打開鏈接點亮社區項目羣Star,照亮技術的前進之路。每一個點贊,都是社區技術大佬前進的動力
Github 地址: https://github.com/secretflow
數據要素和三權分置
放眼全球,新一輪科技革命和產業變革深入發展,互聯網、大數據、雲計算、人工智能、區塊鏈等數字技術創新活躍,數據作為關鍵生產要素的價值日益凸顯,深入滲透到經濟社會各領域全過程,數字化轉型深入推進,傳統產業加速向智能化、綠色化、融合化方向轉型升級,新產業、新業態、新模式蓬勃發展,推動生產方式、生活方式發生深刻變化,數字經濟成為重組全球要素資源、重塑全球經濟結構、改變全球競爭格局的關鍵力量。
數據作為新型生產要素,是數字化、網絡化、智能化的基礎,已快速融入生產、分配、流通、消費和社會服務管理等各環節,深刻改變着生產方式、生活方式和社會治理方式。
- 2019年10月,中央在19屆4中全會上首次提出數據是一種生產要素,明確要求“健全勞動、資本、土地、知識、技術、管理、數據等生產要素由市場評價貢獻、按貢獻決定報酬的機制。
- 2020 年 4 月 9 日,中共中央國務院發佈《關於構建更加完善的要素市場化配置體制機制的意見》,在傳統的要素之外,文件還把數據納入了生產要素的範圍,成為數字化轉型帶動中國新經濟發展的堅實政策基礎。
- 2022年12月發佈的《中共中央 國務院關於構建數據基礎制度更好發揮數據要素作用的意見》(後續簡稱“數據二十條”)從數據產權、流通交易、收益分配、安全治理四方面,提出二十條政策舉措。旨在充分發揮我國海量數據規模和豐富應用場景優勢,激活數據要素潛能,做強做優做大數字經濟,增強經濟發展新動能。
現實中數據採集、利用等環節存在權益保障、隱私保護、安全合規等難題,法律法規是解決數據流通的基礎,在此基礎上,還需要探索更多的技術手段保障數據流通的安全,促進數據價值的釋放。
數據要素三權分置
“數據二十條”開創性提出了“數據資源持有權、數據加工使用權、數據產品經營權”的三權分置模式。 關於三權分置的數據產權制度細則並未出台,業界對於三權定義尚不清晰,綜合考慮“數據二十條”及其他相關文件,我們對數據資源持有權、數據加工使用權、數據產品經營權的三權分置概念解釋如下。
定義的參考資料見文末附錄。
數據資源持有權
數據資源持有權相當於弱化或改造的“所有權”,其客體是數據資源,其主體是數據來源者或數據處理者。
- 在具體權能上,數據的持有者不僅有權進行數據處理,同時也可以經由其同意來“轉讓”自己對數據的持有權利(如數據加工使用權、數據產品經營權)。
- 在權力來源上,“數據二十條”中指出數據資源持有權可以分為數據來源者持有自己所產生的數據和數據處理者“依法持有”(如通過委託授權)其他主體(數據來源者)的數據。此外,數據資源持有權也存在相應的限制,不得超出或法律規定的權限(如來源合規等)。
數據加工使用權
數據加工使用權是依法加工處理和使用數據的權力,其客體是數據資源或者數據產品,其主體是數據處理者。
- 在具體的權能上,數據加工包括對數據進行清洗、預處理、分析、建模等處理的活動。
- 在權力來源上,在滿足“依法持有”或“合法取得”數據的前提下,數據處理者即擁有數據加工使用權。依法持有表示數據來源者依法採集、數據持有者依法持有,合法取得表示按照合同約定。
數據產品經營權
數據產品經營權指對數據處理者開發的數據產品進行經營、交易並獲取收益的權益,其客體是數據產品,其主體是數據處理者。
在具體的權能上,數據產品經營權包括收益權和經營權。
在權力來源上,數據產品經營權來源於數據處理者通過大量智力和體力勞動賦予了數據更高的價值。數據產品的形成是以“實質性加工”和“創新性勞動”為前提。
三權分置下的數據流轉
數據使用權跨域管控
隨着數據要素的流轉,數據離開持有者的“運維域/管理域”後,如何保障數據使用權依然受到管控是新的挑戰。如果數據使用權跨域得不到管控,那麼數據流通的安全得不到保障,進一步會阻礙數據的流通。這催生了使用權跨域管控的需求。
所謂的管控,主要是指對數據的管控,包括:
- 對原始數據的管控:如何使用。包括但不限於數據註冊、加密上傳、授權、取消授權、計算、銷燬等。
- 對結果數據的管控:獲取及使用。包括結果的查看、下載、再加工使用等。
通過合作協議和法律法規對數據使用權進行管控是基本方式。在此基礎上,我們希望通過技術提供更可靠更高級的保障,讓數據使用權的管控不只是依賴於人治,基於技術的信任,會更加有助於數據要素的流通和三權分置。
為什麼使用TrustFlow保障使用權跨域管控?
如何保障使用權跨域管控是數據要素流通中的挑戰,這既需要法規授權作為基礎,也需要有效的技術進行保障。通過依法授權獲得數據使用權限,通過技術保障數據不被泄露和濫用。
TrustFlow是隱語基於可信執行環境(Trusted Execution Environment,簡稱TEE)的可信計算系統,具有可信可驗證、計算可隔離、授權可管控等機制,強有力的保障了數據要素流通中的使用權跨域管控。
TrustFlow使用權跨域管控
TrustFlow以TEE作為技術底座,提供了信任可驗證、計算可隔離、授權可管控三大核心特性以保障數據要素流通過程中的使用權跨域管控。此外TrustFlow提供了豐富的人工智能和數據分析計算能力,在充分保障數據使用權的同時釋放數據要素的價值。
信任可驗證
通過TEE的遠程認證機制,可以對TrustFlow運行環境、運行的代碼進行驗證,確保TrustFlow運行在正確的可信執行環境中,且代碼符合預期沒有被篡改。
TrustFlow會盡量以最新安全手段對代碼進行加固,TrustFlow代碼是開源的,用户亦可以對代碼進行安全審計。
計算可隔離
TrustFlow覆蓋了數據使用中(data-in-use)、數據存儲(data-at-rest)、數據傳輸(data-in-transit)端到端全鏈路的安全保障。TrustFlow保證了數據在流轉全鏈路中一直保存密態,是名副其實的全鏈路密態計算系統。
-
數據使用中(data-in-use)加密
基於TEE的內存加密、內存隔離等安全特性,TrustFlow在數據在使用過程中保證數據一直處於加密狀態。
-
數據存儲(data-at-rest)加密
TrustFlow向外部存儲(比如硬盤、網絡存儲等)寫入數據前,會對數據進行加密,且密鑰僅TrustFlow可訪問。
-
數據傳輸(data-in-transit)加密
TrustFlow基於TEE的遠程認證機制建立安全通道(比如mTLS),確保TrustFlow內部數據傳輸以及外部數據傳輸的完整性與機密性。
授權可管控
TrustFlow提供了一套完善的授權管控機制,包含數據確權、使用授權、使用鑑權、結果獲取等。在信任可驗證的基礎上,機構可以對TrustFlow進行驗證,從而確保TrustFlow授權管控機制一定是按照預期運行,這也是TrustFlow相比傳統管控方案(比如需要依賴相信管控方)的一大優點。
數據確權
針對數據確權,TrustFlow提供了可信的數據屬主和數據標識能力。
數據屬主:TrustFlow中的數據均有數據持有方的簽名和完整性保護,確保數據持有方與數據實體的綁定關係可信。
數據標識:TrustFlow中的數據均有ID標識,並且具有完整性保護,確保數據實體與ID之間的綁定關係可信。
使用授權
使用授權指的是數據持有方可以對數據進行細粒度的管控,加工使用方只有獲得正確授權才能對數據進行指定的計算和加工。
針對使用授權,TrustFlow提供了固定計算邏輯、動態計算邏輯和通用計算限制等管控,TrustFlow提供了一套語法用於描述授權策略,其詳細原理可以參考授權策略。
-
固定計算邏輯
數據持有方可以限制數據僅能執行固定計算邏輯,比如數據僅能被用於統計平均值。
-
動態計算邏輯
在有些場景下,固化的數據計算邏輯可能不適合。比如在AI場景下,數據可能需要經過清洗、預處理、建模、評估等流程才能發揮數據的價值,算法人員可能需要對數據進行反覆試驗才能獲得較好的模型,這意味需要動態計算邏輯。
針對此類場景,TrustFlow提供了以下管控能力:
-
動態計算流管控
數據持有方可以限制數據只能在有限的算法下進行計算,數據只有在計算邏輯在授權的算法列表中時才能進行計算。
-
列管控
對於結構化數據,數據持有方可以限制僅能使用數據的部分列,還可以進一步限定數據列可以進行的計算操作操作,比如僅能做聚合計算、僅能求平均值等。對於數據分析場景而言,可以在便利數據使用方分析的同時確保數據不被濫用。
-
行管控
對於結構化數據,數據持有方可以限制僅能使用數據的部分行,比如限制僅可使用數據的前100條。
-
可擴展管控
TrustFlow提供了一套可擴展的授權語法,可以按照機構對計算參數做進一步的限制,比如可以限定數據必須經過差分隱私(Differential Privacy)處理且ε必須等於某個值。
-
-
通用計算限制
除了固定計算邏輯和動態計算邏輯外,TrustFlow還允許數據持有方對數據進行一些通用限制,比如限制數據可被計算次數、設置數據過期時間、指定數據計算參與方等。
使用鑑權
使用鑑權是指實際執行計算時,對授權策略進行校驗。TrustFlow在執行計算代碼時,會對計算代碼(邏輯)、計算參數、計算限制等各項內容根據授權策略進行強制檢查,具體原理可以參考TrustFlow原理。
結果獲取
獲取數據加工的結果需要被管控,這裏需要保障兩件事,一是結果數據的可信性,即結果數據是按照預期加工方式進行的,二是誰可以獲得結果數據。
數據溯源
TrustFlow提供了數據溯源機制,數據加工使用方可以通過數據溯源確認結果數據是按照預期的計算邏輯產生,確保結果數據沒有被仿冒或者篡改。TrustFlow的數據血緣機制可以參考數據血緣。
授權獲取
TrustFlow提供了結果數據的授權審批機制,任何參與方想要獲取結果數據必須得到全體數據持有方的同意,詳細原理可以參見獲取結果。
附錄
數據要素三權分置的定義
數據要素三權分置的定義主要參考自《數據二十條》。
以下摘自《數據二十條》
數據來源者:促成產生數據的主體,如個人、企業/機構
數據來源者定義參考:“數據二十條”原文:
(七)建立健全數據要素各參與方合法權益保護制度。充分保護數據來源者合法權益,推動基於知情同意或存在法定事由的數據流通使用模式,保障數據來源者享有獲取或複製轉移由其促成產生數據的權益。合理保護數據處理者對依法依規持有的數據進行自主管控的權益。在保護公共利益、數據安全、數據來源者合法權益的前提下,承認和保護依照法律規定或合同約定獲取的數據加工使用權,尊重數據採集、加工等數據處理者的勞動和其他要素貢獻,充分保障數據處理者使用數據和獲得收益的權利。保護經加工、分析等形成數據或數據衍生產品的經營權,依法依規規範數據處理者許可他人使用數據或數據衍生產品的權利,促進數據要素流通複用。建立健全基於法律規定或合同約定流轉數據相關財產性權益的機制。在數據處理者發生合併、分立、解散、被宣告破產時,推動相關權利和義務依法依規同步轉移。
以下摘自《數據二十條》
數據處理者:對原始數據進行開發利用、依規行使數據應用相關權利的主體。包括數據持有者、數據加工者、數據使用者等
數據處理者定義參考:“數據二十條”原文:
(三)在保障安全前提下,推動數據處理者依法依規對原始數據進行開發利用,支持數據處理者依法依規行使數據應用相關權利,促進數據使用價值複用與充分利用,促進數據使用權交換和市場化流通。審慎對待原始數據的流轉交易行為
(七)合理保護數據處理者對依法依規持有的數據進行自主管控的權益。在保護公共利益、數據安全、數據來源者合法權益的前提下,承認和保護依照法律規定或合同約定獲取的數據加工使用權,尊重數據採集、加工等數據處理者的勞動和其他要素貢獻,充分保障數據處理者使用數據和獲得收益的權利。以下摘自《數據二十條》
數據產品:經加工、分析等形成數據或數據衍生產品,包括但不限於數據包、模型、API接口等
數據產品定義參考:“數據二十條”原文:
(四)鼓勵公共數據在保護個人隱私和確保公共安全的前提下,按照“原始數據不出域、數據可用不可見”的要求,以模型、核驗等產品和服務等形式向社會提供,對不承載個人信息和不影響公共安全的公共數據,推動按用途加大供給使用範圍。
(七)保護經加工、分析等形成數據或數據衍生產品的經營權,依法依規規範數據處理者許可他人使用數據或數據衍生產品的權利
其他:
《上海市數據條例》第四十九條規定,鼓勵深度挖掘數據價值,通過實質性加工和創新性勞動形成數據產品和服務。
《上海市公共數據開放實施細則》第二十條規定,支持數據利用主體對開放數據進行實質性加工和創造性勞動後形成的數據產品依法進入流通交易市場。