打開鏈接點亮社區Star,照亮技術的前進之路。每一個點贊,都是社區技術大佬前進的動力
Github 地址: https://github.com/secretflow
一、可信數據空間介紹
可信數據空間,是指基於共識規則,聯接多方主體,實現數據資源共享共用的一種數據流通利用基礎設施。
是數據要素價值共創的應用生態,是支撐構建全國一體化數據市場的重要載體。可信數據空間須具備數據可信管控、資源交互、價值共創三類核心能力。
二、隱語社區“可信數據空間”初步實踐
(一) 總體介紹
根據國家發展改革委、國家數據局、工業和信息化部聯合印發的《國家數據基礎設施建設指引》和全國數據標準化技術委員會發布的《可信數據空間 技術架構》等標準和規範要求,隱語社區研發實現可信數據空間平台,為推動數據資源共享共用、促進數據要素流通利用提供通用型的平台功能。
隱語社區研發的可信數據空間提供:
- 可信數據空間服務平台,包括空間服務門户和管理中心。空間服務門户是面向數據空間的各參與方提供業務應用入口,包括空間門户、機構中心、運營中心、開發中心、審計中心等。管理中心實現了身份管理、連接器管理、目錄管理、數字合約管理、數據空間管理等功能。並支持按照“三統一”要求,保持身份、標識、目錄與區域/行業功能節點的互聯互通。
- 密態計算樞紐,提供基於TEE技術路線的密態計算平台,包括密態計算底座、可信應用體系、密態計算引擎、密態膠囊、密態數據開發服務平台在內的全棧功能。密態計算樞紐可以作為可信數據空間的密態數據託管環境和開發利用環境,支持數據供需雙方基於密態進行數據交付,研發。
- 隱私計算平台,集成了隱語原有的MPC、PSI、PIR等多種隱私計算關鍵核心技術,以及聯合數據分析(SCQL)能力。
- 接入連接器,按照可信數據空間技術架構,隱語社區提供了符合《技術架構》要求的標準功能連接器,以及擴展隱私計算、密態計算、密態託管等功能的擴展型連接器。
(二) 功能介紹
- 可信數據空間服務平台
通過可信數據空間服務平台,支持數據空間相關參與方,完成以下業務功能:
- 制定數據流通控制策略,支持智能合約自動執行,確保數據訪問、使用符合預期。
- 管理數據資源目錄與產品目錄,提供檢索、訂閲、交易等服務,促進數據產品流通複用。
- 對接入應用、連接器進行審核與監控,保障系統安全合規運行。
- 運用區塊鏈等技術實現操作存證與核驗,提供全流程審計日誌管理。
從功能上,可信數據空間服務平台分為面向各類參與主體的空間服務門户,以及涵蓋《可信數據空間 技術架構》相關功能的管理中心。
空間服務門户
空間服務門户是數據供需雙方的交互平台,聚焦數據產品交易、生態主體入駐及市場運營。
核心目標是搭建數據交易生態,降低數據供需匹配成本,促進數據要素市場化流通。主要功能包括:
- 提供主體入駐建檔服務,審核資質並建立唯一檔案,確保參與方身份可信。
- 展示數據產品、應用場景及行業資訊,支持多維度檢索與智能匹配,提升數據發現效率。
- 支持數據產品檢索篩選與需求申請,實現資源收藏管理及在線合約協商。
- 分析市場供需動態,提供熱門數據推薦、交易統計等可視化視圖,輔助決策優化。
管理中心
管理中心對應《可信數據空間 技術架構》中的數據空間服務平台的基礎功能,實現了身份管理、連接器管理、目錄管理、數字合約管理、數據空間管理等功能是密態可信數據空間的核心資源管理中樞,負責平台內用户、連接器、資源目錄、數據產品、合約及日誌的統一管理。
核心目標是保障數據空間高效運行,優化資源配置,提升生態活躍度與合規性。
主要功能:
- 空間互通網關:提供請求鑑權,請求路由轉發的能力,支撐連接器與空間服務平台的接口互通。
- 互聯互通代理:對接功能節點的身份管理、連接器管理、目錄管理等模塊,基於互通互聯三統一(統一身份、統一標識、統一目錄)的標準進行建設,主要代理的功能包括 1)主體身份、業務節點的身份管理 2)連接器管理 3)數據資源、數據產品的目錄管理。
- 可信空間管理:提供可信空間的全生命週期管理,包括創建、配置變更、成員管理、刪除、功能審計等能力。
- 數字合約管理:基於策略模板、合約備案等等功能管理數據交易合約,支撐合約起草、簽署與履約全過程。
- 存證審計:建設可信審計模塊, 覆蓋空間服務平台內的用户行為、數據訪問\流轉等關鍵操作的審計。
- 密態計算樞紐
密態計算樞紐是可信數據空間中提供規模化密態計算能力的計算節點,也是解決數據可信流通的關鍵所在。
其他連接器可以用密態數據膠囊方式封裝數據後託管到密態計算樞紐內進行融合加工後產出數據產品在可信數據空間內進一步流通。密態計算樞紐的整體架構如下:
密態底座層是密態能力的基本單元,以現有的可信執行環境(TEE)技術為基礎,提供最核心的“可用不可見”能力,重點改進可信根自主可控、跨平台統一機密計算能力等問題。
密態服務框架將獨立的密態基本單元鏈接成密態服務集羣,實現密態服務的規模化,重點要解決密態單元之間相互驗證問題,以及提供公共的基礎服務。
密態數據互通層提供數據的全生命週期流通能力,包括數據的封裝、授權、鑑權等,重點保障數據在流通過程中不被竊取和濫用。
密態數據計算層主要是與現有的計算軟件融合,繼承現有計算軟件的強大能力,併兼容已有的海量業務層代碼,重點是改造現有計算軟件的賬户和權限體系。
密態數據服務層主要是以上述功能為基礎,實現用户視角的數據流通服務。
一、密態數據膠囊
數據互通層是密態計算樞紐作為可信數據空間組件之一的基礎:
- 按照“三統一”要求通過參與方身份和數據目錄模塊支持身份、標識、目錄與上游功能節點的互通。
- 密態膠囊和數據管控模塊則通過對數據的封裝和可信鑑權實現數據的全鏈路密態保障,保障數據不泄露、不濫用。
密態膠囊是一種全新的數據封裝技術。與傳統數據封裝技術只關注數據在存儲與傳輸階段的保密不同,密態膠囊將密封后的數據與使用策略(數字合約)進行強綁定,確保數據在多源融合、計算等所有環節,都嚴格遵守使用策略。通過這種方式實現了數據提供者對數據的嚴格管控。
密態膠囊的實現底層依託可信應用。在進行數據封裝時,數據提供者可以使用可信應用的公鑰加密數據,從而確保只有目標的可信應用可以使用數據,任何第三方都不能使用數據或竊取數據。
數據提供者將使用策略(如有效期、操作次數、算法限制)編碼為數字合約,一同封裝在密態膠囊中,並使用自己的身份私鑰對其進行簽名。要指出的,數字簽名只能代表數據提供者的意願,對使用策略是否會被遵守不起作用。
數據提供者需要檢查目標可信應用(能夠使用數據的可信應用)是否包含檢查使用策略的代碼,以及檢查的邏輯是否完備。使用策略的遵守,實際上來自於可信應用對使用策略的檢查,而不是合約簽署本身。
- 隱私計算平台
在中心部署的隱私計算平台,100%包含隱語隱私計算能力,並可與數據空間服務平台實現無縫對接。
提供包括聯合數據分析(SCQL)、隱私求交(PSI)、隱匿查詢(PIR)、聯合建模(MPC/FL)等多種查詢分析能力。
- 接入連接器
接入連接器是數據提供方、使用方及第三方服務方接入密態可信數據空間的核心入口,負責數據資源的接入管理、身份驗證及基礎功能支撐。
核心目標是實現多類型數據資源的標準化接入,保障接入主體身份可信,為數據流通提供基礎環境。
標準接入連接器主要功能包括:
- 支持數據提供方接入本地數據資源(如庫表、文件、接口、流式數據等),進行分類管理與元數據登記。
- 提供身份驗證方式配置(如生物識別、數字證書等),實現接入主體身份的真實性校驗與權限管理。
- 支持數據產品封裝、上架及交付,結合數據合約與使用控制技術,保障數據安全可控流轉。
- 記錄操作日誌、審計信息及異常事件,提供日誌查詢與安全追溯能力。
隱語社區在接入連接器技術架構基礎上進行了擴展,提供隱私計算、密態計算、密態託管等多種擴展功能模塊。
三、可信數據空間的使用方式
(一) 基於標準型連接器
- 數據提供方、數據使用方均通過標準連接器接入數據空間。
- 提供方通過連接器,將本地數據資源封裝為數據產品(文件、API、隱私計算),發佈到數據空間。
- 使用方通過連接器,或者直接通過數據空間服務平台查詢產品目錄,申請後通過數字合約約定的控制策略,使用數據產品。
(二) 基於密態計算樞紐
數據提供方、加工服務方、產品運營方、數據使用方等多方,通過密態可信數據空間完成數據託管、數據加工、產品上架、數據申請流程。
四、產業案例
(一) 金融可信數據空間案例
小農户貸款一直是金融領域的難題。受制於地域分散、數據缺失等原因,金融機構難以對農户的信貸風險進行科學有效的評估。
農業農村部大數據發展中心、網商銀行及螞蟻密算三方首次將時空大數據和密態計算技術相結合,安全融合多源數據並聯合建模,形成農業信貸實時評估指標,累計已為1300萬農户提供了獲得金融服務的渠道,他們來自全國2600多個區縣,其中80%農户的種植面積在10畝以下。
(二) 醫療可信數據空間案例
針對醫療保險行業存在的數據合規使用需求和理賠補充材料率高的問題,依託螞蟻密算提供的密態可信數據空間,螞蟻保險科技團隊與保險公司合作構建了“理賠大腦”智能理賠系統,覆蓋了全國10+省份的醫療數據,為醫療數據的使用提供合規路徑,保司調查案均成本降低40%,門診醫療理賠80%實現秒級審核,住院醫療理賠86%實現2日內結案。
不僅顯著提升用户報案體驗,也節省了立案審核的運營成本,更有利於擴大普惠醫療的服務範圍、提升普惠醫療的服務效率。