城市數據空間CDS白皮書-2023.12_第1頁
城市數據空間CDS白皮書-2023.12_第2頁
城市數據空間CDS白皮書-2023.12_第3頁
城市數據空間CDS白皮書-2023.12_第4頁
城市數據空間CDS白皮書-2023.12_第5頁
已閱讀5頁,還剩43頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

踐行深度用云城市數據空間CDS白皮書編制委員會編

上海數據集團有限公司華為云計算技術有限公司編制委員會

上海數據集團有限公司:朱宗堯

李小山

傅行曉

高曉麗

夏佳斌華為云計算技術有限公司:尚海峰

胡玉海

王劉鵬宇

滕奉濤

張志剛

季飛亮朱杰

郭奕浩

宋曄志鵬殷潤悅前言當今世界,新一輪科技革命和產業變革深入發展、加速演進、裂變創新,開辟了人類生產生活新空間,拓展了社會治理的新疆域。近幾年,以土地生產要素為主的城市經濟增長動力逐步減弱,而數據成為繼土地、勞動力、資本、技術之后的“第五個關鍵生產要素”,日益成為經濟發展的新引擎。數據要素正在驅動構建數字敏捷型經濟形態,重建模型化知識產品,重塑市場化信任規則,重構生態化共治規制。工業經濟筑造了城市空間,數字經濟將開創數據空間。像城市空間一樣,數據空間要圍繞數據要素高效合規流通,探索構建新生產關系,創造新權屬、新信任、新規則、新基礎設施、新模式。長期以來,我國政府高度重視發展數字經濟,將其上升為國家戰略,提出加快建設數字中國,率先探索數字化轉型之路。數據要素流通是培育數據要素市場的基本前提,是推動數字經濟發展的必然要求和核心引擎,是促進數字政府持續長效運營、激活政府公共數據的社會化價值和市場化潛力重要手段。2023年10月,國家數據局正式掛牌掀開了我國數據要素市場化的序幕,進一步加快統籌全國統一的數據大市場建設。上海數據集團有限公司和華為技術有限公司聯合編制本白皮書,在業內首次發布城市數據空間CDS(City

Data

Spaces)理念,利用各自在數據要素領域積累的經驗,取長補短,在洞察分析國外數據空間和國內數據要素發展現狀基礎上,提出城市數據空間的“2+1+1”的架構體系頂設,即制度和組織2個保障參考體系、1個基礎設施、1個數據生態,并且在基礎設施中進一步提出,構建城市數據空間基礎設施的“1+4+2”統一基礎架構,即1個城市數據底座,4個數據分層(數據資源、數據治理、數據資產和數據交易),以及2個治理框架(安全可信和合規可控),旨在鼓勵行業內外各單位共同探討,并推動在行業中形成統一的認知。02目錄010205-1011-36國內外現狀與主要挑戰城市數據空間頂設與模式1.1

國外數據空間現狀1.2

國內數據要素現狀1.3

國內主要挑戰2.1

城市數據空間的內涵2.2

城市數據空間的體系架構2.3

城市數據空間的制度參考體系2.4

城市數據空間的組織參考體系2.5

城市數據空間的基礎設施架構2.6

城市數據空間的數據生態2.7

城市數據空間的運行模式030437-4243-45最佳實踐案例發展與展望3.1

上海數據集團城市數據空間實踐3.2

某醫療集團數據可信流通探索實踐3.3

華為產業數據空間探索實踐國內外現狀與主要挑戰1.1

國外數據空間現狀共管理、技能)。其中,數據空間作為核心概念,進一步拉動歐洲對安全、高效和可信的云基礎設施投資建設。1、歐洲數據戰略歐洲長期存在數據挑戰,依賴于谷歌、亞馬遜、Facebook等提供的數字應用和服務,同時歐洲的云計算、人工智能、5G通信等關鍵基礎技術發展也相對落后。在此背景下,歐洲已意識到其在數字經濟所處的被動局面,于2020年2月發布《塑造歐洲數字未來》的數據戰略,并陸續出臺了《通用數據保護條例》、《數字市場法》、《數字服務法》等一系列政策和法律框架,致力于構建歐洲“數字主權”,增強數字創新能力。2、IDS數據空間IDS(International

Data

Spaces)是在歐洲數據戰略下的最佳實踐,是基于工業4.0下發展的子項目,隨著更多的國家和組織參與進來,該項目上升為歐盟資助的重點項目。IDSA(Inter-nationalDataSpacesAssociation)協會已發展成員130多個,其中以歐洲企業為主,也包括微軟、IBM等美國企業,以及華為、海爾和信通院等中國企業和機構。歐洲數據戰略提出四大核心措施:加強數據全周期治理、加大數據基礎設施投資、賦能個人和中小企業,以及構建九大領域數據空間建設(制造、環保、移動、衛生、金融、能源、農業、公IDS核心理念是歐洲的價值觀和數據主權,即數據隱私保護和安全,提倡機會均等,確保數據創建者的數據主權和參與者之間的信任。通過IDSClearingHouseBrokerDatasharingin

aData

SpaceUsageUsagePoliciesPoliciesAPPIDSAPPIDSDataDataData

exchange

and

data

processingalong

the

data

value

chainConnectorConnectorDataconsumerDataProviderAPPStoreVocabularyIdentityProvider圖1

IDS數據空間參考架構06數據空間,歐洲致力于建設一個以用戶為中心,獨立于供應商的數據生態系統和市場,以低成本和低門檻方式向所有人開放,促進數據供需雙方的連接。3、IDS與GAIA-X組合2020年歐洲發布《歐洲數字主權》報告,明確建設歐洲的下一代數字基礎設施,建立數字主權的最高標準。由德國和法國聯合倡議GAIA-X計劃啟動,GAIA-X遵循《歐洲數據戰略》要求,致力于實現跨行業共享,避免數據孤島,打造安全可靠的數據基礎設施,培育開放的數據生態系統,以推動歐洲經濟增長和創新。IDS數據空間參考架構定義了一個去中心化的數據生態系統,數據提供者和消費者之間通過Connector(可信連接器)進行數據的共享交換,連同Identity

Provider(認證服務)、Broker(數據交易監管服務),Clearing

House(結算服務),APP

Store(應用商店服務)一起構成了完整的數據空間系統。IDS實現數據主權的核心技術是“使用控制”,數據供需雙方配置相應的數據控制策略后,由Connector(可信連接器)負責執行,將數據的控制策略轉化為形式化語言,與數據內容一起流轉到對端并執行控制。GAIA-X生態系統架構分為兩個部分:數據生態系統和基礎設施生態系統。兩者構成了一個不可割裂的整體。聯接兩個生態系統的關鍵服務是聯合服務,由身份與信任、合規、主權數據交換以及聯合目錄四個部分組成。GAIA-X和IDS形成一個完整的組合架構,GAIA-X專注于主權云服務和云基礎設施,而IDSGAIA-X數據生態IDS數據空間數據提供者數據消費者數據清算數據連接器GAIA-X聯合服務身份與信任主權數據交換聯合目錄合規GAIA-X基礎設施生態硬件節點基礎服務標準數據存儲規則&策略互操作性圖2

GAIA-X生態系統架構07專注于數據和數據主權。GAIA-X和IDS相互補充和聯合,以保護整個生態系統中端到端數據價值鏈的數據主權。活的數據控制工具、數據可信連接器等,確保了歐洲數據戰略的落地,也促進了IDS數據空間的推廣,已成為廣泛接受的產業標準。4、歐洲模式主要特點1.2

國內數據要素現狀IDS數據空間的核心理念是保護歐洲的數據主權,歐洲發布多部法律法規為數據保駕護航。國內數據要素發展經歷了預熱階段、起步階段、落地階段,已進入深化階段。基于統一的基礎架構(GAIA-X+IDS),以及去中心化的數據交換模式,降低了使用成本和門檻,提升了中小企業的廣泛參與。1、國內數據要素政策進入體系化深化階段2014年大數據首次寫入政府工作報告以來,數據與實體經濟不斷融合加深,數字產業、數字應用等都飛速發展。2019年,十九屆四中全會首次將數據列為新型生產要素,數據要素市場配置上升為國家戰略,一批批《關于構建更加完善的數據要素市場化配置體制機制的意見》、《“十四五”數字經濟發展規劃》、《關于構建數據基礎制度更好發揮數據要素作用的意見》等文件相繼出臺,數據要素政策體系架構初步形成,已進入體系化深化階段。集中力量構建九大領域數據空間建設,為推進數據高效流通使用、賦能實體經濟,提供了豐富的最佳實踐。從技術到標準體系,全流程保障數據的安全可信,以及數據空間之間的平等互信、互操作性。工欲善其事,必先利其器。通過開發多種便捷靈NOW預熱階段起步階段落地階段深化階段《中共中央國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(數據二十條),為推動數據要素發展筑牢政策基礎國家數據局正式掛牌“大數據”開始成為熱點國家層面開始“大數據”頂層設計國家大數據戰略從“數據大國”邁向“數據強國”國務院數據要素市場《關于構建更加完善的要素市場化配置體制機制的意見》數據被正式列為新型生產要素化配置上升國家戰略十九大報告提出“推動大數據與實體經濟深度融合”《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》《十三五規劃綱要》第二十七章“實施國家大數據戰略”國務院辦公廳十九屆四中全會《公共數據資源開發利用試點方案》首次公開提出“數據可作為生產要素按貢獻參與分配”國務院印發《促進大數據發展的行動綱要》工信部發布《大數據產業發展規劃》國務院《關于新時代加快完善社會主義市場經濟體制的意見》提出“加快培育發展數據要素市場”大數據首次寫入政府工作報告2014年3月2015年8月2016年3月

2016年12月

2017年10月2019年10月2020年4月2020年4月2020年5月2021年3月2022年12月2023年10月圖3

國內數據要素發展歷程082、“數據二十條”為推動數據要素發展筑牢政策基礎上海圍繞“經濟、生活、治理”三大領域,全面推進城市數字化轉型,深入貫徹網絡強國、數字中國、智慧社會戰略部署,落實黨中央、國務院決策部署,踐行“人民城市人民建,人民城市為人民”重要理念,按照《上海市數據條例》和中共上海市委、上海市政府《關于全面推進上海城市數字化轉型的意見》《上海市促進城市數字化轉型的若干政策措施》等文件精神,加快實現超大城市治理體系和治理能力現代化。2022年12月,國家“數據二十條”發布,明確了數據基礎制度體系的基本架構,提出建立保障權益、合規使用的數據產權制度,建立合規高效、場內外結合的數據要素流通和交易制度,建立體現效率、促進公平的數據要素收益分配制度,建立安全可控、彈性包容的數據要素治理制度。在“數據二十條”的指導下各地各部門不斷完善相關制度體系和配套政策,制定相關細則。1.3

國內主要挑戰3、數據局組建推動數據要素統籌管理和協調發展缺數據,高價值數據更缺,數據入場難2023年初《黨和國家機構改革方案》提出組建國家數據局,負責協調推進數據基礎制度建設,統籌數據資源整合共享和開發利用,統籌推進數字中國、數字經濟、數字社會規劃和建設等工作。國家數據局的組建有利于破除“九龍治水”的數據治理環境,平衡數據要素安全和發展的辯證關系,從而進一步推動數據要素的統籌規劃,推進多層次數據要素市場建設。對政府公共數據來說,國家層面還沒有明確公共數據的開放范圍,有些數據不能給;有些數據質量參差不齊,擔心使用后承擔風險,數據不敢給。同時,有些數據維護政府需要投入經費保障,額外帶來較大工作量,數據不想給。對于企業數據來說,政府行業部門缺少指導,擔心合規風險,數據不能給;沒有安全交易渠道,擔心數據泄露和擴散,數據不愿給。對于個人數據,缺少相關法律政策指導,隱私數據不敢用。有些稀缺數據,數據資源來源壟斷,4、上海進一步明確加快構筑數據要素體系重點工作國內主要挑戰“五缺”缺數據缺治理缺標準缺工具缺生態高價值數據更缺數據入場難高質量數據更缺閉環監管難實施細則待探索供需互信難數據權益待保護數據確權難生態環境待培育創新驅動難圖4

國內主要挑戰“五缺”09缺少可替代方案。總體上,國內市場不僅缺少數據,更缺少高價值數據,以及相關的數據供需方的利益保障機制。缺治理,高質量數據更缺,閉環監管難數據要素缺少有效治理,有些數據入市后缺乏可靠的質量保障措施,無法快速響應新場景和新需求。數據要素的高效流通依賴于數據的高質量供給,而系統化的數據治理是高質量數據的必要保障,當前我們治理能力和水平參差不齊,基本還處在數據規范的可管可控階段,缺少在數據安全保障、數據分類分級、數據融合加工、數據分析應用、數據質量提升、數據產品開發等方面的深化治理,缺少數據治理的標準要求和考核體系,缺少數據質量的監管、跟蹤、反饋、完善的閉環機制,缺少稅收、法律等配套體系的建立,形成完整的監管服務流程。與主體多元化、使用場景多樣化,使得數據要素權益保障變得復雜。數據供需雙方在數據使用上,缺少工具來落實公共數據、企業數據和個人數據的不同權益保障,以及不同權益下的數據使用策略,包括數據的使用時間、訪問權限、使用頻次等。工具的安全性和操作便捷性,將大幅度降低用戶進入市場的門檻,促進數據要素市場的用戶參與規模。缺標準,實施細則待探索,供需互信難目前多個省市已發布《數據條例》,以地方性立法的形式明確開展公共數據授權運營,如《北京市公共數據專區授權運營管理辦法》、《浙江省公共數據授權運營管理辦法》等,但國家層面暫時沒有“公共數據”、“企業數據”和“個人數據”的細則規定或指導意見,在數據要素市場供需雙方互信不足,落地過程中涉及的法律、稅收等諸多細則還有待探索和實踐,導致各地實施的方案流派不同,比如公共數據,有的地方納入政務平臺的數據開放體系,與政務數據共平臺運營;有的地方單獨建設數據開放體系,政務數據只是其中一種數據資源來源,各種落地方式不同。缺生態,生態環境待培育,創新驅動難在數據開發方面,手中掌握一定規模數據的企業,并具備開發能力的各類“數商”,各自占山為王,生態封閉。在數據消費方面,政府與企業在數字化轉型中,有大量的ToB、ToC應用場景,但缺少對數據業務創新的動力,偏好零風險的成功實踐。在人才供給上,高校科研機構,因缺少仿真“數據要素實訓環境”,數據類人才供給緩慢,創新人才不足。總體上,缺少生態培育土壤、場景創新機制,需要數據提供方、場景應用方、數據監管方、技術服務方以及法律合規機構等共同積極參與,穩步構建覆蓋數據要素流通各環節、全鏈條的市場生態環境。缺工具,數據權益待保護,數據確權難由于數據具有低成本、易復制等特點,數據參10城市數據空間頂設與模式2.1

城市數據空間的內涵城市數據空間是踐行城市數據戰略的重要舉措數字化和科技創新作為先進生產力,打破了城市空間的時空限制,城市智能化、共享化、信息化重構了時空關系,在傳統“地理空間”的基礎上形成了“要素流動空間”。一般來說,超大和特大級城市作為城市資源要素流動的關鍵樞紐,承擔了70%以上的要素流動,突顯出了城市級的數據戰略意義。1、理念城市數據空間是城市發展的高階演進和新引擎人口、活動和空間是城市發展的三個基本要素,人口發展推動了社會活動,社會活動擴大了城市空間,從而推動城市發展不斷演進。從農業社會、工業社會到當今數字社會,城市空間也從單個地理中心往城市群/城市帶高階發展,比如長三角、京津冀、粵港澳大灣區城市群等。城市數據空間是促進城市數據要素高效合規流通的重要基石數字社會釋放了城市海量數據,也開辟出了城市數據新空間。城市數據量從TB到PB級海量持續增加,使數據成為城市的“石油能源”、“信息高速公路”。從海量數據中挖掘的數據要素價值,激發了更大的經濟和社會價值,成為城市發展的新引擎。城市數據空間提供城市數據要素高質量供給和交易能力,不斷推動數據要素的高效合規流通,成為城市數字的重要基石。城市數據空間包括公共數據空間、行業數據空間、企業數據空間和個人數據空間,這些空間場景不同,但遵循統一的城市數據空間規范體系和服務能力。城市數據空間理念數據生態系統維維度度nn+1維維維度度度321制度體系組織體系數據基礎設施城市數據空間是踐行城市數據戰略的重要舉措要素流動空間地理空間科技創新、數字化驅動數字數字化變革農業社會全球土地經濟工業社會工業經濟新產業數字社會數字經濟全球人口國家城市群/帶城市城市城市群/帶國家空間活動圖5

城市數據空間理念12城市數據空間的4個主要特征城市數據空間是城市數字化轉型的具體表現和關鍵路徑。《數字中國發展報告》提出數字化的四個方面建設:夯實數字底座、全面賦能經濟發展、強化數字關鍵能力、優化數字發展環境。作為重要參考和借鑒,我們可以勾勒出城市數據空間的4個主要特征:制度體系組織體系城市數據空間具備完善的制度體系保障,為城市數據空間的發展,提供法律法規保障,加強立法體系化建設,建立公平公正的城市數據運行環境。城市數據空間具備完善的組織體系保障,有清晰的組織架構、明確的組織目標,統籌協調各個部門工作,有例行的聯席工作組運作,進行工作推進和問題升級,通過自身不斷的組織優化匹配城市數據空間的發展。數據城市數據空間具備先進的數據基礎設施,以安全可信可控為關鍵基礎,提供城市數據的共享交換基基礎設施礎服務,位于數據空間中的企業和個人能夠獲取其他參與者提供的數據,并在數據共享中獲益。城市數據空間具備豐富的數據生態系統,共同以城市數據空間為起點,以發展和繁榮城市數據產業為目標,由數據提供方、數據消費方、數據經紀方、數據開發方等各參與方,一起聯合構建一個全新的城市級數據生態系統,以數據要素市場化配置為驅動力,推動城市數據高價值高質量釋放。數據生態系統圖6

城市數據空間的4個主要特征2、“五可”原則城市數據空間的數據要素,遵循“五可”原則:“可發現、可訪問、可開發、可共享、可流通”。城市數據空間數據要素“五可”原則可發現可訪問可開發可共享可流通圖7“五可”原則可發現:如何讓數據消費者在城市數據空間中,可快速高效地找到想要的數據,無論是通過場景找數據,還是通過主題匯聚數據,最終實現數據要素供需方的發現和連接?當前簡單數據目錄已經不能再滿足城市級大規模應用的需求,需要結合AI關鍵能力,從場景化自然語言轉換、多語義關聯到大模型數據聚合等技術,實現基于數據地圖模式的自助問答、自動發現能力。可發現是推13廣城市數據要素的可獲得性的關鍵能力。數據商品化的流通環節打通,支撐商業生態系統的數據要素流通。可訪問:數據消費者找到所需的數據后,可快速、可便捷地訪問數據。基于通用的數據安全基礎上,首先要確保可訪問數據的可信、可控能力,基于全流程、全生命周期的可信可控是可訪問的關鍵基礎,包括數字身份可認證,數據不可篡改,訪問操作可審計追溯等;也包括基于數據安全合規、數據權益保障的前提下的訪問權限、訪問范圍等策略控制。尤其,需要解決跨多個認證體系的聯合認證問題。打造堅實的城市數據空間可信可控能力,需要經歷千錘百煉的鍛造,數據所在的安全環境重要性遠比數據本身價值意義更大,一旦風險泄露,數據價值將可能全部失去。3、重要意義(一)促進數據要素高效合規流通,提升城市運作效率城市數據空間實現數據要素的開放與共享,為數據要素匯集、資源整合提供解決方案能力,有助于推進城市數據資源的開發利用與價值實現。同時,城市數據空間有助于提升政府治理水平與服務效能。政府通過與企業、社會組織等深入合作,實現基于跨部門、跨行業的數據統籌管理,有助于提升城市在公共交通、醫療、教育、文化及政務服務等各領域的公共服務水平。(二)激發城市數據效能,打造城市經濟繁榮的新引擎可開發:城市數據空間的強大生命力,在于它的開放性,需要構建一個龐大的數據生態系統,但落地到技術層面,主要是數據的可開發性。需要站在開發者角度,從開發的全流程剖析,明確各個階段數據的開發對象、開發方式、開發環境、開發賦能等。可開發周期內容,仍要遵循數據的合規使用,涉及測試數據申請、銷毀、范圍控制等處理。提供簡便快速的開發套件,測試沙箱等模塊,加快數據產品的行業場景應用。城市數據空間推動數字經濟和實體經濟深度融合,是推動各類要素快速流動、各類市場主體深度合作、各類場景融合創新的新引擎。城市數據空間促進市場體系中生產、分配、流通、消費各環節有機銜接,促進產業全要素的互聯互通,增強經濟發展動力,暢通經濟循環,實現產業鏈韌性生產和健康發展。(三)提升城市智能化水平,推進城市智慧化進程城市數據空間通過運用AI城市模型賦能、多元數據要素融合、多樣場景數據貫通等手段,推動智慧醫療、智慧金融、智慧出行、智慧物流等智慧化進程,打造城市智能體,提升城市運行效率,讓城市像生命體一樣更加智能。通過數智融合,加快數據的智能監測、預測、控制等手段,解決城市發展所面臨的問題,為城市的可持續發展開辟新的道路。可共享:城市數據空間的數據共享,是基于安全可信的數據共享基礎設施。圍繞數據全生命周期,對數據的登記、離線、消亡等不同階段采取不同策略,包括使用時間、次數、方式等控制,對數據使用進行更精細化的管理。可流通:數據進入到流通環節,才能發揮出市場配置作用,數據的可流通性是城市數據空間的發展動力,必須加強對數據資產化,數據產品化和142.2

城市數據空間的體系架構礎設施,數據基礎設施是新型的基礎設施,主要解決數據找得到,在哪里,可流通,可信任的問題。最后是1個數據生態,包括參與到數據要素全生命周期流通里面的所有參與方,以及為這些參與方構建起來的生態培育環境。城市數據空間體系架構由四個部分組成(2+1+1):首先是2個保障參考體系(制度參考體系和組織參考體系),其中,制度參考體系從立法和法規角度,發布城市數據空間相關政策制度,構建從地方數據條例、管理辦法、實施細則到地方標準的四位一體式法規體系,提供全方位保障。組織參考體系,從地方數據局到協同各級責任主體及標準委員會,形成清晰的組織架構保障。其次是1個基礎設施,基礎上設施不是我們傳統講的計算、存儲和通訊基城市數據空間體系架構的四個組成部分,相互依賴又有機協同。制度和組織參考體系是空氣和水分,基礎設施是肥沃的黑土地,數據生態是繁榮的枝葉,數據要素高效合規流通是經脈主干道。城市數據空間社交電商游戲汽車數據生態醫療零售教育政府金融工業煤礦制度組織數據要素高效合規流通合法合規|

公平公正職責明確|

高效協同基礎設施全球中國長三角區域上海長三角區域中國全球圖8

城市數據空間體系架構152.3

城市數據空間的制度參考體系文件、地方標準)方式進行構建,其中《地方性法規》定地方總體政策原則和法律規范,對有關數據要素活動各方的法律責任進行詳細規定。《地方政府規章》依據《地方性法規》定地方策略和規范,明確數據要素活動各方的職責范圍、工作推進方式等。《地方規范性文件》針對落地過程中實施細則或實施方案,地方因地制宜做出針對性規范要求,《地方標準》規定地方的數據要素活動相關標準規范。當前各省市已陸續推出數據要素的相關政策規定,以制度化管理推動數據要素的合法使用和開發利用,比如上海發布《上海數據條例》、《公共數據授權運營管理辦法》、《公共數據開放實施細則》。總體上看,城市數據空間制度體系采用四位一體(地方性法規、地方政府規章、地方規范性國家相關政策發文城市數據空間的制度參考體系地方性法規(如《上海數據條例》)地方政府規章(如《上海市公共數據共享實施辦法(試行)》)地方規范性文件(如《上海市公共數據開放實施細則》)地方標準4位一體(法規、規章、規范性文件、標準),統籌協同圖9

城市數據空間的制度體系162.4

城市數據空間的組織參考體系城市數據空間的組織體系有清晰明確的組織框架,可參考為:“一局、一中心、一集團、一數標委”。城市數據空間的組織參考體系國家數據局“一局”某數據局“一數標委”“一中心”“一集團”數據標準化技術委員會市、區大數據中心數據集團圖10

城市數據空間的組織參考體系組織架構是城市數據空間體系建立和持續運行的基本保障,各個職能主體的功能范圍參考如下:負責協調推進數據基礎制度建設,統籌數據資源整合共享和開發利用,統籌推進數字城市、數數據局字經濟規劃和建設;推動數據要素的市場化、價值化,推動數據條例、數據管理辦法。大數據中心落實以政務數據為主的公共數據歸集、共享開放;聯合各個行業主管部門進行公共數據治理、監管,提升公共數據質量。構建數據要素市場、激發數據要素潛能、保障數據安全;作為城市數據空間建設、運營主體,承擔城市數據要素的授權運營;數據集團圍繞數字產業化、產業數字化以及數據生態領域開展布局,成為城市數據要素交匯、供給、配置的核心樞紐。數據標準化技術委員會圍繞“采集、歸集、治理、應用、安全、運營”的數據全生命周期,規劃標準體系、打破部門“數據孤島”,實現互聯互通,從而推動政務服務從“群眾跑腿”向"數據跑路”轉變。圖11

城市數據空間的組織職能172.5

城市數據空間的基礎設施架構4個數據分層:圍繞數據全生命周期,數據分層治理,精細化管理。1、統一基礎架構(1+4+2)城市數據空間基礎設施的統一基礎架構,包括1個城市數據底座,4個數據分層(數據資源、數據治理、數據資產和數據交易),以及2個治理框架(安全可信和合規可控)。2個治理框架:數據安全可信治理、數據合規可控治理。城市數據空間基礎設施涵蓋了城市全場景數據的接入、治理、開發、流通、應用五個領域,通過匯聚各方數據,提供“采-治-算-流-用”全生命周期的支撐能力,構建全方位的數據流通體系。1個城市數據底座:打造城市級數據交換的可信可控堅實底座。1個底座+4個數據分層(數據資源、數據治理、數據資產、數據交易)+2個治理框架(安全可信、合規可控)數據資產入表合規可控圖12

城市數據空間的基礎設施架構182、城市數據底座輯統一、開放兼容的城市數據底座。孤立的數據價值并不顯著,只有當數據像水一樣流動起來,才能打破“數據壁壘”,最大化釋放其價值。然而當前企業保存下來的數據,由于技術與流動性問題,只有10%的數據能得到分析,數據孤島、多樣性設備、業務遷移成為數據“流不動”的主要瓶頸。產生上述問題的根本原因在于,企業在建設數據基礎設施時,從滿足客戶的訴求出發并考慮投資成本問題,會選擇不同的計算資源、網絡資源和存儲資源來分別滿足客戶的不同訴求,各類定制化的需求配置導致數據孤島的產生。城市數據底座,包括城市存算融合平臺、城市區塊鏈平臺、城市隱私計算平臺、城市數字信任平臺和城市數智融合平臺。城市存算融合云平臺存儲、服務器、網絡是基礎設施城市數據底座的重要組成,數據"存得好"、算力"算得快"、網絡"傳得穩",數據底座才能充分發揮數據的要素價值。數據生命周期的起點是將采集的數據進行存儲,從而給數據處理和應用提供"原材料"。產生的各類數據與物理世界完成交互后,最終處理的結果又回到數據存儲進行保存,提升模型、算法的精確性和可用性。城市數據底座作為城市數據空間基礎設施,采用集約化建設和管理的重要方法和手段,向下能提高資源利用率,向上能作為能力層提供計算、存儲、大數據分析、人工智能等統一服務。充分利用云計算的先進技術,按照“集約高效、共享開放、安全可靠、按需服務”的原則,以“云網合一、云數聯動”為技術構架,構建物理分散、邏城市存算融合平臺支撐存儲和計算的融合優化,包括交易型數據與生產型存儲相融合,提升性能增強可靠性;數據分析與分析型存儲融合,提高效率提升準確性。在存儲層,通過重定義存儲架17構,將塊、文件、對象、HDFS等多種存儲服務融合,打通數據孤島,解決多樣性數據存儲和共享問題;在算力層,通過將數據庫、大數據、AI多引擎融合分析和多樣性算力統一調度,降低海量數據處理難度,實現高效分析;在管理層,通過將AI融入存儲全生命周期管理,從資源規劃、業務發放、系統調優、風險預測、故障定位等方面實現智能運維,從容應對數千節點規模的復雜管理。后是否被篡改,難以真正做到“數據互認”。同時,也需要一個統一辦理調度平臺,在安全環境中打通各企業、部門業務流程,讓企事業間的數據可靈活共享調用與可信互認,實現“身份通、數據通、事項通”,最終“業務通”。因此,區塊鏈技術的“不可篡改、共享賬本、全程可追溯”等特點,符合城市數據空間中的信息公開、安全互信等需求。同時,使用區塊鏈的非對稱式加密技術、公私鑰機制來確保公眾及政府部門的數據資產安全,可以解決數據開放共享所衍生的信息安全問題,消除各方對隱私泄露的顧慮,保證數據存儲與安全的“權責清晰”,又實現在各企業、政府單位之間數據實時共享互認與靈活調用。城市區塊鏈平臺隨著城市數據交易體系逐步完善,政府對政務服務流程、改善營商環境的力度不斷加大,市民和企業對數據價值的期待也越來越高。跨企業、部門協同和數據互認最多的是公共數據,企業數據仍是流通的關鍵環節和主要難點。由于政府部門、企事業單位原有系統眾多、分散建設,跨企業、部門之間缺乏有效協同機制,難以真正實現業務協同;此外,各企事業單位數據在原有共享機制下無明確標識和校驗,也無法記錄數據共享按照“基礎設施統一建設和運營,應用系統獨立運行和管理”模式,城市區塊鏈平臺可基于開源區塊鏈技術,并結合分布式并行計算、容器、數據管理、安全加密等核心技術,支撐城市數字化應用場景...政務金融港口物流制造醫療增強能力可信共享計算沙箱分布式身份跨鏈服務城市區塊鏈平臺基礎能力聯盟管理節點管理用戶管理運維監控告警日志分布式賬本共識機制合約引擎機密機制輕節點圖13

城市區塊鏈平臺20轉型。面向政務、數據交易、司法、征信、溯源、供應鏈、金融等領域提供PaaS服務,實現城市區塊鏈應用的規范化開發部署和集約化建設運營,確保整體合規性和安全性。三種,即多方安全計算(Secure

Multi-partyComputation,MPC)、聯邦學習(FederatedLearning,

FL)、可信執行環境(TrustedExecutionEnvironment,TEE)。城市隱私計算平臺城市隱私計算平臺融合大數據跨源查詢、機器學習、多方安全計算、可信硬件等功能,逐步推動建立隱私計算聯盟,提供聯邦分析、聯邦學習、聯邦預測等各類功能,提供安全沙箱、同態加密、減分隱私、安全聚合,確保原始數據“可用不可見”,并為不同參與方機構包括城市數據集團、大數據中心、監管機構、審計機構、社會面機構(如銀行、電信或其他數據提供方)部署隱私計算節點,支持配置數據源、執行作業等操作。隨著數據融合需求日益迫切,保障數據要素持有者權益是實現數據要素有效開發利用的關鍵。然而,傳統隱私保護技術無法保護數據在計算過程中的隱私安全,難以保障數據要素持有者權益不受損害。隱私計算技術因能在保護數據隱私同時開發利用數據價值,備受各界廣泛關注。隱私計算是指在保護平臺上各類數據本身不對外泄露的前提下,實現數據共享、分析、計算、建模的技術集合,達到數據“可用不可見”的目的。在充分保護平臺數據和隱私安全的前提下,實現數據價值的轉化和釋放。目前常見的技術路線主要有城市數字信任平臺城市數字信任平臺通過數字化技術、智能算法模...普惠金融政務數據開放產業互聯聯邦分析聯邦學習隱私計算聯盟公共安全聚合節點信任域密碼學沙箱MPC機密計算TEE密文可信計算節點可信計算節點可信計算節點參與方信任域申報材料

|

流水…企業納稅

|

資產…政府交易

|

信用…個人圖14

城市隱私計算平臺21型和制度規則體系,構建安全、便捷、合規、高效的統一身份管理和統一身份認證體系。整合部署在本地或云端的各業務系統的所有數字身份,可實現一個可信身份憑證打通所有應用系統,一次認證,處處可用,并提供統一的數字證書的分發與管理,為物理世界的個人、組織、智能終端、程序等各類實體與其數字空間中的數字孿生體(數字市民、數字政府、數字組織和數字資產等)的映射提供信任擔保,以觸發數字孿生體間的數據交換行為。通過提供分布式身份,以數字身份卡包等APP、小程序為載體,自主管理自己的身份和授權,對原本分散在各大互聯網平臺/系統中的數字身份進行歸集,讓身份的控制權回歸用戶,保護用戶隱私和身份主權,并提供法人、自然人本身的電子證照、屬性身份管理、展示與核驗的服務能力。整的數字身份安全體系,包括:·統一身份管理:覆蓋各類組織/機構、個人、物、應用等實體身份認證體系的延伸和升級,面向平臺中的一切聯網實體提供“安全、中立、權威”的智能化數字身份服務。·統一身份認證:構建多維身份驗證機制,提供完整的面向法人、自然人的身份認證服務能力,提供數字身份管理能力。·可信身份憑證:根據業務場景要求,提供法人、自然人相關聯的數字信息、電子證照等關聯數據,或經相關運算輸出與個人身份相關的匿名化或去標識化等各類可信身份憑證。·分布式數字身份:以數字身份卡包的形式,支持APP前端界面展示與集成,提供身份管理、認城市數字信任平臺可以支撐城市數據空間構建完最終服務對象法人、自然人數據開發數據需求方數據監管方利用方分布式身份

身份憑證身份認證

電子證照授權簽署

數字證書身份認證授權核驗身份憑證數字簽名證照核驗安全審計身份認證授權核驗身份憑證數字簽名身份關聯安全審計授權核驗簽名核驗安全審計公共數據授權運營服務平臺數據使用服務模組

數據運營服務模組數據授權運營方法人自然人物最終對象服務模組服務能力組織架構身份管理身份核驗單點登錄分布式數字身份子系統統一身份管理

統一身份認證

可信身份憑證分布式身份數字證書平臺運營方應用數據授權、匯聚、存儲、加工、流通各個環節及相關軟硬件能力支撐支撐能力身份認證加密傳輸身份認證加密傳輸身份認證加密傳輸數據提供方(公共數據)數據提供方(國資國企)數據提供方(社會數據)圖15

城市數字信任平臺22證、證照、授權等服務能力,保證數據真實可信、保護用戶隱私安全、可移植性強、去中心化,讓個人能自主管理本人身份。通過整合所有云原生數據湖的組件,包括大數據、AI、數據倉庫等一系列的處理引擎,讓引擎之間的元數據進行統一管理,為上層業務開發者提供更方便的使用。通過統一元數據工具,可以把多種多樣數據處理引擎的基礎元數據進行精細管理,實現統一權限控制,統一事務機制,統一數據索引。同時湖倉一體化構建,將數據真正無縫地銜接在一起形成統一數據湖。融合AI人工智能,將進一步釋放數據價值,一站式AI開發生產線,讓原來認知、感知、決策這一系列的AI復雜功能得到極大簡,構建起面向未來數據和智能融合的一個基礎基石。·數字證書:根據組織/機構、個人、物、應用的身份管理、發放、核驗相應的數字證書。城市數智融合平臺數據從產生到發揮要素價值的過程困難且漫長,包括數據采集、數據存儲、數據處理加工、數據流通、數據分析、數據應用等,每一個過程都充滿大大小小的挑戰。“AI+數據”雙輪驅動,是解決數據從要素到用起來、實現數據價值化鴻溝的重要策略。城市數智融合平臺把這些系統和高價值的數據統一、融合起來進行高效治理,以充分發揮AI的能力,有效地實現降本增效。3、數據資源層數據資源是釋放數據要素價值的“原材料”。隨著數字經濟的迅猛發展,各類主體在生產、經數據湖統一存儲HDFS|對象存儲圖16

城市數智融合平臺23營、管理、服務、消費等過程中產生大量數據。在推進數據開發利用、釋放數據價值過程中,不同類型數據面臨不同的重點任務與關鍵問題,分類推進數據要素探索已成為當前共識。按照數據資源相關權益歸屬的不同,將數據分為公共數據、企業數據、個人數據三大類型,提出“建立公共數據、企業數據、個人數據的分類分級確權授權制度”,突出不同類型的重點關切,探尋相應的突破方向。公共數據企業數據公共數據是在各級黨政機關、企事業單位依法履職,或提供公共服務過程中產生的數據。公共數據不僅包含來自政務體系的數據,還包括來自公共事業的數據(包括科研、教育、文化、供水、供電、公交等公共事業)。公共數據,歸國家或全民所有,由政府或其他公共部門代為行使管理、開放等職責。企業在開展業務、提供服務和進行日常經營管理中,產生了各類數據,尤其是處于數字化轉型進程中的現代化企業,積累了海量數據資源,特別是互聯網、金融、先進制造等行業。現代企業利用數據湖倉等技術,進行企業數據管理,這些數據經過不同程度的加工、整理與分析,形成了企業數據資產。這些數據資產是企業進行豐富的數據應用、參與數據要素流通的基礎。在保障國家安全、商業秘密安全、個人信息安全的前提下,通過公共數據的授權運營模式進行市場化運營,是城市公共數據匯聚、開發和價值釋放的主要路徑。公共數據授權主體依托公共數據運營服務平臺,為各數據要素參與方,提供技術、工具、和增值開發服務,加速公共數據的市場化利用。數據資源富集的企業,在產業鏈上下游的數據融通提效、精準營銷、用戶畫像、線上線下體驗提升等領域,發揮著重要作用。數據綜合能力強的企業,除供給數據資源外,還利用數據服務能力,提供綜合性數據產品與解決方案。這些數據產品和數據服務,共同構成了企業數據要素的流通形態。目前,公共數據已在金融行業的風險洞察、信用評估等領域發揮價值。在各地陸續出臺的公共數據授權運營實施方案中,也不斷提出在健康醫療、交通運輸、商貿物流、工業制造、社會治理、生態環保、教育、體育、文旅、科研等更多領域,充分釋放公共數據價值。個人數據個人在城市工作、生活中,在不同的工具使用和服務過程中,產生的了大量個人數據,其中不乏像醫療、出行等許多具有較高商業利用價值的數24據。目前,個人數據大多由政府公共部門和平臺型企業實際持有,個人對不同類型個人數據的掌控能力均有限,如何有效保障個人的隱私和權益,仍然是目前個人數據的焦點。據要素的潛力,甚至開辟出新的市場增長機會。數據要素在運用過程中,可以和金融、信用、醫療、制造、物流等數據深度融合,通過數字化進一步實現市場供需匹配,涌現如普惠金融、普惠醫療、智慧出行等一批批創新場景,從而增加要素使用機會并提升配置效率,創造更高的市場價值。數據要素在促進其他要素使用效率提高的同時,也能夠通過打破信息壁壘,為各種要素之間的優化組合與合理配置創造有利條件,促進市場主體間的協同創新,提升城市經濟的發展水平。在《個人信息保護法》施行前,大量個人數據被“一攬子授權”,個人在使用服務過程中可能需要提供許多與服務無關的數據。《個人信息保護法》規定了個人數據收集與處理的最小必要原則和單獨同意原則,實現了初步的個人數據分級、分步驟授權模式。4、數據治理層未來,在遵循相關法規和用戶意愿、保護數據隱私和安全的基礎上,以更簡潔清晰的開發利用場景,更加細化、完備的數據要素分級授權體系,實現個人對數據處理范圍的高效控制,是城市個人數據流通利用的重要方向。數據治理基本框架城市數據空間的數據治理是指以區域為單位對城市發展有價值的信息進行識別、收集和組織,建立管理、服務和運營體系,以實現城市管理者及數據使用者對數據可視、可管和可用的需求。其特點在于數據來源多樣、網絡環境復雜、利益相關方眾多、應用場景不斷涌現等。多元數據融合在具體業務場景中的數據類型,實際往往不是單個類型的數據要素,更多的是公共數據、企業數據和個人數據的組合,即多元數據要素融合。因此,城市數據空間的數據治理需要管理和技術相結合,實現各管理組織、規劃、制度、流程、標準等工作中的協調性和一致性。多元數據要素融合,有助于進一步發揮出市場數在整體數據治理工作中,基本框架如下:城市數據空間數據治理的核心活動包括元數據管理與資源資產編目、數據標準管理、數據質量管理、數據分類分級、數據安全管理、以及AI數據工程建設等幾大方面。這些活動能夠有效地提高數據質量和可用性,從而提升城市管理水平,并推動城市發展。城市數據空間主要承載城市區域范圍內的公共數25據、企業數據和個人數據,因此,城市數據空間的治理有別于傳統企業、政府數據治理,而需要兼顧三類數據需求,既要支持傳統數據分析消費,又要提供用于AI訓練的高質量語料數據。城市數據空間數據使用者反饋意見提供服務城市數據空間服務運營者城市數據空間治理需求方城市數據治理服務提供方滿足需求提供支持城市數據空間治理成果咨詢系統數據可視數據可管數據可用......數據交換數據共享數據交易AI訓練推理治理成果工具城市數據空間數據治理核心活動指導監督元數據與編目數據分類分級數據標準數據質量提出需求運維數據安全AI數據工程其他

......提供數據城市數據空間數據提供者公共數據企業數據個人數據圖17

數據治理的基本框架數據治理基礎內容(共性要求)元數據與編目數據標準數據質量數據分類分級數據安全AI數據工程公共數據特性要求企業數據特性要求個人數據特性要求加大供給明確量化規則安全合規進一步提升質量高效共享明確價值評估規則隱私計算高效共享圖18

數據治理基礎內容26公共數據、企業數據和個人數據各自的內涵和特性不同,故三類數據的治理方法和目標也有所不同。對于個人數據,大多數由公共部門和企業實際持有,自然人對這些數據的自主掌控性較弱,加之可以運用AI大模型等能力開展深入挖掘,這部分數據與其他相關數據結合后的價值可以被不斷放大,治理中需要警惕這部分數據不被相關利益方獲取濫用,因此個人數據治理的關鍵問題是如何在加強相關個人權益保護的基礎上開發利用。“取之于民、用之于民、造福于民”是公共數據治理的原則,它要求在保護國家安全、商業秘密安全、個人信息安全的前提下,根據用途持續擴大供給使用范圍,讓公共數據價值更好地惠及全社會,這就涉及到如何增加供給規模、提高供給質量和效率的關鍵問題。元數據管理及資源、資產編目在城市數據空間中,無論是結構化數據還是非結構化數據,都需要通過元數據管理來進行數據治理工作。因此,元數據管理需要貫穿從數據進入、匯聚、加工、產品化、估值、流通到消費的全生命周期。對于企業數據,主要治理活動存在于企業內部管理中,數據在被提供至城市數據空間前,已經完成了一定程度的治理,因此在城市數據空間中的治理目標將不再是規范化和標準化,而是如何量化企業數據的價值貢獻,促進數據價值的“顯性化”。為了實現有效的元數據管理,建立以下主要管理框架和策略:運維元數據消費元數據元數據質量管理元數據運營分析元數據API管理元模型管理管理流程元數據中心元數據查詢/搜索元數據血緣分析元數據影響分析數據標準合規檢查注冊元數據存量增量業務、技術、操作元數據管理規范

采集元數據產生元數據結構化數據非結構化數據CDH

iSales...公共數據企業數據個人數據圖19

元數據管理架構元數據管理架構包括產生、采集、注冊和運維四個方面工作。數據和技術元數據之間的連接,通過下面四步全面管理元數據的生命周期:在城市數據空間中建立元數據中心,實現業務元1)當公共數據、企業數據和個人數據進入城市27數據空間時,將同時取得相應的元數據;4)最后確保元數據的運維工作得到有效實施。2)之后通過統一的元模型,從各類數據源建立的采集通道中自動采集元數據;建立元數據管理的基礎能力后,對后續開展數據消費的關鍵作用就是對相關數據資源、資產開展編目工作,形成層級化、結構化的數據資源資產目錄,從而為城市數據空間建立完善的“數據一張圖”。3)接著基于增量和存量兩種場景,完成城市數據空間元數據的注冊工作;數據接入認證產品登記上架合規交易安全可信質量評估監測預警……數據到哪里去數據流通數據消費者數據產品經營權數據流通視圖:聯通各數據專區空間,建立數據要素流通統一大市場,從城市數據空間角度建設數據流通視圖3可信可證鏈可用不可見可控可計量2數據產品視圖:按數據屬性劃分物理/邏輯數據空間專區,專業化管理數據產品信息視圖,為數據要素流通提供基礎公共產品交通產品金融征信產品生命健康產品……………數據開發商數據產品城市治理

社區網格

政務信息低碳出行

交通大腦

車路協同數字風控

數字征信

數字信貸普惠醫療

應急防控

e生報數據做什么用數據加工使用權數據專區/集市數據開發金融專區空間公共專區空間交通專區空間醫療專區空間………行業知識圖譜發現新型語義智能構建AI大模型訓練采存&算管用1數據資產視圖:將原始數據資源治理為高質量、高價值的數據資產,利用數據資產視圖提升數據產品開發效率數據提供者數據從哪里來公共數據匯聚、聯接、開放、共享企業數據個人數據……數據源持有權金融制造交通科技醫療能源教育環境圖20

數據一張圖在城市數據空間中可以分別從數據資產、數據產品和數據流通的視角,來形成整體的數據地圖。其次,數據產品視角主要關注數據做什么用,即城市數據空間中的數據產品。這張圖展示了城市數據空間中的各種數據產品,包括數據分析報告、數據可視化、智能決策支持系統等,以及這些數據產品的應用場景、用戶群體等信息。通過這張圖,可以為數據的應用和價值實現提供支持。首先,數據資產視角主要關注數據從哪里來,即城市數據空間中的數據資產。這張圖展示了城市數據空間中的各種數據來源,包括政府部門、企業、社會組織、個人等,以及這些數據的類型、格式、質量等信息。通過這張圖,可以為數據的后續處理和利用提供基礎。最后,數據流通視角主要關注數據到哪里去,即28城市數據空間中的數據流通。這張圖展示了城市數據空間中的數據流通路徑,包括數據采集、存儲、處理、分析、共享等環節,以及這些環節中的數據要素、數據流向、數據安全等信息。通過這張圖,可以為數據的安全和可控提供保障。·數據的定義和描述:元模型應該清晰地定義和描述數據的名稱、含義、類型、格式、來源、范圍、約束、質量等基本屬性,以便于數據的識別、理解和使用。·數據的分類和分級:元模型應該根據數據的用途、敏感性、安全性、共享性等因素,對數據進行合理的分類和分級,以便于數據的管理、授權和服務。綜合這三個視角形成的完整數據地圖,幫助我們全面了解在城市數據空間中的數據從哪里來、做什么用、到哪里去以及中間經歷了哪些環節最后產生了什么價值,幫助城市管理者和數據消費者更好的管理和使用數據。·數據的關系和映射:元模型應該描述數據之間的邏輯關系和物理映射,以便于數據的整合、分析和查詢。數據標準管理城市數據空間的建設,需要面向公共數據、企業數據和個人數據三類數據制定統一規范、統一標準,并達成各方共同認識。·數據的變化和版本:元模型應該記錄數據的變化歷史和版本信息,以便于數據的更新、追溯和審計。對于結構化數據,可以構建的數據標準模型主要包括:·數據權責管理:明確業務規則責任主體、數據29維護責任主體、數據看護責任主體等,以便開展數據權責劃分和數據質量改進。于隱私數據合規的前提下合理使用數據、合規治理數據,才能實現對個人數據的可控和可信。對于非結構化數據,可以構建的標準體系包括:內容模型、內容分類、編碼命名、內容格式、內容本體、版本策略、元數據、內容指標和內容接口等。數據分類分級根據數據來源可以分為公共數據、企業數據和個人數據;根據內容可以分為結構化數據和非結構化數據;根據業務屬性可以進行資源和資產的分類編目。數據分類是進行數據分級管理的基礎,以便采取不同的管理措施和應用策略。數據質量管理在城市數據空間的公共數據、企業數據和個人數據三類數據中,需要更加強調的是公共數據的數據質量要求。當前對于公共數據的治理還需明確權責體系,需要進一步推動公共數據從開發利用到治理完善的閉環驅動機制落地,實現公共數據質量的持續改進和高效供給。在元數據的管理模型中,可以針對不同數據分類設計分級管理模型。例如,結構化數據按照邏輯實體和屬性進行數據分級,包括數據安全分級標識、數據敏感性標識、隱私數據標識等管理標簽;非結構化數據則可以在其“內容分類標準”和“內容本體標準”中提供數據內容的分類、分級、敏感度、密級等方面的規范性標識。相比之下,企業數據則具有明確的數據Owner權責體系,且已經完成了一定程度的治理,部分重點行業監管機構也提出了嚴格的數據標準和質量要求。并且企業自身受市場驅動也有自己的數據治理體系,可持續對數據進行質量提升。有了以上基礎,數據管理者和消費方就能夠明確區分空間內哪些數據密級高、哪些數據屬于個人隱私類數據、哪些數據可以被快速獲取等,并為三類數據進一步制定安全管理流程和制定安全技術標準提供依據。而個人數據當前主要問題不是數據質量的問題,而是隱私數據保護法律規范的遵從要求,需要基控制=流轉監控、SOD吃藥=脫敏打針=加密手術=集中管控元數據安全掃描數據安全治理制定安全策略執行安全策略識別安全隱私風險分組、標識和標注按等級制定約束保護、控制和稽查圖21

元數據安全治理流程30數據安全治理險評估和登記,制定相應的流轉和使用約束,以及保護和留存規則,可以確保數據在流轉和使用過程中的安全性和合規性。數據安全是公共數據、企業數據和個人數據三類數據在城市數據空間管理中的核心訴求。進一步開展元數據管理,提升數據安全管理能力。·執行安全策略:這包括數據保護措施的實施,如脫敏、加密、隔離和入侵檢測系統等,以及數據流轉的控制和策略合規的稽核。通過這些措施,可以保護數據的完整性和可用性,同時確保數據的流轉和使用符合相關的安全策略和合規要求。在城市數據空間中開展數據安全治理主要過程,包括以下幾個方面:·元數據安全掃描:通過獲取安全相關元數據并持續發現安全隱私風險,可以及時了解數據的來源、結構和安全風險,為后續的數據安全管理奠定基礎。面向AI的數據工程建設AI和大模型隨著應用越來越廣泛和深入,未來在城市管理與運行中的重要性會越發凸顯。各方對于語料訓練數據既相互需要,但又無法確保數據不被對方濫用。因此可由城市管理方出任可信方,將城市數據空間作為AI語料數據的承載底座,實現數據可信可用,在整個過程中還需要對AI語料數據進行治理以提升其數據質量、規范和數據安全。·數據安全治理:包括資產注冊、分組分類、標識、分布和標準管理等工作。通過對數據進行分類和標識,可以清晰地了解數據的性質和重要性,并建立起對數據的管理框架和規范,為后續的安全策略制定和執行提供依據。·制定安全策略:這包括風險登記、流轉與使用約束、保護與留存規則等方面。通過對數據的風31數據工程是面向AI和大模型開展數據處理、提升數據質量的高效方法,在這其中也可以同時運用多種先進技術、AI算法算子和自動化處理能力,示例流程如下圖:處理階段數據獲取數據預處理三方收集、網絡爬取、邊緣匯聚原始數據清晰、加工為可訓練數據慮毒&隱私處理模糊重復刪除數據格式規粗整過濾及去重語言檢測計算處理數據提純

數據去重

數據分詞

數據混合訓練高性能存儲存儲處理內置數據預處理框架高質量數據集混合訓練數據多模態原始數據(PB級)大容量存儲圖像、文本、語音、代碼等預處理中間階段的過程數據加工過后的高質量數據集海量原始數據預處理后的數據數據多模態原始數據圖22

面向AI的數據工程流程框架AI語料訓練數據管理和治理流程,主要包括兩大步驟:5、數據資產層和數據交易層雖然“數據二十條”對數據要素確定了三權分置的數據產權制度,但落地在稅收、法律等相關領域時,有些進展但尚有許多問題待探索和研究,包括數據資產評估、數據資產入表、數據產權登記、數據產品定價、數據商品流通等。1)

數據獲取:通過多個渠道獲取大規模的語料數據,包括文本、圖像、音頻和視頻數據,這些數據來自城市感應器、社交媒體、市政機構、市民反饋等多個來源。獲取到的數據集需要經過脫敏、合規、審批和匯聚等環節,最終在城市數據空間內進行統一存儲,形成多模態的初始語料數據集。財政部會計司于在2023年8月發布了《企業數據資源相關會計處理暫行規定》,就數據交易雙方如何進行會計處理、數據資源是否可以作為資產入賬等問題提出會計處理方法。中國資產評估協會于2023年10月發布了《數據資產評估指導意見》,規范資產評估機構及其資產評估專業人員在數據資產評估業務中的實務操作,明確了評估對象、數據質量評價、評估方法、披露要求等。這些進展讓我們看到后續還會有更多的政策發布,對數據資產和數據交易環節提供更具體的政策依據。2)數據預處理:經過數據格式規整、粗過濾及去重、語言檢測、模糊重復數據刪除、數據濾毒、隱私處理、數據提純、數據去重、數據分詞和數據混合等環節。這些預處理環節中的算子或框架可以由數據治理服務方提供。經過預處理后,數據將變得更加高質量,形成高質量數據集和混合訓練數據集,為后續的訓練和分析提供可靠的基礎。326、安全可信和合規可控治理框架城市數據要素要實現安全高效流通,需要在城市數據要素流通的全生命周期過程中設計安全可信和合規可控治理框架。安全可信HTTPS證書數據硬件加密數據數據準入校驗數據權限控制數據訪問策略數據內容加密數據權限控制合規可控圖23

數據全生命周期安全(一)數據流通可信任種方式,參與方可以對數據流通的各個環節進行有效追溯,及時發現和預防合規風險。城市數據流通的可信任是指數據在流通過程中,數據的真實性、完整性、保密性和合規性得到保障。要確保各參與方身份可信、數據使用合規、數據安全和數據隱私保護。·合約可信執行是實現合規管理可追溯的基礎,通過將合規規則和條件轉化為合約,并將合約執行程序化,可以減少人工干預,確保合規規則的有效執行。通過采用數字證書、電子簽章等技術手段,確保參與方身份的真實性和合法性。建立信任管理服務平臺,統一管理數據資產的權限、身份認證等信息,實現數據授權的自動化信任管理。采用數據加密、訪問控制等技術手段,保障數據在流通過程中的安全性。·過程可追溯是合規管理可追溯的重要組成部分,通過對數據流通過程的各個環節進行記錄和保存,可以為事后追溯和分析提供基礎。通過區塊鏈技術有效實現合規管理可追溯:(二)數據合規可追溯合規可追溯是城市數據流通中有效防范合規風險的重要手段,通過合約可信執行和過程可追溯兩·不可篡改性:區塊鏈上的所有數據都采用哈希算法進行加密,并存儲在分布式賬本上,任何節33點都無法修改或刪除,從而保證數據的真實性和完整性。數據授權運營中存在的數據訪問權限與敏感數據擴散的安全問題,提高數據流通合規的可信度,降低數據泄露的擔憂,通過分類分級和脫敏溯源化解對數據無限制擴散的擔憂,促進各方對數據共享的信心,提升數據授權運營的品質。·可追溯性:區塊鏈采用鏈式結構存儲數據,每個區塊都包含前一個區塊的哈希值,從而可以追溯到數據的來源和流轉過程。(四)跨境數據監督·去中心化:區塊鏈網絡由多個節點共同維護,任何節點都無法控制整個網絡,從而保證合規管理的透明度和公信力。發展安全的數據有序跨境流動是城市數據空間推進數字跨境貿易基礎設施建設的基礎。需要制定政策保障措施,建立數據安全保護能力認證、數據流通備份審查、跨境數據流動和交易風險評估等數據安全管理機制。(三)數據內容可信任需要全面確保數據內容安全可信,從根本上解決2.6

城市數據空間的數據生態建立人才認證中心,以及為之配套的人才認證體系支撐數據產品的市場營銷,提供咨詢服務提供資產評估、擔保抵押、權益保障等服務通過認證培訓+實踐的方式,為本地培育數據要素復合型人才交易中介方,推動交易達成,包括公證、合同、商務等數據產品博覽中心基于數字孿生技術,匯聚產業鏈營銷生態,提供數據產品發布會、招商推介、展覽展示、品牌營銷等數據服務純軟件開發商行業應用開發廠家根據客戶需求定制數據產品根據客戶需求定制開發數據產品提供產品開發、可信流通、應用開發測試等普惠性技術培訓服務本地人才的培養、認證體系提供端到端開發環境和一站式開發包,“拎包”入駐快速便捷積極推動政策扶持,引入本地人才在金融、醫療、公共服務、制造等優勢領域,聚合行業生態進行價值數據產品開發,價值場景聯合孵化在可信傳輸、隱私保護等方面,開展技術創新圖24

城市數據空間的生態培育體系34城市數據空間的數據生態,包括授權運營方、數據供給方、數據消費方,以及為數據全生命周期服務的數商(數據開發商、數據經紀人、第三方服務機構、行業應用開發商、本地人才等)。博覽中心,通過數字虛擬化互動體驗,提供數據產品的產品發布會、招商推介、展覽展示、品牌營銷等服務,以及產品技術的系列化數字沙龍活動、圓桌論壇等,激發產業數據產品應用場景不斷創新。數據生態的培育體系主要基于2中心2平臺開展,圍繞城市數據要素高效合規流通為目標,提供高質量的數據人才、數據產品、數據認證和數據相關服務。2中心是人才認證中心和數據產品博覽中心;2平臺是開發賦能平臺和創新孵化平臺。開發賦能平臺提供產品開發、可信流通、應用開發測試等普惠性技術培訓服務,提供端到端開發環境和一站式開發包,快速便捷地實現“拎包”入駐。發布開發測試規范,以保障在開發環境中的數據安全性和合規性,做到數據在開發周期內的可信可控。人才認證中心面對數據要素發展戰略對人才需求的挑戰,建立人才認證中心,構建以及為之配套的人才認證體系。通過認證培訓+實踐考核的方式,為本地培育數據要素復合型人才,面向未來、為城市產業鏈源源不斷輸送人才。創新孵化平臺面對技術創新挑戰,優先在金融、醫療、公共服務、制造等優勢領域,引入行業專家,聯手高校科研,聚合行業生態進行價值數據產品開發、價值場景聯合孵化。同時在可信傳輸、隱私保護、數據回收、數據確權等方面,開展關鍵技術和課題的研究、攻關和創新。數據產品博覽中心基于數字孿生沉浸式技術,建立線上數據產品的圖25

城市數據空間內外3模式3循環352.7

城市數據空間的運行模式粵港澳大灣區等城市群,這些城市群正在將城市內循環外溢到國內跨城循環,形成雙循環模式,進一步促進城市群的區域規模效應,也同時外溢到國際跨境循環,甚至出現三循環模式,加強對國外先進城市的數據對接,推進跨境貿易。城市數據空間的運行模式,需要根據數據的分類分級,選擇不同的運行模式,對于每一種模式沒有絕對合適,都是基于業務場景來判斷,能推動業務健康發展的模式,才是真正的好模式。目前看分成以下三種模式:城市內循環模式關注數據要素在城市內流通的高效性和合規性,是最主要的循環模式。(1)中心化模式:即數據被集約式共享,被授權給不同的運營單位進行使用。當前的公共數據授權運營方式就是我們認為的中心化模式。國內跨城循環模式需要關注城市帶/城市群,甚至在整個國內的各個城市之間的數據要素流通。加強城市與城市之間、城市與國家中心之間的互通,建立區域和全國的互通接口和協議標準化,打通數據壁壘,實現互操作性,進一步釋放數據價值。(2)去中心化模式:即數據供給來源于任何地方,不呈現集中模式,基于平等和對等網絡接入和訪問數據,類似歐洲IDS數據空間,該模式激發了企業數據的大規模應用。(3)混合模式:在中心化和去中心化模式之國際跨境循環模式間,我們認為還在混合模式。需要關注跨境數據的安全、敏感性,是否存在違反國家安全法律的規定。對影響或者可能影響國家安全的數據處理、數據跨境傳輸等活動依法依規進行國家安全審查。維護國家安全和利益,保障跨境數據用于合法用途,防范數據出境安全風險。反對數據霸權和數據保護主義,有效應對數據領域“長臂管轄”。從循環機制來看,存在三種循環模式,即城市內循環、國內跨城循環、國際跨境循環。其中城市內循環是大循環,也是循環主體。不同的循環方式,對城市數據空間的要求不同。當前越來越多出現跨多個城市的城市群,如長三角、京津冀、

30

48最佳實踐案例3.1

上海數據集團城市數據空間分離架構,滿足以公共數據為牽引,融合企業數據、行業數據等多源數據匯聚、治理和開發利用,提供面向數據治理、數據產品、數據服務、數據應用的開發工具。圍繞數據全生命周期,提供信任安全和授權運營的管理能力,以促進數據的社會化利用。“天機·智信”平臺深度融合區塊鏈、隱私計算等關鍵技術,依托“浦江數鏈”、“數字信任”體系提供身份可認證、訪問可控制、授權可管理、安全可審計、過程可追溯的關鍵技術能力,打造城市級數據空間基礎設施的標桿和示范。上海數據集團作為上海市公共數據授權運營主體,承擔著構建數據要素市場、激發數據要素潛能、保障數據安全的戰略使命。通過整合公共數據空間、企業數據空間和個人數據空間,利用創新的技術尋找數據要素的價值場景,釋放數據要素的生產力,幫助上海各政府機構、本地企業、民眾挖掘和賦能數據要素的價值,為此聯合華為云打造“城市數據空間”新范式。2023年,上海數據集團以公共數據為牽引,構建城市數據空間的關鍵基礎設施——“天機·智信”平臺。采用技術領先的湖倉一體、存算“天機·智信”平臺打造“1+2+4+X”整體架構,如下圖所示:數字生活數字治理身份授權數字經濟普惠金融醫療健康便民服務保險報銷民生治理…………數據價值場景數據資產地圖審核中心供應中心運營中心開發中心個人中心數據開發服務數據治理|數據產品|數據服務|數據應用數據授權信任安全數據底座基礎庫|主題庫|專題庫數據平臺運營管理大數據區塊鏈數據倉庫隱私計算數據治理ROMA基礎設施平臺企業數據圖26

上海數據集團城市數據空間381個數據底座:采用自主創新、安全可信的技術路線,構建統一的數據匯聚、存儲、治理加工、運維管理能力的數據底座;當前,以普惠金融場景為例,上海數據集團已經成功開放超過3000項公共數據,向33家金融機構提供超3700萬次的數據標準化服務,幫助金融機構優化信貸評估模型,提升評估效率,為中小微企業

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論