云智算技術白皮書2025_第1頁
云智算技術白皮書2025_第2頁
云智算技術白皮書2025_第3頁
云智算技術白皮書2025_第4頁
云智算技術白皮書2025_第5頁
已閱讀5頁,還剩49頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

云智算技術白皮書(2025)2力泛在化(2020年)等階段,隨著人工智能與算力網絡深度融合,中國移動通過打造云智算技術體系,升級AIIaaS、AIPaaS、作為“匯聚者”,打造AI生態平臺,廣泛匯聚多類型模型、多領域運營服務,深化AI賦能。在此基礎上,全面激活智能算力與應用普3 7 7 7 8 9 9 10 11 13 13 14 16 4 5縮略語123456789ModelFLOPsUtilizatiModelContextProtocCommonVulnerabilitiesModelDistributionNetwo61.從云計算到云智算隨著千億參數大模型等AI技術的迅猛發展,傳統云服務體系面臨嚴峻挑戰,云超現有資源池化的調度能力;在網絡層面,AI的IaaS/PaaS服務無法全面覆蓋數據處理、模型訓練、推理部署等AI開發全鏈路的需求,迫切需要構建適應智能時代的云云智算作為云計算的新升級,是以AI為核心驅動力的下一代云計算范式,是未云計算向云和AI深度融合的云智算升級,體系架構從IaaS、PaaS、SaaS活調度、即取即用。二是AIPaaS,即面向各類AI開發者的工具平臺服務,提供覆蓋AI研發、運營、測試等全環節的工具鏈和開發環境,顯著提升全社會AI創新效率。三是MaaS,即加速AI一站式落地的模型服務,匯聚模型、能體等資源,推動AI在各行業的普及滲透的AI應用服務,賦能生產方式、生活方式、社會治理方式的數智釋放AI價值潛能。為此,中國移動針對云智算體系架構形成了計算、存儲、網72.云智算關鍵技術方向引領云智算基礎設施從規模擴張走向效能躍延等。GPU是智算核心,中國移動以測促研推動國產化GPU成熟,同時布局DPU搭載輕量化RTTbased擁塞流控算法,有效降低網絡時延,滿足推理場從源頭上解決多路徑hash沖突問題,提升智算集群帶寬利用率與可靠性。面向近期,升級DPU芯片智算網絡帶寬,優化RDMA傳輸機制、搭載流控算面向中遠期,持續優化DPU芯片智算網絡核心能力,提升8二是融合COCA智算軟件棧實現算力應用一體加速,面向近期,聚焦超節點生態構建和應用示范牽頭打造,并推進行業形成跨7家智算芯片的一體接入。重點攻關異構設備統一接入面向近期,深化研究AI芯片統一算力抽象機制及轉換方法,強健高性能全棧異構通用基礎軟件系統能力,接入更多AI芯片,支撐更多編程語言范式,全面融入高性能推理業務場景,支撐跨廠商低成本遷移面向中遠期,以“異構CPU+智算AI芯片”一體融通、支撐訓推一體的泛AI業務為目標,探索虛擬指令集等深度算力抽象技術,形成即插即用的統一XPU9基于通算理念構建的存儲系統在長期演進中形成的標準化協議和產品形態儲系統的革命性升級。基于高性能網絡技術棧(如RDMA、Infiniband)和高性應用以更高效的方式使用存儲系統,是提升智算業務效能隨著AI大模型應用及訓推場景的爆發式增長,GPU顯存和宿主機內存容量有限、本地及網絡持久化存儲性能不足等問題凸顯,已成為制約AI大模型發展的癥結所在。尤其以KVCache、RAG等為代表的推理技術對存力的要求越來中國移動提出面向AI的高彈性多級緩存方案,解決訓推過程對于存儲系統面向近期,針對AI訓推場景對于多級緩存的核心需求,聯合產業力量升級為應對AI大模型訓練與推理對算力基礎設施的極致性能需求,中國移動構建“卡間-機間”全棧智能互聯技術體系,通過協議與全調度以太網(GSE)架構,突破傳統互聯技術在高帶寬、低時延、大規),級時延與無損傳輸能力。2024年以來,中國移動通過廣泛合作進入產業化快車道。在多樣性算力峰會成立“OI2D/2.5D/3D封裝形態的標準化互連協議棧,系統性解決多芯粒互操作性瓶頸;同步開展光電協同技術預研,通過OIO(OpticalI/O)光電融合架構創新,采AI大模型以GPU集群分布式訓練為基礎,網絡成為影響算力的關鍵因素。為此中國移動提出全調度以太網(GSE)技術架構,全面革新以太網底層轉發機調度以太網技術架構白皮書》[13],隨后發布全套GSE技術標準、全量支持GSE過實現網絡和算力的深度融合與動態協同供給,正成為支撐AI規?;瘧玫年PIETF路由域近20年由中國企業/高校推動成立的唯二工作組之一,當前已經完為系統性能的卡點。面向云智算訓練,在網計算可以將Allreduce、Broadcast為應對AI開發周期長、AI開發門檻高等難題期;基于代碼大模型內核等AI工具鏈技術,通過拖拉拽或者對話式開發模式降數據燃料,推動自動駕駛、醫療影像等垂直領域AI應用落地。面向近期,為AI提供高質量數據燃料。數據合成技術突破真實數據瓶頸,型融合文本、圖像、音頻等,增強跨領域泛化能力;AI驅動自動化標注,提升即FP8/INT8精度自適應切換)與梯度縮放機制,在確保訓練精面向中遠期,探索FP4/INT4超低精度計算架構,建立從算法設計到硬件指彈性分片)與增量式檢查點技術(秒級快照+差異恢復),將故障恢復時間AI驅動的故障預測模型,通過時序預測、因果推理實現訓練中斷的提前預警,構硬件適配復雜等問題,通過合理的模型切分、顯存分區管理,提升AI規?;―ynamicBatchSize)與顯存分區管理技術優化KVCache利用率,構建基于理延遲降低20%-30%,同時結合算力-內存協同優化技術,將異構集群資源利用面向中遠期,打造AI驅動的智能監控框架,通過計算圖拓撲與硬件資源狀增強檢索生成(RAG)技術面臨多源知識庫管理復雜、動態場景下知識更新立反思機制,構建錯誤模式知識庫并實現策略優AI工具鏈存在AI技術門檻高、工具鏈協作效率托云原生AI底座技術,結合代碼大模型和向量、多模數據庫等能力,整合多模助力規?;疉I應用落地。本、圖像、音頻等復雜數據的高效處理,正在成為AI時代不可或缺的關鍵數據面向中遠期,向量數據庫進一步與大語言模型(LLM)等人工智能技術深度整合研發大模型能力,提升“數據處理-知識構建-模型開發-模型預訓練-模型后訓練-模型推理-智能體開發”全流程工具鏈效能[19][20],推動模型開發從場景。打造端到端模型交付能力,為用戶提供算力、模型運維、咨詢、集成、交付、調優的一體化服依托云原生AI底座和AI工具鏈技術,匯聚覆蓋“L0、L1、L2系,構建最開放、最全面的模型和智能體生態,助力AI+企業即用即取。中國移動已構建DICT庫、MaaS云市場等多種成熟商業模式,形成了算力補貼、技術面向近期,提供統一的框架、接口和標準化協),特征(如任務復雜度、數據模態、實時性需求)動態分配子任務至最優量化異構算力(CPU/GPU/NPU)、存儲容量及任務式編排調度技術面向離線負載與離線作業等任務式場景提供全生命周智能體編排調度技術基于分布式AIAgent協同架構,深度整合ANP與MCP,創新智能體路由調度算法,達到意圖的精準識別和任務的高效規劃,實現模型、智算資源的引入也帶來了新的風險,已公布的GPU相關的CVE漏洞高達700方式進行分析防范;并借助時序分析、行為特征分析等技術監測GPU/CPU利l可信計算技術:應用硬件級安全芯片(如TPM/TCM)構建底層信任根,在其智算場景面臨的數據安全風險主要包括針對數據的攻擊和通過數據發起攻結果的偏差會對AI模型使用者造成安全威脅。針對模型自身安全合規、模型被內容合規性、結果可信性等方面的檢測,用AI對抗AI,實現“用魔法打敗實現綠色人工智能(GREENAI)。AI大模型快速發展推動云智算系統算力需求激增,帶來高能耗與碳排放問l能效管理技術:提出能效、碳效、算效評價模型,形成“評價-優化-管控”隨著AI大模型快速發展,高密芯片TDP持續攀升,算力基礎設施制冷模式l空調智慧化運維技術:通過AI驅動的能耗優化與預測云智算系統的高能耗與高碳排放已成為綠色低碳發展的核心挑戰。為破解l算電協同技術:通過構建“信息流-能量流”雙向耦合機制,實現聯OISA、全調度以太網GSE等核心技術突破可推動計算效率顯著提升,而算力原生、智能體開發體系等技術演進正加速AI應用普惠化發展。面向未來,隨著存算一體、量子計算等技術的不斷成熟,將開啟訓練、推理端到端計算框架,打造量子神經網絡新模型,構建量子AI信息處理),中國移動將積極布局UDCI國內外標準,拉通產業合作,推動芯片、設備、測試儀表的成熟。與此同時,中國移動還將大力推進UDCI關鍵技術的落地實現模型分發網絡(MDN)可充分發揮運營商算網資源優勢,通過云邊協同的分布式推理架構以及均衡調度、安全接入、大小模型調度、PD分離等不同協同模式,為用戶提供無處不在的低時延推理服務,支撐AI普惠時代億級海量用戶的惠智能時代的AI產業發展。[1]COCA(ComputeOnChipArchitectu[5]《面向AI的DPU技術能力要求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論