




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
報告指導:宋濤報告撰寫:劉瑤前言?伴隨著ChatGPT的爆紅,AIGC產業鏈受到廣泛關注,大模型的發展正推動AI算力市場進入新的發展階段,強大的AIGC算力基礎設施正在構建當中。大模型訓練是復雜系統工程,AIGC產業的算力也對應是系統化的建設,基于此,甲子光年智庫特此展開AIGC的算力研究,輸出《中國AIGC產業算力發展報告》,在瞬息萬變的AIGC產業發展過程中,試圖捕捉到AIGC產業算力的發展變化。本次報告探討的問題 本次報告探討的問題 (infrastructure)——算力,包括哪些關鍵決定因素??產業分析:AIGC的算力產業鏈剖析,從芯片發展到云服務方案,”?需求探討:中國AIGC產業發展是否缺乏算力,還是缺乏針對企業的?趨勢可能:AIGC的算力爆發是否可持續?未來對AIGC的算力提出哪的關鍵資源,決定了產業的發展速度及AIGC的爆發會重新改變負載AI技術的算力發展AIGC的爆發會重新改變負載AI技術的算力發展用,在多細分場景上具有潛力AI技術(算法、模型)與算力的融合催生更多產品及服務模式甲子光年重點關注企業——AIGC產業算力領域的領航者“基于大模型自身實踐“基于大模型自身實踐與服務客戶的專業經驗,浪潮信息發布大模型智算軟件棧OGAI(OpenGenAIInfra)‘元腦生智’,OGAI以大模型為核心技術的生成式AI開發與應用場景,提供從集群系統環境部署到算力調度保障和大模型開發管理的全棧全流程的軟件,從而降低大模型使用門檻、優化大模型的研發效率,保障大模型的生產與應用。”法、算法定義芯片、芯片賦能應用”是云天勵飛一直堅持的人工智能發展之路。基于此,云天勵飛構建了業界、芯片、大數據全棧式AI能力,同時擁有大量創新應用和落地場景,橫跨人工智能基礎層、技術層和應用層。”理平臺、網絡服務、應用服務、生態接口等一站式產品和解決方案。憑借技術及工程能力沉淀,UCloud優刻得可在AIGC領域構筑強大的算力底座,通過優化網絡和存儲帶寬提升大模型訓練效率,并持續提供快速、高效、可控及安全的AI推理環境。”的架構優勢,存內計算能夠為神經網絡模型指數級增長的算力需求提供強大基石。知存科技憑借率先量產商用存面覆蓋。”有電力公司、股份制銀行、大型支付機構等標桿行業客戶的重要生產系統提供服務。”“億鑄科技在全球率先利用“億鑄科技在全球率先利用ReRAM(RRAM)的特性著手使用先進異構封裝的方式來實現系統級的芯片優化方案,并且在2023年3月,億鑄科技正式公布了存算一體超異構芯片的創新理念——以存算一體(CIM)AI加速計算單元為核心,同時將不同的計算單元進行異構集成,以實PartPart01產業基石,算力是AIGC產業的催化劑AIPart03層見疊出,商業浪潮下的算力選擇思考PartPart04實踐真知,AIGC產業算力實踐的新范式二次浪潮編碼表示 (BERT)積神經網絡 (CNN)術玻爾茲曼機(DBM)Attention&TransformerchatGPT(GPT3.5)GPT3神經網絡 (RNN)記憶 (LSTM)MT-NLG知機 (MLP)源AlphaFold2強化學習 (DQN)AlphaFold性激活用力機制 (Attention)差網絡 (ResNet)代表具有里程碑的關鍵創新反向傳播(BP)向量模型二次浪潮編碼表示 (BERT)積神經網絡 (CNN)術玻爾茲曼機(DBM)Attention&TransformerchatGPT(GPT3.5)GPT3神經網絡 (RNN)記憶 (LSTM)MT-NLG知機 (MLP)源AlphaFold2強化學習 (DQN)AlphaFold性激活用力機制 (Attention)差網絡 (ResNet)代表具有里程碑的關鍵創新反向傳播(BP)向量模型?隨著2023年大模型的熱潮,AIGC早已超越內容生產的概念,而突出生成式AI(GenerativeAI)的概念,即如何通過生成式AI的技術思路解決以往決策式AI難以?新的AI時代則是AIGC產業全面進擊的時代,隨著生成式對抗網絡(GenerativeAdversarialNetwork,GAN)等的演進及迭代,生成式AI可以延展到流程、策略、形式的產業,生成式AI均可以涉及。AIGCAIGC三次浪潮一次浪潮“應用”&“技術”&“資源”實現飛輪增長一次浪潮訓練變壓器(GPT)爾茲曼機 (RBM)對抗網絡 (GAN)卡洛樹搜索 (MCTS)RNNRNN改進AlexNet&Dropout0年-至今2000年-2010年0年0年-至今2000年-2010年0年算力翻倍需要21.3個月2010前模型2010-2022深度學習不斷取得進展,算力翻倍僅需要5.7個月,所需算力量級由TFLOPs增至EFLOPs訓練算力(FLOPS)需求與人工智能發展關系圖(1952-2022年)訓練算力求FLOPSN=121訓練算力需求FLOPS2016-2022縱觀AI發展,算法的發展及迭代極大地拉動了算力的需求算力翻倍需要21.3個月2010前模型2010-2022深度學習不斷取得進展,算力翻倍僅需要5.7個月,所需算力量級由TFLOPs增至EFLOPs訓練算力(FLOPS)需求與人工智能發展關系圖(1952-2022年)訓練算力求FLOPSN=121訓練算力需求FLOPS2016-2022級。?從2022年底,隨著ChatGPT成功帶來大規模參數通用大模型相繼發布。這些大模型的訓練需要千億、甚至萬億級參數,以及上千GB的高質量數據,大模型的訓練訓練算力(FLOPS)需求與深度學習發展關系圖(2000-2022年)2015年開始逐漸出現大規模(更大參數量)模型,算力級。智能方式相比,具有更多的不確定性,需要進行多次復訓練,模型訓練中,模型即是訓練結果,中間的過參數規模實際上可以看作“必要不充分條件”:難以明確的直接因果關系數據質量 分布式計算效率“量變”收集數據及數據準備選擇訓練工程調優模型部署和應用包括數據收集、預處理、存儲;數據的質量和梳理對算法效果至關重要從原始數據提取有代表性、可解釋的特征無監督學習監督學習強化學習……部署成部署器化部署理部署模型封裝后,導入環境進行推理網絡搜索、隨機搜索、貝葉斯優化智能方式相比,具有更多的不確定性,需要進行多次復訓練,模型訓練中,模型即是訓練結果,中間的過參數規模實際上可以看作“必要不充分條件”:難以明確的直接因果關系數據質量 分布式計算效率“量變”收集數據及數據準備選擇訓練工程調優模型部署和應用包括數據收集、預處理、存儲;數據的質量和梳理對算法效果至關重要從原始數據提取有代表性、可解釋的特征無監督學習監督學習強化學習……部署成部署器化部署理部署模型封裝后,導入環境進行推理網絡搜索、隨機搜索、貝葉斯優化、梯度優化、集成方法等選取最優參數組合,提高模型性能自開發實現模型使用現成的框架模型訓練涉及的基礎資源提升在方向上(理論上)能夠決定模型訓練的效率和結果充足的能耗數學理論程呈現“黑盒”性質“質變”調參“質變”型評估根據分類、回歸、聚類等各種問題有相應評估指標算力:提供底算力:提供底層動力源泉算法跨模態融合數據數據巨量化算力內容創造力數字孿生虛擬現實全息立體應用場景算法層面核心技術突破多模態認知計算感知+交互高精度訓練集大數據語料庫訓練喂標注計算任務數據層面算力層面硬件算力本地化實時算力云計算智能交互計算算法跨模態融合數據數據巨量化算力內容創造力數字孿生虛擬現實全息立體應用場景算法層面核心技術突破多模態認知計算感知+交互高精度訓練集大數據語料庫訓練喂標注計算任務數據層面算力層面硬件算力本地化實時算力云計算智能交互計算算力、算法、數據和系統架構等多個方面的綜合優化對于大規模模型訓練的成功至關重要。和模型推理等環節是核心關鍵因素和主要計算特征。AIGCAIGC當下的時代機遇:大規模模型的摩爾定律當下的時代機遇:大規模模型的摩爾定律-單模型參數量每年增長10倍參數算力 大數據量微調階段數量訓練階段算力力核心因素力核因素數據量響推理端算力AIGC的突破依賴于算力的“暴力美學”,應用依賴于算力在場景中的釋放微調階段數量訓練階段算力力核心因素力核因素數據量響推理端算力?AI技術在實際應用中包括兩個環節:訓練(Training)和推理(Inference),AIGC的算力需要考慮訓練及推理兩個方面。AI為AI技術的研發。因此參數量的升級對算力的需求影響大。結論的過程,一般為AI技術的應用。推理部署的算力主要在于每個應用場景日數據的吞吐量。模型參數數值基本確定,隨著應用場景、適用人群數量增加,導致推理數據量及模型數量增多,進而使推理算力需求井噴發展數量用場景數據量參數量活用時間訓練次數訓練階段算力及對應的微調階段算力提升閉源模型應用邊緣或端側應用網絡平臺應用基于公共網絡平臺的應用,單一平臺應用提供基于本地邊緣或端側交互的應用Prompt優化與模型微調數據中心與模型API數據中心工具與模型部署和調用API基于預訓練模型的場景/產品適配從模型到應用閉源非開源預訓練模型商業化的預訓練模型,通過API調用模型Hub開源模型代碼及權重開源的預訓練模型,一般可免費試用開源模型共享平臺深度學習框架與中間件等用于訓練或云部署的深度學習框架和中間件等,包括PyTorch、TensorFlow一體機數據中心基礎設備基礎硬件芯片、存儲、網卡、PCB、BMC、電源等通用算力中心、智算中心、超算中型通用算力中心、智算中心、超算中心服務器、路由器、交換機、光模塊等IT設備及機架其他非IT設備數據資源(數據采集、清洗、標注等)AIGC算力具備軟硬件的復雜性,并且以不同產品/服務/方案為應用賦能閉源模型應用邊緣或端側應用網絡平臺應用基于公共網絡平臺的應用,單一平臺應用提供基于本地邊緣或端側交互的應用Prompt優化與模型微調數據中心與模型API數據中心工具與模型部署和調用API基于預訓練模型的場景/產品適配從模型到應用閉源非開源預訓練模型商業化的預訓練模型,通過API調用模型Hub開源模型代碼及權重開源的預訓練模型,一般可免費試用開源模型共享平臺深度學習框架與中間件等用于訓練或云部署的深度學習框架和中間件等,包括PyTorch、TensorFlow一體機數據中心基礎設備基礎硬件芯片、存儲、網卡、PCB、BMC、電源等通用算力中心、智算中心、超算中型通用算力中心、智算中心、超算中心服務器、路由器、交換機、光模塊等IT設備及機架其他非IT設備數據資源(數據采集、清洗、標注等)基于AIGC的技術棧,算力層作為上層模型集應用的重要支撐應用層應用層 (接口層)模型層模型層框架層框架層算力層算力層數數據層整體算力的因素?資源納管?算力調度?網絡性能?云邊協同?智能運維及監控……智算中心(數據中心)算?門戶管理?配額管理?運營管理?安全保障……器?網路通信?資源調度?作業管理?系統部署?環境配置?性能優化……算力資源利用率取決與多層工程的利用率?? 單元數量芯片架構卡間通信并行管理生態工具芯片穩定性……整體算力的因素?資源納管?算力調度?網絡性能?云邊協同?智能運維及監控……智算中心(數據中心)算?門戶管理?配額管理?運營管理?安全保障……器?網路通信?資源調度?作業管理?系統部署?環境配置?性能優化……算力資源利用率取決與多層工程的利用率?? 單元數量芯片架構卡間通信并行管理生態工具芯片穩定性……未來大模型的產業化發展是一套復雜的系統工程,構建高效穩定的算力平臺是核心要義,成熟的算法、數據產業鏈,配套工具鏈及豐富的生態鏈是關鍵因素,亟需KnowHowAI和穩定性,并非單一因素的參數能簡單決定。AIGC產業算力的資源組成部分代表不同硬件層級之間需要完成的網絡通信及資源管理(包括硬件及資源化層面)PFLOPsPFLOPs1e+091e+081e+071e+061e+051e+041e+031e+02Transformer訓練算力與iPhone現革命,快速1e+091e+08基于Transformer結構算法,遠超摩爾定律1e+071e+06PFLOPsPFLOPs1e+091e+081e+071e+061e+051e+041e+031e+02Transformer訓練算力與iPhone現革命,快速1e+091e+08基于Transformer結構算法,遠超摩爾定律1e+071e+06.51e+05%1e+041e+031e+020?Transformer的應用標志著基礎模型時代的開始(基礎模型的龐大規模和應用范圍突飛猛進),模型參數量指數級增長,帶動算力超過摩爾定律,可以稱e?技術層面上,基礎模型通過遷移學習(TransferLearning)和規模(scale)得以實現;深度學習中,預訓練又是遷移學習的主要方法:在替代任務上訓練模型(通常只是達到目的的一種手段),然后通過微調來適應感興趣的下游任務。遷移學習(TransferLearning)使基礎模型成為可能。Transformer結構對于基礎模型訓練算力需求的推動作用2007-2021年蘋果iPhone出貨量(百萬臺)及市占率200720082009201020112012201320142015201620172018201920202021基于Transformer結構算法與時間的關系摩爾定律與時間的關系29.0%27.9%26.6%26.3%中央重視通用人工智能發展2023年4月25.0%發改委:加快發展數字經濟,重視通用人工智能發展產業數字化,人工智能發展,支持平臺企業在引領發展、創造就業、國際競2023年5月16.9%2023年5月北京市:《北京市促進通用人工智能創新發展的若干措施》創新算法及關鍵技術研究,強大模型訓練數據采集及治理工具研發,建設大模型評測開放服務平臺,構建大模論體系。5.7%3.0%2.9%5.0%-3.3%3.0%10.6%數字經濟時代,人工智能相關產業必然迎來廣闊發展,AI算力正當時29.0%27.9%26.6%26.3%中央重視通用人工智能發展2023年4月25.0%發改委:加快發展數字經濟,重視通用人工智能發展產業數字化,人工智能發展,支持平臺企業在引領發展、創造就業、國際競2023年5月16.9%2023年5月北京市:《北京市促進通用人工智能創新發展的若干措施》創新算法及關鍵技術研究,強大模型訓練數據采集及治理工具研發,建設大模型評測開放服務平臺,構建大模論體系。5.7%3.0%2.9%5.0%-3.3%3.0%10.6%在內的人工智能(AI)市場的技術投資從2019年的612億美元增長至2021年的924億美元,預計將在2022年(同比)增長26.6%至1170億美元,有望到2025年突徑,推動創新場景應用成為思想共識、政策共識、發展共識。從中央到地方,出臺相應政策推動通用人工智能發展全球人工智能支出、數字化轉型支出及GDP增長趨勢預測,2020-2024從中央到地方,出臺相應政策推動通用人工智能發展116.9%17.6%17.0%16.2%15.0%同時北京正在加快推進國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區建設,打造具有全球影響力的人工智能創新策源地-5.0%20202021202220232024人工智能支出增幅數字化轉型支出增幅-5.0%20202021202220232024人工智能支出增幅數字化轉型支出增幅GDP增幅百億億次浮點運算/秒(EFLOPS)1400.01271.41200.01000.0922.8800.0640.7600.0427.0400.0268.0155.2200.075.031.70.020192021202020222023E2024E2025E2026E模型的訓練及推理離不開智能算力,AI應用催生智能算力需求百億億次浮點運算/秒(EFLOPS)1400.01271.41200.01000.0922.8800.0640.7600.0427.0400.0268.0155.2200.075.031.70.020192021202020222023E2024E2025E2026EAIAI長。AI域。中國智能算力規模及預測,2019-2026國內重要的算力政策文件內容,2021-2023中國智能算力規模及預測,2019-2026發文部門文件名稱主要內容全國人大常委第三十七次會議字經濟發展情況的告應統籌通信和算力基礎設施建設,適度超前部署5G基站.推進“東數西算”工程。加空天地海一體化網絡。2023.2中共中央國務院中國建設整體布局規劃中心、智能計算中心、邊緣數據中心等合理梯次布局。2022.8科技部等六部門快場景創新以人工高水平應用促進經濟發展的指導意見施資源開放共享,為人工智能企業開展場景創新提供算力、算法資源。鼓勵地方通提升人工智能場景創新的算力支撐。2022.8科技部財政部業技術創新能力提升行動方案(2022-2023年)推動國家超算中心、智能計算中心等面向企業提供低成本算力服務。發“十四五”數字展規劃的通知推進云網協同和算網融合發展。加快構建算力、算法、數據、應用資源協同的全國一體化大數據中心體系。推動智能計算中心有序發展,打造智能算力、通用算法和語言智能等重點新興領域,提供體系化的人工智能服務。2022.1國家知識產權局發知識產權公共服“十四五”規劃的通知加強國家知識產權大數據中心建設。依托全國一體化大數據中心體系,建設國家知2021.8工業和信息化部數據中心發展三年行動計劃(2021-2023年)需求牽引,深化協同。堅持市場需求導向,建用并舉。推動新型數據中心與網絡協加強國際國內數據中心協同發展。5國家發改委《全國一體化大數據中心創新體系算力樞紐實施方案》方案明確國家算力樞紐建設方案,加快建設全國一體化算力樞紐體系,提出布局全國算力網絡國家樞紐節點,啟動實施“東數西算”工程構建國家算力網絡體系。進動微提中貪理局,供給平衡,綠色集約及互聯互場多地重視人工智能及算力產業發展,相繼出臺相關政策算力的相關政策匯總市稱容上海2023.5《上海市加大力度支持民間投資發展若干政策措施》充分發揮人工智能創新發展專項等引導作用,支持民營企業廣泛參與數據、算力等人工智能基礎設施建設北京2023.5《北京市促進通用人工智能創新發展的若干措施》將新增算力建設項目納入算力伙伴計劃,加快推動海淀區、朝陽區建設北京人工智能公共算力中心、北京數字經濟算力中心,形成規模化先進算力供給能力,支撐千億級參數量的大型語言模型、大型視覺模型、多模態大模型、科學計算大模型、大規模精細神經網絡模擬仿真模型、腦啟發神經網絡等研發。北京2023.2《關于北京市推動先進制造業和現代服務業深度融合發展的實施意見》支持園區加快計算中心、算力中心工業互聯網、物聯網等基礎設施建設,建設園區大腦、數字孿生園區。成都2023.1《成都市圍繞超穿智算加快算力產業發展的政策措施》建立以“算力券”為核心的算力中心運營統籌結算分擔機制,結合區塊鏈等新技術實現“算力券”有效監管。每年發放總額不超過1000萬元的“算力券”,用于支持算力中介服務機構、科技型中小微企業和創客、科研機構、高校等使用國家超算成都中心、成都智算中心算力資源。黑龍江2022.10《黑龍江省現代信息服務業振興行動方案(2022-2026年)的通知》完善新型基礎設施布局,增強數字化轉型支撐低能能力。不斷增強骨干網承載能力,構建算力產業體系,建設區塊鏈等新技術基礎設施,助力構筑哈大齊協同一體科創走廊和工業走廊,促進網絡基礎設施廣泛融入生產生活,有力支撐政務服務、公共服務、民生保障和社會治理。河南2022.9《河南省元宇宙產業發展行動計劃(2022-2025年)的通知》構建多層次算力設施體系。統籌布局算力基礎設施構建“超算+智算+邊緣計算+存儲“多元協同、數智勝合多層次算力體上海2022.7《上海市數字經濟發展“十四五”規劃》推動建設綠色數據中心,強化算力統籌和智能調度,提升數據中心跨網絡、跨地域數據交互能力,推動數據中心供電、冷卻、網絡、服務器等智能協同,實現數據中心自動化能效調優,提升數據中心能效密度河北2021.11《河北省建設全國級產業轉型升級試驗區“十四五“規劃建設全國一體化算力網絡京津冀國家樞紐節點,加快向建工業互聯網網絡體系,改造升級省級北斗導航系統,規劃建設低軌衛星的通知》互聯網地面信關站。天津2021.3《天津市新型基礎設施建設三年行動方案(2021-2023年)的通知》打造超算資源算力供給體系。依托國家超級計算天津中心,推動超算與人工智能深度融合。加快與量子計算、區塊鏈技術融合發展,提供多層次智能算力服務打造各類創新平臺協同創新算力載體。北京2021.2《數字經濟領域“兩區"建設工作方案》以支持數字經濟發展的新基建為契機,推動形成5G網絡、衛星網絡、新型算力、新型數據中心、車聯網等集聚、協同聯動的數字經濟基礎建設體系109.8882.0354.6629.468.19020222023E2024E2025E2026EAI產業趨勢疊加時代趨勢,專用智能走向通用智能109.8882.0354.6629.468.19020222023E2024E2025E2026EAIAI算占比從2022年4.2%增長到31.7%。時代趨勢:隨著LLM大規模語言模型技術的不斷突破,以ChatGPT為代表的生成式人工智能引發廣泛關注,人工智能正在從專用智能邁向以大模型為基通用人工智能,關注通用大模型的邏輯推理能力提升全球生成式AI計算的規模及預測(億美元),2022-2026通用人工智能,關注通用大模型的邏輯推理能力提升00邏輯能力迭邏輯能力迭代升級千億級別具備涌現能力和泛化能力的通用大模型,涌現能力是指隱含知識和推理歸納,帶來創新靈感的出現;泛化能力是為多任務泛化提供統一強大的算法支撐。基于泛化能力及涌現能力的人工智能已經能夠擁有人的邏輯理解能力、使用工具能力、像人一樣可以跨領域工作,是通用人工智能的跨時代能力價值。通用智能迎通用智能迎來曙光大模型的邏輯推理能力得益于其強大的表示能力和學習能力。大模型可以學習到更多的特征和規律,從而更好地表示輸入數據。同時,大模型可以通過更多的數據和更復雜的訓練方式進行訓練,從而提高其學習能力和泛化能力。這些優勢使得大模型在邏輯推理能力方面具有極大的AI計算Part01產業基石,算力是AIGC產業的催化劑AIPart03層見疊出,商業浪潮下的算力選擇思考Part04實踐真知,AIGC產業算力實踐的新范式MaaS模式對于算力的直接拉動:最終提供給用戶的服務為建立在算力基礎上的模型服務無大模型云服務模式層邊緣或端側應用提供基于本地邊緣或端側交互的應用基于公共網絡平臺的應用,單一平臺應用從模型到應用閉源MaaS可以基于模型能力直接提供應用:?企業級解決方案,直接提供企業定制化產?嵌入產品,如AzureOpenAI實現大模型數據中心工具與模型部署和調用API數據中心與模型API (接口層)基于預訓練模型的場景/產品適配模型Hub型層模型代碼及權重開源的預訓練模型,一般可免費試用商業化的預訓練模型,通過API用源預訓練模型MaaS是以大模型為核心的AI服務:?數據處理?特征工程?模型訓練?模型調優?推理部署?模型托管?模型存儲MaaS模式對于算力的直接拉動:最終提供給用戶的服務為建立在算力基礎上的模型服務無大模型云服務模式層邊緣或端側應用提供基于本地邊緣或端側交互的應用基于公共網絡平臺的應用,單一平臺應用從模型到應用閉源MaaS可以基于模型能力直接提供應用:?企業級解決方案,直接提供企業定制化產?嵌入產品,如AzureOpenAI實現大模型數據中心工具與模型部署和調用API數據中心與模型API (接口層)基于預訓練模型的場景/產品適配模型Hub型層模型代碼及權重開源的預訓練模型,一般可免費試用商業化的預訓練模型,通過API用源預訓練模型MaaS是以大模型為核心的AI服務:?數據處理?特征工程?模型訓練?模型調優?推理部署?模型托管?模型存儲……學習框架與中間件等PaaS (aPaaS、IPaaS、FPaaS)(也可提供AI技術能力)架層云服務算力層MaaS的底層資源是算力及數據,算力及數據通過MaaS模式直接輸出了AI應用能力,而非簡單的計算能力,具有更多的商業價值硬件據層基礎設施服務商代表MaaS可以提供的服務?MaaS(Modelasaservice)模型即服務,是指將大模型作為一項服務提供給用戶使用的新業態,MaaS中模型訓練(主要指微調)及推理的技術路線成MaaSAI。 用戶MaaS模式基于傳統云服務的升級:基于傳統模式的IaaS 用戶用戶用戶閉源閉源模型應用SSaaSPromptPrompt優化與模型微調開源模型共享臺用于訓練或云部署的深度學習框架和中間件等,包括PyTorch、TensorFlowPaaSIaaIaaSIaaS設施服務數據資源(數據采集、清洗、標注等)中國云計算市場規模及預測(億元),2020-20251多行業及多業務多模態技術 育理生成虛擬生成以MaaS服務為核心策略生成生成生成0%代碼生成律結構生成2 0使用場景模型類型付費模式4000模型模型資源(時間)付費代模型優產品付費用模型應用30202020212022中國云計算市場規模及預測(億元),2020-20251多行業及多業務多模態技術 育理生成虛擬生成以MaaS服務為核心策略生成生成生成0%代碼生成律結構生成2 0使用場景模型類型付費模式4000模型模型資源(時間)付費代模型優產品付費用模型應用302020202120222023E2024E2025E市場規模(億元)MaaS云服務,可結合數據資源實現模型迭代MaaS商業范式MaaS分析下游場景急需下游場景急需AI模型能力進行商業突破,云服務價值提升媒視戲融調品付費的業務積累、數據回流等,可形成模型迭代,145.2%150.0%300097.6%2000100.0%80.5%90.3%74.5%51.0%27.6%42.6%100033.0%50.0%00.0%201920202021202220202021PaaS市場增速2022SaaS市場增速IaaS市場增速IaaS市場規模SaaS市場規模MaaS服務未來將帶動云服務市場的第二增長曲線145.2%150.0%300097.6%2000100.0%80.5%90.3%74.5%51.0%27.6%42.6%100033.0%50.0%00.0%201920202021202220202021PaaS市場增速2022SaaS市場增速IaaS市場增速IaaS市場規模SaaS市場規模務等云原生應用帶來的刺激增長,總收入已達到342億元,并且增長率達到74%。PaaS在技術架構上,易結合AI技術應用,并且可以與MaaS服務作為增值服務提供,目前多家云服務廠商已經推出自研大模型、接入開源大模型,基于模型提供新的云服務增長點。根據微軟財報數據,微軟23Q3(相當于2023年第一季度)AzureOpenAI服務客戶數目達到2500+個,微軟23Q4(相AzureOpenAI繼續增長至11000+個,環比增加340%,且本季度每天新增近100名新客戶。中國云計算細分市場規模(億元),2019-2020中國云計算細分市場增速,2019-2020400024000472472342342370370196196227822442 453183895183895161615PaaS市場規模端邊云時效在實體場景(例如物聯網,工廠互聯下),可以節省數據向中傳輸時間,從而提高數據的實時處理能力EdgeComputingSaaS服務協同長距離數據傳輸,邊緣計算解決大量數據回傳云絡帶寬壓力、性能瓶頸以及網絡吞吐量 維護能效優化 質量提升SaaS傳輸用協同能力用實例用部署軟硬件環境中式訓練布式智能/推理據分析安全據采集與分析EdgeComputingIaaS基礎設施資源及調度管理ICT基礎設置、云端的數據壓力,邊緣計算僅對需要的、必要的數據算,解決云端承受海量數據壓力,實現終端的算力資源協同靈活云邊協同,從計算、通信、安全、時效等方面提升AI應用落地可能性端邊云時效在實體場景(例如物聯網,工廠互聯下),可以節省數據向中傳輸時間,從而提高數據的實時處理能力EdgeComputingSaaS服務協同長距離數據傳輸,邊緣計算解決大量數據回傳云絡帶寬壓力、性能瓶頸以及網絡吞吐量 維護能效優化 質量提升SaaS傳輸用協同能力用實例用部署軟硬件環境中式訓練布式智能/推理據分析安全據采集與分析EdgeComputingIaaS基礎設施資源及調度管理ICT基礎設置、云端的數據壓力,邊緣計算僅對需要的、必要的數據算,解決云端承受海量數據壓力,實現終端的算力資源協同靈活邊緣計算可負責范圍內的數據計算和存儲工作。同時,負責將連續數據匯總至計算層,最終由云計算層完成分析挖掘、數據共享工作,下發結果或模型至實現云、端間的數據及計算結果的協同。邊緣云及邊緣芯片的發展將推動AIGC的更快落地。邊緣計算的核心在于避免數據多次傳輸,從而打破完全中心的計算困境邊緣計算的核心在于避免數據多次傳輸,從而打破完全中心的計算困境協同業務管理協同應用管理協同能協同數據協同協同業務管理協同應用管理協同能協同數據協同PaaS編排PaaS用生命周期管理緣計算,實現在斷網、斷點情況保持穩定性、安全性IIaaS節點基礎設施/設備/的生命周期管理ICT設施20212016算力占比能算力占比基礎算力占比智能算力占比超算算力占比超算算力占比智能算力持續增長,未來需求增加,進一步加快智算中心建設及相關設備增長20212016算力占比能算力占比基礎算力占比智能算力占比超算算力占比超算算力占比標算力中心心中心來源一般為基于CPU芯片的服務器一般為基于AI芯片的加速計算平臺超級計算機等高性能計算集群建設目的幫助用戶降本增效或提升盈利水平促進AI產業化、產業AI化、政府治理智能化面向科研人員和科學計算場景提供支撐服務技術標準標準不一、重復建設CSP內部互聯、跨CSP隔離安全水平不一致統一標準、統籌規劃、開放建設、互聯互通互操作、高安全標準采用并行架構,標準不一,存在多個技術路線,互聯互通難度較大具體功能能以更低成本承載企業、政府等用戶個性化、規模化業務應用需求算力生產供應平臺、數據開放共享平臺、智能生態建設平臺、產業創新聚集平臺以提升國家及地方自主科研創新能力為目的,重點支持各種大規模科學計算和工程計算任務應用領域面向眾多應用場景應用領域和應用層級不斷擴張,支撐構造不同類型的應用面向AI典型應用場景,如知識圖譜、自然語言處理、智能制造、自動駕駛、智慧農業、防洪減災等基礎學科研究、工業制造、生命醫療,模擬仿真、氣象環境、天文地理等序號智算中心名稱運營狀態算力浙江省青田縣元宇宙智算中心2022年11月17日投產100P孚臨港云計算數據中心-中國電信京津冀大數據智算中心2021年底投入運營1-10P24北京數字經濟算力中心(規劃)2022年4月落戶規劃超過1000P中心-26上海市人工智能公共服務算力平臺序號智算中心名稱運營狀態算力浙江省青田縣元宇宙智算中心2022年11月17日投產100P孚臨港云計算數據中心-中國電信京津冀大數據智算中心2021年底投入運營1-10P24北京數字經濟算力中心(規劃)2022年4月落戶規劃超過1000P中心-26上海市人工智能公共服務算力平臺2023年2月20日揭牌-28百度陽泉智算中心2022年12月27日開機上線計劃100P心0P30長沙人工智能計算中心2022年11月4日200P;2025年1000P工智能計算中心32橫琴人工智能超算中心2019年12月成立1.16E(2019年);4E(完全建成)人工智能計算中心建都人工智能計算中心人工智能計算中心0P人工智能計算中心建0P陽智算中心年8月建成使用-人工智能計算中心建0P進計算中心-40沈陽人工智能計算中心2022年8月9日上線100P;后期300P、揭牌、上線,支撐AIGC產業的研發及多行業應用。序號智算中心名稱運營狀態力1北京昇騰人工智能計算中心2023年2月13日上線一期100P;短期500P;遠期1000P2天津人工智能計算中心2022年12月30日一期完工300P3河北人工智能計算中心2022年2月14日揭牌計劃100P4人工智能計算中心-5智能計算中心6南京鯤鵬·昇騰人工智能計算中心2021年7月6日上線800P南京智能計算中心2021年7月16日投入運營800P8量子智算中心-9騰訊長三角人工智能超算中心在建預計1400P2022年1月24日投產3600年的視頻人工智能計算中心P淮海智算中心建3中國-東盟人工智能計算中心2022年9月23日揭牌一期40P訓練/1.4P推理14福建人工智能計算中心2023年4月26日揭牌一期規劃105P:總體400P15深圳人工智能融合賦能中心2019年打造人工智能融合賦能平臺-廣州人工智能公共算力中心2022年9月15日上線運營一期100P,五年內1000P17浙江“烏鎮之光”超算中心2021年9月25日正式啟用181.9P2023年1月10日上線100P(FP16)/5P(FP64)P(FP16)/15P(FP64)19昆山智算中心2021年12月1日寒武紀中標峰值500P(FP16)20阿里云張北超級智算中心2022年8月30日上線12000P14080%70%60%50%40%30%20%10%0%347.1 39.10%40%35%3501202830030%10081%25025%8020020%156.36015015%10%112.379913.50%4010076.862005%0作為核心的智算硬件,AI服務器全球及中國的市場規模持續提升14080%70%60%50%40%30%20%10%0%347.1 39.10%40%35%3501202830030%10081%25025%8020020%156.36015015%10%112.379913.50%4010076.862005%0AI式,提供AI技術所需的算力。可以針對不同的需求進行硬件的選型及組合。IGCAI全球AI服務器市場規模,2018-2026中國AI全球AI服務器市場規模,2018-202640045400123.45790%51.06%14.7600%02018201920202018201920202026E2021201820202021201820202019增長率中國AI服務器市場規模(億美元)增長率全增長率中國AI服務器市場規模(億美元)增長率廣義的AI芯片,可指運算AI算法的芯片,可包括深度學習,也可以包括其他機器算法,AIGCAI、AI芯片的架構升級、算法與芯片在設計層面的融合,通過算法調整解決解決芯片硬件瓶頸等1194120010002022-2027CAGR:22%800671AI訓練對內存需求較高600534數據存儲單元:進行數據實442400數據的存儲及調用020222023E2024E2027EAIGC的產業發展極大地推動了AI芯片市場的未來增長速度及產品豐富性廣義的AI芯片,可指運算AI算法的芯片,可包括深度學習,也可以包括其他機器算法,AIGCAI、AI芯片的架構升級、算法與芯片在設計層面的融合,通過算法調整解決解決芯片硬件瓶頸等1194120010002022-2027CAGR:22%800671AI訓練對內存需求較高600534數據存儲單元:進行數據實442400數據的存儲及調用020222023E2024E2027E全球AI芯片市場規模及預測(億美元),2022-2027,Gartner1400規模增規模增長2倍調用AI芯片AI芯片與其他關鍵組件的關系調用AI芯片數據存儲單元傳統芯片200法,?CPU(Centerprocessingunit,中央處理器)?DSP(DigitalSignalProcessing,數字信號處理)?ISP(ImageSignalProcessingUnit,圖像信號處理)短期內,大模型訓練端需要GPU多卡集群完成,時間壓力下用戶傾向選擇成熟方案英偉達通過對硬件單元的改進與顯存升級增強了單張GPU算力的釋放,及形成護城河的網絡通信、AI生態工具,并且全球內具有成功案例,短期內是大模型訓練最適用的AI芯片。隨著Transformer模型的大規模發展和應用,模型參數量呈爆炸式增長,單卡無法完成相應訓練,大模型參數量的指數級增長帶來的諸多問題使GPU集群化運算成為必須。英偉達的CUDA生態在AIGC領域已經逐步養成客戶習慣,短期內具有競爭力DEPLOYMENTCLOUDMLSERVICESFRAMEWORKAGRAPHLDLTRAINCUDA-XAICUDACloudWorkstationServerCUDA-X短期內,大模型訓練端需要GPU多卡集群完成,時間壓力下用戶傾向選擇成熟方案英偉達通過對硬件單元的改進與顯存升級增強了單張GPU算力的釋放,及形成護城河的網絡通信、AI生態工具,并且全球內具有成功案例,短期內是大模型訓練最適用的AI芯片。隨著Transformer模型的大規模發展和應用,模型參數量呈爆炸式增長,單卡無法完成相應訓練,大模型參數量的指數級增長帶來的諸多問題使GPU集群化運算成為必須。英偉達的CUDA生態在AIGC領域已經逐步養成客戶習慣,短期內具有競爭力DEPLOYMENTCLOUDMLSERVICESFRAMEWORKAGRAPHLDLTRAINCUDA-XAICUDACloudWorkstationServerCUDA-XAI是軟件加速庫的集合,建立在CUDA之上,提供對于深度學習、機器學習和高性能計NVIDIATensorCoreGPU配合工作,能夠將機器學習和數據科學工作負載加速至高達50倍。CUDA-XAI的軟件加速庫集成到所有深度學習框架和常用的數據科學軟件中,且可以部署到多種設備內的NVIDIAGPU上???對大量數據進行數據訓練(training)與推斷(inference)設計的芯片。分類GPU典型特征圖形處理器(Graphicsprocessingunit),在計算方面具有高效的并行性。用于圖像處理的GPU芯片因海量數據并行運算能力,被最先引入深度學習。FPGA現場可編程門陣列(Fieldprogrammablegatearray),是一種集成大量基本門電路及存儲器的芯片,最大特點為可編程。具有能耗優勢明顯、低延時和高吞吐的特性。ASIC專用集成電路(Applicationspecificintegratedcircuit,特定應用集成電路),是專用定制芯片,為實現特定要求而定制的芯片。除不能擴展應用以外,在功耗、可靠性、體積方面都有優勢。類腦芯片“類腦芯片”是指參考人腦神經元結構和人腦感知認知方式來設計的芯片。目前仍然量子計算(量子芯片)基于量子力學的新型半導體芯片,它利用量子力學的特性來實現信息的存儲、處理和傳輸,實現多量子比特的耦合,實現更高的計算能力和更復雜的邏輯運算。具有高遷移率,即量子芯片可以同時處理多個任務;同時具備強穩定性。制造和維護成本高,研發和生產成本也非常高。目前仍然處于探索階段。光子芯片利用量子力學原理來制造的特殊芯片,它可以實現對光子信息的操作和處理,光子芯片具有高計算速度、低功耗、低時延等特點,且不易受到溫度、電磁場和噪聲變化的影響,光子器件很難做成芯片,后面需要很長的基礎物理學研究,解決大量工程學問5GB6GBAIGC時代,內存對算力的整體利用率影響提升,需要新的內存解決思路5GB6GBTransformer模型中的參數數量呈現出2年240倍的超指數增長,而單個GPU內存僅以每2年2倍的速度擴大。而訓練AI模型的內存需求,通常是參數數量?同時通信成為算力的瓶頸。無論是芯片內部、芯片間,還是AI加速器之間的通信,都已成為AI訓練的瓶頸。過去20年間,運算設備的算力提高了9萬倍,雖然存儲器從DDR發展到GDDR6x,接口標準從PCIe1.0a升級到NVLink3.0,但是通訊帶寬的增長只有30倍。長期看,無法實現堆積顯存解決問題。AI0CYCY-21存儲存儲非易失性多比特存儲能力否否否是是是是是是 存算一體存儲墻和功耗墻的解決思路功耗效率低好較低低存算一體隨存儲器介質的多樣性逐步走向應用成熟,解決AGI時代的存儲墻問題非易失性多比特存儲能力否否否是是是是是是 存算一體存儲墻和功耗墻的解決思路功耗效率低好較低低CPUGPUDPU諾依曼架構的局限性,數據的處理遇到了存儲墻和功耗墻兩大問題。存儲器的訪問速度遠遠小于處理器的運算速度,系統整體會受到傳輸帶寬的限制,導致處理器的實際算力遠低于理論算力,難以滿足大數據應用的快、準響應基于不同存儲器介質的存算一體芯片之間的性能存存內計算標準SRAMDRAMFlashReRAMPCMFeFETMRAM?模擬式存內計算是指存儲單元內部或陣列周邊的信號以模擬信號的方式進行操作。?數字式存內計算是指在實際運算過程元內部或陣列周邊的信號否是是否是否是是否面積效率低面積效率低一般高高高高高仍是存算分離,存儲器不進行計算高高高高高低高高高高高縮短存儲器和處理器之間傳輸通過高速接口、光互聯、3維堆疊、增加片上緩存等方法來提高數據帶寬,并把存儲器和處理器之間的數據傳輸距離縮短,以減小功耗。其中,產業界應用較多的是3維堆疊技術與增加片上縮短存儲器和處理器之間傳輸通過高速接口、光互聯、3維堆疊、增加片上緩存等方法來提高數據帶寬,并把存儲器和處理器之間的數據傳輸距離縮短,以減小功耗。其中,產業界應用較多的是3維堆疊技術與增加片上緩存等方法。好較差好較好好高較高低低低成本高較高低低低完畢后再寫回存儲器,耗墻問題。由于帶寬導致的實際算力往往低于處理器的理論算力。解決處理器與內存間數據傳輸即可直接提升實際算力主處理器-存內計算具備接口存內計算不僅可打破數據搬運產生的“存儲墻”,并且適用于AI算法處理器片上緩存控制單元運算單元指令列存內計算數字接口外圍電路計算任務基于主處理器-存內計算芯片的異構計算架構示意圖存內計算技術革命性解決存儲墻問題,高效適配Transformer結構算法完畢后再寫回存儲器,耗墻問題。由于帶寬導致的實際算力往往低于處理器的理論算力。解決處理器與內存間數據傳輸即可直接提升實際算力主處理器-存內計算具備接口存內計算不僅可打破數據搬運產生的“存儲墻”,并且適用于AI算法處理器片上緩存控制單元運算單元指令列存內計算數字接口外圍電路計算任務基于主處理器-存內計算芯片的異構計算架構示意圖“”未來3-5年內可能提升速度更快,每年可能都超過8倍的算力提升。“”——知存科技創始人兼CEO王紹迪典典型的馮·諾依曼架構示意圖儲器 數字接口外圍電路存儲陣列大量待處理數據,儲器 數字接口外圍電路存儲陣列大量待處理數據,而總帶寬限制交換數據速度片上緩存處處理器控制單元運算單元此外,存內計算及存內邏輯非常適合人工智能/深度學習的算法計算,人工智能/深度學習的算法中有大量的矩陣乘法計算,其本質是乘累加(Multiply-Accumulate,MAC)運算,存算架構可以將計算直接映射到存儲結構中,具有高能效比和低延遲AI依賴的Transformer結構同樣可以適合存內計算完成。持80MB神經網絡權重,單個芯片算力達到25TOPS。Part01產業基石,算力是AIGC產業的催化劑AIPartPart03層見疊出,商業浪潮下的算力選擇思考Part04實踐真知,AIGC產業算力實踐的新范式資源分配:通過選擇合適的技術路徑實現算力的成本優化其他成本制約因素運行模型和數據處理,并且需要考慮產品的使用體驗模型規模 (參數稀疏程度)?基于用戶的細分行業屬性,熟悉細分行業的需求價值?基于用戶的業務流程細節,對用戶的需求矛盾分析?基于用戶的資源能力,明確用戶的負擔上限?……實踐化的落地)算法結構訓練數據量模型種類 (算力需求系數相關數據吞吐量參數量規模How(項目執行)?在不同階段和層面對項目的工作內容從主項、分項、子項甚至單體的各個部分進行拆分(例如采用WBS),實現項目關鍵節點的管理,?完成項目人員的協同、管理、分工及時間資源調配?對風險的預知、判斷及合理控制?……訓練人員成本團隊)安全性與穩定性AIGC產業算力理念:需要基于目標與資源的分配去達成工程學平衡資源分配:通過選擇合適的技術路徑實現算力的成本優化其他成本制約因素運行模型和數據處理,并且需要考慮產品的使用體驗模型規模 (參數稀疏程度)?基于用戶的細分行業屬性,熟悉細分行業的需求價值?基于用戶的業務流程細節,對用戶的需求矛盾分析?基于用戶的資源能力,明確用戶的負擔上限?……實踐化的落地)算法結構訓練數據量模型種類 (算力需求系數相關數據吞吐量參數量規模How(項目執行)?在不同階段和層面對項目的工作內容從主項、分項、子項甚至單體的各個部分進行拆分(例如采用WBS),實現項目關鍵節點的管理,?完成項目人員的協同、管理、分工及時間資源調配?對風險的預知、判斷及合理控制?……訓練人員成本團隊)安全性與穩定性?AIGC產業落地的算力選擇,更應該強調最優解,而非最大解。在實現AIGC的技術落地過程中,模型的參數量及涌現結果固然重要,但模型在運行過程中所需的AIGC重要。以終為始,貼合行業需求,實現目標與資源平衡,是AI新世代下的算力選擇依據核心目標:基于行業核心目標:基于行業Know-How需要實現的AIGC能拆分,實現精準的需求分析源要進行主次的優先選擇推理需求 (長期運營)訓練需求 (一次開發)源要進行主次的優先選擇推理需求 (長期運營)訓練需求 (一次開發)考慮到模型訓練“黑盒”機制與多次調優,所需算考慮到模型訓練“黑盒”機制與多次調優,所需算力與開發過程強相關技術實現路徑WhyWhy(用戶分析)能耗成本云服務或者算力的使用成本)基于需求進行算力資源利用的維度 (算力提供方在AI算力領域的Know-How及經驗)?芯片的選擇及適配?智算硬件的選擇及適配?智算中心的選擇及適配?接入方式、算力調度、需求分配、彈性擴展、高效穩定、算法優化、通訊傳輸、第三方生態、故障排查、大模型相關數據及訓練工具包 (生態)、模型的納管及生態合作、云邊端協同可按需適配資源及彈性適配,部署時間更快,可以選擇適配AIGC產品/服務的算力資源,減少對于AI算力環境優化的時間及人力成本?芯片的選擇及適配?智算硬件的選擇及適配?租戶管理、配額管理、運維管理、資源及作業調度管理、系統監控、安全及穩定按需取用、靈活擴展、無需各IT系統的復雜運維,直接在完成優化的環境下進行開發?核心計算單元的算力參數?對應的運算精度?單元數量?芯片的選擇及適配?硬件選型及適配(如內存)、異構算力的調度及配合、網絡傳輸、軟件優化、集群架構、環境優化通過服務器等硬件完成自有算力的部署,環境調試,完成大量不同硬件設備的選型、優化及穩定性保障,需要具備成熟的項目案例經驗?內存/顯存、片內互聯及片間互聯、AI適配生態工具(包括適配算法及其他硬件)、物理環境支撐、折舊速率需要從芯片層面解決工程問題,包括芯片互聯、構建網絡、適配從應用到硬件的環境,工作量大且繁雜,需要具備從0到1的經驗豐富的技術團隊支持AIGC的算力資源選擇,需要結合自身部署能力及應用需求綜合考量算力資源利用的維度 (算力提供方在AI算力領域的Know-How及經驗)?芯片的選擇及適配?智算硬件的選擇及適配?智算中心的選擇及適配?接入方式、算力調度、需求分配、彈性擴展、高效穩定、算法優化、通訊傳輸、第三方生態、故障排查、大模型相關數據及訓練工具包 (生態)、模型的納管及生態合作、云邊端協同可按需適配資源及彈性適配,部署時間更快,可以選擇適配AIGC產品/服務的算力資源,減少對于AI算力環境優化的時間及人力成本?芯片的選擇及適配?智算硬件的選擇及適配?租戶管理、配額管理、運維管理、資源及作業調度管理、系統監控、安全及穩定按需取用、靈活擴展、無需各IT系統的復雜運維,直接在完成優化的環境下進行開發?核心計算單元的算力參數?對應的運算精度?單元數量?芯片的選擇及適配?硬件選型及適配(如內存)、異構算力的調度及配合、網絡傳輸、軟件優化、集群架構、環境優化通過服務器等硬件完成自有算力的部署,環境調試,完成大量不同硬件設備的選型、優化及穩定性保障,需要具備成熟的項目案例經驗?內存/顯存、片內互聯及片間互聯、AI適配生態工具(包括適配算法及其他硬件)、物理環境支撐、折舊速率需要從芯片層面解決工程問題,包括芯片互聯、構建網絡、適配從應用到硬件的環境,工作量大且繁雜,需要具備從0到1的經驗豐富的技術團隊支持算力資源的維度不僅包括算力規模大小,要考慮算力部署及運營過程中可以利用的程度。算力是工程化結果,是從芯片到資源服務的多層次構造,需要算力服務How力部署的能力進行進一步探究。直接使用者所需技術要求云云服務智算智算中心智算智算硬件芯芯片不同場景下算力需求的分析示例超算和大型視覺類物聯網實時決策數據處理 (訓練)視覺類 (推理)工控采集帶寬需求10G超大型算力(P~級)1G大型算力(T~P級)100M中型算力(G~T級)10M1M1000ms時延需求10ms100ms視頻渲染算力作為邏輯資源,場景的復雜性導致算力的評價指標不唯一不同場景下算力需求的分析示例超算和大型視覺類物聯網實時決策數據處理 (訓練)視覺類 (推理)工控采集帶寬需求10G超大型算力(P~級)1G大型算力(T~P級)100M中型算力(G~T級)10M1M1000ms時延需求10ms100ms視頻渲染算力作為邏輯資源,與水電等標準化資源相比就更加復雜、具備更多維度,而技術的發展催生了豐富的計算場景,不同的行業、應用場景對算力更提根據需求考量根據需求考量的算力維度示例100G型計算的選擇如天體物理、氣象研究、航空航天等高精尖科研領域需要能夠支持復雜運算、性能高的雙精度算力;對于AI模型訓練及推理來說,處理文滿足應用需要。:需要實時渲染的游戲、自動駕駛決策、遠程手術、工業控制等領域對延遲的要求非常高,對延遲沒有很高要求。小型算力(<500G級)帶寬:基于帶寬:基于AR、VR等渲染場景,模型訓練、超算類等場景對大帶寬的需求較高,工控、物聯網采集等則對帶寬要求不高。用戶日活量(主要為推理階段數據每日的吞吐量)參數量/模型數量/訓練數據量應用層技術路線確認商業模式突破中間層模型層在重點的典型市場實現爆發,具有場景原生能力、行業模型、通用模型強的企業進入云服務算力層智算硬件芯片當下的AIGC算力關注熱點在訓練端,但商業突破及應用需要推理側支持用戶日活量(主要為推理階段數據每日的吞吐量)參數量/模型數量/訓練數據量應用層技術路線確認商業模式突破中間層模型層在重點的典型市場實現爆發,具有場景原生能力、行業模型、通用模型強的企業進入云服務算力層智算硬件芯片?整體市場的算力核心判斷指標取決于市場發展階段對應的訓練及推理需求,當下是AIGC產業技術與商業結合的重要拐點,一方面,國內外均有商業落地尋找,需要大量算力支持各行各業企業持續探索。,重推理階段——關注應用的用戶數量。模型數量/訓練數據量算力隨市場商業落地而改變算力隨市場商業落地而改變多點成熟應用下游應用全面爆發,多個場景出現成熟應用大量投入資源,行業巨頭(資源豐富)企業投入搶占先機,中小企業進行跟隨性探索用模型出現,并且有部分標桿性案例,可在部分場景下尋找穩定商業模式?細分賽道的技術路線待定:當下的模型能力如何賦能細分賽道依然值得探索多模態*多行業,AIGC的C端垂類應用體驗將處于快速探索階段?考慮到當下AIGC的可信性及成本的局限性,AIGC的應用在復雜度高(智能化水平),及更開放的場景實現,推動AI落地側應用以及模型的迭代。中國人工智能服務器工作負載占比預測,2020-2026中國人工智能服務器工作負載占比預測,2020-2026環節的不斷擬合100%娛樂率高 (更開放的場景)實現×10的娛樂率高 (更開放的場景)實現×10的產品體驗80%51.5%意設計創作化培訓化營銷57.6%58.5%59.5%60.7%61.8%62.2%化營銷教育創新影視創作60%協同開發開發設計設計居40%數據核
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司春節互動活動方案
- 公司短視頻小組活動方案
- 公司狂歡夜活動方案
- 2025年育兒嫂職業技能鑒定考試試題及答案
- 2025年網絡信息安全法考試試題及答案
- 2025年現代生物技術專業水平考試試卷及答案
- 2025年特殊兒童教育教師資格考試試題及答案
- 2025年企業形象設計師資格考試試題及答案
- 2025年領導力與團隊建設專業知識測試卷及答案
- 2025年大愛事業發展與慈善管理考試試卷及答案
- 【課件】新高三啟動主題班會:啟航高三逐夢未來
- 2024年山東省交通運輸行業職業技能競賽(裝卸機械電器修理工)試題庫(含答案)
- 電力電子技術第五版(王兆安)課件全
- QB∕T 2080-2018 高回彈軟質聚氨酯泡沫塑料
- 工程機械設備保險附加第三者責任保險條款
- 醫院感染知識培訓記錄范文(精選6篇)
- 日周月安全檢查記錄表
- 上海電動汽車充電設施建設管理暫行規定
- 100道結構力學彎矩圖
- 鋼結構設計圖中的焊接符號標注大全(圖)
- 流動資金缺口測算表
評論
0/150
提交評論