通信行業AI大時代系列報告之一(基礎篇):大模型與算力共振奇點時刻到來_第1頁
通信行業AI大時代系列報告之一(基礎篇):大模型與算力共振奇點時刻到來_第2頁
通信行業AI大時代系列報告之一(基礎篇):大模型與算力共振奇點時刻到來_第3頁
通信行業AI大時代系列報告之一(基礎篇):大模型與算力共振奇點時刻到來_第4頁
通信行業AI大時代系列報告之一(基礎篇):大模型與算力共振奇點時刻到來_第5頁
已閱讀5頁,還剩40頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

內容目錄TOC\o"1-2"\h\z\u1、大模型涌現,ChatGPT引爆AI奇點 5、ChatGPT加速人工智能發展奇點來臨 5、大模型軍備競賽,開啟未來時刻 102、算力質變,英偉達打造AI時代引擎 17、算力需求指數級增長,加速計算深度變革 17、英偉達時代賣水人,打造發展引擎 233、中文模型奮起直追,辦公生產力率先變革 30、中文模型奮起直追,更強中文理解 30、生產力工具革新,釋放創造力 384、相關公司 445、風險提示 45圖表目錄圖表1:ChatGPT根據指示進行回復 5圖表2:ChatGPT可以實現的功能 5圖表3:ChatGPT用戶訪問量 6圖表4:2023年6月ChatGPT受眾群體地區分布情況 6圖表5:各應用程序達到1億用戶所需時間 7圖表6:OpenAI發展歷程與股東情況 8圖表7:ChatGPT模型原理 9圖表8:RLHF(人類反饋強化學習技術)訓練模型技術原理 9圖表發展歷程 10圖表10:2023年國內外發布的主要大模型梳理 圖表11:OpenAI推出ChatGPTPlus訂閱服務 12圖表12:文本生成圖像模型 13圖表13:不同功能的語言模型 13圖表14:Codex語言模型示例 13圖表15:OpenAI已在多個應用程序中應用 14圖表16:GitHubCopilot價格情況 14圖表17:Keeper價格情況 15圖表18:Viable價格情況 15圖表19:Duolingo的數據與算法工具示例 16圖表20:第一批ChatGPTPlugins合作伙伴 16圖表21:算力發展總體框架 17圖表22:1950-2022年機器學習訓練參數變化情況 18圖表23:1950-2022年機器學習算力變化情況 18圖表24:2011-2022年項目數量情況 19圖表25:2010-2021年全球期刊論文發表數量 19圖表26:全球算力規模發展趨勢 20圖表27:中國通用算力規模及預測 20圖表28:中國智能算力規模及預測 20圖表29:2020-2024年全球人工智能、數字化轉型支出及GDP增長趨勢預測 21圖表30:全球人工智能服務器GPU芯片搭載率 21圖表31:全球人工智能服務器芯片搭載率 21圖表32:全球人工智能服務器芯片搭載率 22圖表33:2022年中國人工智能芯片市場規模占比 22圖表34:英偉達建立了加速計算的良性循環 23圖表35:加速計算和人工智能將重塑計算機行業 23圖表36:英偉達推出超級計算機DGXGH200 24圖表37:英偉達Spectrum-X以太網平臺 24圖表38:英偉達cuLitho加速庫合作客戶 25圖表39:用于量子電路仿真的加速庫cuQuantum 26圖表40:英偉達cuOpt及客戶 26圖表41:英偉達CV-CUDA平臺 26圖表42:NVIDIAParabricks醫療加速庫 26圖表43:英偉達推出DGXCloud 27圖表44:英偉達Nemo語言模型 27圖表45:英偉達Picasso視覺語言模型 27圖表46:NVIDIA全新推理平臺 28圖表47:NVIDIAH100NVL性能情況 28圖表48:NVIDIASuperPOD胖樹拓撲網絡結構 29圖表49:交換芯片技術演進路徑 29圖表50:大模型的分類 30圖表51:百度發布“文心一言” 30圖表52:“文心一言”文學創作能力 31圖表53:“文心一言”數理邏輯推理能力 31圖表54:“文心一言”中文理解能力 31圖表55:“文心一言”多模態生成能力 31圖表56:百度人工智能全棧布局 31圖表57:ERNIE3.0文心大模型架構示意圖 32圖表58:ERNIE3.0預訓練數據集 32圖表59:全面的模型尺寸,覆蓋不同場景需求 33圖表60:百度面向特定任務的大模型 33圖表61:百度面向特定領域的大模型 33圖表62:飛漿重點產品示意圖 34圖表63:百度文心一格藝術與創意輔助平臺 34圖表64:百度文心百中產業級搜索系統 35圖表65:商湯科技推出日日新大模型體系 35圖表66:商湯SenseChat2.0大語言模型能力全面升級 36圖表67:商湯SenseMirage3.0文生圖大模型全面升級 36圖表68:華為云正式發布盤古大模型3.0 37圖表69:華為全棧核心技術 37圖表70:微軟發布Microsoft365Copilot 38圖表71:Microsoft365Copilot技術原理 39圖表72:Copilot版Word使用示例 39圖表73:Copilot版使用示例 39圖表74:Copilot版PPT,將Word文檔轉換為幻燈片 40圖表75:Copilot版PPT,為所有幻燈片生成演講者備注 40圖表76:Copilot版Outlook,自動管理和回復郵件 40圖表77:Copilot版,會議過程中提供會議信息 41圖表78:Copilot版,會議結束后總結用戶錯過的內容 41圖表79:Copilot版BusinessChat使用示例,給予綜合性答復 41圖表80:MicrosoftSecurityCopilot的特點 42圖表81:MicrosoftSecurityCopilot為微軟各安全產品賦能 42圖表82:MicrosoftSecurityCopilot基于和微軟安全專用模型 43圖表83:MicrosoftSecurityCopilot集成了和微軟的安全能力 43圖表84:賦能安全團隊以機器的速度來解決問題 43圖表85:MicrosoftSecurityCopilot使用案例 43圖表86:相關公司業務情況 441、大模型涌現,ChatGPT引爆AI奇點、ChatGPT加速人工智能發展奇點來臨2022年11月OpenAI發布ChatGPT聊天機器人,人工智能發展奇點加速來臨。ChatGPTPre-trained是由美國人工智能公司OpenAI開發的用于自2022年30日發布,是一款全新的聊天機器人模型,可以根據用戶的對話輸入,產生出與其相關的回復,能夠從文本輸入中理解上下文因素,并生成有意義的句子回復,能夠回答問題、承認錯誤、質疑不正確的前提和拒絕不適當的請求。圖表1:ChatGPT根據指示進行回復資料來源:OpenAI,五礦證券研究所可以實現的功能資料來源:通信產業網,五礦證券研究所ChatGPT發布后,OpenAI網站訪問量爆發式增長。據SimilarWeb數據顯示,過去7個月,網站訪問量快速增長,2023年6月網站訪問量達16億次,平均訪問時長約8分鐘,每次訪問頁數4.26個。從受眾群體地區來看,美國、印度、日本、巴西、哥倫比亞占比前五,分別為12.12%、7.61%、4.17%、3.32%、3.16%。圖表3:ChatGPT用戶訪問量200,000180,000160,000140,000120,000100,00080,00060,00040,00020,00002022年11月 2022年12月 2023年1月 2023年2月 2023年3月 2023年4月 2023年5月 2023年6月總訪問量(萬次)資料來源:Similarweb,五礦證券研究所圖表4:2023年6月ChatGPT受眾群體地區分布情況12.17.67.69.6日本2 巴西哥倫比亞其他資料來源:Similarweb,五礦證券研究所ChatGPT用戶增速創歷史新高,發布5天用戶數突破100萬,2個月過億。2022年11月30日,OpenAI推出ChatGPT聊天機器人產品。12月5日,OpenAI創始人SamAltman發推稱,ChatGPT上線僅5天,用戶數突破100萬。至2023年1月末,ChatGPT用戶數突破1億,距離發布時間僅2個月,成為史上用戶數增長最快的消費者應用。據英偉達在World13個月1億用戶;Instagram26個月(2年多)達到月活1億用戶;Facebook用時421億用戶。圖表5:各應用程序達到1億用戶所需時間2132621326394249FacebookWhatsApp0 10 20 30 40 50 60花費時長(月)資料來源:英偉達,五礦證券研究所OpenAI創始人背景深厚,與微軟深度合作。2015年12月,OpenAI公司在美國舊金山成立,由人工智能領域的頂尖科學家和企業家聯合創立的一家非盈利的人工智能研究公司。聯合創始人包括美國創業孵化器YCombinator總裁SamAltman(現CEO)、馬斯克(ElonMusk)、全球在線支付平臺PayPal聯合創始人PeterThiel、IlyaSutskever(師從神經網絡之父GeofferyHinton,現首席科學家)等;3月,OpenAI創立了OpenAILP公司,從非盈利公司轉型至有限盈利公司;20197OpenAI10億美元,同時微軟Azure成為OpenAI的“獨家”云計算服務提供商;1OpenAIChatGPT,Azure中整合ChatGPT,作為OpenAI的獨家云提供商,Azure將為研究、產品和APIOpenAI工作負載提供支持。圖表6:OpenAI發展歷程與股東情況資料來源:OpenAI,五礦證券研究所ChatGPT采用基于練模型tPT是基于P.(GetiePetidsmr.5)AIInstructGPT的兄弟模型,采用“預訓練+微調”的模型訓練方技術對ChatGPT訓練過程可分為三個步驟:訓練監督學習模型:首先ChatGPT從數據庫中抽取若干問題并向模型解釋強化學習機制,隨后人類標注者撰寫期望的輸出值,對模型給予特定獎勵或懲罰引導教育,最后通過監督學習微調5模型;收集數據并訓練獎勵模型:從采用近端策略優化(PRO)強化學習微調模型:近端策略優化(ProximalPolicyOptimization)是年OpenAI發布的強化學習算法,首先通過監督學習生成初始PRO模型,由獎勵模型對回答打分后,將反饋結果優化和迭代初始PRO模型,通過多圖表7:ChatGPT模型原理資料來源:OpenAI,五礦證券研究所RLHF(ReinforcementLearningfromHumanFeedback)是通過人類反饋強化學習技術優化語言模型。將人類的反饋納入訓練過程,為機器提供了一種自然的、人性化的互動學習過程,以更廣泛的視角和更高的效率學習,允許人類直接指導機器,并允許機器掌握明顯嵌入人類經驗中的決策要素。圖表8:RLHF(人類反饋強化學習技術)訓練模型技術原理資料來源:OpenAI,五礦證券研究所、大模型軍備競賽,開啟AI未來時刻人工智能是引領未來的新興戰略性技術,是驅動新一輪科技革命和產業革命的重要力量。年艾倫(Alan2050年代中期,由于計算機的出現與發展,人們開始了具有真正意義的人工智能的研究。隨著人工智能越來越多地被應用于內容創作,人工智能生成內容(ArtificialIntelligenceContent,AIGC)概念悄然升起。AIGC的發展可大致分為三個階段:早期萌芽階段受限于當時的科技水平,僅限于小范圍實驗。在1956年的達特茅斯會議上,“人工智能”的概念被首次提出,在之后的十余年內人工智能迎來了發展史上的第一個小高峰,研究者們紛紛涌入,取得了一批矚目的成就。沉淀積累階段(1990s-2010s):AIGC從實驗性向實用性轉變。2006年,深度學習算法取得重大突破,同時期圖形處理器(GPU)、張量處理器(TPU)等算力設備性能不斷提升,互聯網使數據規模快速膨脹并為各類人工智能算法提供了海量訓練數據,使人工智能發展取得了顯著的進步,同時受限于算法瓶頸,應用仍然有限,效果有待提升。至今年起,隨著以生成式對抗網絡(GAN)為代表的深度學習算法的提出和迭代更新,AIGC迎來了新時代。圖表9:AIGC發展歷程資料來源:中國信息通信研究院《人工智能生成內容(AIGC)白皮書》,五礦證券研究所國內外廠商紛紛加入大模型軍備競賽。在AI等國際科技巨頭處于領先地位,中國阿里巴巴、華為、百度等公司均推出了自己的AI大模型產品。3月百度發布文心一言,4月華為發布盤古大模型,阿里發布通義千問大模型,商湯科技公布“日日新SenseNova”大模型體系,月科大訊飛發布星火大模型,此外多家上市公司也開始布局AI大模型領域,積極探索索AI大模型技術的應用。從模型參數量來看,模型參數量呈現上升趨勢。多模態大模型參數量相對較大,多在千億級Visual的模型參數量分別為5620,17501750億。國內大數據模型中,模型參數數量達千億的模型有文心大模型(2600億),盤古NLP(千億級)等。圖表10:2023年國內外發布的主要AI大模型梳理發布機構發布時間模型名稱模型參數數量(億)模型類型是否開源Google2023/2/10ViT-22B220計算機視覺否復旦大學2023/2/20MOSS160多模態是Facebook2023/2/24LLaMA650自然語言處理是Google2023/3/6PaLM-E5620多模態否Microsoft2023/3/8VisualChatGPT1750多模態否TogetherComputer2023/3/11GPT-NeoXT-Chat-Base-20B200自然語言處理是斯坦福大學2023/3/13StanfordAlpaca70自然語言處理是清華大學2023/3/14ChatGLM-6B62自然語言處理是OpenAI2023/3/14GPT-41750多模態否Intel2023/3/16INT8GPT-J6B60自然語言處理是databricks2023/3/24Dolly60自然語言處理是CerebrasSystems2023/3/28CerebrasGPT130自然語言處理是HPC-AITech2023/3/29ColossalChat130自然語言處理是LightningAI2023/3/29Lit-LLaMA650自然語言處理是Bloomberg2023/3/30BloombergGPT500自然語言處理否LM-SYS2023/3/31Vicuna-13B130自然語言處理是UCBerkeley2023/4/3Koala-13B130自然語言處理否Facebook2023/4/5SegmentAnythingModel10計算機視覺是騰訊2023/4/6LVDM0多模態是databricks2023/4/12dolly-v2120自然語言處理是StabilityAI2023/4/14StableDiffusionXL23計算機視覺是Meta2023/4/14DINOv211計算機視覺是Microsoft2023/4/17LLaVA130多模態是AI2023/4/20StableLM1750自然語言處理是AI2023/4/28StableVicuna-13B130自然語言處理是上海人工智能實驗室2023/4/28LLaMAAdapterV2650多模態是Google2023/5/10PaLM23400自然語言處理是Google2023/5/17DoReMi80自然語言處理是清華大學2023/5/17VisualGLM-6B78多模態是Meta2023/5/22LIMA650自然語言處理是資料來源:DataLearner,五礦證券研究所ChatGPT開啟商業變現。當地時間年2月1日,美國人工智能公司OpenAI推出ChatGPTGPT20美元。訂閱者可在免費服務基礎上獲得:1)更快的相應時間;3)優先使用新功能和優化等權益。2023年31官方宣布正式開放ChatGPTAPIChatGPTPlus的推出,標志著ChatGPT正式商業化,開啟產品向商業變現之路。圖表11:OpenAI推出ChatGPTPlus訂閱服務資料來源:OpenAI,五礦證券研究所OpenAI盈利模式:開放付費API接口,提供多種模型。OpenAI提供filter的APIAPI接口根據模型類型、業務量等指標進行收費。圖像模型根據圖片分辨率的不同按張數收費,語言模型基于子模型型號按字符數收費,微調模型則包括訓練和使用兩部分的價格。圖像模型:基于實現文本生成圖像DALL·EAPI3種與圖像交互的方法:1)基于新文本提示創建對現有圖像的創建現有圖像的變體。生成的圖像有256x256512x5121024x1024像素三種規格,尺寸較小的圖像生成速度更快。用戶只需簡單輸入一些文字描述,即可將文字描述的場OpenAI300萬人使用DALL·E模型擴展創造力,加快工作流程。語言模型:不同功能和價格的語言模型OpenAIGPT3、filter1750億是GPfilter圖表12:文本生成圖像模型資料來源:OpenAI,五礦證券研究所圖表13模型名稱概況GPT-3能夠理解和生成自然語言的模型Codex能夠理解和生成代碼的模型,同時可以實現將自然語言轉換為代碼Contentfilter檢測文本是否敏感或不安全資料來源:OpenAI,五礦證券研究所資料來源:OpenAI,五礦證券研究所OpenAPI已在多個應用程序中應用,從幫助人們學習新語言到解決復雜分類問題。是一款AIOpenAI語言模型提供支持,幫助開發人員更快地編寫代碼;KeeperAppGP模型提供支通過使用GPT-3語言模型,幫助公司從客戶反饋中獲得見解,智能讀取用戶評論;Duolingo使用GP語言模型進行語法修正。圖表15:OpenAIAPI已在多個應用程序中應用資料來源:OpenAI,五礦證券研究所GitHubCopilot:AI編程工具軟件,提高開發效率。629日,微軟與nAI共AIGitHubCopilot,2022622日,Copilot正式上線,定價每10GitHub由OpenAI提供支持,這是一個由OpenAI創建的生成預訓練語言模型,可以根據上文提示為程序員自動編寫下文代碼。使開發人員更快地編寫代碼,專注于業務邏輯而不是樣板,提高工作效率。圖表16:GitHubCopilot價格情況資料來源:GitHubCopilot,五礦證券研究所KeeperTax:AI稅務軟件。通過定制版GPT-3模型來識別賬單上的各種數據,以幫助用戶找到可以免稅的費用,連接銀行自動發現隱藏的稅收減免,通過搜索交易歷史,發現容易錯過的可抵扣稅款的業務支出和其他稅收減免。據KeeperTax官網披露,Keeper用戶平均每年發現價值1249美元的額外稅務沖銷,目前Keeper已幫助超過50000名靈活雇員和創意經濟工作者發現了價值7000萬美元的稅務沖銷。圖表17:KeeperTax價格情況資料來源:KeeperTax,五礦證券研究所ViableI企業分析應用軟件Vile是第一家使用人工智能研究分析初創公司OpenAI的Viable推出3美元,每月最多個數據點;對于成長型企業,希望通過客戶反饋迭代產美元,每月最多5000個數據點;對于成熟企業,獲得定制報告與測量,利用數據訓練AI,可選擇定制服務。圖表18:Viable價格情況資料來源:Viable,五礦證券研究所Duolingo:AI語言學習工具軟件。Duolingo是一款語言學習工具軟件,提供40多種語言課程,包括英語、日語、韓語、法語、粵語等大眾語言,也包括威爾士語、納瓦荷語等小語種和瀕危語言。Duolingo使用OpenAI的GPT-3進行語法修正。圖表19:Duolingo的數據與算法工具示例資料來源:Duolingo,五礦證券研究所推出ChatGPTPlugins插件功能,拓寬場景邊界323日,OpenAI推出ChatGPTPluginsChatGPTChatGPTPlugins插件專門為大語言模型設計,以安全為核心原則,能夠幫助ChatGPT訪問最新的信息,運ChatGPT參與開發者定義的APIChatGPT的能力,拓寬場景邊界。圖表20:第一批ChatGPTPlugins合作伙伴資料來源:OpenAI,五礦證券研究所2、算力質變,英偉達打造AI時代引擎、算力需求指數級增長,加速計算深度變革算力是設備通過處理數據,實現特定結果輸出的計算能力GPU、FPGAASIC(Flops,1EFlops=10^18Flops52A25萬臺主流雙路服務器,或者200萬臺主流筆記本的算力輸出。算力可分為基礎算力、智能算力和超算算力三部分,分別提供基礎通用計算、人工智能計算和科學工程計算。其中,基礎通用算力主要基于CPU芯片的服務器所提供的計算能力;智能算力主要是基于GPU、FPGA、ASIC等芯片的加速計算平臺提供人工智能訓練和推理的計算能力;超算算力主要是基于超級計算機等高性能計算集群所提供的計算能力。圖表21:算力發展總體框架資料來源:中國信息通信研究院《中國算力發展指數白皮書》,五礦證券研究所算力需求指數級增長,大模型參數指數級增長。經過大規模預訓練的大模型,能夠在各種任務中達到更高的準確性、降低應用的開發門檻、增強模型泛化能力等。隨著海量數據的持續積累、人工智能算力多樣化與算法的突破,大模型參數規模呈現指數級增長,先后經歷了預訓練模型、大規模預訓練模型、超大規模預訓練模型三個階段,參數量實現百萬億級突破。與此同時,算力需求也呈現指數級增長。從行業分布上看,大模型的應用領域逐步從學術拓展至產業,2010年后產業界對大模型的應用與算力需求顯著增長,成為主導力量。圖表22:1950-2022年機器學習訓練參數變化情況資料來源:《ArtificialIntelligenceIndexReport2023》,五礦證券研究所圖表23:1950-2022年機器學習算力變化情況資料來源:《ArtificialIntelligenceIndexReport2023》,五礦證券研究所期刊論文與開源項目快速增長ChatGPT引發了新一輪的AI浪潮,越來越多的研究機構與公司加大對AI2023年AI指數報告》統計,人工智能論文的總數自年呈現翻倍增長,從年的20萬篇增長到年的近50萬模式識別、機器學習和計算機視覺是人工智能領域研究的熱門話題,從國家分布221年占比為.%.%(10%AIGitHub統計,自年以來人工智能相關的Git項目穩步增長,從個增長至2022年34.79萬個,從國家分布看,2022年印度軟件開發人員占比24.2%,其次是歐盟和英國3%)與美國(14%)。圖表24:2011-2022年GitHubAI項目數量情況資料來源:《ArtificialIntelligenceIndexReport2023》,GitHub,五礦證券研究所圖表25:2010-2021年全球AI期刊論文發表數量資料來源:《ArtificialIntelligenceIndexReport2023》,五礦證券研究所全球算力規模不斷增長。據IDC統計,2020年全球算力總規模達到429EFlops,同比增長39%,其中基礎算力規模(FP322,FP32為單精度浮點數,采用32位二進制來表達一個數字,常用于多媒體和圖形處理計算)為313EFlops3,智能算力規模(換算為FP32)為107EFlops4,超算算力規模(換算為FP32)為9EFlops5。據IDC預測,未來五年全球算力規模將以超過50%的速度增長,到2025年整體規模將達到3300Eflops。全球主要國家和地區紛紛加快算力布局。算力水平方面,據IDC統計2021年美國、中國、歐洲、日本在全球算力規模中的份額分別為36%、31%、11%和6%。圖表26:全球算力規模發展趨勢資料來源:中國信息通信研究院《中國算力發展指數白皮書》,IDC,Gartner,TOP500,五礦證券研究所中國智能算力規模持續擴大C1年中國智能算力規模達.EFOPS,268.0年智能算力規模將進入每秒十萬億億次浮點計算(ZFLOPS)級別,達到1271.4EFLOPS。圖表27:中國通用算力模及測 圖表28:中國智能算力模及測120

1,400100

1,2001,000808006060040 40020 20002019

2020

2021 2023E 2024E 2025E 2026E

02019

2020

2021 2023E 2024E 2025E 2026E中國通用算力規模(EFLOPs)

中國智能算力規模(EFLOPs)資料來源:IDC,五礦證券研究所 資料來源:IDC,五礦證券研究所全球企業持續增加對的投資。伴隨數字經濟的持續發展,為滿足企業內部發展需求和外部市場需求,企業一直大力投資數字化轉型相關技術。據IDC統計,全球企業在包括軟件、硬件和服務在內的人工智能市場的技術投資從2019612.4億美元增長至2021年2025年突破2000億美元,增幅高于企業數字化轉型(DX)29.0%26.6%27.9%26.3%16.9%16.9%17.6%29.0%26.6%27.9%26.3%16.9%16.9%17.6%17.0%16.2%10.6%5.7%2.9%3.0%3.0%2020-3.3%202120222023E2024E35%30%25%20%15%10%5%0%-5%AI支出增幅 數字化轉型支出增幅 GDP增幅資料來源:IDC,世界銀行,五礦證券研究所全球人工智能芯片搭載率將持續增長,低能耗為大勢所趨。AI產業化的核心力AI據2025726億美元。人工智能算力規模的18個月,人工智能服務器GPU、ASIC和FPGAGPU為主,實現數據中心計算加速,市場占有率達89%,GPU芯片多用于圖形圖像處理、復雜的數學計算等場景。此外ASIC,等非GPU芯片市場占有率超過U較以往具有明顯增長,NPU芯片設計邏輯相對簡單,常用于邊側和端側的模型推理。圖表30:全球人工智能務器芯片搭載率 圖表31:全球人工智能務器芯片搭載率 資料來源:IDC,五礦證券研究所 資料來源:IDC,五礦證券研究所19.689圖表32:全球人工智能務器芯片搭載率 圖表33:2022年中國人智能片市規模比19.689資料來源:IDC,五礦證券研究所 資料來源:IDC,五礦證券研究所

GPUNPUASICFPGA、英偉達AI時代賣水人,打造發展引擎的iPhone時刻。年3月21日,英偉達舉行了GTC2023(GPU主題演講,CEO黃仁勛表示“我們正處于AI的iPhone仁勛介紹了英偉達在AIAI應用個、更新功能的工業元宇宙Omniverse。計算技術發展日新月異,曲速引擎是加速計算,動力來源是AI,隨著計算量的激增,生成式AI使得企業需重新思考其商業模式與產品。目前英偉達生態系統涵蓋400萬開發者、4萬家公司、1.4萬家初創公司。圖表34:英偉達建立了加速計算的良性循環資料來源:英偉達官網,《英偉達GTC2023主題演講》,五礦證券研究所加速計算和人工智能將重塑計算機行業,新計算時代臨界點正到來。2023年5月29日,英偉達CEO黃仁勛在Computex2023上發表主題演講,表示“加速計算已經帶來了全新的計算時代”,在AI發展中GPU擔任的運算器角色變得愈發重要,加速計算有望成為關鍵引擎。圖表35:加速計算和人工智能將重塑計算機行業資料來源:英偉達官網,五礦證券研究所英偉達推出超級計算機GH200,E超算。5COMPUTEX大會上英偉達推出超級計算機GXGX0通過Vik互連技術及VikSitchSystem個Grace1-Exaflop、144TBGPU的巨型模型,用于驅動生成式人工智能、推薦系統和數據分析,為巨型人工智能模型提供線性Meta和微軟將會是首批使用DGXNVIDIA的Grace超級晶片已開始量產。圖表36:英偉達推出超級計算機DGXGH200資料來源:英偉達,五礦證券研究所英偉達推出全新Spectrum-X加速以太網平臺。529推出IDIASpectrum-XAI云的性能與效率。Spectrum-X將Spectrum-4NVIDIABlueField-3DPU緊密結合,取得1.7倍整體AI性能和能效提升,同時可在多租戶環境中提供一致、可預測的性能,Spectrum-XNVIDIA(S使開發人員能夠構建軟件定義的云原生AI應用。圖表37:英偉達Spectrum-X以太網平臺資料來源:英偉達官網,五礦證券研究所英偉達發布多款加速庫助力加速計算。加速庫是加速計算的核心,通過加速庫連接應用,再連接至各行各業,形成網絡中的網絡。經過30年的開發,已有數千款應用被英偉達的庫加速,涉及科學和工業多個領域。目前NVIDIAGPU兼容CUDA,為開發者提供了龐大的安裝基礎和廣泛的覆蓋范圍,吸引了眾多終端用戶。同時英偉達建立了加速計算的良性循環,涵蓋了300個加速庫和400個AI模型。英偉達在2023年GTC大會重點介紹了幾款加速庫:cuQuantum量子加速庫:用于量子電路仿真的加速庫。cuQuantum由英偉達與QuantumMachinesGPU連接到量子計算機以極快的速度進行糾錯,對量子計算機進行加速,可供研究人員推進量子編程模型,系統架構和算法。cuOpt運籌規劃加速庫:API。cuOpt使用進化算法和加速計算每億次動作,打破了世界紀錄。cuOpt可以優化物流,每年有4000億個包裹被投遞到Capgemini,SoftserveQuantiphi正在使用cuOpt來幫助客戶優化運營。視頻處理加速庫:用于計算機視覺的云規模加速庫包括30個計算機視覺算子,可用于檢測、分割和分類,VPF是一個Python視頻編解碼加速庫,騰訊使用和VPF30萬個視頻,Microsoft使用和VPF來處理視覺搜索。Parabricks醫療加速庫:用于云端或儀器設備內的端到端基因組分析的加速庫。Parabricks將會在PacBio、OxfordNanopore、Ultima,Singular、BioNano和Nanostring的第四代NVIDIA加速基因組學設備上運行。cuLitho計算光刻加速庫:通過計算技術大幅優化芯片制造流程cuLitho歷時4用GPU402m及更先進芯片的生產提供助力。如果在GPU上運行cuLitho,只需8小時即可處理完一個掩膜板。臺積電可通過在個DGX系統上使用cuLitho35MW5MW,4萬臺CPU服務器。圖表38:英偉達cuLitho加速庫合作客戶資料來源:英偉達官網,《英偉達GTC2023主題演講》,五礦證券研究所圖表39:用于量子電路真的速庫cuQuantum 圖表40:英偉達cuOpt及客戶 資料來源:英偉達官網,《英偉達2023主題演講》,五礦證券研究所 資料來源:英偉達官網,《英偉達2023主題演講》,五礦證券研究所圖表41:英偉達平臺 圖表醫療加速庫資料來源:英偉達官網,《英偉達2023主題演講》,五礦證券研究所 資料來源:英偉達官網,《英偉達2023主題演講》,五礦證券研究所推出DGXAICloud云服務,重塑大模型格局,加速AI生態發展。英偉達宣布推出NVIDIADGXCloud,這是一項AI超級計算服務,能讓企業立即訪問為生成式AI和其他突破性應用程序訓練高級模型所需的基礎設施和軟件。企業可按月租用DGXCloud集群,每月租金為3.7DGXAI超級計算機和AIAI和其他開創性應用訓練先進模型,可快速輕松地擴展大型多節點訓練工作負載的開發,而無需等待通常需求量很大的加速計算資源。此外,英偉達還成立了AIFoundationsAI模型訓練,從而降低AI數據的生成時間和提升客戶的工作效率。NVIDIAAIFoundations包括語言、視覺和生物模型制作服務。其中語言模型NVIDIANemo用于構建定制的語言文本轉文本;視覺模型PICASSO用于視覺語言模型制作;生物學模型BioNeMo可幫助研究人員使用專有數據創建、微調和提供自定義模型。DGX基礎設施。圖表43:英偉達推出DGXCloud資料來源:英偉達官網,《英偉達GTC2023主題演講》,五礦證券研究所圖表44:英偉達語言模型 圖表45:英偉達Picasso視覺言模型資料來源:英偉達官網,《英偉達2023主題演講》,五礦證券研究所 資料來源:英偉達官網,《英偉達2023主題演講》,五礦證券研究所推出GPU推理平臺,為AIGC設計專用算力。英偉達推出全新GPU推理平臺,4種配置分別用于加速AI視頻、圖像生成、大型語言模型部署和推薦系統,為不同種類的AIGC產業提供了對應的硬件產品。針對AI視頻設計的通用GPU,可提供比CPU120倍的AI視頻性能,能效提高99%;AI支持的2D、視頻和3D圖像生成進行了優化,推理性能是英偉達最受歡迎的云推理GPU10倍;H100NVL:針對ChatGPT等大型語言模型的大規模部署,配備雙GPUNVLink,將兩94GBHBM3顯存的PCleGPU1750億參數的大模型;GraceHooper:適用于推薦系統和大型語言模型的AI數據庫,圖推薦模型、向量數據庫和圖神經網絡的理想選擇,通過900GB/s的高速一致性芯片到芯片接口連接英偉達GraceCPU和GPU。圖表46:NVIDIA全新推理平臺資料來源:英偉達官網,《英偉達GTC2023主題演講》,五礦證券研究所圖表47:NVIDIAH100NVL性能情況資料來源:英偉達官網,《英偉達GTC2023主題演講》,五礦證券研究所胖樹網絡架構成為人工智能數據中心的重要需求之一。SuperPOD是推出的一個分布式集群的參考架構,最新一代是基于NVIDIA和NVIDIAHDR200Gb/sHCAs組建,旨在幫助AI研究人員快速搭建一套強大、靈活、高效的SuperPODSuperPOD臺DGXA100和三層InfinibandDGXA100配8200Gb/s2個200Gb/s的高速存儲網,采用計算和存儲網絡分離的方案。人工智能數據中心內部數據流量較大,高速率、低延時的要求推動胖樹架構在數據中心網絡中部署。圖表48:NVIDIASuperPOD胖樹拓撲網絡結構資料來源:英偉達,五礦證券研究所光連接向高速率、大密度方向發展。大語言模型帶來超大算力需求拉動通信基礎設施建設與擴容,光模塊作為數據傳輸的基礎部件,是實現光電轉換的核心部件,網絡帶寬需求增加,推動以太網交換機和光學器件進步,交換機之間連接需要高端光模塊來完成,交換芯片的技術演進推動光模塊更新換代,交換芯片向大容量、高速率、低功耗方向發展,光模塊隨之迭代升級。圖表49:交換芯片技術演進路徑資料來源:《Co-packageddatacenteropticsOpportunitiesandchallenges》,五礦證券研究所3、中文模型奮起直追,辦公生產力率先變革、中文模型奮起直追,更強中文理解大模型可大致分為基礎大模型、行業大模型、場景模型三類。基礎大模型:可在多個領域和任務上通用的大模型。利用大算力、使用海量數據與大參數的深度學習算法,在大規模無標注數據上進行訓練,以尋找特征并發現規律,進而形成強大泛化能力,可在不進行微調或少量微調的情況下完成多場景任務。行業大模型:針對特定行業或領域的大模型。通常使用行業相關的數據進行預訓練或微調,以提高在該領域的性能和準確度。場景模型:針對特定任務或場景的大模型。通常使用任務相關的數據進行預訓練或微調,以提高在該任務上的性能和效果。圖表50:大模型的分類資料來源:華為開發者大會2023,五礦證券研究所百度發布“文心一言”大模型,更強中文理解與跨模態能力。2023年3月16日,百度召開發布會發布大語言模型、生成式AI產品“文心一言”,百度創始人、董事長兼首席執行官李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。百度智能云面向企業客戶開放文心一言API接口調用服務。2023年3月27日,百度推出企業級大模型服務平臺“文心千帆”,基于文心一言底層模型(ErnieAI應用需求落地。圖表51:百度發布“文心一言”資料來源:百度官網,五礦證券研究所圖表52:“文心一言”學創能力 圖表53:“文心一言”理邏推理力總結《三體》核心內容與續寫思路 總結《三體》核心內容與續寫思路解答雞兔同籠問題資料來源:百度官網,五礦證券研究所 資料來源:百度官網,五礦證券研究所解釋洛陽紙貴含義內容生成視頻圖表54:“文心一言”文理能力 圖表55:“文心一言”模態成能力解釋洛陽紙貴含義內容生成視頻資料來源:百度官網,五礦證券研究所 資料來源:百度官網,五礦證券研究所圖表56:百度人工智能全棧布局資料來源:百度官網,五礦證券研究所文心大模型:基于結構,多范式的統一預訓練模式,支持長文本語言模型建模年3ERNE.百度圍繞各場景,在NLP、CV、跨模態、生物計算等領域形成完善的大模型生態,已歷經四代,2022年發布的ERNE3.0參數量達到2600億,相對的參數量提升50%。圖表57:ERNIE3.0文心大模型架構示意圖資料來源:《ERNIE3.0:Large-scaleKnowledgeEnhancedPre-trainingforLanguageUnderstandingandGeneration》,五礦證券研究所超大規模預訓練數據集在3.03.0融合了自回歸網絡和自編碼網絡,同時由于大規模知識圖譜類數據的引入,使得模型能夠在理解任務、生成任務、零樣本學習任務和常識推理任務上均獲取優秀的表現。3.01445個自然語言理解數據集上取得了SOTA的結果,在9個自然語言生成任務上取得了的效果,在18個數據集上刷新了zero-shot的效果。圖表58:ERNIE3.0預訓練數據集資料來源:百度官網,五礦證券研究所創新型算法,更好的中文理解能力,全面的模型尺寸,覆蓋不同場景需求。百度創新性地將大數據預訓練與多源豐富知識相結合,通過持續學習技術,不斷吸收海量文本數據中詞匯、結構、語義等方面的新知識,實現模型效果不斷進化。文心大模型引入知識圖譜,通過知識內化(語義學習和數據構造)和知識外用(知識推理和提示構建),將數據與知識融合,使得學習效率更高、可解釋性更好,突破了多源異構數據難以統一表示和學習瓶頸。針對不同的場景需求,百度發布不同的模型尺寸,拓寬了人工智能技術落地場景的覆蓋廣度。圖表59:全面的模型尺寸,覆蓋不同場景需求模型參數大小ERNIE3.0-10B100億ERNIE3.0-1.5B15億ERNIE3.0-Large3億ERNIE3.0-Base1億ERNIE3.0-Tiny3000萬資料來源:百度官網,五礦證券研究所大模型體系化,預置豐富模型。不同場景對模型的需求會有一定的差異化,所以在通用模型的基礎上需增加不同特質,對此百度增加了兩類模型:1、任務大模型,主要面向特定任務,比如語音搜索、圖文搜索、圖象理解等;2、行業大模型,針對特定行業進行知識增強后的大模型。圖表60:百度面向特定任務的大模型模型場景ERNIE-Gen文本生成任務對比同尺寸通用橫型BLEU4提升2~5%ERNIE-IE文本抽取任務,適合零樣本少樣本情況,單標簽5條樣本ERNIE-Rank檢索排序任務提升2%ERNIE-Senta情感分析任務,對比同尺寸通用模型平均提升0.6%ERNIE-Sim文本匹配任務對比同尺寸通用模型提升10%ERNIE-Doc長文本分類匹配抽取任務等ERNIE-M多語言分類匹配抽取任務等資料來源:百度官網,五礦證券研究所圖表61:百度面向特定領域的大模型模型場景ERNIE-Finance金融領域(實體抽取任務提升1.4%,分類提升0.4%)ERNIE-Health醫療領域(實體識別任務提升0.8%,匹配任務提升1.7%)ERNIE-Law法律領域(罪名預測提升0.33%,法條推薦提升1.52%)資料來源:百度官網,五礦證券研究所飛漿(PaddlePaddle):源于產業實踐的開源深度學習平臺。百度于年成立深度學習PdlPale26年8PalPaddlePaddlePaddle集深度學習核心框架、基礎模型庫、端到端開發套件、工具組件和服務平臺于一體,是全面圖表62:飛漿重點產品示意圖資料來源:百度官網,五礦證券研究所文心一格:AI藝術與創意輔助平臺。文心一格是百度推出的AI作畫產品。依托飛槳、文心大模型的技術創新,只需輸入文字描述,即能生成各種風格的精美畫作。可為畫師、設計師等視覺內容創作者啟發靈感,輔助藝術創作,也能為媒體、作者等文字內容創作者提供高質量、高效率的配圖。圖表63:百度文心一格AI藝術與創意輔助平臺資料來源:百度官網,五礦證券研究所文心百中:產業級搜索系統。文心百中是百度推出的由大模型驅動的產業級搜索系統。依托百度文心大模型,以極簡框架,代替傳統搜索引擎復雜的構建及維護成本,可低成本接入各類企業和開發者應用,并憑借數據驅動的優化模式可實現行業優化效率及應用效果。圖表64:百度文心百中產業級搜索系統資料來源:百度官網,五礦證券研究所商湯科技推出“日日新大模型”體系。2023年4月10日,在商湯技術交流日活動上,商湯科技董事長兼首席執行官徐立宣布推出大模型體系“商湯日日新大模型”,包括自然語言生成、文生圖、感知模型標注、以及模型研發功能。圖表65:商湯科技推出日日新大模型體系資料來源:商湯科技官網,五礦證券研究所商湯SenseChat2.0大語言模型能力全面升級77CEO徐立在第六屆世界人工智能大會(WAIC推出商湯商量SenseChat2.0版本,實現大與此同時,商湯秒畫SenseMirage3.0文生圖大模型亦全面升級,模型參數從2023年4月的10億提升至7月的70億,可實現專業攝影級的圖片細節刻畫。圖表66:商湯SenseChat2.0大語言模型能力全面升級資料來源:商湯科技,五礦證券研究所圖表67:商湯SenseMirage3.0文生圖大模型全面升級資料來源:商湯科技,五礦證券研究所華為云正式發布盤古大模型,面向行業的大模型系列77CEO30,30分為L0基礎大模型、L1行業大模型、L2場景模型三層架構,將重塑千行百業。盤古大模型強調在細分場景的落地應用,主要解決商業環境中低成本大規模定制的問題,用AI賦能千行百業。81000多個細分場景,讓更多煤礦工人能夠在地面上作業,極大地減少安全事故;103000臺服務器的高性能計算機集群上花費5秒內就可以獲得更精確的10000倍以上。76日,該研究成果登上國際頂級學術期刊《自然》雜志;在交通運輸行業,盤古鐵路大模型能精準識別現網運行的67種貨車、430多種故障,綜合準確性高達99.8%。通過盤古鐵路大模型的“慧眼”,無故障圖片的篩除率為95%,實現效率提升。圖表68:華為云正式發布盤古大模型3.0資料來源:華為開發者大會2023,五礦證券研究所盤古大模型在性能、深度、架構及數據增強方面均進行了升級。華為擁有算力、框架、平臺全棧核心技術,盤古大模型實現了以鯤鵬和昇騰為基礎的AI算力云平臺,以及異構計算架構CANN、全場景AI框架昇思MindSpore、AI開發生產線ModelArts的全棧自主創新。單集群2000PFlops算力、千卡訓練30天長穩率達到90%的昇騰AI云服務在華為云的烏蘭察布和貴安AI算力中心同時上線。圖表69:華為全棧核心技術資料來源:華為開發者大會2023,五礦證券研究所、生產力工具革新,釋放創造力微軟發布Copilot,提升工作效率,革新工作方式。316日,微軟發布了集成了功能的MicrosoftCopilot,提供了包括文字和圖片內容生成,歸Copilot一款基于GPT-4和MicrosoftAI辦公助手,為用戶提供了一種全新的工作方式。Copilot通過兩種方式集成至MicrosoftMicrosoftWord、Excel、PowerPoint、Outlook、PowerPlatform中的Copilot,將重復的工作流程自動化,解鎖生產力。圖表70:微軟發布Microsoft365Copilot資料來源:微軟官網,五礦證券研究所Copilot技術原理:Graph+MicrosoftMicrosoft由“Copilot系統”提供支持,利用了三種基礎技術:應用:即Word、Excel、PowerPoint、Outlook、等;MicrosoftGraph:是Microsoft365中通往數據和智能的網關,它提供統一的可編程模型,可用于訪問Microsoft365、ows10和企業移動性+安全性中的海量數據,相當于數據傳輸的通道,連結大模型和Microsoft365應用;大型語言模型Microsoft,進行上下文檢索和修正提,之后將回復傳回Microsoft,完成安全和合規性檢查后,最終傳回到Microsoft應用。Copilot能掃描MicrosoftGraph中存儲的電郵、會議、聊天內容和日歷中標注的日期和事件等所有數據,根據這些內容作出回應。這些數據可以幫助支持Copilot的大語言模型改進回答,讓回答更具體、對用戶個人更有針對性。圖表71:Microsoft365Copilot技術原理資料來源:微軟官網,五礦證券研究所Word:通過Copilot可實現文稿的快速生成和修改。幫助用戶寫作、編輯、摘要和創作文檔,能讓用戶集中精力發揮創造力,快速撰寫具有說服力的提案;可以生成摘要和提供建議以改進文檔。Excel:通過Copilot可實現海量數據可視化,幫助用戶分析和探索數據。用戶可以讓找出關鍵趨勢、提出跟進問題,并將數據可視化;還能創建簡單的假設模型,并將操作過程逐步分解,以便用戶進行修改。圖表版Word使用示例 圖表版Excel使用示例資料來源:微軟官網,五礦證券研究所 資料來源:微軟官網,五礦證券研究所PowerPoint:通過Copilot可基于文稿生成幻燈片,通過便捷指令調用編輯功能。可將Word文檔轉換為演示文稿,亦可將PowerPoint轉換為Word文檔;用戶只需給出簡短的指示,Copilot即能迅速完成幻燈片制作,讓用戶進行審查;能為文字過多幻燈片添加動畫效果,以實現專業設計效果;可以為所有幻燈片生成演講者備注,幫助用戶成為更出色的演講者。圖表版將Word文檔轉換為幻燈片 圖表版為所有幻燈片生成演講者備注資料來源:微軟官網,五礦證券研究所 資料來源:微軟官網,五礦證券研究所Outlook:通過Copilot輔助、歸納、起草電子郵件。可根據收件人或主題生成合適的語氣或建議,幫助用戶節省處理郵件時間。圖表76:Copilot版Outlook,自動管理和回復郵件資料來源:微軟官網,五礦證券研究所Teams:通過Copilot總結會議要點、追蹤待辦事項。可幫助用戶參與和組織會議,提供即將進行的會議信息、相關項目更新、組織變化等;可讓用戶跟蹤會議,從而解決時間沖突問題;中發出通知;用戶可向提出澄清問題以獲取詳細的回答和有用的背景信息。圖表版會議過程中提供議信息 圖表版會議結束后總結戶錯的內容資料來源:微軟官網,五礦證券研究所 資料來源:微軟官網,五礦證券研究所BusinessChat:通過Copilot實現全局信息視角下的交互式回答。BusinessMicrosoft365應用和用戶在日歷、郵件、聊天、文檔、會議、聯系人中的數據,能夠基于全局信息視角給予綜合性答復;能夠與用戶進行商業相關的對話,根據用戶的日常活動生成提醒和狀態更新,讓用戶隨時了解工作進展。圖表79:Copilot版BusinessChat使用示例,給予綜合性答復資料來源:微軟官網,五礦證券研究所微軟發布MicrosoftSecurityCopilot,進入網絡安全領域。2023年3月28日,微軟宣布推出人工智能產品MicrosoftSecurityCopilot,將AI技術應用于網絡安全領域,為安全專業人員提供一個有效工具。Security可深度集成到微軟的產品和工作流程中,Security與微軟的三大安全產品MicrosoftSentinel、Microsoft、Microsoft進行了集成,提供事件安全、應用程序防護、云端到本地等多維度防護。此外開創了交互式防護體驗,用戶可以通過自然語言詢問安全事件響應、威脅追蹤和安全報告,幫助企業、個人用戶緩解諸多網絡安全業務痛點。圖表80:MicrosoftSecurity的特點 圖表81:MicrosoftSecurity為微軟各安全產品賦能資料來源:微軟官網,五礦證券研究所 資料來源:微軟官網,五礦證券研究所MicrosoftSecurityCopilot的主要功能:、簡化安全流程復雜性:用戶借助Security可實現“分鐘級”自動網絡安全事件評2、深度分析、優先級排序:SecurityCopilot發現安全問題后,會借助微軟網絡安全威脅庫深度分析攻擊行為,并預

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論