2023-2028年AI服務(wù)器市場(chǎng)現(xiàn)狀與前景調(diào)研報(bào)告_第1頁
2023-2028年AI服務(wù)器市場(chǎng)現(xiàn)狀與前景調(diào)研報(bào)告_第2頁
2023-2028年AI服務(wù)器市場(chǎng)現(xiàn)狀與前景調(diào)研報(bào)告_第3頁
2023-2028年AI服務(wù)器市場(chǎng)現(xiàn)狀與前景調(diào)研報(bào)告_第4頁
2023-2028年AI服務(wù)器市場(chǎng)現(xiàn)狀與前景調(diào)研報(bào)告_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

盛世華研·2008-2010年鋼行業(yè)調(diào)研報(bào)告PAGE2服務(wù)熱線圳市盛世華研企業(yè)管理有限公司2028年AI服務(wù)器市場(chǎng)2023-2028年AI服務(wù)器市場(chǎng)現(xiàn)狀與前景調(diào)研報(bào)告報(bào)告目錄TOC\o"1-3"\u第1章人工智能服務(wù)器:算力爆發(fā)打開空間 31.1AI服務(wù)器行業(yè)概覽 41.2AI服務(wù)器綜合能力維度 51.3AI服務(wù)器全棧技術(shù)架構(gòu)圖 61.4AI服務(wù)器市場(chǎng)格局 7第2章行業(yè)競(jìng)爭(zhēng)格局趨穩(wěn),集中度有望進(jìn)一步向頭部廠商提升 82.1數(shù)據(jù)量指數(shù)級(jí)增長(zhǎng),算力增長(zhǎng)已出現(xiàn)滯后 82.2AI大模型對(duì)算力提出高要求,AI服務(wù)器需求量提升將加速 82.3行業(yè)競(jìng)爭(zhēng)格局趨于穩(wěn)定,未來集中度有望進(jìn)一步向頭部提升 9第3章2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估及對(duì)服務(wù)器的需求 113.1智能算力規(guī)模持續(xù)擴(kuò)大,算力、算法基建化成為共識(shí) 113.2人工智能城市排行榜 123.3互聯(lián)網(wǎng)、金融、政府、電信和制造等行業(yè)AI滲透度提升 143.4算力多元化發(fā)展提速,大模型加速行業(yè)落地 163.5智能算力成為數(shù)字化創(chuàng)新的源動(dòng)力 173.6中國(guó)人工智能計(jì)算力發(fā)展評(píng)估及對(duì)服務(wù)器的需求 183.7對(duì)產(chǎn)業(yè)發(fā)展的建議 19第4章國(guó)內(nèi)AI服務(wù)器進(jìn)入快速增長(zhǎng)期 204.1AI服務(wù)器和通用型區(qū)別 204.2互聯(lián)網(wǎng)廠商是國(guó)內(nèi)AI服務(wù)器主要下游 234.3國(guó)產(chǎn)服務(wù)器廠商水平位于世界前列 244.44卡/8卡GPU服務(wù)器逐步成為主流 26第5章AI服務(wù)器出貨量預(yù)測(cè)及復(fù)合增速 29第6章AI迎來“iPhone時(shí)刻”,算力需求即將迎來新高 32第7章ChatGPT對(duì)算力需求 377.1受每日用戶數(shù)量和模型參數(shù)影響,保守估計(jì)每日所需算力約為50EFLOPs 377.2華為預(yù)測(cè)未來十年人工智能算力需求將增長(zhǎng)500倍以上 41第1章人工智能服務(wù)器:算力爆發(fā)打開空間當(dāng)前機(jī)器學(xué)習(xí)和人工智能應(yīng)用對(duì)算力的要求變得越來越嚴(yán)苛,這也使得搭載GPU、FPGA等面向人工智能場(chǎng)景的服務(wù)器市場(chǎng)增長(zhǎng)迅速,成為拉動(dòng)整體服務(wù)器市場(chǎng)的重要增長(zhǎng)點(diǎn)。現(xiàn)階段的ChatGPT是在擁有3000億個(gè)單詞的語料基礎(chǔ)上預(yù)訓(xùn)練擁有1750億參數(shù)的模型,而GPT4官方資料沒有講模型參數(shù)和數(shù)據(jù)規(guī)模,沒有講任何技術(shù)原理,但GPT4模型輸入更長(zhǎng),可以處理文字輸入長(zhǎng)度增加到3.2萬個(gè)token,約25000字文本,同時(shí)智能程度大幅躍遷,可以接受圖片輸入。可以看到GPT模型在持續(xù)迭代過程中,能力持續(xù)增強(qiáng),所需要的算力需求也或?qū)⒊掷m(xù)增長(zhǎng)。AI計(jì)算在整體計(jì)算市場(chǎng)占比正逐年提高,全球增長(zhǎng)的AI計(jì)算支出50%來自中國(guó)。當(dāng)前我國(guó)AI服務(wù)器出貨市場(chǎng)整體呈現(xiàn)上揚(yáng)趨勢(shì),AI服務(wù)器作為算力基礎(chǔ)設(shè)備,其需求有望受益于AI時(shí)代下對(duì)于算力不斷提升的需求而快速增長(zhǎng)。1.1AI服務(wù)器行業(yè)概覽目前,全球AI服務(wù)器占AI基礎(chǔ)設(shè)施市場(chǎng)的84.2%以上,是AI基礎(chǔ)設(shè)施的主體。AI服務(wù)器分類方式有兩種:按應(yīng)用場(chǎng)景:AI服務(wù)器按照應(yīng)用場(chǎng)景可以分為深度學(xué)習(xí)訓(xùn)練型和智能應(yīng)用推理型。訓(xùn)練任務(wù)對(duì)服務(wù)器算力要求較高,需要訓(xùn)練型服務(wù)器提供高密度算力支持,典型產(chǎn)品有中科曙光X785-G30和華為昇騰Atlas800(型號(hào)9000、型號(hào)9010)。推理任務(wù)則是利用訓(xùn)練后的模型提供服務(wù),對(duì)算力無較高要求,典型產(chǎn)品有中科曙光X785-G40和華為昇騰Atlas800(型號(hào)3000、型號(hào)3010)。按芯片類型:AI服務(wù)器為異構(gòu)服務(wù)器,可以根據(jù)應(yīng)用范圍調(diào)整計(jì)算模塊結(jié)構(gòu),可采用CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多種加速卡等組合形式。目前,產(chǎn)品中最常見的是CPU+多塊GPU的方式。CPU+GPU/FPGA/ASIC類的異構(gòu)AI加速服務(wù)器能夠?yàn)闄C(jī)器學(xué)習(xí)、深度學(xué)習(xí)、計(jì)算機(jī)視覺、NLP、知識(shí)圖譜、智能語音等AI技術(shù)加速,支持更大規(guī)模的深度神經(jīng)網(wǎng)絡(luò)模型的同時(shí),還能提高訓(xùn)練精度,因而成為AI算力突破的新業(yè)務(wù)增長(zhǎng)點(diǎn)。根據(jù)微軟宣布,為OpenAI開發(fā)的超級(jí)計(jì)算機(jī)超過了28.5萬個(gè)CPU核心、1萬個(gè)GPU,每臺(tái)GPU服務(wù)器網(wǎng)絡(luò)連接能力為400Gbps,位列全球超級(jí)計(jì)算機(jī)前五。目前,英偉達(dá)的AI計(jì)算集群整體解決方案(如DGXA100系列)是AI集群投資的主流選擇,除此之外部分云和互聯(lián)網(wǎng)大廠選擇了CPU+FPGA+GPU+AIDSA異構(gòu)算力自己搭建AI計(jì)算中心。根據(jù)YOLE預(yù)測(cè),全球AI加速服務(wù)器滲透率將在2027年達(dá)到17.9%,AI/GPU加速服務(wù)器出貨量復(fù)合增速高達(dá)39.8%/20.3%。1.2AI服務(wù)器綜合能力維度據(jù)艾瑞和行行查數(shù)據(jù)顯示,AI服務(wù)器的綜合能力維度分成三部分:板卡芯片組配置、硬盤-網(wǎng)絡(luò)帶寬-操作系統(tǒng)、機(jī)箱結(jié)構(gòu)設(shè)計(jì)。板卡芯片組是AI服務(wù)器運(yùn)行效率的核心,主頻高、核心數(shù)多的CPU搭配小面積、高頻率、算力強(qiáng)的加速芯片,并結(jié)合互聯(lián)互通的總線與充足的內(nèi)存,才能保證更高的吞吐量、更多的并發(fā)數(shù)與更低的延遲。硬盤-網(wǎng)絡(luò)帶寬-操作系統(tǒng)是AI服務(wù)器的運(yùn)作基礎(chǔ),硬盤存儲(chǔ)空間與網(wǎng)絡(luò)帶寬的大小影響著AI應(yīng)用與用戶數(shù)據(jù)存儲(chǔ)的上限與線上接入數(shù)據(jù)的快慢,操作系統(tǒng)則影響著數(shù)據(jù)與訪問的安全性、執(zhí)行的效率與穩(wěn)定性。通用服務(wù)器一般是單路或多路CPU架構(gòu),而AI服務(wù)器需要承擔(dān)大量的AI運(yùn)算,一般配置多個(gè)GPU或其他的系統(tǒng)級(jí)芯片。而AI服務(wù)器由于對(duì)加速卡的獨(dú)特需求,需要針對(duì)性的對(duì)于系統(tǒng)結(jié)構(gòu)、散熱等做專門的設(shè)計(jì),才能滿足AI服務(wù)器需求。在助跑AI模型時(shí)會(huì)散發(fā)較多的熱量,因此AI服務(wù)器物理環(huán)境的安全穩(wěn)定、機(jī)箱的通風(fēng)散熱設(shè)計(jì)亦是需要考慮的因素。1.3AI服務(wù)器全棧技術(shù)架構(gòu)圖在全國(guó)產(chǎn)AI服務(wù)器解決方案的系統(tǒng)架構(gòu),自底向上分為四層:系統(tǒng)層:基于搭載飛騰FT-2000+/64芯片和異構(gòu)加速卡、安裝麒麟操作系統(tǒng)的基于飛騰的自主AI服務(wù)器,前期已進(jìn)行了深度的驅(qū)動(dòng)適配工作。SDK層:異構(gòu)加速的核心庫,包含了一套神經(jīng)網(wǎng)絡(luò)算子庫、Linux驅(qū)動(dòng)、運(yùn)行時(shí)程序庫和神經(jīng)網(wǎng)絡(luò)圖引擎框架等。深度學(xué)習(xí)框架和模型應(yīng)用:這一層包含了業(yè)界常用的深度學(xué)習(xí)框架和深度學(xué)習(xí)模型,按照應(yīng)用場(chǎng)景劃分,目前業(yè)界應(yīng)用基本聚焦于CV、NLP和語音等領(lǐng)域。行業(yè)解決方案:在這一層主要面向垂直行業(yè),解決客戶的實(shí)際問題,通常需要整合多個(gè)深度學(xué)習(xí)應(yīng)用場(chǎng)景,提供的是一整套完整的軟硬件解決方案。1.4AI服務(wù)器市場(chǎng)格局根據(jù)IDC數(shù)據(jù),2022年全球AI服務(wù)器市場(chǎng)規(guī)模202億美元,同比增長(zhǎng)29.8%,占服務(wù)器市場(chǎng)規(guī)模的比例為16.4%,同比提升1.2pct。2022年上半年全球AI服務(wù)器市場(chǎng)中,浪潮、戴爾、惠普、聯(lián)想、新華三分別以15.1%、14.1%、7.7%、5.6%、4.7%的市場(chǎng)份額位居前五位。IDC預(yù)計(jì)預(yù)計(jì)2026年全球AI服務(wù)器市場(chǎng)規(guī)模將達(dá)到355億美元,對(duì)應(yīng)22-26年CAGR為15.1%。2022年末,ChatGPT的火爆引發(fā)了科技巨頭對(duì)于AI算力的密集投入,這將極大促進(jìn)短期和中長(zhǎng)期AI服務(wù)器的市場(chǎng)規(guī)模擴(kuò)容,全球頭部廠商將充分受益于云廠商AI算力投資的快速增長(zhǎng)。第2章行業(yè)競(jìng)爭(zhēng)格局趨穩(wěn),集中度有望進(jìn)一步向頭部廠商提升2.1數(shù)據(jù)量指數(shù)級(jí)增長(zhǎng),算力增長(zhǎng)已出現(xiàn)滯后未來市場(chǎng)廣闊在全球數(shù)據(jù)流量迅速增長(zhǎng)以及公有云蓬勃發(fā)展的背景下,服務(wù)器作為云網(wǎng)體系中最重要的算力基礎(chǔ)設(shè)施,市場(chǎng)規(guī)模快速擴(kuò)容。根據(jù)CiscoGlobalIndex數(shù)據(jù)顯示,2016年全球數(shù)據(jù)中心流量規(guī)模為6.8ZB,到2021年規(guī)模增長(zhǎng)至20.6ZB,CAGR為25%;其中,云數(shù)據(jù)中心流量占比由87.86%上升至94.91%。根據(jù)IDC最新數(shù)據(jù)顯示,2021年全年全球服務(wù)器出貨量為1354萬臺(tái),同比增長(zhǎng)約7%,2021年服務(wù)器增速相比2019年、2020年有所提升。根據(jù)IDC最新數(shù)據(jù)顯示,2021年全年中國(guó)服務(wù)器出貨量為391萬臺(tái),同比提升8.4%,實(shí)現(xiàn)較高增速增長(zhǎng),實(shí)現(xiàn)出貨額250.9億美元(約合人民幣1723億元,略高于預(yù)期),同比增長(zhǎng)12.7%;中國(guó)服務(wù)器出貨金額預(yù)計(jì)到2025年將達(dá)到2687億元,增速保持在10%-12%水平。2.2AI大模型對(duì)算力提出高要求,AI服務(wù)器需求量提升將加速AI大模型對(duì)算力的需求高于摩爾定律迭代速度,服務(wù)器需求量將提升。根據(jù)OpenAI測(cè)算,自2012年來,頭部AI模型訓(xùn)練算力每3-4個(gè)月翻一番,訓(xùn)練算力增長(zhǎng)幅度高達(dá)10倍。而摩爾定律放緩成為不爭(zhēng)的事實(shí),但數(shù)據(jù)量卻在持續(xù)增加,算力增速已出現(xiàn)明顯滯后,AI服務(wù)器行業(yè)未來成長(zhǎng)空間廣闊。“新摩爾定律”(圖靈獎(jiǎng)獲得者JimGray)提出:每18個(gè)月全球新增信息量是計(jì)算機(jī)有史以來全部信息量的總和。從產(chǎn)業(yè)需求來看,數(shù)據(jù)量與算力需求之間為循環(huán)加強(qiáng)關(guān)系,數(shù)據(jù)量的不斷增加要求更強(qiáng)的算力處理數(shù)據(jù),同時(shí)為人工智能等新技術(shù)不斷訓(xùn)練、應(yīng)用提供數(shù)據(jù)基礎(chǔ),這些技術(shù)的落地應(yīng)用又將產(chǎn)生多數(shù)據(jù)、反過對(duì)算力又提出巨大需求。AI服務(wù)器迎來增量市場(chǎng),相對(duì)傳統(tǒng)服務(wù)器,AI服務(wù)器價(jià)格更高,公司量?jī)r(jià)雙升,作為龍頭,收入有保障。根據(jù)IDC預(yù)測(cè),2021年中國(guó)智能算力規(guī)模達(dá)155.2每秒百億億次浮點(diǎn)運(yùn)算(EFLOPS),2022年智能算力規(guī)模將達(dá)到268.0EFLOPS,預(yù)計(jì)到2026年智能算力規(guī)模將進(jìn)入每秒十萬億億次浮點(diǎn)計(jì)算(ZFLOPS)級(jí)別,達(dá)到1,271.4EFLOPS;2021年,中國(guó)AI服務(wù)器市場(chǎng)規(guī)模為57億美元,同比增長(zhǎng)61.6%,預(yù)計(jì)到2025年,市場(chǎng)規(guī)模將增長(zhǎng)至109億美元,2021-2025年CAGR為17.5%。價(jià)格方面,根據(jù)測(cè)算,普通服務(wù)器均價(jià)大概為4-5萬元,AI服務(wù)器則在幾萬到幾十萬不等,根據(jù)客戶具體需求定價(jià)不同,整體遠(yuǎn)高于普通服務(wù)器價(jià)格。此外,AI服務(wù)器毛利率相對(duì)普通服務(wù)器毛利率較高。2.3行業(yè)競(jìng)爭(zhēng)格局趨于穩(wěn)定,未來集中度有望進(jìn)一步向頭部提升全球服務(wù)器市場(chǎng)方面,市場(chǎng)格局趨于穩(wěn)定,戴爾、新華三、浪潮、聯(lián)想占據(jù)主要市場(chǎng)份額。根據(jù)IDC數(shù)據(jù)顯示,從銷售收入角度,2021年Q2全球服務(wù)器市占率排名前五的分別為新華三、戴爾、浪潮、聯(lián)想,市占率分別為15.7%、15.6%、9.4%、7.0%、26.7%;從出貨量角度,2021年Q2全球服務(wù)器市占率排名前四的為戴爾、新華三、浪潮、聯(lián)想,市占率分別為16.4%、13.8%、10.1%、6.2%。但總體來看,自2018年至2021Q2,競(jìng)爭(zhēng)格局未發(fā)生重大變動(dòng)。另一方面,服務(wù)器行業(yè)進(jìn)入壁壘高,成本控制能力極為關(guān)鍵,中長(zhǎng)期內(nèi)全球服務(wù)器市場(chǎng)格局出現(xiàn)大幅變動(dòng)概率較低。服務(wù)器上游的核心元器件為芯片,芯片行業(yè)的壟斷程度非常高,上游供貨商議價(jià)權(quán)極大,下游互聯(lián)網(wǎng)巨頭瘋狂購買服務(wù)器建造新型數(shù)據(jù)中心,客戶集中度上升,客戶議價(jià)能力大大提高,上下游的雙重壓力下,服務(wù)器廠商的毛利潤(rùn)率也相應(yīng)減少。從全球主要服務(wù)器廠商的毛利率情況來看,其毛利潤(rùn)水平與其市場(chǎng)份額也呈現(xiàn)出一致性。國(guó)內(nèi)服務(wù)器市場(chǎng)份額不斷向頭部企業(yè)集中,未來集中度有望進(jìn)一步提升。以戴爾、惠普等為代表的海外服務(wù)器品牌在國(guó)內(nèi)市場(chǎng)的普及度較高,主要集中在高端服務(wù)器市場(chǎng)。伴隨著云計(jì)算時(shí)代的到來,國(guó)內(nèi)的專業(yè)服務(wù)器廠商加速技術(shù)創(chuàng)新,實(shí)現(xiàn)向高端市場(chǎng)的滲透,嚴(yán)重?cái)D壓海外服務(wù)器廠商在中國(guó)服務(wù)器市場(chǎng)的份額及發(fā)展空間。根據(jù)IDC最新數(shù)據(jù)顯示,2021年中國(guó)服務(wù)器市場(chǎng)市占率排名前五的分別為浪潮、新華三、華為、戴爾、聯(lián)想,市占率分別為30.5、16.8%、11.2%、8.4%、8.0%。第3章2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估及對(duì)服務(wù)器的需求IDC與浪潮信息聯(lián)合發(fā)布《2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》(以下簡(jiǎn)稱《報(bào)告》)。《報(bào)告》指出,中國(guó)人工智能計(jì)算力繼續(xù)保持快速增長(zhǎng),2022年智能算力規(guī)模達(dá)到268百億億次/秒(EFLOPS),超過通用算力規(guī)模。預(yù)計(jì)未來5年中國(guó)智能算力規(guī)模的年復(fù)合增長(zhǎng)率將達(dá)52.3%。《報(bào)告》從人工智能計(jì)算力產(chǎn)業(yè)發(fā)展趨勢(shì)、區(qū)域算力分布和行業(yè)滲透度等維度進(jìn)行全面評(píng)估,旨在科學(xué)描繪中國(guó)人工智能發(fā)展的階段和整體情況,為推動(dòng)數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)的融合提供極具價(jià)值的參考依據(jù)和行動(dòng)建議。3.1智能算力規(guī)模持續(xù)擴(kuò)大,算力、算法基建化成為共識(shí)智能算力對(duì)于提升國(guó)家、區(qū)域經(jīng)濟(jì)核心競(jìng)爭(zhēng)力的重要作用已經(jīng)成為業(yè)界共識(shí)。隨著“東數(shù)西算”工程的啟動(dòng)以及智能計(jì)算中心的建設(shè),從國(guó)家層面實(shí)現(xiàn)有效的資源結(jié)構(gòu)整合,助力產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,構(gòu)建更為健全的算力、算法基礎(chǔ)設(shè)施。目前,國(guó)家在8地啟動(dòng)建設(shè)國(guó)家算力樞紐節(jié)點(diǎn),并規(guī)劃了10個(gè)國(guó)家數(shù)據(jù)中心集群,協(xié)調(diào)區(qū)域平衡化發(fā)展,推進(jìn)集約化、綠色節(jié)能、安全穩(wěn)定的算力基礎(chǔ)設(shè)施的建設(shè)。中國(guó)智能算力規(guī)模及預(yù)測(cè),2019-2026IDC預(yù)測(cè),中國(guó)智能算力規(guī)模將持續(xù)高速增長(zhǎng),預(yù)計(jì)到2026年中國(guó)智能算力規(guī)模將達(dá)到1271.4EFLOPS,未來五年復(fù)合增長(zhǎng)率達(dá)52.3%,同期通用算力規(guī)模的復(fù)合增長(zhǎng)率為18.5%。3.2人工智能城市排行榜《報(bào)告》針對(duì)不同城市在人工智能投資規(guī)模、相關(guān)政策支持力度、政策落地情況和實(shí)施進(jìn)展、人工智能技術(shù)成熟度,以及勞動(dòng)供給等維度的情況,對(duì)中國(guó)城市人工智能發(fā)展進(jìn)行綜合評(píng)估。在2022年中國(guó)人工智能城市排行榜中,北京、杭州、深圳繼續(xù)保持前三名,上海和廣州分列第四、五名,其中北京連續(xù)四年蟬聯(lián)首位,天津首次進(jìn)入前十,成都、蘇州、南京、濟(jì)南保持前十。綜合TOP10城市發(fā)展情況,頭部城市的共性特征是,較早的政策引導(dǎo)和配套政策保障,充分的智算基礎(chǔ)設(shè)施規(guī)劃、投入,達(dá)到上百家AI企業(yè)集聚、十萬級(jí)人才保障,千億級(jí)AI產(chǎn)業(yè)集群規(guī)模。近五年人工智能TOP10城市排名變化城市智能算力的投入已經(jīng)成為推動(dòng)區(qū)域數(shù)字經(jīng)濟(jì)發(fā)展,加速人工智能產(chǎn)業(yè)創(chuàng)新的重要支撐,除了TOP10城市之外,合肥、武漢、長(zhǎng)沙等多個(gè)城市在自身產(chǎn)業(yè)優(yōu)勢(shì)及各種因素推動(dòng)下,人工智能應(yīng)用也取得了較大進(jìn)展。此外,一些城市深耕特定的人工智能應(yīng)用并取得了明顯成果,成為城市智能化新標(biāo)簽,如安徽宿州淮海智算中心、浙江青田元宇宙智算中心陸續(xù)投建。3.3互聯(lián)網(wǎng)、金融、政府、電信和制造等行業(yè)AI滲透度提升從行業(yè)維度看,2022年中國(guó)人工智能行業(yè)應(yīng)用滲透度排名前五的行業(yè)依次為互聯(lián)網(wǎng)、金融、政府、電信和制造。與21年相比,行業(yè)AI滲透度明顯提升。其中,互聯(lián)網(wǎng)行業(yè)依然是人工智能應(yīng)用滲透度和投資最高的行業(yè);金融行業(yè)的人工智能滲透度從2021年的55提升到62,智能客服、實(shí)體機(jī)器人、智慧網(wǎng)點(diǎn)、云上網(wǎng)點(diǎn)等成為人工智能在金融行業(yè)的應(yīng)用典型;電信行業(yè)的人工智能滲透度從2021年的45增長(zhǎng)到51,人工智能技術(shù)融入電信網(wǎng)絡(luò)的構(gòu)建、優(yōu)化,并為下一代智慧網(wǎng)絡(luò)建設(shè)提供支撐;制造行業(yè)的人工智能滲透度從40增長(zhǎng)到45,預(yù)計(jì)到2023年年底,中國(guó)50%的制造業(yè)供應(yīng)鏈環(huán)節(jié)將采用人工智能。中國(guó)人工智能行業(yè)滲透度,2022vs2021從場(chǎng)景應(yīng)用維度看,智能化場(chǎng)景在行業(yè)的落地隨著時(shí)間的推移,正呈現(xiàn)出更加深入、更加廣泛的趨勢(shì)。人工智能持續(xù)為提升用戶體驗(yàn)做出貢獻(xiàn),當(dāng)前諸如智能客服、智能推薦、精準(zhǔn)營(yíng)銷等場(chǎng)景深入落地到各行業(yè);人工智能也在精準(zhǔn)科學(xué)防疫,加強(qiáng)公共衛(wèi)生安全體系建設(shè)中承擔(dān)重要角色,在病毒演變預(yù)測(cè)、疫苗藥物研發(fā)、輔助診斷等維度實(shí)現(xiàn)廣泛應(yīng)用;長(zhǎng)期來看,企業(yè)通過在數(shù)字人等數(shù)字化營(yíng)銷內(nèi)容創(chuàng)作領(lǐng)域布局,創(chuàng)造差異化的營(yíng)銷體驗(yàn),升級(jí)品牌形象;另外,科學(xué)家們?cè)絹碓蕉嗟乩萌斯ぶ悄芗夹g(shù)和方法,從數(shù)據(jù)中建立模型,重點(diǎn)圍繞新藥創(chuàng)制、基因研究、新材料研發(fā)等領(lǐng)域加速對(duì)前沿科學(xué)問題的探究。3.4算力多元化發(fā)展提速,大模型加速行業(yè)落地《報(bào)告》從算力層面,對(duì)人工智能芯片、服務(wù)器、計(jì)算架構(gòu)、算法及應(yīng)用等方面的發(fā)展近況進(jìn)行了全面分析。從整體看AI服務(wù)器是人工智能市場(chǎng)增長(zhǎng)的主力軍。IDC數(shù)據(jù)顯示,2021年全球人工智能服務(wù)器市場(chǎng)的同比增速為39.1%,超過全球整體人工智能市場(chǎng)增速(20.9%),是整體人工智能市場(chǎng)增長(zhǎng)的推動(dòng)力。中國(guó)AI服務(wù)器市場(chǎng)領(lǐng)跑全球,2021年人工智能服務(wù)器市場(chǎng)規(guī)模59.2億美元,與2020年相比增長(zhǎng)68.2%,預(yù)計(jì)到2026年,中國(guó)人工智能服務(wù)器市場(chǎng)將達(dá)到123.4億美元。從人工智能芯片角度,人工智能產(chǎn)業(yè)技術(shù)不斷提升,產(chǎn)業(yè)AI化加速落地,推動(dòng)全球人工智能芯片市場(chǎng)高速增長(zhǎng)。IDC預(yù)計(jì),到2025年人工智能芯片市場(chǎng)規(guī)模將達(dá)726億美元。異構(gòu)計(jì)算成為主流趨勢(shì),未來18個(gè)月全球人工智能服務(wù)器GPU、ASIC和FPGA的搭載率均會(huì)上升,算力多元化發(fā)展趨勢(shì)明顯。從計(jì)算架構(gòu)發(fā)展來看,基于DSA(Domain-SpecificArchitectures)思想設(shè)計(jì)的人工智能芯片正在成為主導(dǎo),推動(dòng)了人工智能芯片多元化發(fā)展。多元算力從“能用”到“好用”并且為企業(yè)創(chuàng)造業(yè)務(wù)價(jià)值,離不開通用性強(qiáng)、綠色高效、安全可靠的計(jì)算系統(tǒng)的支持。業(yè)內(nèi)正在推動(dòng)多元算力系統(tǒng)架構(gòu)創(chuàng)新,基于計(jì)算節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間的互聯(lián)技術(shù)破局現(xiàn)有計(jì)算架構(gòu)的瓶頸,通過充分調(diào)動(dòng)起多芯片、多板卡、多節(jié)點(diǎn)的系統(tǒng)級(jí)能力,實(shí)現(xiàn)各種加速單元以及跨節(jié)點(diǎn)系統(tǒng)的高效協(xié)同,提升計(jì)算性能。《報(bào)告》對(duì)于大模型的行業(yè)落地和發(fā)展情況也進(jìn)行了分析。IDC調(diào)研顯示,未來超過80%的組織會(huì)優(yōu)先考慮購買預(yù)先訓(xùn)練好的人工智能模型。大模型是智算力驅(qū)動(dòng)下典型的重大創(chuàng)新,被認(rèn)為是“通用智能”的雛形,是業(yè)內(nèi)探索實(shí)現(xiàn)普惠人工智能的重要途徑之一。大模型發(fā)展的背后是龐大的算力支撐,例如AI+Science領(lǐng)域的AlphaFold2、自動(dòng)駕駛系統(tǒng)、GPT-3等模型訓(xùn)練需要幾百甚至幾千PD(PetaFlops/s-day,PD)的算力當(dāng)量支持。2022年,大模型正在成為AIGC領(lǐng)域發(fā)展的算法引擎,文生圖、虛擬數(shù)字人等AIGC類應(yīng)用將快速進(jìn)入到商業(yè)化階段,并為元宇宙內(nèi)容生產(chǎn)帶來巨大的變革。3.5智能算力成為數(shù)字化創(chuàng)新的源動(dòng)力人工智能算力的增長(zhǎng)為人工智能的持續(xù)創(chuàng)新發(fā)展提供支撐。宏觀層面,人工智能算力為國(guó)家創(chuàng)新力的發(fā)展帶來實(shí)質(zhì)性推進(jìn),不僅在應(yīng)用科學(xué)的突破上發(fā)揮了重要作用,也開始滲透到基礎(chǔ)科學(xué)領(lǐng)域,極大提高了科學(xué)研究的效率和科學(xué)發(fā)展的進(jìn)程。《報(bào)告》指出,人工智能應(yīng)用正在從單點(diǎn)技術(shù)到多種技術(shù)能力融合方向發(fā)展、從事后分析向事前預(yù)判和主動(dòng)執(zhí)行方向發(fā)展、從計(jì)算智能和感知智能向認(rèn)知智能和決策智能方向發(fā)展,創(chuàng)新應(yīng)用場(chǎng)景逐步增多。未來五年,隨著人機(jī)交互、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、語音識(shí)別技術(shù)的成熟,人工智能將在企業(yè)市場(chǎng)中加快應(yīng)用與落地,智能算力將成為未來創(chuàng)新的核心推動(dòng)力。3.6中國(guó)人工智能計(jì)算力發(fā)展評(píng)估及對(duì)服務(wù)器的需求伴隨數(shù)字經(jīng)濟(jì)的持續(xù)發(fā)展,以及諸如新冠肺炎疫情等突發(fā)事件的影響,企業(yè)積極打造敏捷反應(yīng)機(jī)制,推進(jìn)精益化管理,提升組織創(chuàng)新能力,以期在變革中發(fā)現(xiàn)新的賽道甚至實(shí)現(xiàn)彎道超車,實(shí)現(xiàn)數(shù)字時(shí)代中的自身發(fā)展。為滿足企業(yè)內(nèi)部發(fā)展需求和外部市場(chǎng)需求,企業(yè)一直大力投資數(shù)字化轉(zhuǎn)型相關(guān)技術(shù),特別是在人工智能領(lǐng)域。人工智能支出已經(jīng)成為支持企業(yè)數(shù)字化轉(zhuǎn)型支出的主力之一。IDC數(shù)據(jù)統(tǒng)計(jì),全球范圍內(nèi),企業(yè)在包括硬件、軟件和服務(wù)在內(nèi)的人工智能(AI)市場(chǎng)的技術(shù)投資從2019年的612.4億美元增長(zhǎng)至2021年的924.0億美元,預(yù)計(jì)將在2022年(同比)增長(zhǎng)26.6%至1,170.0億美元,并有望到2025年突破2,000億美元,增幅高于企業(yè)數(shù)字化轉(zhuǎn)型(DX)支出整體增幅。服務(wù)器:中國(guó)市場(chǎng)領(lǐng)跑全球,綠色節(jié)能引領(lǐng)未來人工智能服務(wù)器仍是人工智能市場(chǎng)增長(zhǎng)的主力軍。IDC認(rèn)為企業(yè)將更多地使用人工智能服務(wù)器處理推理工作負(fù)載。伴隨企業(yè)人工智能應(yīng)用成熟度逐步遞增,企業(yè)將把精力更多從人工智能訓(xùn)練轉(zhuǎn)移到人工智能推理工作負(fù)載上,這意味著人工智能模型將逐步進(jìn)入廣泛投產(chǎn)模式,這將對(duì)企業(yè)的人工智能基礎(chǔ)設(shè)施規(guī)劃帶來影響,企業(yè)需要更好地制定運(yùn)營(yíng)支出規(guī)劃,提升服務(wù)器利用率。據(jù)IDC數(shù)據(jù),2021年中國(guó)數(shù)據(jù)中心用于推理的服務(wù)器的市場(chǎng)份額占比已經(jīng)過半,達(dá)到57.6%,預(yù)計(jì)到2026年,用于推理的工作負(fù)載將達(dá)到62.2%。算力發(fā)展評(píng)估行業(yè)排名總體來看,人工智能在各個(gè)行業(yè)的應(yīng)用程度都呈現(xiàn)不斷加深的趨勢(shì),應(yīng)用場(chǎng)景也越來越廣泛,人工智能已經(jīng)成為了企業(yè)尋求業(yè)務(wù)增長(zhǎng)點(diǎn)、提升用戶體驗(yàn)、保持核心競(jìng)爭(zhēng)力的重要途徑。人工智能行業(yè)應(yīng)用滲透度排名TOP5的行業(yè)依次為互聯(lián)網(wǎng)、金融、政府、電信和制造。其中金融和電信行業(yè)人工智能應(yīng)用增長(zhǎng)速度較為明顯,對(duì)人工智能基礎(chǔ)架構(gòu)的投入增長(zhǎng)也較為突出。2022年中國(guó)人工智能行業(yè)應(yīng)用滲透度分布如下圖所示:3.7對(duì)產(chǎn)業(yè)發(fā)展的建議1加速自身研發(fā)能力的提升技術(shù)提供商和行業(yè)用戶應(yīng)該堅(jiān)持更加開放和深入的合作,共同推進(jìn)人工智能應(yīng)用的發(fā)展。2各地區(qū)應(yīng)挖掘自身特點(diǎn)和優(yōu)勢(shì),因勢(shì)利導(dǎo)各個(gè)城市和區(qū)域具有不同的環(huán)境、地理位置,以及各自的產(chǎn)業(yè)優(yōu)勢(shì),可以此為基礎(chǔ),探索具有自身特色的發(fā)展路徑,并給其他城市提供借鑒,共同推動(dòng)人工智能產(chǎn)業(yè)在中國(guó)的發(fā)展。3各方協(xié)作推進(jìn)綠色發(fā)展為滿足人工智能應(yīng)用可持續(xù)性發(fā)展的需求,綠色低碳的AI算力基礎(chǔ)設(shè)施是未來發(fā)展方向。第4章國(guó)內(nèi)AI服務(wù)器進(jìn)入快速增長(zhǎng)期4.1AI服務(wù)器和通用型區(qū)別AI服務(wù)器和通用型區(qū)別主要在于:1)硬件架構(gòu):AI服務(wù)器是采用異構(gòu)形式的服務(wù)器,根據(jù)應(yīng)用的范圍采用不同的組合方式,如CPU+GPU、CPU+TPU、CPU+其他的加速卡等。與普通的服務(wù)器的差別主要在大數(shù)據(jù)及云計(jì)算、人工智能等方面需要更大的內(nèi)外存。2)卡的數(shù)量:普通的GPU服務(wù)器一般是單卡或者雙卡,AI服務(wù)器需要承擔(dān)大量的計(jì)算,一般配置四塊GPU卡以上,甚至要搭建AI服務(wù)器集群。3)獨(dú)特設(shè)計(jì):AI服務(wù)器由于有了多個(gè)GPU卡,需要針對(duì)性的對(duì)于系統(tǒng)結(jié)構(gòu)、散熱、拓?fù)涞茸鰧iT的設(shè)計(jì),才能滿足AI服務(wù)器長(zhǎng)期穩(wěn)定運(yùn)行的要求。隨著國(guó)內(nèi)數(shù)字基礎(chǔ)建設(shè)數(shù)據(jù)負(fù)載量的需求量不斷上升,我國(guó)AI服務(wù)器市場(chǎng)保持較快增速。根據(jù)IDC數(shù)據(jù),2022年大陸AI服務(wù)器出貨量達(dá)28.4萬臺(tái),預(yù)計(jì)到2027年達(dá)到65萬臺(tái),CAGR為17.9%,按金額計(jì)算,2022年大陸AI服務(wù)器銷售額為72.55億美元,預(yù)計(jì)到2027年銷售額將達(dá)到163.99億美元,CAGR為17.7%。圖表:2019-2027年大陸AI服務(wù)器出貨量來源:IDC,中泰證券研究所圖表:2019-2027年大陸AI服務(wù)器銷售額來源:IDC,中泰證券研究所4.2互聯(lián)網(wǎng)廠商是國(guó)內(nèi)AI服務(wù)器主要下游AI服務(wù)器下游主要由互聯(lián)網(wǎng)和運(yùn)營(yíng)商占據(jù)主導(dǎo)。根據(jù)IDC數(shù)據(jù),2022年中國(guó)AI服務(wù)器市場(chǎng)按銷售額統(tǒng)計(jì),互聯(lián)網(wǎng)廠商占據(jù)47.5%,運(yùn)營(yíng)商占比19.6%,其次通信、政府、制造、教育、金融分別占據(jù)8.6%、6.3%、5.1%、5%、3.8%。圖表:2022中國(guó)加速服務(wù)器市場(chǎng)份額(按銷售額)來源:智通財(cái)經(jīng),Counterpoint,IDC,芯八哥圖表:2022中國(guó)加速服務(wù)器市場(chǎng)份額(按出貨量)來源:智通財(cái)經(jīng),Counterpoint,IDC,芯八哥4.3國(guó)產(chǎn)服務(wù)器廠商水平位于世界前列中國(guó)在AI服務(wù)器水平位于世界前列。AI服務(wù)器采用CPU+加速芯片的架構(gòu)形式,在進(jìn)行模型的訓(xùn)練和推斷時(shí)會(huì)更具有效率優(yōu)勢(shì)。與國(guó)外AI芯片廠商的壟斷局面不同,中國(guó)AI服務(wù)器水平位于世界前列。據(jù)IDC數(shù)據(jù),2022年中國(guó)AI服務(wù)器市場(chǎng)(按銷售額),浪潮以46.6%份額占據(jù)首位,新華三、寧暢分別以11%和9%占據(jù)第二、第三名。圖表:2022年中國(guó)AI加速服務(wù)器市場(chǎng)份額(按出貨量)來源:智通財(cái)經(jīng),Counterpoint,IDC,芯八哥圖表:2022年中國(guó)AI加速服務(wù)器市場(chǎng)份額(按銷售額)來源:智通財(cái)經(jīng),Counterpoint,IDC,芯八哥4.44卡/8卡GPU服務(wù)器逐步成為主流技術(shù)升級(jí)推動(dòng)行業(yè)進(jìn)步:服務(wù)器的升級(jí)迭代依賴于CPU、GPU、存儲(chǔ)介質(zhì)和網(wǎng)絡(luò)接口等上游核心組件在性能上的提升。近年來,部分企業(yè)正積極提高自身服務(wù)器的性能,如浪潮服務(wù)器在設(shè)計(jì)上實(shí)現(xiàn)了多項(xiàng)技術(shù)創(chuàng)新和升級(jí),可支持3組或4組CPUXGMI靈活互聯(lián)配置;戴爾新一代DellPowerEdge服務(wù)器,提供了比PERC11高2倍、比PERC10高4倍的性能。隨大數(shù)據(jù)需求增長(zhǎng),4卡和8卡的AI加速服務(wù)器成為大客戶的主流。云計(jì)算帶動(dòng)AI訓(xùn)練推理需求增長(zhǎng),22H1,A100的出貨量表現(xiàn)突出,占據(jù)GPU服務(wù)器市場(chǎng)的44%,隨大模型推出后下游需求火熱,8卡高端GPU服務(wù)器份額有望持續(xù)增長(zhǎng)。圖表:2022中國(guó)加速服務(wù)器市場(chǎng)份額(按銷售額)(單位:百萬美元)來源:智通財(cái)經(jīng),Counterpoint,IDC,芯八哥,中泰證券研究所圖表:各品牌AI加速服務(wù)器增長(zhǎng)率(出貨量,2022/2021)來源:智通財(cái)經(jīng),Counterpoint,IDC,芯八哥,中泰證券研究所英偉達(dá)占據(jù)AI服務(wù)器市場(chǎng)主要地位第5章AI服務(wù)器出貨量預(yù)測(cè)及復(fù)合增速根據(jù)中商產(chǎn)業(yè)研究院數(shù)據(jù),2021年全球服務(wù)器出貨量達(dá)1315萬臺(tái),同比增長(zhǎng)7.8%,對(duì)應(yīng)全球市場(chǎng)規(guī)模達(dá)995億美元。根據(jù)Counterpoint預(yù)計(jì),2022年全球服務(wù)器市場(chǎng)規(guī)模有望達(dá)到1117億美元,同比增長(zhǎng)17.0%。預(yù)計(jì)云服務(wù)提供商數(shù)據(jù)中心擴(kuò)張?jiān)鲩L(zhǎng)驅(qū)動(dòng)力主要來自于汽車、5G、云游戲和高性能計(jì)算。圖表:全球服務(wù)器出貨量(萬臺(tái))及增速(%)資料來源:Wind,中商產(chǎn)業(yè)研究院,國(guó)盛證券研究所圖表:全球服務(wù)器市場(chǎng)規(guī)模預(yù)測(cè)(億美元)同比(%)資料來源:Counterpoint,國(guó)盛證券研究所AI服務(wù)器滲透率依舊較低,增長(zhǎng)空間巨大。根據(jù)TrendForce數(shù)據(jù),截止2022年全球搭載GPGPU的AI服務(wù)器(推理)出貨量占整體服務(wù)器比重約1%,同時(shí)TrendForce預(yù)測(cè)2023年伴隨AI相關(guān)應(yīng)用加持,年出貨量增速達(dá)到8%,2022~2026年CAGR為10.8%。根據(jù)TrendForce數(shù)據(jù),2022年全球AI服務(wù)器采購中,Microsoft、Google、Meta、AWS為前四大采購商,合計(jì)占比66.2%。中國(guó)地區(qū)ByteDance(字節(jié)跳動(dòng))采購比例最高,達(dá)到6.2%。圖表:AI服務(wù)器(推理)出貨量預(yù)測(cè)及復(fù)合增速(千臺(tái),%)圖表:2022年采購AI服務(wù)器占比(%)第6章AI迎來“iPhone時(shí)刻”,算力需求即將迎來新高“我們正處于AI的iPhone時(shí)刻。”北京時(shí)間3月21日23點(diǎn),GTC大會(huì)正式召開,英偉達(dá)CEO黃仁勛搬出了為ChatGPT準(zhǔn)備的芯片HGXA100。“現(xiàn)在一臺(tái)搭載四對(duì)H100和雙NVLINK的標(biāo)準(zhǔn)服務(wù)器速度能快10倍,可以將大語言模型的處理成本降低一個(gè)數(shù)量級(jí)。”黃仁勛說道。3月24日Chatgpt宣布推出插件功能,構(gòu)造AI“應(yīng)用商店”。可以預(yù)見的是,如果進(jìn)展順利,ChatGPT有望從一個(gè)AI工具升級(jí)為開發(fā)者平臺(tái),借助無數(shù)開發(fā)者之手,基于GPT大模型的強(qiáng)化版AIGC工具將不斷涌現(xiàn),同時(shí)進(jìn)一步激發(fā)下游應(yīng)用的需求和創(chuàng)新。算力需求快速增長(zhǎng),AI服務(wù)器潛在市場(chǎng)廣闊預(yù)訓(xùn)練模型與參數(shù)的提升,帶動(dòng)服務(wù)器基礎(chǔ)設(shè)施需求大幅增加。人工智能的模型自2012年AlexNet問世以來,模型的深度和廣度一直在逐級(jí)擴(kuò)升,以2018年的時(shí)候BERT-Large(基于BERT和transformer結(jié)構(gòu)的模型)產(chǎn)生之后,興起了一波模型規(guī)模和參數(shù)激增的熱潮。從BERT模型出現(xiàn)到GPT-31750億參數(shù)規(guī)模的千億級(jí)大模型,大規(guī)模預(yù)訓(xùn)練模型成了一個(gè)新的技術(shù)發(fā)展趨勢(shì)。根據(jù)CNBC報(bào)道,以微軟Bing為例,基于OpenAI的ChatGPT模型或需要8個(gè)GPU才能在不到一秒的時(shí)間內(nèi)響應(yīng)問題,按照這個(gè)速度測(cè)算需要超2萬臺(tái)8-GPU服務(wù)器,按照NvidiaDGXA100(八個(gè)A100GPU協(xié)同工作的系統(tǒng))建議售價(jià)近2萬美元測(cè)算,需要40億美元的基礎(chǔ)設(shè)施支出。圖:NLP模型參數(shù)呈指數(shù)級(jí)增長(zhǎng)資料來源:Nvidia官網(wǎng)、天風(fēng)證券研究所2030年全球算力需求較2021年增長(zhǎng)90倍。根據(jù)國(guó)家數(shù)據(jù)資源調(diào)查報(bào)告數(shù)據(jù),2021年全球數(shù)據(jù)總產(chǎn)量67ZB,近三年平均增速超過26%。經(jīng)中國(guó)信息通信研究院測(cè)算,2021年全球計(jì)算設(shè)備算力總規(guī)模達(dá)到615EFlops,增速達(dá)到44%,其中基礎(chǔ)算力規(guī)模(FP32)為369EFlops,智力算力規(guī)模(換算為FP32)為232EFlops,超算算力規(guī)模(換算為FP32)為14EFlops。結(jié)合華為GIV預(yù)測(cè),2030年人類將迎來YB數(shù)據(jù)時(shí)代,全球算力規(guī)模達(dá)到56ZFlops,平均年增速達(dá)到65%,其中基礎(chǔ)算力達(dá)到3.3ZFlops,平均年增速達(dá)27%;智能算力達(dá)到52.5ZFlops,平均年增速超過80%;超算算力達(dá)到0.2ZFlops,平均年增速超過34%。圖:全球算力需求情況及預(yù)測(cè)資料來源:中國(guó)信通院、天風(fēng)證券研究所我們認(rèn)為基于下述假設(shè),GPT目前在服務(wù)器上花費(fèi)的成本至少為3.47億美元。首先,我們參考馬里蘭州AI方向的副教授TomGoldstein及財(cái)經(jīng)十一人公眾號(hào)的估計(jì),①假設(shè)1個(gè)服務(wù)器由2個(gè)CPU、8個(gè)GPU(A100,80G內(nèi)存)、DRAM與其它組件組成,這個(gè)服務(wù)器可以使用ChatGPTAI模型每秒生成15-20個(gè)單詞,我們?nèi)?0個(gè)單詞/秒,那么每臺(tái)服務(wù)器每天可以生成172.8(=20×60×60×24/10000)萬個(gè)單詞。根據(jù)SimilarWeb數(shù)據(jù),2023年1月,ChatGPT的網(wǎng)站平均每天有超過1300萬用戶使用,②假設(shè)日活量(DAU)為1000萬,如果每個(gè)人對(duì)話過程中只使用500個(gè)單詞,那么每天ChatGPT至少需要生產(chǎn)50億單詞(=1000×500萬,這里需要注意的是,1000萬人使用時(shí)間實(shí)際上并不是均勻分布的,因此現(xiàn)實(shí)中ChatGPT每天可生成單詞預(yù)計(jì)比50億單詞高)。基于以上分析,ChatGPT至少需要2894個(gè)服務(wù)器,即5788個(gè)CPU、23152個(gè)GPU。參考行行查給出的服務(wù)器成本構(gòu)成以及Thinkmate給出的A100GPU報(bào)價(jià),③CPU單價(jià)取$5000,GPU單價(jià)取$11500(考慮公司戰(zhàn)略合作及貿(mào)易成本,取價(jià)比Thinkmate報(bào)價(jià)略低),DRAM取$8000,加上其他組件,一個(gè)服務(wù)器總價(jià)為$120000。綜合上述假設(shè),服務(wù)器總成本為3.47億美元,CPU、GPU、DRAM分別為0.29、2.66、0.23億美元。算力需求推升AI基建產(chǎn)值。隨著人工智能技術(shù)的不斷發(fā)展,基于深度學(xué)習(xí)和大規(guī)模神經(jīng)網(wǎng)絡(luò)的大語言模型(LLM)正在成為一個(gè)新的熱點(diǎn)研究領(lǐng)域。然而,LLM的實(shí)用價(jià)值需要強(qiáng)大的計(jì)算資源來支持。基于大規(guī)模神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理需要海量的數(shù)據(jù)、高度優(yōu)化的算法和大規(guī)模的計(jì)算資源支持。隨著參與大模型訓(xùn)練公司增加和生成式AI應(yīng)用的拓展,AI服務(wù)器需求或?qū)⒓铀籴尫拧D:全球服務(wù)器出貨趨勢(shì)資料來源:IDC、工業(yè)富聯(lián)年報(bào),天風(fēng)證券研究所表:AI服務(wù)器產(chǎn)值測(cè)算資料來源:IDC、工業(yè)富聯(lián)年報(bào)、Nvidia英偉達(dá)企業(yè)解決方案公眾號(hào)、天風(fēng)證券研究所(假設(shè)每年出貨1,500萬臺(tái)服務(wù)器,AI服務(wù)器平均售價(jià)20萬美元)第7章ChatGPT對(duì)算力需求7.1受每日用戶數(shù)量和模型參數(shù)影響,保守估計(jì)每日所需算力約為50EFLOPs隨著ChatGPT模型的不斷升級(jí),其參數(shù)量和模型規(guī)模也不斷增大,因此對(duì)計(jì)算資源的需求也越來越高。尤其是在推理過程中,需要將模型加載到計(jì)算節(jié)點(diǎn)上進(jìn)行運(yùn)算,因此需要高性能的計(jì)算設(shè)備來支持模型的推理。同時(shí),由于ChatGPT模型需要進(jìn)行海量的預(yù)訓(xùn)練和微調(diào),因此需要大量的算力資源來支持這些任務(wù)。ChatGPT的發(fā)展將帶來算力需求的大幅提升。使用ChatGPT帶來的算力需求測(cè)算:1)每日用戶數(shù)量:根據(jù)Similarweb統(tǒng)計(jì),OpenAI網(wǎng)站2月總訪問量達(dá)11億人,平均每天訪客數(shù)量約3929萬人。我們按目前每日訪客數(shù)量增長(zhǎng)至約4000萬人進(jìn)行測(cè)算。2)每日問題產(chǎn)生的token數(shù)量:假設(shè)每人每天提出10個(gè)問題,每個(gè)問題和回答折算成英文約400個(gè)單詞,每個(gè)單詞token數(shù)約為1.33,每日問題產(chǎn)生的總token數(shù)量為4000萬*400*10*1.33=2128億token3)每秒需處理token數(shù)量:2128億token/(24*60*60)=246.3萬token4)ChatGPT計(jì)算每token所需算力:根據(jù)OpenAI論文,Transformer模型推理過程中每token計(jì)算所需FLOPs為2N,N為參數(shù)數(shù)量。GPT-3模型擁有1750億參數(shù)量,是GPT-2的116倍。谷歌在3月推出的視覺語言模型PaLM-E,參數(shù)量為5620億。我們假設(shè)ChatGPT所使用的GPT3.5參數(shù)量為4000億。同時(shí)考慮模型的FLOPS利用率,則ChatGPT每token計(jì)算所需算力約為4TFLOPS(4*10^12FLOPs)。5)每秒所需算力:ChatGPT每秒所需算力為246.3萬token*4TFLOPs/token=9852PFLOPs(9.8EFLOPs)6)每日服務(wù)器需求量:我們以英偉達(dá)DGXA1OO服務(wù)器為測(cè)算依據(jù),同時(shí)由于ChatGPT的每日訪問存在峰谷,考慮峰值時(shí)所需算力,經(jīng)測(cè)算需要約10000臺(tái)英偉達(dá)服務(wù)器。通過測(cè)算,當(dāng)前每日僅來自使用ChatGPT所需算力約為50EFLOPs,所需服務(wù)器約為10000臺(tái)。而測(cè)算結(jié)果僅根據(jù)4000萬日活用戶,每日4000字問題計(jì)算得出。表:服務(wù)器數(shù)量敏感性分析資料來源:OpenAI,Similarweb,安信證券研究中心另外我們考慮到服務(wù)器自身算力的提升,對(duì)2024年底算力需求與服務(wù)器需求量進(jìn)行測(cè)算。服務(wù)器算力:服務(wù)器大約三年迭代一次,每次算力提升3-5倍左右,極值可達(dá)9倍左右。英偉達(dá)A100于2021年5月推出,我們預(yù)計(jì)2024年將推出迭代產(chǎn)品,假設(shè)算力提升4倍左右。用戶數(shù)量:ChatGPT僅推出兩個(gè)月,月活躍用戶數(shù)預(yù)計(jì)已達(dá)1億,2月總訪問量已達(dá)11億人,用戶增長(zhǎng)速度驚人。目前微軟newbing和Microsoft365Copilot已集成最新發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論