




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SOUTHWESTSECURITIESSOUTHWESTSECURITIES科技前瞻專題西南證券研究發展中心海外研究團隊投資邏輯耗,更低的成本;3)為AI工作負載定制的內存和I/O架構。隨著AI應用的發展和生態逐步完善,AI算力集群特別并開始切入到部分訓練環節。對照北美四大CSP的自研產品路線:Google的TPU出貨目前以v5產品為主,2025年將量產TPUv6;亞馬遜的ASIC產品包括Trainium和Inferentia,分別用于訓練和推理環節求。泛的IP儲備可為其XPU產品線賦能。2)Marvell:全球一線ASIC廠商,其定制計算產品包括AI加速芯片,針對安全、NIC/DPU、風險提示:AI產業發展不及預期的風險;大型12ASIC與GPU的對比3北美四大CSP自研AIASIC4相關標的21.1大型CSP加速資本支出北美四大北美四大CSP資本支出規模(億美元)1.2ASIC可適應不同的業務場景和商業模式的需求大型CSP的業務模型、應用場景等很多通過自身的云來承載,每個云承載了獨特的應用和商業模型,包括內部應用(比如搜索引擎、社交媒體等)、SaaS服務(比如AI聊天機器人、CoASIC需要滿足不同業務/應用的加速計算需求ASIC需要滿足不同業務/應用的加速計算需求1.3訓練和推理集群對加速計算芯片的需求算芯片的需求已提升到萬卡級別。隨萬卡級別指日可待。理集群的部署數量要遠多于訓練集群 ,推理集群的數量預計會達到百萬級別。AI算力集群特別是推理集群對加速計算芯片的龐大需求,是ASIC快速成長的核心驅動力。551.4ASIC市場規模預測據Marvell預測,2023年ASIC占數據中心加速計算芯片的16%,規模約為66億美元;隨著AI計算需求的增長,ASIC占比有望提升至25%,預計2028年數據中心ASIC市場規模將提升至429億美元,CAGR為45.4%。數據中心定制加速計算市場規模數據中心定制加速計算市場規模2ASIC與GPU的對比3北美四大CSP自研AIASIC4相關標的72.1ASIC硬件性能:針對特定算法和應用優化設計,具有較高能效比ASIC針對特定算法和應用進行優化設計,在特定任務上的計算能力強大,例如在某些AI深度學習算法中實現高效的矩陣運算和數據ASIC通常具有較高的能效比,因其硬件結構是為特定任務定制的,能最大限度減少不必要的功耗。GPU由于其通用的設計架構,在執行特定任務時可能存在一些功耗浪費;但隨著技術的進步,新一代GPU也在不斷提高能效比。ASIC在處理特定任務時,能實現高吞吐量,數據處理速度快,可快速完成大量的數據處理工作。GPU具有較高的帶寬和并行處理能ASIC在絕對算力和片間互聯方面普遍低于AIGPU,但ASIC的服務器間互聯由于采用以太網為主,具有通用性強、生態開放、低成本等優勢。2.2ASIC的單位算力成本更低,滿足一定的降本需求ASIC的單位算力成本更低,滿足一定的降本需求。ASIC因其硬件結構是為特定任務定制的,減少了很多針對通用加速計算的不必要的硬件設計,其單位算力成本相比GPU或更低。谷歌TPUv5、亞馬遜Trainium2的單位算力成本分別為英偉達H100的70%、60%2.3ASIC與GPU軟件生態對比得GPU在各種應用場景中都能快速地進行開發和部署。GPU軟件生態的劣勢:軟件生態在特定任務上的優化程度可能不如ASIC。在一些對性能和功耗要求極高的特定場景中,需要進行大量的優化工作才能發揮出GPU的最佳性能。2.4ASIC以推理場景為主,并開始切入到部分訓練環節ASIC也有開發周期長且靈活性差的劣勢,由于ASIC的設計和制造是針對特定算法和應用場景進行的,一旦設計完成其功能就固化下數據來源:西南證券整理2ASIC與GPU的對比3北美四大CSP自研AIASIC4相關標的適合各種使用場景,例如聊天機器人、代碼生成、媒體內容生成、合成現5萬卡線性加速。最新一代TPUv6Trillium預計2024H2推出,TPUv6FP16/BF16精度非稀疏算力可達926TFLOPS,約為H100、B100的93%、53%。相比TPUv5e,TPUv6能效高出67%,峰值性能高出3.7倍。谷歌TPU歷代產品性能谷歌TPU歷代產品性能3.1.1谷歌TPU算力集群能力,每64顆TPUv4芯片組成4x4x4的立方體,每個CPU配備4顆TPUv4,64顆TPUv4和16顆CPU放入一個機架,形成一個模塊。一個模塊有6個面的光路鏈接,每個面有16個鏈接,單模塊共有96個光路連接到OCS。為了提供3D環面的環繞鏈接,對面的鏈接必須連接到同一個OCS。每個模塊連接48個OCS(6×16÷2最終實現所需的4096個TPUv4芯片互聯。4x4x4的3D模塊結構。64個機柜共同組成4096顆芯片規模的算力集群。TPU立方體與3個OCS的連接TPUv4封裝和算力集群數據來源:谷歌,《TPUv4:AnOpticallyReconfigurableSupercomputerforMachineLearningwithHardwareSupportforEmbeddings》,14西南證券整理3.1.2谷歌TPU基準測試性能對比v4分別比A100和IPU快1.67倍和約4.5倍;運行MLPerf基準測試時,A100的平均功耗比谷歌TPUv4數據來源:谷歌,《TPUv4:AnOpticallyReconfigurableSupercomputerforMachineLearningwithHardwareSupportforEmbeddings》,15西南證券整理3.1.3谷歌TPU迭代推動大模型訓練效率顯著提升TPU的算力成本隨著產品更新迭代也在持續優化。TPUv5e的相對性價比(TFLOPs/$)是TPUv4的2.3倍,參考谷歌披露的TPULLM的速度比TPUv4快2.8倍,利用第二代SparseCores,TPUv5p訓練嵌入密集模型的速度比TPUv4快1.9倍。谷歌TPU迭代推動大模型訓練效率的顯著提升谷歌TPU迭代推動大模型訓練效率的顯著提升3.2.1亞馬遜自研AI芯片TrainiumAWSTrainium是AWS專門為超過1000億個參數模型的深度學習訓練打造的機器學習芯片。自2020年以來,亞馬遜發布了兩代可節省高達50%的訓練成本。Trainiu碼生成、問題解答、圖像和視頻生成、推薦和欺詐檢測等各種應用程序。3.2.2亞馬遜自研AI芯片InferentiaAWSInferentia加速器由AWS設計,在AmazonEC2中以低成本為深度學習和生成式AI推理應用程序提供高性能。第一代AWS總內存增加了4倍,內存帶寬增加了10倍;每個EC2Inf2實例最多有12個In3.2.3亞馬遜AWSNeuronAmazonEC2Trn1實例上進行高性能訓練。對于模型部署,它支持在基于AWSInferentia的AmazonEC2Inf可將基于GPU的實例遷移到AWSTranium中,客戶只要修改少量代碼即可實現海量數據訓練,降低了訓練成3.3微軟自研芯片Maia100片具有12倍400GbE的網絡帶寬,設計最大功耗700WTDP。超過英偉達A10028%,是英偉達H100的40%。3.3微軟自研芯片Maia100Maia100基于自定義的RoCE類協議和以太網互連,內置AES-GCM加密引擎以保護用戶數據,網絡連接帶寬達到600GB/s。Maia3.3微軟自研芯片Maia100集成。該軟件棧提供了豐富而全面的庫、編譯器和工具,使數據科學家和開發人員能在Maia100上成功運行模型。微軟集成了會犧牲效率和針對AI工作負載的能力。Maia的SDK允許用戶將用PyTorch和Triton編寫3.4Meta自研芯片MTIA芯片架構方面,MTIAv2內部包含加速器、片上和片外存儲以及互聯結構。AI加速器由8x8的處理單元網格(PE,processing 3.4Meta自研芯片MTIA3.4Meta自研芯片MTIA2ASIC與GPU的對比3北美四大CSP自研AIASIC4相關標的4.1.1博通AI芯片業務目標博通AI業務占比從2019年的低于5%提升至2023年的15%左右。根據公司的規劃,預計2024年實現超過100億美元的收入體量,占公司整體收入比例增長至35%。4.1.2博通廣泛的IP儲備為ASIC產品線賦能NICs、高端封裝、交換機、CPO、內存等IP處于行業領先水平。博通在相關領域投入了30億美元研發費用。博通廣泛的IP儲備為XPU賦能博通廣泛的IP儲備為XPU賦能4.1.3博通利用XPU平臺和與客戶的深度戰略合作實現產品快速落地博通充分利用已經布局完成的XPU平臺工程,實現了業界最快的ASIC產品落地時間。XPU平臺涵蓋了經過10年XPU經驗優化的AI設計流程、AIIP、SoC封裝等一體化解決方案。ASIC產品設計階段耗費7-9個月的聯合開發時間,再用3個月左右的時間完成產品的生產和產能爬坡。博通與客戶在架構階段就展開了深度的戰略合作。在XPU設計啟動的前幾年,完成了關鍵組件的早期IP投資;并且為后兩代XPU同時進行技術、IP和封裝投資。4.1.4博通與客戶聯合開發多款不同復雜度的XPU隨著算力性能增長、網絡和內存帶寬提升、對電力輸送、熱完整度、機械可靠性等要求了客戶對更復雜的XPU的需求。博通與多家大客戶一起聯合開發了十幾款XPU產品。博通與大客戶聯合開發了多款XPU博通與大客戶聯合開發了多款XPU4.1.5博通收入穩步增長,利潤率顯著提升博通Non-GAAP凈利率從2019財年的41.8%提升至2023財年的51.3%。得益于利潤率的提升,博通2019-202潤年復合增速達14.4%。2024財年Non-GAAP凈利博通凈利潤(億美元)博通凈利潤(億美元)博通收入(億美元)博通收入(億美元)4.1.6半導體是博通最大業務,盈利能力逐年提升半導體解決方案是公司的最大業務,2023財年占據公司整體收入的78.7%;利潤率從2019財年的50%提升至2023年的58.5%。公司的基礎設施軟件業務占比不低于20%。其中,Vmware在2024年并表后顯著推高了該業博通基礎設施軟件收入(億美元)博通基礎設施軟件收入(億美元)博通半導體業務收入(億美元)博通半導體業務收入(億美元)4.2.2MarvellAI業務目標Marvell的AI業務2023財年為2億美元左右。公司預計24-26財年加速AI業務(連接+定制化計算)收入從5.5億提升至25億美元。Marvell的數據中心業務TAM:根據Marvell預測,2023-2028年其數據中心業務TAM從210億美元增長至750億美元,CAGR為29%;其中,定制化加速計算TAM從66億美元增長至429億美元,CAGR為45%;交換機TAM從61億美元增長至120億美元,4.2.3Marvell的加速計算基礎設施平臺布局Marvell的加速計算基礎設施平臺涵蓋了“工藝制程-IP-封裝-專家”的布局。Marvell經過多年對完整定制平臺的收購和重大投資,儲備了一大批世界級的IP,覆蓋模擬、數字、封裝等多個層面的知識產權。其中,Cavium擅長網絡加速計算,AveraSemi(原格芯子公司)擅長為各種應用提供定制芯片解決方案和2.5D/3D封裝技術,Aquantia擅長網絡傳輸,Inphi擅長模擬、硅光和DSP技術,Innovium擅長數據中心交換機芯片技術(競品為博通的Trident和Tomahawk芯片)。4.2.4Marvell的定制計算產品線和主要客戶情況Marvell的定制計算產品包括AI加速芯片,針對安全、NIC/DPU、ARM計算、存儲、Marvell的客戶涵蓋美國3/4的大型CSP。Marvell為亞馬能爬坡階段。新介入的C客戶其AI加速器將于2026年產能爬坡。4.2.5Marvell業績彈性大,2025財年盈利逐季改善Marvell2021-2024財年Non-GAAP凈利潤年復合增速達31%。2025前三財季Non-GAAP凈利潤為8.5億美元,Non-GAAP凈利率從17.8%提升至24.6%。MarvellMarvell凈利潤(億美元)Marvell收入(億美元)Marvell收入(億美元)4.2.6受益于AI需求推動,數據中心業務比重超40%數據中心業務占據整體收入比重超40%。其他業務中,企業網絡收入2021-2024財年復合增速21.2%,2024財年占收入比重22%左右;基礎設施收入2021-2024財年復合增速23.2%,2024財年占收入比重19%左右;消費業務2024財年占收入比重11%左右;工業和汽車業務2021-2024財年占收入比重7%左右。Marvell分業務收入(億美元)Marvell分業務收入(億美元)風險提示AI產業發展不及預期的風險;互聯網科技企業資本支出不及預期的風險;GPU競爭的風險。執業證號:S1250521120002電話箱:wxj@分析師:楊鎮宇執業證號:S1250517090003電話,SOUTHWESTSECURITIES西南證券研究發展中心西南證券研究發展中心西南證券投資評級說明報告中投資建議所涉及的評級分為公司評級和行業評級(另有說明的除外)。評級標準為報告發布日后6個月內的相對市場表現,即:以報告發布日后6個月內公司股價(或行業指數)相對同期相關證券市場代表性指數的漲跌幅作為基準。其中:A股市場以滬深300指數為基準,新三板市場以三板成指(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的)為基準;香港市場以恒生指數為基準;美國市場以納斯達克綜合指數或標普500指數為基準。公司評級買入:未來6個月內,個股相對同期相關證券市場代表性指數漲幅在20%以上持有:未來6個月內,個股相對同期相關證券市場代表性指數漲幅介于10%與20%之間中性:未來6個月內,個股相對同期相關證券市場代表性指數漲幅介于-10%與10%之間回避:未來6個月內,個股相對同期相關證券市場代表性指數漲幅介于-20%與-10%之間賣出:未來6個月內,個股相對同期相關證券市場代表性指數漲幅在-20%以下行業評級強于大市:未來6個月內,行業整體回報高于同期相關證券市場代表性指數5%以上跟隨大市:未來6個月內,行業整體回報介于同期相關證券市場代表性指數-5%與5%之間弱于大市:未來6個月內,行業整體回報低于同期相關證券市場代表性指數-5%以下分析師承諾報告署名分析師具有中國證券業協會授予的證券投資咨詢執業資格并注冊為證券分析師,報告所采用的數據均來自合法合規渠道,分析邏輯基于分析師的職業理解,通過合理判斷得出結論獨立、客觀地出具本報告。分析師承諾不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接獲取任何形式的補償。重要聲明西南證券股份有限公司(以下簡稱“本公司”)具有中國證券監督管理委員會核準的證券投資咨詢業務資格。本公司與作者在自身所知情范圍內,與本報告中所評價或推薦的證券不存在法律法規要求披露或采取限制、靜默措施的利益沖突。《證券期貨投資者適當性管理辦法》于2017年7月1日起正式實施,本報告僅供本公司簽約客戶使用,若您并非本公司簽約客戶,為控制投資風險,請取消接收、訂閱或使用本報告中的任何信息。本公司也不會因接收人收到、閱讀或關注自媒體推送本報告中的內容而視其為客戶。本公司或關聯機構可能會持有報告中提到的公司所發行的證券并進行交易,還可能為這些公司提供或爭取提供投資銀行或財務顧問服務。本報告中的信息均來源于公開資料,本公司對這些信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌,過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告,本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告僅供參考之用,不構成出售或購買證券或其他投資標的要約或邀請。在任何情況下,本報告中的信息和意見均不構成對任何個人的投資建議。投資者應結合自己的投資目標和財務狀況自行判斷是否采用本報告所載內容和信息并自行承擔風險,本公司及雇員對投資者使用本報告及其內容而造成的一切后果不承擔任何法律責任。本報告刪節和修改。未經授權刊載或者轉發本報告及附錄的,本公司將保留向其追究法律責任的權利。SOUTHWESTSECURITIES西南證券研究發展中心西南證券研究發展中心西南證券研究發展中心上海深圳地址:上海市浦東新區陸家嘴21世紀大廈10樓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 刺繡與絎縫藝術企業制定與實施新質生產力項目商業計劃書
- 連鎖酒店AI應用行業深度調研及發展項目商業計劃書
- 湖南省郴州市湘南中學2024-2025學年化學九上期末聯考試題含解析
- 吉林省延邊州敦化市2025屆化學九年級第一學期期末質量跟蹤監視試題含解析
- 山西信息職業技術學院《醫學表觀遺傳學》2023-2024學年第一學期期末試卷
- 2025屆遼寧省朝陽建平縣聯考化學九年級第一學期期末綜合測試試題含解析
- 溫州大學《中醫生命學》2023-2024學年第一學期期末試卷
- 貴陽職業技術學院《大學英語(學術)》2023-2024學年第一學期期末試卷
- 消防救援知識試卷涵蓋油品滅火水域救援等多方面考點
- 民航空管運行單位安全管理及設備相關知識試卷
- 商業步行街物業管理方案
- 日語被動態練習
- 鋼板樁安全技術交底
- 旅游大數據與智慧旅游教學大綱
- 金屬廢棄物生物冶金提取與利用
- 湖南省長沙2024年七年級下冊生物期末試卷附答案
- 2023-2024學年第二學期期末學業質量檢測八年級語文試卷
- 農村房子繼承人放棄繼承協議書
- WS 329-2024 麻醉記錄單標準
- 2024-2029全球及中國福利管理系統行業市場發展分析及前景趨勢與投資發展研究報告
- 新標準英語小學五年級下各模塊習題
評論
0/150
提交評論