




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
DeepSeek:
技術(shù)顛覆or
創(chuàng)新共贏中國(guó)銀河證券|CGS計(jì)算機(jī)行業(yè)首席分析師:吳硯靖:通信行業(yè)首席分析師:趙良畢:電子行業(yè)首席分析師:高峰:傳媒行業(yè)分析師:岳錚。計(jì)算機(jī)行業(yè)分析師:鄒文倩、李璐昕,研究助理胡天昊、馮雨淇;通信行業(yè)分析師:趙中興:傳媒行業(yè)研究助理:祁天睿。www.chinastock.com.cn
證券研究報(bào)告請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明核心觀點(diǎn)●DeepSeek
通過(guò)算法及工程創(chuàng)新,顯著降低成本,技術(shù)變革算力新方向:DeepSoek
模型通過(guò)使用PTX
編程語(yǔ)言,以及工程能力上的創(chuàng)新,使得其在
具有更強(qiáng)的性能的同時(shí),實(shí)現(xiàn)更低的訓(xùn)練與推理成本,或?qū)⒓铀偻苿?dòng)AI應(yīng)
用
與硬件的普及和落地。與市場(chǎng)認(rèn)為的不同,我們認(rèn)為更低的訓(xùn)練與推理成本對(duì)
算力需求呈現(xiàn)短期減少,長(zhǎng)期高增的趨勢(shì),AI
能力邊際擴(kuò)張依然需要依賴更
大的模型和強(qiáng)大的算力,DeepSeek
在算法和架構(gòu)上的創(chuàng)新給AI
發(fā)展增加了
一條新的道路,有望開(kāi)拓AI
行業(yè)的共贏局面。●
結(jié)合我們對(duì)芯片、硬件、軟件、應(yīng)用端等的影響分析,我們認(rèn)為DeepSeek的技術(shù)順夏帶來(lái)的是AI
行業(yè)的多元化,有望加速AI
行業(yè)的普及繁榮,具
體細(xì)分到行業(yè)子板塊來(lái)看:電子板塊
-
后訓(xùn)練時(shí)代看好推理側(cè)算力部署,以及AI
端
側(cè)
加
速
落
地
:DeepSeek
的創(chuàng)新并沒(méi)有完全打破scalinglaxs,且正從pre-trainíng轉(zhuǎn)
向post-training
和推理,通過(guò)增加模型規(guī)模、擴(kuò)展訓(xùn)練數(shù)據(jù)、提高計(jì)算資源以
及合理的任務(wù)設(shè)計(jì),可加速模型學(xué)習(xí)更復(fù)雜的推理能力。隨著模型規(guī)模、數(shù)據(jù)
量和計(jì)算資源的增加,模型能夠更好地進(jìn)行推理,通過(guò)平衡性能、內(nèi)存占用和
推理速度來(lái)提高大語(yǔ)言模型的運(yùn)行效率,有利于AI
硬件端的落地與普及。通信板塊-推理側(cè)算力有望增加利好國(guó)產(chǎn)光芯片,看好AI
時(shí)
代
運(yùn)
營(yíng)
商
角
色
轉(zhuǎn)換,光模塊景氣度無(wú)虞。我們認(rèn)為運(yùn)營(yíng)商作為我國(guó)最大的流量管道,具備
數(shù)據(jù)優(yōu)勢(shì)及接口優(yōu)勢(shì),
AI
應(yīng)用的普及將持續(xù)推進(jìn),同時(shí),更強(qiáng)訓(xùn)練模型的未
來(lái)需求將帶動(dòng)光模塊產(chǎn)業(yè)鏈快速發(fā)展,在全球經(jīng)濟(jì)形勢(shì)復(fù)雜化趨勢(shì)下,核心器
件光芯片等方向自主可控進(jìn)程進(jìn)一步加速。計(jì)算機(jī)板塊-看好算力向推理,基礎(chǔ)設(shè)施向應(yīng)用側(cè)投資變化機(jī)遇:當(dāng)下投資
中的結(jié)構(gòu)性機(jī)會(huì)主要體現(xiàn)在"從訓(xùn)練算力為主到推理算力為主過(guò)渡"、“從高
端GPU
到
ASIC
芯片過(guò)渡",以及“從基礎(chǔ)設(shè)施投資機(jī)會(huì)向應(yīng)用側(cè)投資機(jī)會(huì)
過(guò)渡"。其開(kāi)源策略和低成本模型使得更多企業(yè)和開(kāi)發(fā)者能夠使用先進(jìn)的
AI技術(shù),加速了AI
技術(shù)在各行業(yè)的應(yīng)用和發(fā)展。傳媒板塊-大棋型推陳出新進(jìn)程加速,AI+
賦
能
進(jìn)
行
時(shí)
:在
C端,用戶滲透
率不斷提升,主要AI
APP活躍數(shù)據(jù)持續(xù)環(huán)比增長(zhǎng):在B
端,AI
營(yíng)銷(xiāo)等領(lǐng)域的商業(yè)化模式已經(jīng)逐步得到驗(yàn)證。
DeepSeek有望加速推動(dòng)在影視、廣告、社交陪伴等多個(gè)領(lǐng)域AI+應(yīng)用落地。●
投
資
建
議
:建議關(guān)注電子板塊消費(fèi)電子相關(guān)產(chǎn)業(yè)鏈、AI
終端硬件等方向:通
信板塊運(yùn)營(yíng)商、光模塊、光芯片等方向:計(jì)算機(jī)板塊看好邊緣算力、
AI
應(yīng)
用
開(kāi)發(fā)、數(shù)據(jù)服務(wù)與處理、端側(cè)AI
設(shè)備等方向:傳媒板塊“AI+”等細(xì)分子領(lǐng)域
方向。●
風(fēng)
險(xiǎn)
提
示
:國(guó)際經(jīng)濟(jì)形勢(shì)復(fù)雜度進(jìn)一步提升的風(fēng)險(xiǎn):AI
硬件發(fā)展速度不及預(yù)期的風(fēng)險(xiǎn):AI
產(chǎn)業(yè)鏈上下游短期波動(dòng)的風(fēng)險(xiǎn):
AI應(yīng)用發(fā)展不及預(yù)期的風(fēng)險(xiǎn)等。2025年02月03日分析師超良畢首席通信分析師窗:010-8092-7619兇:zhaoliangbi_yj@chinastock.com.cn分析師登記編碼:SO130522030003吳硯靖首席計(jì)算機(jī)分析師窗:wuyanjing(@chinustoccn分析師登記編碼:S0130619070001高峰首席電子分析師窗:gaofeng
yi
@chinastockcomcn分析師登記編碼:S0130622040001岳錚傳媒分析師窗:010-8092-7630兇:yuezhengyj@chinastock,comcn分析師登記編碼:S0130522030006計(jì)算機(jī)行業(yè)分析師:鄒文倩,登記編碼:SD130519060003、
李聘聽(tīng),登記編碼:S0130521040001
研究助理胡天昊、馮雨淇;通信行業(yè)分析師:趙中興,登記編碼:S0130524090002;中國(guó)銀河證券|
CGS科技行業(yè)專題報(bào)告DeepSeek:
技術(shù)顛覆or
創(chuàng)新共贏請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。傳媒行業(yè)研究助理:祁天睿2中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告目錄Catalog一
、DeepSeek
:算法革命帶動(dòng)AI景氣進(jìn)一步上行
……………4(一)
DeepSeek
公司成立背景與發(fā)展歷程…………………4(二)
DeepSeek
:從硬件競(jìng)賽到算法效率革命的技術(shù)順覆………………
5(三)
DeepSeek
開(kāi)辟了效率提升新賽道,創(chuàng)新優(yōu)勢(shì)明顯…………………7(四)
DeepSeek
引領(lǐng)AI
成本革命,算法突破有望促進(jìn)算力需求正向循環(huán)……………11二
、芯片端:推理+端側(cè)發(fā)展星辰大海,高需求無(wú)成
…………
12(一)
推理算力需求持續(xù)增長(zhǎng)正向影響芯片需求……………………………12(二)后訓(xùn)練增長(zhǎng)及國(guó)產(chǎn)化需求提升有望帶動(dòng)光芯片需求增長(zhǎng)……………………………14三
、硬件端:光通信仍然靚麗,智能硬件邊際改善……………16(一)運(yùn)營(yíng)商、光模塊等細(xì)分板塊仍舊具備較大投資價(jià)值…………………………………16(二)
端側(cè)大模型落地,智能硬件迎來(lái)星辰大海……………20四
、軟件端:大模型演進(jìn)加速,看好AI
Agent發(fā)
展…………………………27(一)DeepSeek加
速AGI到來(lái),大模型從“訓(xùn)練”向“推理”演進(jìn)……………………27(二)AIAgent崛
起
,B
端+C端應(yīng)用開(kāi)啟新篇章
…………28五
、應(yīng)
用
端
:AI+賦能進(jìn)行時(shí),行業(yè)加速繁榮可期……………………………30(一)開(kāi)源的生態(tài)推動(dòng)AI行業(yè)高速發(fā)展………………………30(二)A
I應(yīng)用:“AI
+”行業(yè)應(yīng)用百花齊放…………………………………32六
、投資建議:硬件產(chǎn)業(yè)鏈加速發(fā)展,應(yīng)用端方興未艾………………………37(一)
電子板塊:Scaling
Laws轉(zhuǎn)向后訓(xùn)練,計(jì)算效率提升至關(guān)重要……………………37(二)通信板塊:運(yùn)營(yíng)商、光模塊及光芯片子板塊動(dòng)能強(qiáng)勁………………38(三)計(jì)算機(jī)板塊:看好算力向推理,基礎(chǔ)設(shè)施向應(yīng)用側(cè)投資變化機(jī)遇…………………………………39(
四)傳媒板塊:DeepSeek
加速AI
向低成本發(fā)展,看好AI
+應(yīng)用落地………………
40七
風(fēng)
險(xiǎn)
提
示
……………………
41請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。資柯來(lái)源
DaySnkAPY文輝,中國(guó)品河證券研究院DeepSeck的團(tuán)隊(duì)成員大多來(lái)自清華大學(xué)、北京大學(xué)、中山大學(xué)、北京郵電大學(xué)等國(guó)內(nèi)頂尖高校,
整體呈現(xiàn)出“年輕高學(xué)歷、注重開(kāi)源、重視創(chuàng)新”的特點(diǎn)。根據(jù)彭博社報(bào)道,
DeepSeek
的
AI
助手在140個(gè)市場(chǎng)中成為下載量最多的移動(dòng)應(yīng)用。根據(jù)
Appfigures
的數(shù)據(jù),
DeepSeek
的推理人工智能聊天機(jī)器人在1月26日登上蘋(píng)果公司AppStore
的
榜首并保持全球第一,1月28日起在美國(guó)的AndroidPlayStore中也位居榜首。根據(jù)SensorTower的數(shù)據(jù),
DeepSeek
在發(fā)布后的前18天內(nèi)獲得了1600萬(wàn)次下載,約為OpenAI
的ChatGPT
發(fā)布時(shí)
900萬(wàn)下載量的兩倍,印度貢獻(xiàn)了所有平臺(tái)下載量的15.6%。在用戶體驗(yàn)方面,DeepSeek
表現(xiàn)不俗。用戶普遍認(rèn)為DeepSeekR1
的性能出色,特別是在數(shù)
學(xué)推理、編程能力和自然語(yǔ)言理解等領(lǐng)域。其推理速度和準(zhǔn)確度在多個(gè)測(cè)試場(chǎng)景中達(dá)到業(yè)界領(lǐng)先水平。此
外,DeepSeekRI的“聰明”特性使得用戶無(wú)需復(fù)雜的提示詞技巧,即可獲得高質(zhì)量的回答。在實(shí)際使用場(chǎng)景中,無(wú)論是游戲、視頻播放還是日常工作的輔助,其流暢的操作體驗(yàn)都得到了用戶的高度
評(píng)價(jià),用戶反饋顯示,DeepSeek
界面簡(jiǎn)潔直觀、操作簡(jiǎn)單,在實(shí)時(shí)數(shù)據(jù)推送和內(nèi)容推薦上十分出色,能夠有效提升工作效率,減少用戶在信息檢索上的時(shí)間投入。DeepSeekRI
的發(fā)布引起了硅谷科技領(lǐng)袖、國(guó)際媒體及學(xué)術(shù)界的廣泛關(guān)注。其性能和開(kāi)源策略獲
得了高度評(píng)價(jià),被認(rèn)為是“非美國(guó)公司踐行OpenAI初心”的典范。
DeepSeekRI
的發(fā)布引發(fā)了全
球科技市場(chǎng)的連鎖反應(yīng)。其開(kāi)源策略、低成本、高性能的特性,對(duì)科找巨頭形成了壓力。其訓(xùn)練成本
僅為600萬(wàn)美元,遠(yuǎn)低于OpenAI
和谷歌等公司的同類模型,《MITTechnologyReview》提
到
,R1
在數(shù)學(xué)、代碼等復(fù)雜任務(wù)上的表現(xiàn)與OpenAlol
相當(dāng),而訓(xùn)練成本僅為其1/70,定價(jià)低至OpenAI的3%。這種成本效益優(yōu)勢(shì)使得更多企業(yè)和開(kāi)發(fā)者能夠以較低的成本使用先進(jìn)的AI
技術(shù),將大大加
速
AI
技術(shù)的普及和應(yīng)用。圖1:DeepSeek
發(fā)展歷程正式發(fā)布DepSsck
R1模型,在大模DeepSek
成Lie
預(yù)覽版正中其基在測(cè)試升至Q合并Deep
宜布
快型第三。2024年1月s324
年2縣2023年7月
2024年5月
2021年11前個(gè)版本上線025年1月發(fā)布首個(gè)大模ln(一)DeepSeek
公司成立背景與發(fā)展歷程DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司。由幻方量化的聯(lián)合創(chuàng)始人梁文
峰創(chuàng)立。公司自2023年7月年成立以來(lái),始終專注于大語(yǔ)言模型
(LLMO
及其相關(guān)技術(shù)的深度研發(fā)。公司堅(jiān)持技術(shù)創(chuàng)新路線,開(kāi)創(chuàng)性地提出多頭潛在注意力機(jī)制(MLA)和DeepSeekMoE等
創(chuàng)
新架構(gòu)。憑借這些創(chuàng)新成果,DeepSeek
的大模型在多項(xiàng)權(quán)威測(cè)評(píng)中展現(xiàn)出頂尖的性能表現(xiàn)。一、DeepSeek:
算法革命帶動(dòng)AI景氣進(jìn)一步上行宣布開(kāi)源第二代MoE
大模型中國(guó)銀河證券科技行業(yè)專題報(bào)告型排名Arena痊理模型CGS請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告(二)DeepSeek:從硬件競(jìng)賽到算法效率革命的技術(shù)顛覆大模型在AI
行業(yè)中占據(jù)核心地位,是推動(dòng)技術(shù)創(chuàng)新、拓展應(yīng)用場(chǎng)最及提升行業(yè)效率的關(guān)鍵因
素。全球范圍內(nèi)的領(lǐng)軍企業(yè)持續(xù)推動(dòng)大模型性能的提升,隨著模型規(guī)模的不斷擴(kuò)張,其性能也實(shí)現(xiàn)
了顯著提升。然而,這種規(guī)模的擴(kuò)大也相應(yīng)地帶來(lái)了訓(xùn)練和部署成本的急劇增加,成為制約大模型
廣泛應(yīng)用的瓶頸。在機(jī)器學(xué)習(xí)領(lǐng)域,尤其是大型語(yǔ)言模型(LLMs)的應(yīng)用場(chǎng)景中,模型性能的提升與模型規(guī)模、
數(shù)據(jù)集的大小以及計(jì)算資源之間存在著緊密的關(guān)聯(lián),這一關(guān)系通常被描述為“規(guī)模定律”(ScalingLaw)
。
根據(jù)規(guī)模定律,模型的性能會(huì)隨著模型規(guī)模的指數(shù)級(jí)增加而實(shí)現(xiàn)線性提升。目前,國(guó)際上
主流的大模型,諸如OpenAI
的
GPT
系列、Anthropic
的
Claude
以及谷歌的Gemini
等,其最
新版本的規(guī)模均已突破千億參數(shù)大關(guān)。盡管這些模型在性能上展現(xiàn)出了卓越的表現(xiàn),但對(duì)于眾多公
司和開(kāi)發(fā)者而言,其高昂的硬件資源使用成本、計(jì)算時(shí)間等依然構(gòu)成了巨大的挑戰(zhàn)。長(zhǎng)期以來(lái),大
算力訓(xùn)練一直是基座模型廠商用于融資與構(gòu)建竟?fàn)幈趬镜闹匾侄巍募夹g(shù)層面來(lái)看,GPU
等硬件設(shè)施效率的提升以及算法的優(yōu)化等方式,均有望帶動(dòng)大模型成本
的顯著下降。在全球GPU
短缺以及美國(guó)限制政策的雙重壓力下,我國(guó)的人工智能公司DeepSeek通過(guò)算法優(yōu)化的創(chuàng)新路徑,進(jìn)一步降低了訓(xùn)練成本,為大模型的大規(guī)模應(yīng)用提供了前所未有的可能
性,DeepSeek
在1月20日正式發(fā)布了其RI
模型,并同步開(kāi)源了模型權(quán)重。在第三方的基準(zhǔn)測(cè)試
中,DeepSeek-R1的表現(xiàn)優(yōu)于OpenAI
、Meta
和
Anthropic
等美國(guó)領(lǐng)先的人工智能公司。在
AIME2024
數(shù)學(xué)基準(zhǔn)測(cè)試中,DeepSeek-R1
的成功率高達(dá)79.8%,成功超越了OpenAI
的
ol
推理
模型。在標(biāo)準(zhǔn)化編碼測(cè)試中,DeepSeek-RI
更是展現(xiàn)出了“專家級(jí)”的性能,在Codeforces
上獲
得了2029Elo
的評(píng)級(jí),并超越了96.3%的人類競(jìng)爭(zhēng)對(duì)手。
同
時(shí)
,DeepSeek-R1
真正令人矚目的地
方并不僅僅在于其卓越的性能,而在于其極低的成本。它打破了硅谷傳統(tǒng)的“堆算力、拼資本”的
發(fā)展路徑,僅用557.6萬(wàn)美元和2048塊英偉達(dá)H800GPU便完成了性能對(duì)標(biāo)GPT-40的模型訓(xùn)練,成本僅為OpenAI
同類模型的十分之一,推理成本更是低至每百萬(wàn)Token
0.14
美元,而OpenAI的推理成本則為7.5美元每百萬(wàn)Token.圖2:DeepSeek
性能對(duì)齊0penAI-l正式版DopSek-Rl-penAI-o1-1217一
DwpSesk-RI-328OpenAlol-minDwpSwkV300250輸入IP
價(jià)
路
存
命
中
AA
春在未曲中)0S
a
MMLUsE-tachVorifad
38Tn)d班料來(lái)品
DepSeek言網(wǎng),中國(guó)織河證券研究院
停料來(lái)源
DrepSek言間,中國(guó)品河證券研究院1共排收型入抽出價(jià)格(元/MDeepSedk-RIl-miid.periw圖3:推理成本低至每百萬(wàn)Token
0.14美元680250請(qǐng)務(wù)必間讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
5資料來(lái)愿DapSk
官網(wǎng),中國(guó)紹河證券研究院與專有模型不同,
DeepSeek-R1的代碼和訓(xùn)練方法均在MIT
許可下完全開(kāi)源,這意味著任何
人都可以無(wú)限制地獲取、使用和修改該模型。全球開(kāi)發(fā)者對(duì)DeepSeck-RI
的貢獻(xiàn)代碼使其推理效
率每小時(shí)提升0.3%,這一開(kāi)放性的舉措極大地激發(fā)了業(yè)界的創(chuàng)新活力。DeepSeek-R1在芯片資源
利用、算法復(fù)雜性和推理速度上實(shí)現(xiàn)了重大突破,為AI
行業(yè)的發(fā)展樹(shù)立了新的標(biāo)桿。DeepSeek-R1
的崛起和其所展現(xiàn)出的成本優(yōu)勢(shì)和開(kāi)源策略,
一度讓華爾街對(duì)傳統(tǒng)的“燒錢(qián)”信
仰產(chǎn)生了懷疑。DeepSeek
突破的核心在于算法層次和系統(tǒng)軟件層次的創(chuàng)新等:1)首先是算法層次的創(chuàng)新。
他們采用了新的MoE
架構(gòu),使用了共享專家和大量細(xì)粒度路由
專家的架構(gòu)。通過(guò)將通用知識(shí)壓縮到共享專家中,可以減輕路由專家的參數(shù)冗余,提高參數(shù)效率;
在保持參數(shù)總量不變的前提下,劃分更多的細(xì)粒度路由專家,通過(guò)靈活地組合路由專家,有助于更
準(zhǔn)確和針對(duì)性的進(jìn)行知識(shí)表達(dá)。同時(shí),通過(guò)負(fù)載均衡的算法設(shè)計(jì),有效地緩解了傳統(tǒng)MoE
模型因
負(fù)載不均衡帶來(lái)訓(xùn)練效率低下的問(wèn)題。2)其次在系統(tǒng)軟件層次的創(chuàng)新。DeepSeek
采用了大量精細(xì)化的系統(tǒng)工程優(yōu)化。例如,在并行
策略方面,采用雙向流水的并行機(jī)制,通過(guò)精細(xì)的排布,挖掘了計(jì)算和通信的重疊,有效的降低了
流水并行帶來(lái)的氣泡影響:在計(jì)算方面,采用
FP8等混合精度進(jìn)行計(jì)算,降低計(jì)算復(fù)雜度:在通
信方面,采用低精度通信策略以及token
路由控制等機(jī)制有效降低通信開(kāi)銷(xiāo)。DeepSeek-R1的成功或許證明,未來(lái)的AI
競(jìng)賽將不再單純依賴于芯片的納米級(jí)較量,而是算
法效率、生態(tài)活力與政策彈性的多維度博弈,
AI
行業(yè)的發(fā)展將呈現(xiàn)出更加多元化和復(fù)雜化的變化趨
勢(shì),有望帶來(lái)AI
行業(yè)的繁榮。GPT-4o-0513ADE2024pass9.3AINE2024cons864
13.4MATH500pass0174.6GPOADlanondpass81
49.9LiveCodeBench
CodePoroespass81
rating32.9
759.0Claude-3.5-Sonnet-102216.0
26.7
78.3
65.038.9
717.0ol-nini63.6
80.090.060.053.8
1820.0QnQ-32B44.060.090.654.5
41.91316.0DoepSoek-R1-Distill-Qwen-1.5H28.9
52.783.9
33.8
16.9954.0DeepSeek-R1-Distill-Qven-7H55.5
83.392.849.137.6
1189.0DexpSeek-RI-Distill-Qrr14日69.7
80.093.959.153.1
148L.0DespSoek-RI-Distill-Qurr32872.6
83.394.362.157.2
1691.0DeepSeek-RL-DistillHLlam-8B50.480.0
89.149.039.6
1205.0DeepSeek-R1-Distill-Llara-70E70.0
86.7
94.5
65.2
57.5
1633.0中國(guó)銀河證券|
CGS
科技行業(yè)專題報(bào)告圖4:DoepSeok
蒸館小模型超越OpenAI
ol-mini請(qǐng)務(wù)業(yè)夜讀正文最后的中國(guó)能可證券股份有限公司免責(zé)聲明。Benchaark(letrle)Claude-3.5-GPT-4o
DeepSeek
Soanet-10220613
V3OpenAI
ol-ini0penAIo1-1217DoepSoek
R1Architecture#ActivatedParans#TotalParansMoE
37B
671BMoE37B671BNLU(Pass01)NL-Redux
(EM)MLJ-Pro
(EMODROP
(3-sbot
F1)EnglishIF-Ewal
Prorpt
Strict)
GPOL
Dianond
(Pass01)SirpleQA(Correct)FRAWES(Acc.)lAlpacaEval2.0(LC-winrateArenaHard(GPT4-1106)88.388.978.088.386.565.028.472.552.085.287.288.072.683.784.349.938.280.551.180.488.589.175.991.686.159.124.973.370.085.585.286.780.3
83.984.860.07.0
76.9
57.892.091.890.275.7
47.090.892.984.092.283.371.530.182.587.692.3LiveCodBenchPass01-00Codeforces(Percentile)Code
Codeforces
(Rating))SAE
Verified
(Resolved38.9
20.3
717
50.845.332.923.675938.816.036.258.7113442.049.653.8
93.41820
41.6
32.963.4
96.6
2061
48.9
61.765.996.3202949.253.3三Chinese
C-Eval
(EN)C-SimpleQA(Correct)16.078.313.19.374.610.839.290.243.263.6
90.0
67.679.2
96.479.897.378.885.476.755.487.976.058.790.986.568.089.9
68.9
40.392.891.863.7資料來(lái)潞
DnySnk官網(wǎng),中國(guó)眼河證券研究院(三)DeepSeek
開(kāi)辟了效率提升新賽道,創(chuàng)新優(yōu)勢(shì)明顯更強(qiáng)的性能,更低的訓(xùn)練與推理成本,將加速推動(dòng)AI應(yīng)用與硬件的普及和落地。雖然更低的訓(xùn)
練與推理成本減少了當(dāng)前的算力需求,但是并不意味著AI
的未來(lái)發(fā)展對(duì)半導(dǎo)體整體需求的減少,
相反由于其模型架構(gòu)、基礎(chǔ)設(shè)施數(shù)據(jù)等方面的優(yōu)化,以及更低的成本,使得其更加容易布置在端側(cè),
從而加速AI
的普及。
AI
能力邊際的擴(kuò)張依然需要依賴更大的模型和強(qiáng)大的算力,
DeepSeek
在
算
法和架構(gòu)上的創(chuàng)新給AI
的發(fā)展增加了一條新的道路。Scaling
laws指出,模型的性能伴隨著三個(gè)關(guān)鍵因素的增加而提升,即:模型參數(shù)量、訓(xùn)練數(shù)
據(jù)量、計(jì)算資源,且性能和資源之間存在對(duì)數(shù)線性關(guān)系,
DeepSeek
的技術(shù)創(chuàng)新表現(xiàn)在很多方面。
中國(guó)銀河證券|
CGS
科技行業(yè)專題報(bào)告圖5;DeepSeck-RI與其他代表性模型在各個(gè)維度性能上的對(duì)比請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。7Compute
DatasetSizeParametersPF-days,non-embedding
tokens
non-embeddingFigure1Languagemodeling
performanceimprovessmoothlyas
weincrease
the
modelsize,datasetset
size,andamountof
compute2usedfortraining.Foroptimalperformance
allthree
factors
mustbe
scaledupintandem.Empiricalperformancehasapower-lawrelationshipwitheachindividualfactorwhennotbottlenecked
by
the
other
two.
資料來(lái)源:
Corell
Uniersiny,
中國(guó)織河證券研究院模型架構(gòu)的創(chuàng)新:以DeepSeekV3為例,采用了先進(jìn)的MoE架構(gòu),具備6710億總參數(shù),
但每次僅激活370億參數(shù),從而實(shí)現(xiàn)了高效的資源利用。與傳統(tǒng)的全參數(shù)激活模型相比,MoE動(dòng)
態(tài)激活機(jī)制顯著降低了計(jì)算資源的需求,同時(shí)保持了高性能。DeepSeek提出的多頭潛注意力(MLA)在不犧牲模型質(zhì)量的前提下,大幅減少了KV緩存的大小。MLA的核心思想是將鍵和值向
量的計(jì)算分解成兩個(gè)步驟,并在推理過(guò)程中只緩存中間的“潛向量”,而不是完整的鍵和值向量
大幅提升效率,降低推理成本。其他架構(gòu)上的創(chuàng)新還包括:多令牌預(yù)測(cè),提升訓(xùn)練效率,推測(cè)性解
碼提高推理速度。使用多token預(yù)測(cè)(MTP)
訓(xùn)練目標(biāo),提升數(shù)據(jù)效率。高效訓(xùn)練:DeepSeekV3
在一個(gè)配備2048塊WIDIAH800GPU的集群上進(jìn)行訓(xùn)練,使用FP8
混合精度加速訓(xùn)練。設(shè)計(jì)了DualPipe算法以實(shí)現(xiàn)高效的管道并行性,開(kāi)發(fā)了高效的跨節(jié)點(diǎn)全對(duì)全
通信內(nèi)核,在訓(xùn)練過(guò)程中仔細(xì)優(yōu)化了內(nèi)存占用。完整訓(xùn)練僅需278.8萬(wàn)H800GPU
小時(shí),展現(xiàn)高效
成本效益。訓(xùn)練成本僅為557萬(wàn)美元。后續(xù)DeepSeck推出的R1,在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)
的情況下,極大提升了模型推理能力,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI
o1
正式版。通過(guò)
DeepSeek-R1的輸出,蒸餾了6個(gè)小模型開(kāi)源給社區(qū),其中32B和70B模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)
OpenAIol-mini的效果。強(qiáng)化學(xué)習(xí):在過(guò)去的研究中,大型語(yǔ)言模型往往需要先進(jìn)行監(jiān)督微調(diào)(SFT,再結(jié)合強(qiáng)化學(xué)習(xí)來(lái)提升推理性能。然而,DeepSeek-R1-Zero直接用強(qiáng)化學(xué)習(xí)訓(xùn)練基座模型
DeepSeek-V3-Base,
不依賴任何監(jiān)督數(shù)據(jù)作為起點(diǎn),證明了大型語(yǔ)言模型只要具備合適的獎(jiǎng)勵(lì)機(jī)制,就能純粹依靠強(qiáng)化
學(xué)習(xí)自主進(jìn)化,學(xué)會(huì)復(fù)雜且深度的推理。而
DeepSeck-R1
通過(guò)冷啟動(dòng)數(shù)據(jù)和多階段訓(xùn)練,使模型
同時(shí)兼具高水平推理與高質(zhì)量表達(dá)。
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告圖6
:
S
c
aIi
ng1a
w
s請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。87…
lnssDeepsWae0000Tandem
SoskLFodFconwudaFSHam"RONT
Tep0Alterdon
00000000,InputHidenuwsd
Lm
AnerbnMLeadred
Durg
hianre
k
派
HWNomusun
Latentc001J0000資料來(lái)源:
DnpSk-V3技術(shù)報(bào)告,中國(guó)能河證券研究院
資料來(lái)酒
DvpSok-V3技術(shù)報(bào)告,中國(guó)限河證券研究院蒸餾模型:據(jù)DeepSeck-V3的技術(shù)文檔,該模型使用數(shù)據(jù)蒸餾技術(shù)生成的高質(zhì)量數(shù)據(jù)提升了
訓(xùn)練效率。通過(guò)已有的高質(zhì)量模型來(lái)合成少量高質(zhì)量數(shù)據(jù),作為新模型的訓(xùn)練數(shù)據(jù),從而達(dá)到接近于在原始數(shù)據(jù)上訓(xùn)練的效果。DeepSeck
發(fā)布了從15億到700億參數(shù)的R1蒸餾版本。這些模型基
于Qwen和Lama
等架構(gòu),表明復(fù)雜的推理能力可以被封裝在更小、更高效的模型中。蒸餾過(guò)程110Btoptw
imMTak2ilTfrkrne
L8N6oirgLhTekm中國(guó)銀河證券|
CGS
科技行業(yè)專題報(bào)告圖
7
:
D
e
e
p
S
e
e
k
V
3
的
架
構(gòu)
概
覽
②wiWe廠
②li資料來(lái)源:DeepSeekV3技術(shù)報(bào)苦,中國(guó)銀河證養(yǎng)研究院圖
B:MTP
的實(shí)現(xiàn)環(huán)節(jié)
圖
9
:FPS
訓(xùn)練混合精度框架Flgure2|llustratlionofthe
basle
arehiteetureofDeepSeek-V3.FollowingDeepSeek-V2,weadoptMLAandDepSeekMoEforeffielentinferenceandeconomkealtraining.OutoutHkddenu0000{9d
同F(xiàn)zure3ⅢlustrationofourMuli-Token
RediktimMTP
impkmentatim.WekeeptheesnMBsohgLwbe
wai
innasipat
ShadExpertCTdMOQOpt
Hdlerh(imbeangL用2k?
回to
t②
-NH(T[las.hrurTonh
klt品PPOpt
wkiinf包括使用由完整DeepSeek-R1
生成的合成推理數(shù)據(jù)對(duì)這些較小的模型進(jìn)行微調(diào),從而在降低計(jì)算
成本的同時(shí)保持高性能。讓規(guī)模更大的模型先學(xué)到高水平推理模式,再把這些成果移植給更小的模
型
。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告圖
1
0
:
知
識(shí)
蒸
餾
小
模
型General
LLM(GPT-3)Specialized
TeacherModelCounterfactual
Over-generationFilteringCounterfactual
DataDataAugmentationStudent
ModelCounterfactual:Ayounggirllooks
up
at
a
very
tall
rollercoaster
with
an
eager
and
excited
look
on
her
face.請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
10Spans:Ayounggirllooks
upassherideson
a
merry-g0-round.Original:A
younggirl
looksupas
she
rides
on
a
merry-go-round.EasyAmbigiousHardSpanExtractionDataSelectionSeed
Dataset以上的創(chuàng)新主要是利用了更好的技術(shù)手段,解決很多實(shí)際“問(wèn)題”,在理論應(yīng)用和工程上打成
平衡,體現(xiàn)了對(duì)transfomer
架構(gòu)的深度理解,成功降低了對(duì)高端硬件的依賴,為AI的發(fā)展打開(kāi)
了一條新的道路。我們認(rèn)為DeepSeck
的創(chuàng)新并沒(méi)有完全打破scaling
laws,對(duì)于計(jì)算量,模型參
數(shù)量和數(shù)據(jù)集大小,當(dāng)不受其他兩個(gè)因素制約時(shí),模型性能依然與每個(gè)因素都呈現(xiàn)冪律關(guān)系。
DepSeek
的創(chuàng)新為大模型的發(fā)展提供了新的“基準(zhǔn)”,推動(dòng)大模型發(fā)展進(jìn)入新的階段,
AI
大模型
的效率革命已經(jīng)到來(lái),而算力依然是推動(dòng)人工智能進(jìn)步核心因素之一。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
10資料來(lái)源:Cornell
Uniersiy,中國(guó)品河證券研寵院中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告(四)DeepSeek
引
領(lǐng)AI
成本革命,算法突破有望促進(jìn)算力需求正向循環(huán)DeepSeek-R1以超越美國(guó)頂尖模型的性能、更低的研發(fā)成本和較弱的芯片性能要求,引發(fā)了
美國(guó)對(duì)其AI全球領(lǐng)先地位的擔(dān)憂,同時(shí)也對(duì)科技公司在構(gòu)建AI
棋型和數(shù)據(jù)中心上的巨額投入提出
了質(zhì)疑。在DeepSeek的沖擊下,國(guó)內(nèi)外大模型廠商緊急上線新模型,采取降價(jià)、免費(fèi)等措施以證
明自身的領(lǐng)先優(yōu)勢(shì)。同時(shí),亞馬遜、英偉達(dá)、微軟等海外AI
巨頭紛紛上線部署支持用戶訪問(wèn)
DeepSeek-R1模型。2月1日,
OpenAI
發(fā)布全新推理模型o3-mini
并首次向免費(fèi)用戶開(kāi)放。這是
OpenAI
推理模型系列中最新、成本效益最高的模型。在定價(jià)方面,03-mini
每百萬(wàn)token
的輸入
(緩存未命中)/輸出價(jià)格分別為1.10美元/4.40美元,比完整版ol便宜93%
.
不過(guò),o3-mini
的
性價(jià)比或依然不及DeepSeck
。
作為對(duì)比,DeepSeek
的
API
提供的R1
模型,每百萬(wàn)token
的輸入(緩存未命中)/輸出價(jià)格僅分別為0.55美元/2.19美元。在03-mini
推出后,OpenAI
CEO表
示,中國(guó)競(jìng)爭(zhēng)對(duì)手DeepSeek
的崛起削弱了OpenAI
的技術(shù)領(lǐng)先優(yōu)勢(shì),并就開(kāi)源與閉源的問(wèn)題回應(yīng)
稱
,OpenAI
過(guò)去在開(kāi)源方面站在“歷史錯(cuò)誤的一邊”,公司曾經(jīng)開(kāi)源部分模型,但主要采用閉源
的開(kāi)發(fā)模式,未來(lái)將重新制定開(kāi)源戰(zhàn)略。與此同時(shí),國(guó)產(chǎn)大模型的降價(jià)浪潮仍在持續(xù)。1月30日,
阿里云發(fā)布百煉qwen-max
系列模型調(diào)整通知,qwen-max
、qwen-max-2025-01-25
、qwen-max-latest
三款模型輸入輸出價(jià)格調(diào)整,
qwen-max
batch
和cache
同步降價(jià),AI
大模型行業(yè)競(jìng)爭(zhēng)加劇。DeepSeek
的成本突破不僅是大模型訓(xùn)練的從“硬件驅(qū)動(dòng)”向“算法驅(qū)動(dòng)”的范式拓展,更為
普惠化應(yīng)用打開(kāi)了新空間,反映AI技術(shù)向?qū)嵱没⒌统杀净葸M(jìn)。行業(yè)對(duì)算力的依賴相較之前發(fā)
生了“結(jié)構(gòu)性”而非“總量性”變化:DeepSeek
的技術(shù)進(jìn)步短期內(nèi)或許能夠局部緩解算力壓力,
但由于算法與算力的“螺旋上升”關(guān)系、應(yīng)用場(chǎng)景的爆發(fā)式擴(kuò)展以及數(shù)據(jù)增長(zhǎng)的不可逆等特性,我
們認(rèn)為算力資源需求會(huì)從預(yù)訓(xùn)練端逐漸轉(zhuǎn)移到推理端,
DeepSeck
的興起不會(huì)削弱高端芯片需求,
而會(huì)促使大模型發(fā)展進(jìn)入“算法進(jìn)步→模型復(fù)雜化→硬件升級(jí)”的正向循環(huán)。大模型成本優(yōu)化與算力需求之間相互成就,高資源使用效率反而可能會(huì)增加算力的總消耗量。DeepSeek通過(guò)降低訓(xùn)練成本,提高訓(xùn)練效率,看似減少算力需求,但同時(shí),大模型成本縮減意味
著降低了企業(yè)的訓(xùn)練與推理門(mén)檻,即每單位成本所能提供的訓(xùn)練和推理服務(wù)更多了,算力效率提升
有望激活更廣泛的用戶與應(yīng)用場(chǎng)景,從而引發(fā)對(duì)更大參數(shù)以及更復(fù)雜的大模型迭代需求。算法優(yōu)化
(如模型壓縮、蒸餾)確實(shí)能提升單次任務(wù)效率,但AI能力的邊界擴(kuò)展(如多模態(tài)、復(fù)雜推理、通
用人工智能)仍依賴更大規(guī)模模型和更復(fù)雜計(jì)算。這可能會(huì)對(duì)均衡下的算力需求產(chǎn)生正面影響,整
體算力需求不會(huì)減少而是更加旺盛,從而形成對(duì)硬件需求的新一輪推升,即步入“算法進(jìn)步→模型
復(fù)雜化→硬件升級(jí)"的正循環(huán)。微軟首席執(zhí)行官引用了“杰文斯悖論”來(lái)解釋這一現(xiàn)象:Jevons
在《煤炭問(wèn)題》中發(fā)現(xiàn),隨著
蒸汽機(jī)效率的提升,煤炭消耗量不降反增。其核心觀點(diǎn)為:技術(shù)進(jìn)步提高了資源使用效率,效率提
高降低了資源使用成本,成本下降刺激了資源需求的增長(zhǎng),需求增長(zhǎng)可能超過(guò)效率提升帶來(lái)的節(jié)約,
最終導(dǎo)致資源總消耗增加。在算力日益成為數(shù)字經(jīng)濟(jì)“水電煤”的今天,
DeepSeek
的技術(shù)方向與
開(kāi)源定位,恰恰是算力普及化革命的關(guān)鍵參與者。我們認(rèn)為,大模型成本優(yōu)化與算力需求并不是直
接的此長(zhǎng)彼消關(guān)系,而是互相搭臺(tái)、相互成就,高資源使用效率反而可能增加算力的總消耗量。定
價(jià)的持續(xù)走低有望帶來(lái)更快的商業(yè)化落地,進(jìn)而會(huì)衍生出更多的微調(diào)及推理等需求,將逐步盤(pán)活全
球AI
應(yīng)用及算力發(fā)展。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。資料來(lái)票維基百淋,中國(guó)能阿證辦研究院二、芯片端:推理+端側(cè)發(fā)展星辰大海,高需求無(wú)虞(一)推理算力需求持續(xù)增長(zhǎng)正向影響芯片需求在OpenAI
提供的01模型后訓(xùn)練階段的縮放定律顯示,隨著強(qiáng)化學(xué)習(xí)時(shí)間和推理思考時(shí)間的
增長(zhǎng),01模型性能得到顯著提升。
DeepSeek
R1系列模型推理過(guò)程包含大量反思和驗(yàn)證,思維鏈
長(zhǎng)度可達(dá)數(shù)萬(wàn)字。隨著思考長(zhǎng)度的增加,模型性能在穩(wěn)步提升。Scaling
Law
已經(jīng)從預(yù)訓(xùn)練向推理
層轉(zhuǎn)向。
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告圖
1
1:
“
杰
文
斯
悖
論
”
-
一
高
資
源
使
用
效
率
反
而
可
能
增
加
總
消
耗
量QuanttyQuantlyderandedincreasesat
ahigherproporfon展現(xiàn)出的推理scaling
lawDeepSeek-R1-Zero080.70605rl-zero-pass@1r1-zero-Cons@1601-0912-pass@101-0912-c0ns@642000
400
6000請(qǐng)務(wù)公閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
12資料來(lái)源:DeepSek-R1
技術(shù)報(bào)告,中國(guó)銀河證券研究院圖1
2:DapSok-RI09accuracy
duringtraining二ADNE04
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告通過(guò)增加模型規(guī)模、擴(kuò)展訓(xùn)練數(shù)據(jù)、提高計(jì)算資源以及合理的任務(wù)設(shè)計(jì),可以加速模型學(xué)習(xí)更
復(fù)雜的推理能力,這一過(guò)程遵循
scaling
Law.隨著模型規(guī)模、數(shù)據(jù)量和計(jì)算資源的增加。模型能夠更好地進(jìn)行推理。OpenAl
的
0
1模型,以及其背后所強(qiáng)調(diào)的后訓(xùn)練(Post-training)和推理階段(Inference-time)的計(jì)算投入,正在重新定義我們理解AI
模型性能增長(zhǎng)的方式。通過(guò)模仿人類思考過(guò)程,進(jìn)行多步驟、多路徑的推理,最終選擇最優(yōu)的答案。這種“隱式思維鏈”(lmplicit
Chain
ofThoughu
的方法,需要在推理階段投入更多的計(jì)算資源進(jìn)行探索和評(píng)估。谷歌研究發(fā)現(xiàn),當(dāng)合理分配推理計(jì)算資源時(shí),檢索增強(qiáng)生成(RAG)的性能能夠呈現(xiàn)近乎線性
的增長(zhǎng),RAG
在長(zhǎng)上下文的大語(yǔ)言模型上的性能最高可提升58.9%。這意味著,模型的表現(xiàn)提升和
投入的計(jì)算量幾乎是成正比的,這種現(xiàn)象被稱為推理擴(kuò)展定律。也進(jìn)一步印證了,在提升推理能力
上,算力依然是最為重要的需求之
一
,無(wú)論其模型是開(kāi)源或者閉源。未
來(lái)的AI
系統(tǒng)計(jì)算開(kāi)銷(xiāo)將更多地集中在推理服務(wù)上,面非單純的預(yù)訓(xùn)練計(jì)算。這意味著算力
基礎(chǔ)設(shè)施的建設(shè)和優(yōu)化需要重新思考,以滿足日益增長(zhǎng)的推理需求。在
AI
技術(shù)的實(shí)際應(yīng)用落地過(guò)
程中,用戶感受最直觀、最強(qiáng)烈的往往是推理環(huán)節(jié)的性能表現(xiàn),雖然過(guò)去我們一直在強(qiáng)調(diào)大模型訓(xùn)
練的重要性,但真正到了全業(yè)應(yīng)用層面,推理的需求規(guī)模往往是訓(xùn)練需求的5-10倍。以字節(jié)為例,
根
據(jù)QuestMobike的數(shù)據(jù),目前抖音集團(tuán)旗下豆包app
的月活躍用戶達(dá)到了7522萬(wàn),
AI
原
生APP
在24年12月的月活躍用戶規(guī)模達(dá)到了1.2億,同比增速達(dá)到232%。典型互聯(lián)網(wǎng)企業(yè)人原生App產(chǎn)品矩陣e原生p書(shū)廣
棋
師7,
6續(xù)合錄A1場(chǎng)景分露隆S直油最夢(mèng)160直湯最維生成程桶生城保星繪5直場(chǎng)錄圖生成0
悟
空直湯錄辦會(huì)0小言12L1續(xù)合錄百度集團(tuán)C挫箱通義aT2綜介場(chǎng)景
壞介場(chǎng)景阿
E
e
妙相機(jī)2直錄圖維生成3性素30004.6最場(chǎng)量推直資料來(lái)源:QucstMobik,中國(guó)銀河證券研究院資得來(lái)源:QwerMobilr.中國(guó)規(guī)河證券研究院QuestMobile
數(shù)據(jù)顯示,2024年12月,AI
原
生App
整體月人均使用時(shí)長(zhǎng)達(dá)133.0分鐘,較
1月增加53.4分鐘;月人均使用次數(shù)從1月的26.1次增加至49,6次,考慮到未來(lái)的潛在推理需
求,預(yù)計(jì)將推動(dòng)國(guó)內(nèi)推理算力需求的持續(xù)增長(zhǎng)。目前2024年豆包大模型的日均
token
調(diào)用量在
40000億左右,預(yù)估2025年日均token
調(diào)用量將提升到最高40萬(wàn)億,將大幅提升對(duì)推理算力的需
求。國(guó)產(chǎn)算力寒武紀(jì)、海光信息等廠商有望受益。平
經(jīng)
:
幅
你
用
戶
回
畫(huà)
率
as
inswn
snamaaea圖14:2024年原生APP整體月活躍用戶規(guī)模及同比增速
圖1
3:
互
聯(lián)網(wǎng)
企
業(yè)
A
工
原
生
A
P
P
產(chǎn)品
矩陣
請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證養(yǎng)股份有限公司免責(zé)聲明。
13分類產(chǎn)品類別工作波長(zhǎng)產(chǎn)品特性應(yīng)用場(chǎng)景激光器芯片VCSEL800-900nm線寬窄,功耗低,調(diào)制速率高,耦合效率高,
傳輸距離短,線性度差500米內(nèi)短距離傳輸,數(shù)據(jù)中心機(jī)柜內(nèi)布傳輸,消費(fèi)電子等領(lǐng)域FP1310-1550nm調(diào)制速率高,成本低,耦合效率低,先行督察中速度無(wú)線接入短距離市場(chǎng),部分應(yīng)
用場(chǎng)景逐步被DFB激光器芯片取代DFB1270-1610nm譜線窄,調(diào)制速率高,波長(zhǎng)穩(wěn)定,耦合效率低中長(zhǎng)距離傳輸,如FTTx接入網(wǎng)、傳
輸網(wǎng)、無(wú)線基站、數(shù)據(jù)中心內(nèi)部互聯(lián)等EIL1270-1610nm調(diào)制頻率高,穩(wěn)定性好,傳輸距離長(zhǎng),成本高長(zhǎng)距離傳輸,高速率遠(yuǎn)距離的電信骨干網(wǎng),城域網(wǎng)和DCI探測(cè)器芯片PIN830-860/1100-1600mn噪聲小,工作電壓低,成本低,靈敏度低中長(zhǎng)距離傳輸■月人均使用時(shí)長(zhǎng)+53.4分鐘312088.9
84.1
87.898.079.66002024-112024-120(二)后訓(xùn)練增長(zhǎng)及國(guó)產(chǎn)化需求提升有望帶動(dòng)光芯片需求增長(zhǎng)光芯片是光模塊核心器件,應(yīng)用場(chǎng)景較廣。光芯片分為激光器芯片及探測(cè)器芯片,當(dāng)前人工智
能相關(guān)光模塊內(nèi)光芯片主要以VCSEL及EML芯片為主,高速率光芯片主要以VCSEL芯片為主,
該款芯片具備線寬窄,功耗低,調(diào)制速率高,耦合效率高,傳輸距離短等特點(diǎn),主要應(yīng)用于500米
內(nèi)短距離傳輸,集中在數(shù)據(jù)中心機(jī)柜內(nèi)布傳輸,消費(fèi)電子等領(lǐng)域:EML芯片則由于其調(diào)制頻率高,
穩(wěn)定性好。傳輸距離長(zhǎng)等特性,廣泛應(yīng)用于長(zhǎng)距離傳輸,高速率遠(yuǎn)距離的電信骨干網(wǎng),城域網(wǎng)和
DC等領(lǐng)域,但其具備成本較高的特性,雖然可以部署于短距離傳輸市場(chǎng)中,但不具備性價(jià)比優(yōu)勢(shì)。表1:光芯片按功能分類
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告圖
1
5:
2
0
2
4
年
A
I
原
生
A
P
P
整
體
月
均
使
用
時(shí)
長(zhǎng)
和
次
數(shù)
趨
勢(shì)
2024年A1原生App
整體月人均使用時(shí)長(zhǎng)及次數(shù)趨勢(shì)
40
26.0
28.9-
3L.1
33.7
34.932.9
35.135.2
43.749.62024-012024-022024-032024-042024-052024-062024-072024-08202-092024-10資料來(lái):QwsnMoble,
中因配河證券研究院1212107.5
103.9單位:分鐘
18080單位:次■月人均使用次數(shù)+23.5次95.6115.9118.1AP01270-1610rm靈敏度高,成本高長(zhǎng)距離單模光纖資料來(lái)囂中商防報(bào)網(wǎng),中國(guó)艦河證券研究院光芯片市場(chǎng)規(guī)棋持續(xù)提升,推理側(cè)算力部暑加速及國(guó)產(chǎn)化進(jìn)程加連有望直接帶動(dòng)行業(yè)增長(zhǎng)。隨請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
14
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,對(duì)高速、高效、低能耗的數(shù)據(jù)傳輸需求日益增長(zhǎng),光芯片的市場(chǎng)需求也隨之增加,推動(dòng)全球光芯片市場(chǎng)規(guī)模持續(xù)擴(kuò)大,根據(jù)中商產(chǎn)業(yè)研究院發(fā)布的
《2024-2029年全球及中國(guó)光芯片行業(yè)發(fā)展趨勢(shì)與投資格局研究報(bào)告》顯示,2023年全球光芯片市
場(chǎng)規(guī)模約27.8億美元,較上年增長(zhǎng)14.4%。中商產(chǎn)業(yè)研究院預(yù)測(cè),2024年全球光芯片市場(chǎng)規(guī)模將達(dá)到31.7億美元。隨著國(guó)產(chǎn)替代的加連推進(jìn),中國(guó)光芯片市場(chǎng)規(guī)模持續(xù)增長(zhǎng),并展現(xiàn)出強(qiáng)勁的發(fā)展
勢(shì)頭。中商產(chǎn)業(yè)研究院發(fā)布的《2024-2029年全球及中國(guó)光芯片行業(yè)發(fā)展趨勢(shì)與投資格局研究報(bào)告》
顯示,2023年中國(guó)光芯片市場(chǎng)規(guī)模約為137.62億元,較上年增長(zhǎng)10.24%。中商產(chǎn)業(yè)研究院預(yù)測(cè),
2024年中國(guó)光芯片市場(chǎng)規(guī)模將增長(zhǎng)至151.56億元。從國(guó)產(chǎn)化率來(lái)看,國(guó)內(nèi)相關(guān)企業(yè)僅在2.5G和
10G光芯片領(lǐng)域?qū)崿F(xiàn)核心技術(shù)的掌握,2.5G
及以下速率光芯片國(guó)產(chǎn)化率超過(guò)90%;10G光芯片國(guó)
產(chǎn)
化
率
約
6
0
%;
2
5Ghs
及以上的光芯片國(guó)產(chǎn)化率低,僅有4%.預(yù)計(jì)隨著推理側(cè)算力部署的逐步增
多,以及后訓(xùn)練算力的規(guī)模提升,相對(duì)較低速率光芯片市場(chǎng)空問(wèn)將進(jìn)一步提升,在我國(guó)光芯片相關(guān)企業(yè)有望直接受益。圖16:全球光芯片市場(chǎng)規(guī)模
圖17:我國(guó)光芯片市場(chǎng)規(guī)模200億元
150億元
100億元50億元
0億元20.00%15.00%10.00%5.00%0.00%201920202021
20222023
2024全球市場(chǎng)規(guī)模我國(guó)市場(chǎng)規(guī)模
YoY資料來(lái)慕中商報(bào)網(wǎng),中國(guó)證券研究院
資料來(lái)源:中商情批網(wǎng),中國(guó)紙河證券研究院40億美元30億美元
20億美元
10億美元0億美元1000%5.00%0.00%2021
2022
202420.00%15.00%
YoY請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。15(
一
)
運(yùn)
營(yíng)
商
、
光
模
塊
等
細(xì)
分
板
塊
仍
舊
具
備
較
大
投
資
價(jià)
值我們認(rèn)為DeepSeek
對(duì)通信行業(yè)的推動(dòng)作用主要體現(xiàn)在兩方面:1)強(qiáng)化國(guó)產(chǎn)算力產(chǎn)業(yè)鏈:為中國(guó)AI
發(fā)展帶來(lái)新機(jī)遇,為中美科技競(jìng)爭(zhēng)增添變數(shù)。
DeepSeek-RI/V3
支持華為昇騰平臺(tái)及MindIE
引擎,自研推理加速引擎使硅基流動(dòng)與華為云昇騰服務(wù)上的模
型效果媲美高端GPU,同時(shí)降低成本,這一突破為AI
生態(tài)提供自主多元化方案,助力我國(guó)本土芯
片廠商商業(yè)化落地,促進(jìn)高效能AI
的普及。2)提升中國(guó)AI
國(guó)際影響力:
DeepSeek-R1的開(kāi)源實(shí)踐標(biāo)志著開(kāi)源模式對(duì)閉源模式的一次重
要?jiǎng)倮@一開(kāi)源模式對(duì)社區(qū)的貢獻(xiàn)能夠迅速轉(zhuǎn)化為整個(gè)開(kāi)源社區(qū)的繁榮。中小企業(yè)和個(gè)人開(kāi)發(fā)者
等長(zhǎng)尾市場(chǎng)原本因成本限制無(wú)法參與的領(lǐng)域(如小規(guī)模模型微調(diào)、實(shí)驗(yàn)性研究)將被激活,形成分
散的算力需求增量,產(chǎn)業(yè)或?qū)⒂瓉?lái)結(jié)構(gòu)性變化,有望為AI技術(shù)的多元化創(chuàng)新增添更多可能性。同
時(shí)
,AI
加速走向千行百業(yè),智能駕駛、機(jī)器人、元宇宙等新興領(lǐng)域?qū)?shí)時(shí)計(jì)算和低延遲的高要求,
將持續(xù)助推高算力需求。
DeepSeek
迅速吸引了全球開(kāi)發(fā)者矚目,曾短時(shí)間內(nèi)即在蘋(píng)果中國(guó)及美國(guó)
應(yīng)用商店免費(fèi)應(yīng)用下載榜超越ChatGPT
登頂,彰顯了中國(guó)AI
技術(shù)以更開(kāi)放姿態(tài)融入全球。未來(lái)創(chuàng)
新將聚焦于效率、開(kāi)放性和生產(chǎn)力轉(zhuǎn)化,DeepSeek
或成全球AI
科技發(fā)展轉(zhuǎn)折點(diǎn)。雖然DeepSeek的推出,對(duì)降低推理側(cè)成本帶來(lái)巨大降低,但我們認(rèn)為推理側(cè)的成本降低,將
顯著帶來(lái)訓(xùn)練測(cè)迭代的加速,由于推理側(cè)成本的降低,應(yīng)用場(chǎng)景落地或?qū)⑦M(jìn)一步加速,推動(dòng)推理側(cè)
模型效率的進(jìn)一步提升,從而帶動(dòng)通信行業(yè)相關(guān)方向的持續(xù)性繁榮。故而我們維持此前對(duì)通信細(xì)分
子領(lǐng)域運(yùn)營(yíng)商、光芯片、光模塊的推薦方向,認(rèn)為DeepSeek
的推出,運(yùn)營(yíng)商作為我國(guó)最大的流量
管道,具備數(shù)據(jù)優(yōu)勢(shì)及接口優(yōu)勢(shì),
AI
應(yīng)用的普及將持續(xù)推進(jìn),同時(shí),更強(qiáng)訓(xùn)練模型的未來(lái)需求將帶
動(dòng)光模塊產(chǎn)業(yè)鏈快速發(fā)展,在全球經(jīng)濟(jì)形勢(shì)復(fù)雜化趨勢(shì)下,核心器件光芯片等方向自主可控進(jìn)程進(jìn)
一
步加速。未來(lái)5年數(shù)通市場(chǎng)的增長(zhǎng)驅(qū)動(dòng)力主要來(lái)自400G以上高速率光棋塊的需求。
全球云計(jì)算服務(wù)提
供商對(duì)計(jì)算能力和帶寬需求的持續(xù)增長(zhǎng),以及他們?cè)诜?wù)器、交換機(jī)和光模塊等硬件設(shè)備上的資本
支出的增加,將推動(dòng)光模塊產(chǎn)品向更高速率的800G
、1.6T
甚至更高端產(chǎn)品的迭代升級(jí)。根據(jù)我們
估算,全球光模塊400G客戶主要集中于亞馬進(jìn)(約45%)和谷歌(約25%)、800G主要集中于
英偉達(dá)(約50%)、谷歌(約30%)和Meta
(約20%)等,2025年1.6T光模塊的主要需求方預(yù)計(jì)
將是英偉達(dá)和谷歌。在GTC2024大會(huì)上,英偉達(dá)發(fā)布了其最新產(chǎn)品GB200,其服務(wù)器與交換機(jī)端
口速率也實(shí)現(xiàn)了翻倍提升,更有望引領(lǐng)AI
光模塊從現(xiàn)有的800G
向更高性能的1.6T升級(jí)。此外,英偉達(dá)明確了2026年將使用1.6T網(wǎng)卡,對(duì)應(yīng)3.2T光模塊需求,明確了光模塊升級(jí)迭代的節(jié)奏。LightCounting
預(yù)測(cè),到2029年,400G+市場(chǎng)預(yù)計(jì)將以28%以上的復(fù)合年增長(zhǎng)率(每年約16億美
元以上)擴(kuò)張,達(dá)125億美元。其中800G和1
.
6T
產(chǎn)品的增長(zhǎng)尤為強(qiáng)勁,這兩個(gè)產(chǎn)品共占400G+
市場(chǎng)的一半以上。與此同時(shí),200G
以下速率光模塊產(chǎn)品的市場(chǎng)規(guī)模預(yù)計(jì)將以每年約10%的速度縮
減。光模塊頭部廠商產(chǎn)品的高度可靠性、領(lǐng)先的研發(fā)實(shí)力及交付能力等優(yōu)勢(shì)將進(jìn)一步凸顯,行業(yè)集
中度有望進(jìn)一步提高。因此,那些能夠與客戶同步研發(fā)、快速融入客戶供應(yīng)鏈,并能提前把握客戶
需求的光模塊廠商,將有機(jī)會(huì)在產(chǎn)品更新?lián)Q代時(shí)搶先獲利。
中國(guó)銀河證券|CGS
科技行業(yè)專題報(bào)告三
、硬件端:光通信仍然靚麗,智能硬件邊際改善請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。
16高速光模塊的應(yīng)用導(dǎo)致網(wǎng)絡(luò)設(shè)備功耗大幅增加,硅光等新技術(shù)加固護(hù)城河。在以400G
和80
.
0G
光模塊為典型配置的51.2T和100T交換機(jī)中,光模塊加驅(qū)動(dòng)SerDes
的功耗占比
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 代駕服務(wù)車(chē)輛保險(xiǎn)責(zé)任合同
- 休閑餐飲品牌區(qū)域代理銷(xiāo)售協(xié)議范本
- 2024屆福建省泉州市南安市達(dá)標(biāo)名校中考沖刺卷數(shù)學(xué)試題含解析
- 2024屆甘肅省武威九中重點(diǎn)名校中考數(shù)學(xué)對(duì)點(diǎn)突破模擬試卷含解析
- 公司跟單提成管理制度
- 創(chuàng)新中小企業(yè)管理制度
- 2025至2030中國(guó)住房公積金應(yīng)用規(guī)模與運(yùn)營(yíng)模式創(chuàng)新策略報(bào)告
- 2025至2030中國(guó)產(chǎn)業(yè)園行業(yè)發(fā)展分析及投融資與運(yùn)營(yíng)策略報(bào)告
- 2025至2030中國(guó)互聯(lián)網(wǎng)+服裝行業(yè)發(fā)展趨勢(shì)分析與未來(lái)投資戰(zhàn)略咨詢研究報(bào)告
- 醫(yī)藥公司內(nèi)勤管理制度
- 代加工物料管理制度
- 模切安全生產(chǎn)培訓(xùn)
- 安寧療護(hù)之疼痛管理
- AI驅(qū)動(dòng)的智能汽車(chē)故障診斷系統(tǒng)
- 水土保持方案編制經(jīng)費(fèi)預(yù)算書(shū)
- 中國(guó)中鐵股份有限公司內(nèi)部控制運(yùn)行管理辦法試行
- 2025濰坊輔警考試題庫(kù)
- 危險(xiǎn)性較大的分部分項(xiàng)工程專項(xiàng)施工方案嚴(yán)重缺陷清單(試行)
- 四川省 2025屆高考?xì)v史全真模擬試題(含解析)
- 采購(gòu)管理數(shù)字化轉(zhuǎn)型-深度研究
- 2025年助理會(huì)計(jì)考試試題及答案
評(píng)論
0/150
提交評(píng)論