DeepSeek技術(shù)顛覆-創(chuàng)新共贏DeepSeek大模型分享與展望-清華大學(xué)DeepSeek大模型概念、技術(shù)與應(yīng)用實(shí)踐(讀懂大模型)_第1頁(yè)
DeepSeek技術(shù)顛覆-創(chuàng)新共贏DeepSeek大模型分享與展望-清華大學(xué)DeepSeek大模型概念、技術(shù)與應(yīng)用實(shí)踐(讀懂大模型)_第2頁(yè)
DeepSeek技術(shù)顛覆-創(chuàng)新共贏DeepSeek大模型分享與展望-清華大學(xué)DeepSeek大模型概念、技術(shù)與應(yīng)用實(shí)踐(讀懂大模型)_第3頁(yè)
DeepSeek技術(shù)顛覆-創(chuàng)新共贏DeepSeek大模型分享與展望-清華大學(xué)DeepSeek大模型概念、技術(shù)與應(yīng)用實(shí)踐(讀懂大模型)_第4頁(yè)
DeepSeek技術(shù)顛覆-創(chuàng)新共贏DeepSeek大模型分享與展望-清華大學(xué)DeepSeek大模型概念、技術(shù)與應(yīng)用實(shí)踐(讀懂大模型)_第5頁(yè)
已閱讀5頁(yè),還剩103頁(yè)未讀 繼續(xù)免費(fèi)閱讀

VIP免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DeepSeek:

技術(shù)顛覆or

創(chuàng)新共贏中國(guó)銀河證券|CGS計(jì)算機(jī)行業(yè)首席分析師:吳硯靖:通信行業(yè)首席分析師:趙良畢:電子行業(yè)首席分析師:高峰:傳媒行業(yè)分析師:岳錚。計(jì)算機(jī)行業(yè)分析師:鄒文倩、李璐昕,研究助理胡天昊、馮雨淇;通信行業(yè)分析師:趙中興:傳媒行業(yè)研究助理:祁天睿。www.chinastock.com.cn

證券研究報(bào)告請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明核心觀點(diǎn)●DeepSeek

通過(guò)算法及工程創(chuàng)新,顯著降低成本,技術(shù)變革算力新方向:DeepSoek

模型通過(guò)使用PTX

編程語(yǔ)言,以及工程能力上的創(chuàng)新,使得其在

具有更強(qiáng)的性能的同時(shí),實(shí)現(xiàn)更低的訓(xùn)練與推理成本,或?qū)⒓铀偻苿?dòng)AI應(yīng)

與硬件的普及和落地。與市場(chǎng)認(rèn)為的不同,我們認(rèn)為更低的訓(xùn)練與推理成本對(duì)

算力需求呈現(xiàn)短期減少,長(zhǎng)期高增的趨勢(shì),AI

能力邊際擴(kuò)張依然需要依賴更

大的模型和強(qiáng)大的算力,DeepSeek

在算法和架構(gòu)上的創(chuàng)新給AI

發(fā)展增加了

一條新的道路,有望開(kāi)拓AI

行業(yè)的共贏局面。●

結(jié)合我們對(duì)芯片、硬件、軟件、應(yīng)用端等的影響分析,我們認(rèn)為DeepSeek的技術(shù)順夏帶來(lái)的是AI

行業(yè)的多元化,有望加速AI

行業(yè)的普及繁榮,具

體細(xì)分到行業(yè)子板塊來(lái)看:電子板塊

-

后訓(xùn)練時(shí)代看好推理側(cè)算力部署,以及AI

側(cè)

:DeepSeek

的創(chuàng)新并沒(méi)有完全打破scalinglaxs,且正從pre-trainíng轉(zhuǎn)

向post-training

和推理,通過(guò)增加模型規(guī)模、擴(kuò)展訓(xùn)練數(shù)據(jù)、提高計(jì)算資源以

及合理的任務(wù)設(shè)計(jì),可加速模型學(xué)習(xí)更復(fù)雜的推理能力。隨著模型規(guī)模、數(shù)據(jù)

量和計(jì)算資源的增加,模型能夠更好地進(jìn)行推理,通過(guò)平衡性能、內(nèi)存占用和

推理速度來(lái)提高大語(yǔ)言模型的運(yùn)行效率,有利于AI

硬件端的落地與普及。通信板塊-推理側(cè)算力有望增加利好國(guó)產(chǎn)光芯片,看好AI

時(shí)

運(yùn)

營(yíng)

轉(zhuǎn)換,光模塊景氣度無(wú)虞。我們認(rèn)為運(yùn)營(yíng)商作為我國(guó)最大的流量管道,具備

數(shù)據(jù)優(yōu)勢(shì)及接口優(yōu)勢(shì),

AI

應(yīng)用的普及將持續(xù)推進(jìn),同時(shí),更強(qiáng)訓(xùn)練模型的未

來(lái)需求將帶動(dòng)光模塊產(chǎn)業(yè)鏈快速發(fā)展,在全球經(jīng)濟(jì)形勢(shì)復(fù)雜化趨勢(shì)下,核心器

件光芯片等方向自主可控進(jìn)程進(jìn)一步加速。計(jì)算機(jī)板塊-看好算力向推理,基礎(chǔ)設(shè)施向應(yīng)用側(cè)投資變化機(jī)遇:當(dāng)下投資

中的結(jié)構(gòu)性機(jī)會(huì)主要體現(xiàn)在"從訓(xùn)練算力為主到推理算力為主過(guò)渡"、“從高

端GPU

ASIC

芯片過(guò)渡",以及“從基礎(chǔ)設(shè)施投資機(jī)會(huì)向應(yīng)用側(cè)投資機(jī)會(huì)

過(guò)渡"。其開(kāi)源策略和低成本模型使得更多企業(yè)和開(kāi)發(fā)者能夠使用先進(jìn)的

AI技術(shù),加速了AI

技術(shù)在各行業(yè)的應(yīng)用和發(fā)展。傳媒板塊-大棋型推陳出新進(jìn)程加速,AI+

進(jìn)

時(shí)

:在

C端,用戶滲透

率不斷提升,主要AI

APP活躍數(shù)據(jù)持續(xù)環(huán)比增長(zhǎng):在B

端,AI

營(yíng)銷(xiāo)等領(lǐng)域的商業(yè)化模式已經(jīng)逐步得到驗(yàn)證。

DeepSeek有望加速推動(dòng)在影視、廣告、社交陪伴等多個(gè)領(lǐng)域AI+應(yīng)用落地。●

:建議關(guān)注電子板塊消費(fèi)電子相關(guān)產(chǎn)業(yè)鏈、AI

終端硬件等方向:通

信板塊運(yùn)營(yíng)商、光模塊、光芯片等方向:計(jì)算機(jī)板塊看好邊緣算力、

AI

應(yīng)

開(kāi)發(fā)、數(shù)據(jù)服務(wù)與處理、端側(cè)AI

設(shè)備等方向:傳媒板塊“AI+”等細(xì)分子領(lǐng)域

方向。●

風(fēng)

險(xiǎn)

:國(guó)際經(jīng)濟(jì)形勢(shì)復(fù)雜度進(jìn)一步提升的風(fēng)險(xiǎn):AI

硬件發(fā)展速度不及預(yù)期的風(fēng)險(xiǎn):AI

產(chǎn)業(yè)鏈上下游短期波動(dòng)的風(fēng)險(xiǎn):

AI應(yīng)用發(fā)展不及預(yù)期的風(fēng)險(xiǎn)等。2025年02月03日分析師超良畢首席通信分析師窗:010-8092-7619兇:zhaoliangbi_yj@chinastock.com.cn分析師登記編碼:SO130522030003吳硯靖首席計(jì)算機(jī)分析師窗:wuyanjing(@chinustoccn分析師登記編碼:S0130619070001高峰首席電子分析師窗:gaofeng

yi

@chinastockcomcn分析師登記編碼:S0130622040001岳錚傳媒分析師窗:010-8092-7630兇:yuezhengyj@chinastock,comcn分析師登記編碼:S0130522030006計(jì)算機(jī)行業(yè)分析師:鄒文倩,登記編碼:SD130519060003、

李聘聽(tīng),登記編碼:S0130521040001

研究助理胡天昊、馮雨淇;通信行業(yè)分析師:趙中興,登記編碼:S0130524090002;中國(guó)銀河證券|

CGS科技行業(yè)專題報(bào)告DeepSeek:

技術(shù)顛覆or

創(chuàng)新共贏請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。傳媒行業(yè)研究助理:祁天睿2中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告目錄Catalog一

、DeepSeek

:算法革命帶動(dòng)AI景氣進(jìn)一步上行

……………4(一)

DeepSeek

公司成立背景與發(fā)展歷程…………………4(二)

DeepSeek

:從硬件競(jìng)賽到算法效率革命的技術(shù)順覆………………

5(三)

DeepSeek

開(kāi)辟了效率提升新賽道,創(chuàng)新優(yōu)勢(shì)明顯…………………7(四)

DeepSeek

引領(lǐng)AI

成本革命,算法突破有望促進(jìn)算力需求正向循環(huán)……………11二

、芯片端:推理+端側(cè)發(fā)展星辰大海,高需求無(wú)成

…………

12(一)

推理算力需求持續(xù)增長(zhǎng)正向影響芯片需求……………………………12(二)后訓(xùn)練增長(zhǎng)及國(guó)產(chǎn)化需求提升有望帶動(dòng)光芯片需求增長(zhǎng)……………………………14三

、硬件端:光通信仍然靚麗,智能硬件邊際改善……………16(一)運(yùn)營(yíng)商、光模塊等細(xì)分板塊仍舊具備較大投資價(jià)值…………………………………16(二)

端側(cè)大模型落地,智能硬件迎來(lái)星辰大海……………20四

、軟件端:大模型演進(jìn)加速,看好AI

Agent發(fā)

展…………………………27(一)DeepSeek加

速AGI到來(lái),大模型從“訓(xùn)練”向“推理”演進(jìn)……………………27(二)AIAgent崛

,B

端+C端應(yīng)用開(kāi)啟新篇章

…………28五

、應(yīng)

:AI+賦能進(jìn)行時(shí),行業(yè)加速繁榮可期……………………………30(一)開(kāi)源的生態(tài)推動(dòng)AI行業(yè)高速發(fā)展………………………30(二)A

I應(yīng)用:“AI

+”行業(yè)應(yīng)用百花齊放…………………………………32六

、投資建議:硬件產(chǎn)業(yè)鏈加速發(fā)展,應(yīng)用端方興未艾………………………37(一)

電子板塊:Scaling

Laws轉(zhuǎn)向后訓(xùn)練,計(jì)算效率提升至關(guān)重要……………………37(二)通信板塊:運(yùn)營(yíng)商、光模塊及光芯片子板塊動(dòng)能強(qiáng)勁………………38(三)計(jì)算機(jī)板塊:看好算力向推理,基礎(chǔ)設(shè)施向應(yīng)用側(cè)投資變化機(jī)遇…………………………………39(

四)傳媒板塊:DeepSeek

加速AI

向低成本發(fā)展,看好AI

+應(yīng)用落地………………

40七

風(fēng)

險(xiǎn)

……………………

41請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。資柯來(lái)源

DaySnkAPY文輝,中國(guó)品河證券研究院DeepSeck的團(tuán)隊(duì)成員大多來(lái)自清華大學(xué)、北京大學(xué)、中山大學(xué)、北京郵電大學(xué)等國(guó)內(nèi)頂尖高校,

整體呈現(xiàn)出“年輕高學(xué)歷、注重開(kāi)源、重視創(chuàng)新”的特點(diǎn)。根據(jù)彭博社報(bào)道,

DeepSeek

AI

助手在140個(gè)市場(chǎng)中成為下載量最多的移動(dòng)應(yīng)用。根據(jù)

Appfigures

的數(shù)據(jù),

DeepSeek

的推理人工智能聊天機(jī)器人在1月26日登上蘋(píng)果公司AppStore

榜首并保持全球第一,1月28日起在美國(guó)的AndroidPlayStore中也位居榜首。根據(jù)SensorTower的數(shù)據(jù),

DeepSeek

在發(fā)布后的前18天內(nèi)獲得了1600萬(wàn)次下載,約為OpenAI

的ChatGPT

發(fā)布時(shí)

900萬(wàn)下載量的兩倍,印度貢獻(xiàn)了所有平臺(tái)下載量的15.6%。在用戶體驗(yàn)方面,DeepSeek

表現(xiàn)不俗。用戶普遍認(rèn)為DeepSeekR1

的性能出色,特別是在數(shù)

學(xué)推理、編程能力和自然語(yǔ)言理解等領(lǐng)域。其推理速度和準(zhǔn)確度在多個(gè)測(cè)試場(chǎng)景中達(dá)到業(yè)界領(lǐng)先水平。此

外,DeepSeekRI的“聰明”特性使得用戶無(wú)需復(fù)雜的提示詞技巧,即可獲得高質(zhì)量的回答。在實(shí)際使用場(chǎng)景中,無(wú)論是游戲、視頻播放還是日常工作的輔助,其流暢的操作體驗(yàn)都得到了用戶的高度

評(píng)價(jià),用戶反饋顯示,DeepSeek

界面簡(jiǎn)潔直觀、操作簡(jiǎn)單,在實(shí)時(shí)數(shù)據(jù)推送和內(nèi)容推薦上十分出色,能夠有效提升工作效率,減少用戶在信息檢索上的時(shí)間投入。DeepSeekRI

的發(fā)布引起了硅谷科技領(lǐng)袖、國(guó)際媒體及學(xué)術(shù)界的廣泛關(guān)注。其性能和開(kāi)源策略獲

得了高度評(píng)價(jià),被認(rèn)為是“非美國(guó)公司踐行OpenAI初心”的典范。

DeepSeekRI

的發(fā)布引發(fā)了全

球科技市場(chǎng)的連鎖反應(yīng)。其開(kāi)源策略、低成本、高性能的特性,對(duì)科找巨頭形成了壓力。其訓(xùn)練成本

僅為600萬(wàn)美元,遠(yuǎn)低于OpenAI

和谷歌等公司的同類模型,《MITTechnologyReview》提

,R1

在數(shù)學(xué)、代碼等復(fù)雜任務(wù)上的表現(xiàn)與OpenAlol

相當(dāng),而訓(xùn)練成本僅為其1/70,定價(jià)低至OpenAI的3%。這種成本效益優(yōu)勢(shì)使得更多企業(yè)和開(kāi)發(fā)者能夠以較低的成本使用先進(jìn)的AI

技術(shù),將大大加

AI

技術(shù)的普及和應(yīng)用。圖1:DeepSeek

發(fā)展歷程正式發(fā)布DepSsck

R1模型,在大模DeepSek

成Lie

預(yù)覽版正中其基在測(cè)試升至Q合并Deep

宜布

快型第三。2024年1月s324

年2縣2023年7月

2024年5月

2021年11前個(gè)版本上線025年1月發(fā)布首個(gè)大模ln(一)DeepSeek

公司成立背景與發(fā)展歷程DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司。由幻方量化的聯(lián)合創(chuàng)始人梁文

峰創(chuàng)立。公司自2023年7月年成立以來(lái),始終專注于大語(yǔ)言模型

(LLMO

及其相關(guān)技術(shù)的深度研發(fā)。公司堅(jiān)持技術(shù)創(chuàng)新路線,開(kāi)創(chuàng)性地提出多頭潛在注意力機(jī)制(MLA)和DeepSeekMoE等

創(chuàng)

新架構(gòu)。憑借這些創(chuàng)新成果,DeepSeek

的大模型在多項(xiàng)權(quán)威測(cè)評(píng)中展現(xiàn)出頂尖的性能表現(xiàn)。一、DeepSeek:

算法革命帶動(dòng)AI景氣進(jìn)一步上行宣布開(kāi)源第二代MoE

大模型中國(guó)銀河證券科技行業(yè)專題報(bào)告型排名Arena痊理模型CGS請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告(二)DeepSeek:從硬件競(jìng)賽到算法效率革命的技術(shù)顛覆大模型在AI

行業(yè)中占據(jù)核心地位,是推動(dòng)技術(shù)創(chuàng)新、拓展應(yīng)用場(chǎng)最及提升行業(yè)效率的關(guān)鍵因

素。全球范圍內(nèi)的領(lǐng)軍企業(yè)持續(xù)推動(dòng)大模型性能的提升,隨著模型規(guī)模的不斷擴(kuò)張,其性能也實(shí)現(xiàn)

了顯著提升。然而,這種規(guī)模的擴(kuò)大也相應(yīng)地帶來(lái)了訓(xùn)練和部署成本的急劇增加,成為制約大模型

廣泛應(yīng)用的瓶頸。在機(jī)器學(xué)習(xí)領(lǐng)域,尤其是大型語(yǔ)言模型(LLMs)的應(yīng)用場(chǎng)景中,模型性能的提升與模型規(guī)模、

數(shù)據(jù)集的大小以及計(jì)算資源之間存在著緊密的關(guān)聯(lián),這一關(guān)系通常被描述為“規(guī)模定律”(ScalingLaw)

根據(jù)規(guī)模定律,模型的性能會(huì)隨著模型規(guī)模的指數(shù)級(jí)增加而實(shí)現(xiàn)線性提升。目前,國(guó)際上

主流的大模型,諸如OpenAI

GPT

系列、Anthropic

Claude

以及谷歌的Gemini

等,其最

新版本的規(guī)模均已突破千億參數(shù)大關(guān)。盡管這些模型在性能上展現(xiàn)出了卓越的表現(xiàn),但對(duì)于眾多公

司和開(kāi)發(fā)者而言,其高昂的硬件資源使用成本、計(jì)算時(shí)間等依然構(gòu)成了巨大的挑戰(zhàn)。長(zhǎng)期以來(lái),大

算力訓(xùn)練一直是基座模型廠商用于融資與構(gòu)建竟?fàn)幈趬镜闹匾侄巍募夹g(shù)層面來(lái)看,GPU

等硬件設(shè)施效率的提升以及算法的優(yōu)化等方式,均有望帶動(dòng)大模型成本

的顯著下降。在全球GPU

短缺以及美國(guó)限制政策的雙重壓力下,我國(guó)的人工智能公司DeepSeek通過(guò)算法優(yōu)化的創(chuàng)新路徑,進(jìn)一步降低了訓(xùn)練成本,為大模型的大規(guī)模應(yīng)用提供了前所未有的可能

性,DeepSeek

在1月20日正式發(fā)布了其RI

模型,并同步開(kāi)源了模型權(quán)重。在第三方的基準(zhǔn)測(cè)試

中,DeepSeek-R1的表現(xiàn)優(yōu)于OpenAI

、Meta

Anthropic

等美國(guó)領(lǐng)先的人工智能公司。在

AIME2024

數(shù)學(xué)基準(zhǔn)測(cè)試中,DeepSeek-R1

的成功率高達(dá)79.8%,成功超越了OpenAI

ol

推理

模型。在標(biāo)準(zhǔn)化編碼測(cè)試中,DeepSeek-RI

更是展現(xiàn)出了“專家級(jí)”的性能,在Codeforces

上獲

得了2029Elo

的評(píng)級(jí),并超越了96.3%的人類競(jìng)爭(zhēng)對(duì)手。

時(shí)

,DeepSeek-R1

真正令人矚目的地

方并不僅僅在于其卓越的性能,而在于其極低的成本。它打破了硅谷傳統(tǒng)的“堆算力、拼資本”的

發(fā)展路徑,僅用557.6萬(wàn)美元和2048塊英偉達(dá)H800GPU便完成了性能對(duì)標(biāo)GPT-40的模型訓(xùn)練,成本僅為OpenAI

同類模型的十分之一,推理成本更是低至每百萬(wàn)Token

0.14

美元,而OpenAI的推理成本則為7.5美元每百萬(wàn)Token.圖2:DeepSeek

性能對(duì)齊0penAI-l正式版DopSek-Rl-penAI-o1-1217一

DwpSesk-RI-328OpenAlol-minDwpSwkV300250輸入IP

價(jià)

AA

春在未曲中)0S

a

MMLUsE-tachVorifad

38Tn)d班料來(lái)品

DepSeek言網(wǎng),中國(guó)織河證券研究院

停料來(lái)源

DrepSek言間,中國(guó)品河證券研究院1共排收型入抽出價(jià)格(元/MDeepSedk-RIl-miid.periw圖3:推理成本低至每百萬(wàn)Token

0.14美元680250請(qǐng)務(wù)必間讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

5資料來(lái)愿DapSk

官網(wǎng),中國(guó)紹河證券研究院與專有模型不同,

DeepSeek-R1的代碼和訓(xùn)練方法均在MIT

許可下完全開(kāi)源,這意味著任何

人都可以無(wú)限制地獲取、使用和修改該模型。全球開(kāi)發(fā)者對(duì)DeepSeck-RI

的貢獻(xiàn)代碼使其推理效

率每小時(shí)提升0.3%,這一開(kāi)放性的舉措極大地激發(fā)了業(yè)界的創(chuàng)新活力。DeepSeek-R1在芯片資源

利用、算法復(fù)雜性和推理速度上實(shí)現(xiàn)了重大突破,為AI

行業(yè)的發(fā)展樹(shù)立了新的標(biāo)桿。DeepSeek-R1

的崛起和其所展現(xiàn)出的成本優(yōu)勢(shì)和開(kāi)源策略,

一度讓華爾街對(duì)傳統(tǒng)的“燒錢(qián)”信

仰產(chǎn)生了懷疑。DeepSeek

突破的核心在于算法層次和系統(tǒng)軟件層次的創(chuàng)新等:1)首先是算法層次的創(chuàng)新。

他們采用了新的MoE

架構(gòu),使用了共享專家和大量細(xì)粒度路由

專家的架構(gòu)。通過(guò)將通用知識(shí)壓縮到共享專家中,可以減輕路由專家的參數(shù)冗余,提高參數(shù)效率;

在保持參數(shù)總量不變的前提下,劃分更多的細(xì)粒度路由專家,通過(guò)靈活地組合路由專家,有助于更

準(zhǔn)確和針對(duì)性的進(jìn)行知識(shí)表達(dá)。同時(shí),通過(guò)負(fù)載均衡的算法設(shè)計(jì),有效地緩解了傳統(tǒng)MoE

模型因

負(fù)載不均衡帶來(lái)訓(xùn)練效率低下的問(wèn)題。2)其次在系統(tǒng)軟件層次的創(chuàng)新。DeepSeek

采用了大量精細(xì)化的系統(tǒng)工程優(yōu)化。例如,在并行

策略方面,采用雙向流水的并行機(jī)制,通過(guò)精細(xì)的排布,挖掘了計(jì)算和通信的重疊,有效的降低了

流水并行帶來(lái)的氣泡影響:在計(jì)算方面,采用

FP8等混合精度進(jìn)行計(jì)算,降低計(jì)算復(fù)雜度:在通

信方面,采用低精度通信策略以及token

路由控制等機(jī)制有效降低通信開(kāi)銷(xiāo)。DeepSeek-R1的成功或許證明,未來(lái)的AI

競(jìng)賽將不再單純依賴于芯片的納米級(jí)較量,而是算

法效率、生態(tài)活力與政策彈性的多維度博弈,

AI

行業(yè)的發(fā)展將呈現(xiàn)出更加多元化和復(fù)雜化的變化趨

勢(shì),有望帶來(lái)AI

行業(yè)的繁榮。GPT-4o-0513ADE2024pass9.3AINE2024cons864

13.4MATH500pass0174.6GPOADlanondpass81

49.9LiveCodeBench

CodePoroespass81

rating32.9

759.0Claude-3.5-Sonnet-102216.0

26.7

78.3

65.038.9

717.0ol-nini63.6

80.090.060.053.8

1820.0QnQ-32B44.060.090.654.5

41.91316.0DoepSoek-R1-Distill-Qwen-1.5H28.9

52.783.9

33.8

16.9954.0DeepSeek-R1-Distill-Qven-7H55.5

83.392.849.137.6

1189.0DexpSeek-RI-Distill-Qrr14日69.7

80.093.959.153.1

148L.0DespSoek-RI-Distill-Qurr32872.6

83.394.362.157.2

1691.0DeepSeek-RL-DistillHLlam-8B50.480.0

89.149.039.6

1205.0DeepSeek-R1-Distill-Llara-70E70.0

86.7

94.5

65.2

57.5

1633.0中國(guó)銀河證券|

CGS

科技行業(yè)專題報(bào)告圖4:DoepSeok

蒸館小模型超越OpenAI

ol-mini請(qǐng)務(wù)業(yè)夜讀正文最后的中國(guó)能可證券股份有限公司免責(zé)聲明。Benchaark(letrle)Claude-3.5-GPT-4o

DeepSeek

Soanet-10220613

V3OpenAI

ol-ini0penAIo1-1217DoepSoek

R1Architecture#ActivatedParans#TotalParansMoE

37B

671BMoE37B671BNLU(Pass01)NL-Redux

(EM)MLJ-Pro

(EMODROP

(3-sbot

F1)EnglishIF-Ewal

Prorpt

Strict)

GPOL

Dianond

(Pass01)SirpleQA(Correct)FRAWES(Acc.)lAlpacaEval2.0(LC-winrateArenaHard(GPT4-1106)88.388.978.088.386.565.028.472.552.085.287.288.072.683.784.349.938.280.551.180.488.589.175.991.686.159.124.973.370.085.585.286.780.3

83.984.860.07.0

76.9

57.892.091.890.275.7

47.090.892.984.092.283.371.530.182.587.692.3LiveCodBenchPass01-00Codeforces(Percentile)Code

Codeforces

(Rating))SAE

Verified

(Resolved38.9

20.3

717

50.845.332.923.675938.816.036.258.7113442.049.653.8

93.41820

41.6

32.963.4

96.6

2061

48.9

61.765.996.3202949.253.3三Chinese

C-Eval

(EN)C-SimpleQA(Correct)16.078.313.19.374.610.839.290.243.263.6

90.0

67.679.2

96.479.897.378.885.476.755.487.976.058.790.986.568.089.9

68.9

40.392.891.863.7資料來(lái)潞

DnySnk官網(wǎng),中國(guó)眼河證券研究院(三)DeepSeek

開(kāi)辟了效率提升新賽道,創(chuàng)新優(yōu)勢(shì)明顯更強(qiáng)的性能,更低的訓(xùn)練與推理成本,將加速推動(dòng)AI應(yīng)用與硬件的普及和落地。雖然更低的訓(xùn)

練與推理成本減少了當(dāng)前的算力需求,但是并不意味著AI

的未來(lái)發(fā)展對(duì)半導(dǎo)體整體需求的減少,

相反由于其模型架構(gòu)、基礎(chǔ)設(shè)施數(shù)據(jù)等方面的優(yōu)化,以及更低的成本,使得其更加容易布置在端側(cè),

從而加速AI

的普及。

AI

能力邊際的擴(kuò)張依然需要依賴更大的模型和強(qiáng)大的算力,

DeepSeek

法和架構(gòu)上的創(chuàng)新給AI

的發(fā)展增加了一條新的道路。Scaling

laws指出,模型的性能伴隨著三個(gè)關(guān)鍵因素的增加而提升,即:模型參數(shù)量、訓(xùn)練數(shù)

據(jù)量、計(jì)算資源,且性能和資源之間存在對(duì)數(shù)線性關(guān)系,

DeepSeek

的技術(shù)創(chuàng)新表現(xiàn)在很多方面。

中國(guó)銀河證券|

CGS

科技行業(yè)專題報(bào)告圖5;DeepSeck-RI與其他代表性模型在各個(gè)維度性能上的對(duì)比請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。7Compute

DatasetSizeParametersPF-days,non-embedding

tokens

non-embeddingFigure1Languagemodeling

performanceimprovessmoothlyas

weincrease

the

modelsize,datasetset

size,andamountof

compute2usedfortraining.Foroptimalperformance

allthree

factors

mustbe

scaledupintandem.Empiricalperformancehasapower-lawrelationshipwitheachindividualfactorwhennotbottlenecked

by

the

other

two.

資料來(lái)源:

Corell

Uniersiny,

中國(guó)織河證券研究院模型架構(gòu)的創(chuàng)新:以DeepSeekV3為例,采用了先進(jìn)的MoE架構(gòu),具備6710億總參數(shù),

但每次僅激活370億參數(shù),從而實(shí)現(xiàn)了高效的資源利用。與傳統(tǒng)的全參數(shù)激活模型相比,MoE動(dòng)

態(tài)激活機(jī)制顯著降低了計(jì)算資源的需求,同時(shí)保持了高性能。DeepSeek提出的多頭潛注意力(MLA)在不犧牲模型質(zhì)量的前提下,大幅減少了KV緩存的大小。MLA的核心思想是將鍵和值向

量的計(jì)算分解成兩個(gè)步驟,并在推理過(guò)程中只緩存中間的“潛向量”,而不是完整的鍵和值向量

大幅提升效率,降低推理成本。其他架構(gòu)上的創(chuàng)新還包括:多令牌預(yù)測(cè),提升訓(xùn)練效率,推測(cè)性解

碼提高推理速度。使用多token預(yù)測(cè)(MTP)

訓(xùn)練目標(biāo),提升數(shù)據(jù)效率。高效訓(xùn)練:DeepSeekV3

在一個(gè)配備2048塊WIDIAH800GPU的集群上進(jìn)行訓(xùn)練,使用FP8

混合精度加速訓(xùn)練。設(shè)計(jì)了DualPipe算法以實(shí)現(xiàn)高效的管道并行性,開(kāi)發(fā)了高效的跨節(jié)點(diǎn)全對(duì)全

通信內(nèi)核,在訓(xùn)練過(guò)程中仔細(xì)優(yōu)化了內(nèi)存占用。完整訓(xùn)練僅需278.8萬(wàn)H800GPU

小時(shí),展現(xiàn)高效

成本效益。訓(xùn)練成本僅為557萬(wàn)美元。后續(xù)DeepSeck推出的R1,在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)

的情況下,極大提升了模型推理能力,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI

o1

正式版。通過(guò)

DeepSeek-R1的輸出,蒸餾了6個(gè)小模型開(kāi)源給社區(qū),其中32B和70B模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)

OpenAIol-mini的效果。強(qiáng)化學(xué)習(xí):在過(guò)去的研究中,大型語(yǔ)言模型往往需要先進(jìn)行監(jiān)督微調(diào)(SFT,再結(jié)合強(qiáng)化學(xué)習(xí)來(lái)提升推理性能。然而,DeepSeek-R1-Zero直接用強(qiáng)化學(xué)習(xí)訓(xùn)練基座模型

DeepSeek-V3-Base,

不依賴任何監(jiān)督數(shù)據(jù)作為起點(diǎn),證明了大型語(yǔ)言模型只要具備合適的獎(jiǎng)勵(lì)機(jī)制,就能純粹依靠強(qiáng)化

學(xué)習(xí)自主進(jìn)化,學(xué)會(huì)復(fù)雜且深度的推理。而

DeepSeck-R1

通過(guò)冷啟動(dòng)數(shù)據(jù)和多階段訓(xùn)練,使模型

同時(shí)兼具高水平推理與高質(zhì)量表達(dá)。

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告圖6

:

S

c

aIi

ng1a

w

s請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。87…

lnssDeepsWae0000Tandem

SoskLFodFconwudaFSHam"RONT

Tep0Alterdon

00000000,InputHidenuwsd

Lm

AnerbnMLeadred

Durg

hianre

k

HWNomusun

Latentc001J0000資料來(lái)源:

DnpSk-V3技術(shù)報(bào)告,中國(guó)能河證券研究院

資料來(lái)酒

DvpSok-V3技術(shù)報(bào)告,中國(guó)限河證券研究院蒸餾模型:據(jù)DeepSeck-V3的技術(shù)文檔,該模型使用數(shù)據(jù)蒸餾技術(shù)生成的高質(zhì)量數(shù)據(jù)提升了

訓(xùn)練效率。通過(guò)已有的高質(zhì)量模型來(lái)合成少量高質(zhì)量數(shù)據(jù),作為新模型的訓(xùn)練數(shù)據(jù),從而達(dá)到接近于在原始數(shù)據(jù)上訓(xùn)練的效果。DeepSeck

發(fā)布了從15億到700億參數(shù)的R1蒸餾版本。這些模型基

于Qwen和Lama

等架構(gòu),表明復(fù)雜的推理能力可以被封裝在更小、更高效的模型中。蒸餾過(guò)程110Btoptw

imMTak2ilTfrkrne

L8N6oirgLhTekm中國(guó)銀河證券|

CGS

科技行業(yè)專題報(bào)告圖

7

:

D

e

e

p

S

e

e

k

V

3

構(gòu)

②wiWe廠

②li資料來(lái)源:DeepSeekV3技術(shù)報(bào)苦,中國(guó)銀河證養(yǎng)研究院圖

B:MTP

的實(shí)現(xiàn)環(huán)節(jié)

9

:FPS

訓(xùn)練混合精度框架Flgure2|llustratlionofthe

basle

arehiteetureofDeepSeek-V3.FollowingDeepSeek-V2,weadoptMLAandDepSeekMoEforeffielentinferenceandeconomkealtraining.OutoutHkddenu0000{9d

同F(xiàn)zure3ⅢlustrationofourMuli-Token

RediktimMTP

impkmentatim.WekeeptheesnMBsohgLwbe

wai

innasipat

ShadExpertCTdMOQOpt

Hdlerh(imbeangL用2k?

回to

t②

-NH(T[las.hrurTonh

klt品PPOpt

wkiinf包括使用由完整DeepSeek-R1

生成的合成推理數(shù)據(jù)對(duì)這些較小的模型進(jìn)行微調(diào),從而在降低計(jì)算

成本的同時(shí)保持高性能。讓規(guī)模更大的模型先學(xué)到高水平推理模式,再把這些成果移植給更小的模

。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告圖

1

0

:

識(shí)

型General

LLM(GPT-3)Specialized

TeacherModelCounterfactual

Over-generationFilteringCounterfactual

DataDataAugmentationStudent

ModelCounterfactual:Ayounggirllooks

up

at

a

very

tall

rollercoaster

with

an

eager

and

excited

look

on

her

face.請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

10Spans:Ayounggirllooks

upassherideson

a

merry-g0-round.Original:A

younggirl

looksupas

she

rides

on

a

merry-go-round.EasyAmbigiousHardSpanExtractionDataSelectionSeed

Dataset以上的創(chuàng)新主要是利用了更好的技術(shù)手段,解決很多實(shí)際“問(wèn)題”,在理論應(yīng)用和工程上打成

平衡,體現(xiàn)了對(duì)transfomer

架構(gòu)的深度理解,成功降低了對(duì)高端硬件的依賴,為AI的發(fā)展打開(kāi)

了一條新的道路。我們認(rèn)為DeepSeck

的創(chuàng)新并沒(méi)有完全打破scaling

laws,對(duì)于計(jì)算量,模型參

數(shù)量和數(shù)據(jù)集大小,當(dāng)不受其他兩個(gè)因素制約時(shí),模型性能依然與每個(gè)因素都呈現(xiàn)冪律關(guān)系。

DepSeek

的創(chuàng)新為大模型的發(fā)展提供了新的“基準(zhǔn)”,推動(dòng)大模型發(fā)展進(jìn)入新的階段,

AI

大模型

的效率革命已經(jīng)到來(lái),而算力依然是推動(dòng)人工智能進(jìn)步核心因素之一。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

10資料來(lái)源:Cornell

Uniersiy,中國(guó)品河證券研寵院中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告(四)DeepSeek

領(lǐng)AI

成本革命,算法突破有望促進(jìn)算力需求正向循環(huán)DeepSeek-R1以超越美國(guó)頂尖模型的性能、更低的研發(fā)成本和較弱的芯片性能要求,引發(fā)了

美國(guó)對(duì)其AI全球領(lǐng)先地位的擔(dān)憂,同時(shí)也對(duì)科技公司在構(gòu)建AI

棋型和數(shù)據(jù)中心上的巨額投入提出

了質(zhì)疑。在DeepSeek的沖擊下,國(guó)內(nèi)外大模型廠商緊急上線新模型,采取降價(jià)、免費(fèi)等措施以證

明自身的領(lǐng)先優(yōu)勢(shì)。同時(shí),亞馬遜、英偉達(dá)、微軟等海外AI

巨頭紛紛上線部署支持用戶訪問(wèn)

DeepSeek-R1模型。2月1日,

OpenAI

發(fā)布全新推理模型o3-mini

并首次向免費(fèi)用戶開(kāi)放。這是

OpenAI

推理模型系列中最新、成本效益最高的模型。在定價(jià)方面,03-mini

每百萬(wàn)token

的輸入

(緩存未命中)/輸出價(jià)格分別為1.10美元/4.40美元,比完整版ol便宜93%

.

不過(guò),o3-mini

性價(jià)比或依然不及DeepSeck

作為對(duì)比,DeepSeek

API

提供的R1

模型,每百萬(wàn)token

的輸入(緩存未命中)/輸出價(jià)格僅分別為0.55美元/2.19美元。在03-mini

推出后,OpenAI

CEO表

示,中國(guó)競(jìng)爭(zhēng)對(duì)手DeepSeek

的崛起削弱了OpenAI

的技術(shù)領(lǐng)先優(yōu)勢(shì),并就開(kāi)源與閉源的問(wèn)題回應(yīng)

,OpenAI

過(guò)去在開(kāi)源方面站在“歷史錯(cuò)誤的一邊”,公司曾經(jīng)開(kāi)源部分模型,但主要采用閉源

的開(kāi)發(fā)模式,未來(lái)將重新制定開(kāi)源戰(zhàn)略。與此同時(shí),國(guó)產(chǎn)大模型的降價(jià)浪潮仍在持續(xù)。1月30日,

阿里云發(fā)布百煉qwen-max

系列模型調(diào)整通知,qwen-max

、qwen-max-2025-01-25

、qwen-max-latest

三款模型輸入輸出價(jià)格調(diào)整,

qwen-max

batch

和cache

同步降價(jià),AI

大模型行業(yè)競(jìng)爭(zhēng)加劇。DeepSeek

的成本突破不僅是大模型訓(xùn)練的從“硬件驅(qū)動(dòng)”向“算法驅(qū)動(dòng)”的范式拓展,更為

普惠化應(yīng)用打開(kāi)了新空間,反映AI技術(shù)向?qū)嵱没⒌统杀净葸M(jìn)。行業(yè)對(duì)算力的依賴相較之前發(fā)

生了“結(jié)構(gòu)性”而非“總量性”變化:DeepSeek

的技術(shù)進(jìn)步短期內(nèi)或許能夠局部緩解算力壓力,

但由于算法與算力的“螺旋上升”關(guān)系、應(yīng)用場(chǎng)景的爆發(fā)式擴(kuò)展以及數(shù)據(jù)增長(zhǎng)的不可逆等特性,我

們認(rèn)為算力資源需求會(huì)從預(yù)訓(xùn)練端逐漸轉(zhuǎn)移到推理端,

DeepSeck

的興起不會(huì)削弱高端芯片需求,

而會(huì)促使大模型發(fā)展進(jìn)入“算法進(jìn)步→模型復(fù)雜化→硬件升級(jí)”的正向循環(huán)。大模型成本優(yōu)化與算力需求之間相互成就,高資源使用效率反而可能會(huì)增加算力的總消耗量。DeepSeek通過(guò)降低訓(xùn)練成本,提高訓(xùn)練效率,看似減少算力需求,但同時(shí),大模型成本縮減意味

著降低了企業(yè)的訓(xùn)練與推理門(mén)檻,即每單位成本所能提供的訓(xùn)練和推理服務(wù)更多了,算力效率提升

有望激活更廣泛的用戶與應(yīng)用場(chǎng)景,從而引發(fā)對(duì)更大參數(shù)以及更復(fù)雜的大模型迭代需求。算法優(yōu)化

(如模型壓縮、蒸餾)確實(shí)能提升單次任務(wù)效率,但AI能力的邊界擴(kuò)展(如多模態(tài)、復(fù)雜推理、通

用人工智能)仍依賴更大規(guī)模模型和更復(fù)雜計(jì)算。這可能會(huì)對(duì)均衡下的算力需求產(chǎn)生正面影響,整

體算力需求不會(huì)減少而是更加旺盛,從而形成對(duì)硬件需求的新一輪推升,即步入“算法進(jìn)步→模型

復(fù)雜化→硬件升級(jí)"的正循環(huán)。微軟首席執(zhí)行官引用了“杰文斯悖論”來(lái)解釋這一現(xiàn)象:Jevons

在《煤炭問(wèn)題》中發(fā)現(xiàn),隨著

蒸汽機(jī)效率的提升,煤炭消耗量不降反增。其核心觀點(diǎn)為:技術(shù)進(jìn)步提高了資源使用效率,效率提

高降低了資源使用成本,成本下降刺激了資源需求的增長(zhǎng),需求增長(zhǎng)可能超過(guò)效率提升帶來(lái)的節(jié)約,

最終導(dǎo)致資源總消耗增加。在算力日益成為數(shù)字經(jīng)濟(jì)“水電煤”的今天,

DeepSeek

的技術(shù)方向與

開(kāi)源定位,恰恰是算力普及化革命的關(guān)鍵參與者。我們認(rèn)為,大模型成本優(yōu)化與算力需求并不是直

接的此長(zhǎng)彼消關(guān)系,而是互相搭臺(tái)、相互成就,高資源使用效率反而可能增加算力的總消耗量。定

價(jià)的持續(xù)走低有望帶來(lái)更快的商業(yè)化落地,進(jìn)而會(huì)衍生出更多的微調(diào)及推理等需求,將逐步盤(pán)活全

球AI

應(yīng)用及算力發(fā)展。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。資料來(lái)票維基百淋,中國(guó)能阿證辦研究院二、芯片端:推理+端側(cè)發(fā)展星辰大海,高需求無(wú)虞(一)推理算力需求持續(xù)增長(zhǎng)正向影響芯片需求在OpenAI

提供的01模型后訓(xùn)練階段的縮放定律顯示,隨著強(qiáng)化學(xué)習(xí)時(shí)間和推理思考時(shí)間的

增長(zhǎng),01模型性能得到顯著提升。

DeepSeek

R1系列模型推理過(guò)程包含大量反思和驗(yàn)證,思維鏈

長(zhǎng)度可達(dá)數(shù)萬(wàn)字。隨著思考長(zhǎng)度的增加,模型性能在穩(wěn)步提升。Scaling

Law

已經(jīng)從預(yù)訓(xùn)練向推理

層轉(zhuǎn)向。

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告圖

1

1:

-

使

量QuanttyQuantlyderandedincreasesat

ahigherproporfon展現(xiàn)出的推理scaling

lawDeepSeek-R1-Zero080.70605rl-zero-pass@1r1-zero-Cons@1601-0912-pass@101-0912-c0ns@642000

400

6000請(qǐng)務(wù)公閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

12資料來(lái)源:DeepSek-R1

技術(shù)報(bào)告,中國(guó)銀河證券研究院圖1

2:DapSok-RI09accuracy

duringtraining二ADNE04

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告通過(guò)增加模型規(guī)模、擴(kuò)展訓(xùn)練數(shù)據(jù)、提高計(jì)算資源以及合理的任務(wù)設(shè)計(jì),可以加速模型學(xué)習(xí)更

復(fù)雜的推理能力,這一過(guò)程遵循

scaling

Law.隨著模型規(guī)模、數(shù)據(jù)量和計(jì)算資源的增加。模型能夠更好地進(jìn)行推理。OpenAl

0

1模型,以及其背后所強(qiáng)調(diào)的后訓(xùn)練(Post-training)和推理階段(Inference-time)的計(jì)算投入,正在重新定義我們理解AI

模型性能增長(zhǎng)的方式。通過(guò)模仿人類思考過(guò)程,進(jìn)行多步驟、多路徑的推理,最終選擇最優(yōu)的答案。這種“隱式思維鏈”(lmplicit

Chain

ofThoughu

的方法,需要在推理階段投入更多的計(jì)算資源進(jìn)行探索和評(píng)估。谷歌研究發(fā)現(xiàn),當(dāng)合理分配推理計(jì)算資源時(shí),檢索增強(qiáng)生成(RAG)的性能能夠呈現(xiàn)近乎線性

的增長(zhǎng),RAG

在長(zhǎng)上下文的大語(yǔ)言模型上的性能最高可提升58.9%。這意味著,模型的表現(xiàn)提升和

投入的計(jì)算量幾乎是成正比的,這種現(xiàn)象被稱為推理擴(kuò)展定律。也進(jìn)一步印證了,在提升推理能力

上,算力依然是最為重要的需求之

,無(wú)論其模型是開(kāi)源或者閉源。未

來(lái)的AI

系統(tǒng)計(jì)算開(kāi)銷(xiāo)將更多地集中在推理服務(wù)上,面非單純的預(yù)訓(xùn)練計(jì)算。這意味著算力

基礎(chǔ)設(shè)施的建設(shè)和優(yōu)化需要重新思考,以滿足日益增長(zhǎng)的推理需求。在

AI

技術(shù)的實(shí)際應(yīng)用落地過(guò)

程中,用戶感受最直觀、最強(qiáng)烈的往往是推理環(huán)節(jié)的性能表現(xiàn),雖然過(guò)去我們一直在強(qiáng)調(diào)大模型訓(xùn)

練的重要性,但真正到了全業(yè)應(yīng)用層面,推理的需求規(guī)模往往是訓(xùn)練需求的5-10倍。以字節(jié)為例,

據(jù)QuestMobike的數(shù)據(jù),目前抖音集團(tuán)旗下豆包app

的月活躍用戶達(dá)到了7522萬(wàn),

AI

生APP

在24年12月的月活躍用戶規(guī)模達(dá)到了1.2億,同比增速達(dá)到232%。典型互聯(lián)網(wǎng)企業(yè)人原生App產(chǎn)品矩陣e原生p書(shū)廣

師7,

6續(xù)合錄A1場(chǎng)景分露隆S直油最夢(mèng)160直湯最維生成程桶生城保星繪5直場(chǎng)錄圖生成0

空直湯錄辦會(huì)0小言12L1續(xù)合錄百度集團(tuán)C挫箱通義aT2綜介場(chǎng)景

壞介場(chǎng)景阿

E

e

妙相機(jī)2直錄圖維生成3性素30004.6最場(chǎng)量推直資料來(lái)源:QucstMobik,中國(guó)銀河證券研究院資得來(lái)源:QwerMobilr.中國(guó)規(guī)河證券研究院QuestMobile

數(shù)據(jù)顯示,2024年12月,AI

生App

整體月人均使用時(shí)長(zhǎng)達(dá)133.0分鐘,較

1月增加53.4分鐘;月人均使用次數(shù)從1月的26.1次增加至49,6次,考慮到未來(lái)的潛在推理需

求,預(yù)計(jì)將推動(dòng)國(guó)內(nèi)推理算力需求的持續(xù)增長(zhǎng)。目前2024年豆包大模型的日均

token

調(diào)用量在

40000億左右,預(yù)估2025年日均token

調(diào)用量將提升到最高40萬(wàn)億,將大幅提升對(duì)推理算力的需

求。國(guó)產(chǎn)算力寒武紀(jì)、海光信息等廠商有望受益。平

經(jīng)

畫(huà)

as

inswn

snamaaea圖14:2024年原生APP整體月活躍用戶規(guī)模及同比增速

圖1

3:

聯(lián)網(wǎng)

業(yè)

A

A

P

P

產(chǎn)品

矩陣

請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證養(yǎng)股份有限公司免責(zé)聲明。

13分類產(chǎn)品類別工作波長(zhǎng)產(chǎn)品特性應(yīng)用場(chǎng)景激光器芯片VCSEL800-900nm線寬窄,功耗低,調(diào)制速率高,耦合效率高,

傳輸距離短,線性度差500米內(nèi)短距離傳輸,數(shù)據(jù)中心機(jī)柜內(nèi)布傳輸,消費(fèi)電子等領(lǐng)域FP1310-1550nm調(diào)制速率高,成本低,耦合效率低,先行督察中速度無(wú)線接入短距離市場(chǎng),部分應(yīng)

用場(chǎng)景逐步被DFB激光器芯片取代DFB1270-1610nm譜線窄,調(diào)制速率高,波長(zhǎng)穩(wěn)定,耦合效率低中長(zhǎng)距離傳輸,如FTTx接入網(wǎng)、傳

輸網(wǎng)、無(wú)線基站、數(shù)據(jù)中心內(nèi)部互聯(lián)等EIL1270-1610nm調(diào)制頻率高,穩(wěn)定性好,傳輸距離長(zhǎng),成本高長(zhǎng)距離傳輸,高速率遠(yuǎn)距離的電信骨干網(wǎng),城域網(wǎng)和DCI探測(cè)器芯片PIN830-860/1100-1600mn噪聲小,工作電壓低,成本低,靈敏度低中長(zhǎng)距離傳輸■月人均使用時(shí)長(zhǎng)+53.4分鐘312088.9

84.1

87.898.079.66002024-112024-120(二)后訓(xùn)練增長(zhǎng)及國(guó)產(chǎn)化需求提升有望帶動(dòng)光芯片需求增長(zhǎng)光芯片是光模塊核心器件,應(yīng)用場(chǎng)景較廣。光芯片分為激光器芯片及探測(cè)器芯片,當(dāng)前人工智

能相關(guān)光模塊內(nèi)光芯片主要以VCSEL及EML芯片為主,高速率光芯片主要以VCSEL芯片為主,

該款芯片具備線寬窄,功耗低,調(diào)制速率高,耦合效率高,傳輸距離短等特點(diǎn),主要應(yīng)用于500米

內(nèi)短距離傳輸,集中在數(shù)據(jù)中心機(jī)柜內(nèi)布傳輸,消費(fèi)電子等領(lǐng)域:EML芯片則由于其調(diào)制頻率高,

穩(wěn)定性好。傳輸距離長(zhǎng)等特性,廣泛應(yīng)用于長(zhǎng)距離傳輸,高速率遠(yuǎn)距離的電信骨干網(wǎng),城域網(wǎng)和

DC等領(lǐng)域,但其具備成本較高的特性,雖然可以部署于短距離傳輸市場(chǎng)中,但不具備性價(jià)比優(yōu)勢(shì)。表1:光芯片按功能分類

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告圖

1

5:

2

0

2

4

A

I

A

P

P

使

時(shí)

長(zhǎng)

數(shù)

勢(shì)

2024年A1原生App

整體月人均使用時(shí)長(zhǎng)及次數(shù)趨勢(shì)

40

26.0

28.9-

3L.1

33.7

34.932.9

35.135.2

43.749.62024-012024-022024-032024-042024-052024-062024-072024-08202-092024-10資料來(lái):QwsnMoble,

中因配河證券研究院1212107.5

103.9單位:分鐘

18080單位:次■月人均使用次數(shù)+23.5次95.6115.9118.1AP01270-1610rm靈敏度高,成本高長(zhǎng)距離單模光纖資料來(lái)囂中商防報(bào)網(wǎng),中國(guó)艦河證券研究院光芯片市場(chǎng)規(guī)棋持續(xù)提升,推理側(cè)算力部暑加速及國(guó)產(chǎn)化進(jìn)程加連有望直接帶動(dòng)行業(yè)增長(zhǎng)。隨請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

14

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,對(duì)高速、高效、低能耗的數(shù)據(jù)傳輸需求日益增長(zhǎng),光芯片的市場(chǎng)需求也隨之增加,推動(dòng)全球光芯片市場(chǎng)規(guī)模持續(xù)擴(kuò)大,根據(jù)中商產(chǎn)業(yè)研究院發(fā)布的

《2024-2029年全球及中國(guó)光芯片行業(yè)發(fā)展趨勢(shì)與投資格局研究報(bào)告》顯示,2023年全球光芯片市

場(chǎng)規(guī)模約27.8億美元,較上年增長(zhǎng)14.4%。中商產(chǎn)業(yè)研究院預(yù)測(cè),2024年全球光芯片市場(chǎng)規(guī)模將達(dá)到31.7億美元。隨著國(guó)產(chǎn)替代的加連推進(jìn),中國(guó)光芯片市場(chǎng)規(guī)模持續(xù)增長(zhǎng),并展現(xiàn)出強(qiáng)勁的發(fā)展

勢(shì)頭。中商產(chǎn)業(yè)研究院發(fā)布的《2024-2029年全球及中國(guó)光芯片行業(yè)發(fā)展趨勢(shì)與投資格局研究報(bào)告》

顯示,2023年中國(guó)光芯片市場(chǎng)規(guī)模約為137.62億元,較上年增長(zhǎng)10.24%。中商產(chǎn)業(yè)研究院預(yù)測(cè),

2024年中國(guó)光芯片市場(chǎng)規(guī)模將增長(zhǎng)至151.56億元。從國(guó)產(chǎn)化率來(lái)看,國(guó)內(nèi)相關(guān)企業(yè)僅在2.5G和

10G光芯片領(lǐng)域?qū)崿F(xiàn)核心技術(shù)的掌握,2.5G

及以下速率光芯片國(guó)產(chǎn)化率超過(guò)90%;10G光芯片國(guó)

產(chǎn)

6

0

%;

2

5Ghs

及以上的光芯片國(guó)產(chǎn)化率低,僅有4%.預(yù)計(jì)隨著推理側(cè)算力部署的逐步增

多,以及后訓(xùn)練算力的規(guī)模提升,相對(duì)較低速率光芯片市場(chǎng)空問(wèn)將進(jìn)一步提升,在我國(guó)光芯片相關(guān)企業(yè)有望直接受益。圖16:全球光芯片市場(chǎng)規(guī)模

圖17:我國(guó)光芯片市場(chǎng)規(guī)模200億元

150億元

100億元50億元

0億元20.00%15.00%10.00%5.00%0.00%201920202021

20222023

2024全球市場(chǎng)規(guī)模我國(guó)市場(chǎng)規(guī)模

YoY資料來(lái)慕中商報(bào)網(wǎng),中國(guó)證券研究院

資料來(lái)源:中商情批網(wǎng),中國(guó)紙河證券研究院40億美元30億美元

20億美元

10億美元0億美元1000%5.00%0.00%2021

2022

202420.00%15.00%

YoY請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。15(

)

運(yùn)

營(yíng)

細(xì)

價(jià)

值我們認(rèn)為DeepSeek

對(duì)通信行業(yè)的推動(dòng)作用主要體現(xiàn)在兩方面:1)強(qiáng)化國(guó)產(chǎn)算力產(chǎn)業(yè)鏈:為中國(guó)AI

發(fā)展帶來(lái)新機(jī)遇,為中美科技競(jìng)爭(zhēng)增添變數(shù)。

DeepSeek-RI/V3

支持華為昇騰平臺(tái)及MindIE

引擎,自研推理加速引擎使硅基流動(dòng)與華為云昇騰服務(wù)上的模

型效果媲美高端GPU,同時(shí)降低成本,這一突破為AI

生態(tài)提供自主多元化方案,助力我國(guó)本土芯

片廠商商業(yè)化落地,促進(jìn)高效能AI

的普及。2)提升中國(guó)AI

國(guó)際影響力:

DeepSeek-R1的開(kāi)源實(shí)踐標(biāo)志著開(kāi)源模式對(duì)閉源模式的一次重

要?jiǎng)倮@一開(kāi)源模式對(duì)社區(qū)的貢獻(xiàn)能夠迅速轉(zhuǎn)化為整個(gè)開(kāi)源社區(qū)的繁榮。中小企業(yè)和個(gè)人開(kāi)發(fā)者

等長(zhǎng)尾市場(chǎng)原本因成本限制無(wú)法參與的領(lǐng)域(如小規(guī)模模型微調(diào)、實(shí)驗(yàn)性研究)將被激活,形成分

散的算力需求增量,產(chǎn)業(yè)或?qū)⒂瓉?lái)結(jié)構(gòu)性變化,有望為AI技術(shù)的多元化創(chuàng)新增添更多可能性。同

時(shí)

,AI

加速走向千行百業(yè),智能駕駛、機(jī)器人、元宇宙等新興領(lǐng)域?qū)?shí)時(shí)計(jì)算和低延遲的高要求,

將持續(xù)助推高算力需求。

DeepSeek

迅速吸引了全球開(kāi)發(fā)者矚目,曾短時(shí)間內(nèi)即在蘋(píng)果中國(guó)及美國(guó)

應(yīng)用商店免費(fèi)應(yīng)用下載榜超越ChatGPT

登頂,彰顯了中國(guó)AI

技術(shù)以更開(kāi)放姿態(tài)融入全球。未來(lái)創(chuàng)

新將聚焦于效率、開(kāi)放性和生產(chǎn)力轉(zhuǎn)化,DeepSeek

或成全球AI

科技發(fā)展轉(zhuǎn)折點(diǎn)。雖然DeepSeek的推出,對(duì)降低推理側(cè)成本帶來(lái)巨大降低,但我們認(rèn)為推理側(cè)的成本降低,將

顯著帶來(lái)訓(xùn)練測(cè)迭代的加速,由于推理側(cè)成本的降低,應(yīng)用場(chǎng)景落地或?qū)⑦M(jìn)一步加速,推動(dòng)推理側(cè)

模型效率的進(jìn)一步提升,從而帶動(dòng)通信行業(yè)相關(guān)方向的持續(xù)性繁榮。故而我們維持此前對(duì)通信細(xì)分

子領(lǐng)域運(yùn)營(yíng)商、光芯片、光模塊的推薦方向,認(rèn)為DeepSeek

的推出,運(yùn)營(yíng)商作為我國(guó)最大的流量

管道,具備數(shù)據(jù)優(yōu)勢(shì)及接口優(yōu)勢(shì),

AI

應(yīng)用的普及將持續(xù)推進(jìn),同時(shí),更強(qiáng)訓(xùn)練模型的未來(lái)需求將帶

動(dòng)光模塊產(chǎn)業(yè)鏈快速發(fā)展,在全球經(jīng)濟(jì)形勢(shì)復(fù)雜化趨勢(shì)下,核心器件光芯片等方向自主可控進(jìn)程進(jìn)

步加速。未來(lái)5年數(shù)通市場(chǎng)的增長(zhǎng)驅(qū)動(dòng)力主要來(lái)自400G以上高速率光棋塊的需求。

全球云計(jì)算服務(wù)提

供商對(duì)計(jì)算能力和帶寬需求的持續(xù)增長(zhǎng),以及他們?cè)诜?wù)器、交換機(jī)和光模塊等硬件設(shè)備上的資本

支出的增加,將推動(dòng)光模塊產(chǎn)品向更高速率的800G

、1.6T

甚至更高端產(chǎn)品的迭代升級(jí)。根據(jù)我們

估算,全球光模塊400G客戶主要集中于亞馬進(jìn)(約45%)和谷歌(約25%)、800G主要集中于

英偉達(dá)(約50%)、谷歌(約30%)和Meta

(約20%)等,2025年1.6T光模塊的主要需求方預(yù)計(jì)

將是英偉達(dá)和谷歌。在GTC2024大會(huì)上,英偉達(dá)發(fā)布了其最新產(chǎn)品GB200,其服務(wù)器與交換機(jī)端

口速率也實(shí)現(xiàn)了翻倍提升,更有望引領(lǐng)AI

光模塊從現(xiàn)有的800G

向更高性能的1.6T升級(jí)。此外,英偉達(dá)明確了2026年將使用1.6T網(wǎng)卡,對(duì)應(yīng)3.2T光模塊需求,明確了光模塊升級(jí)迭代的節(jié)奏。LightCounting

預(yù)測(cè),到2029年,400G+市場(chǎng)預(yù)計(jì)將以28%以上的復(fù)合年增長(zhǎng)率(每年約16億美

元以上)擴(kuò)張,達(dá)125億美元。其中800G和1

.

6T

產(chǎn)品的增長(zhǎng)尤為強(qiáng)勁,這兩個(gè)產(chǎn)品共占400G+

市場(chǎng)的一半以上。與此同時(shí),200G

以下速率光模塊產(chǎn)品的市場(chǎng)規(guī)模預(yù)計(jì)將以每年約10%的速度縮

減。光模塊頭部廠商產(chǎn)品的高度可靠性、領(lǐng)先的研發(fā)實(shí)力及交付能力等優(yōu)勢(shì)將進(jìn)一步凸顯,行業(yè)集

中度有望進(jìn)一步提高。因此,那些能夠與客戶同步研發(fā)、快速融入客戶供應(yīng)鏈,并能提前把握客戶

需求的光模塊廠商,將有機(jī)會(huì)在產(chǎn)品更新?lián)Q代時(shí)搶先獲利。

中國(guó)銀河證券|CGS

科技行業(yè)專題報(bào)告三

、硬件端:光通信仍然靚麗,智能硬件邊際改善請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。

16高速光模塊的應(yīng)用導(dǎo)致網(wǎng)絡(luò)設(shè)備功耗大幅增加,硅光等新技術(shù)加固護(hù)城河。在以400G

和80

.

0G

光模塊為典型配置的51.2T和100T交換機(jī)中,光模塊加驅(qū)動(dòng)SerDes

的功耗占比

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論