計算機-DeepSeek驚艷世界算力與應用將迎來結構性變化_第1頁
計算機-DeepSeek驚艷世界算力與應用將迎來結構性變化_第2頁
計算機-DeepSeek驚艷世界算力與應用將迎來結構性變化_第3頁
計算機-DeepSeek驚艷世界算力與應用將迎來結構性變化_第4頁
計算機-DeepSeek驚艷世界算力與應用將迎來結構性變化_第5頁
已閱讀5頁,還剩16頁未讀 繼續免費閱讀

VIP免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

l

DeepSeek近期成為科技圈最炙手可熱的明星企業:

DeepSeek近期分別發布大模型DeepSeek-v3和推理模型R1,前者在大模型主流榜單的開源模型中位列榜首,并與世界上最先進的閉源模型不分伯仲;后者性能對標OpenAI的o1正式版,在數

學、代碼和自然語言推理等任務上表現卓越。以上兩個模型均通過算法和架構的創新,大幅降低了訓練成本和推理成本,為AI技術的普及與創新作出了卓越的貢獻

DeepSeek相關模型自從推出后,立刻占據全球科技頭條并引發巨大關注,我們認為,DeepSeek呈現出的算法創新、性能表現、開源屬性等多重因素,將對AI應用

與算力行業產生深遠的影響。lDeepSeek在模型訓練與推理中采用了多項技術創新:DeepSeek-V3實現了多項工

程技術上的創新,包括通過FP8精度訓練、DualPipe雙向流水線等技術降低訓練成

本,通過優化MoE負載均衡、多頭潛在注意力機制(

MLA

)來降低推理成本,并通

過多Token預測(MTP

)以及模型蒸餾來進一步提升模型性能,最終用極低的成本完成了訓練過程,與此同時推理的成本也較其他模型有大幅下降。而

R1-Zero的目標是驗證純RL能否激發模型的自主推理能力,探索無監督強化學習的潛力,而R1

則通過數據引導+多階段優化,平衡推理性能和實用價值,目標是打造更符合人類偏好的通用推理模型,兩個模型均實現了較為理想的效果。lDeepSeek將對AI算力與應用產生結構性影響:

由于DeepSeek-V3

、R1等模型通過算法與架構層面的多重創新大幅降低了訓練端算力消耗,不過我們認為,在各模型公司仍致力于訓練出性能更強大模型的目標指引下,龐大的訓練集群將仍然被產業所追逐,訓練算力長期看仍有前景和空間。而推理算力的需求空間則更為樂觀,我們認為推理成本的大幅下降將帶來需求更大幅度的增長,而在這樣的過程中,算力需求結構可能將會改變,而美國如果進一步收緊AI芯片供應,則可能對國產芯片形成利好。而另一方面,此前AI應用的普及及其商業化還存在一定的困難,一方面在于模型性能仍然沒法滿足眾多場景的需求,尤其是在推理能力和多模態環節,另一方面則是閉源模型性能領先但API調用的成本過高,影響了AI應用的大范圍普及,我們認為,DeepSeek

的強推理能力、低算力成本、開源屬性,使得其對AI應用的普及有望發揮重要的作用。lB端企業級應用,建議關注金山辦公、鼎捷數智、泛微網絡、漢得信息、軟通動力、上海鋼聯、合合信息、新致軟件、每日互動。l垂直行業應用領域有較強優勢的企業,建議關注科大訊飛、焦點科技、潤達醫療、

同花順、衛寧健康

。lAI工具類應用,建議關注彩訊股份、虹軟科技、萬興科技、福昕軟件。l國產算力及算力服務企業,建議關注海光信息、寒武紀-U、中科曙光、云賽智聯、

安博通、首都在線、優刻得-W

。風險提示技術落地不及預期;政策落地不及預期;美國進一步制裁風險;競爭激烈導致變現能力

下降。DeepSeek驚艷世界,算力與應用將迎來結

構性變化我們認為

AI

應用正逐步進入落地期,有望呈現較多的投資機遇,建議投資者關注行業整

體性機會,而國產算力及推理算力服務企業,也將從AI應用繁榮中受益。核心觀點

字節加速AI

落地、小米、理想"All

in

AI"AI

應用前景廣闊、自主可控已是大趨勢:計算機行業2025年度投資策略AI

應用落地曙光已現2024-12-292024-12-272024-11-18投資建議與投資標的浦俊懿

S0860514050004行業研究

|

深度報告

計算機行業有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。看好(維持)報告發布日期

2025年02月04

日國家/地區

中國計算機行業行業目錄引言

...............................................................................................................

4一、DeepSeek-V3、R1模型推出后“火”遍全球

..............................................

41.1

DeepSeek-V3性能表現不輸全球頂尖模型

...................................................................41.2

R1模型實現了比肩OpenAIo1的推理能力

..................................................................51.3

DeepSeek-V3

、R1模型在產業中引發巨大反響

...........................................................7二、DeepSeek模型訓練與推理技術創新解析

................................................

82.1

DeepSeek-V3模型采用了多項創新技術......................................................................82.2

R1-Zero與R1模型嘗試強化學習邊界.......................................................................

10三、DeepSeek將對AI算力與應用產生結構性影響.....................................113.1

DeepSeek模型有望引發算力需求與市場結構變化.....................................................113.2AI應用有望在高性能、低成本模型支撐下繁榮

...........................................................

13四、投資建議與投資標的.............................................................................15五、風險提示

...............................................................................................16有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化2圖表目錄圖1

:DeepSeek-V3在多項評測中成績領先

................................................................................4圖2

:DeepSeek-V3在各類測試集上的表現................................................................................5圖3:DeepSeek-V3API服務價格具備很強的吸引力.................................................................5圖4

:DeepSeek-R1在推理能力上比肩OpenAIo1.....................................................................6圖5:基于

R1蒸餾的小模型性能超越OpenAIo1-mini................................................................6圖6

:DeepSeek-R1

API服務定價繼續大幅低于OpenAIo1.......................................................7圖7

:DeepSeek-V3模型訓練僅需要278.8萬GPU小時訓練資源

..............................................7圖8

:DeepSeek成為全球增速最快的AI應用

.............................................................................8圖9:DeepSeek發布后下載量增長迅猛

.....................................................................................8圖10

:DeepSeek-V3模型基本架構.............................................................................................8圖11

:DeepSeek-V3采用FP8為主的混合精度訓練方法............................................................9圖

12:多Token預測(MTP

)模塊結構示意............................................................................

10圖13

:R1-Zero由基礎模型直接進行強化學習訓練而產生

.........................................................

10圖14

:DeepSeek-R1-Zero訓練期間

AIME準確率....................................................................11圖15

:DeepSeek-R1-Zero在RL過程中的平均響應長度(輸出長度不斷增加)......................11圖17

:“杰文斯悖論”指出成本下降將刺激資源需求更大增長

......................................................

12圖18:硅基流動x華為云聯合推出基于昇騰云的DeepSeek

R1

&V3

推理服務.......................

13圖19:AI產品榜全球

Web端訪問前

15情況(24年12月)

....................................................

14圖20:AI產品榜全球APP端訪問前

15情況(24年12月)

....................................................

14圖21:2024年全球

AI產品付費用戶規模

..................................................................................

14圖22:short-CoT模式下,k1.5模型多方面能力領先...............................................................

15圖23:long-CoT模式下,k1.5模型多方面能力比肩o1............................................................

15圖24

:Qwen2.5-Max測試結果領先各類指令模型

.....................................................................

15圖25

:Qwen2.5-Max表現優于各類開源模型............................................................................

15有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化3引言DeepSeek

近期分別發布大模型

DeepSeek-v3

和推理模型

R1,前者在大模型主流榜單的開源模

型中位列榜首,并與世界上最先進的閉源模型不分伯仲;后者性能對標OpenAI的o1正式版,在數學、代碼和自然語言推理等任務上表現卓越。以上兩個模型均通過算法和架構的創新,

大幅降低了訓練成本和推理成本,為AI技術的普及與創新作出了卓越的貢獻。我們認為,DeepSeek呈

現出的算法創新、性能表現、開源屬性等多重因素,將對AI

應用與算力行業產生深遠的影響。一

、DeepSeek-V3

、R1模型推出后“火”遍全球1.1

DeepSeek-V3性能表現不輸全球頂尖模型2024年

12月26

日,杭州深度求索(DeepSeek

AI

)發布

DeepSeek-V3并同步開源,據介紹,

DeepSeek-V3

多項評測成績超越了

Qwen2.5-72B

Llama-3.1-405B

等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o

以及Claude-3.5-Sonnet不分伯仲。具體而言,DeepSeek-V3在知識類任務(MMLU,

MMLU-Pro,

GPQA,

SimpleQA)上的水平相比前代DeepSeek-V2.5顯著提升,接近當前表現最好的模型Anthropic公司于2024年10月發布的

Claude-3.5-Sonnet-1022;在長文本評測(DROP

、FRAMES和LongBenchv2

)方面,V3平均

表現也超越其他模型。在算法類代碼場景(Codeforces),V3

遠遠領先于市面上已有的全部非o1

類模型,并在工程類代碼場景(SWE-Bench

Verified)逼近

Claude-3.5-Sonnet-1022

。而在

美國數學競賽(

AIME

2024,

MATH

)和全國高中數學聯賽(CNMO

2024)上,DeepSeek-V3大

幅超過了其他所有開源閉源模型。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖

1

:DeepSeek-V3

在多項評測中成績領先數據來源:

DeepSeek

微信公眾號,東方證券研究所4另外,

DeepSeek-V3

通過算法和工程上的創新,將生成吐字速度從

20TPS(Transactions

PerSecond每秒完成的事務數量)大幅提高至60TPS,相比V2.5模型實現了3倍的提升,可以帶來更加流暢的使用體驗。同時,模型API

服務定價也將調整為每百萬輸入tokens

0.5

元(緩存命中)

/

2

元(緩存未命中),每百萬輸出tokens

8元,因此,V3模型在性能實現領先的同時,定價大幅低于市面上所有模型,性價比優勢明顯。1.2

R1模型實現了比肩OpenAI

o1的推理能力2025年1月20

日,DeepSeek再次扔出重磅炸彈,發布了推理模型R1,該模型在后訓練階段大

規模使用了強化學習技術,在僅僅使用極少標注數據的情況下,極大提升了模型推理能力,在數

據、代碼、自然語言推理等領域均實現了比肩OpenAIo1模型的能力。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖3:DeepSeek-V3API服務價格具備很強的吸引力圖2

:DeepSeek-V3在各類測試集上的表現數據來源:

DeepSeek

微信公眾號,東方證券研究所數據來源:

DeepSeek

微信公眾號,東方證券研究所5除了開源相關模型外,DeepSeek-R1

上線API,對用戶開放思維鏈輸出,服務定價為每百萬輸入

tokens

1元(緩存命中)/4元(緩存未命中),每百萬輸出

tokens

16元,與OpenAIo1API

調用相比,繼續保持超高的性價比。與此同時,DeepSeek還上線了APP并更新官網,打開“深度思考”模式,即可調用最新版DeepSeek-R1完成各類推理任務。DeepSeek不僅開源了R1-Zero和R1兩個660B模型,還通過

DeepSeek-R1

的輸出,蒸餾了6

個小模型開源給社區,其中

32B

70B

模型在多項能力上實現了對標

OpenAI

o1-mini

的效果。

同時,DeepSeek

還修改了產品協議,支持用戶進行“模型蒸餾”,即允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖5:基于

R1蒸餾的小模型性能超越OpenAIo1-mini圖4

:DeepSeek-R1在推理能力上比肩OpenAIo1數據來源:

DeepSeek

微信公眾號,東方證券研究所數據來源:

DeepSeek

微信公眾號,東方證券研究所6圖6

:DeepSeek-R1API服務定價繼續大幅低于OpenAIo1數據來源:

DeepSeek

微信公眾號,東方證券研究所1.3

DeepSeek-V3、R1模型在產業中引發巨大反響DeepSeek-V3

、R1

兩款模型最讓人印象深刻的不僅在于其比肩業內最佳表現的性能,更在于超低的訓練成本:DeepSeek在V3相關的論文中披露,V3僅僅使用2048塊H800GPU訓練2個月的時間,共消耗

278.8

GPU

小時,而按照

OpenAI

創始成員之一

Andrej

Karpathy

介紹,

Llama3-405B則消耗了3080萬GPU小時,是V3的

11倍;如果按照H800

GPU每小時2美金的租賃費用計算,意味著V3模型正式訓練僅僅需要

557.6萬美金,

而此前同等性能的模型則需

要0.6-1億美金。而R1模型

是在DeepSeek

V3

的基礎上,通過引入大

規模強化

學習

(Reinforcement

Learning)和多階段訓練,進一步提升推理能力的模型,據專家判斷,在V3

的基礎上生產R1模型的成本可能非常低廉。DeepSeek-V3

、R1兩款模型的推出,猶如在AI行業投入了兩顆重磅炸彈,DeepSeek

迅速成為

科技產業最耀眼的明星企業,并引發了巨大的討論與關注。相較于各科技巨頭不斷構建更大規模

算力集群來訓練更強大的模型,DeepSeek

向大家展示了通過精巧的算法優化,可以在低一個數量級算力消耗的情況下生產出頂尖性能的模型。DeepSeek

已經成為眾多科技領域領袖重點關注的對象:微軟

CEO

納德拉在財報電話會議上稱DeepSeek“有一些真的創新”,并透露R1

模型已經可以通過微軟的

AI平臺獲取;MetaCEO

克伯格表示

Meta

DeepSeek

視為競爭對手并正在學習;ASML

CEO

則在接受采訪時

表示DeepSeek這樣的低成本模型將帶來更多而非更少的AI芯片需求;Anthropic創始人認為V3是真正的創新所在;人工智能專家吳恩達也發文認為中美AI差距正在迅速縮小。OpenAI

CEO山姆奧特曼更是在發布o3-mini后罕見地承認“在開源上

OpenAI站在了歷史的錯誤一方”

。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。圖7

:DeepSeek-V3模型訓練僅需要278.8萬GPU小時訓練資源計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化數據來源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,東方證券研究所7二、

DeepSeek

模型訓練與推理技術創新解析2.1

DeepSeek-V3模型采用了多項創新技術據披露,DeepSeek-V3為自研MoE模型,總參數671B參數,而每項任務僅激活37B,在14.8Ttoken

上進行了預訓練。DeepSeek-V3實現了多項工程技術上的創新,包括通過FP8精度訓練、DualPipe

雙向流水線等技術降低訓練成本,通過優化MoE負載均衡、多頭潛在注意力機制(MLA)

來降低推理成本,并通過多Token預測(MTP

)以及模型蒸餾來進一步提升模型性能,最終取得

了令人驚艷的效果。在超高的熱度下,DeepSeek

成為了全球增速最快的

AI

應用,僅上線

18

天日活就達到了

1500

萬,而

ChatGPT

1500

萬花了

244

天,增速是

ChatGPT

13

倍;1月26

日同時登頂蘋果

AppStore和谷歌PlayStore全球下載榜首,

目前仍然在100多個多家/地區維持領先。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化

數據來源:

invest

wallstreet

微信公眾號,東方證券研究所

數據來源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,東方證券研究所圖8

:DeepSeek

成為全球增速最快的AI應用圖9:DeepSeek發布后下載量增長迅猛圖

10

:DeepSeek-V3模型基本架構數據來源:

AI

產品榜,東方證券研究所8從訓練的角度,FP8精度訓練、DualPipe雙向流水線以及高效的跨節點通信等技術是工程領域創

新的重點。1)FP8

精度訓練:DeepSeek-V3

將大部分計算密集型操作(如矩陣乘法)使用FP8

精度進行,

同時保留一些關鍵操作(如嵌入層、輸出頭、歸一化操作等)的高精度(BF16

FP32),

以確保訓練的數值穩定性。

在此基礎上,進一步疊加細粒度量化、高精度累加、在線量化、低精度存儲和通信等技術方法,成功實現了高效的

FP8

精度訓練。這些創新不僅顯著提高了訓練速度和效率,還保持了模型的高性能,為大規模語言模型的訓練提供了新的解決方案。2)DualPipe

雙向流水線:核心思想是將模型的不同層分配到不同的

GPU

上進行并行訓練,并

通過雙向流水線調度來同時處理正向傳播和反向傳播。具體來說,它允許從流水線的兩端同

時輸入微批次(micro-batches),從而最大化地利用計算資源并減少通信開銷,該方法實現了高效的模型訓練,為大規模分布式訓練提供了強大的支持。3)

跨節點通信技術

:DeepSeek-V3通過高效的跨節點全對全通信內核、通信和計算的重疊、定

制化通信內核、低精度通信以及對未來硬件設計的建議,顯著提高了跨節點通信的效率。這

些技術不僅減少了通信開銷,還提高了整體訓練效率,為大規模分布式訓練提供了強大的支

持。而在推理領域,DeepSeek-V3

混合專家系統(MoE

)和多頭潛在注意力機制(MLA

)是獲得低成

本、高質量推理結果的重要原因。1)混合專家系統(MoE)

:MoE

是一種將多個小型專家模型組合起來,共同完成任務的架構

MoE

可以顯著增加模型的參數數量,而無需像稠密模型那樣增加計算量。具體而言,V3

模型每項任務僅激活370億個參數,大大降低了計算成本,同時保持了高性能。2)多頭潛在注意力(MLA):多頭潛在注意力機制增強了模型處理細微關系和同時管理多個輸入的能力,使其對需要上下文深度的任務非常有效。

如果以聽一場演講來類比,傳統的注意力機制需要記住每個時間點的所有細節(就像記錄每一秒的錄音)

,而MLA則只提取關鍵信息(就像只記錄每個重點句子),這樣大大降低需要記憶的信息。此外,DeepSeek-V3還通過多令牌預測(MTP

)和模型蒸餾技術提高了模型的性能。1)多令牌預測(MTP):傳統的語言模型通常只預測下一個令牌(token),而MTP

則是在每

個位置上,讓模型預測多個未來的標記,從而提高模型的性能和效率

。它不僅增加了訓練信號的密度,還使模型能夠更好地規劃未來的表示,從而生成更連貫和準確的文本。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖

11

:DeepSeek-V3采用FP8為主的混合精度訓練方法數據來源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,東方證券研究所9圖

12

:多Token預測(

MTP

)模塊結構示意數據來源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,東方證券研究所2.2

R1-Zero與R1模型嘗試強化學習邊界為了獲得推理能力更強的模型,DeepSeek相繼開發了

R1-Zero和

R1模型,其中

R1-Zero

嘗試

了不使用監督微調(SFT)、僅采用大規模強化學習(RL

)的方式,而R1

則在強化學習之前引

入冷啟動階段,通過少量人工設計的長鏈思維(CoT)數據對基礎模型進行初步監督微調,從而為強化學習提供更穩定、可讀性更強的初始策略。R1-Zero

直接在基礎模型上應用強化學習而不使用任何

SFT

數據,為了訓練

R1-Zero

,DeepSeek

采用了一種基于規則的獎勵系統(而非神經獎勵模型),該系統包含準確率獎勵和格式獎勵,其中前者負責評估響應是否正確,而后者確保模型在生成響應時遵循特定的結構要求。而隨著

RL

訓練的持續推進,DeepSeek-R1-Zero

的性能呈現出穩步提升的趨勢。此外,通過延長測試時間的計算,

DeepSeek-R1-Zero

自然而然地獲得了解決更復雜推理任務的能力,從生成數百個

token

到數千個

token,模型得以更深入地探索和優化其思維過程。模型的「思考過程」會不斷與最終的正確率獎勵相互作用。當模型最初得出的答案并未得到較高獎勵時,它會在后續

的推理中「回頭反省」,嘗試補充或修正先前的思路,從而獲得更高的獎勵

,通過這樣的方式,模型在沒有外部指導的情況下持續自主學習與迭代,最終具備了強大的推理能力。2

)模型蒸餾技術:模型蒸餾(Knowledge

Distillation)是一種將大型復雜模型(教師模型)的知

識遷移到小型高效模型(學生模型)的技術。其核心目標是在保持模型性能的同時,顯著降低模

型的計算復雜度和存儲需求

。DeepSeek

利用強大的教師(R1

)模型生成或優化數據,幫助小模

型更高效地學習,此外,

DeepSeek

通過監督微調(SFT)的方式,將教師模型的知識遷移到學生模型中。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。

數據來源:

圖靈人工智能微信公眾號,

東方證券研究所

計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖

13

:R1-Zero由基礎模型直接進行強化學習訓練而產生10R1-Zero

的目標是驗證純

RL

能否激發模型的自主推理能力,探索「無監督強化學習的潛力」

,而

R1則通過數據引導+多階段優化,平衡推理性能和實用價值,目標是打造更符合人類偏好的通

用推理模型。R1的訓練過程分為4

個階段:1)階段

1(冷啟動):使用少量高質量的

CoT

數據對基礎模型進行微調,作為

RL

訓練的初始

起點,解決純RL冷啟動不穩定問題;2)階段2(推理導向的強化學習):在冷啟動模型上進行

RL訓練,應用

GRPO

算法,結合規則獎勵和語言一致性獎勵,優化模型在數學、代碼、邏輯等任務上的推理能力;3)

階段3(拒絕采樣+監督微調):使用上一階段的

RL

模型進行拒絕采樣,生成高質量的推理和非推理數據,并用這些數據對模型進行微調。側重點是提升模型的綜合能力,使其在寫作、事實問答等多種任務上表現良好。4)階段4(全場景強化學習):在上一階段

SFT

模型的基礎上進行

RL

訓練,側重點是使模型

在所有場景下都能表現良好,包括推理任務和非推理任務,對齊人類偏好,優化模型的實用

性、無害性和多任務能力。此外,為了獲得更高效的小模型,并使其具有DeekSeek-R1的推理能力,DeepSeek還對Qwen和

Llama

等開源模型進行了微調,使用的是上面

SFT

DeepSeek-R1

的80萬數據。研究結果表明,這種直接蒸餾方法顯著提高了小模型的推理能力。在這里使用的基座模型是

Qwen2.5-Math-1.5B、Qwen2.5-Math-7B、Qwen2.5-14B、Qwen2.5-32B、Llama-3.1-8B和Llama-3.3-70B-

Instruct。三、

DeepSeek

將對AI

算力與應用產生結構性影響3.1

DeepSeek模型有望引發算力需求與市場結構變化由于DeepSeek-V3

、R1

等模型通過算法與架構層面的多重創新大幅降低了訓練端算力消耗,使

得投資者對繼續斥巨資構建超大規模算力中心的合理性和前景產生質疑,這導致了算力產業鏈相

關企業在

R1模型發布后暴跌,其中英偉達股價

1

27

日下跌

16.97%,市值蒸發約

5900億美

金,創下美國上市公司單日市值損失記錄,而博通公司股價跌幅一度接近

20%,收盤時下跌

17.4%,臺積電股價也大跌13.3%。數據來源:

DeepSeek-AI《DeepSeek-R1:IncentivizingReasoningCapabilityin

LLMsvia

Reinforcement

Learning》,東方證券研究所

15

:DeepSeek-R1-Zero在RL過程中的平均響應長度(輸

出長度不斷增加)數據來源:

DeepSeek-AI《DeepSeek-R1:IncentivizingReasoningCapabilityin

LLMsvia

Reinforcement

Learning》,東方證券研究所有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖

14

:DeepSeek-R1-Zero訓練期間AIME

準確率11訓練算力長期看仍有前景和空間

。從訓練算力的角度,

我們認為各模型廠商大概率將借鑒

DeepSeek公開的一系列優化方法,如FP8精度訓練、跨節點通信、DualPipe雙向流水線與自身模型訓練結合,探索更高效的模型訓練方式。不過,正如

Anthropic

CEO

Dario

所述:“訓練越

來越智能的模型的經濟價值是如此之大,以至于任何成本收益幾乎都會立即被吃掉——它們被重

新投入到制作更智能的模型中,而我們最初計劃花費的成本與此相同”。因此,在各模型公司仍致力于訓練出性能更強大模型的目標指引下,龐大的訓練集群將仍然被產業所追逐,因此,我們認為,訓練算力需求從長期來看依然值得樂觀。“杰文斯悖論

”有望在推理算力上再度印證。而從另一方面來看,開源模型和更低的推理成本將有助于應用的繁榮,從而對推理算力形成更加積極的影響。微軟

CEO

納德拉在社交平臺上表示,

“杰文斯悖論(Jevons

Paradox)再次上演!隨著

AI

變得更加高效和普及,我們將看到它的使用

量激增,最終成為一種我們永遠無法滿足的商品。”杰文斯悖論是一條知名的經濟學理論,指當技

術的進步導致某種資源的使用更加高效時,消費者或企業對它的使用需求可能會大幅增加,雖然

其使用成本降低了,但總消耗最終反而會上升。這樣的情況在當前的蒸汽機時代和內燃機時代都曾出現過,我們認為,隨著推理成本的下降,AI

應用的廣闊需求有望被激發,推理算力將具備更大的增長空間。算力芯片行業格局是否生變值得關注。此前,英偉達憑借領先的計算與互聯性能、強大的

CUDA生態,在

AI算力芯片市場占據主導地位,但DeepSeek

在跨節點通信方案上的優化,以及推理階

段的算力需求爆發潛力,讓

AI

芯片廠商看到了突破口與希望。AMD

1

25

日宣布已將新的

DeepSeek-V3

模型集成到

Instinct

MI300X

GPU

上;2月1

日,硅基流動與華為云聯合推出基于

昇騰云的

DeepSeek-R1&V3推理服務,可獲得持平全球高端

GPU

部署模型的效果,而

2

2日,DeepSeek

兩款模型完成海光

DCU

適配并正式上線,意味著國產芯片與

DeepSeek系列模型實現了無縫銜接。我們認為,DeepSeek

模型的開源性以及對芯片性能與生態要求的下降,可能會對AI芯片行業的格局產生一定影響。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖16:“杰文斯悖論”指出成本下降將刺激資源需求更大增長數據來源:

華爾街見聞

,東方證券研究所12此外,DeepSeek在使用英偉達A100

、H800等性能受限的芯片基礎上訓練出V3

、R1

等模型,使得是否要對中國進一步進行芯片限售成為熱門話題。例如,

Anthropic

CEO

在萬字長文中就提出要對中國進行更嚴格的芯片限制,而彭博社也援引知情人士報道稱,美國正考慮進一步收緊英偉達(NVIDIA

)芯片對華出口限制,可能將限制范圍擴大至英偉達針對中國市場特供的符合出口管制規則的H20

芯片。我們認為,如果英偉達等美國

AI

芯片進一步受到限制,則可能對國產芯片

的份額與需求產生進一步的影響。3.2AI應用有望在高性能、低成本模型支撐下繁榮自

ChatGPT問世以來,無論是大模型公司還是各類應用型企業均推出各類基于大模型的應用,尋找用戶增長與商業閉環機會。近期我們關注到,無論是從產品用戶數增長的角度,還是海外

B

端企業AI應用商業化落地的角度,均呈現積極的成果,基于大模型的商業化曙光已現。從各類產品用戶數及訪問量來看,ChatGPT

網站端

24年12

月3.4億用戶產生38

億次的訪問量,

APP端訪問次數則超過3億次,月度總訪問次數超過40億次,保持著明顯的領先優勢。在Web

端訪問前

15榜單來看,中國僅有納米AI位列其中,而在APP端,則有豆包、Talkie

AI

Kimi

助手三款,其中豆包、TalkieAI均位列前五,顯示出中國AI應用在全球占有重要地位。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。圖

17:硅基流動x華為云聯合推出基于昇騰云的DeepSeek

R1&V3

推理服務計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化數據來源:

硅基流動微信公眾號,東方證券研究所13我們認為,此前AI應用的普及及其商業化還存在一定的困難,一方面在于模型性能仍然沒法滿足眾多場景的需求,尤其是在推理能力和多模態環節,另一方面則是閉源模型性能領先但

API

調用的成本過高,影響了AI應用的大范圍普及,我們認為,DeepSeek

的強推理能力、低算力成本、

開源屬性性有望推動AI應用的繁榮。此外,不僅是

DeepSeek系列模型,國內其他模型公司近期發布產品也取得了性能領先。如

1月

20

日,月之暗面推出的全新SOTA模型——Kimi

k1.5

多模態思考模型,在short-CoT模式下,

Kimi

k1.5

的數學、代碼、視覺多模態和通用能力大幅超越了全球范圍內短思考

SOTA模型

GPT-4o

Claude

3.5

Sonnet

的水平,領先達到550%;在

long-CoT

模式下,k1.5推理能力達到長思考SOTA模型OpenAIo1

正式版的水平。而伴隨著

AI

應用在日常生活中發揮著越來越重要的作用,各類

AI

應用的付費用戶也在增長,目

前來看,2024年付費用戶最多的產品是微軟的Copilot,達到了5574萬,百度文庫緊隨其后,達到4000萬,而Canva和ChatGPT付費用戶也超過了千萬。此外,大模型應用

Claude、智能文

檔與協作平臺Notion

、AI

搜索應用Perplexity

、AI

Coding

應用Cursor

以及智能陪伴應用

Character

AI

也都榜上有名。用戶愿意付費往往意味著產品已經觸及到了其真正的需求,付費行為跨越了感興趣和真正需要之間的鴻溝,是未來AI產品貨幣化的重要方向。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。圖

18:AI產品榜全球Web端訪問前

15情況(

24年12月)圖

19:AI產品榜全球APP

端訪問前

15情況(

24年12月)計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖20:2024年全球AI產品付費用戶規模數據來源

:AI

產品榜,東方證券研究所數據來源:

AI

產品榜,東方證券研究所數據來源:

AI

產品榜,東方證券研究所14我們認為,DeepSeek-V3

、R1,月之暗面

Kimik1.5,以及Qwen2.5-Max等國產模型的集體性突破,為國內AI應用的發展與繁榮打下良好的基礎,未來擁有場景和用戶資源的廠商可以以更好的性能

、更低的成本提供產品和服務,與此同時,更開源的模型和更低的成本也意味著AI應用企業的商業模型將迎來更加積極正面的變化。四、投資建議與投資標的我們認為AI應用正逐步進入落地期,有望呈現較多的投資機遇,建議投資者關注行業整體性機會,而國產算力及推理算力服務企業,也將從AI應用繁榮中受益。B

端企業級應用,建議關注金山辦公(688111,增持)

、鼎捷數智(300378,未評級)

、泛微網絡

(603039,

買入)

、漢得信息(300170,

未評級)

、軟通動力(301236,

未評級)

、上海鋼聯

(300226,增持

)、合

合信息

(688615

未評

)、新致

(688590

買入

)、每日互動

(300766,未評級)。1月29

日,阿里云通義千問旗艦版模型Qwen2.5-Max正式升級發布,據介紹,Qwen2.5-Max

模型是阿里云通義團隊對MoE

模型的最新探索成果,展現出極強勁的綜合性能,

阿里云官微發文

稱,

Qwen2.5-Max

比肩Claude-3.5-Sonnet,

并幾乎全面超越了GPT-4o

、DeepSeek-V3及Llama-3.1-405B。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化圖22:long-CoT模式下

,k1.5模型多方面能力比肩o1圖21:short-CoT模式下,k1.5模型多方面能力領先圖23

:Qwen2.5-Max測試結果領先各類指令模型圖24

:Qwen2.5-Max表現優于各類開源模型數據來源:IT

之家,

東方證券研究所數據來源:IT

之家,

東方證券研究所數據來源:

芯智訊,東方證券研究所數據來源:

芯智訊,東方證券研究所15垂直行業應用領域有較強優勢的企業,建議關注科大訊飛(002230,買入)

、焦點科技(002315,未評級)

、潤達醫療(603108,買入)、同花順(300033,未評級)、衛寧健康(300253,未評級)。AI

工具類應用,建議關注彩訊股份(300634,買入)、虹軟科技(688088,未評級)、萬興科技

(300624,未評級)、福昕軟件(688095,未評級)。國產算力及算力服務企業,建議關注海光信息(688041,買入)、寒武紀-U(688256,未評級)

云賽智聯(600602,未評級)、安博通(688168,未評級)、中科曙光(603019,買入)

、首都在線

(300846,未評級)、優刻得-W(688158,未評級)。五、風險提示技術落地不及預期

:DeepSeek

為代表的模型雖然在性能和成本上有顯著提升,但仍存在大模型技術無法支撐AI應用在部分場景落地的風險;政策落地不及預期:政策是AI產業發展的重要因素,如果政策支持力度不及預期,也會對行業發

展帶來偏負面影響;美國進一步制裁風險

:如果美國進一步收緊芯片供應,仍將對國內大模型訓練產生負面影響;競爭激烈導致變現能力下降風險:

目前AI產業競爭激烈,如果各廠商由于競爭進一步降低產品定價,則對AI產業的商業化形成影響。有關分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯系。并請閱讀本證券研究報告最后一頁的免責申明。計算機行業深度報告——DeepSeek驚艷世界,算力與應用將迎來結構性變化16報告發布日后的12

個月內行業或公司的漲跌幅相對同期相關證券市場代表性指數的漲跌幅為基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論