




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
n
三個模型:純強化學習復現
o1
能力,引發(fā)新一輪革命。DeepSeek
由幻方量化創(chuàng)立,
創(chuàng)始人為梁文峰,2024年
12
月,DeepSeek-V3發(fā)布,性能對齊海外領軍閉源模
型。2025年
1
月,以
V3為基座,衍生出強化推理版
R1-Zero+泛化推理版
R1
,性能
對標
OpenAI-o1正式版。n
兩大貢獻:
復現
o1強化學習效果+
實現有限算力的算法創(chuàng)新。
1
)捅破強化學習用于
大模型推理的窗戶紙。DeepSeek
R1是繼
openAI
o1之后,推理的第二個里程碑。2)
根據
DeepSeek
公開的數據,按照
1張
H800每小時
2美元的租賃成本算,V3預訓
練成本只有
557.6
萬美金,用
1萬張
H800只需要
11天就能訓練完,僅使用不到
1/
10
的成本就達到了國際上領先模型的表現,這對當前我國突破算力卡脖子限制具備重要
意義。n
九大創(chuàng)新:模型創(chuàng)新+
系統優(yōu)化+商業(yè)模式開源。n
4個模型本身創(chuàng)新點:
1
)V3基座能力強勁,具備較高的基座模型能力、DeepSeek
系統效率、RL
調教能力;2)
R1-zero
模型直接應用
RL
到基礎模
型,而不依賴作為初步步驟的監(jiān)督微調(
SFT);3)R1泛化推理模型,通過深
度推理
SFT
數據(本身帶推理能力)+通用
SFT
數據實現推理能力的跨任務泛
化;4)通過模型與強化學習環(huán)境交互,在沒有獎勵思維鏈長度的情況下,
自發(fā)
涌現了反思和長思考能力,帶動推理能力提升。n
4個系統優(yōu)化創(chuàng)新點:
1)復雜均衡優(yōu)化:
引入動態(tài)調整的
Expert
Bias
,只影響
專家路由,不產生任何梯度影響;2)通信優(yōu)化:提出
DualPipe
算法,精細控制
分配給計算和通信的
GPU
SM
數量,保證計算和通信完全重疊,顯著減少了
L2
緩存的使用和對其他
SM
的干擾,從而提升了系統性能;
3)內存優(yōu)化:
啟用上
下文硬盤緩存技術,把預計未來會重復使用的內容,緩存在分布式的硬盤陣列中,
以應對上下文
KV
Cache緩存的問題;4)計算優(yōu)化:采用組相對策略優(yōu)化(
GRPO
)
替代傳統的近端策略優(yōu)化(
PPO),優(yōu)勢在于無需單獨的價值模型、采用基于組
的相對優(yōu)勢估計、顯著降低內存和計算開銷、增強了模型的數學推理能力。n
1個商業(yè)模式創(chuàng)新點:
堅持開源,DeepSeek
開源了原生
FP8權重,公開深度思
考過程、免費允許用戶無限制商用、鼓勵蒸餾。n
行業(yè)影響:
算力需求仍未見頂,重心向推理側遷移。
1
)模型側:
scalinglaw
沒有失
效,還在持續(xù)迭代,
大概率往推理方向卷。2)算力側:基座模型仍需云上算力來迭
代,云端推理部署需求存在,應用爆發(fā)需要規(guī)模算力支持訪問;
3)端側:應用場景
的天然分散性會導致推理需求指數增長,Agent
與各類終端、用戶入口的加速結合。n
投資方向和標的建議:n
第一類:
用戶入口與
agent
的融合。1)Agent+C端各類終端入
口。
①手機:R1本地部署要求大幅降低,
內嵌在各
種系統、軟件中的場景將大幅增加,HarmonyOS
NEXT
小藝助手接入DeepSeek
,建議關注:
潤和軟件、
法本信息、軟通動力、
東方中科、誠邁
科技、
中科創(chuàng)達、拓維信息等。
②智能汽車:低成本高性能
AI
Agent
與座
艙結合,顯著提升人車智能交互體驗的同時,能打造差異化競爭優(yōu)勢,建議
關注:黑芝麻智能、地平線機器人、德賽西威、經緯恒潤、
中科創(chuàng)達、光庭
信息。
③機器人:
消費類機器人與AI
Agent
集合,提升智能家居用戶體驗,
加速教育用戶實現場景擴容。建議關注:
螢石網絡等。
2)B端軟件:
B端公司掌握了大量用戶入
口,并具備品牌優(yōu)勢和壁壘,通過模
型接入實現降本增效,同時憑借
Deepseek
的更低推理成本,未來有望實現
增收又增利。建議關注:合合信息、金山辦公、
同花順、萬興科技、
中望軟
件等。
n
第二類:
國產算力。算法和軟硬件協調發(fā)展、形成系統性彎道超車,
①華為昇騰
產業(yè)鏈:建議關注軟通動力、烽火通信、神州數碼以及相關配套硬件廠商;
②中
科院算力產業(yè)鏈:
建議關注海光信息、
中科曙光、
曙光數創(chuàng)、寒武紀等。
n
風險提示:技術迭代不及預期的風險;
市場競爭加劇的風險;人才流失風險的風險;
研究報告中使用的公開資料可能存在信息滯后或更新不及時的風險分析師:孫行臻執(zhí)業(yè)證書編號:S0740524030002Email:sunxz@zt基本狀況上市公司數337行業(yè)總市值(億元)44,
199.21行業(yè)流通市值(億元)38,242.67行業(yè)-市場走勢對比1、《中國電子核心資產盤點——重
點
央
企
資
產盤
點系
列(
二
)
》
2024-11-132、《中電科核心資產盤點——重點
央企資產盤點系列(一)》2024-10-30報告摘要評級:
增持(維持)相關報告證券研究報告/行業(yè)點評報告請務必閱讀正文之后的重要聲明部分2025
年
02
月
09日計算機內容目錄一、三個模型:
純強化學習復現
o1
能力,引發(fā)新一輪革命
.....................................31.1基因根植+加速迭代,DeepSeek
正式出圈
...................................................31.2三個模型:
以
V3為基座,衍生強化推理版
R1-Zero+泛化推理版
R1
.........
3二、兩大貢獻:復現
o1強化學習效果+
實現有限算力的算法創(chuàng)新
............................5三、九大創(chuàng)新:模型創(chuàng)新+
系統優(yōu)化+商業(yè)模式開源
..................................................7四、
行業(yè)影響:算力需求仍未見頂,重心向推理側遷移
........................................
11投資建議
...................................................................................................................13風險提示
...................................................................................................................18圖表目錄圖表1:
2025年
1月
AI
應用全球日活總榜
.............................................................3圖表2:
DeepSeek
全球增速最快
Al
應用
................................................................3圖表3:
DeepSeek
的
LLM
模型分三個版本
............................................................4圖表4:
DeepSeek-V3和
DeepSeek-R1與其他代表性模型的比較
.......................5圖表5:
OpenAI
o1模型性能在訓練時間和訓練時間計算上均平穩(wěn)提升
.................6圖表6:
DeepSeekV3預訓練成本測算
....................................................................
6圖表7:
DeepSeekV3模型性價比處于最優(yōu)范圍
.....................................................
7圖表8:
DeepSeek-V3及其同類產品的基準性能
....................................................
7圖表9:
DeepSeek-R1-Zero
和
OpenAI
o1模型在推理相關基準測試中的比較
.....
8圖表10:
DeepSeek-R1及其同類產品的基準性能
..................................................8圖表11:強化學習過程中
DeepSeek-R1-Zero
在訓練集上的平均響應長度
...........9圖表12:
Loss-Free
負載均衡策略
...........................................................................9圖表13:
DualPipe
關鍵是在一對獨立的前向和后向塊中重疊計算和通信
............
10圖表14:
多輪對話場景,下一輪對話會命中上一輪對話生成的上下文緩存
.........10圖表15:數據分析場景,后續(xù)具有相同前綴的請求會命中上下文緩存
................
10圖表16:
PPO
與
GRPO
原理對比
.........................................................................
11圖表17:
DeepSeek
蒸餾模型與其他可比模型表現對比
.......................................11圖表18:
大模型發(fā)展重心有望進一步向
“后訓練、推理側、
自主智能體”偏移
..
12圖表19:
亞馬遜、谷歌、微軟和
Meta
或計劃加大
AI
資本支出(十億美元)
.....
12圖表20:
DeepSeek-V3
的訓練成本相比其對標模型訓練成本大幅降低
...............
13圖表21:
DeepSeek-R1在推理成本方面展現出顯著優(yōu)勢
.....................................
13圖表22:接入
DeepSeek
相關標的合作及漲幅匯總
.............................................14-2-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告一、三個模型:純強化學習復現
o1
能力,引發(fā)新一輪革命1.1基因根植+加速迭代,DeepSeek
正式出圈前世今生:
幻方量化創(chuàng)立,創(chuàng)始人為梁文峰。
DeepSeek
成立于
2023年
5
月,由量化巨頭幻方量化創(chuàng)立,其創(chuàng)始人梁文峰在量化投資和高性能計算領
域具有深厚的背景和豐富的經驗。l
2024年
5月,DeepSeek-V2
發(fā)布,成為全球最強開源通用
MoE
模型。l
2024年
12
月,DeepSeek-V3發(fā)布,性能對齊海外領軍閉源模型。l
2025
年1
月
,
DeepSeek-R1
發(fā)布
,
性能對標OpenAI-o1
正式版
。
DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標
注數據的情況下,極大提升了模型推理能力。
同時
DeepSeek
開源
R1
推理模型,允許所有人在遵循
MIT
License
的情況下,蒸餾
R1訓練其他
模型。快速出圈:
上線
20
天全球
日活就突破
2000
萬。
DeepSeek
應用于
2025
年
1
月
11
日發(fā)布,截止
2025
年
1
月
31
日上線僅
21天。春節(jié)期間國貨之
光
DeepSeek
迅速點燃了全民參與熱情,上線
20天全球日活就突破
2000
萬,
已然成為現在全球增速最快的
AI
應用。l
25M1全球數據:1
)DeepSeek
日活躍用戶
DAU2215
萬,達
ChatGPT日活用戶的
41.6%
,超過豆包的日活用戶
1695
萬。2)上線僅
21
天,
憑
3370
萬月活
MAU
排名全球總榜TOP4。
3)截止
2025年
1
月
31
日
DeepSeek
霸榜蘋果應用商店
157個國家/地區(qū)的第一名,MAU
月活
躍用戶占比最多的前
5
國家為:中國
30.71%,印度
13.59%,印尼
6.94%,
美國
4.34%
,法國
3.21%。l
25M1
國
內數據:
1)豆包第一
7861
萬
MAU
、
DeepSeek
第二
3370
萬
MAU
、Kimi
第三
1943
萬
MAU
、文小言第四
1305
萬
MAU。
MAU
數據
不包括接入
DeepSeek
的
C端應用和模型云服務平臺(
納米
AI
搜索、
秘塔
AI
搜索、硅基流動
x
華為云)
。圖表2:DeepSeek
全球增速最快Al
應用圖表1:2025
年1月AI
應用全球日活總榜1.2三個模型:
以
V3為基座,衍生強化推理版
R1-Zero+泛化推理版
R1DeepSeek
的
LLM
模型分三個版本——基座模型
V3、強化推理版
R1-Zero
、
泛化推理版
R1。來源:A
I產品榜,
中泰證券研究所注:僅包含應用(APP)全球i0S、海
外
GP、以及國內安卓市場,不
含網站
(Web);數據范圍
2025/1/1-2025/1/31。來源:A
I產品榜,中泰證券研究所注:僅包含應用(APP)全球i0S、海外GP、
以及國內安卓市場,不含網站(Web)。-3-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告來源:
AI
大模型前沿公眾號,
中泰證券研究所1
)基座模型
V3:V3基座模型總參數為
671B
,(對比
GPT3參數
175B
、
GPT4
參數
1.76T),有
61
層transformer、并且用
MoE
代替?zhèn)鹘yTransformer模型中的前饋網絡(
FFN
)層,每一層包括大量的細粒度專家,有
1個共享
專家+256個路由專家。l
知識:
1)在MMLU
、
MMLU-Pro
和
GPOA
等教育基準測試中
,
DeepSeek-V3的
表
現
優(yōu)
于
所
有
其
他
開
源模
型
,
在
MMLU/MMLU-Pro/GPOA
分
別
達
到88.5/75.9/59.1
,
性
能
可
與
GPT-4o和
Claude-Sonnet-3.5等領先的閉源模型相媲美。2)對于事
實性基準測試,DeepSeek-V3在英文
SimpleQA
方面落后于
GPT-4o
和Claude-Sonnet3.5
,但它在中文
Chinese
SimpleQA
表現卓越,
適宜中文語言環(huán)境和應用場景。l
代碼、數學和推理:1
)DeepSeek-V3在數學相關基準性能變現優(yōu)越,
在
MATH-500
的表現甚至優(yōu)于
o1-preview。2
)在編碼相關任務上,
DeepSeek-V3
在
LiveCodeBenc
等編碼競賽基準上表現出最佳性能,
工程相關表現略低于
Claude-Sonnet-3.5
,但仍優(yōu)于其他模型。2)R1-Zero(
強化推理版本):沒有
warmup
階段、沒有監(jiān)督微調的數據,
從
DeepSeek-v3基座,直接進行強化學習,技術上比較激進、效果顯著、
能完美復現
o1
,但不足之處是沒有監(jiān)督微調的數據啟動、可讀性差、語言
混雜輸出。l
推理任務:
DeepSeek-R1在
AIME2024
上達到了
79.8%的
Pass@1
分數,略微超過了
OpenA1-o1-1217。在
MATH-500上,它取得了令
人印象深刻的
97.3%的分數,與
OpenA1-o1-1217相當,遠遠超過了
其他模型。l
編碼任務:
DeepSeek-R1在代碼競賽任務中表現出專家級水平,它
在
Codeforces
上獲得了
2029
的
Elo
評分,超過了
96.3%的人類參
與者。l
工程任務:DeepSeek-R1
的表現略微優(yōu)于
DeepSeek-V3,這可以幫
助開發(fā)者在實際任務中。l
知
識
:在
MMLU
、MMLU-Pro
和GPQADiamond
等
基
準
上,
DeepSeek-R1
取得了卓越的成績
,顯著優(yōu)于DeepSeek-V3,在
MMLU
上的得分為
90.8%
,在
MMLU-Pro
上的得分為
84.0%
,在
GPOADiamond
上的得分為
71.5%。雖然它在這些基準上的表現略低
于
OpenAl-o1-1217
,但
DeepSeek-R1超越了其他閉源模型,展示
了其在教育任務中的競爭優(yōu)勢。-4-
請務必閱讀正文之后的重要聲明部分圖表3:DeepSeek
的LLM
模型分三個版本行業(yè)點評報告來源:
《DeepSeek-V3Technical
Report》
,DeepSeek
公眾號,
中泰證券研究所二、兩大貢獻:復現
o1強化學習效果+
實現有限算力的算法創(chuàng)新DeepSeek
的兩大重要貢獻,一是捅破強化學習用于大模型推理的窗戶紙、
二是掀起低成本算力革命,且全球范圍率先實現并開源。
1
)捅破強化學習用于大模型推理的窗戶紙。如果說
openAI
的
o1是推理的
第一個里程碑,那
DeepSeek
R1可以稱之為第二個里程碑,堪比
2023年
初的
ChatGPT
時刻。l
openAI
o1:
引入新的范式,推動
scaling
law
繼續(xù)往強化學習、推理方
向突破。通過強化學習可以識別并糾正自己的錯誤,將復雜的步驟分解
為更簡單的,并嘗試行不通時換其他方法,這個過程是模型自
己學習而
非人為干擾。l
DeepSeek
R1:全球第一個通過強化學習完美復現
o1能力的模型。l
事實基準
SimpleQA
測評:
DeepSeek-R1優(yōu)于
DeepSeek-V3
,展
示了其在處理基于事實的查詢方面的能力。在這一基準上,OpenAl-01
超過了
4o也出現了類似的趨勢。3)R1(
泛化推理版本):基于
DeepSeek-v3基座,先用
SFT
來啟動,
構建少量
Long-CoT(長思維鏈)數據來微調模型(使模型先跟隨樣本學習
思維鏈的方法),防止
RL
早期不穩(wěn)定和可讀性差的問題。第二步再進行和
R1-zero
一樣的強化學習,同時引入語言一致性獎勵(減少語言混雜輸出的
問題)。第三步,生成的深度推理
SFT
數據再結合通用
SFT
數據,一起微
調大模型,再進行強化學習。圖表4:DeepSeek-V3和DeepSeek-R1與其他代表性模型的比較-5-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告來源:OpenAI
官網,
中泰證券研究所2)實現有限算力下的算法創(chuàng)新。根據
DeepSeek
公開的數據,按照
1
張
H800每小時
2
美元的租賃成本算,V3預訓練成本只有
557.6萬美金(僅
包括DeepSeek-V3的正式訓練,
不包括與架構、
算法或數據相關的先前
的研究或精簡實驗的成本),如果用
1萬張
H800只需要
11天就能訓練完。
如果參數量為
671B
的
DeepSeekV3使用
H800訓練,整個訓練過程僅使
用不到
280萬個
GPU
小時,相比之下,Llama3405B使用
H100
的訓練時
長是
3080萬
GPU
小時,DeepSeek
僅使用不到
1/
10
的成本就達到了國際
上領先模型的表現,這對當前我國突破算力卡脖子限制具備重要意義。
目前
模型性能/性價比優(yōu)勢顯著
,模型
API
服務定價也將調整為每百萬輸入
tokens0.5元(緩存命中)/2元(緩存未命中
),每百萬輸出
tokens8元。圖表5:OpenAI
o1
模型性能在訓練時間和訓練時間計算上均平穩(wěn)提升-6-
請務必閱讀正文之后的重要聲明部分圖表6:DeepSeekV3
預訓練成本測算來源:
《DeepSeek-V3Technical
Report》
,
中泰證券研究所行業(yè)點評報告來源:
Deepseek
公眾號,
中泰證券研究所三、九大創(chuàng)新:模型創(chuàng)新+
系統優(yōu)化+商業(yè)模式開源模型本身具備
4個創(chuàng)新點:
1
)基座模型
V3性能強大。
R1
的成功離不開
DeepSeek-V3
強大的基
座模型能力、DeepSeek
系統效率、RL
調教能力。DeepSeek-V3
多項
評測成績超越了Qwen2.5-72B和
Llama-3.
1-405B等其他開源模型代碼
和數學方面表現尤為突出;并在性能上和世界頂尖的閉源模型GPT-4o
以及Claude-3.5-Sonnet
相媲美。-7-
請務必閱讀正文之后的重要聲明部分圖表8:DeepSeek-V3
及其同類產品的基準性能圖表7:DeepSeekV3
模型性價比處于最優(yōu)范圍來源:
《DeepSeek-V3Technical
Report》
,
中泰證券研究所行業(yè)點評報告來源:
《DeepSeek-R1:
Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》
,
中泰證券研究所4)
自發(fā)涌現了反思能力、長思考能力。
隨著測試時間的增加,模型出
現了復雜的行為。模型能夠回顧和重新評估其之前的步驟,
自發(fā)地探索
解決問題的替代方法,這些行為不是顯式編程的結果,而是模型與強化來源:
《DeepSeek-R1:
Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》
,
中泰證券研究所3)第三個創(chuàng)新點是,R1泛化推理模型,通過深度推理
SFT
數據(本
身
帶推
理
能
力
)+
通
用
SFT
數據
實
現推
理
能
力的跨任
務
泛化。DeepSeek-R1-Zero存在可讀性差和語言混合等問題。
因此,研究引入
DeepSeek-R1,通過收集少量冷啟動數據對基礎模型進行微調,并采用
多階段訓練流程,最終獲得了與
OpenAI
o1-1217性能相當的模型。2)R1-zero模型直接應用
RL
到基礎模型,而不依賴作為初步步驟的監(jiān)
督微調(
SFT)。其重要意義在于驗證
LLMs
的推理能力可以通過
RL完全激勵,而不需要
SFT。R1-zero
以
DeepSeek-V3-Base
為基礎模型,采用
GRPO(Group
Relative
Policy
Optimization
)作為
RL
框架來提高
模型在推理任務中的性能,并且采用
rule-based
reward
system
的方式
來確保強化學習能實現規(guī)模化。圖表9:DeepSeek-R1-Zero和OpenAI
o1
模型在推理相關基準測試中的比較-8-
請務必閱讀正文之后的重要聲明部分圖表10:DeepSeek-R1
及其同類產品的基準性能行業(yè)點評報告來源:《DeepSeek-R1:Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》,
中泰證券研究所系統優(yōu)化具備
4個創(chuàng)新點:
DeepSeek
通過負載均衡優(yōu)化、通信優(yōu)化(硬件)、內存優(yōu)化(硬件)、
計算優(yōu)化四重優(yōu)化,實現了算法、軟件、硬件協同創(chuàng)新,通過算法和工
程上的創(chuàng)新
,
DeepSeek-V3
的生成吐字速度從
20TPS
大幅提高至
60TPS
,相比
V2.5模型實現了
3倍的提升,為用戶帶來更加迅速流暢
的使用體驗。1
)負載均衡優(yōu)化:
負載均衡是為了避免所有任務都堆在個別專家形成
堰塞湖,因此
V3模型引入一個動態(tài)調整的
Expert
Bias,Bias
只影響專
家路由,不產生任何梯度影響,通過動態(tài)調整
Expert
Bias
來調整各個
專家的門控分數,實現負載均衡。圖表11:強化學習過程中DeepSeek-R1-Zero在訓練集上的平均響應
長度學習環(huán)境交互的結果。在沒有獎勵思維鏈長度的情況下,模型就自發(fā)地
進行越來越長的思考,這種自發(fā)發(fā)展顯著提高了
DeepSeek-R1-Zero
的
推理能力,使其能夠以更高的效率和準確性處理更具挑戰(zhàn)性的任務。-9-
請務必閱讀正文之后的重要聲明部分圖表12:Loss-Free
負載均衡策略來源:智東西,
中泰證券研究所行業(yè)點評報告來源:
《DeepSeek-V3Technical
Report》
,
中泰證券研究所3)
內存優(yōu)化:
復雜推理場景下的多輪對話和長序列需要緩存更多的
KVCache
,導致
GPU
高帶寬內存容量成為瓶頸,而通過增加
DRAM
解決
問題又會讓推理成本激增。
為
了應對上下文
KV
Cache
緩存的問題,
DeepSeek
采用創(chuàng)新性的硬盤緩存技術,啟用上下文硬盤緩存技術,把
預計未來會重復使用的內容,緩存在分布式的硬盤陣列中。如果輸入存
在重復,則重復的部分只需要從緩存讀取,無需計算。該技術不僅降低
服務的延遲,還大幅削減最終的使用成本,緩存命中的部分,DeepSeek每百萬tokens
收費
0.1元。圖表14:多輪對話場景,下一輪對話會命中上一輪
對話生成的上下文緩存2)通信優(yōu)化:關于專家并行的通信開銷的問題,提出
DualPipe
算法來解決,
精細控制分配給計算和通信的
GPU
SM
數量,保證計算和通信完全重疊。
硬件層面修改
CUDA
的底層匯編語言,通過定制的
PTX
指令來更精細
地控制底層
GPU
資源的分配和使用(
H800里面有
132個
SM
,分配20個
SM
來控制通信、同時還能動態(tài)調整分配給通信任務的warp
數量,
用剩下的
SM
做計算)
,顯著減少了
L2
緩存的使用和對其他
SM
的干
擾,從而提升了系統性能。4)計算優(yōu)化:DeepSeek-R1采用組相對策略優(yōu)化(
GRPO
)替代傳統的近
端策略優(yōu)化(
PPO
),優(yōu)勢在于無需單獨的價值模型、采用基于組的相
對優(yōu)勢估計、顯著降低內存和計算開銷、增強了模型的數學推理能力。圖表15:數據分析場景,后續(xù)具有相同前綴的請求
會命中上下文緩存圖表13:DualPipe
關鍵是在一對獨立的前向和后向塊中重疊計算和通信-
10-
請務必閱讀正文之后的重要聲明部分來源:
DeepSeek
官網,
中泰證券研究所來源:
DeepSeek
官網,
中泰證券研究所行業(yè)點評報告來源:
《DeepSeek-R1:
Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》
,
中泰證券研究所四、行業(yè)影響:算力需求仍未見頂,重心向推理側遷移1
)模型側:
Scaling
law
尚未失效仍在迭代,但重心有望進一步向推理側
偏移。2024年
12
月,OpenAI
聯創(chuàng)
Ilya
在深度學習頂會
NeuralPS2024
上
表示預訓練時代可能結束,其原因是互聯網的文本數據幾乎窮盡,而短期內
數據難以迅速增長,基于此,行業(yè)的趨勢有望朝向推理側發(fā)展,其重心可能
從
“卷基座、卷模型”向
“卷推理、卷
AI
Agent
、卷應用落地”過渡。來源:
CSDN
,
中泰證券研究所n
商業(yè)模式的
1個創(chuàng)新:開源1)DeepSeek
商業(yè)模式為開源,以開源精神和長期主義追求普惠
AGI。與
o1相反,DeepSeek
采用
FP8訓練,并開源了原生
FP8權重,公開深度思
考過程、免費允許用戶無限制商用、鼓勵蒸餾(
用
R1輸出結果訓練其他模
型
),盡可能降低用戶使用壁壘,全球范圍出圈和更容易建立起廣泛繁榮的
用戶生態(tài)。-
11-
請務必閱讀正文之后的重要聲明部分圖表17:DeepSeek
蒸餾模型與其他可比模型表現對比圖表16:PPO
與GRPO
原理對比行業(yè)點評報告圖表18:大模型發(fā)展重心有望進一步向“后訓練、推理側、
自主智能體”偏移來源:機器之心公眾號,
中泰證券研究所2)算力側:
整體趨勢來看,Pre-training
將達瓶頸,基座模型格局日益明
朗,但算力需求仍未見頂。
即使互聯網中現成數據已完全納入訓練集,模
型仍可運用合成數據等方式彌補訓練數據的不足,基座模型依舊需要云上的
算力來迭代,Pre-training
的
scaling
law
有望續(xù)命;并且端側應用與設備也
需要云上的算力來支持云端推理部署。
因此,長期來看,未來
AI
應用與端
側的爆發(fā)將需要大規(guī)模算力來支持訪問,算力需求遠未見頂。從海內外視角看
DeepSeek
對算力廠商的影響。
①對國際大廠可能會帶來
短期沖擊,而從微軟、谷歌等云廠商最新公布的資本開支來看,算力相關的
開支依然堅挺,
目前來看對云廠商資本投入的決心影響較小。
長期來看,
AI
應用的爆發(fā)有望帶來推理端需求迸發(fā),訓練和推理此消彼長。在技術和
產品方面,我們預計大廠的優(yōu)勢還會引領一段時間。
②利好國產半導體產
業(yè)鏈,DeepSeek
實現有限算力下的算法創(chuàng)新,改善國產芯卡脖子和供給不
足的現狀,有望走上算法和軟硬件協調發(fā)展的路徑,以形成獨立且系統性領
先的生態(tài)。來源:凌通社,各公司官網,
中泰證券研究所注:數據反映的是固定資產和設備的購買情況。本圖表展示了各日歷季
度的數據。微軟財年于
6
月
30日結束圖表19:亞馬遜、谷歌、微軟和Meta或計劃加大AI
資本支出(十億美元)-
12-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告投資建議n
第一類:
用戶入口與
agent
的融合。l
Agent+C端各類終端入
口:
因為
R1本地部署要求大幅降低,
內嵌
在各種系統、軟件中的場景將大幅增加,強交互的手機/PC
、消費類
機器人、智能駕駛等智能硬件終端可能會百花齊放。1)手機:
HarmonyOS
NEXT
小藝助手接入
DeepSeek
,用戶可
通過小藝助手與
DeepSeek
對話實現更加無縫的
AI
體驗,建
議關注:
潤和軟件、
法本信息、軟通動力、
東方中科、誠邁科
技、
中科創(chuàng)達、拓維信息等。
2)智能汽車:R1本地部署要求大幅降低,低成本高性能
AI
Agent與座艙結合,顯著提升人車智能交互體驗的同時,
能打造差異
化競爭優(yōu)勢,未來有望成為智艙發(fā)展新趨勢。建議關注:1
)芯
片:黑芝麻、地平線;2
)域控:德賽西威、經緯恒潤;3)AI+
座艙:
中科創(chuàng)達、光庭信息。
3)機器人:消費類機器人與AI
Agent
集合,提升智能家居用戶體
驗,加速教育用戶實現場景擴容。建議關注:
螢石網絡等。
l
B
端軟件:B端公司掌握了大量用戶入口,并具備品牌優(yōu)勢和壁壘,
在與
DeepSeek
開源高性能大模型融合后,
能夠降低自身的研發(fā)投
入、提升自身產品迭代速度、
增加客戶粘性和續(xù)費率
,
同時憑借
Deepseek
的更低推理成本,未來有望實現增收又增利。建議關注:
合合信息、金山辦公、
同花順、
萬興科技、
中望軟件等。
圖表20:DeepSeek-V3的訓練成本相比其對標模型
訓練成本大幅降低圖表21:DeepSeek-R1在推理成本方面展現出顯
著優(yōu)勢3)應用&端側:
降本、
降門檻加速商業(yè)化,利好應用與端側發(fā)展。從技術
上講,
DeepSeek
使得大模型向Agent
智能體更近一步,尤其是其開源特
性降低了模型技術的使用門檻,使更多中小科技企業(yè)有機會打造更優(yōu)質的垂
類場景應用,使
Agent
與各類終端、用戶入口的加速結合。從成本上講,
不論對于模型的訓練側還是推理側,Deepseek
為世界探出一條能夠以更低
成本布局
AI
的路徑,
因此應用公司能夠以更低成本自研或調用
API
來打造
AI
應用,利潤空間也有望進一步提升。
隨著應用的普及與能力的提升,端
側硬件將具備更優(yōu)的大規(guī)模落地的條件。來源:SemiAnalysis
,NVIDIA
,Anthropic
,Meta
,深度求索,
甲子光年,中泰證券研究所注:訓練成本并不包括前期研究以及關于架構、算法或數
據的消融實驗所產生的成本,也不包括人力成本及其他未提及的成本-
13-
請務必閱讀正文之后的重要聲明部分來源:Statista,
中泰證券研究所行業(yè)點評報告圖表22:接入DeepSeek
相關標的合作及漲幅匯總證券代碼證券簡稱概念相關點年后累計漲幅(2025/2/5-2025/2/7)688158.SH優(yōu)刻得根據2025年2
月3日
官微
,優(yōu)刻得云平臺上線
DeepSeek-R1系列模
型72.81%300766.SZ每
日
互動根據2025年2
月4日公告,公司在較早時間就接入
DeepSeek相關版
本并完成各方面的評估及利用自有算力進行私有化部署,目
前主要用于業(yè)務垂直場景使用
、研發(fā)提效(AI4SE)、知識庫問答以及將其納入數據
智能操作系統(DiOS)
的功能模塊等。根據2025
年2
月4
日
官微,安恒信息旗下恒腦·安全垂域大模型正式集65.73%688023.SH安恒信息成
DeepSeek,
完成基于
DeepSeekR1
的安全大模型的訓練
,推出首
個“
DeepSeek”版安全智能體,
開啟全新智能化安全之旅。根據2025
年
1
月25日
官微,公司AK39系列芯片的天才虎AI
智能錄音54.73%688620.SH安凱微筆Pro4G
版推出市場,對接多家大模型底座,開啟智能錄音筆全新篇章
。
通過對接了豆包
、通義千問
、文心一言、DeepSeek、Kimi
等多家大語言
模型,并通過調優(yōu),能夠對不同大模型的特性進行分析與整合
,實現對多源語言理解優(yōu)勢的有效融合。2025年2
月6
日微信公眾號發(fā)布,首都在線云平臺快速上架
R1模型,51.32%300846.SZ首都在線還提供為期
1
個月的免費使用權限。用戶可以通過首都在線云平臺的強49.35%688058.SH寶蘭德大算力
,免受各種限制,
隨時隨地暢快地體驗
DeepSeek。根據青云科技2025年2
月4日
官微,
青云科技旗下AI
算力云服務一
基石智算CoresHub正式上線
DeepSeek-R1
系列模型,根據2025年2
月5日
官微,
品高AI
大模型融合平臺--AISTACK早在36.47%688227.SH品高股份2024年7
月開始支持
DeepSeek
的混合專家模型(MOE)
,并上架京東
商城,在
DeepSeek-R1發(fā)布后
,也第一時間在產品中進行了集成為垂直領域大模型的落地提供了更強大的技術支持。2025年02
月05日
官微:春節(jié)期間,
云天勵飛芯片團
隊完成35.95%688343.SH云天勵飛DeepEdge10“
算力積木”
芯片平臺與
R1-Distill-Qwen-1.5B、R1-Distill-Qwen-7B、R1-Distill-Llama-8B
大模型的適配
,可以交付客
戶使用。根據軟通動力2025
年2
月4
日
官微,作為中國數字技術產品和服務創(chuàng)33.89%301236.SZ軟通動力新領導企業(yè),軟通動力積極擁抱
DeepSeek,率先進行產品的創(chuàng)新融合,
通過把
DeepSeek-R1接入天璇
MaaS
平臺,
以全棧AI技術服務加速
企業(yè)智能化轉型。33.46%002123.SZ夢網科技根據2025年2
月4
日
官微,隨著
DeepSeek
大模型的全球影響力持續(xù)
擴大,夢網科技將
DeepSeek
大模型深度集成至多源AI
調度引擎“
天慧智匯臺2.0”,推動消息通信服務從基礎連接向智能決策升級,為行業(yè)開
辟5.70%效新路徑。33.11%n
第二類:
國產算力。
受益于
DeepSeek
的推出和生態(tài)繁榮,部分國產算
力產業(yè)鏈的公司有望實現算法和軟硬件協調發(fā)展,甚至達到系統性彎
道超車,建議關注:
1
)華為昇騰產業(yè)鏈:軟通動力、烽火通信、神州
數碼以及相關配套硬件廠商;2)中科院算力產業(yè)鏈;海光信息、
中科
曙光、曙光數創(chuàng)、寒武紀等。
-
14-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告002881.SZ美格智能根據2025年
1
月26日
官微
,公司結合美格智能自研的AIMO
智能體
及
DeepSeek-R1模型的基礎能力,開發(fā)面向工業(yè)智能化、座艙智能體
、
智能無人機
、機器人等領域的AIAgent應用。根據2025
年2
月3
日全資子公司浙江數據管理微信公眾號,浙江省數33.10%600126.SH杭鋼股份據管理有限公司成功完成
DeepSeek-R1
的適配并實現DeepSeekR170B
參數及以下全部蒸餾模型的部署。根據2025年2
月5日
官微,奇安信宣布已完成與DeepSeek(深度求索)33.08%688561.SH奇安信的全面深度接入,奇安信自研QAX安全大模型通過
DeepSeekR1進行
了一系列的優(yōu)化和蒸餾后,運營成本大幅降低
,同時在威脅研判等多個
場景下的模型性能方面獲得了顯著提升。根據參股公司杭州領信數科信息技術有限公司2025
年2
月6
日微信公31.11%688080.SH映翰通眾號:近日,領信數科已完成兩大核心
升級:AI
中臺一大白智腦,
完成
DeepSeek基座模型適配。30.88%600186.SH蓮花控股2025
年2
月4
日公司孫公司蓮花紫星官微:蓮花紫星已在自有算力上成
功部署
DeepSeekR1
大模型
,并全面支持智能體調用。29.42%300352.SZ北信源2025年2
月5日微信公眾號發(fā)布
,公司密信AI
能力平臺已成功對接
DeepSeek。27.40%300588.SZ熙菱信息根據公司官網
,公司AI
智慧助手平臺AILinkDebot產品接入集成了
qwen2-7b、deepseek、ChatGLM、
文心一言等模型,2025年2
月6日
官微:今天,
用友
BIP
全面上線以
DeepSeek-V3
和26.17%600588.SH用友網絡DeepSeek-R1作為基座大模型的智能服務,企業(yè)客戶可以通過
BIP3R6
智能平臺的公有云
、
專屬云模式使用相關服務。根據2024年半年報,公司參股世優(yōu)科技3%股權。2025年
2
月
6日參25.57%300057.SZ萬順新材股公司世優(yōu)科技微信公眾號發(fā)布,世優(yōu)科技推出的“世優(yōu)波塔”AI
數字人25.06%688039.SH當虹科技智能體與
DeepSeek
的通用人工智能(AGI)
能力結合。據當虹科技2025
年2月
5日
官微
,近日,當虹科技BlackEye多模態(tài)視
聽大模型正式融合DeepSeek-R1
和DeepSeekJanusPro,并完成視聽傳媒
、
工業(yè)與衛(wèi)星
、
車載智能座艙等多行業(yè)垂類場景的數據調優(yōu)訓練。2025
年2
月4
日微信公眾號發(fā)布
,快麥小智推出了基于大模型的智能24.68%688365.SH光云科技體產品綾智
。基于綾智
,商家可以搭建導購助手
、智能培訓
、對話打標
等智能助理功能
。
目
前,綾智的多項業(yè)務場景和功能已經接入并在支持
DeepSeek各個版本。2025
年2
月6
日微信公眾號發(fā)布
,神州鯤泰和神州問學均已支持23.17%000034.SZ神州數碼DeepSeek
的部署。神州數碼還將
DeepSeek
集成到其自主研發(fā)的神州
問學平臺中
,僅需3
分鐘部署
DeepSeek模型。根據2025年2
月6日
官微
,順網智算是一個AIINFRA
平臺,
目
前已22.26%300113.SZ順網科技經可以支持
DeepSeek模型的部署和運行
,預計后續(xù)
DeepSeek模型亦會應用于順網智能客服和嘮嘮等AI
應用。2025年02
月06
日公司官微:2
月6日
,開普云旗下開悟大模型應用產22.11%688228.SH開普云品積極適配國產大模型
,在開悟大型能體平臺接入
DeepSeekV3、R1
在線模型API
,在運營管理平臺部署量化版
R1
模型服務
,在端側一體機中部署蒸餾量化版
R132B型20.56%002354.SZ天娛數科根據證券時報網2025年
1
月27日新聞
,天娛數科為
DeepSeek移動
應用分發(fā)服務商。20.00%-
15-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告601360.SH三六零根據2025年2
月2日
官微,360數字安全集團宣布其安全大模型正式
接入
DeepSeek
,將以
DeepSeek
為安全大模型基座
,發(fā)揮360安全
大數據優(yōu)勢
,通過繼續(xù)強化學習等技術手段
,訓練出“
DeepSeek版”安
全大模型
,讓安全真正做到“
自動駕駛”。18.92%300624.SZ萬興科技根據萬興科技2025年2
月4日
官微,AIGC
軟件A股上市公司萬技
(300624.SZ)率先完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1
的深入適配,
涵蓋旗下視頻創(chuàng)意
、繪圖創(chuàng)意及文檔創(chuàng)意
軟件業(yè)務多款產品。根據2024
年
8
月
8日
互動易回復,
昆侖萬維攜手新加坡南洋理工大學
成功開發(fā)Q*算法,顯著提升現有大模型推理能力。在GSM8K
數據集上,
Q*幫助Llama-2-7b
提升至
80.8%的準確率
,超越了ChatGPT;在MATH17.32%300418.SZ昆侖萬維數據集上
,Q*幫助DeepSeek-Math-7b
提升至
55.4%的準確率
,超越了GeminiUltra;在MBPP
數據集上
,Q*幫助CodeQwen1.5-7b-Chat提升至
77.0%的準確率
,縮小了與GPT-4
的編程水平差距。Q*能夠不僅大幅提
升了小模型的性能,還顯著降低了計算資源的需求,為人工智能的廣泛
應用帶來了全新可能。16.37%688208.SH道通科技2025
年2
月6日證券時報網新聞,道通AI
團
隊已完成
DeepSeek
的全
面接入和本地化部署,并應用
DeepSeek訓練流程,加速推進道通以“
巡
檢垂域大模型”
為核心的“
空地一體解決方案”在能源、交通等領域的廣泛
推廣。2025年2
月5日微信公眾號發(fā)布
,公司
InHandAl技術團隊成功在15.95%301070.SZ開勒股份EC5000
系列邊緣計算機上完成
DeepSeekR1
蒸餾模型的本地部署。這一成果驗證了輕量級邊緣設備(如EC5000)在
AI推理任務中的強大潛
力。15.82%002439.SZ啟明星辰2025年02
月06
日
官微:啟明星辰目前已完成了“安星”智能體與DeepSeek
大模型的全面對接
,并應用到安全運營
、威脅檢測(脅情報、
數據安全等全業(yè)務場景中,
實現了安全智能化能力的再級。根據2025
年2
月5
日
互動易,公司目前已有相關合作
,正在進行對接14.02%300494.SZ盛天網絡使用deepseek模型,目前公司一款底層對接deepseek
的社交小游戲
已完成了一輪內部測試。13.46%002212.SZ天融信2025年2
月6日
官微:近日,天融信天問大模型正式完成
DeepSeek
大
模型的接入,賦能安全事件檢測分析
、威脅情報融合等多個場景,進
一步提升了天融信現有的安全產品和服務能力。12.95%600986.SH浙文互聯根據2025年2
月6日
官微
,春節(jié)前浙文互聯完成本地化部署的
DeepSeek-R1推理大模型。2025
年2
月2
日子公司超訊智能微信公眾號發(fā)布,公司聯手開源中國、12.65%603322.SH超訊通信沐曦
、
米塔碳等合作伙伴完成
DeepSeek-R170B部署
,并支持
1.5B,
7B
,14B
,32B
蒸餾模型的部署,
兼容openaiapi格式輸出。根據2025年2
月5日
官微
,亞信安全基于
DeepSeek-R1作為基座利12.48%688225.SH亞信安全用多年來積累的網絡安全獨家數據
,進一步訓練和提升“信立方網絡安
全領域大模型;同時,基于
DeepSeekMoE
架構,整合網絡安全專家模
型。12.41%603019.SH中科曙光根據光合組織2025
年2
月2
日
官微,
海光信息技術團隊成功完成DeepSeekV3和
R1模型與海光
DCU(深度計算單元)
的國產化適配,并11.99%-
16-
請務必閱讀正文之后的重要聲明部分行業(yè)點評報告300002.SZ神州泰岳正式上線。據子公司鼎富智能官網:鼎富智能研發(fā)的AI
外呼機器人整合通義千問
、
智譜AI和
DeepSeek
等國內領先的基礎大模型技術,
實現了外呼效果
的全方位提升。11.56%300364.SZ中文在線2025年2
月5日
官微:基于
DeepSeekV3
與
R1提出的技術路線,中文
在線正著力研發(fā)并訓練升級版“
中文逍遙”,
以進一步提升該大模型的創(chuàng)
作能力
。目
前
,公司已在部分內部AI
網文創(chuàng)作流程中部署11.21%300182.SZ捷成股份DeepSeek-R1
,通過調用
DeepSeek-R1
的能力
,增強創(chuàng)作效率2025
年2
月6日參股公司世優(yōu)科技微信公眾號發(fā)布
,世優(yōu)科技推出的
“世優(yōu)波塔”AI數字人智能體與
DeepSeek的通用人工智能(AGI)能力結
合,與世優(yōu)波塔的182個數字人面部控制技術結合,打造了“
情感反饋
”
能力。11.13%300188.SZ國投智能2025年2
月5日
官微:“
星盾”、“Qiko”
等自研平臺也第一時間成立接入
DeepSeek,進一步滿足行業(yè)客戶的多樣化需求。據子公司北京創(chuàng)業(yè)未來傳媒技術有限公司官微:黑馬天啟基于10.02%300688.SZ創(chuàng)業(yè)黑馬DeepSeek發(fā)布政策大模型
1.1版,基于
DeepSeek技術架構,通過底
層能力重構與數據體系拓展,迭代升級出更精準高效的政務政策解決方
案。9.86%000681.SZ視覺中國2025年2
月5
日
官微:視覺中國近期完成深度求索公司開源大模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家族管理會管理制度
- 應急搶險隊管理制度
- 形體舞蹈室管理制度
- 征地辦工作管理制度
- 心電圖衛(wèi)生管理制度
- 心里減壓室管理制度
- 快遞操作工管理制度
- 急救實訓室管理制度
- 總經理外派管理制度
- 惠而浦公司管理制度
- 品管圈PDCA獲獎案例呼吸科提高患者吸入劑規(guī)范使用達標率
- 電池安全管理
- 住宿安全檢查清單
- 我的家鄉(xiāng)廣東河源
- 《信號工程施工》課件全套 穆中華 項目1-3 信號圖紙識讀、施工技能訓練、信號聯鎖試驗
- 智能制造變革者
- 腸道菌群移植治療糖尿病
- 痛風腎病的中醫(yī)護理方案
- 2024年玉溪市事業(yè)單位招考及易考易錯模擬試題(共500題)試卷后附參考答案
- 麻醉恢復室病人的護理
- 四川燃氣用戶安裝檢修工理論考試題及答案
評論
0/150
提交評論