




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
n
三個模型:純強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)
o1
能力,引發(fā)新一輪革命。DeepSeek
由幻方量化創(chuàng)立,
創(chuàng)始人為梁文峰,2024年
12
月,DeepSeek-V3發(fā)布,性能對齊海外領(lǐng)軍閉源模
型。2025年
1
月,以
V3為基座,衍生出強(qiáng)化推理版
R1-Zero+泛化推理版
R1
,性能
對標(biāo)
OpenAI-o1正式版。n
兩大貢獻(xiàn):
復(fù)現(xiàn)
o1強(qiáng)化學(xué)習(xí)效果+
實現(xiàn)有限算力的算法創(chuàng)新。
1
)捅破強(qiáng)化學(xué)習(xí)用于
大模型推理的窗戶紙。DeepSeek
R1是繼
openAI
o1之后,推理的第二個里程碑。2)
根據(jù)
DeepSeek
公開的數(shù)據(jù),按照
1張
H800每小時
2美元的租賃成本算,V3預(yù)訓(xùn)
練成本只有
557.6
萬美金,用
1萬張
H800只需要
11天就能訓(xùn)練完,僅使用不到
1/
10
的成本就達(dá)到了國際上領(lǐng)先模型的表現(xiàn),這對當(dāng)前我國突破算力卡脖子限制具備重要
意義。n
九大創(chuàng)新:模型創(chuàng)新+
系統(tǒng)優(yōu)化+商業(yè)模式開源。n
4個模型本身創(chuàng)新點:
1
)V3基座能力強(qiáng)勁,具備較高的基座模型能力、DeepSeek
系統(tǒng)效率、RL
調(diào)教能力;2)
R1-zero
模型直接應(yīng)用
RL
到基礎(chǔ)模
型,而不依賴作為初步步驟的監(jiān)督微調(diào)(
SFT);3)R1泛化推理模型,通過深
度推理
SFT
數(shù)據(jù)(本身帶推理能力)+通用
SFT
數(shù)據(jù)實現(xiàn)推理能力的跨任務(wù)泛
化;4)通過模型與強(qiáng)化學(xué)習(xí)環(huán)境交互,在沒有獎勵思維鏈長度的情況下,
自發(fā)
涌現(xiàn)了反思和長思考能力,帶動推理能力提升。n
4個系統(tǒng)優(yōu)化創(chuàng)新點:
1)復(fù)雜均衡優(yōu)化:
引入動態(tài)調(diào)整的
Expert
Bias
,只影響
專家路由,不產(chǎn)生任何梯度影響;2)通信優(yōu)化:提出
DualPipe
算法,精細(xì)控制
分配給計算和通信的
GPU
SM
數(shù)量,保證計算和通信完全重疊,顯著減少了
L2
緩存的使用和對其他
SM
的干擾,從而提升了系統(tǒng)性能;
3)內(nèi)存優(yōu)化:
啟用上
下文硬盤緩存技術(shù),把預(yù)計未來會重復(fù)使用的內(nèi)容,緩存在分布式的硬盤陣列中,
以應(yīng)對上下文
KV
Cache緩存的問題;4)計算優(yōu)化:采用組相對策略優(yōu)化(
GRPO
)
替代傳統(tǒng)的近端策略優(yōu)化(
PPO),優(yōu)勢在于無需單獨的價值模型、采用基于組
的相對優(yōu)勢估計、顯著降低內(nèi)存和計算開銷、增強(qiáng)了模型的數(shù)學(xué)推理能力。n
1個商業(yè)模式創(chuàng)新點:
堅持開源,DeepSeek
開源了原生
FP8權(quán)重,公開深度思
考過程、免費允許用戶無限制商用、鼓勵蒸餾。n
行業(yè)影響:
算力需求仍未見頂,重心向推理側(cè)遷移。
1
)模型側(cè):
scalinglaw
沒有失
效,還在持續(xù)迭代,
大概率往推理方向卷。2)算力側(cè):基座模型仍需云上算力來迭
代,云端推理部署需求存在,應(yīng)用爆發(fā)需要規(guī)模算力支持訪問;
3)端側(cè):應(yīng)用場景
的天然分散性會導(dǎo)致推理需求指數(shù)增長,Agent
與各類終端、用戶入口的加速結(jié)合。n
投資方向和標(biāo)的建議:n
第一類:
用戶入口與
agent
的融合。1)Agent+C端各類終端入
口。
①手機(jī):R1本地部署要求大幅降低,
內(nèi)嵌在各
種系統(tǒng)、軟件中的場景將大幅增加,HarmonyOS
NEXT
小藝助手接入DeepSeek
,建議關(guān)注:
潤和軟件、
法本信息、軟通動力、
東方中科、誠邁
科技、
中科創(chuàng)達(dá)、拓維信息等。
②智能汽車:低成本高性能
AI
Agent
與座
艙結(jié)合,顯著提升人車智能交互體驗的同時,能打造差異化競爭優(yōu)勢,建議
關(guān)注:黑芝麻智能、地平線機(jī)器人、德賽西威、經(jīng)緯恒潤、
中科創(chuàng)達(dá)、光庭
信息。
③機(jī)器人:
消費類機(jī)器人與AI
Agent
集合,提升智能家居用戶體驗,
加速教育用戶實現(xiàn)場景擴(kuò)容。建議關(guān)注:
螢石網(wǎng)絡(luò)等。
2)B端軟件:
B端公司掌握了大量用戶入
口,并具備品牌優(yōu)勢和壁壘,通過模
型接入實現(xiàn)降本增效,同時憑借
Deepseek
的更低推理成本,未來有望實現(xiàn)
增收又增利。建議關(guān)注:合合信息、金山辦公、
同花順、萬興科技、
中望軟
件等。
n
第二類:
國產(chǎn)算力。算法和軟硬件協(xié)調(diào)發(fā)展、形成系統(tǒng)性彎道超車,
①華為昇騰
產(chǎn)業(yè)鏈:建議關(guān)注軟通動力、烽火通信、神州數(shù)碼以及相關(guān)配套硬件廠商;
②中
科院算力產(chǎn)業(yè)鏈:
建議關(guān)注海光信息、
中科曙光、
曙光數(shù)創(chuàng)、寒武紀(jì)等。
n
風(fēng)險提示:技術(shù)迭代不及預(yù)期的風(fēng)險;
市場競爭加劇的風(fēng)險;人才流失風(fēng)險的風(fēng)險;
研究報告中使用的公開資料可能存在信息滯后或更新不及時的風(fēng)險分析師:孫行臻執(zhí)業(yè)證書編號:S0740524030002Email:sunxz@zt基本狀況上市公司數(shù)337行業(yè)總市值(億元)44,
199.21行業(yè)流通市值(億元)38,242.67行業(yè)-市場走勢對比1、《中國電子核心資產(chǎn)盤點——重
點
央
企
資
產(chǎn)盤
點系
列(
二
)
》
2024-11-132、《中電科核心資產(chǎn)盤點——重點
央企資產(chǎn)盤點系列(一)》2024-10-30報告摘要評級:
增持(維持)相關(guān)報告證券研究報告/行業(yè)點評報告請務(wù)必閱讀正文之后的重要聲明部分2025
年
02
月
09日計算機(jī)內(nèi)容目錄一、三個模型:
純強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)
o1
能力,引發(fā)新一輪革命
.....................................31.1基因根植+加速迭代,DeepSeek
正式出圈
...................................................31.2三個模型:
以
V3為基座,衍生強(qiáng)化推理版
R1-Zero+泛化推理版
R1
.........
3二、兩大貢獻(xiàn):復(fù)現(xiàn)
o1強(qiáng)化學(xué)習(xí)效果+
實現(xiàn)有限算力的算法創(chuàng)新
............................5三、九大創(chuàng)新:模型創(chuàng)新+
系統(tǒng)優(yōu)化+商業(yè)模式開源
..................................................7四、
行業(yè)影響:算力需求仍未見頂,重心向推理側(cè)遷移
........................................
11投資建議
...................................................................................................................13風(fēng)險提示
...................................................................................................................18圖表目錄圖表1:
2025年
1月
AI
應(yīng)用全球日活總榜
.............................................................3圖表2:
DeepSeek
全球增速最快
Al
應(yīng)用
................................................................3圖表3:
DeepSeek
的
LLM
模型分三個版本
............................................................4圖表4:
DeepSeek-V3和
DeepSeek-R1與其他代表性模型的比較
.......................5圖表5:
OpenAI
o1模型性能在訓(xùn)練時間和訓(xùn)練時間計算上均平穩(wěn)提升
.................6圖表6:
DeepSeekV3預(yù)訓(xùn)練成本測算
....................................................................
6圖表7:
DeepSeekV3模型性價比處于最優(yōu)范圍
.....................................................
7圖表8:
DeepSeek-V3及其同類產(chǎn)品的基準(zhǔn)性能
....................................................
7圖表9:
DeepSeek-R1-Zero
和
OpenAI
o1模型在推理相關(guān)基準(zhǔn)測試中的比較
.....
8圖表10:
DeepSeek-R1及其同類產(chǎn)品的基準(zhǔn)性能
..................................................8圖表11:強(qiáng)化學(xué)習(xí)過程中
DeepSeek-R1-Zero
在訓(xùn)練集上的平均響應(yīng)長度
...........9圖表12:
Loss-Free
負(fù)載均衡策略
...........................................................................9圖表13:
DualPipe
關(guān)鍵是在一對獨立的前向和后向塊中重疊計算和通信
............
10圖表14:
多輪對話場景,下一輪對話會命中上一輪對話生成的上下文緩存
.........10圖表15:數(shù)據(jù)分析場景,后續(xù)具有相同前綴的請求會命中上下文緩存
................
10圖表16:
PPO
與
GRPO
原理對比
.........................................................................
11圖表17:
DeepSeek
蒸餾模型與其他可比模型表現(xiàn)對比
.......................................11圖表18:
大模型發(fā)展重心有望進(jìn)一步向
“后訓(xùn)練、推理側(cè)、
自主智能體”偏移
..
12圖表19:
亞馬遜、谷歌、微軟和
Meta
或計劃加大
AI
資本支出(十億美元)
.....
12圖表20:
DeepSeek-V3
的訓(xùn)練成本相比其對標(biāo)模型訓(xùn)練成本大幅降低
...............
13圖表21:
DeepSeek-R1在推理成本方面展現(xiàn)出顯著優(yōu)勢
.....................................
13圖表22:接入
DeepSeek
相關(guān)標(biāo)的合作及漲幅匯總
.............................................14-2-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告一、三個模型:純強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)
o1
能力,引發(fā)新一輪革命1.1基因根植+加速迭代,DeepSeek
正式出圈前世今生:
幻方量化創(chuàng)立,創(chuàng)始人為梁文峰。
DeepSeek
成立于
2023年
5
月,由量化巨頭幻方量化創(chuàng)立,其創(chuàng)始人梁文峰在量化投資和高性能計算領(lǐng)
域具有深厚的背景和豐富的經(jīng)驗。l
2024年
5月,DeepSeek-V2
發(fā)布,成為全球最強(qiáng)開源通用
MoE
模型。l
2024年
12
月,DeepSeek-V3發(fā)布,性能對齊海外領(lǐng)軍閉源模型。l
2025
年1
月
,
DeepSeek-R1
發(fā)布
,
性能對標(biāo)OpenAI-o1
正式版
。
DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)
注數(shù)據(jù)的情況下,極大提升了模型推理能力。
同時
DeepSeek
開源
R1
推理模型,允許所有人在遵循
MIT
License
的情況下,蒸餾
R1訓(xùn)練其他
模型。快速出圈:
上線
20
天全球
日活就突破
2000
萬。
DeepSeek
應(yīng)用于
2025
年
1
月
11
日發(fā)布,截止
2025
年
1
月
31
日上線僅
21天。春節(jié)期間國貨之
光
DeepSeek
迅速點燃了全民參與熱情,上線
20天全球日活就突破
2000
萬,
已然成為現(xiàn)在全球增速最快的
AI
應(yīng)用。l
25M1全球數(shù)據(jù):1
)DeepSeek
日活躍用戶
DAU2215
萬,達(dá)
ChatGPT日活用戶的
41.6%
,超過豆包的日活用戶
1695
萬。2)上線僅
21
天,
憑
3370
萬月活
MAU
排名全球總榜TOP4。
3)截止
2025年
1
月
31
日
DeepSeek
霸榜蘋果應(yīng)用商店
157個國家/地區(qū)的第一名,MAU
月活
躍用戶占比最多的前
5
國家為:中國
30.71%,印度
13.59%,印尼
6.94%,
美國
4.34%
,法國
3.21%。l
25M1
國
內(nèi)數(shù)據(jù):
1)豆包第一
7861
萬
MAU
、
DeepSeek
第二
3370
萬
MAU
、Kimi
第三
1943
萬
MAU
、文小言第四
1305
萬
MAU。
MAU
數(shù)據(jù)
不包括接入
DeepSeek
的
C端應(yīng)用和模型云服務(wù)平臺(
納米
AI
搜索、
秘塔
AI
搜索、硅基流動
x
華為云)
。圖表2:DeepSeek
全球增速最快Al
應(yīng)用圖表1:2025
年1月AI
應(yīng)用全球日活總榜1.2三個模型:
以
V3為基座,衍生強(qiáng)化推理版
R1-Zero+泛化推理版
R1DeepSeek
的
LLM
模型分三個版本——基座模型
V3、強(qiáng)化推理版
R1-Zero
、
泛化推理版
R1。來源:A
I產(chǎn)品榜,
中泰證券研究所注:僅包含應(yīng)用(APP)全球i0S、海
外
GP、以及國內(nèi)安卓市場,不
含網(wǎng)站
(Web);數(shù)據(jù)范圍
2025/1/1-2025/1/31。來源:A
I產(chǎn)品榜,中泰證券研究所注:僅包含應(yīng)用(APP)全球i0S、海外GP、
以及國內(nèi)安卓市場,不含網(wǎng)站(Web)。-3-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告來源:
AI
大模型前沿公眾號,
中泰證券研究所1
)基座模型
V3:V3基座模型總參數(shù)為
671B
,(對比
GPT3參數(shù)
175B
、
GPT4
參數(shù)
1.76T),有
61
層transformer、并且用
MoE
代替?zhèn)鹘y(tǒng)Transformer模型中的前饋網(wǎng)絡(luò)(
FFN
)層,每一層包括大量的細(xì)粒度專家,有
1個共享
專家+256個路由專家。l
知識:
1)在MMLU
、
MMLU-Pro
和
GPOA
等教育基準(zhǔn)測試中
,
DeepSeek-V3的
表
現(xiàn)
優(yōu)
于
所
有
其
他
開
源模
型
,
在
MMLU/MMLU-Pro/GPOA
分
別
達(dá)
到88.5/75.9/59.1
,
性
能
可
與
GPT-4o和
Claude-Sonnet-3.5等領(lǐng)先的閉源模型相媲美。2)對于事
實性基準(zhǔn)測試,DeepSeek-V3在英文
SimpleQA
方面落后于
GPT-4o
和Claude-Sonnet3.5
,但它在中文
Chinese
SimpleQA
表現(xiàn)卓越,
適宜中文語言環(huán)境和應(yīng)用場景。l
代碼、數(shù)學(xué)和推理:1
)DeepSeek-V3在數(shù)學(xué)相關(guān)基準(zhǔn)性能變現(xiàn)優(yōu)越,
在
MATH-500
的表現(xiàn)甚至優(yōu)于
o1-preview。2
)在編碼相關(guān)任務(wù)上,
DeepSeek-V3
在
LiveCodeBenc
等編碼競賽基準(zhǔn)上表現(xiàn)出最佳性能,
工程相關(guān)表現(xiàn)略低于
Claude-Sonnet-3.5
,但仍優(yōu)于其他模型。2)R1-Zero(
強(qiáng)化推理版本):沒有
warmup
階段、沒有監(jiān)督微調(diào)的數(shù)據(jù),
從
DeepSeek-v3基座,直接進(jìn)行強(qiáng)化學(xué)習(xí),技術(shù)上比較激進(jìn)、效果顯著、
能完美復(fù)現(xiàn)
o1
,但不足之處是沒有監(jiān)督微調(diào)的數(shù)據(jù)啟動、可讀性差、語言
混雜輸出。l
推理任務(wù):
DeepSeek-R1在
AIME2024
上達(dá)到了
79.8%的
Pass@1
分?jǐn)?shù),略微超過了
OpenA1-o1-1217。在
MATH-500上,它取得了令
人印象深刻的
97.3%的分?jǐn)?shù),與
OpenA1-o1-1217相當(dāng),遠(yuǎn)遠(yuǎn)超過了
其他模型。l
編碼任務(wù):
DeepSeek-R1在代碼競賽任務(wù)中表現(xiàn)出專家級水平,它
在
Codeforces
上獲得了
2029
的
Elo
評分,超過了
96.3%的人類參
與者。l
工程任務(wù):DeepSeek-R1
的表現(xiàn)略微優(yōu)于
DeepSeek-V3,這可以幫
助開發(fā)者在實際任務(wù)中。l
知
識
:在
MMLU
、MMLU-Pro
和GPQADiamond
等
基
準(zhǔn)
上,
DeepSeek-R1
取得了卓越的成績
,顯著優(yōu)于DeepSeek-V3,在
MMLU
上的得分為
90.8%
,在
MMLU-Pro
上的得分為
84.0%
,在
GPOADiamond
上的得分為
71.5%。雖然它在這些基準(zhǔn)上的表現(xiàn)略低
于
OpenAl-o1-1217
,但
DeepSeek-R1超越了其他閉源模型,展示
了其在教育任務(wù)中的競爭優(yōu)勢。-4-
請務(wù)必閱讀正文之后的重要聲明部分圖表3:DeepSeek
的LLM
模型分三個版本行業(yè)點評報告來源:
《DeepSeek-V3Technical
Report》
,DeepSeek
公眾號,
中泰證券研究所二、兩大貢獻(xiàn):復(fù)現(xiàn)
o1強(qiáng)化學(xué)習(xí)效果+
實現(xiàn)有限算力的算法創(chuàng)新DeepSeek
的兩大重要貢獻(xiàn),一是捅破強(qiáng)化學(xué)習(xí)用于大模型推理的窗戶紙、
二是掀起低成本算力革命,且全球范圍率先實現(xiàn)并開源。
1
)捅破強(qiáng)化學(xué)習(xí)用于大模型推理的窗戶紙。如果說
openAI
的
o1是推理的
第一個里程碑,那
DeepSeek
R1可以稱之為第二個里程碑,堪比
2023年
初的
ChatGPT
時刻。l
openAI
o1:
引入新的范式,推動
scaling
law
繼續(xù)往強(qiáng)化學(xué)習(xí)、推理方
向突破。通過強(qiáng)化學(xué)習(xí)可以識別并糾正自己的錯誤,將復(fù)雜的步驟分解
為更簡單的,并嘗試行不通時換其他方法,這個過程是模型自
己學(xué)習(xí)而
非人為干擾。l
DeepSeek
R1:全球第一個通過強(qiáng)化學(xué)習(xí)完美復(fù)現(xiàn)
o1能力的模型。l
事實基準(zhǔn)
SimpleQA
測評:
DeepSeek-R1優(yōu)于
DeepSeek-V3
,展
示了其在處理基于事實的查詢方面的能力。在這一基準(zhǔn)上,OpenAl-01
超過了
4o也出現(xiàn)了類似的趨勢。3)R1(
泛化推理版本):基于
DeepSeek-v3基座,先用
SFT
來啟動,
構(gòu)建少量
Long-CoT(長思維鏈)數(shù)據(jù)來微調(diào)模型(使模型先跟隨樣本學(xué)習(xí)
思維鏈的方法),防止
RL
早期不穩(wěn)定和可讀性差的問題。第二步再進(jìn)行和
R1-zero
一樣的強(qiáng)化學(xué)習(xí),同時引入語言一致性獎勵(減少語言混雜輸出的
問題)。第三步,生成的深度推理
SFT
數(shù)據(jù)再結(jié)合通用
SFT
數(shù)據(jù),一起微
調(diào)大模型,再進(jìn)行強(qiáng)化學(xué)習(xí)。圖表4:DeepSeek-V3和DeepSeek-R1與其他代表性模型的比較-5-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告來源:OpenAI
官網(wǎng),
中泰證券研究所2)實現(xiàn)有限算力下的算法創(chuàng)新。根據(jù)
DeepSeek
公開的數(shù)據(jù),按照
1
張
H800每小時
2
美元的租賃成本算,V3預(yù)訓(xùn)練成本只有
557.6萬美金(僅
包括DeepSeek-V3的正式訓(xùn)練,
不包括與架構(gòu)、
算法或數(shù)據(jù)相關(guān)的先前
的研究或精簡實驗的成本),如果用
1萬張
H800只需要
11天就能訓(xùn)練完。
如果參數(shù)量為
671B
的
DeepSeekV3使用
H800訓(xùn)練,整個訓(xùn)練過程僅使
用不到
280萬個
GPU
小時,相比之下,Llama3405B使用
H100
的訓(xùn)練時
長是
3080萬
GPU
小時,DeepSeek
僅使用不到
1/
10
的成本就達(dá)到了國際
上領(lǐng)先模型的表現(xiàn),這對當(dāng)前我國突破算力卡脖子限制具備重要意義。
目前
模型性能/性價比優(yōu)勢顯著
,模型
API
服務(wù)定價也將調(diào)整為每百萬輸入
tokens0.5元(緩存命中)/2元(緩存未命中
),每百萬輸出
tokens8元。圖表5:OpenAI
o1
模型性能在訓(xùn)練時間和訓(xùn)練時間計算上均平穩(wěn)提升-6-
請務(wù)必閱讀正文之后的重要聲明部分圖表6:DeepSeekV3
預(yù)訓(xùn)練成本測算來源:
《DeepSeek-V3Technical
Report》
,
中泰證券研究所行業(yè)點評報告來源:
Deepseek
公眾號,
中泰證券研究所三、九大創(chuàng)新:模型創(chuàng)新+
系統(tǒng)優(yōu)化+商業(yè)模式開源模型本身具備
4個創(chuàng)新點:
1
)基座模型
V3性能強(qiáng)大。
R1
的成功離不開
DeepSeek-V3
強(qiáng)大的基
座模型能力、DeepSeek
系統(tǒng)效率、RL
調(diào)教能力。DeepSeek-V3
多項
評測成績超越了Qwen2.5-72B和
Llama-3.
1-405B等其他開源模型代碼
和數(shù)學(xué)方面表現(xiàn)尤為突出;并在性能上和世界頂尖的閉源模型GPT-4o
以及Claude-3.5-Sonnet
相媲美。-7-
請務(wù)必閱讀正文之后的重要聲明部分圖表8:DeepSeek-V3
及其同類產(chǎn)品的基準(zhǔn)性能圖表7:DeepSeekV3
模型性價比處于最優(yōu)范圍來源:
《DeepSeek-V3Technical
Report》
,
中泰證券研究所行業(yè)點評報告來源:
《DeepSeek-R1:
Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》
,
中泰證券研究所4)
自發(fā)涌現(xiàn)了反思能力、長思考能力。
隨著測試時間的增加,模型出
現(xiàn)了復(fù)雜的行為。模型能夠回顧和重新評估其之前的步驟,
自發(fā)地探索
解決問題的替代方法,這些行為不是顯式編程的結(jié)果,而是模型與強(qiáng)化來源:
《DeepSeek-R1:
Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》
,
中泰證券研究所3)第三個創(chuàng)新點是,R1泛化推理模型,通過深度推理
SFT
數(shù)據(jù)(本
身
帶推
理
能
力
)+
通
用
SFT
數(shù)據(jù)
實
現(xiàn)推
理
能
力的跨任
務(wù)
泛化。DeepSeek-R1-Zero存在可讀性差和語言混合等問題。
因此,研究引入
DeepSeek-R1,通過收集少量冷啟動數(shù)據(jù)對基礎(chǔ)模型進(jìn)行微調(diào),并采用
多階段訓(xùn)練流程,最終獲得了與
OpenAI
o1-1217性能相當(dāng)?shù)哪P汀?)R1-zero模型直接應(yīng)用
RL
到基礎(chǔ)模型,而不依賴作為初步步驟的監(jiān)
督微調(diào)(
SFT)。其重要意義在于驗證
LLMs
的推理能力可以通過
RL完全激勵,而不需要
SFT。R1-zero
以
DeepSeek-V3-Base
為基礎(chǔ)模型,采用
GRPO(Group
Relative
Policy
Optimization
)作為
RL
框架來提高
模型在推理任務(wù)中的性能,并且采用
rule-based
reward
system
的方式
來確保強(qiáng)化學(xué)習(xí)能實現(xiàn)規(guī)模化。圖表9:DeepSeek-R1-Zero和OpenAI
o1
模型在推理相關(guān)基準(zhǔn)測試中的比較-8-
請務(wù)必閱讀正文之后的重要聲明部分圖表10:DeepSeek-R1
及其同類產(chǎn)品的基準(zhǔn)性能行業(yè)點評報告來源:《DeepSeek-R1:Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》,
中泰證券研究所系統(tǒng)優(yōu)化具備
4個創(chuàng)新點:
DeepSeek
通過負(fù)載均衡優(yōu)化、通信優(yōu)化(硬件)、內(nèi)存優(yōu)化(硬件)、
計算優(yōu)化四重優(yōu)化,實現(xiàn)了算法、軟件、硬件協(xié)同創(chuàng)新,通過算法和工
程上的創(chuàng)新
,
DeepSeek-V3
的生成吐字速度從
20TPS
大幅提高至
60TPS
,相比
V2.5模型實現(xiàn)了
3倍的提升,為用戶帶來更加迅速流暢
的使用體驗。1
)負(fù)載均衡優(yōu)化:
負(fù)載均衡是為了避免所有任務(wù)都堆在個別專家形成
堰塞湖,因此
V3模型引入一個動態(tài)調(diào)整的
Expert
Bias,Bias
只影響專
家路由,不產(chǎn)生任何梯度影響,通過動態(tài)調(diào)整
Expert
Bias
來調(diào)整各個
專家的門控分?jǐn)?shù),實現(xiàn)負(fù)載均衡。圖表11:強(qiáng)化學(xué)習(xí)過程中DeepSeek-R1-Zero在訓(xùn)練集上的平均響應(yīng)
長度學(xué)習(xí)環(huán)境交互的結(jié)果。在沒有獎勵思維鏈長度的情況下,模型就自發(fā)地
進(jìn)行越來越長的思考,這種自發(fā)發(fā)展顯著提高了
DeepSeek-R1-Zero
的
推理能力,使其能夠以更高的效率和準(zhǔn)確性處理更具挑戰(zhàn)性的任務(wù)。-9-
請務(wù)必閱讀正文之后的重要聲明部分圖表12:Loss-Free
負(fù)載均衡策略來源:智東西,
中泰證券研究所行業(yè)點評報告來源:
《DeepSeek-V3Technical
Report》
,
中泰證券研究所3)
內(nèi)存優(yōu)化:
復(fù)雜推理場景下的多輪對話和長序列需要緩存更多的
KVCache
,導(dǎo)致
GPU
高帶寬內(nèi)存容量成為瓶頸,而通過增加
DRAM
解決
問題又會讓推理成本激增。
為
了應(yīng)對上下文
KV
Cache
緩存的問題,
DeepSeek
采用創(chuàng)新性的硬盤緩存技術(shù),啟用上下文硬盤緩存技術(shù),把
預(yù)計未來會重復(fù)使用的內(nèi)容,緩存在分布式的硬盤陣列中。如果輸入存
在重復(fù),則重復(fù)的部分只需要從緩存讀取,無需計算。該技術(shù)不僅降低
服務(wù)的延遲,還大幅削減最終的使用成本,緩存命中的部分,DeepSeek每百萬tokens
收費
0.1元。圖表14:多輪對話場景,下一輪對話會命中上一輪
對話生成的上下文緩存2)通信優(yōu)化:關(guān)于專家并行的通信開銷的問題,提出
DualPipe
算法來解決,
精細(xì)控制分配給計算和通信的
GPU
SM
數(shù)量,保證計算和通信完全重疊。
硬件層面修改
CUDA
的底層匯編語言,通過定制的
PTX
指令來更精細(xì)
地控制底層
GPU
資源的分配和使用(
H800里面有
132個
SM
,分配20個
SM
來控制通信、同時還能動態(tài)調(diào)整分配給通信任務(wù)的warp
數(shù)量,
用剩下的
SM
做計算)
,顯著減少了
L2
緩存的使用和對其他
SM
的干
擾,從而提升了系統(tǒng)性能。4)計算優(yōu)化:DeepSeek-R1采用組相對策略優(yōu)化(
GRPO
)替代傳統(tǒng)的近
端策略優(yōu)化(
PPO
),優(yōu)勢在于無需單獨的價值模型、采用基于組的相
對優(yōu)勢估計、顯著降低內(nèi)存和計算開銷、增強(qiáng)了模型的數(shù)學(xué)推理能力。圖表15:數(shù)據(jù)分析場景,后續(xù)具有相同前綴的請求
會命中上下文緩存圖表13:DualPipe
關(guān)鍵是在一對獨立的前向和后向塊中重疊計算和通信-
10-
請務(wù)必閱讀正文之后的重要聲明部分來源:
DeepSeek
官網(wǎng),
中泰證券研究所來源:
DeepSeek
官網(wǎng),
中泰證券研究所行業(yè)點評報告來源:
《DeepSeek-R1:
Incentivizing
Reasoning
Capability
in
LLMs
via
Reinforcement
Learning》
,
中泰證券研究所四、行業(yè)影響:算力需求仍未見頂,重心向推理側(cè)遷移1
)模型側(cè):
Scaling
law
尚未失效仍在迭代,但重心有望進(jìn)一步向推理側(cè)
偏移。2024年
12
月,OpenAI
聯(lián)創(chuàng)
Ilya
在深度學(xué)習(xí)頂會
NeuralPS2024
上
表示預(yù)訓(xùn)練時代可能結(jié)束,其原因是互聯(lián)網(wǎng)的文本數(shù)據(jù)幾乎窮盡,而短期內(nèi)
數(shù)據(jù)難以迅速增長,基于此,行業(yè)的趨勢有望朝向推理側(cè)發(fā)展,其重心可能
從
“卷基座、卷模型”向
“卷推理、卷
AI
Agent
、卷應(yīng)用落地”過渡。來源:
CSDN
,
中泰證券研究所n
商業(yè)模式的
1個創(chuàng)新:開源1)DeepSeek
商業(yè)模式為開源,以開源精神和長期主義追求普惠
AGI。與
o1相反,DeepSeek
采用
FP8訓(xùn)練,并開源了原生
FP8權(quán)重,公開深度思
考過程、免費允許用戶無限制商用、鼓勵蒸餾(
用
R1輸出結(jié)果訓(xùn)練其他模
型
),盡可能降低用戶使用壁壘,全球范圍出圈和更容易建立起廣泛繁榮的
用戶生態(tài)。-
11-
請務(wù)必閱讀正文之后的重要聲明部分圖表17:DeepSeek
蒸餾模型與其他可比模型表現(xiàn)對比圖表16:PPO
與GRPO
原理對比行業(yè)點評報告圖表18:大模型發(fā)展重心有望進(jìn)一步向“后訓(xùn)練、推理側(cè)、
自主智能體”偏移來源:機(jī)器之心公眾號,
中泰證券研究所2)算力側(cè):
整體趨勢來看,Pre-training
將達(dá)瓶頸,基座模型格局日益明
朗,但算力需求仍未見頂。
即使互聯(lián)網(wǎng)中現(xiàn)成數(shù)據(jù)已完全納入訓(xùn)練集,模
型仍可運用合成數(shù)據(jù)等方式彌補(bǔ)訓(xùn)練數(shù)據(jù)的不足,基座模型依舊需要云上的
算力來迭代,Pre-training
的
scaling
law
有望續(xù)命;并且端側(cè)應(yīng)用與設(shè)備也
需要云上的算力來支持云端推理部署。
因此,長期來看,未來
AI
應(yīng)用與端
側(cè)的爆發(fā)將需要大規(guī)模算力來支持訪問,算力需求遠(yuǎn)未見頂。從海內(nèi)外視角看
DeepSeek
對算力廠商的影響。
①對國際大廠可能會帶來
短期沖擊,而從微軟、谷歌等云廠商最新公布的資本開支來看,算力相關(guān)的
開支依然堅挺,
目前來看對云廠商資本投入的決心影響較小。
長期來看,
AI
應(yīng)用的爆發(fā)有望帶來推理端需求迸發(fā),訓(xùn)練和推理此消彼長。在技術(shù)和
產(chǎn)品方面,我們預(yù)計大廠的優(yōu)勢還會引領(lǐng)一段時間。
②利好國產(chǎn)半導(dǎo)體產(chǎn)
業(yè)鏈,DeepSeek
實現(xiàn)有限算力下的算法創(chuàng)新,改善國產(chǎn)芯卡脖子和供給不
足的現(xiàn)狀,有望走上算法和軟硬件協(xié)調(diào)發(fā)展的路徑,以形成獨立且系統(tǒng)性領(lǐng)
先的生態(tài)。來源:凌通社,各公司官網(wǎng),
中泰證券研究所注:數(shù)據(jù)反映的是固定資產(chǎn)和設(shè)備的購買情況。本圖表展示了各日歷季
度的數(shù)據(jù)。微軟財年于
6
月
30日結(jié)束圖表19:亞馬遜、谷歌、微軟和Meta或計劃加大AI
資本支出(十億美元)-
12-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告投資建議n
第一類:
用戶入口與
agent
的融合。l
Agent+C端各類終端入
口:
因為
R1本地部署要求大幅降低,
內(nèi)嵌
在各種系統(tǒng)、軟件中的場景將大幅增加,強(qiáng)交互的手機(jī)/PC
、消費類
機(jī)器人、智能駕駛等智能硬件終端可能會百花齊放。1)手機(jī):
HarmonyOS
NEXT
小藝助手接入
DeepSeek
,用戶可
通過小藝助手與
DeepSeek
對話實現(xiàn)更加無縫的
AI
體驗,建
議關(guān)注:
潤和軟件、
法本信息、軟通動力、
東方中科、誠邁科
技、
中科創(chuàng)達(dá)、拓維信息等。
2)智能汽車:R1本地部署要求大幅降低,低成本高性能
AI
Agent與座艙結(jié)合,顯著提升人車智能交互體驗的同時,
能打造差異
化競爭優(yōu)勢,未來有望成為智艙發(fā)展新趨勢。建議關(guān)注:1
)芯
片:黑芝麻、地平線;2
)域控:德賽西威、經(jīng)緯恒潤;3)AI+
座艙:
中科創(chuàng)達(dá)、光庭信息。
3)機(jī)器人:消費類機(jī)器人與AI
Agent
集合,提升智能家居用戶體
驗,加速教育用戶實現(xiàn)場景擴(kuò)容。建議關(guān)注:
螢石網(wǎng)絡(luò)等。
l
B
端軟件:B端公司掌握了大量用戶入口,并具備品牌優(yōu)勢和壁壘,
在與
DeepSeek
開源高性能大模型融合后,
能夠降低自身的研發(fā)投
入、提升自身產(chǎn)品迭代速度、
增加客戶粘性和續(xù)費率
,
同時憑借
Deepseek
的更低推理成本,未來有望實現(xiàn)增收又增利。建議關(guān)注:
合合信息、金山辦公、
同花順、
萬興科技、
中望軟件等。
圖表20:DeepSeek-V3的訓(xùn)練成本相比其對標(biāo)模型
訓(xùn)練成本大幅降低圖表21:DeepSeek-R1在推理成本方面展現(xiàn)出顯
著優(yōu)勢3)應(yīng)用&端側(cè):
降本、
降門檻加速商業(yè)化,利好應(yīng)用與端側(cè)發(fā)展。從技術(shù)
上講,
DeepSeek
使得大模型向Agent
智能體更近一步,尤其是其開源特
性降低了模型技術(shù)的使用門檻,使更多中小科技企業(yè)有機(jī)會打造更優(yōu)質(zhì)的垂
類場景應(yīng)用,使
Agent
與各類終端、用戶入口的加速結(jié)合。從成本上講,
不論對于模型的訓(xùn)練側(cè)還是推理側(cè),Deepseek
為世界探出一條能夠以更低
成本布局
AI
的路徑,
因此應(yīng)用公司能夠以更低成本自研或調(diào)用
API
來打造
AI
應(yīng)用,利潤空間也有望進(jìn)一步提升。
隨著應(yīng)用的普及與能力的提升,端
側(cè)硬件將具備更優(yōu)的大規(guī)模落地的條件。來源:SemiAnalysis
,NVIDIA
,Anthropic
,Meta
,深度求索,
甲子光年,中泰證券研究所注:訓(xùn)練成本并不包括前期研究以及關(guān)于架構(gòu)、算法或數(shù)
據(jù)的消融實驗所產(chǎn)生的成本,也不包括人力成本及其他未提及的成本-
13-
請務(wù)必閱讀正文之后的重要聲明部分來源:Statista,
中泰證券研究所行業(yè)點評報告圖表22:接入DeepSeek
相關(guān)標(biāo)的合作及漲幅匯總證券代碼證券簡稱概念相關(guān)點年后累計漲幅(2025/2/5-2025/2/7)688158.SH優(yōu)刻得根據(jù)2025年2
月3日
官微
,優(yōu)刻得云平臺上線
DeepSeek-R1系列模
型72.81%300766.SZ每
日
互動根據(jù)2025年2
月4日公告,公司在較早時間就接入
DeepSeek相關(guān)版
本并完成各方面的評估及利用自有算力進(jìn)行私有化部署,目
前主要用于業(yè)務(wù)垂直場景使用
、研發(fā)提效(AI4SE)、知識庫問答以及將其納入數(shù)據(jù)
智能操作系統(tǒng)(DiOS)
的功能模塊等。根據(jù)2025
年2
月4
日
官微,安恒信息旗下恒腦·安全垂域大模型正式集65.73%688023.SH安恒信息成
DeepSeek,
完成基于
DeepSeekR1
的安全大模型的訓(xùn)練
,推出首
個“
DeepSeek”版安全智能體,
開啟全新智能化安全之旅。根據(jù)2025
年
1
月25日
官微,公司AK39系列芯片的天才虎AI
智能錄音54.73%688620.SH安凱微筆Pro4G
版推出市場,對接多家大模型底座,開啟智能錄音筆全新篇章
。
通過對接了豆包
、通義千問
、文心一言、DeepSeek、Kimi
等多家大語言
模型,并通過調(diào)優(yōu),能夠?qū)Σ煌竽P偷奶匦赃M(jìn)行分析與整合
,實現(xiàn)對多源語言理解優(yōu)勢的有效融合。2025年2
月6
日微信公眾號發(fā)布,首都在線云平臺快速上架
R1模型,51.32%300846.SZ首都在線還提供為期
1
個月的免費使用權(quán)限。用戶可以通過首都在線云平臺的強(qiáng)49.35%688058.SH寶蘭德大算力
,免受各種限制,
隨時隨地暢快地體驗
DeepSeek。根據(jù)青云科技2025年2
月4日
官微,
青云科技旗下AI
算力云服務(wù)一
基石智算CoresHub正式上線
DeepSeek-R1
系列模型,根據(jù)2025年2
月5日
官微,
品高AI
大模型融合平臺--AISTACK早在36.47%688227.SH品高股份2024年7
月開始支持
DeepSeek
的混合專家模型(MOE)
,并上架京東
商城,在
DeepSeek-R1發(fā)布后
,也第一時間在產(chǎn)品中進(jìn)行了集成為垂直領(lǐng)域大模型的落地提供了更強(qiáng)大的技術(shù)支持。2025年02
月05日
官微:春節(jié)期間,
云天勵飛芯片團(tuán)
隊完成35.95%688343.SH云天勵飛DeepEdge10“
算力積木”
芯片平臺與
R1-Distill-Qwen-1.5B、R1-Distill-Qwen-7B、R1-Distill-Llama-8B
大模型的適配
,可以交付客
戶使用。根據(jù)軟通動力2025
年2
月4
日
官微,作為中國數(shù)字技術(shù)產(chǎn)品和服務(wù)創(chuàng)33.89%301236.SZ軟通動力新領(lǐng)導(dǎo)企業(yè),軟通動力積極擁抱
DeepSeek,率先進(jìn)行產(chǎn)品的創(chuàng)新融合,
通過把
DeepSeek-R1接入天璇
MaaS
平臺,
以全棧AI技術(shù)服務(wù)加速
企業(yè)智能化轉(zhuǎn)型。33.46%002123.SZ夢網(wǎng)科技根據(jù)2025年2
月4
日
官微,隨著
DeepSeek
大模型的全球影響力持續(xù)
擴(kuò)大,夢網(wǎng)科技將
DeepSeek
大模型深度集成至多源AI
調(diào)度引擎“
天慧智匯臺2.0”,推動消息通信服務(wù)從基礎(chǔ)連接向智能決策升級,為行業(yè)開
辟5.70%效新路徑。33.11%n
第二類:
國產(chǎn)算力。
受益于
DeepSeek
的推出和生態(tài)繁榮,部分國產(chǎn)算
力產(chǎn)業(yè)鏈的公司有望實現(xiàn)算法和軟硬件協(xié)調(diào)發(fā)展,甚至達(dá)到系統(tǒng)性彎
道超車,建議關(guān)注:
1
)華為昇騰產(chǎn)業(yè)鏈:軟通動力、烽火通信、神州
數(shù)碼以及相關(guān)配套硬件廠商;2)中科院算力產(chǎn)業(yè)鏈;海光信息、
中科
曙光、曙光數(shù)創(chuàng)、寒武紀(jì)等。
-
14-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告002881.SZ美格智能根據(jù)2025年
1
月26日
官微
,公司結(jié)合美格智能自研的AIMO
智能體
及
DeepSeek-R1模型的基礎(chǔ)能力,開發(fā)面向工業(yè)智能化、座艙智能體
、
智能無人機(jī)
、機(jī)器人等領(lǐng)域的AIAgent應(yīng)用。根據(jù)2025
年2
月3
日全資子公司浙江數(shù)據(jù)管理微信公眾號,浙江省數(shù)33.10%600126.SH杭鋼股份據(jù)管理有限公司成功完成
DeepSeek-R1
的適配并實現(xiàn)DeepSeekR170B
參數(shù)及以下全部蒸餾模型的部署。根據(jù)2025年2
月5日
官微,奇安信宣布已完成與DeepSeek(深度求索)33.08%688561.SH奇安信的全面深度接入,奇安信自研QAX安全大模型通過
DeepSeekR1進(jìn)行
了一系列的優(yōu)化和蒸餾后,運營成本大幅降低
,同時在威脅研判等多個
場景下的模型性能方面獲得了顯著提升。根據(jù)參股公司杭州領(lǐng)信數(shù)科信息技術(shù)有限公司2025
年2
月6
日微信公31.11%688080.SH映翰通眾號:近日,領(lǐng)信數(shù)科已完成兩大核心
升級:AI
中臺一大白智腦,
完成
DeepSeek基座模型適配。30.88%600186.SH蓮花控股2025
年2
月4
日公司孫公司蓮花紫星官微:蓮花紫星已在自有算力上成
功部署
DeepSeekR1
大模型
,并全面支持智能體調(diào)用。29.42%300352.SZ北信源2025年2
月5日微信公眾號發(fā)布
,公司密信AI
能力平臺已成功對接
DeepSeek。27.40%300588.SZ熙菱信息根據(jù)公司官網(wǎng)
,公司AI
智慧助手平臺AILinkDebot產(chǎn)品接入集成了
qwen2-7b、deepseek、ChatGLM、
文心一言等模型,2025年2
月6日
官微:今天,
用友
BIP
全面上線以
DeepSeek-V3
和26.17%600588.SH用友網(wǎng)絡(luò)DeepSeek-R1作為基座大模型的智能服務(wù),企業(yè)客戶可以通過
BIP3R6
智能平臺的公有云
、
專屬云模式使用相關(guān)服務(wù)。根據(jù)2024年半年報,公司參股世優(yōu)科技3%股權(quán)。2025年
2
月
6日參25.57%300057.SZ萬順新材股公司世優(yōu)科技微信公眾號發(fā)布,世優(yōu)科技推出的“世優(yōu)波塔”AI
數(shù)字人25.06%688039.SH當(dāng)虹科技智能體與
DeepSeek
的通用人工智能(AGI)
能力結(jié)合。據(jù)當(dāng)虹科技2025
年2月
5日
官微
,近日,當(dāng)虹科技BlackEye多模態(tài)視
聽大模型正式融合DeepSeek-R1
和DeepSeekJanusPro,并完成視聽傳媒
、
工業(yè)與衛(wèi)星
、
車載智能座艙等多行業(yè)垂類場景的數(shù)據(jù)調(diào)優(yōu)訓(xùn)練。2025
年2
月4
日微信公眾號發(fā)布
,快麥小智推出了基于大模型的智能24.68%688365.SH光云科技體產(chǎn)品綾智
?;诰c智
,商家可以搭建導(dǎo)購助手
、智能培訓(xùn)
、對話打標(biāo)
等智能助理功能
。
目
前,綾智的多項業(yè)務(wù)場景和功能已經(jīng)接入并在支持
DeepSeek各個版本。2025
年2
月6
日微信公眾號發(fā)布
,神州鯤泰和神州問學(xué)均已支持23.17%000034.SZ神州數(shù)碼DeepSeek
的部署。神州數(shù)碼還將
DeepSeek
集成到其自主研發(fā)的神州
問學(xué)平臺中
,僅需3
分鐘部署
DeepSeek模型。根據(jù)2025年2
月6日
官微
,順網(wǎng)智算是一個AIINFRA
平臺,
目
前已22.26%300113.SZ順網(wǎng)科技經(jīng)可以支持
DeepSeek模型的部署和運行
,預(yù)計后續(xù)
DeepSeek模型亦會應(yīng)用于順網(wǎng)智能客服和嘮嘮等AI
應(yīng)用。2025年02
月06
日公司官微:2
月6日
,開普云旗下開悟大模型應(yīng)用產(chǎn)22.11%688228.SH開普云品積極適配國產(chǎn)大模型
,在開悟大型能體平臺接入
DeepSeekV3、R1
在線模型API
,在運營管理平臺部署量化版
R1
模型服務(wù)
,在端側(cè)一體機(jī)中部署蒸餾量化版
R132B型20.56%002354.SZ天娛數(shù)科根據(jù)證券時報網(wǎng)2025年
1
月27日新聞
,天娛數(shù)科為
DeepSeek移動
應(yīng)用分發(fā)服務(wù)商。20.00%-
15-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告601360.SH三六零根據(jù)2025年2
月2日
官微,360數(shù)字安全集團(tuán)宣布其安全大模型正式
接入
DeepSeek
,將以
DeepSeek
為安全大模型基座
,發(fā)揮360安全
大數(shù)據(jù)優(yōu)勢
,通過繼續(xù)強(qiáng)化學(xué)習(xí)等技術(shù)手段
,訓(xùn)練出“
DeepSeek版”安
全大模型
,讓安全真正做到“
自動駕駛”。18.92%300624.SZ萬興科技根據(jù)萬興科技2025年2
月4日
官微,AIGC
軟件A股上市公司萬技
(300624.SZ)率先完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1
的深入適配,
涵蓋旗下視頻創(chuàng)意
、繪圖創(chuàng)意及文檔創(chuàng)意
軟件業(yè)務(wù)多款產(chǎn)品。根據(jù)2024
年
8
月
8日
互動易回復(fù),
昆侖萬維攜手新加坡南洋理工大學(xué)
成功開發(fā)Q*算法,顯著提升現(xiàn)有大模型推理能力。在GSM8K
數(shù)據(jù)集上,
Q*幫助Llama-2-7b
提升至
80.8%的準(zhǔn)確率
,超越了ChatGPT;在MATH17.32%300418.SZ昆侖萬維數(shù)據(jù)集上
,Q*幫助DeepSeek-Math-7b
提升至
55.4%的準(zhǔn)確率
,超越了GeminiUltra;在MBPP
數(shù)據(jù)集上
,Q*幫助CodeQwen1.5-7b-Chat提升至
77.0%的準(zhǔn)確率
,縮小了與GPT-4
的編程水平差距。Q*能夠不僅大幅提
升了小模型的性能,還顯著降低了計算資源的需求,為人工智能的廣泛
應(yīng)用帶來了全新可能。16.37%688208.SH道通科技2025
年2
月6日證券時報網(wǎng)新聞,道通AI
團(tuán)
隊已完成
DeepSeek
的全
面接入和本地化部署,并應(yīng)用
DeepSeek訓(xùn)練流程,加速推進(jìn)道通以“
巡
檢垂域大模型”
為核心的“
空地一體解決方案”在能源、交通等領(lǐng)域的廣泛
推廣。2025年2
月5日微信公眾號發(fā)布
,公司
InHandAl技術(shù)團(tuán)隊成功在15.95%301070.SZ開勒股份EC5000
系列邊緣計算機(jī)上完成
DeepSeekR1
蒸餾模型的本地部署。這一成果驗證了輕量級邊緣設(shè)備(如EC5000)在
AI推理任務(wù)中的強(qiáng)大潛
力。15.82%002439.SZ啟明星辰2025年02
月06
日
官微:啟明星辰目前已完成了“安星”智能體與DeepSeek
大模型的全面對接
,并應(yīng)用到安全運營
、威脅檢測(脅情報、
數(shù)據(jù)安全等全業(yè)務(wù)場景中,
實現(xiàn)了安全智能化能力的再級。根據(jù)2025
年2
月5
日
互動易,公司目前已有相關(guān)合作
,正在進(jìn)行對接14.02%300494.SZ盛天網(wǎng)絡(luò)使用deepseek模型,目前公司一款底層對接deepseek
的社交小游戲
已完成了一輪內(nèi)部測試。13.46%002212.SZ天融信2025年2
月6日
官微:近日,天融信天問大模型正式完成
DeepSeek
大
模型的接入,賦能安全事件檢測分析
、威脅情報融合等多個場景,進(jìn)
一步提升了天融信現(xiàn)有的安全產(chǎn)品和服務(wù)能力。12.95%600986.SH浙文互聯(lián)根據(jù)2025年2
月6日
官微
,春節(jié)前浙文互聯(lián)完成本地化部署的
DeepSeek-R1推理大模型。2025
年2
月2
日子公司超訊智能微信公眾號發(fā)布,公司聯(lián)手開源中國、12.65%603322.SH超訊通信沐曦
、
米塔碳等合作伙伴完成
DeepSeek-R170B部署
,并支持
1.5B,
7B
,14B
,32B
蒸餾模型的部署,
兼容openaiapi格式輸出。根據(jù)2025年2
月5日
官微
,亞信安全基于
DeepSeek-R1作為基座利12.48%688225.SH亞信安全用多年來積累的網(wǎng)絡(luò)安全獨家數(shù)據(jù)
,進(jìn)一步訓(xùn)練和提升“信立方網(wǎng)絡(luò)安
全領(lǐng)域大模型;同時,基于
DeepSeekMoE
架構(gòu),整合網(wǎng)絡(luò)安全專家模
型。12.41%603019.SH中科曙光根據(jù)光合組織2025
年2
月2
日
官微,
海光信息技術(shù)團(tuán)隊成功完成DeepSeekV3和
R1模型與海光
DCU(深度計算單元)
的國產(chǎn)化適配,并11.99%-
16-
請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告300002.SZ神州泰岳正式上線。據(jù)子公司鼎富智能官網(wǎng):鼎富智能研發(fā)的AI
外呼機(jī)器人整合通義千問
、
智譜AI和
DeepSeek
等國內(nèi)領(lǐng)先的基礎(chǔ)大模型技術(shù),
實現(xiàn)了外呼效果
的全方位提升。11.56%300364.SZ中文在線2025年2
月5日
官微:基于
DeepSeekV3
與
R1提出的技術(shù)路線,中文
在線正著力研發(fā)并訓(xùn)練升級版“
中文逍遙”,
以進(jìn)一步提升該大模型的創(chuàng)
作能力
。目
前
,公司已在部分內(nèi)部AI
網(wǎng)文創(chuàng)作流程中部署11.21%300182.SZ捷成股份DeepSeek-R1
,通過調(diào)用
DeepSeek-R1
的能力
,增強(qiáng)創(chuàng)作效率2025
年2
月6日參股公司世優(yōu)科技微信公眾號發(fā)布
,世優(yōu)科技推出的
“世優(yōu)波塔”AI數(shù)字人智能體與
DeepSeek的通用人工智能(AGI)能力結(jié)
合,與世優(yōu)波塔的182個數(shù)字人面部控制技術(shù)結(jié)合,打造了“
情感反饋
”
能力。11.13%300188.SZ國投智能2025年2
月5日
官微:“
星盾”、“Qiko”
等自研平臺也第一時間成立接入
DeepSeek,進(jìn)一步滿足行業(yè)客戶的多樣化需求。據(jù)子公司北京創(chuàng)業(yè)未來傳媒技術(shù)有限公司官微:黑馬天啟基于10.02%300688.SZ創(chuàng)業(yè)黑馬DeepSeek發(fā)布政策大模型
1.1版,基于
DeepSeek技術(shù)架構(gòu),通過底
層能力重構(gòu)與數(shù)據(jù)體系拓展,迭代升級出更精準(zhǔn)高效的政務(wù)政策解決方
案。9.86%000681.SZ視覺中國2025年2
月5
日
官微:視覺中國近期完成深度求索公司開源大模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)字貨幣創(chuàng)新貨幣政策傳導(dǎo)機(jī)制變革的金融穩(wěn)定性分析報告
- 養(yǎng)羊場運營管理方案
- 危險品裝卸管理人員復(fù)習(xí)測試附答案
- 法律業(yè)務(wù)知識復(fù)習(xí)試題及答案
- 2025年臭氧吸附用活性炭行業(yè)深度研究分析報告
- 房地產(chǎn)企業(yè)2025年財務(wù)穩(wěn)健性分析及風(fēng)險管理體系優(yōu)化報告
- 高清安防監(jiān)控攝像頭組網(wǎng)服務(wù)行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 高端冰品定制服務(wù)企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 生物基環(huán)氧樹脂固化劑行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 電商快遞聯(lián)盟行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 雷軍的創(chuàng)業(yè)成功之路
- 《上市公司社會責(zé)任報告披露要求》
- 重癥患者譫妄管理指南及標(biāo)準(zhǔn)解讀
- 三布五油防腐施工方案
- 生產(chǎn)經(jīng)營單位主要負(fù)責(zé)人和安全管理人員安全培訓(xùn)資料
- 2024年-惠州市中心人民醫(yī)院招聘筆試真題
- 貴州省黔東南南苗族侗族自治州臺江縣2025年小升初數(shù)學(xué)綜合練習(xí)卷含解析
- 中藥京大戟介紹
- 《多樣的中國民間美術(shù)》課件 2024-2025學(xué)年人美版(2024)初中美術(shù)七年級下冊
- 撤銷限高和失信申請書
- DB33-T 2383-2021 《公路工程強(qiáng)力攪拌就地固化設(shè)計與施工技術(shù)規(guī)范》
評論
0/150
提交評論