計算機(jī)行業(yè):DeepSeek掀起算力成本革命助推AI Agent加速落地_第1頁
計算機(jī)行業(yè):DeepSeek掀起算力成本革命助推AI Agent加速落地_第2頁
計算機(jī)行業(yè):DeepSeek掀起算力成本革命助推AI Agent加速落地_第3頁
計算機(jī)行業(yè):DeepSeek掀起算力成本革命助推AI Agent加速落地_第4頁
計算機(jī)行業(yè):DeepSeek掀起算力成本革命助推AI Agent加速落地_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

n

三個模型:純強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)

o1

能力,引發(fā)新一輪革命。DeepSeek

由幻方量化創(chuàng)立,

創(chuàng)始人為梁文峰,2024年

12

月,DeepSeek-V3發(fā)布,性能對齊海外領(lǐng)軍閉源模

型。2025年

1

月,以

V3為基座,衍生出強(qiáng)化推理版

R1-Zero+泛化推理版

R1

,性能

對標(biāo)

OpenAI-o1正式版。n

兩大貢獻(xiàn):

復(fù)現(xiàn)

o1強(qiáng)化學(xué)習(xí)效果+

實現(xiàn)有限算力的算法創(chuàng)新。

1

)捅破強(qiáng)化學(xué)習(xí)用于

大模型推理的窗戶紙。DeepSeek

R1是繼

openAI

o1之后,推理的第二個里程碑。2)

根據(jù)

DeepSeek

公開的數(shù)據(jù),按照

1張

H800每小時

2美元的租賃成本算,V3預(yù)訓(xùn)

練成本只有

557.6

萬美金,用

1萬張

H800只需要

11天就能訓(xùn)練完,僅使用不到

1/

10

的成本就達(dá)到了國際上領(lǐng)先模型的表現(xiàn),這對當(dāng)前我國突破算力卡脖子限制具備重要

意義。n

九大創(chuàng)新:模型創(chuàng)新+

系統(tǒng)優(yōu)化+商業(yè)模式開源。n

4個模型本身創(chuàng)新點:

1

)V3基座能力強(qiáng)勁,具備較高的基座模型能力、DeepSeek

系統(tǒng)效率、RL

調(diào)教能力;2)

R1-zero

模型直接應(yīng)用

RL

到基礎(chǔ)模

型,而不依賴作為初步步驟的監(jiān)督微調(diào)(

SFT);3)R1泛化推理模型,通過深

度推理

SFT

數(shù)據(jù)(本身帶推理能力)+通用

SFT

數(shù)據(jù)實現(xiàn)推理能力的跨任務(wù)泛

化;4)通過模型與強(qiáng)化學(xué)習(xí)環(huán)境交互,在沒有獎勵思維鏈長度的情況下,

自發(fā)

涌現(xiàn)了反思和長思考能力,帶動推理能力提升。n

4個系統(tǒng)優(yōu)化創(chuàng)新點:

1)復(fù)雜均衡優(yōu)化:

引入動態(tài)調(diào)整的

Expert

Bias

,只影響

專家路由,不產(chǎn)生任何梯度影響;2)通信優(yōu)化:提出

DualPipe

算法,精細(xì)控制

分配給計算和通信的

GPU

SM

數(shù)量,保證計算和通信完全重疊,顯著減少了

L2

緩存的使用和對其他

SM

的干擾,從而提升了系統(tǒng)性能;

3)內(nèi)存優(yōu)化:

啟用上

下文硬盤緩存技術(shù),把預(yù)計未來會重復(fù)使用的內(nèi)容,緩存在分布式的硬盤陣列中,

以應(yīng)對上下文

KV

Cache緩存的問題;4)計算優(yōu)化:采用組相對策略優(yōu)化(

GRPO

替代傳統(tǒng)的近端策略優(yōu)化(

PPO),優(yōu)勢在于無需單獨的價值模型、采用基于組

的相對優(yōu)勢估計、顯著降低內(nèi)存和計算開銷、增強(qiáng)了模型的數(shù)學(xué)推理能力。n

1個商業(yè)模式創(chuàng)新點:

堅持開源,DeepSeek

開源了原生

FP8權(quán)重,公開深度思

考過程、免費允許用戶無限制商用、鼓勵蒸餾。n

行業(yè)影響:

算力需求仍未見頂,重心向推理側(cè)遷移。

1

)模型側(cè):

scalinglaw

沒有失

效,還在持續(xù)迭代,

大概率往推理方向卷。2)算力側(cè):基座模型仍需云上算力來迭

代,云端推理部署需求存在,應(yīng)用爆發(fā)需要規(guī)模算力支持訪問;

3)端側(cè):應(yīng)用場景

的天然分散性會導(dǎo)致推理需求指數(shù)增長,Agent

與各類終端、用戶入口的加速結(jié)合。n

投資方向和標(biāo)的建議:n

第一類:

用戶入口與

agent

的融合。1)Agent+C端各類終端入

口。

①手機(jī):R1本地部署要求大幅降低,

內(nèi)嵌在各

種系統(tǒng)、軟件中的場景將大幅增加,HarmonyOS

NEXT

小藝助手接入DeepSeek

,建議關(guān)注:

潤和軟件、

法本信息、軟通動力、

東方中科、誠邁

科技、

中科創(chuàng)達(dá)、拓維信息等。

②智能汽車:低成本高性能

AI

Agent

與座

艙結(jié)合,顯著提升人車智能交互體驗的同時,能打造差異化競爭優(yōu)勢,建議

關(guān)注:黑芝麻智能、地平線機(jī)器人、德賽西威、經(jīng)緯恒潤、

中科創(chuàng)達(dá)、光庭

信息。

③機(jī)器人:

消費類機(jī)器人與AI

Agent

集合,提升智能家居用戶體驗,

加速教育用戶實現(xiàn)場景擴(kuò)容。建議關(guān)注:

螢石網(wǎng)絡(luò)等。

2)B端軟件:

B端公司掌握了大量用戶入

口,并具備品牌優(yōu)勢和壁壘,通過模

型接入實現(xiàn)降本增效,同時憑借

Deepseek

的更低推理成本,未來有望實現(xiàn)

增收又增利。建議關(guān)注:合合信息、金山辦公、

同花順、萬興科技、

中望軟

件等。

n

第二類:

國產(chǎn)算力。算法和軟硬件協(xié)調(diào)發(fā)展、形成系統(tǒng)性彎道超車,

①華為昇騰

產(chǎn)業(yè)鏈:建議關(guān)注軟通動力、烽火通信、神州數(shù)碼以及相關(guān)配套硬件廠商;

②中

科院算力產(chǎn)業(yè)鏈:

建議關(guān)注海光信息、

中科曙光、

曙光數(shù)創(chuàng)、寒武紀(jì)等。

n

風(fēng)險提示:技術(shù)迭代不及預(yù)期的風(fēng)險;

市場競爭加劇的風(fēng)險;人才流失風(fēng)險的風(fēng)險;

研究報告中使用的公開資料可能存在信息滯后或更新不及時的風(fēng)險分析師:孫行臻執(zhí)業(yè)證書編號:S0740524030002Email:sunxz@zt基本狀況上市公司數(shù)337行業(yè)總市值(億元)44,

199.21行業(yè)流通市值(億元)38,242.67行業(yè)-市場走勢對比1、《中國電子核心資產(chǎn)盤點——重

產(chǎn)盤

點系

列(

2024-11-132、《中電科核心資產(chǎn)盤點——重點

央企資產(chǎn)盤點系列(一)》2024-10-30報告摘要評級:

增持(維持)相關(guān)報告證券研究報告/行業(yè)點評報告請務(wù)必閱讀正文之后的重要聲明部分2025

02

09日計算機(jī)內(nèi)容目錄一、三個模型:

純強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)

o1

能力,引發(fā)新一輪革命

.....................................31.1基因根植+加速迭代,DeepSeek

正式出圈

...................................................31.2三個模型:

V3為基座,衍生強(qiáng)化推理版

R1-Zero+泛化推理版

R1

.........

3二、兩大貢獻(xiàn):復(fù)現(xiàn)

o1強(qiáng)化學(xué)習(xí)效果+

實現(xiàn)有限算力的算法創(chuàng)新

............................5三、九大創(chuàng)新:模型創(chuàng)新+

系統(tǒng)優(yōu)化+商業(yè)模式開源

..................................................7四、

行業(yè)影響:算力需求仍未見頂,重心向推理側(cè)遷移

........................................

11投資建議

...................................................................................................................13風(fēng)險提示

...................................................................................................................18圖表目錄圖表1:

2025年

1月

AI

應(yīng)用全球日活總榜

.............................................................3圖表2:

DeepSeek

全球增速最快

Al

應(yīng)用

................................................................3圖表3:

DeepSeek

LLM

模型分三個版本

............................................................4圖表4:

DeepSeek-V3和

DeepSeek-R1與其他代表性模型的比較

.......................5圖表5:

OpenAI

o1模型性能在訓(xùn)練時間和訓(xùn)練時間計算上均平穩(wěn)提升

.................6圖表6:

DeepSeekV3預(yù)訓(xùn)練成本測算

....................................................................

6圖表7:

DeepSeekV3模型性價比處于最優(yōu)范圍

.....................................................

7圖表8:

DeepSeek-V3及其同類產(chǎn)品的基準(zhǔn)性能

....................................................

7圖表9:

DeepSeek-R1-Zero

OpenAI

o1模型在推理相關(guān)基準(zhǔn)測試中的比較

.....

8圖表10:

DeepSeek-R1及其同類產(chǎn)品的基準(zhǔn)性能

..................................................8圖表11:強(qiáng)化學(xué)習(xí)過程中

DeepSeek-R1-Zero

在訓(xùn)練集上的平均響應(yīng)長度

...........9圖表12:

Loss-Free

負(fù)載均衡策略

...........................................................................9圖表13:

DualPipe

關(guān)鍵是在一對獨立的前向和后向塊中重疊計算和通信

............

10圖表14:

多輪對話場景,下一輪對話會命中上一輪對話生成的上下文緩存

.........10圖表15:數(shù)據(jù)分析場景,后續(xù)具有相同前綴的請求會命中上下文緩存

................

10圖表16:

PPO

GRPO

原理對比

.........................................................................

11圖表17:

DeepSeek

蒸餾模型與其他可比模型表現(xiàn)對比

.......................................11圖表18:

大模型發(fā)展重心有望進(jìn)一步向

“后訓(xùn)練、推理側(cè)、

自主智能體”偏移

..

12圖表19:

亞馬遜、谷歌、微軟和

Meta

或計劃加大

AI

資本支出(十億美元)

.....

12圖表20:

DeepSeek-V3

的訓(xùn)練成本相比其對標(biāo)模型訓(xùn)練成本大幅降低

...............

13圖表21:

DeepSeek-R1在推理成本方面展現(xiàn)出顯著優(yōu)勢

.....................................

13圖表22:接入

DeepSeek

相關(guān)標(biāo)的合作及漲幅匯總

.............................................14-2-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告一、三個模型:純強(qiáng)化學(xué)習(xí)復(fù)現(xiàn)

o1

能力,引發(fā)新一輪革命1.1基因根植+加速迭代,DeepSeek

正式出圈前世今生:

幻方量化創(chuàng)立,創(chuàng)始人為梁文峰。

DeepSeek

成立于

2023年

5

月,由量化巨頭幻方量化創(chuàng)立,其創(chuàng)始人梁文峰在量化投資和高性能計算領(lǐng)

域具有深厚的背景和豐富的經(jīng)驗。l

2024年

5月,DeepSeek-V2

發(fā)布,成為全球最強(qiáng)開源通用

MoE

模型。l

2024年

12

月,DeepSeek-V3發(fā)布,性能對齊海外領(lǐng)軍閉源模型。l

2025

年1

,

DeepSeek-R1

發(fā)布

,

性能對標(biāo)OpenAI-o1

正式版

DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)

注數(shù)據(jù)的情況下,極大提升了模型推理能力。

同時

DeepSeek

開源

R1

推理模型,允許所有人在遵循

MIT

License

的情況下,蒸餾

R1訓(xùn)練其他

模型。快速出圈:

上線

20

天全球

日活就突破

2000

萬。

DeepSeek

應(yīng)用于

2025

1

11

日發(fā)布,截止

2025

1

31

日上線僅

21天。春節(jié)期間國貨之

DeepSeek

迅速點燃了全民參與熱情,上線

20天全球日活就突破

2000

萬,

已然成為現(xiàn)在全球增速最快的

AI

應(yīng)用。l

25M1全球數(shù)據(jù):1

)DeepSeek

日活躍用戶

DAU2215

萬,達(dá)

ChatGPT日活用戶的

41.6%

,超過豆包的日活用戶

1695

萬。2)上線僅

21

天,

3370

萬月活

MAU

排名全球總榜TOP4。

3)截止

2025年

1

31

DeepSeek

霸榜蘋果應(yīng)用商店

157個國家/地區(qū)的第一名,MAU

月活

躍用戶占比最多的前

5

國家為:中國

30.71%,印度

13.59%,印尼

6.94%,

美國

4.34%

,法國

3.21%。l

25M1

內(nèi)數(shù)據(jù):

1)豆包第一

7861

MAU

、

DeepSeek

第二

3370

MAU

、Kimi

第三

1943

MAU

、文小言第四

1305

MAU。

MAU

數(shù)據(jù)

不包括接入

DeepSeek

C端應(yīng)用和模型云服務(wù)平臺(

納米

AI

搜索、

秘塔

AI

搜索、硅基流動

x

華為云)

。圖表2:DeepSeek

全球增速最快Al

應(yīng)用圖表1:2025

年1月AI

應(yīng)用全球日活總榜1.2三個模型:

V3為基座,衍生強(qiáng)化推理版

R1-Zero+泛化推理版

R1DeepSeek

LLM

模型分三個版本——基座模型

V3、強(qiáng)化推理版

R1-Zero

、

泛化推理版

R1。來源:A

I產(chǎn)品榜,

中泰證券研究所注:僅包含應(yīng)用(APP)全球i0S、海

GP、以及國內(nèi)安卓市場,不

含網(wǎng)站

(Web);數(shù)據(jù)范圍

2025/1/1-2025/1/31。來源:A

I產(chǎn)品榜,中泰證券研究所注:僅包含應(yīng)用(APP)全球i0S、海外GP、

以及國內(nèi)安卓市場,不含網(wǎng)站(Web)。-3-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告來源:

AI

大模型前沿公眾號,

中泰證券研究所1

)基座模型

V3:V3基座模型總參數(shù)為

671B

,(對比

GPT3參數(shù)

175B

、

GPT4

參數(shù)

1.76T),有

61

層transformer、并且用

MoE

代替?zhèn)鹘y(tǒng)Transformer模型中的前饋網(wǎng)絡(luò)(

FFN

)層,每一層包括大量的細(xì)粒度專家,有

1個共享

專家+256個路由專家。l

知識:

1)在MMLU

、

MMLU-Pro

GPOA

等教育基準(zhǔn)測試中

DeepSeek-V3的

現(xiàn)

優(yōu)

源模

,

MMLU/MMLU-Pro/GPOA

達(dá)

到88.5/75.9/59.1

,

GPT-4o和

Claude-Sonnet-3.5等領(lǐng)先的閉源模型相媲美。2)對于事

實性基準(zhǔn)測試,DeepSeek-V3在英文

SimpleQA

方面落后于

GPT-4o

和Claude-Sonnet3.5

,但它在中文

Chinese

SimpleQA

表現(xiàn)卓越,

適宜中文語言環(huán)境和應(yīng)用場景。l

代碼、數(shù)學(xué)和推理:1

)DeepSeek-V3在數(shù)學(xué)相關(guān)基準(zhǔn)性能變現(xiàn)優(yōu)越,

MATH-500

的表現(xiàn)甚至優(yōu)于

o1-preview。2

)在編碼相關(guān)任務(wù)上,

DeepSeek-V3

LiveCodeBenc

等編碼競賽基準(zhǔn)上表現(xiàn)出最佳性能,

工程相關(guān)表現(xiàn)略低于

Claude-Sonnet-3.5

,但仍優(yōu)于其他模型。2)R1-Zero(

強(qiáng)化推理版本):沒有

warmup

階段、沒有監(jiān)督微調(diào)的數(shù)據(jù),

DeepSeek-v3基座,直接進(jìn)行強(qiáng)化學(xué)習(xí),技術(shù)上比較激進(jìn)、效果顯著、

能完美復(fù)現(xiàn)

o1

,但不足之處是沒有監(jiān)督微調(diào)的數(shù)據(jù)啟動、可讀性差、語言

混雜輸出。l

推理任務(wù):

DeepSeek-R1在

AIME2024

上達(dá)到了

79.8%的

Pass@1

分?jǐn)?shù),略微超過了

OpenA1-o1-1217。在

MATH-500上,它取得了令

人印象深刻的

97.3%的分?jǐn)?shù),與

OpenA1-o1-1217相當(dāng),遠(yuǎn)遠(yuǎn)超過了

其他模型。l

編碼任務(wù):

DeepSeek-R1在代碼競賽任務(wù)中表現(xiàn)出專家級水平,它

Codeforces

上獲得了

2029

Elo

評分,超過了

96.3%的人類參

與者。l

工程任務(wù):DeepSeek-R1

的表現(xiàn)略微優(yōu)于

DeepSeek-V3,這可以幫

助開發(fā)者在實際任務(wù)中。l

:在

MMLU

、MMLU-Pro

和GPQADiamond

準(zhǔn)

上,

DeepSeek-R1

取得了卓越的成績

,顯著優(yōu)于DeepSeek-V3,在

MMLU

上的得分為

90.8%

,在

MMLU-Pro

上的得分為

84.0%

,在

GPOADiamond

上的得分為

71.5%。雖然它在這些基準(zhǔn)上的表現(xiàn)略低

OpenAl-o1-1217

,但

DeepSeek-R1超越了其他閉源模型,展示

了其在教育任務(wù)中的競爭優(yōu)勢。-4-

請務(wù)必閱讀正文之后的重要聲明部分圖表3:DeepSeek

的LLM

模型分三個版本行業(yè)點評報告來源:

《DeepSeek-V3Technical

Report》

,DeepSeek

公眾號,

中泰證券研究所二、兩大貢獻(xiàn):復(fù)現(xiàn)

o1強(qiáng)化學(xué)習(xí)效果+

實現(xiàn)有限算力的算法創(chuàng)新DeepSeek

的兩大重要貢獻(xiàn),一是捅破強(qiáng)化學(xué)習(xí)用于大模型推理的窗戶紙、

二是掀起低成本算力革命,且全球范圍率先實現(xiàn)并開源。

1

)捅破強(qiáng)化學(xué)習(xí)用于大模型推理的窗戶紙。如果說

openAI

o1是推理的

第一個里程碑,那

DeepSeek

R1可以稱之為第二個里程碑,堪比

2023年

初的

ChatGPT

時刻。l

openAI

o1:

引入新的范式,推動

scaling

law

繼續(xù)往強(qiáng)化學(xué)習(xí)、推理方

向突破。通過強(qiáng)化學(xué)習(xí)可以識別并糾正自己的錯誤,將復(fù)雜的步驟分解

為更簡單的,并嘗試行不通時換其他方法,這個過程是模型自

己學(xué)習(xí)而

非人為干擾。l

DeepSeek

R1:全球第一個通過強(qiáng)化學(xué)習(xí)完美復(fù)現(xiàn)

o1能力的模型。l

事實基準(zhǔn)

SimpleQA

測評:

DeepSeek-R1優(yōu)于

DeepSeek-V3

,展

示了其在處理基于事實的查詢方面的能力。在這一基準(zhǔn)上,OpenAl-01

超過了

4o也出現(xiàn)了類似的趨勢。3)R1(

泛化推理版本):基于

DeepSeek-v3基座,先用

SFT

來啟動,

構(gòu)建少量

Long-CoT(長思維鏈)數(shù)據(jù)來微調(diào)模型(使模型先跟隨樣本學(xué)習(xí)

思維鏈的方法),防止

RL

早期不穩(wěn)定和可讀性差的問題。第二步再進(jìn)行和

R1-zero

一樣的強(qiáng)化學(xué)習(xí),同時引入語言一致性獎勵(減少語言混雜輸出的

問題)。第三步,生成的深度推理

SFT

數(shù)據(jù)再結(jié)合通用

SFT

數(shù)據(jù),一起微

調(diào)大模型,再進(jìn)行強(qiáng)化學(xué)習(xí)。圖表4:DeepSeek-V3和DeepSeek-R1與其他代表性模型的比較-5-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告來源:OpenAI

官網(wǎng),

中泰證券研究所2)實現(xiàn)有限算力下的算法創(chuàng)新。根據(jù)

DeepSeek

公開的數(shù)據(jù),按照

1

H800每小時

2

美元的租賃成本算,V3預(yù)訓(xùn)練成本只有

557.6萬美金(僅

包括DeepSeek-V3的正式訓(xùn)練,

不包括與架構(gòu)、

算法或數(shù)據(jù)相關(guān)的先前

的研究或精簡實驗的成本),如果用

1萬張

H800只需要

11天就能訓(xùn)練完。

如果參數(shù)量為

671B

DeepSeekV3使用

H800訓(xùn)練,整個訓(xùn)練過程僅使

用不到

280萬個

GPU

小時,相比之下,Llama3405B使用

H100

的訓(xùn)練時

長是

3080萬

GPU

小時,DeepSeek

僅使用不到

1/

10

的成本就達(dá)到了國際

上領(lǐng)先模型的表現(xiàn),這對當(dāng)前我國突破算力卡脖子限制具備重要意義。

目前

模型性能/性價比優(yōu)勢顯著

,模型

API

服務(wù)定價也將調(diào)整為每百萬輸入

tokens0.5元(緩存命中)/2元(緩存未命中

),每百萬輸出

tokens8元。圖表5:OpenAI

o1

模型性能在訓(xùn)練時間和訓(xùn)練時間計算上均平穩(wěn)提升-6-

請務(wù)必閱讀正文之后的重要聲明部分圖表6:DeepSeekV3

預(yù)訓(xùn)練成本測算來源:

《DeepSeek-V3Technical

Report》

,

中泰證券研究所行業(yè)點評報告來源:

Deepseek

公眾號,

中泰證券研究所三、九大創(chuàng)新:模型創(chuàng)新+

系統(tǒng)優(yōu)化+商業(yè)模式開源模型本身具備

4個創(chuàng)新點:

1

)基座模型

V3性能強(qiáng)大。

R1

的成功離不開

DeepSeek-V3

強(qiáng)大的基

座模型能力、DeepSeek

系統(tǒng)效率、RL

調(diào)教能力。DeepSeek-V3

多項

評測成績超越了Qwen2.5-72B和

Llama-3.

1-405B等其他開源模型代碼

和數(shù)學(xué)方面表現(xiàn)尤為突出;并在性能上和世界頂尖的閉源模型GPT-4o

以及Claude-3.5-Sonnet

相媲美。-7-

請務(wù)必閱讀正文之后的重要聲明部分圖表8:DeepSeek-V3

及其同類產(chǎn)品的基準(zhǔn)性能圖表7:DeepSeekV3

模型性價比處于最優(yōu)范圍來源:

《DeepSeek-V3Technical

Report》

,

中泰證券研究所行業(yè)點評報告來源:

《DeepSeek-R1:

Incentivizing

Reasoning

Capability

in

LLMs

via

Reinforcement

Learning》

,

中泰證券研究所4)

自發(fā)涌現(xiàn)了反思能力、長思考能力。

隨著測試時間的增加,模型出

現(xiàn)了復(fù)雜的行為。模型能夠回顧和重新評估其之前的步驟,

自發(fā)地探索

解決問題的替代方法,這些行為不是顯式編程的結(jié)果,而是模型與強(qiáng)化來源:

《DeepSeek-R1:

Incentivizing

Reasoning

Capability

in

LLMs

via

Reinforcement

Learning》

,

中泰證券研究所3)第三個創(chuàng)新點是,R1泛化推理模型,通過深度推理

SFT

數(shù)據(jù)(本

帶推

)+

SFT

數(shù)據(jù)

現(xiàn)推

力的跨任

務(wù)

泛化。DeepSeek-R1-Zero存在可讀性差和語言混合等問題。

因此,研究引入

DeepSeek-R1,通過收集少量冷啟動數(shù)據(jù)對基礎(chǔ)模型進(jìn)行微調(diào),并采用

多階段訓(xùn)練流程,最終獲得了與

OpenAI

o1-1217性能相當(dāng)?shù)哪P汀?)R1-zero模型直接應(yīng)用

RL

到基礎(chǔ)模型,而不依賴作為初步步驟的監(jiān)

督微調(diào)(

SFT)。其重要意義在于驗證

LLMs

的推理能力可以通過

RL完全激勵,而不需要

SFT。R1-zero

DeepSeek-V3-Base

為基礎(chǔ)模型,采用

GRPO(Group

Relative

Policy

Optimization

)作為

RL

框架來提高

模型在推理任務(wù)中的性能,并且采用

rule-based

reward

system

的方式

來確保強(qiáng)化學(xué)習(xí)能實現(xiàn)規(guī)模化。圖表9:DeepSeek-R1-Zero和OpenAI

o1

模型在推理相關(guān)基準(zhǔn)測試中的比較-8-

請務(wù)必閱讀正文之后的重要聲明部分圖表10:DeepSeek-R1

及其同類產(chǎn)品的基準(zhǔn)性能行業(yè)點評報告來源:《DeepSeek-R1:Incentivizing

Reasoning

Capability

in

LLMs

via

Reinforcement

Learning》,

中泰證券研究所系統(tǒng)優(yōu)化具備

4個創(chuàng)新點:

DeepSeek

通過負(fù)載均衡優(yōu)化、通信優(yōu)化(硬件)、內(nèi)存優(yōu)化(硬件)、

計算優(yōu)化四重優(yōu)化,實現(xiàn)了算法、軟件、硬件協(xié)同創(chuàng)新,通過算法和工

程上的創(chuàng)新

DeepSeek-V3

的生成吐字速度從

20TPS

大幅提高至

60TPS

,相比

V2.5模型實現(xiàn)了

3倍的提升,為用戶帶來更加迅速流暢

的使用體驗。1

)負(fù)載均衡優(yōu)化:

負(fù)載均衡是為了避免所有任務(wù)都堆在個別專家形成

堰塞湖,因此

V3模型引入一個動態(tài)調(diào)整的

Expert

Bias,Bias

只影響專

家路由,不產(chǎn)生任何梯度影響,通過動態(tài)調(diào)整

Expert

Bias

來調(diào)整各個

專家的門控分?jǐn)?shù),實現(xiàn)負(fù)載均衡。圖表11:強(qiáng)化學(xué)習(xí)過程中DeepSeek-R1-Zero在訓(xùn)練集上的平均響應(yīng)

長度學(xué)習(xí)環(huán)境交互的結(jié)果。在沒有獎勵思維鏈長度的情況下,模型就自發(fā)地

進(jìn)行越來越長的思考,這種自發(fā)發(fā)展顯著提高了

DeepSeek-R1-Zero

推理能力,使其能夠以更高的效率和準(zhǔn)確性處理更具挑戰(zhàn)性的任務(wù)。-9-

請務(wù)必閱讀正文之后的重要聲明部分圖表12:Loss-Free

負(fù)載均衡策略來源:智東西,

中泰證券研究所行業(yè)點評報告來源:

《DeepSeek-V3Technical

Report》

,

中泰證券研究所3)

內(nèi)存優(yōu)化:

復(fù)雜推理場景下的多輪對話和長序列需要緩存更多的

KVCache

,導(dǎo)致

GPU

高帶寬內(nèi)存容量成為瓶頸,而通過增加

DRAM

解決

問題又會讓推理成本激增。

了應(yīng)對上下文

KV

Cache

緩存的問題,

DeepSeek

采用創(chuàng)新性的硬盤緩存技術(shù),啟用上下文硬盤緩存技術(shù),把

預(yù)計未來會重復(fù)使用的內(nèi)容,緩存在分布式的硬盤陣列中。如果輸入存

在重復(fù),則重復(fù)的部分只需要從緩存讀取,無需計算。該技術(shù)不僅降低

服務(wù)的延遲,還大幅削減最終的使用成本,緩存命中的部分,DeepSeek每百萬tokens

收費

0.1元。圖表14:多輪對話場景,下一輪對話會命中上一輪

對話生成的上下文緩存2)通信優(yōu)化:關(guān)于專家并行的通信開銷的問題,提出

DualPipe

算法來解決,

精細(xì)控制分配給計算和通信的

GPU

SM

數(shù)量,保證計算和通信完全重疊。

硬件層面修改

CUDA

的底層匯編語言,通過定制的

PTX

指令來更精細(xì)

地控制底層

GPU

資源的分配和使用(

H800里面有

132個

SM

,分配20個

SM

來控制通信、同時還能動態(tài)調(diào)整分配給通信任務(wù)的warp

數(shù)量,

用剩下的

SM

做計算)

,顯著減少了

L2

緩存的使用和對其他

SM

的干

擾,從而提升了系統(tǒng)性能。4)計算優(yōu)化:DeepSeek-R1采用組相對策略優(yōu)化(

GRPO

)替代傳統(tǒng)的近

端策略優(yōu)化(

PPO

),優(yōu)勢在于無需單獨的價值模型、采用基于組的相

對優(yōu)勢估計、顯著降低內(nèi)存和計算開銷、增強(qiáng)了模型的數(shù)學(xué)推理能力。圖表15:數(shù)據(jù)分析場景,后續(xù)具有相同前綴的請求

會命中上下文緩存圖表13:DualPipe

關(guān)鍵是在一對獨立的前向和后向塊中重疊計算和通信-

10-

請務(wù)必閱讀正文之后的重要聲明部分來源:

DeepSeek

官網(wǎng),

中泰證券研究所來源:

DeepSeek

官網(wǎng),

中泰證券研究所行業(yè)點評報告來源:

《DeepSeek-R1:

Incentivizing

Reasoning

Capability

in

LLMs

via

Reinforcement

Learning》

中泰證券研究所四、行業(yè)影響:算力需求仍未見頂,重心向推理側(cè)遷移1

)模型側(cè):

Scaling

law

尚未失效仍在迭代,但重心有望進(jìn)一步向推理側(cè)

偏移。2024年

12

月,OpenAI

聯(lián)創(chuàng)

Ilya

在深度學(xué)習(xí)頂會

NeuralPS2024

表示預(yù)訓(xùn)練時代可能結(jié)束,其原因是互聯(lián)網(wǎng)的文本數(shù)據(jù)幾乎窮盡,而短期內(nèi)

數(shù)據(jù)難以迅速增長,基于此,行業(yè)的趨勢有望朝向推理側(cè)發(fā)展,其重心可能

“卷基座、卷模型”向

“卷推理、卷

AI

Agent

、卷應(yīng)用落地”過渡。來源:

CSDN

,

中泰證券研究所n

商業(yè)模式的

1個創(chuàng)新:開源1)DeepSeek

商業(yè)模式為開源,以開源精神和長期主義追求普惠

AGI。與

o1相反,DeepSeek

采用

FP8訓(xùn)練,并開源了原生

FP8權(quán)重,公開深度思

考過程、免費允許用戶無限制商用、鼓勵蒸餾(

R1輸出結(jié)果訓(xùn)練其他模

),盡可能降低用戶使用壁壘,全球范圍出圈和更容易建立起廣泛繁榮的

用戶生態(tài)。-

11-

請務(wù)必閱讀正文之后的重要聲明部分圖表17:DeepSeek

蒸餾模型與其他可比模型表現(xiàn)對比圖表16:PPO

與GRPO

原理對比行業(yè)點評報告圖表18:大模型發(fā)展重心有望進(jìn)一步向“后訓(xùn)練、推理側(cè)、

自主智能體”偏移來源:機(jī)器之心公眾號,

中泰證券研究所2)算力側(cè):

整體趨勢來看,Pre-training

將達(dá)瓶頸,基座模型格局日益明

朗,但算力需求仍未見頂。

即使互聯(lián)網(wǎng)中現(xiàn)成數(shù)據(jù)已完全納入訓(xùn)練集,模

型仍可運用合成數(shù)據(jù)等方式彌補(bǔ)訓(xùn)練數(shù)據(jù)的不足,基座模型依舊需要云上的

算力來迭代,Pre-training

scaling

law

有望續(xù)命;并且端側(cè)應(yīng)用與設(shè)備也

需要云上的算力來支持云端推理部署。

因此,長期來看,未來

AI

應(yīng)用與端

側(cè)的爆發(fā)將需要大規(guī)模算力來支持訪問,算力需求遠(yuǎn)未見頂。從海內(nèi)外視角看

DeepSeek

對算力廠商的影響。

①對國際大廠可能會帶來

短期沖擊,而從微軟、谷歌等云廠商最新公布的資本開支來看,算力相關(guān)的

開支依然堅挺,

目前來看對云廠商資本投入的決心影響較小。

長期來看,

AI

應(yīng)用的爆發(fā)有望帶來推理端需求迸發(fā),訓(xùn)練和推理此消彼長。在技術(shù)和

產(chǎn)品方面,我們預(yù)計大廠的優(yōu)勢還會引領(lǐng)一段時間。

②利好國產(chǎn)半導(dǎo)體產(chǎn)

業(yè)鏈,DeepSeek

實現(xiàn)有限算力下的算法創(chuàng)新,改善國產(chǎn)芯卡脖子和供給不

足的現(xiàn)狀,有望走上算法和軟硬件協(xié)調(diào)發(fā)展的路徑,以形成獨立且系統(tǒng)性領(lǐng)

先的生態(tài)。來源:凌通社,各公司官網(wǎng),

中泰證券研究所注:數(shù)據(jù)反映的是固定資產(chǎn)和設(shè)備的購買情況。本圖表展示了各日歷季

度的數(shù)據(jù)。微軟財年于

6

30日結(jié)束圖表19:亞馬遜、谷歌、微軟和Meta或計劃加大AI

資本支出(十億美元)-

12-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告投資建議n

第一類:

用戶入口與

agent

的融合。l

Agent+C端各類終端入

口:

因為

R1本地部署要求大幅降低,

內(nèi)嵌

在各種系統(tǒng)、軟件中的場景將大幅增加,強(qiáng)交互的手機(jī)/PC

、消費類

機(jī)器人、智能駕駛等智能硬件終端可能會百花齊放。1)手機(jī):

HarmonyOS

NEXT

小藝助手接入

DeepSeek

,用戶可

通過小藝助手與

DeepSeek

對話實現(xiàn)更加無縫的

AI

體驗,建

議關(guān)注:

潤和軟件、

法本信息、軟通動力、

東方中科、誠邁科

技、

中科創(chuàng)達(dá)、拓維信息等。

2)智能汽車:R1本地部署要求大幅降低,低成本高性能

AI

Agent與座艙結(jié)合,顯著提升人車智能交互體驗的同時,

能打造差異

化競爭優(yōu)勢,未來有望成為智艙發(fā)展新趨勢。建議關(guān)注:1

)芯

片:黑芝麻、地平線;2

)域控:德賽西威、經(jīng)緯恒潤;3)AI+

座艙:

中科創(chuàng)達(dá)、光庭信息。

3)機(jī)器人:消費類機(jī)器人與AI

Agent

集合,提升智能家居用戶體

驗,加速教育用戶實現(xiàn)場景擴(kuò)容。建議關(guān)注:

螢石網(wǎng)絡(luò)等。

l

B

端軟件:B端公司掌握了大量用戶入口,并具備品牌優(yōu)勢和壁壘,

在與

DeepSeek

開源高性能大模型融合后,

能夠降低自身的研發(fā)投

入、提升自身產(chǎn)品迭代速度、

增加客戶粘性和續(xù)費率

,

同時憑借

Deepseek

的更低推理成本,未來有望實現(xiàn)增收又增利。建議關(guān)注:

合合信息、金山辦公、

同花順、

萬興科技、

中望軟件等。

圖表20:DeepSeek-V3的訓(xùn)練成本相比其對標(biāo)模型

訓(xùn)練成本大幅降低圖表21:DeepSeek-R1在推理成本方面展現(xiàn)出顯

著優(yōu)勢3)應(yīng)用&端側(cè):

降本、

降門檻加速商業(yè)化,利好應(yīng)用與端側(cè)發(fā)展。從技術(shù)

上講,

DeepSeek

使得大模型向Agent

智能體更近一步,尤其是其開源特

性降低了模型技術(shù)的使用門檻,使更多中小科技企業(yè)有機(jī)會打造更優(yōu)質(zhì)的垂

類場景應(yīng)用,使

Agent

與各類終端、用戶入口的加速結(jié)合。從成本上講,

不論對于模型的訓(xùn)練側(cè)還是推理側(cè),Deepseek

為世界探出一條能夠以更低

成本布局

AI

的路徑,

因此應(yīng)用公司能夠以更低成本自研或調(diào)用

API

來打造

AI

應(yīng)用,利潤空間也有望進(jìn)一步提升。

隨著應(yīng)用的普及與能力的提升,端

側(cè)硬件將具備更優(yōu)的大規(guī)模落地的條件。來源:SemiAnalysis

,NVIDIA

,Anthropic

,Meta

,深度求索,

甲子光年,中泰證券研究所注:訓(xùn)練成本并不包括前期研究以及關(guān)于架構(gòu)、算法或數(shù)

據(jù)的消融實驗所產(chǎn)生的成本,也不包括人力成本及其他未提及的成本-

13-

請務(wù)必閱讀正文之后的重要聲明部分來源:Statista,

中泰證券研究所行業(yè)點評報告圖表22:接入DeepSeek

相關(guān)標(biāo)的合作及漲幅匯總證券代碼證券簡稱概念相關(guān)點年后累計漲幅(2025/2/5-2025/2/7)688158.SH優(yōu)刻得根據(jù)2025年2

月3日

官微

,優(yōu)刻得云平臺上線

DeepSeek-R1系列模

型72.81%300766.SZ每

互動根據(jù)2025年2

月4日公告,公司在較早時間就接入

DeepSeek相關(guān)版

本并完成各方面的評估及利用自有算力進(jìn)行私有化部署,目

前主要用于業(yè)務(wù)垂直場景使用

、研發(fā)提效(AI4SE)、知識庫問答以及將其納入數(shù)據(jù)

智能操作系統(tǒng)(DiOS)

的功能模塊等。根據(jù)2025

年2

月4

官微,安恒信息旗下恒腦·安全垂域大模型正式集65.73%688023.SH安恒信息成

DeepSeek,

完成基于

DeepSeekR1

的安全大模型的訓(xùn)練

,推出首

個“

DeepSeek”版安全智能體,

開啟全新智能化安全之旅。根據(jù)2025

1

月25日

官微,公司AK39系列芯片的天才虎AI

智能錄音54.73%688620.SH安凱微筆Pro4G

版推出市場,對接多家大模型底座,開啟智能錄音筆全新篇章

。

通過對接了豆包

、通義千問

、文心一言、DeepSeek、Kimi

等多家大語言

模型,并通過調(diào)優(yōu),能夠?qū)Σ煌竽P偷奶匦赃M(jìn)行分析與整合

,實現(xiàn)對多源語言理解優(yōu)勢的有效融合。2025年2

月6

日微信公眾號發(fā)布,首都在線云平臺快速上架

R1模型,51.32%300846.SZ首都在線還提供為期

1

個月的免費使用權(quán)限。用戶可以通過首都在線云平臺的強(qiáng)49.35%688058.SH寶蘭德大算力

,免受各種限制,

隨時隨地暢快地體驗

DeepSeek。根據(jù)青云科技2025年2

月4日

官微,

青云科技旗下AI

算力云服務(wù)一

基石智算CoresHub正式上線

DeepSeek-R1

系列模型,根據(jù)2025年2

月5日

官微,

品高AI

大模型融合平臺--AISTACK早在36.47%688227.SH品高股份2024年7

月開始支持

DeepSeek

的混合專家模型(MOE)

,并上架京東

商城,在

DeepSeek-R1發(fā)布后

,也第一時間在產(chǎn)品中進(jìn)行了集成為垂直領(lǐng)域大模型的落地提供了更強(qiáng)大的技術(shù)支持。2025年02

月05日

官微:春節(jié)期間,

云天勵飛芯片團(tuán)

隊完成35.95%688343.SH云天勵飛DeepEdge10“

算力積木”

芯片平臺與

R1-Distill-Qwen-1.5B、R1-Distill-Qwen-7B、R1-Distill-Llama-8B

大模型的適配

,可以交付客

戶使用。根據(jù)軟通動力2025

年2

月4

官微,作為中國數(shù)字技術(shù)產(chǎn)品和服務(wù)創(chuàng)33.89%301236.SZ軟通動力新領(lǐng)導(dǎo)企業(yè),軟通動力積極擁抱

DeepSeek,率先進(jìn)行產(chǎn)品的創(chuàng)新融合,

通過把

DeepSeek-R1接入天璇

MaaS

平臺,

以全棧AI技術(shù)服務(wù)加速

企業(yè)智能化轉(zhuǎn)型。33.46%002123.SZ夢網(wǎng)科技根據(jù)2025年2

月4

官微,隨著

DeepSeek

大模型的全球影響力持續(xù)

擴(kuò)大,夢網(wǎng)科技將

DeepSeek

大模型深度集成至多源AI

調(diào)度引擎“

天慧智匯臺2.0”,推動消息通信服務(wù)從基礎(chǔ)連接向智能決策升級,為行業(yè)開

辟5.70%效新路徑。33.11%n

第二類:

國產(chǎn)算力。

受益于

DeepSeek

的推出和生態(tài)繁榮,部分國產(chǎn)算

力產(chǎn)業(yè)鏈的公司有望實現(xiàn)算法和軟硬件協(xié)調(diào)發(fā)展,甚至達(dá)到系統(tǒng)性彎

道超車,建議關(guān)注:

1

)華為昇騰產(chǎn)業(yè)鏈:軟通動力、烽火通信、神州

數(shù)碼以及相關(guān)配套硬件廠商;2)中科院算力產(chǎn)業(yè)鏈;海光信息、

中科

曙光、曙光數(shù)創(chuàng)、寒武紀(jì)等。

-

14-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告002881.SZ美格智能根據(jù)2025年

1

月26日

官微

,公司結(jié)合美格智能自研的AIMO

智能體

DeepSeek-R1模型的基礎(chǔ)能力,開發(fā)面向工業(yè)智能化、座艙智能體

智能無人機(jī)

、機(jī)器人等領(lǐng)域的AIAgent應(yīng)用。根據(jù)2025

年2

月3

日全資子公司浙江數(shù)據(jù)管理微信公眾號,浙江省數(shù)33.10%600126.SH杭鋼股份據(jù)管理有限公司成功完成

DeepSeek-R1

的適配并實現(xiàn)DeepSeekR170B

參數(shù)及以下全部蒸餾模型的部署。根據(jù)2025年2

月5日

官微,奇安信宣布已完成與DeepSeek(深度求索)33.08%688561.SH奇安信的全面深度接入,奇安信自研QAX安全大模型通過

DeepSeekR1進(jìn)行

了一系列的優(yōu)化和蒸餾后,運營成本大幅降低

,同時在威脅研判等多個

場景下的模型性能方面獲得了顯著提升。根據(jù)參股公司杭州領(lǐng)信數(shù)科信息技術(shù)有限公司2025

年2

月6

日微信公31.11%688080.SH映翰通眾號:近日,領(lǐng)信數(shù)科已完成兩大核心

升級:AI

中臺一大白智腦,

完成

DeepSeek基座模型適配。30.88%600186.SH蓮花控股2025

年2

月4

日公司孫公司蓮花紫星官微:蓮花紫星已在自有算力上成

功部署

DeepSeekR1

大模型

,并全面支持智能體調(diào)用。29.42%300352.SZ北信源2025年2

月5日微信公眾號發(fā)布

,公司密信AI

能力平臺已成功對接

DeepSeek。27.40%300588.SZ熙菱信息根據(jù)公司官網(wǎng)

,公司AI

智慧助手平臺AILinkDebot產(chǎn)品接入集成了

qwen2-7b、deepseek、ChatGLM、

文心一言等模型,2025年2

月6日

官微:今天,

用友

BIP

全面上線以

DeepSeek-V3

和26.17%600588.SH用友網(wǎng)絡(luò)DeepSeek-R1作為基座大模型的智能服務(wù),企業(yè)客戶可以通過

BIP3R6

智能平臺的公有云

專屬云模式使用相關(guān)服務(wù)。根據(jù)2024年半年報,公司參股世優(yōu)科技3%股權(quán)。2025年

2

6日參25.57%300057.SZ萬順新材股公司世優(yōu)科技微信公眾號發(fā)布,世優(yōu)科技推出的“世優(yōu)波塔”AI

數(shù)字人25.06%688039.SH當(dāng)虹科技智能體與

DeepSeek

的通用人工智能(AGI)

能力結(jié)合。據(jù)當(dāng)虹科技2025

年2月

5日

官微

,近日,當(dāng)虹科技BlackEye多模態(tài)視

聽大模型正式融合DeepSeek-R1

和DeepSeekJanusPro,并完成視聽傳媒

、

工業(yè)與衛(wèi)星

、

車載智能座艙等多行業(yè)垂類場景的數(shù)據(jù)調(diào)優(yōu)訓(xùn)練。2025

年2

月4

日微信公眾號發(fā)布

,快麥小智推出了基于大模型的智能24.68%688365.SH光云科技體產(chǎn)品綾智

?;诰c智

,商家可以搭建導(dǎo)購助手

、智能培訓(xùn)

、對話打標(biāo)

等智能助理功能

。

前,綾智的多項業(yè)務(wù)場景和功能已經(jīng)接入并在支持

DeepSeek各個版本。2025

年2

月6

日微信公眾號發(fā)布

,神州鯤泰和神州問學(xué)均已支持23.17%000034.SZ神州數(shù)碼DeepSeek

的部署。神州數(shù)碼還將

DeepSeek

集成到其自主研發(fā)的神州

問學(xué)平臺中

,僅需3

分鐘部署

DeepSeek模型。根據(jù)2025年2

月6日

官微

,順網(wǎng)智算是一個AIINFRA

平臺,

前已22.26%300113.SZ順網(wǎng)科技經(jīng)可以支持

DeepSeek模型的部署和運行

,預(yù)計后續(xù)

DeepSeek模型亦會應(yīng)用于順網(wǎng)智能客服和嘮嘮等AI

應(yīng)用。2025年02

月06

日公司官微:2

月6日

,開普云旗下開悟大模型應(yīng)用產(chǎn)22.11%688228.SH開普云品積極適配國產(chǎn)大模型

,在開悟大型能體平臺接入

DeepSeekV3、R1

在線模型API

,在運營管理平臺部署量化版

R1

模型服務(wù)

,在端側(cè)一體機(jī)中部署蒸餾量化版

R132B型20.56%002354.SZ天娛數(shù)科根據(jù)證券時報網(wǎng)2025年

1

月27日新聞

,天娛數(shù)科為

DeepSeek移動

應(yīng)用分發(fā)服務(wù)商。20.00%-

15-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告601360.SH三六零根據(jù)2025年2

月2日

官微,360數(shù)字安全集團(tuán)宣布其安全大模型正式

接入

DeepSeek

,將以

DeepSeek

為安全大模型基座

,發(fā)揮360安全

大數(shù)據(jù)優(yōu)勢

,通過繼續(xù)強(qiáng)化學(xué)習(xí)等技術(shù)手段

,訓(xùn)練出“

DeepSeek版”安

全大模型

,讓安全真正做到“

自動駕駛”。18.92%300624.SZ萬興科技根據(jù)萬興科技2025年2

月4日

官微,AIGC

軟件A股上市公司萬技

(300624.SZ)率先完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1

的深入適配,

涵蓋旗下視頻創(chuàng)意

、繪圖創(chuàng)意及文檔創(chuàng)意

軟件業(yè)務(wù)多款產(chǎn)品。根據(jù)2024

8

8日

互動易回復(fù),

昆侖萬維攜手新加坡南洋理工大學(xué)

成功開發(fā)Q*算法,顯著提升現(xiàn)有大模型推理能力。在GSM8K

數(shù)據(jù)集上,

Q*幫助Llama-2-7b

提升至

80.8%的準(zhǔn)確率

,超越了ChatGPT;在MATH17.32%300418.SZ昆侖萬維數(shù)據(jù)集上

,Q*幫助DeepSeek-Math-7b

提升至

55.4%的準(zhǔn)確率

,超越了GeminiUltra;在MBPP

數(shù)據(jù)集上

,Q*幫助CodeQwen1.5-7b-Chat提升至

77.0%的準(zhǔn)確率

,縮小了與GPT-4

的編程水平差距。Q*能夠不僅大幅提

升了小模型的性能,還顯著降低了計算資源的需求,為人工智能的廣泛

應(yīng)用帶來了全新可能。16.37%688208.SH道通科技2025

年2

月6日證券時報網(wǎng)新聞,道通AI

團(tuán)

隊已完成

DeepSeek

的全

面接入和本地化部署,并應(yīng)用

DeepSeek訓(xùn)練流程,加速推進(jìn)道通以“

檢垂域大模型”

為核心的“

空地一體解決方案”在能源、交通等領(lǐng)域的廣泛

推廣。2025年2

月5日微信公眾號發(fā)布

,公司

InHandAl技術(shù)團(tuán)隊成功在15.95%301070.SZ開勒股份EC5000

系列邊緣計算機(jī)上完成

DeepSeekR1

蒸餾模型的本地部署。這一成果驗證了輕量級邊緣設(shè)備(如EC5000)在

AI推理任務(wù)中的強(qiáng)大潛

力。15.82%002439.SZ啟明星辰2025年02

月06

官微:啟明星辰目前已完成了“安星”智能體與DeepSeek

大模型的全面對接

,并應(yīng)用到安全運營

、威脅檢測(脅情報、

數(shù)據(jù)安全等全業(yè)務(wù)場景中,

實現(xiàn)了安全智能化能力的再級。根據(jù)2025

年2

月5

互動易,公司目前已有相關(guān)合作

,正在進(jìn)行對接14.02%300494.SZ盛天網(wǎng)絡(luò)使用deepseek模型,目前公司一款底層對接deepseek

的社交小游戲

已完成了一輪內(nèi)部測試。13.46%002212.SZ天融信2025年2

月6日

官微:近日,天融信天問大模型正式完成

DeepSeek

模型的接入,賦能安全事件檢測分析

、威脅情報融合等多個場景,進(jìn)

一步提升了天融信現(xiàn)有的安全產(chǎn)品和服務(wù)能力。12.95%600986.SH浙文互聯(lián)根據(jù)2025年2

月6日

官微

,春節(jié)前浙文互聯(lián)完成本地化部署的

DeepSeek-R1推理大模型。2025

年2

月2

日子公司超訊智能微信公眾號發(fā)布,公司聯(lián)手開源中國、12.65%603322.SH超訊通信沐曦

米塔碳等合作伙伴完成

DeepSeek-R170B部署

,并支持

1.5B,

7B

,14B

,32B

蒸餾模型的部署,

兼容openaiapi格式輸出。根據(jù)2025年2

月5日

官微

,亞信安全基于

DeepSeek-R1作為基座利12.48%688225.SH亞信安全用多年來積累的網(wǎng)絡(luò)安全獨家數(shù)據(jù)

,進(jìn)一步訓(xùn)練和提升“信立方網(wǎng)絡(luò)安

全領(lǐng)域大模型;同時,基于

DeepSeekMoE

架構(gòu),整合網(wǎng)絡(luò)安全專家模

型。12.41%603019.SH中科曙光根據(jù)光合組織2025

年2

月2

官微,

海光信息技術(shù)團(tuán)隊成功完成DeepSeekV3和

R1模型與海光

DCU(深度計算單元)

的國產(chǎn)化適配,并11.99%-

16-

請務(wù)必閱讀正文之后的重要聲明部分行業(yè)點評報告300002.SZ神州泰岳正式上線。據(jù)子公司鼎富智能官網(wǎng):鼎富智能研發(fā)的AI

外呼機(jī)器人整合通義千問

、

智譜AI和

DeepSeek

等國內(nèi)領(lǐng)先的基礎(chǔ)大模型技術(shù),

實現(xiàn)了外呼效果

的全方位提升。11.56%300364.SZ中文在線2025年2

月5日

官微:基于

DeepSeekV3

R1提出的技術(shù)路線,中文

在線正著力研發(fā)并訓(xùn)練升級版“

中文逍遙”,

以進(jìn)一步提升該大模型的創(chuàng)

作能力

。目

,公司已在部分內(nèi)部AI

網(wǎng)文創(chuàng)作流程中部署11.21%300182.SZ捷成股份DeepSeek-R1

,通過調(diào)用

DeepSeek-R1

的能力

,增強(qiáng)創(chuàng)作效率2025

年2

月6日參股公司世優(yōu)科技微信公眾號發(fā)布

,世優(yōu)科技推出的

“世優(yōu)波塔”AI數(shù)字人智能體與

DeepSeek的通用人工智能(AGI)能力結(jié)

合,與世優(yōu)波塔的182個數(shù)字人面部控制技術(shù)結(jié)合,打造了“

情感反饋

能力。11.13%300188.SZ國投智能2025年2

月5日

官微:“

星盾”、“Qiko”

等自研平臺也第一時間成立接入

DeepSeek,進(jìn)一步滿足行業(yè)客戶的多樣化需求。據(jù)子公司北京創(chuàng)業(yè)未來傳媒技術(shù)有限公司官微:黑馬天啟基于10.02%300688.SZ創(chuàng)業(yè)黑馬DeepSeek發(fā)布政策大模型

1.1版,基于

DeepSeek技術(shù)架構(gòu),通過底

層能力重構(gòu)與數(shù)據(jù)體系拓展,迭代升級出更精準(zhǔn)高效的政務(wù)政策解決方

案。9.86%000681.SZ視覺中國2025年2

月5

官微:視覺中國近期完成深度求索公司開源大模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論