




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
請務(wù)必閱讀正文之后的重要聲明部分證券研究報(bào)告/行業(yè)深度報(bào)告2025年04月0工智能教育工作方案,關(guān)注AI+教育投資機(jī)會》2025-03-09(元)2022A2023A2024E2025E2026E2022A2023A2024E2025E2026E 核心觀點(diǎn):AIAgent積木搭建完成,迎來爆發(fā)臨界點(diǎn)以產(chǎn)業(yè)演進(jìn)角度看,AIAgent的發(fā)展路徑類似于搭積木過程,過去各模塊(大模型智能性、多模態(tài)推理、Coding能力、工具調(diào)用ToolUse、Token經(jīng)濟(jì)、算力支撐)零散分布,單一技術(shù)無法形成閉環(huán),Agent形態(tài)始終停留在“缺乏行動(dòng)能力”的狀態(tài)。當(dāng)前,以MCP為代表的工具調(diào)用協(xié)議標(biāo)準(zhǔn)化落地、OpenAI的AgentSDK框架逐步完善、大模型Coding能力提升至產(chǎn)業(yè)應(yīng)用級別、Token調(diào)用成本大幅下降等因素疊加,各項(xiàng)技術(shù)模塊已逐漸完整拼接。我們認(rèn)為,AIAgent已經(jīng)走到從組件齊備到整體協(xié)同運(yùn)轉(zhuǎn)的“臨界點(diǎn)”,產(chǎn)業(yè)生態(tài)將步入爆發(fā)式增長階段。預(yù)計(jì)將有越來越多的工具、軟件開發(fā)接口,供大模型調(diào)用以提升其用戶使用體驗(yàn)。且隨著Token價(jià)格的下降,Agent滲透將加速。以MCP聚合平臺Smithery為例,平臺上已經(jīng)有超過3500個(gè)MCP服務(wù)器推出,涉及多個(gè)領(lǐng)域。n本篇報(bào)告對上述提及的技術(shù)演進(jìn)歷程做了詳細(xì)分析,同時(shí)就AIAgent可能帶來的算力消耗做了敏感性分析測算。n技術(shù)演進(jìn):l大模型:基礎(chǔ)對話需求對齊智能涌現(xiàn)多模態(tài)+長時(shí)記憶強(qiáng)Coding與推理l工具調(diào)用:RAG(檢索增強(qiáng)生成,擴(kuò)展大模型記憶能力)FunctionCalling(函數(shù)調(diào)用,通過強(qiáng)化學(xué)習(xí)大模型可以調(diào)用外部一切)MCP協(xié)議(統(tǒng)一了各大模型與各工具間的通信格式)計(jì)算機(jī)操作(以O(shè)penAI的Operator與Anthropic的ComputerUse為代表)。l技術(shù)迭代:COT的提出(思維鏈,讓模型具備規(guī)劃能力LangGraph等的Agent開發(fā)框架的完善,增強(qiáng)大模型處理復(fù)雜問題、多重推理的能力;Cursor(估值25億美元)、Cline等AI代碼編輯器的推出,加快AIAgent所需的工具模塊的開發(fā)。n算力消耗測算:l以GPT-4o為基準(zhǔn),假設(shè)一個(gè)日活規(guī)模達(dá)到10億的全球級AIAgent應(yīng)用,每日所需算力約相當(dāng)于14.15萬張NVIDIAH100SXMGPU。隨著未來Agent應(yīng)用向多模態(tài)、復(fù)雜推理與高頻次ToolUse方向演進(jìn),這一需求預(yù)計(jì)還將進(jìn)一步指數(shù)級攀升。l兩個(gè)案例:1)Manus一次標(biāo)準(zhǔn)復(fù)雜度任務(wù)執(zhí)行預(yù)計(jì)消耗20萬Tokens;2)Cline+MCP+claudesonnet3.7組合一次標(biāo)準(zhǔn)旅行規(guī)劃消耗93.34萬Tokens。n相關(guān)公司推薦關(guān)注:中芯國際、Amazon、Microsoft、Alphabet、CoreWeave、阿里巴巴2、模型開發(fā)與研究(Alphabet、Microsoft、Meta、阿里巴巴、騰訊控股、科大訊飛3、平臺與工具(HuggingFace-未上市、Brevian-未上市、Anysphere-未上市、Coze-字節(jié)跳動(dòng)旗下、ScaleAI-未上市、Turing-未上市4、應(yīng)用(特斯拉、Salesforce、Adobe、Palantir、快手、阿里巴巴、騰訊控股、Boss直聘、美圖、行業(yè)深度報(bào)告lA股傳媒相關(guān)標(biāo)的:1、AI教育:南方傳媒、豆神教育、榮信文化、世紀(jì)天鴻;2、AI陪伴:奧飛娛樂、上海電影、湯姆貓;3、AI工具:果麥文化、昆侖萬維、易點(diǎn)天下;AI娛樂:愷英網(wǎng)絡(luò)、巨人網(wǎng)絡(luò)、盛天網(wǎng)絡(luò)。n風(fēng)險(xiǎn)提示:1)AI大模型與AI應(yīng)用發(fā)展進(jìn)度不及預(yù)期風(fēng)險(xiǎn);2)技術(shù)、環(huán)境變化導(dǎo)致測算依據(jù)失效的風(fēng)險(xiǎn);3)數(shù)據(jù)信息更新不及時(shí)風(fēng)險(xiǎn)。行業(yè)深度報(bào)告核心技術(shù)躍遷,AIAgent時(shí)代全面到來 4何為AIAgent? 4AI大模型:對齊涌現(xiàn)長時(shí)記憶、多模態(tài)推理 4可調(diào)用工具及協(xié)議不斷完善(RAG、Functioncalling、MCP) 6推理賦予AIAgent處理復(fù)雜問題的能力 9Coding(代碼)就是大模型的自然語言 AIAgent實(shí)現(xiàn)路徑探尋 AIAgent應(yīng)用算力消耗假設(shè) 一個(gè)全球爆款A(yù)IAgent應(yīng)用需要多少張H100支持? 案例分享:Manus與Cline+MCP+claudesonnet3.7 AIAgent應(yīng)用場景展望與投資建議 現(xiàn)有應(yīng)用場景分析 投資建議 20風(fēng)險(xiǎn)提示 221、AI大模型發(fā)展進(jìn)度不及預(yù)期風(fēng)險(xiǎn) 222、AI應(yīng)用發(fā)展進(jìn)度不及預(yù)期風(fēng)險(xiǎn) 223、因技術(shù)與環(huán)境變化導(dǎo)致測算依據(jù)失效的風(fēng)險(xiǎn) 224、報(bào)告中數(shù)據(jù)信息更新不及時(shí)風(fēng)險(xiǎn) 22圖表1:AIAgent突破關(guān)鍵技術(shù)點(diǎn) 4圖表2:GPT-4Tokens價(jià)格變化(美元/百萬Tokens) 5圖表3:大模型上下文窗口支持Token量發(fā)展趨勢 6圖表4:RAG與LLM配合使用的概念流程 7圖表5:FunctionCalling實(shí)現(xiàn)原理圖 8 9圖表7:利用Grok3進(jìn)行DeeperSearch處理問題 圖表8:LangGraph與LangChain實(shí)現(xiàn)路徑對比(模擬制定旅行規(guī)劃) 圖表9:Cursor的訂閱價(jià)格 圖表10:Cursor年度經(jīng)常性收入(百萬美元) 圖表12:AIAgent實(shí)現(xiàn)路徑探尋 圖表14:DeepSeek、ChatG 圖表15:Token消耗量敏感性分析 圖表16:代表性超級APP的日均交互次數(shù)(次) 圖表17:每日算力消耗量敏感性分析 圖表19:Manus不同復(fù)雜度任務(wù)積分消耗 圖表20:大模型進(jìn)行任務(wù)規(guī)劃示意圖 圖表21:大模型進(jìn)行任務(wù)規(guī)劃結(jié)果 圖表22:Manus的應(yīng)用分類 20行業(yè)深度報(bào)告何為AIAgent?n何為AIAgent?lOpenAI官網(wǎng)定義:AIAgent是可以智能完成任務(wù)的系統(tǒng)——從執(zhí)行簡單的工作流程到追求復(fù)雜、開放式的目標(biāo)。lAnthropic官網(wǎng)定義:AIAgent是讓LLM(大語言模型)動(dòng)態(tài)掌控工具使用方式的系統(tǒng),可自主決定如何完成任務(wù)。n一句話形象總結(jié):AIAgent就是給AI大模型安上可操控的“四肢”。初期AI大模型只會告訴用戶處理問題的方式或解決問題的辦法(只有大腦但實(shí)操環(huán)節(jié)還需人為介入,且需要用戶來設(shè)計(jì)解決問題的路徑。發(fā)展到AIAgent,其不僅可以提出處理方案,還可以自主編排處理流程,自主調(diào)用工具,最終解決問題。有了Agent,將大大擴(kuò)展個(gè)體或機(jī)構(gòu)的能力邊界。n技術(shù)快速迭代創(chuàng)新,推動(dòng)AIAgent時(shí)代的到來:l1、更加智能的大模型,長上下文記憶,且調(diào)用的token成本持續(xù)下降。l2、大模型可調(diào)用工具不斷豐富。l3、輔助框架進(jìn)一步完善(RAG技術(shù)、Functioncalling、LangGraph框來源:中泰證券研究所AI大模型:對齊涌現(xiàn)長時(shí)記憶、多模態(tài)推理nAI大模型不斷智能化l2018年:初代大語言模型GPT-1(固定長度的輸入512Tokens)推出,還無法根據(jù)人類指令靈活響應(yīng)。l2019年:GPT-2推出,較好順寫文本,但在長文本生成時(shí)會出現(xiàn)重復(fù)、跑題,缺乏整體連貫性,無法很好對齊用戶意圖。l2020年:GPT-3推出,擁有1750億參數(shù),遠(yuǎn)超GPT-2的15億參數(shù),上下文輸入輸出窗口來到2048個(gè)Tokens。由于參數(shù)的大幅提升,模型開始出現(xiàn)Few-Shot學(xué)習(xí)等涌現(xiàn)能力,但依舊無法很好對齊用戶意圖。l2021年:DALL·E模型發(fā)布,從文本到圖像生成顯雛形。l2022上半年:InstructGPT推出,微調(diào)GPT-3,采用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)(RLHF)方式,在僅有13億參數(shù)情況下,更好對齊用戶意圖。l2022下半年:ChatGPT正式推出,至此為分水嶺,AI真正進(jìn)入了大眾視野,其顯著增強(qiáng)了對話的連貫性和上下文理解能力。行業(yè)深度報(bào)告l2023上半年:Claude1.0和GPT-4共同推出,GPT-4推理能力、專業(yè)知識進(jìn)一步提升,并支持圖像輸入,是多模態(tài)AI的里程碑。l2023下半年:Claude2.0、GPT-4Turbo、LLaMA2、Gemini推出,國內(nèi)阿里推出Qwen,大模型進(jìn)入百花齊放階段。其中Claude2.0將上下文擴(kuò)展到100Ktokens,支持文件上傳處理。2023年11月上線Claude2.1,進(jìn)一步將上下文窗口擴(kuò)展至200Ktokens,模型記憶能力大幅提升。LLaMA2將其模型開源,推動(dòng)整個(gè)行業(yè)發(fā)展。Go上線既具備多模態(tài)處理能力。l2024上半年:GPT-4o、Claude3、Gemini1DeepSeek-V2等發(fā)布,多模態(tài)進(jìn)一步完善,GPT-4o集成視頻和語音功能,Llama3是首款能夠處理圖像和文本的開源模型,Gemini1.5Pro支持多模態(tài)的同時(shí)還將上下文窗口提升至1MTokens。l2024下半年~至今:OpenAIo1、GrokDeepSeek-R1、AlibabaQwQ、Gemini2.5pro等發(fā)布,標(biāo)志著模型的推理思考能力大幅提升,OpenAIo1通過鏈?zhǔn)剿季S(chain-of-thoughtreasoning)優(yōu)化了推理能力,特別在科學(xué)和編程任務(wù)上表現(xiàn)優(yōu)異,減少模型幻覺問題,Claudesonnet3.7在編程和工具調(diào)用能力上非常突出。nToken調(diào)用成本大幅下降l以GPT-4系列為例,GPT-4o每百萬Tokens調(diào)用價(jià)格以及相較于GPT-4剛剛推出時(shí)下降了89%,若對比小模型GPT-4omini,則價(jià)格比GPT-4下降了99.3%。對比國產(chǎn)大模型DeepSeek,V3版本目前國內(nèi)標(biāo)準(zhǔn)時(shí)間段(北京時(shí)間08:30-00:30)價(jià)格為2元/百萬Tokens,輸出為8元/百萬Tokens,較GPT-4調(diào)用成本更低。來源:spearheadt,中泰證券研究所n上下文長時(shí)記憶l長時(shí)記憶對AIAgent尤為重要,減少了AIAgent頻繁分段記憶導(dǎo)致的結(jié)果偏離。不支持足夠長的文本輸入,AIAgent就較難建立起對目標(biāo)任務(wù)完整的認(rèn)知邏輯。例如GPT-3只能支持2048個(gè)tokens的輸入,很難完成邏輯鏈較長的任務(wù),發(fā)展到GPT-4,最大已經(jīng)可以支持到32KTokens上下文窗口,再到Gemini甚至可以支持到2M的上下文Tokens。此前受制于Transformer模型的自注意力機(jī)制,計(jì)算開銷隨序列長度行業(yè)深度報(bào)告指數(shù)增長,目前技術(shù)上通過更高效的稀疏注意力和分塊處理實(shí)現(xiàn)上下文窗口的擴(kuò)展。來源:artificialanalysis,中泰證券研究所可調(diào)用工具及協(xié)議不斷完善(RAG、Functioncalling、MCP)n大語言模型經(jīng)歷了從預(yù)訓(xùn)練回答歷史知識,到實(shí)施調(diào)用工具回答實(shí)施問題的階段,工具調(diào)用與協(xié)議的完善大幅拓展了大語言模型的能力。lRAG(檢索增強(qiáng)生成)技術(shù)的成熟:使AI大模型能夠在生成響應(yīng)之前引用訓(xùn)練數(shù)據(jù)來源之外的知識庫,對模型在專業(yè)領(lǐng)域的知識補(bǔ)充、長時(shí)記憶、新知識補(bǔ)充等都起到至關(guān)重要的作用。提升了大模型輸出的信息的及時(shí)性和質(zhì)量、減少幻覺。在大模型本就已經(jīng)很強(qiáng)的上下文記憶能力基礎(chǔ)上,接上了一個(gè)隨時(shí)可以擴(kuò)展的向量數(shù)據(jù)庫。來源:Amazon官網(wǎng),中泰證券研究所calling功能,允許開發(fā)者在ChatCompletionsAPI中定義函數(shù),大模型可根據(jù)用戶輸入自動(dòng)調(diào)用相應(yīng)函數(shù),生成所需的JSON對象輸出。結(jié)合了Functioncalling后,大模型相當(dāng)于擁有了可以調(diào)用函數(shù)的能力,進(jìn)而獲得了與外部交互的能力。來源:OpenAI官網(wǎng),中泰證券研究所lAnthropic推出MCP(ModelContextProtocol)協(xié)議:2024年11月25日Anthropic正式推出開源MCP協(xié)議,相當(dāng)于在FunctionCalling之上提供了一套標(biāo)準(zhǔn)協(xié)議,把API調(diào)用流程進(jìn)一步抽象,讓AIAgent可以自動(dòng)調(diào)用多個(gè)工具。Anthropic已經(jīng)預(yù)先預(yù)構(gòu)建了一些MCP服務(wù)等企業(yè)級系統(tǒng),也可以由社區(qū)編寫更多功能的MCP服務(wù)器。MCP簡化了AI連接外部數(shù)據(jù)的難度,一次性構(gòu)建兼容多個(gè)數(shù)據(jù)源的AI解決方案,行業(yè)深度報(bào)告提高數(shù)據(jù)訪問效率。有了MCP,就可以將企業(yè)數(shù)據(jù)與AI大模型更好的鏈接起來,讓大模型更高效更自主使用外部數(shù)據(jù)。來源:maartengrootendorst,中泰證券研究所l其他工具的完善。包括:1、搜索(GoogleSearchAPI等讓大模型更加方面從互聯(lián)網(wǎng)獲取信息;2、文件系統(tǒng)(Filesearch讓大模型可以調(diào)用本地或者云端文件輔助分析;3、計(jì)算機(jī)調(diào)用(ComputerUse讓大模型具備類人的計(jì)算機(jī)操作能力;4、函數(shù)調(diào)用,讓大模型可以使用編寫的函數(shù)完成自定義功能;5、專業(yè)API調(diào)用,例如金融系統(tǒng)、天氣系統(tǒng)、電商系統(tǒng)等數(shù)據(jù)信息;6、自動(dòng)化工具,例如Google郵箱、Discord平臺、Slack平臺等信息的同步與編寫。推理賦予AIAgent處理復(fù)雜問題的能力n推理與制定計(jì)劃(Planning)能力是AIAgent能夠完成復(fù)雜目標(biāo)的核心:將最終目標(biāo)分解為可執(zhí)行的具體步驟。大模型推理能力發(fā)展脈絡(luò):l1、初代大模型只是一問一答,沒有推理和計(jì)劃能力;l2、COT(ChainofThought,思維鏈)在2022年1月被提出,一種專門用于提升大模型推理能力的提示方法,能夠逐步拆解問題;l3、2022年底,ChatGPT推出后,Auto-GPT/BabyAGI等引入了任務(wù)列表與思維鏈形式,可以按照任務(wù)規(guī)劃拆分行動(dòng)分步執(zhí)行,大模型初步擁有了解決復(fù)雜任務(wù)的能力,這是把AI從工具變成Agent的分水嶺;l4、2024年9月OpenAI推出了o1模型,強(qiáng)調(diào)其在回答問題前會進(jìn)行“思考”,具備更強(qiáng)解決復(fù)雜任務(wù)的能力,而Anthropic在2025年2月發(fā)布的Claude3.7Sonnet是首個(gè)采用混合推理的大模型,具備深度思考模式,X在同月也發(fā)布了Grok3,具備深度思考能力的大模型。l至此大模型進(jìn)入到了推理時(shí)代,模型對目標(biāo)的規(guī)劃和不斷迭代嘗試的能力進(jìn)一步提升。例如詢問Grok3:“美股中,受益于ai或者使用ai或者最容易接入ai的標(biāo)的有哪些,幫我詳細(xì)梳理一下”,可以看到其進(jìn)行了9個(gè)步驟,搜索了18個(gè)信息來源,期間反復(fù)調(diào)整解決問題的思路,最終形成結(jié)果列表。行業(yè)深度報(bào)告來源:Grok3,中泰證券研究所nLangGraph框架簡化AIAgent的開發(fā),引入復(fù)雜任務(wù)循環(huán)概念。LangGraph是由LangChain團(tuán)隊(duì)開發(fā)的一個(gè)開源框架,旨在幫助開發(fā)者構(gòu)建具有狀態(tài)管理能力的多Agent或單AgentAI應(yīng)用。LangGraph引入了循環(huán)圖(CyclicalGraph)概念,彌補(bǔ)了LangChain在處理動(dòng)態(tài)、復(fù)雜任務(wù)時(shí)的局限性。簡單而言,就是用戶在調(diào)用每個(gè)Node(節(jié)點(diǎn))功能前,都會有一個(gè)Edge(邊)根據(jù)state(當(dāng)前狀態(tài))判斷是否需要再進(jìn)行下一個(gè)Node(節(jié)點(diǎn))調(diào)用,或者是END(結(jié)束)流程,這樣可以使整個(gè)處理流程自主循環(huán)直到解決問題。圖表8:LangGraph與LangChain實(shí)現(xiàn)路徑對比(模擬制定旅行規(guī)劃)來源:中泰證券研究所n這一類的開發(fā)框架的完善,也推動(dòng)了整個(gè)AIAgent領(lǐng)域的發(fā)展。Coding(代碼)就是大模型的自然語言n雖然當(dāng)前的AIAgent還很難完成較為復(fù)雜、邏輯要求縝密、精度與準(zhǔn)確度較高的任務(wù),但我們第一章節(jié)提及的上下文長時(shí)記憶+ToolUse+基礎(chǔ)大模型更加智能且推理能力不斷增強(qiáng),這幾方面的發(fā)展非常迅速,再結(jié)合當(dāng)前例如Anthropicclaudesonnet3.7或Gemini2.5pro等的強(qiáng)大Coding能力,使得大模型在擁有更強(qiáng)智慧大腦的同時(shí),用機(jī)器能聽的懂的命令,完成大模型的思考到執(zhí)行的過程。n隨著AI大模型代碼能力的不斷增強(qiáng),我們認(rèn)為本質(zhì)上,代碼就是大模型和機(jī)器交互的自然語言,在沒有大模型和AIAgent之前,人類需要通過學(xué)習(xí)編程,獲得與機(jī)器交流的能力,讓機(jī)器懂得如何去按照我們的要求完成工作,因而演化出了各類軟件,演化出了SaaS、PaaS、IaaS等平臺,以及各類的APP,大大提高了生產(chǎn)效率。n如今,AIAgent就是架設(shè)在人類與機(jī)器之間的中間層,即可以理解人類的自然語言,也可以編寫機(jī)器看的懂的自然語言(代碼這就完成了全人類的效率提升。因?yàn)閷懘a的能力不是人人具備,而且現(xiàn)成的工具也不一定能滿足所有人個(gè)性化需求,并且工具很多基于部分人的智慧,實(shí)際很難集成大量的知識庫做出最優(yōu)決策并結(jié)合實(shí)時(shí)情況更新解決方案和工具,但有了一個(gè)擁有極強(qiáng)Coding能力的AIAgent之后,這一切都將成為可能。n舉例說明:由于大模型Coding能力的不斷增強(qiáng),基于大模型推出了不少編碼工具,包括ClaudeCode、Cursor和Cline,他們分別專注于終端、代碼編輯器和VSCode集成。國內(nèi)字節(jié)跳動(dòng)的Trae也是一個(gè)支持免費(fèi)AIIDE,通過接入LLM技術(shù)提升開發(fā)代碼開發(fā)效率。lClaudeCode是Anthropic開發(fā)的一個(gè)命令行AI編碼助手,幫助開發(fā)者通過自然語言命令執(zhí)行代碼搜索、編輯、測試和Git操作。lCursor是基于VisualStudioCode的AI增強(qiáng)代碼編輯器,提供代碼生成、智能建議和任務(wù)完成代理模式,它集成了多種AI模型,適合個(gè)人和團(tuán)隊(duì)提高生產(chǎn)力,根據(jù)Sacra估計(jì),Cursor是ARR從100萬美元增長到1億美元有史以來最快的SaaS公司,Cursor訂閱的定價(jià)分為免費(fèi)、20美元/月、40美元/月。2025年1月,Cursor宣布完成1.05億美元的B輪融資(ThriveCapital融資估值為25億美元。來源:Cursor官網(wǎng),中泰證券研究所來源:sacra,中泰證券研究所來源:sacra,中泰證券研究所lCline是一個(gè)開源的AI自主編碼代理,集成到VSCode中,可創(chuàng)建/編輯文件、執(zhí)行命令、使用瀏覽器等。n大模型在Coding領(lǐng)域的突破,預(yù)計(jì)會帶動(dòng)LLM和工具的進(jìn)一步緊密結(jié)合,無限拓展LLM能力邊界,向?qū)崿F(xiàn)AGI邁進(jìn)。模型自治+外部協(xié)同nAIAgent的發(fā)展,總結(jié)看來朝兩個(gè)方向不斷推進(jìn):l大模型能力內(nèi)化:可以簡稱“內(nèi)腦”,通過監(jiān)督學(xué)習(xí)+強(qiáng)化學(xué)習(xí)(包括對齊人類指令的RLHF以及適合自主學(xué)習(xí)和探索性的SELF-RL)方式,不斷增強(qiáng)模型的邏輯能力,目的是提升模型自主推理的能力,甚至部分行業(yè)深度報(bào)告內(nèi)嵌功能,例如搜索、規(guī)劃等功能,我們實(shí)際在調(diào)用AI大模型的時(shí)候,模型就自主開始搜索互聯(lián)網(wǎng)信息,無需外接API工具實(shí)現(xiàn)。l外化框架的協(xié)同:1、規(guī)范工具調(diào)用:上文提到的LangGraph架構(gòu),包括Anthropic的MCP協(xié)議,以及OpenAI開源的AgentSDK框架,本質(zhì)上都是通過預(yù)先設(shè)定的邏輯關(guān)系,使得AI大模型在解決目標(biāo)問題時(shí),遵循一定規(guī)則和框架協(xié)議,可以更加高效的調(diào)用外部工具,實(shí)現(xiàn)跨模型跨平臺統(tǒng)一調(diào)用,提升處理處理問題的能力。2、多模型協(xié)同:不同的AI大模型特長不同,可以集各家所長,更好應(yīng)對用戶泛化的需求,使AIAgent可以處理更多復(fù)雜問題。例如基礎(chǔ)大模型負(fù)責(zé)綜合調(diào)度,而擅長圖片處理、視頻分析、數(shù)據(jù)整理等的微調(diào)垂模型可以承接不同環(huán)節(jié),多模型共同協(xié)作完成目標(biāo)任務(wù)。特別是在特定領(lǐng)域,需要專業(yè)知識的情況下,往往通用大模型是無法很好勝任,例如金融、醫(yī)藥等領(lǐng)域,要求模型具備更加專業(yè)的能力,這是就可以通過通用模型+專精尖垂模型配合的模式協(xié)同完成。來源:中泰證券研究所n當(dāng)前各路徑存在的問題:l模型能力內(nèi)化:模型的參數(shù)會變得非常龐大,處理速度可能降低,訓(xùn)練+推理算力消耗會更大,并且應(yīng)對不斷變化的環(huán)境,模型需要不斷進(jìn)行新的訓(xùn)練,無法做到實(shí)時(shí)更新,且訓(xùn)練過程中的不可控因素較大。l外化框架協(xié)同:存在多工具調(diào)用協(xié)同時(shí)token消耗大幅增加的問題,且不同工具之間的切換,需要大模型能夠有較長記憶及綜合處理能力,處理效果或許沒有內(nèi)化到大模型中的效果好。同時(shí)多模型之間協(xié)同,頻繁的模型調(diào)用對基礎(chǔ)設(shè)施要求高,模型間的通信信息傳遞損失,延遲積累等問題也需要處理。n上述提及的各類問題,很多是短期工程的優(yōu)化問題,我們預(yù)計(jì)隨著輔助框架的不斷完善和AI大模型自身能力的提升,將逐步得到解決。且預(yù)計(jì)兩種路徑會在不同的需求場景下不斷推進(jìn),例如:lB端商業(yè)場景:強(qiáng)調(diào)數(shù)據(jù)的安全性,考慮LangGraph與MCP協(xié)議結(jié)合的方式,使用開源的大模型+垂模型+外化工具的組合,完成目標(biāo)任務(wù),這需要企業(yè)自有算力部署,且內(nèi)部API開發(fā)完善。lC端需求場景:優(yōu)先選成熟框架(OpenAISDK、LangChain)快速實(shí)現(xiàn)功能,把更多決定權(quán)交由大模型。行業(yè)深度報(bào)告n小結(jié):外化+內(nèi)化結(jié)合的AI大模型,猶如擁有強(qiáng)運(yùn)動(dòng)天賦的運(yùn)動(dòng)員配備上了專業(yè)的設(shè)備。舉例:當(dāng)前大模型推出的類DeepResearch功能,就是相當(dāng)于把搜索、計(jì)劃等能力內(nèi)化在AI大模型中,同時(shí)又支持工具調(diào)用,如數(shù)據(jù)庫查閱或者用戶上傳文件輔助研究,內(nèi)外集合,大幅提升處理效果。一個(gè)全球爆款A(yù)IAgent應(yīng)用需要多少張H100支持?n做一個(gè)假設(shè)測算,希望能大概估算,一個(gè)爆款的AIAgent應(yīng)用,需要多少塊NVIDIAH100GPU算力支持,基于假設(shè)的測算思路為:l1、通過OpenAI對Plus用戶月訂閱價(jià)格倒推用戶每日一次交互的token消耗量。l2、以計(jì)算出來的每日每次交互的token消耗量為基準(zhǔn),假設(shè)AIAgent應(yīng)用的日活以及每日交互次數(shù),計(jì)算出其一天算力的消耗量。率情況下的不同日活的AIAgent應(yīng)用對應(yīng)的GPU需求數(shù)。來源:NVIDIA官網(wǎng),中泰證券研究所n詳細(xì)步驟:n月訂閱價(jià)格倒推token消耗量:這部分計(jì)算的依據(jù)的假設(shè)為OpenAI在設(shè)定訂閱價(jià)格時(shí),考慮了每個(gè)Plus用戶每天的tokens消耗量,以此為基準(zhǔn),設(shè)定了合理的訂閱價(jià)格。但是由于免費(fèi)用戶也可以無限制使用例如GPT-3.5、GPT-4omini以及有限制使用GPT-4o、OpenAIo3-mini等,因此考慮Plus用戶訂閱價(jià)格設(shè)定時(shí),OpenAI應(yīng)需要覆蓋免費(fèi)用戶的成本開支,加之還有數(shù)據(jù)中心、電力、硬件折舊等開支。n因此我們用敏感性分析,假設(shè)一定的百分比作為實(shí)際Plus用戶開支覆蓋其自身Token消耗部分。根據(jù)SenserTower數(shù)據(jù)顯示,截止2025年2月底,ChatGPTAPP每日平均交互次數(shù)為7.03次,DeepSeek為4.38次,Claude為3.28次,因此我們把日交互次數(shù)也做一個(gè)敏感性分析,得出下表:來源:SensorTower,中泰證券研究所 來源:中泰證券研究所n計(jì)算結(jié)果顯示,最高的每日每次消耗token量為29630個(gè),最低為2222個(gè),以日交互5次與6次/訂閱價(jià)格折價(jià)60%這兩個(gè)中間水平條件對應(yīng)的2個(gè)數(shù)值為基準(zhǔn),計(jì)算平均消耗量為每日每次交互9777.8個(gè)。n做第二層的敏感性分析,由于OpenAIPlus用戶系統(tǒng)默認(rèn)采用GPT-4o大模型,因此我們以GPT-4o的參數(shù)作為計(jì)算基準(zhǔn),根據(jù)微軟與華盛頓大學(xué)發(fā)表的論文《MEDEC:ABenchmarkforMedicalErrorDetectionandCorrectioninClinicalNotes》披露顯示GPT-4o參數(shù)量為2000億,我們對每次激活的參數(shù)量做敏感性分析,對應(yīng)假設(shè)這個(gè)超級AIAgentAPP每日的打開次數(shù)在3~10次范圍內(nèi)(基于當(dāng)前全球超級APP中交互頻次相對低一些的Youtube和AI大模型應(yīng)用中較低一些的Claude作為基準(zhǔn)范圍以激活參數(shù)+日交互次數(shù)為兩個(gè)計(jì)算參數(shù),基于上述的Token消耗結(jié)果平均值,做二層敏感性推導(dǎo),計(jì)算每日的算力總消耗,得出下表,來源:SensorTower,中泰證券研究所每日交互次數(shù)(次)3456789來源:中泰證券研究所n計(jì)算結(jié)果顯示,最高的每日消耗算力量為4.9E+16FLOPs,最低為7.3E+14FLOPs,若依舊考慮中位線水平,則每日交互6/7次+50%的參數(shù)激活對應(yīng)n我們做第三層的敏感性分析,考慮到NVIDIAH100SXMGPU在實(shí)際推理的時(shí)候算力的利用率是有限制的,并不能完全100%的跑滿理論算力,因此我們將GPU的算力利用率按一定比例做敏感性分析,同時(shí)超級AIAgentAPP需要有一個(gè)日活的門檻線,我們對于日活也做了一定的選擇范圍,然后以GPU的算力利用率+日活為兩個(gè)計(jì)算參數(shù),最終計(jì)算NVIDIAH100SXMGPU卡的需求量,得出下表, 來源:中泰證券研究所n計(jì)算結(jié)果顯示,取敏感性分析的中位值,對應(yīng)50%的算力利用率+10億日活情況下,一個(gè)超級AIAgentAPP運(yùn)行一天所消耗的算力需要14.15萬張n總結(jié):以上測算基于GPT-4o模型,但GPT-4o模型為基礎(chǔ)大模型,若考慮推理能力更強(qiáng)的OpenAIo1大模型,或者在GPT-4o基礎(chǔ)上使用OpenAI的DeepResearch功能,那實(shí)際的token消耗量會更大,且當(dāng)前GPT-4o已經(jīng)開放圖片模態(tài)的輸出,算力消耗預(yù)計(jì)會較文字更大,且未來文字+圖片+語音+視頻的多模態(tài)輸入和輸出預(yù)計(jì)將成為標(biāo)配,那算力的消耗將比僅圖文會更大。同時(shí)考慮到AIAgent本身可能基于多重的思維鏈推理,調(diào)用外部工具,特別在執(zhí)行復(fù)雜的任務(wù)時(shí),存在多重的并行調(diào)用和循環(huán)執(zhí)行,那Token的消耗量將更加驚人。n因此以上的計(jì)算僅在當(dāng)前環(huán)境背景下,做了諸多的假設(shè),作為算力需求的一個(gè)概覽。案例分享:Manus與Clinen就此前火爆的定義為通用Agent的應(yīng)用Manus,公布了其訂閱的價(jià)格,分為Starter/Pro兩檔,分別對應(yīng)39美元/月與199美元/月,其中Starter用戶的權(quán)益包括每月3900積分以及并行運(yùn)行兩個(gè)任務(wù),Pro用戶可以擁有19900積分,并同時(shí)運(yùn)行5個(gè)任務(wù)。同時(shí)manus也給了相應(yīng)的案例,復(fù)雜度為標(biāo)準(zhǔn)的“NBA球員得分效率象限圖”預(yù)計(jì)持續(xù)時(shí)間15分鐘,需要消耗200積分,對應(yīng)單次任務(wù)2美元,時(shí)間上預(yù)估0.133美元/分鐘,復(fù)雜度同樣為標(biāo)準(zhǔn)的“優(yōu)雅簡約奢華婚禮邀請網(wǎng)頁”設(shè)計(jì)需求需消耗360積分,預(yù)計(jì)持續(xù)時(shí)間25分鐘,對應(yīng)單次任務(wù)3.6美元,時(shí)間上預(yù)估0.144美元/分鐘,而復(fù)雜度為復(fù)雜的“基于位置的每日天象事件WEB應(yīng)用”則需要消耗900積分,預(yù)估時(shí)間80分鐘,對應(yīng)單次任務(wù)9美元,時(shí)間上0.113美元/分鐘。來源:Manus官網(wǎng),中泰證券研究所n以此看,單次完成任務(wù)消耗成本至少在2美元以上,換算成調(diào)用GPT-4o的API價(jià)格(按輸出10美元/百萬Token對應(yīng)Token消耗量為20萬個(gè),若為復(fù)雜的任務(wù),單次任務(wù)9美元,則對應(yīng)Token消耗量為90萬個(gè)。n上文提到了MCP協(xié)議,目前已經(jīng)看到包括Unity、Blender等軟件社區(qū)開發(fā)了MCP服務(wù)器提供接入,地圖相關(guān)GoogleMaps與百度地圖、高德地區(qū)均有相應(yīng)的MCP服務(wù)器,還有網(wǎng)絡(luò)搜索、文件處理、數(shù)據(jù)庫分析、思維規(guī)劃等應(yīng)用均接了MCP服務(wù)器。n目前在MCP集中Smithery平臺上,已經(jīng)有3579個(gè)相關(guān)服務(wù)應(yīng)用,預(yù)計(jì)后續(xù)會有越來越多的應(yīng)用接入MCP,開發(fā)MCP的服務(wù)器,大模型進(jìn)入應(yīng)用的場景會越來越多,包括OpenAI的AgentSDK也擴(kuò)展支持了MCP協(xié)議的調(diào)用??梢韵胍姷氖牵絹碓蕉鄳?yīng)用將集成大模型,提升用戶使用體驗(yàn),進(jìn)而也不斷增大了token的消耗和算力的需求,試想一下,若每個(gè)軟件都接入大模型作為基礎(chǔ)服務(wù)層。n我們做了一個(gè)旅行的案例:集成了Brave瀏覽器MCP、GoogleMapsMCP、anthropic官方FilesystemMCP,通過Cline客戶端,接入ClaudeSonnet3.7大模型,給予prompt為:“我想去意大利度假,計(jì)劃2025年4月1日出發(fā)。搜索下意大利有什么著名的地標(biāo)景點(diǎn),你從中篩選偏人文歷史的景點(diǎn)。按規(guī)劃的時(shí)間,在中午和晚上就餐時(shí)間,所在游玩景點(diǎn)旁邊推薦一家google評分高的餐館,價(jià)格在20歐元一人以內(nèi)。計(jì)劃差不多10天的時(shí)間,每個(gè)城市當(dāng)日的天氣也需要標(biāo)注,包括是否下雨或者氣溫,給我一個(gè)行程安排,我從上海出發(fā),給我具體的景點(diǎn)間轉(zhuǎn)換乘坐建議。按照你的規(guī)劃和交通費(fèi)用的預(yù)計(jì),給出每天的支出預(yù)算,最后總結(jié)整個(gè)旅行的支出總計(jì)。最后在shanghaiplan.txt中寫好中文計(jì)劃,流程用中文展示”,整體步驟分為:l1、調(diào)用大模型進(jìn)行任務(wù)規(guī)劃:claude將任務(wù)逐步拆解,分成了7個(gè)需求點(diǎn)。l2、生成了6部的處理方案,包括先調(diào)用Brave的MCP進(jìn)行搜索知名的城市及景點(diǎn),然后使用GoogleMapsMCP進(jìn)行交通和餐館的發(fā)掘,從景點(diǎn)附近找出高分餐館,再使用天氣API搜索當(dāng)?shù)靥鞖?,最后預(yù)估旅行費(fèi)用及輸出最終形成規(guī)劃文檔。來源:Cline,中泰證券研究所l整個(gè)流程總共向大模型輸入了9KTokens,同時(shí)大模型輸出了933.4KTokens,合計(jì)整個(gè)需求消耗了942.4KTokens,cline統(tǒng)計(jì)對應(yīng)的調(diào)用資金消耗為0.5904美元。這意味著一個(gè)簡單的旅行規(guī)劃,一次請求,就消耗了接近百萬的Tokens,那如果整個(gè)流程中加入酒店、餐館、機(jī)票等預(yù)訂,再加入各個(gè)景點(diǎn)的歷史人文背景介紹,再添加相應(yīng)的循環(huán)調(diào)整機(jī)制,加入知識的搜索,例如搜索人的喜好習(xí)慣記憶,歷史上旅行的偏好,身體的狀況能接受怎么樣強(qiáng)度的旅行等等,則消耗會更加巨大。來源:Cline,中泰證券研究所現(xiàn)有應(yīng)用場景分析n根據(jù)通用AgentManus官網(wǎng)所列示案例,可以窺見一些AIAgent的使用場景,案例大致可以分為:1、金融與投資(12個(gè)2、市場與品牌傳播(8個(gè)3、科技與互聯(lián)網(wǎng)(6個(gè)4、教育與培訓(xùn)(6個(gè)5、消費(fèi)零售與電商(3個(gè)6、招聘與HR(2個(gè)7、房地產(chǎn)與居住服務(wù)(2個(gè)8、保險(xiǎn)與醫(yī)療(2個(gè)9、辦公效率與文檔工具(2個(gè)10、旅游與生活(1個(gè)11、家庭與人文(1個(gè)12、文化創(chuàng)意與多媒體(1個(gè)13、法律與合規(guī)n綜合各案例,可以總結(jié)銜接端AIAgent應(yīng)用幾大特征;1)非標(biāo)內(nèi)容類:以內(nèi)容輸出為主,涉及到產(chǎn)業(yè)研究、文化創(chuàng)意、課程設(shè)計(jì)或生活需求,這類需求沒有標(biāo)準(zhǔn)化輸出限制,對內(nèi)容的精確度沒有強(qiáng)制要求,滿足諸多非標(biāo)個(gè)性化需求;2)標(biāo)準(zhǔn)內(nèi)容類:有明確數(shù)據(jù)或內(nèi)容支撐,例如電商運(yùn)營分析、房地產(chǎn)數(shù)據(jù)分析、醫(yī)療數(shù)據(jù)分析等,該類內(nèi)容在外部數(shù)據(jù)支持下,大幅降低模型幻覺,輸出更加可靠;3)模板化分析類:內(nèi)容有相對固定格式、固定模板、固定規(guī)則,可批量化操作,可復(fù)用且流程較為繁雜,例如利用AIAgent校對文本、分析合同、語音轉(zhuǎn)錄翻譯、格式轉(zhuǎn)換等。來源:Manus官網(wǎng),中泰證券研究所n以上是AI大模型發(fā)展至今,AIAgent能力所能觸達(dá)的領(lǐng)域,但當(dāng)前對于精度要求高、需求更加復(fù)雜的情況,例如復(fù)雜的研究需要上百步的推理及工具調(diào)用,模擬真實(shí)情況下的各種異常環(huán)境等,AIAgent還較難勝任。投資建議n當(dāng)前在AI領(lǐng)域的投資,可分為幾類:1)硬件支持;2)底層基礎(chǔ)模型;3)中間層架構(gòu)輔助;4)應(yīng)用。n標(biāo)的梳理:l1、硬件與基礎(chǔ)設(shè)施AI硬件和基礎(chǔ)設(shè)施包括半導(dǎo)體制造商和云服務(wù)提供商,它們?yōu)锳I技術(shù)提供計(jì)算基礎(chǔ)。主要公司:NVIDIA(GPU領(lǐng)導(dǎo)者)、AMD(GPU和(芯片制造)、Amazon(AWS,AI云服務(wù))、Microsoft(Azure,AI云平臺)、Alphabet(GoogleCloudPlatform-GCP,TensorFlow支l2、模型開發(fā)與研究聚焦于開發(fā)基礎(chǔ)AI模型。主要公司:Alphabet(通過GoogleAI和DeepMind研究)、Microsoft(與OpenAI合作)、Meta(MetaLlama科大訊飛(星火大模型)、Baidu(文心一言大模型)。l3、平臺與工具提供AI開發(fā)平臺、工具和中間件的公司,幫助開發(fā)者構(gòu)建和管理AI應(yīng)用。主要公司:HuggingFace(提供開源AI模型庫和工具的平臺,未上市)、Brevian(為企業(yè)提供無代碼平臺定制AIAgent,未上市)、Anysphere(提供AI驅(qū)動(dòng)的集成開發(fā)環(huán)境,未上市)、Coze(節(jié)跳動(dòng)推出AIAgent開發(fā)平臺,未上市)、ScaleAI(為機(jī)器學(xué)習(xí)和人工智能模型提供高質(zhì)量的訓(xùn)練數(shù)據(jù)和數(shù)據(jù)標(biāo)注服務(wù),未上市)、Turing(提供人類專家用于AI訓(xùn)練和微調(diào),未上市)。nAI驅(qū)動(dòng)的行業(yè)應(yīng)用,公司覆蓋醫(yī)療、金融、零售、媒體、駕駛、教育等AI平臺,增強(qiáng)其CRM軟件功能)、Adobe(AdobeSensei集成AI,增強(qiáng)創(chuàng)意和營銷軟件的功能)、Palantir(提供AI驅(qū)動(dòng)的數(shù)據(jù)分析平臺,服務(wù)政府和商業(yè)客戶)、快手(可靈,文本提示生成高質(zhì)量視頻)、阿寶,提供文檔分析、文本和圖像生成以及交互式問答,利用混元大模型)、Boss直聘(利用AI促進(jìn)求職者和雇主之間的高效匹配)、美圖(AI驅(qū)動(dòng)的照片和視頻編輯應(yīng)用)、多鄰國(AI提供個(gè)性化的語言學(xué)習(xí)n對應(yīng)A股傳媒板塊:lAI教育:南方傳媒(粵教翔云數(shù)字教材平臺上線AI助教、AI助學(xué)功能,新華樂育推出校園AI智能體,以AI賦能基礎(chǔ)教育,成立廣東新華人工智能與教育研究院)、豆神教育(推出AI超擬人多對一直播課及豆神AI等產(chǎn)品,與智譜合作成立合資公司專注于AI教育產(chǎn)品的技術(shù)研發(fā)及銷售)、榮信文化(AI兒童教育踐行者,已積累適用于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南省新鄉(xiāng)市延津縣2025屆數(shù)學(xué)七下期末教學(xué)質(zhì)量檢測試題含解析
- 山西臨汾霍州第一期第二次月考2025屆八下數(shù)學(xué)期末檢測模擬試題含解析
- 2025年法學(xué)概論新知識試題及答案
- 高考數(shù)學(xué)綱要試題及答案集2023
- 實(shí)驗(yàn)室檢測部門年度成就與改進(jìn)建議計(jì)劃
- 創(chuàng)意班級手冊的設(shè)計(jì)計(jì)劃
- 財(cái)務(wù)工作程序優(yōu)化計(jì)劃
- 財(cái)務(wù)職能轉(zhuǎn)型的實(shí)施路徑計(jì)劃
- 2024年西藏自治區(qū)文化廳下屬事業(yè)單位真題
- 2025年軟考設(shè)計(jì)師考試變革與創(chuàng)新試題及答案
- 2025年江蘇省鹽城市射陽縣中考一模英語試題(原卷版+解析版)
- 煤礦面試筆試試題及答案
- 2025民法典婚姻家庭編司法解釋二解讀
- 中外名曲賞析知到課后答案智慧樹章節(jié)測試答案2025年春廣東外語外貿(mào)大學(xué)
- T-CCTAS 117-2024 橋梁轉(zhuǎn)體支座
- 構(gòu)建素養(yǎng)導(dǎo)向的小學(xué)數(shù)學(xué)“套餐式”作業(yè)設(shè)計(jì)的實(shí)踐與研究
- 《文獻(xiàn)閱讀匯報(bào)》課件
- 二十屆中央紀(jì)律檢查委員會四次會測試題及參考答案
- 嬰幼兒喂養(yǎng)的正確方法
- 重大版小學(xué)英語六年級下冊期中試卷(含答案含聽力原文無聽力音頻)
- 工地試驗(yàn)室安全培訓(xùn)內(nèi)容
評論
0/150
提交評論