2023年中國AIGC產業(yè)全景報告_第1頁
2023年中國AIGC產業(yè)全景報告_第2頁
2023年中國AIGC產業(yè)全景報告_第3頁
2023年中國AIGC產業(yè)全景報告_第4頁
2023年中國AIGC產業(yè)全景報告_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2023年中國AIGC產業(yè)全景報告AIGC丨研究報告核心摘要:古人有云:日就月將,學有緝熙于光明。人類對人工智能學的潛心鉆研終于再度獲得重大突破,大模型的涌現能力與AIGC的應用普及為那不一定是AGI但一定更AI的未來提供了確定性的加速度。AI2.0時代的加速到來,不僅是把AI能力融入到現有應用中,更是未來產業(yè)范式的再塑造。AI正跳躍式地加速滲透進各行各業(yè),推動一場新的生產力與創(chuàng)造力革命。AI產業(yè)鏈各環(huán)節(jié)參與者的角色功能、產品服務和應用生態(tài)可能將發(fā)生變化。對此,艾瑞發(fā)布《AIGC系列報告——中國AIGC產業(yè)全景報告》,作為AIGC系列首發(fā),報告將展開對AIGC產業(yè)的全景洞察、探究生成式AI技術對數字產業(yè)的影響變化、繪制“中國AIGC產業(yè)全景圖譜”、分析主流參與廠商類型與格局策略、各類型廠商發(fā)展路徑和能力要求變化等,為市場辨析產業(yè)發(fā)展價值與空間。報告研究范圍-AIGCAIGC與大模型將引領“AI產業(yè)”與“產業(yè)AI”發(fā)展AIGC(AI-GeneratedContent)指利用人工智能技術(生成式AI路徑)來生成內容的新型內容生產方式。2022年11月上線的AIGC應用ChatGPT,憑借其在語義理解、文本創(chuàng)作、代碼編寫、邏輯推理、知識問答等領域的卓越表現,以及自然語言對話的低門檻交互方式,迅速獲得大量用戶,于23年1月突破1億月活,打破前消費級應用的增速記錄。微軟稱其在GPT-4(ChatGPTPlus背后運行的大模型)中看到了AGI(通用人工智能)的雛形。大眾的生活工作日常出現了Midjourney等新形態(tài)的各類AIGC應用,各行業(yè)的智能化升級也看到了新的可能性,“AI產業(yè)”與“產業(yè)AI”的想象空間進一步拓展。AIGC應用創(chuàng)新的技術支撐為“生成對抗網絡(GAN)/擴散模型(Diffusion)”與“Transformer預訓練大模型”的兩類大模型分支。在國外AIGC應用展示出大模型的能量的同時,我國企業(yè)也加強了相關產品技術布局,云廠商、AI大廠、創(chuàng)企、各行業(yè)公司及技術服務商等產業(yè)各領域玩家紛紛發(fā)布大模型或基于大模型的應用產品及各類技術服務。相較于一般AI應用,大模型應用的訓練及推理需要更強的算力支持。綜上,本報告將圍繞模型、應用、算力三個角度對AIGC產業(yè)的發(fā)展進行探討,試圖在討論開源閉源、垂直通用、知識幻覺等大模型未來發(fā)展的各種不確定性的同時,為AIGC應用的迭代升級、產業(yè)的智能化應用,提供盡可能多的研究輔助,為那個不一定是AGI但一定更AI的未來提供確定性的加速度。中國AIGC產業(yè)市場規(guī)模市場規(guī)模呈指數級增長,突破規(guī)?;R界點攫取萬億產業(yè)價值根據第50次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》,截至2022年6月,中國互聯(lián)網普及率已高達74.4%。在網民規(guī)模持續(xù)提升、網絡接入環(huán)境日益多元、企業(yè)數字化進程不斷加速的宏觀環(huán)境下,AIGC技術作為新型內容生產方式,有望滲透人類生產生活,為千行百業(yè)帶來顛覆變革,開辟人類生產交互新紀元。艾瑞咨詢預測,2023年中國AIGC產業(yè)規(guī)模約為143億元,隨后進入大模型生態(tài)培育期,持續(xù)打造與完善底層算力基建、大模型商店平臺等新型基礎設施,以此孕育成熟技術與產品形態(tài)的對外輸出。2028年,中國AIGC產業(yè)規(guī)模預計將達到7202億元,中國AIGC產業(yè)生態(tài)日益穩(wěn)固,完成重點領域、關鍵場景的技術價值兌現,逐步建立完善模型即服務產業(yè)生態(tài),2030年中國AIGC產業(yè)規(guī)模有望突破萬億元,達到11441億元。中國AIGC產業(yè)投融資情況模型創(chuàng)業(yè)初抬頭,多模態(tài)、跨模態(tài)備受青睞,資本扎堆優(yōu)質項目2021年至2023年7月期間AIGC賽道共發(fā)生280筆投融資,展現了其高熱度與高成長性。從產業(yè)細分維度,應用層創(chuàng)業(yè)機會最多,模型層創(chuàng)業(yè)受到ChatGPT影響,在2023年集中涌現;在獲投的應用與模型層創(chuàng)業(yè)項目中,文本、影像、語音平分秋色,但相比單一模態(tài),多模態(tài)和跨模態(tài)的應用前景更加為資本所看好。從投融資輪次維度,70%左右的項目仍處于A輪及以前階段,同時有高達14.6%的比例屬于股權、戰(zhàn)略融資,說明賽道雖然處于起步期,但其戰(zhàn)略價值已被公認。在全部獲投的170家公司中,獲投3次及以上公司約占17%。同一標的的高頻融資,從企業(yè)需求側反映AIGC前期創(chuàng)業(yè)所需大量資金支持,從資方供給側表明優(yōu)質創(chuàng)業(yè)項目仍非常稀缺。中國AIGC產業(yè)圖譜全景圖預訓練大模型分類與介紹基于兩大類基礎架構衍生出各類大模型;多模態(tài)已成趨勢預訓練大模型按照模態(tài)可以分為文本、圖像、視頻、代碼、音樂生成等多種,但從底層架構上都分屬兩類。Transformer是一種編解碼模型框架,適用于處理文本、代碼這類強連續(xù)性生成任務;Diffusion、GAN、NeRF等框架善于處理圖像生成類任務。疊加文-圖轉換技術可以形成文生圖模型。由單模態(tài)模型在實際訓練時融合其他模態(tài)技術,可形成多模態(tài)、跨模態(tài)大模型,如GPT-4、文心一言、Midjourney等,由于多模態(tài)模型可接受文本、圖像等不同輸入輸出形式,對應用場景能夠更廣泛適配,著力發(fā)展多模態(tài)模型成為產研兩界共同趨勢。預訓練大模型的路徑探討了解人工智能時代的“iOS”與“安卓”,閉源與開源市場將并存互補在以OpenAI為代表的閉源模型廠商開放對外技術服務后,開源模型廠商也在加緊發(fā)力,以Meta的Llama模型為代表陸續(xù)開源迭代,意圖進一步實現生態(tài)層面的跑馬圈地,2023年上半年LLM與數據集迎來開源季。大模型的開源可根據開源程度分為“可研究”與“可商用”級別。2023年2月,Meta發(fā)布了開源大模型LLM的第一個版本Llama,授予“可研究”用途。2023年7月進一步發(fā)布“可商用”的Llama2版本,雖然有日活超過7億產品需額外申請、不能服務于其他模型調優(yōu)等的商用限制,但海外很多中小企業(yè)已可用Llama2的模型來做私有化部署,基于Llama2開源模型訓練出定制化的可控模型。由于Llama2基本不支持中文,對中國的大模型商用生態(tài)暫時不會產生實質性變化,中國仍需開發(fā)培育適配于中文數據土壤的開源生態(tài)。閉源LLM可為B端用戶和C端消費者持續(xù)提供優(yōu)質的模型開發(fā)及應用服務;開源LLM可從研究角度促進廣大開發(fā)者和研究者的探索創(chuàng)新,從商用角度加速大模型的商業(yè)化進程與落地效果。未來,開源和閉源的LLM會并存和互補,為大模型發(fā)展共同創(chuàng)造出多元協(xié)作的繁榮生態(tài)。著力打造中國AIGC開源社區(qū)生態(tài)輕量級模型陸續(xù)開源,助力開源生態(tài)建設,千億級模型暫以閉源路徑開展AIGC開源社區(qū)的建設可以吸納更多的開發(fā)者及擁有定義用戶的主導權,以AI開源創(chuàng)新平臺為杠桿,帶動支撐底層AI芯片、智算中心及云服務等基礎設施發(fā)展。從供給側邏輯來看,大模型開源早期由高校和機構推動,如清華大學的ChatGLM-6B、復旦大學的MOSS,陸續(xù)有頭部云廠商加入,如百度的文心系列與阿里的通義系列,共同為中國AIGC開源社區(qū)的建設“增磚添瓦”,以阿里云魔塔社區(qū)、百度云飛槳社區(qū)為代表的開源社區(qū)建設成果初現,而千億級模型暫以閉源路徑開展,憑借穩(wěn)定、優(yōu)質效、完整工具鏈等產品特點定位應用市場;從商業(yè)化路徑來看,參考海外明星開源社區(qū)HuggingFace的商業(yè)模式,中國AI開源社區(qū)同樣會先免費提供基礎算力,為客戶提供免費的社區(qū)體驗、demo部署及測試,并進一步通過付費服務推送輕量級遷移的微調推理服務或深度開發(fā)的訓練調優(yōu)平臺,提升模型產品性能,通過開源社區(qū)吸引開發(fā)者、企業(yè)客戶完成更多部署應用資源的引流變現。大模型落地將帶來新一輪AI產業(yè)化擴散大模型的落地將提速AI工業(yè)化生產,并充分釋放AI產業(yè)潛在市場空間大模型類似于一個能力全面且突出的“完全體”,不僅通用性強,且能力相比小模型有較大提升。因此,用大模型做應用開發(fā),可以采用“預訓練+微調”開發(fā)范式,只需要針對具體任務,對大模型進行二次開發(fā)、微調甚至只是單純以領域知識庫做輔助,就可以快速賦能應用。相比獨立分散的小模型開發(fā),標準化、流程化程度更高,在開發(fā)效率和運維成本上都有較大改善,有效促進了AI的工業(yè)化生產。同時,模型能力的提升使得更多AI服務可以落地,有效擴展了AI的應用范圍,這些共同促進AI供需兩側潛力釋放。MaaS是大模型能力落地輸出的新業(yè)態(tài)打造大模型商店,為下游提供低門檻、低成本的模型使用與開發(fā)支持MaaS(Model-as-a-Service),模型即服務,是指以云計算為基礎,將大模型作為一項服務提供給用戶使用的新業(yè)態(tài)。如今,MaaS模式已成為各家云巨頭廠商發(fā)展第一戰(zhàn)略優(yōu)先級,把模型作為重要的生產元素,依托于既有IaaS設施與PaaS平臺架構,為下游客戶提供以大模型為核心的數據處理、特征工程、模型訓練、模型調優(yōu)、推理部署等服務。未來,順應大模型開源趨勢,MaaS服務商將著力打造大模型商店平臺,發(fā)力大模型生態(tài)建設,納入更多允許商用的開源模型,提升平臺的基模類型及能力,并豐富工具鏈產品服務,通過業(yè)務積累、數據回流、模型迭代逐步形成壁壘,在拉高云服務營收天花板的同時進一步塑造廠商的核心競爭力。大模型成為AI應用開發(fā)的操作系統(tǒng)模型即服務(MaaS)構建新型AI基礎設施,重構AI開發(fā)部署范式隨著企業(yè)上云進程中智能化轉型需求的逐步增多和傳統(tǒng)行業(yè)領域數據的不斷積累,AI應用開發(fā)過程中逐漸面臨大量細分領域的深耕、非典型客戶需求,對算法的通用性和延展性提出了較高要求。傳統(tǒng)“小模型”范式的AI應用開發(fā)流程一般針對單一場景,獨立完成模型選擇-數據處理-模型優(yōu)化-模型迭代等一系列開發(fā)環(huán)節(jié)。因此,AI應用在定制化需求、長尾需求下的開發(fā)效率較低,且模型精度、性能、可擴展性等指標質量也會受到影響。隨著AI產業(yè)深入及智能化需求增加,AI在研發(fā)門檻及開發(fā)效率的問題日益凸顯?!邦A訓練大模型”應運而生,其將數據中蘊含的知識通過無監(jiān)督或者自監(jiān)督學習方式提取出來,存儲在具有大量參數的神經網絡模型中。AI應用開發(fā)流程轉變?yōu)?,調用通用流程-結合行業(yè)經驗-解決實際問題。未來,大模型將成為AI產業(yè)的操作系統(tǒng),其基礎設施特性可為AI應用開發(fā)做好底座,將AI模型變得可維護、可擴展、可迭代,極大降低AI應用的開發(fā)門檻。從需求側來看,客戶能通過更低成本、高效率的MaaS(ModelAsaService)路徑獲得AI能力,完成AIGC應用的個性化開發(fā)、優(yōu)化及部署,持續(xù)兌現大模型的技術紅利,將AI能力應用滲透到各行各業(yè)的場景業(yè)務中。市場需評估基礎通用大模型產品服務能力艾瑞提出EPS-EPD評估體系,定位大模型產品的基模性能與商業(yè)能力大模型能力評測意義重大,評測結果可讓供需兩側了解各家大模型能力的優(yōu)勢與不足,做出更好的產品調優(yōu)與應用選擇。隨著大模型產業(yè)的發(fā)展迭代,評測基準體系也在不斷完善。艾瑞判斷,未來大模型的產品服務能力評測將作為一項工具包,打包在大模型平臺中為客戶提供產品服務。對此,艾瑞提出EPS-EPD評估體系,以其為核心構建一系列評測集,對市面公開大模型能力展開測評,全維度定位大模型產品的基模性能與商業(yè)能力,為業(yè)內各界對模型評估有結果需求的客戶提供信息參考。基模落地因需求差異展開產業(yè)路徑分化大模型需以行業(yè)級、企業(yè)級大模型方式支撐上層應用基礎大模型落地面臨兩大難題,一是終端客戶對算力成本的接受能力,二是大模型雖擅長通用領域問題,但往往在垂直行業(yè)任務中表現欠佳。因此,基礎大模型會通過領域數據或專屬知識庫進行訓練和調優(yōu),形成垂直領域的行業(yè)大模型或業(yè)務大模型;此外,部分企業(yè)還具有深度定制、私有化部署的需求,需要在行業(yè)大模型基礎上,進一步加入企業(yè)專有數據進行訓練或微調,形成企業(yè)級大模型。從商業(yè)化布局角度來看,如今基礎大模型廠商可分為三類參與者,分別為云巨頭廠商、人工智能公司、學術研究機構及創(chuàng)業(yè)公司,在定位有通用能力基座的同時打通向上商業(yè)化路徑。其中,云巨頭廠商將借助云服務及數據庫資源,更強調MaaS能力輸出。AI公司或創(chuàng)業(yè)公司將借助業(yè)務積累或生態(tài)資源錨定幾個典型行業(yè)或業(yè)務場景展開商業(yè)占領。從開閉源角度來看,基模廠商普遍采用前文所述的“輕量級開源、千億級閉源”的發(fā)展路徑,而向上分化的垂直領域廠商將基于開源模型或基模平臺開發(fā)部署細分領域模型產品,廠商優(yōu)勢在垂類數據與業(yè)務理解。若客戶,如金融行業(yè),對模型的開源性及私有化部署有明確要求,則開源路徑會是該類需求的典型落地形態(tài)。如何連接模型能力與應用需求是落地關鍵數據準備、ROI衡量、Prompt工程是連接模型層與應用層的落地三要素在本輪大模型推動的技術浪潮下,如何連接模型能力與上層應用,完成商業(yè)化變現,構建人工智能應用主導的生態(tài)系統(tǒng)是AIGC各層廠商重點關注的課題。艾瑞認為,數據準備,ROI衡量與Prompt工程能力是連接模型層與應用層落地的核心三要素。由于AI研究進展緩于國外、中文數據集論文發(fā)表難度高、NLP算法改進驗證與數據集語言類型關聯(lián)度低等歷史性原因,目前中文NLP數據集語料庫在數量與質量方面仍有較大差距。從可行性、性價比與時間角度出發(fā),追趕期間同步發(fā)展典型行業(yè)應用數據集是彌補中文NLP數據集短板的有效策略;從需求側角度出發(fā),大模型能力應用化需結合業(yè)務場景與成本效益選擇大模型的應用方式及調用形式,若基于安全隱私性需求要求私有化部署則投入成本更高,客戶端的ROI衡量是決定其能力商業(yè)化進程的關鍵;提示(prompt)是觸發(fā)AI模型生成內容的寬泛指令,提示工程則可進一步開發(fā)和優(yōu)化提示,從指令拆解到調用能力多維度融合大模型LLM來處理各類需求,是未來影響影響交互效果與應用體驗的關鍵。廠商合作關系演化及周邊工具服務發(fā)展模型層與應用層邊界漸弱,帶動數據層、開發(fā)平臺等工具服務高效發(fā)展伴隨大模型通用性的提升,模型開發(fā)廠商可能因其模型被廣泛使用調用匯聚多維場景數據、積累行業(yè)場景認知并集成部分垂類功能特性,進而向上延伸拓展至完整功能應用;原有垂類應用,為鞏固市場地位,可能探索開源甚至自研模型,憑借既有資源、經驗積淀及領域聚焦,同樣打造模型開發(fā)及應用服務的閉環(huán)迭代,因此模型層、應用層有交錯發(fā)展之勢。此外,企業(yè)客戶參差的數字化基礎及個性化的軟件、流程需求依然需要解決方案廠商定制優(yōu)化并部署實施,而AI開發(fā)平臺也將與大模型合力,通過“稀疏、蒸餾、剪裁”等手段助力大模型解決訓練、推理部署困難問題,進一步實現“低門檻、低成本、高效率”的開發(fā)部署與應用。數據標注、安全合規(guī)等周邊工具服務亦是促進AIGC產品高效開發(fā)、產業(yè)有序發(fā)展的可觀商機。工具層成為AIGC產業(yè)新熱點工具層的AIAgent與模型服務平臺可以更好匹配應用需求與模型能力艾瑞認為,大模型的中間層-工具層構成可分為AI代理-Agent角色與AI微調-大模型服務兩類。AIAgent是繼大模型、AIGC后進一步火爆的中間層產品,可看作能感知環(huán)境及需求、進行決策和執(zhí)行動作的智能體。如代表性產品,AutoGPT即是利用GPT-4編寫自身代碼并執(zhí)行Python自動化腳本,持續(xù)完成GPT對問題的自我迭代與完善。目前代理角色產品仍處于初代階段,未來將與實際場景、垂類數據結合,更加作為調度中心完成對應用層需求指令的規(guī)劃、記憶及工具調用(引用自OpenAI的LilianWeng論文觀點)。大模型服務平臺則是為企業(yè)提供模型訓練、推理、評測、精調等全方位平臺服務,并基于供給側能力與需求側要求進行B端私有化部署(創(chuàng)業(yè)公司切入點)或平臺資源調用(云廠商切入點),模型與用戶將呈現明顯雙邊效應。總體來看,作為模型能力與應用需求的鏈接,中間層價值前景廣袤,或作為另一核心入口建設起工具生態(tài),但從另一角度出發(fā),中間層仍嫁接于模型層之上,受限于模型層能力,“合格”的大模型能力底座將為中間層發(fā)展開拓提供更優(yōu)渥土壤。AIAgent更廣闊的角色價值與發(fā)展空間進入AI智能體文明,讓生產力大幅提升,沉淀垂類數據與業(yè)務理解是關鍵早在20世紀80年代,計算機科學家已著手探索開發(fā)一個能與人類交互的智能軟件,類似于AIAgent的雛形應用一直在被構思討論。當下大模型的涌現能力成功賦予AIAgent更多想象與落地空間。一方面,大模型的語料資源包含了大量的人類行為數據,填補了AIAgent可行性與合理性的關鍵要素。另一方面,大模型涌現出優(yōu)秀的上下文學習能力、復雜推理能力,在接受目標及設定后,可自發(fā)性將其拆解成簡單細化的子任務,無需人類干預去完成剩下的全部工作。目前AIAgent已成為繼大模型之后,更有想象空間卻也更貼近應用的下一爆點。海外亞馬遜、OpenAI及國內高校、云巨頭廠商都熱情滿滿,陸續(xù)發(fā)布AIAgent的學術研究成果及產品應用。未來,人與AI的協(xié)作交流或進一步由Agents作為智能媒介實現,每個人都可以使用各類AIAgent完成現實任務的處理執(zhí)行,人類由此進入龐大復雜的AI智能體文明。而要想實現這些,將寶貴的垂類數據與業(yè)務理解集成到Agent框架之中,保證大模型應用在執(zhí)行任務時可以訪問到正確的信息并高效執(zhí)行產出,是未來AIAgent能發(fā)揮出實際效用的關鍵。相較于模型層,AIAgents將留給創(chuàng)業(yè)者更多機會。AIGC產業(yè)化價值與影響內容生產和人機交互兩條主線并駕齊驅,拉開變革大幕本章節(jié)所探討的AIGC應用,是以大模型為技術主體,同時涵蓋其他AIGC技術(如語音合成、策略生成)的應用范圍??傮w來看,大模型基于其在內容生成、總結、邏輯推理等方面的能力,已在多種AI服務的技術開發(fā)環(huán)節(jié)中展開融合替代。其中,內容生成與理解是大模型的核心能力,AIGC的產業(yè)價值主要體現在以此為核心的“變革內容生產方式”與“變革人機交互方式”兩方面。大模型對內容理解和內容生成的雙向能力使其既能以極低門檻實現多模態(tài)內容生成,也可脫離內容生產核心場景泛化為一種人機對話的媒介。未來,全行業(yè)將借助大模型能力衍生出的大量AI生產工具,實現內容生產效率的飛躍,并進一步降低數字生態(tài)的人機交互門檻。生產力變革帶動海量下游應用優(yōu)化生活領域充分釋放用戶創(chuàng)新能力,生產領域全面革新交互體驗和效率以大模型為標志,生成式AI是一次新的技術革命,同時還具有極強的普適性,能夠對人類生產、生活的方方面面進行改造與升級。在生活領域,AIGC將通過進一步下放內容創(chuàng)作權,激發(fā)UGC創(chuàng)作熱情,加速內容裂變。加之社區(qū)玩法在部分內容平臺的良好盈利表現,內容消費領域從技術到商業(yè)模式的路徑已全線打通,以社區(qū)形式,通過用戶自發(fā)交流自主創(chuàng)作形成粘性,是各類平臺的發(fā)力方向。在生產領域,大模型能從研發(fā)流程、產品能力和交互上全方位為企服軟件帶來提升,也充分開拓了新的服務場景,因此各類企業(yè)數字化廠商都將圍繞大模型尋找自身優(yōu)勢空間與定位。AIGC將在全行業(yè)引發(fā)深度變革線上化程度、數字化基礎、行業(yè)內容占比等影響AIGC應用前景與滲透速度總體而言,AIGC主要影響內容創(chuàng)作與人機交互,因此價值鏈線上化程度越高,內容在價值鏈中占比越高,AIGC對其顛覆效應越明顯;另一方面,行業(yè)自身的數據、知識、監(jiān)管要求等特點也會深刻影響到AIGC技術的滲透速度。比如電商、游戲、廣告、影視傳媒等以內容生產為價值核心的行業(yè),以及電商、金融等研發(fā)設計、營銷等環(huán)節(jié)在行業(yè)價值鏈中地位較高的行業(yè),能夠快速看到AIGC應用對原有生產工具的替代和業(yè)務流程的變革。內容消費賽道:內容分發(fā)平臺為核心的AIGC布局現階段AIGC主要在UGC與PGC中進行滲透內容分發(fā)平臺一端鏈接創(chuàng)作者,一端綁定大量用戶,擁有最為完整的內容消費生態(tài),也天然成為了AIGC內容消費的布局核心。原本,內容消費市場按照創(chuàng)作者和商業(yè)模式可大致分為PGC和UGC。PGC專業(yè)性強,以內容付費為主要盈利模式,需要快速大量推出新內容刺激用戶購買,因此PGC平臺的主要戰(zhàn)略是前向打通內容制作環(huán)節(jié),并為了提高用戶粘性同步發(fā)展UGC;UGC內容相對生活化,本質是販賣流量,需要將內容質量保持在可持續(xù)吸引用戶注意力的水平。因此,兩類平臺均在積極布局面向UGC的AI創(chuàng)作工具。由于線上社交需求持續(xù)增長,社交業(yè)務也展現出超強的盈利能力,是內容分發(fā)平臺變現的新方向,如網易云音樂2022年在社交娛樂板塊收入已大大超出其音樂服務收入。各大內容平臺也都在布局社群業(yè)務,盤活手中用戶,其中應用到AIGC技術支撐的營銷文案、電商圖片甚至評論的自動生成中。此外,在各大內容、電商平臺的后臺普遍有大量精準推薦、智能客服等系統(tǒng),平臺也在逐步使用大模型替換和補充原AI技術棧,但這部分應用并不能直接產生內容消費,因而艾瑞將其歸為AIGC企業(yè)服務賽道而非AIGC內容消費賽道。創(chuàng)作工具賽道:模型能力為核心,文、圖發(fā)展路徑將分化短期內模型—應用不分家,圖像生成領域尚有模型自研機會與傳統(tǒng)內容創(chuàng)作工具相比,AIGC內容創(chuàng)作工具的最大特點為“底層模型重、前端輕”,因此產品競爭的核心要素也從功能設計變成模型能力。在這種情況下,是否擁有自研SOTA模型將成為AIGC應用廠商的關鍵分水嶺。基于基礎大模型的研發(fā)投入、使用現有模型開發(fā)高質量應用的可行性這兩個核心要素來看,文本類應用和圖像類應用的發(fā)展路徑差異明顯:大語言模型成熟度高,自研壁壘高,直接基于現有模型開發(fā)應用更為現實;而圖像生成模型成熟度低,自研成本可控,因此吸引更多創(chuàng)業(yè)者聚集。企業(yè)服務賽道:產品化價值與商業(yè)變現AIGC融入既有應用降本效果明顯,營收增長主要依靠服務新場景AIGC帶動中國算力產業(yè)發(fā)展機遇總覽重點關注“芯片硬件、服務器、應用模式、能源散熱”等算力模塊全球將大力發(fā)展算力基礎設施建設算力支撐與模型需求存在gap,AIGC的大算力需求讓供需結構進一步承壓自2017年谷歌提出Transformer架構后,人工智能發(fā)展逐步邁入預訓練大模型時代。2018年6月,OpenAI的GPT模型參數量已經達到1.17億,模型參數量開始實現億級基底的飛越發(fā)展,平均每3-4個月即呈現翻倍態(tài)勢,由此帶來訓練算力需求也“水漲船高”。算力正在成為影響國家綜合實力和經濟發(fā)展的關鍵性要素。浪潮信息發(fā)布的相關報告表明,計算力指數平均每提高1個點,數字經濟和GDP將分別增長千分之3.3和千分之1.8。面對算力層的供需結構矛盾,各國積極發(fā)展算力層基礎設施建設。在計算力指數國家排名中,美國坐擁全球最多超大規(guī)模數據中心,以75分位列國家計算力指數排名第一,中國獲得66分位列第二,隨后為日本、德國、英國等國,算力建設已然成為國家高質量發(fā)展的戰(zhàn)略級方針。2022年末,在OpenAI的GPT模型涌現能力后,AI產業(yè)迅速進入以大模型為技術支撐的AIGC時代,巨量訓推算力需求讓本就供需不平的算力產業(yè)結構進一步承壓。目前中國各地正加快新一批數據中心與智算建設,持續(xù)優(yōu)化算力資源,滿足未來高速發(fā)展的大算力需求。算力產業(yè)模式將在AIGC時代有所演變智能算力資源或將更多承載于云服務產品,以MaaS模式服務千行百業(yè)過去數據中心以租賃與自建為主,算力需求方基于自身業(yè)務量級、財務預算情況、數據隱私要求等情況進行選擇租賃或自建。在AIGC時代背景下,數據中心將配置更多AI服務器滿足日益劇增的智能算力需求,云廠商更是提出MaaS(ModelasaService)模型即服務的商業(yè)模式,將云計算、智能算力、模型能力等資源做高度融合,客戶可以直接在云端調用、開發(fā)與部署模型,更好適配于客戶的個性化需求。未來,更多長尾企業(yè)的需求體量將擁抱MaaS商業(yè)模式。相較于云端算力發(fā)展,端側大模型雖然發(fā)展較緩,仍是各家終端廠商發(fā)展的技術焦點,如從蘋果招聘信息中可觀測到其對“在端側實現推理和加速大語言模型功能“的人才需求及產品規(guī)劃。未來,隨著大模型輕量級開源版本的發(fā)布,大模型有望進行進一步剪裁優(yōu)化,將推理能力部署在端側,并帶動手機、機器人等端側芯片發(fā)展。數據中心需對高速巨量運轉需求做出應對大模型時代下,數據中心將進一步優(yōu)化網絡帶寬、能源消耗與散熱運維等預訓練大模型的訓練推理需要巨量數據資源與高性能計算機的全天候高速運轉,對數據中心的網絡帶寬、能源消耗與散熱運維等能力提出更高要求。首先,網絡是數據中心最為重要的組成部分,隨著數據量與計算量的飛漲,數據中心需優(yōu)化網絡帶寬,實現數據在節(jié)點內與節(jié)點間的高吞吐低延遲的傳輸與連接,并進一步優(yōu)化計算集群的架構與設計,保證數據中心的高效利用率;其次,能源消耗與碳排放問題是數據中心亟需關注的重點問題。普通服務器的標準功耗一般在750~1200W,而AI模型運行時會產生更多的能耗,以CPU+AI芯片(搭載4卡/8卡)異構服務器為例,系統(tǒng)功耗一般會達到1600W~6500W。根據斯坦福大學發(fā)布的《2023年AI指數報告》數據顯示,GPT-3模型訓練耗費的電力可供一個美國家庭使用數百年,CO?排放量也相當于一個家庭排放近百年;另一方面,基于大模型算力需求的高能耗運行,其熱量釋放呈現倍增態(tài)勢。為了確保服務器能夠長期處于適合的工作溫度,數據中心將更注重系統(tǒng)設計和散熱技術的發(fā)展應用。大模型散熱需求加速由風冷到液冷的技術升級,進一步提升經濟性、節(jié)能效果和散熱效率等。散熱也將更貼近發(fā)熱源,由機柜級散熱、服務器級到芯片級發(fā)展。目前,中國大力推進“東數西算”工程,并發(fā)布《新型數據中心發(fā)展三年行動計劃(2021-2023年)》等政策性文件,引導新型數據中心實現集約化、高密化、智能化建設,在AIGC時代下完成中國算力產業(yè)在規(guī)模、網絡帶寬、算力利用率、綠色能源使用率等方面的全方位提升。AI芯片是算力皇冠,關注其性能與利用率為服務于大模型的訓推,AI芯片需進一步升級內存、帶寬、互聯(lián)等能力算力是評價AI芯片的核心要素,而除了運算次數外,芯片的性能衡量還需考慮運算精度?;谶\算數據精度不同,算力可分為雙精度算力(FP64)、單精度算力(FP32)、半精度算力(FP16)及整型算力(INT8、INT4)。數字位數越高,代表運算精度越高,可支持的運算復雜程度越高,以此適配更廣泛的AI應用場景。為了適配大模型的訓練及推理,AI芯片要求有更大的內存訪問帶寬并減少內存訪問延遲,由此帶動由GDDR到HBM的技術升級,另一方面需要更高的片間互聯(lián)甚至片內互聯(lián)能力以滿足AI加速器訪存、交換數據的需求。最后,大集群不等于大算力,在大規(guī)模集群部署下,集群訓練會引入額外通信成本,節(jié)點數越多算力利用率越低,且單點故障影響全局運行。因此,同比增加GPU卡數或計算節(jié)點,不能線性提升算力收益,中國面臨的單卡芯片性能差距將更難通過堆料等方式解決。中國算力產業(yè)將堅持自主創(chuàng)新道路英偉達能否延續(xù)強者恒強?中國何時迎來自主創(chuàng)新芯片曙光?作為AIGC產業(yè)的基建層,算力是AIGC生產力卡脖子的關鍵環(huán)節(jié)。對此,算力生產商紛紛發(fā)力,如AMD、英特爾等追趕型企業(yè)針對AIGC的產品新品動作頻頻。對標英偉達的GraceHopper,AMD推出“CPU+GPU”雙架構的InstinctMI300進軍AI訓練端。英特爾即將在2025年發(fā)布FalconShoresGPU,將其混合架構改為純GPU解決方案。目前,國內大模型訓練芯片仍以英偉達GPU為主,且英偉達作為首批訓推部署框架成品及平臺生態(tài)將進一步鞏固其在生成式AI的優(yōu)勢地位,但國內客戶正積極與海內外追趕型企業(yè)如AMD接觸,意圖打破英偉達的溢價與壟斷體系。自2018年以來,美國陸續(xù)對中國企業(yè)實行貿易管制,進入到美方黑名單上的中國企業(yè)已達到了千余家,尤其在半導體、人工智能等先進科技領域,國產芯片實現自主創(chuàng)新迫在眉睫,中國科技部也陸續(xù)出臺政策推動人工智能公共算力平臺建設。目前國產芯片雖在成片進度有所突破,但整體還尚未進入成熟期。以適配AIGC大模型訓練角度出發(fā),國產產品會出現宕機、兼容性差、AI框架支持度低及核心IP受限等過渡性問題。在AIGC浪潮下,AI芯片發(fā)展路徑更加聚焦于AISC品類,中國算力層也會進一步嘗試脫離對頭部廠商英偉達的依賴,以“云巨頭自研自用+獨立/創(chuàng)業(yè)公司服務于信創(chuàng)、運營商等ToG與ToB市場”為兩條主線發(fā)展路徑,靜待國產替代曙光,實現國產“算力+應用”的正循環(huán)。AIGC的技術發(fā)展:科研與產業(yè)兩端突圍中短期基于Transformer算法和結構優(yōu)化仍是主流,長期可能被替代學術界將通過擴大模型參數量、調整模型結構、局部算法優(yōu)化等方式,進一步探索大模型的能力天花板,觸碰AGI可能性;以各大企業(yè)為代表的產業(yè)側,一方面從商業(yè)化落地角度追求更小模型參數下的高模型能力維持,以及解決大模型出現的知識幻覺問題,一方面也在積極研發(fā)探索新模型架構可能性,呈現“對外模型名稱為廠商能力代號,但內含技術架構隨時可能改變”的發(fā)展特征。產業(yè)與科研兩側的需求都已經暴露標準Transformer架構的巨大瓶頸,即“不可能三角”。各大機構與開發(fā)團隊對Transformer架構的成功改進在快速推進,未來極有可能會出現具備推廣價值的新Transformer架構。AIGC的應用前景:軟硬一體化大模型低參版本的端側應用,推動手機、機器人等物聯(lián)網應用的升級進化大模型在端側的應用,軟硬一體的結合帶來廣闊的應用場景。端側的應用首先需要將大模型進行剪枝、稀疏化等處理,降低參數到十億級規(guī)模,同時根據場景進行專屬知識的訓練和微調以適配專門的終端設備和軟件。這對終端設備的功耗、內存、延遲、成本等都提出了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論