




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
部門:企業服務三組?2025
iResearch
Inc.2024年中國人工智能產業研究報告PREFACE前言2研究背景:作為新一輪科技革命和產業變革的核心引擎,人工智能產業在2024年被中央及各地政府確立為
重點發展方向,陸續出臺了一系列針對性強、力度大的政策措施,旨在推動產業創新,提升區域經濟的科技競爭力。經過多年持續投資布局,我國人工智能產業體系逐步完善,基礎層、模型層及應用層不斷升級優化,實現了人工智能、大數據等數據智能技術與實體經濟的廣泛融合。2025年2月,中共中央總書記、國家主席、中央軍委主席習近平在京出席民營企業座談會并發表重要講話,強調民營企業的關鍵角色與發展前景,進一步強調了人工智能產業的戰略地位。2025年初,以DeepSeek為代表的國產開源大模型掀起熱潮,其高性能、低成本的特點迅速吸
引了國內外開發者和企業的關注,推動了中國AI生態的開放性和競爭力的進一步提升。這一風潮不僅加速了模型層的國產化創新,也為中小企業提供了更易獲取的AI工具,激發了應用層的創新活力,成為中國AI產業發展的標志性事件。艾瑞人工智能研究團隊延續六年行業研究經驗,在第七年聚焦人工智能產業的發展環境、產業進程及產品動態,深入探討技術驅動、產業機遇、商業模式及挑戰等核心議題,為市場提供前瞻性數據與深度洞察。研究方法:本報告通過業內資深的專家訪談、桌面研究、案例實證研究、行業對比研究、投融資數據統計輸出相應研究成果。摘要ABSTRACT2024年,國家高度重視人工智能發展,將其納入國家戰略,各地政府積極推進科研創新與算力基礎設施建設,并因地制宜出臺特色政策。盡管GDP增速放緩,AI技術作為新質生產力,憑借其在提升效率和推動產業升級方面的優勢,展現出廣闊發展前景,政府支持也為其提供了強勁動能。資本市場持續關注AI,投資重點聚焦于語言與多模態模型應用、芯片、算力服務等領域,基礎層與應用層協同發展,不斷完善產業生態。社會層面,生成式AI的普及加速了市場教育,公眾接受度顯著提升,但就業替代、隱私安全等問題仍引發一定焦慮。技術方面,
Transformer架構依然主導大模型發展,研發側通過強化學習、思維鏈優化提升模型推理能力,同時加速跨模態融合,并在推理效率優化和新型注意力機制等方面持續探索,推動AI產業向更高水平邁進。宏觀環境產業動態發展趨勢市場規模增速略低于預期:2024年中國AI產業規模為2697億元,增速26.2%,略低于預期。主要原因為大模型在實際業務場景的表現未完全滿足客戶需求,且建設成本較高,較多項目仍
處于探索階段。算力需求結構性轉變:2024年部分地區智算中心出現閑置,但這主要是供需錯配導致。隨著DeepSeek等開源模型推動推理應用爆發,推理側算力需求大幅上漲,智算中心利用率有望逐步提高。3)工具生態日益完善:分布式AI框架、LLMOps平臺和一體機產品等不斷發展,深度融合軟硬件優勢,加速了大模型的訓練與部署,有效支撐了產業側大模型的應用建設。
4)商業化以項目制與訂閱制為主流:政企側客戶以項目制為主,C端產品多采用“免費+訂閱制”的模式。新興商業模式為按應用效果或功能點收費,創新的模式可在降低客戶采購決策成本的同時,倒逼供應商持續優化產品技術與服務。全球化戰略:面對國內激烈競爭,眾多企業積極出海,布局海外市場,在圖像、視頻和社交等領域有較多突破。DeepSeek掀起開源開放與應用落地的熱潮:DeepSeek刷新了市場對大模型現階段性能的認知,其開源策略結合高效、低成本的架構顯著加速了中國AI產業向更加高效、開放和自主的方向邁進,并帶動產業鏈上下游的合作與應用落地。3AIAgent正在重塑大模型的產品應用形態,帶領AI產品由簡單的對話問答向完成復雜任務的智能代理演進。作為連接數字智能與物理世界的關鍵技術,具身智能是下一代AI競爭的戰略高地,其發展需要解決硬件加速和軟件優化、跨行業生態協作等一系列挑戰。DeepSeek的開源開放,推動了大模型技術的普惠與平權,將加速大模型在產業和消費領域的應用普及。構建面向新一
代人工智能的安全治理體系至關重要,需要在技術、商業、法律、倫理等多個層面協同發力,以確保人工智能的安全發展。目錄CONTENTS01中國人工智能產業宏觀環境政策、經濟、社會、技術02
中國人工智能產業價值總覽基礎層、模型層、應用層03中國人工智能產業商業進程語音、視覺、語言及多模態產品04中國人工智能產業實踐案例典型產品、標桿廠商054中國人工智能產業發展趨勢產業機遇、關鍵挑戰中國人工智能產業宏觀環境——當下,中國人工智能產業在經濟、政策、認知、技術維度的發展環境如何?015中國人工智能產業政策環境人工智能新時代的技術引擎,各城市展開地域大模型產業競速近年來,國家高度重視大模型產業發展,把“人工智能”納入國家發展戰略,并出臺了一系列政策以推動技術創新、資源建設、標準建立與行業應用。隨著中央層面人工智能政策的出臺,以北京、上海、成都、深圳等代表的各地政府紛紛響應號召,將人工智能及其相關產業發展納入當地發展規劃,以助力新一代人工智能產業生態的形成。2025年初,習近平總書記指出:“中國高度重視人工智能發展,積極推動互聯網、大數據、人工智能和實體經濟深度融合,培育壯大智能產業,加快發展新質生產力,為高質量發展提供新動能。并在2月召開中央民營企業座談會,眾多與人工智能相關的民營企業家參會,為中國經濟轉型與產業升級打下重要基調,也進一步反映出未來中國人工智能產業發展的重要戰略意義。中國人工智能產業政策高維規范建設全產業級地方鼓勵以北京、上海為代表,成都、重慶、安徽、山東、深圳、湖南等地方積極響應。北京市政府著重加大對科研機構和高校的資金投入,鼓勵開
展 人工智能基礎理論研究,推動關鍵技術突破;計劃建設強大的 算力基礎設施,以支持AI模型的研發和應用;積極打造人工智 能產業創新高地,吸引頂尖人工智能企業和人才匯聚。來源:艾瑞咨詢研究院自主研究繪制。北京上海上海市政府著力于AI大模型的產業集聚和生態建設,通過 實施大模型創新扶持計劃和示范應用推進計劃,推動AI技 術在金融、制造、生物醫藥等領域的應用;推動AI開源生 態產業集群的建設,以促進AI技術的創新和應用。“夯實產業根基,站在高維的視角,對人工智能產業
各層次的發展進行標準制定。”“各地因地制宜,
充分發揮自身獨特優勢,出臺具有地方特色的人工智能政策,呈現出百花齊放的發展態勢。”數據6?2025.3
iResearch
Inc.算力規范部門印發《“數據要素×”三年行動計劃(2024—2026年)》央網信辦等三部門印發《信息化標準建設行動計劃(2024—2027年)》
2024年1月4日,十七
2024年5月29日,中
2024年9月9日,全國網絡安全標準化技術委員會發布《人工智能安全治理框架》1.0版。標準
2024年6月19日,四部
門聯合印發《國家人工智能產業綜合標準化體系建設指南(2024版)》技術2024年3月18日,市場監管總局等18部門聯合印發《貫徹實施〈國家標準化發展綱要〉行動計劃(2024—2025年)》中國人工智能產業經濟環境超預期因素反復沖擊,GDP增速放緩,CPI低位運行GDP(國內生產總值)是衡量一個國家或地區在特定時期內經濟活動總量的重要指標,它代表了該時期內生產的所有最終產品和服務的市場價值總和。2020年,受全球新冠疫情的沖擊,我國經濟活動的增長速度有所減緩,GDP增速降至2.2%。隨著疫情防控措施的有效實施和經濟政策的積極支持,經濟活動逐漸恢復,GDP增速有所提升,但整體水平仍低于疫情前的增長趨勢。CPI(居民消費價格指數)是反映居民消費商品和服務價格水平變動情況的重要指標。近年來,我國CPI指數呈現下降趨勢,顯示出一定的通縮壓力,表明經濟環境相對低迷。這一經濟形勢對中國人工智能產業的發展帶來了挑戰與機遇。一方面,經濟低迷導致投資減少、融資難度增加以及市場需求萎縮,對人工智能產業的增長產生了一定的負面影響。另一方面,人工智能技術在提升生產效率和創新業務模式方面的優勢,可以有效促進經濟增長和創造就業機會。在國家政策的大力支持引導下,人工智能產業的高質量發展,將進一步推動消費投資增長,助力中國經濟的持續回溫。2014-2024年中國居民消費價格指數變化來源:國家統計局。1.4%2.0%
2.0%1.6%2.1%2.9%2.5%0.9%2.0%0.2%0.2%2014年 2015年 2016年 2017年 2018年2019年 2020年 2021年 2022年 2023年 2024年643563688858746395832036919281986515101356711492377.3%6.9%6.7%6.8%
6.6%
6.0%
2.2%8.4%3.0%
5.2%
5.0%1204724
1294272
iResearch
Inc.中國人工智能產業資本環境語言及多模態賽道目前最受矚目,同時基礎層廠商積極入局從投資輪次的分布情況著眼,戰略及股權投資的數量及占比均呈現出顯著的上升態勢,其中股權投資事件占比高達77.9%。而在應用賽道的投資分布方面,語言及多模態賽道目前已成為最受矚目的投資領域。與此同時,以AI芯片、AI算力解決方案、算法架構等為代表的基礎層投融資數量顯著上升,其中AI芯片產品的投資占比約為50%,這表明應用層的快速發展正有力地帶動基礎層的建設,我國人工智能產業生態也因此得到進一步完善。2023-2024年中國人工智能產業投融資輪次數量及其分布情況221
20413163973961231114種子輪/天使輪pre
A-B+輪2023年融資事件數(個)C-G輪preIPO及IPO2024年融資事件數(個)戰略及股權投資2024年人工智能產業各應用賽道投資數量及其分布情況807640282011語言及多模態視覺模態基礎層機器人自動駕駛賽道智能硬件語音模態1932024年投融資事件數(個)51.3%48.7%AI芯片 其他AI芯片類投資在基礎層賽道中占比超50%來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.8我覺得AI時代還未到來其他事件,如AI換臉的詐騙事件自己親手用上了AI,…妙鴨相機發布GPT-4發布Stable
Diffusion、Midjourney…文生視頻Sora出現AlphaGo擊敗圍棋…ChatGPT發布2022年11月ChatGPT發布2016年3月AlphaGo擊敗圍棋世界冠軍李世石27.2%25.5%2024年2月2022年上半年文生視頻Sora出現Stable
Diffusion、Midjourney等文生圖產品發布2023年4月GPT-4發布2023年7月妙鴨相機發布自己親手用上了AI,生成了內容或者解決了問題其他事件,如AI換臉的詐騙事件我覺得AI時代還未到來11.2%11.1%9.7%3.5%3.1%0.8%7.9%中國人工智能產業社會環境(1/2)AI觀念逐漸“深入人心”,大模型熱潮極大助力中國人工智能市場教育在澎湃新聞·對齊Lab對普通人如何使用和看待AI的調查《2024年人工智能公眾態度調查報告》中,有27.2%的人認為2022年11月ChatGPT的發布是“AI到來的標志事件”。C端ChatGPT產品的出現讓公眾直觀感受到,AI可以理解復雜的語言指令并生成流暢自然文本的強大功能,極大突破了以往人們對AI通常進行簡單任務處理的認知。AI、AIGC、大模型快速成為近兩年科技產業發展的高頻關鍵詞,政府側、企業側紛紛加大對AI技術投資以釋放大模型生產力,消費者對生成式AI工具產品的興趣也在增加,其中,文本寫作類應用(豆包、
Kimi、文心一言等)、圖片生成類應用(文心一格、通義萬相等)是大家主要嘗試的兩大AI功能方向。中國民眾認為“AI到來的標志事件” 過去一年大家主要嘗試過的AI功能2.1%5.2%6.3%9.6%15.0%27.7%32.5%48.8%52.1%代碼編寫類汽車駕駛類視頻生成類個人助理類PPT制作類信息檢索類視頻處理類圖片生成類文本寫作類來源:《2024年人工智能公眾態度調查報告》,澎湃調研。艾瑞咨詢研究院研究繪制。?2025.3
iResearch
Inc.910來源:《2024年人工智能公眾態度調查報告》,澎湃調研。艾瑞咨詢研究院研究繪制。?2025.3
iResearch
Inc.
中國人工智能產業社會環境(2/2)同時,人們對于AI帶來的焦慮與不安情緒也在加重而在調研中,有超過半數的人認為“AI產品及服務讓我更加焦慮”。AI技術的發展應用進一步對社會中重復性、規律性強的工作崗位帶來威脅,相較于自動化浪潮對藍領的沖擊,一些初級專業人士和技術人員等職業,如工廠流水線工人、數據分析員、財務法律專員、客戶服務等職業可能會被數字員工、AI
Agent所取代。此外,人們對AI展示了“慌張”、“厭煩”等負面情緒,且對AI越了解的人,負面情緒占比越高。隨著AI進一步廣泛應用,相關安全隱私事件頻出,大模型能力可能會被惡意利用,用于制造虛假不雅信息、網絡攻擊、詐騙事件、恐怖活動等,從而對社會安全和穩定造成威脅。2022年-2023年全球對AI產品及服務的看法
不同AI了解程度的中國民眾對AI的情緒分布71.1%80.8%74.8%7.0%12.0%17.8%22.0%6.7%0.0%0.5%2.7%4.7%非常了解正面(驚喜、期待)負面(慌張、厭煩)比較了解有點了解中性(平靜、迷茫)無所謂64%52%50%39%67%54%52%52%我很了解AI是什么AI產品及服務的優點多于缺點我對使用AI產品服務的公司和對其他公司同樣相信AI產品及服務讓我更加焦慮2023年 2022年來源:《2024年人工智能公眾態度調查報告》,澎湃調研。艾瑞咨詢研究院研究繪制。?2025.3
iResearch
Inc.
AI產品及服務讓我更加焦慮AI產品及服務的優點多于缺點我對使用AI產品服務的公司和對其他公司同樣相信我很了解AI是什么中國人工智能產業技術環境(1/2)相較于大模型,小模型在一些領域會更具應用優勢:1)小模型成熟度高2)小模型使用成本低3)對小模型替代
成本高1980年,卷積神經網絡的雛形CNN誕生;1998年,現代卷積神經網絡的基本結構LeNet-5誕生。循環神經網絡(
RNN
)和長短時記憶網絡(LSTM)等結構的出現,使得CNN與RNN能夠相互融合,形成了更加復雜的模型結構。CNN適用于處理空間結構的數據,如圖像識別、目標檢測、圖像分割等。在這些場景中,CNN能夠有效地提取圖像的特征,從而實現更好的性能。而RNN適用于處理時序關系的數據,廣泛應用在自然語言處理、語音識別、機器翻譯等領域。在某些任務中,這兩者也可以結合使用,形成更復雜的神經網絡結構,目前CNN、RNN不斷演進成熟,以“小模型”架構被廣泛應用。2017年,Google顛覆性地提出了基于自注意力機制的神經網絡結構Transformer架構,奠定大模型預訓練算法架構的基礎;2018年,OpenAI發布了GPT-1大模型;Google發布BERT大模型;之后GPT模型持續演進,2022年11月,GPT3.5的ChatGPT面世,引爆互聯網,大模型時代隨之到來。2014年,GAN(對抗式生成網絡)誕生,深度學習進里程碑事件:2006年深度神經網絡引入;2012年AlexNetImageNet圖像識別大賽讓圖像領域飛躍式發展CNN與RNN架構GAN架構CNN與RNN為典型小模型架構,Transformer已奠定當今大模型架構基礎人工智能產業典型模型架構演進歷程Transformer架構GAN由兩個神經網絡,判別器與生成器組成,在生成圖像、聲音和文本等數據方面表入了生成模型研究的新階段。現優異,應用于樣本數據生成、圖像生成、圖像修復、圖像轉換、文本生成等方向。2015年,擴散概率模型的基本概念與整體框架被提出,2020-2021年,Diffusion
Model在圖像生成領域得到廣泛應用。Diffusion架構DiffusionModel是一種基于概率生成的深度學習模型,通過模擬數據從有序到無序再到有序的過程,實現從噪聲中生成高質量數據樣本,應用于圖像生成、圖像修復、圖像轉換、視頻生成等方向。大模型應用邏輯:1)替代邏輯-小模型既有場景,但大模型的效果更好2)可行邏輯-原本小模型在某些場景能力無法達到,大模型具備可行性3)創新邏輯-大模型發掘了客戶需求,在需求側未提出要求情況下創造新場景需求來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.112022年-2024年,在大語言模型之外,Transformer架構更多融入語音、視覺領域,發展端到端的語音大模型、以DiT、ViT為代表的視覺大模型。各家積極發展結合強化學習、思維鏈的“后訓練“,推出深度推理模型。在效率優化方面,稀疏注意力、線性注意力等相關機制可大幅降低內存和計算成本。正朝著處理更長序列、更大規模數據和實時應用場景的方向發展,新型高效注意力算法和硬件協同優化可能成為重要突破口。擴散模型在視覺效果和多樣性上表現優異,但計算成本較高;GAN可能存在訓練不穩定和模式崩潰的問題,但在一些任務中能實現較快的生成速度。已有研究在嘗試融合兩者的優點,以在生成效果和效率之間找到更好的平衡。中國人工智能產業技術環境(2/2)跨模態響應:將大語言模型、視覺理解模型及和視覺生成模型等能力實現高階融合以OpenAI為例,在GPT
4o模型中將視覺理解模型GPT4V、視覺生成模型Sora、聲音模型Whisper等模型模態融合,通過GPT4o模型在文本、語音、圖像等多維度實現高效交互,可理解視覺、聽覺和文本模態,并直接輸出音頻,支持靈活的雙工交互。未來在直接視頻分析及交互領域是跨模態、多模態領域新的突破方向。2024年OpenAI發布GPT
o系列,通過大規模強化學習算法讓模型在數據
高效訓練過程中學會更好應用內部思維鏈(CoT,ChainofThoughts),在解決復雜問題時表現更加出色,但彼時尚未公開技術細節。而2025年初,
DeepSeek開源R1系列推理思考模型,將思維鏈過程開放公開,極大推動全產業推理思考模型的技術進步,也讓人們對AI能力有了更深刻感知。系統一
直覺和本能系統二理性快思考:快速、自動、直覺性、無意識原本GPT系列思考形態更類似于系統一慢思考:緩慢、需要努力、邏輯性、有意識推理模型加強推理思考能力,思考形態往系統二傾斜95%來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.12Scaling
Law是否失效?思維鏈、強化學習、后訓練可提升模型訓練ROI自大模型發布以來,Scaling
Law成為模型層發展迭代共識,國內大模型基座廠商均通過不斷加大參數量級以獲得模型能力的優化增強。
2024年,隨著大模型的訓練腳步變緩,人們也開始關注討論ScalingLaw是否存在失效風險。而以國內外頭部廠商的技術動態為標桿,我們可以看到大模型的參數規模與數據跨度仍有提升空間,且在多模態能力融合上完成持續突破。但受限于高質量數據、訓練資源(算力、電力等)的可獲取性及模型資源投入的ROI評估,一些大模型廠商已減緩或停滯了對新一代超大模型的訓練投入,此外也在嘗試多途技術路徑提升大模型能力,如后訓練的思維鏈優化,將Scaling方法由預訓練轉移到了強化學習推理優化階段,為大模型能力擴展提供新道路,也對未來大模型的訓推參數部署、AI推理算力需求等潛在方案布局帶來新變數。AI技術動態ScalingLaw演進:Scaling未到盡頭,各家仍在積極探索,探索大模型能力邊界大模型Scaling
Law表示,增加計算量、模型參數量或數據大小都可能會提升模型性能,但是提升效果會隨著這些因素的增加而遞減。雖然
Scaling
Law原理給大模型能力演進限制了閾值空間,但仍有頭部廠商在加大模型參數、數據規模和算力資源的投入,延續大力出奇跡的大
模型訓練之路。2025年2月,OpenAI推出GPT4.5系列模型,進一步加大模型參數,主要通過無監督訓練提升了模型通用能力,在模型準確率及幻覺率方面達成顯著優化。但Altman同樣表示這將是最后一代“非思維鏈”模型,后面GPT
5將采取融合技術路徑,納入推理側思考。思維鏈CoT優化:強化學習完成推理側優化,在復雜計算、科學研究等方向持續加強5%13中國人工智能產業價值總覽——大模型對AI產業鏈帶來哪些影響?02中國人工智能產業圖譜上游中游人工智能基礎層算力基礎數據基礎算法基礎Infrastructurefor
AITechnology
forAI人工智能技術層機器學習計算機視覺智能語音知識圖譜自然語言處理智能云服務AI基礎數據服務數據集向量數據庫數據治理AI算法框架AI開放平臺人工智能大模型層與工具層通用基礎大模型智能服務器開源多模態大模型視覺大模型語音大模型Models
forAI垂直行業/領域大模型 大模型開放平臺智能體開發平臺工具層AI開源社區模型平臺/模型服務AI開發平臺按模型路徑閉源按模型模態大語言模型AI+工業2024年中國人工智能產業圖譜人工智能應用層
Application
for
AIAI+泛安防 AI+金融
AI+政務 AI+零售 AI+醫療AI+交通計算機視覺大數據智能營銷客服信貸風控視覺產品便民辦公政務大數據刑事偵查運營優化營銷客服視覺產品影像診斷大數據決策智慧病案與DRGs
AIDD視覺檢測+安全生產運維決策智慧管理自動駕駛公共開源企業私有高校政府AI模型架構CNN
RNNDiffusion
ModelTransformer……AI芯片智算中心企業自建智算中心
城市智算中心智算軟件平臺AIoTAI+傳媒影視AI+游戲AI+教育下游AI+效率工具AI+對話交互智能搜索問答情感陪伴企業服務圖像/視頻處理生成效率生產工具內容生成AI換臉換聲剪輯特效創意營銷內容生成、場景建模、策略生成、AI
Agent教育工具智慧校園產業級消費級AI+編程來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.141706213726976537473035221086325.2%26.2%30.6%34.3%32.3%864925.60%2022202320242025e2028e2029e市場規模(億元)2026e
2027e增速(%)中國人工智能產業規模2029年中國人工智能產業規模破萬億,未來五年復合增長率32.1%2024年,大模型驅動的人工智能市場增長低于預期,主要因為大模型在真實業務場景中的表現未能完全滿足部分客戶的需求,且建設成本較高,企業需在數據基礎、算力資源及組織機制等方面投入較多資源,導致多數項目處于嘗試探索階段,難以規模化落地;另一方面,模型計算成本下降疊加供應商間激烈競爭,模型調用的費用持續降低,進一步限制了市場增長。2025年初,DeepSeek刷新了市場對大模型現階段性能的認知,其開源策略結合高效、低成本的架構顯著加速了中國AI產業向更加高效、開放和自主的方向邁進。各地政府、央國企等機構積極投入,將大模型與自身職能及業務場景深度融合,為2025年中國AI市場的快速增長奠定了基礎。與此同時,大模型在推理、多模態等領域的性能持續增強,疊加MCP等智能體開發協議及工具的成熟,使得可自主完成復雜任務的智能體產品的實用性提升,夯實了AI市場增長的潛力;依托大模型的生成式AI產品也推動著傳統小模型的落地應用,基于大小模型協同,為客戶構建兼具效果與成本優勢的理想方案。總結以上分析,艾瑞測算2025至2029年中國AI產業將保持32.1%的年均復合增長率,在2029年突破1萬億的市場規模。2022-2029年中國人工智能產業規模CAGR=32.1%38.2%來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.15大模型對算力產業位置影響分析“堆算力”不是訓練側的唯一真理位,推理側算力需求將大幅上漲近年來中國持續投資智算產業資源,2024年,部分智算中心出現了閑置情況。AI算力是否投資過剩的問題被人們所關注與提出。艾瑞認為,2024年的部分算力閑置現象主要由于當地產業規劃錯配、供給側前置布局及需求側訓練需求有所緩解等原因導致,隨著模型技術迭代及推理應用爆發,長久來看高性能算力仍處于高需求狀態。智算中心建設需協調好地區產業資源規劃,從軟硬件角度優化算力利用率及平臺運行質效,穩健支撐上層AI產業發展。2025年初,隨著DeepSeek
V3及R1模型的開源及產品破圈,英偉達股價單日下跌幅達到近20%。在美國對中國實施芯片出口管制的背景下,DeepSeek模型通過算法優化,如結構化稀疏注意力、混合專家系統等技術,顯著降低了模型訓練成本,極大降低對進口高端GPU訓練卡的依賴程度,在一定程度上削弱了美國通過芯片出口管制遏制中國AI發展的國際戰略。中國基于算法優化與技術創新,進一步突破了模型層性能表現,極大增強了中國在人工智能產業的自主可控能力。而“服務器繁忙,請稍后再試”的AI回復,也象征著模型應用端的需求爆發。未來,如DeepSeek-R1等優質的開源模型及低調用成本將刺激推理算力需求的大幅增長,中國智算中心的利用率也將有望逐步提高。中國人工智能算力產業發展2023年-大模型訓練任務激增,算力出現短缺“百模大戰”,訓練算力需求激增美國商務部“出口管制條例”限制算力供應,出現囤卡搶卡現象來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.162024年-短缺問題緩解,甚至部分地區出現過剩情況多方產業提前布局算力儲備,部分 企業囤積的算力增多,模型訓練需 求放緩,出現結構性過剩情況2025年-優質開源模型帶動推理落地,算力需求再度攀升DeepSeek系列模型的發布加速了
AI滲透擴散,推動大模型普及與應 用落地,推理側算力需求大幅增張大模型帶動基礎層工具產品售賣分布式開發框架、LLMOps平臺、一體機等基礎層產品熱度漸起在當前人工智能領域,模型參數規模不斷擴張,大模型的分布式訓練因此變得愈發普遍。在此背景下,算法框架層面涌現出諸如DeepSpeed、Megatron、Colossal-AI等分布式AI開發框架。這些框架基于PyTorch框架生態,提供了深度學習優化庫,致力于提升大模型分布式訓練的訓練與推理效率,助力開發者更高質量、更高效地完成大模型的訓練及部署工作。從平臺的角度來看,在大模型時代,AI
開發平臺也在積極探索與升級。與傳統AI模型相比,大模型在開發、應用及部署上對算力支持、數據管理、功能模塊及工具庫等方面均提出更多要求,MLOps分化出LLMOps,出現面向大模型,提供整個模型生命周期中加速AI模型開發、部署和管理的專業平臺工具。為了順應市場熱點以及客戶需求,各大廠商紛紛推出了各自的一體機產品。一體機作為軟硬件集成的大模型實踐解決方案,具有顯著的優勢。它能夠降低企業應用大模型的技術門檻,加速大模型在各個行業的落地實施,同時為企業提供安全、高效的AI應用開發和部署能力。以
DeepSeek為代表的模型,具備開源部署、本地化應用(保障數據隱私)、低成本高質量以及快速定制化交付等優點,精準地滿足了政府、金融、醫療以及工業制造等B端行業的特定需求。預計2025年,DeepSeek適配一體機市場將進一步升溫,迎來新的市場熱潮。隨著大模型商業化進程的不斷加快,一體機、分布式AI開發框架以及LLMOps平臺等基礎層工具逐漸進入產業視野,成為支撐企業及開發者完成產業端大模型應用建設的重要力量。面向分布式訓練的AI框架大模型AI開發平臺集結硬件算力與軟件平臺的產品中國大模型產業鏈帶動工具來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.17大模型時代下,分布式訓練對面向大模型時代分布式訓推的軟件棧提出新型框架要求,由此誕生以DeepSpeed、
Megatron、Colossal-AI為代表的分布式
AI開發框架,提高大規模模型訓練的效率和可擴展性,并有效降低訓練成本。LLMOps是面向大模型,提供整個模型生命周期中加速AI模型開發、部署和管理的專業平臺工具。針對大模型的AI開發平臺可更好的助力企業、開發者完成大模型應用的開發、構建及部署。一方面搭載高性能硬件,提供可靈活配置的底層算力,一方面可提供大模型訓推平臺,或內置開箱即用的大模型場景應用。更多被工業、制造、醫藥等私有化部署要求高、低應用門檻的需求企業青睞,
DeepSeek等開源模型帶動一體機銷售。模型層開源創新推動上層商業化實踐降本增效推動大模型落地,選擇微調、蒸餾或RAG等路徑達到ROI最大化2024年,“后訓練”和“強化學習”成為大模型技術創新的熱點。后訓練通常由大模型廠商在預訓練模型基礎上完成,其流程一般包括:監督微調(SFT),即利用特定任務的標注數據對模型進行微調,使其學習任務模式;獎勵模型(RM)訓練,通過收集人類反饋數據訓練獎勵模型,評估輸出質量;以及強化學習(RL),利用獎勵模型反饋優化模型,最終生成更符合人類偏好的輸出等。由于代碼、數學等領域更適配模型評估與獎勵反饋環節,推理模型在這些領域的深度思考能力更強,而在文學、醫藥、科研等領域,因存在大量實驗數據和非唯一最優解等影響,后訓練的效果提升相對有限。從落地質效來看,DeepSeek通過創新的模型結構和訓練任務優化,如多令牌預測(MTP)、多頭潛在注意力機制(MLA)、GRPO(分組相對策略優化)等,在保持高性能的同時,大幅降低了訓練和推理成本。這些低成本、高性能的開源模型(如DeepSeek、阿里QwQ系列)極大推動了大模型的商業化實踐,吸引更多需求方擁抱大模型能力底座,并進一步采用微調、蒸餾、RAG工程等方式完成定向優化和應用部署。預訓練大模型能力落地實踐路徑后訓練/增量預訓練數據處理
微調模型部署蒸餾RAG在預訓練大模型基礎上有后訓練或者微調/精調的進一步需求,則需要更多數據(公開數據集、企業內部數據等)來進行模型調整。數據集的結構、質量對模型訓練結果影響至關重要。數據獲取數據清洗數據預處理在預訓練大模型基礎上可進行后訓練或增量預訓練,針對性提升模型基礎能力。如GPT
o系列、DeepSeek
R1等都是以基模為基礎進行后訓練得到。增量預訓練注入領域知識,優化特定任務或領域后訓練監督微調SFT、強化學習RL、RLHF、偏好優化對齊等基于預訓練模型,通
過少量特定數據集對模型進行進一步訓練。參數全面微調針對所有層的所有參數進行微調參數高效微調針對部分層的參數進行微調LoRA、QLoRA...Adapter
Tuning...Prompt
Tuning大模型
“老師”小模型
“學生”訓練教學讓訓練好的優質大模型來訓練教學更適合應用的小模型,讓小模型以較少的計算資源貼近大模型性能,完成模型壓縮瘦身,服務落地應用。RAG(Retrieval-Augmented
Generation,RAG):檢索增強生成,提供外部知識庫,將外部知識庫中的相關信息檢索并結合大模型的生成能力,提升回復的準確性與豐富度。向量數據庫知識圖譜以RAG知識庫形式補充大模型能力訓練好的模型云平臺部署本地私有化部署考慮數據隱私、存儲空間、計算資源等因素大模型實踐應用在這以前為模型訓練成本之后調用模型能力調用為模型推理成本“小參數,適用邊緣、端側設備”來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.18“訓練成本低,但性能相對有限”“外掛知識庫,適用專業領域內容”客服營銷知識庫等問答任務“定制化調整,服務特定行業或專業任務”“訓練成本跨度大,對資源有要求”應用廠商側“跑馬圈地”態勢漸起價格
產品價格與流量成為應用層核心競爭策略,大模型實踐更加定制化及產品化2024年,大模型能力變現及商業化進程進入關鍵期,應用層的產品表現成為兵家必爭之地。在成本優化與市占競爭的雙重驅力下,國內各家大模型廠商紛紛降價,試圖通過價格戰構建B端競爭策略。2024年5月15日,字節跳動將其大模型的計價單位從分降至厘,聲稱價格比同行低99%。5月21日,阿里云宣布通義千問最高降價97%,百度宣布兩款主力大模型免費。在C端,大模型產品也出現大量買量投流的資金競爭策略。根據有關媒體公開信息報道,截至10月29日,kimi智能助手、字節跳動豆包、騰訊元寶等所有AI應用10月全網廣告投放(投流)支出超過3億元人民幣。由此可見,無論是B端還是C端,大模型廠商“跑馬圈地”態勢均漸起。從實踐落地角度看,大模型落地應用更加定制化及產品化,尤其面向ToB客戶,更加開放底層模型能力與定制化程度,為客戶提供Post-pretrain、SFT精調、RLHF等成熟豐富的微調方案,將大模型解決方案深度嵌入企業需求與業務流程。中國應用層廠商市場策略低價策略/內外動機 定制化/產品化定制化:低價動機–內部:AI芯片技術突破,單位算力對應的成本在下降MoE架構節約推理成本,大模型的量化壓縮技術越來越先進面對落地實踐需求,尤其是To
B產業端需要模型
能力與業務需求的深層適配,大模型往往會通過微調、定制化策略提供產品服務,國內各家大模型廠商的平臺方案支持多類微調方案,Open
AI也于8月份開通了最強大模型GPT
4o的微調功能。產品化:平臺/Agent/APP低價動機–外部:基于低價策略吸引更多B端與C端客源,盡可能在早期占據市場份額,以此獲得業務正循環,在市占基礎上拓展更多業務線及利潤點。在吸引客源基礎上,培育更良性的開發者生態,并在產品側獲得更多相關用戶數據,如用戶偏好、行為趨勢等,更好優化模型技術與應用產品。大模型能力成熟商業化步伐加快廠商嘗試跑馬圈地大模型落地產生高頻客制化需求大模型訓練/推理成本降低Post-pretrainSFT精調RLHFPrompt
(Zero-shot/Few-shot)LoRA來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.19AI辦公平臺AI編程助手AI智能對話AI法律助手AI
Agent助理AI數字人B端大模型商業化進程以央國企為需求主力,率先落地在政務、教科、通信、能源等領域預訓練大模型、類Sora模型以及類o1模型的研發訓練需要大量的資源投入,大模型廠商面臨資源投入與營收壓力需探索有效的變現途徑。從短期來看,B端項目制落地仍然是大模型基座能力變現的主要方式。2024年8月,月之暗面發布企業級API加碼B端,11月,零一萬物推出面向零售、餐飲行業的數字人解決方案。招投標數據顯示,2024年中國大模型項目數量與金額呈現快速增長趨勢,率先落地在政務、教科、通信與能源等領域。在供給側,科大訊飛、百度、智譜、火山引擎、阿里云和騰訊云等成為主力中標廠商。2025年初,DeepSeekV3與R1的開源模型發布,進一步掀起B端產業生態的合作浪潮,以沐曦、天數智芯為代表的基礎層、以阿里云、華為云為代表的模型平臺層、以釘釘、吉利汽車為代表的應用層,紛紛接入DeepSeek生態,借助優質開源模型能力,推動大模型能力在垂直領域的實踐落地。101329476376110125180195299373282351622098352811853414011208294406054199767391061622509941月 2月 3月 4月 5月 6月 7月 8月 9月
10月
11月
12月大模型中標項目數量(個) 大模型中標項目金額(萬元)2024年1-12月中國大模型中標項目26.0%25.0%11.0%9.0%2024年中國大模型中標項目數量行業分布17.0%11.0%通信
教科
政務
能源
金融
其他2024年中國大模型中標項目金額行業分布34.6%15.9%23.5%3.7%11.0%11.1%政務
教科
能源
通信
金融
其他來源:智能超參數,艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.20C端AI產品生態位分析AI階段性產品壁壘仍然非常低,終極產品形態及生態優勢尚未形成2024年,中國AI產品在C端發展迅速,產品類型涵蓋內容創作、智能對話、情感陪伴、效率工具及音視頻生成等,應用場景廣泛。從商業模式來看,中國AI產品在C端產品主要采取“免費+訂閱制”的商業模式,視覺模態類產品的商業步伐會稍快于語言類產品,如剪映、美圖等產品的會員制AI功能,或無界AI、觸手AI等產品的會員制訂閱及資源購買。整體來看,大多數C端AI產品仍然面臨用戶黏性不足,收費持續性不足的問題,產品形態尚未穩定,生態壁壘尚未建立。相較于互聯網較為穩定的生態格局,AI產品的頭號位交椅仍是懸念。近十年中國AI發展階段及關鍵性節點AI認知與應用度時間軸2012年,深度學習AlexNet在ImageNet競賽中奪冠,標志AI進一步深度學習新階段2016~2017年,側重感知智能的圖像技術廣泛應用,以人臉識別代表,誕生商湯、云從等CV廠商2017年,谷歌團隊提出Transformer架構,以Bert模型為代表,推動NLP技術發展,也為Decoder-only的生成式技術打下基礎2022年底,基于GPT3.5的ChatGPT生成式AI產品引爆業界,顛覆眾多人們對AI能力認知,以大模型基座推動AI泛化、低門檻實踐落地,誕生Minimax、月之暗面、DeepSeek等大模型創企2024年2月,OpenAI發布Sora模型,為視頻生成模型、世界空間模型打下標桿產品案例2024年9月,OpenAI發布o系列模型,提出CoT思維鏈優化的強化推理路徑2024年12月,DeepSeek發布開源版V3模型,2025年2月發布開源推理R1模型,以完全開源、低成本、高效果的技術架構推動AI平民化C端AI產品現況發展以CNN、RNN架構為基礎的計算機視覺、智能語音、NLP、機器學習、知識圖譜等技術應用發展以Transformer、DiffusionModel為底座的生成式大模型或判別式CV大模型,加大模型參數,探索能力邊界,并將其產品商業化發展以類Sora的視頻生成/空間模型、類GPT
o系列的推理優化模型、多模態大模型,在Scaling
Law基礎外,探索新的技術路徑優化大模型底座能力、訓推成本及應用效果AI產品在C端首次破圈,以程序員、文字工 作者、設計師為代表的用戶率先廣泛日常應 用AIGC產品2025年初,借助DeepSeek的C端產品上線與開源模型發布,AI產品在C端再度破圈, 將其影響力擴展到更泛職業、泛年齡層的C端用戶群,并推動B端對開源生態的接入,
進一步從B端切入推動在C端的產品應用與市場教育產品邏輯:1)AI功能+產品融合:如抖音(AI生成)、美圖(AI渲染)等
2)獨立AI產品:如豆包、kimi、秘塔搜索、星野等3)AI
Agent或AI助理定位與大廠生態位應用交集高,AI產品頭號位交椅仍是懸念AI產品的渠道與流量池仍與互聯網產品高
度交集,互聯網大廠有強生態優勢,而從kimi→豆包→DeepSeek的熱度轉變可知,目前AI產品仍處于階段性發展,用戶粘性與產品壁壘尚未培養C端用戶主要通過B端產業 滲透感知AI產品,如人臉 識別、人臉閘機等來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.21深層產品洞察:AI
Coding強化推理提升可靠coding能力,coding
for
everyone將改變什么?AI
Coding產品是指利用人工智能和機器學習技術,通過理解人類語言描述來自動生成代碼的工具,具備提升編碼效率、減少人為錯誤及簡化開發流程等產品優勢。2024年6月20日,Anthropic公司發布Claude-3.5-Sonnet模型,該模型在編程能力上取得重大突破,顯著推動了業界Cursor、Devin、Windsurf等標桿產品的破圈應用。AI
Coding產品的發展可極大地提升專業開發者的編程效率,使其能夠將重復性工作交給AI處理,把更多精力投入到創造性工作中。此外,隨著Sonnet、GPTo系列等模型能力的不斷提升,AICoding產品的屬性正逐步從輔助性Copilot向自主性Agent演進。這種演進不僅有望進一步降低編程的門檻,使更多泛開發者、非專業人士能夠進入編程行業,推動編程的民主化,為后續的軟件開發、產品交互及流量生態帶來新的發展可能性。AI
Coding產品方向分析AI
Coding產品AI
Coding
for
developersAI
Coding
for
everyone技術要求:需要開發者具備一定的編程基礎和技術背景,能夠理解生成的代碼邏輯,并對代碼進行修改和優化。技術要求:用戶無需具備專業的編程知識,只需具備基本的計算機操作能力和邏輯思維能力代碼審查代碼補全調試優化代碼生成早期Copilot以代碼補全功能為主……思維鏈推理優化Claude
Sonnet
3.5等模型加持Cursor、Devin、Windsurf、Bolt:對話式編程,側重代碼理解、生成、重構圖形化界面拖拽組件自然語言描述……低代碼工具受限于低代碼工具技術路線,目前尚未實現從需求到軟件開發應用的端到端實現思維鏈推理優化Claude
Sonnet
3.5等模型加持新一代開發工具從自然指令需求到軟件開發交付的端到端實現,更多非專業開發者參與到軟件開發中,產品生態變得更加多元化且個性化可參考視頻剪輯工具演進路線由專業性要求高的PS剪輯軟件拖拽界面、用戶友好的剪輯軟件剪輯軟件的門檻降低催生大批自媒體工作者,對視頻軟件生態、用戶流量分布帶來重構式影響產品技術方向上下文能力提升復雜代碼邏輯、端到端交付能力,0-1門檻跨越產品形態探索,基于
Coding以上的PMF來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.22深層產品洞察:AI
Agent原生Agent應用廠商以終端用戶需求為導向,打造場景化智能服務C端產品側重交互體驗B端產品強調任務閉環B端與C端廠商生態分化邏輯:核心能力與市場需求的雙向適配互聯網科技大廠
B端與C端依托底層算力資源與大模型能力,構建"基礎設施+平臺框架+應用生態"體系提供一站式大模型開發平臺推出通用型Agent工具鏈成熟產品集成Agent能力垂直領域科技廠商
B端深耕行業know-how,推動Agent技術場景化落地聚焦特定領域結合原有產品進行智能升級構建領域專屬工具鏈Agent開發平臺廠商
B端專注Agent技術棧創新,提供跨行業解決方案提供低代碼Agent構建平臺支持多模型適配
?
提供全生命周期開發管理
彌合大模型能力與場景應用的鴻溝,多元化廠商生態驅動產品應用創新AIAgent是一種能夠自主感知環境、作出決策并執行行動的智能體產品。受益于強化學習、后訓練等技術突破,大模型已展現出優秀的邏輯推理及規劃能力,然而,其與應用需求側之間仍存在一定“Gap”。Agent作為“橋梁”角色,可支撐大模型落地到各類具體應用之中,補足其精準對接業務需求、上下文記憶、主動規劃執行以及多任務協作等多方面能力。當前,Agent市場呈現出廠商生態分化的態勢。互聯網科技巨頭與垂直領域科技廠商常借助Agent能力賦能原有產品,提升其使用體驗與智能化水平。同時,各類廠商依據自身優勢,針對特定客戶群體,推出不同模式的Agent產品,如一站式Agent服務、Agent搭建平臺及Agent應用:2024年10月,智譜華章推出自主智能體AutoGLM,覆蓋手機、瀏覽器、電腦等不同場景,可理解超長指令,執行超長任務;2025年3月,蝴蝶效應推出通用型AI助手Manus,可實現企業研究、旅行規劃、課程設計等多場景的任務規劃與流程操作。中國AI
Agent廠商生態分化現狀與當下發展困境當下AI
Agent發展困境側重垂直領域優化,但仍囿于對話式溝通, 與對話式AI產品邏輯類似,Agent的強勢
能力尚未凸顯來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.23產品同質化嚴重,主動性、記憶能力、執 行感知能力有待提升智能體與生產生活聯系緊密度低,多智能 體協作生態尚未培育深層產品洞察:AI硬件AI工具終端:AI手機、AI電腦、……AI教育陪伴:AI學習機、AI玩具、……AI可穿戴:AI耳機、AI眼鏡、AI指環、AI
Pin……AI能力輸入到終端硬件,端側AI尋求規模效應突破,承載更多流量入口2024年,AI成為手機與電腦的主力賣點,如華為、榮耀、小米、VIVO、OPPO等國產手機紛紛打造手機端側大模型,在AI消除、AI搜索對話、生活助手等功能已提供較好用戶落地體驗,10月,榮耀Magic7系列攜帶全新的YOYO智能體發布,可在手機側實現一句話點咖啡、一句話取消訂閱等功能。字節跳動豆包也在10月推出首款AI智能體耳機OlaFriend,接入豆包大模型進軍AI硬件。以科大訊飛為代表的AI學習機產品在大模型技術加持下不斷更新迭代,在教育產品內預裝大模型能力,精準提升教學能力同時配備AI助手提升引導交互能力。除現有硬件對AI能力的融合,也有大廠及創業廠商探索形態交互更加新穎的新一代硬件設備,如RabbitR1、AIPin等新產品,但由于技術不成熟、場景未規模化滲透等原因,尚未出現破圈效應。中國AI+硬件市場洞察強功能性角色,也是AI能力注入終端的率先變革力。2024年,手機、電腦等終端廠商已紛紛發力,基于端側大模型讓AI能力與其更好融合,從軟硬生態交互角度完成更好人機協同,也借此獲取更多市占及增長驅力。存在新一代可能性,借助AI功能,出現全新端側個人設備,或承接現有端側設備功能,或打開用AI硬件新入口:戶新需求新場景,讓AI硬件發展更具可能性與想象力。語音能力為教育陪伴類產品提供更好交互入口,而生成式AI帶來更多語義能力增強,各種教育陪伴類硬件的語音助手升級為智慧助手,基于語音交互的教育、陪伴及親子類內容同樣得以優化,帶來產品升級及創業機會。結合生成式AI、大模型技術與可穿戴設備,完成用戶數據的實時收集與個性化服務,基于端側硬件性能,更多通過云端形式實現,與其他端側設備達成協同優化。來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.2425中國人工智能產業商業進程——大小模型技術演進下,AI產品表現如何?0326?2025.3
iResearch
Inc.?2025.3
iResearch
Inc.來源:烯牛數據。艾瑞咨詢研究院研究繪制。來源:烯牛數據。艾瑞咨詢研究院研究繪制。語音模態產品形態以AI語音解決方案和AI生成為主,前者應用廣泛,后者聚焦文娛在2024年語音模態賽道的投融資中,超過70%為戰略及股權投資。該賽道的產品形態主要分為兩大類:AI語音解決方案和AI生成。其中,
AI語音解決方案的應用范圍極為廣泛,涵蓋了物聯網、工業、政務、教育等多個領域;而AI生成類產品則相對集中于文娛消費領域,如AI音樂生成。2024年語音模態賽道產品形態占比分布2024年語音模態賽道投融資輪次占比分布9.1%9.1%9.1%72.7%種子輪/天使輪preIPO及IPOpre
A-B+輪戰略及股權投資54.5%27.3%18.2%AI語音解決方案AI生成其他應用領域分布廣泛,包含但不限于物聯網、工業、政務、教育等應用領域以文娛消費為主應用領域以工業為主語音模態語音識別與生成能力持續增強,重點關注端到端的語音大模型技術架構在語音識別能力方面,ASR模型數據量和參數量逐步增大,且大模型可為ASR提供上下文內容理解,在識別率、說話人分離、多方言覆蓋等方面繼續進行有效提升;在語音合成能力上,基于AI語音設計、AI音樂創作等技術方向,音頻能力正由被動生成發展到主動創作;在語音交互能力上,更多廠商在語音大模型架構中,可由ASR-LLM-TTS的級聯式架構升級為端到端的語音交互大模型,顯著提升人機語音交互的響應速度、流暢度、打斷性等。2024年5月,OpenAI發布端到端語音架構的GPT4o系列,在語音交互能力表現優異,8月,科大訊飛更新星火語音大模型,采用端到端語音架構,在響應速度上有了顯著提升,使得對話更加自然流暢。而與大小模型應用融合邏輯類似,目前兩類語音交互模型架構仍各有優勢,級聯式架構具備可控性與準確性等優點,端到端語音大模型雖然提升交互效果,但會帶來幻覺問題,因此落地實踐上仍需根據應用場景選擇合適的語音模型架構。AI語音演進方向語音交互能力1AI語音克隆&聲音設計/轉換2AI音頻/音樂創作3語音識別(ASR))大語言模型(LLM)語音合成(TTS)第一代語音大模型:級聯式架構語音合成器碼為離散的token
自回歸建模將連續的音頻信號編對token展開將生成的token合成為語音波形由文本生成聲音
AI聲音克隆:音色復制AI聲音設計/轉換:在語言/聲音基礎上根據參數設置、Prompt生成對應音色海外代表廠商–ElevenLabs:AI音頻模型公司,2022
年成立,目前可以生成32種語言的逼真、多功能且具有上下文感知能力的語音、聲音和音效,2024年10月,ElevenLabs發布全新AI語音生成工具VoiceDesign,通過簡單的文本描述即可創建個性化語音。ElevenLabs在X
to
voice等項目部分開源。市面在AI聲音克隆、AI音色生成上已有眾多優質開源項目,如ChatTTS、CloneVoice、GPT-SoVITS、Seed-TTS等該類TTS技術成熟度相對較高,已在國內電商領域(視頻制作)、泛娛樂消費領域(有聲書、AI配音、歌手音色克隆)等應用端得到小規模傳播應用。文本歌詞旋律音效音頻音樂
歌曲添加創作性與旋律感來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.27海外代表廠商Suno
AI:AI音樂創作公司,2022年成立,基于Chirp模型為用戶生成逼真的音樂和聲音效果,目前模型已更新到V4版本,2024年,Stability
AI在音樂生成領域繼續開源StableAudio2.0和Open等系列,可生成音頻樣本、音效、制作素材和歌曲等。2024年11月,NVIDIA推出全新生成AI音頻模型
Fugatto
,能夠結合文本和音頻輸入,生成多種類型的音樂、聲音及語音。模型優勢:高準確性與可控性模型劣勢:高延遲第二代語音大模型:端到端的語音交互模型語音分詞器
大語言模型模型優勢:低延遲、泛化能力模型劣勢:可控性與準確性,若與RAG結合則對低延遲優勢有損耗語音模態語音生成類產品涌現更多創新機會,以海外創企為代表進行市場試水傳統市面AI語音產品可分為兩類,在過往AI產業浪潮中走在產品化與商業化前列,一類是AI語音轉寫產品,應用在辦公、翻譯等領域,一類是AI語音交互產品,以語音機器人為代表,應用在辦公、客服、營銷等領域。而近兩年,以Elevenlabs、Suno
AI等為代表的語音生成廠商在TTS技術、擴散模型的創新融合,讓2024年海內外生成式語音產品市場出現變革性進步,AI語音產品在原本語音生成的功能屬性上,在音色度、內容性、創作性上添加更多生成式的變量元素,AI配音、AI音色克隆、AI有聲書閱讀、AI音樂生成等產品商業化步伐提速明顯。2024年AI語音典型產品盤點12346AI語音轉寫產品基于語音ASR
(
Automatic
SpeechRecognition)能力提供轉寫、翻譯、總
結、提煉等功能,相較于AI語音交互產品,該類助手及平臺產品更強調對語音進行轉化分析的工具屬性。訊飛聽見:提供音視頻、錄音等轉寫服務。通義聽悟:記錄、轉寫及分析音視頻內容。AI語音交互產品在對話式AI產品中,在人機對話系統中提供語音功能,完成語音式對話交互,常應用于問答、客服、營銷、教育等場景RealtimeAPI:OpenAI的語音交互調 用服務。豆包:字節的AI對話APP。智能語音/對話機器人:百度、阿里、 科大訊飛、百融云創等B端產品。AI語音社交陪伴產品以語音為核心,提供社交陪伴。1)以語音為輸入輸出形式的內容社交平臺;2)以語音為核心交互的陪伴產品Airchat:美國創企,以語音為主要內容 形態進行異步社交。AI陪伴類產品:在虛擬角色中添加個性化音色的語音交互,提升情緒價值,如星野、WoW、貓箱等APPAI語音內容生成產品基于TTS(Text-to-Speech)技術將文本轉換為自然逼真的語音。1)著重語音生成的AI語
音產品,如音色克隆、音色設計生成,主要應用在AI配音、短視頻配音、數字人配音、有聲書閱讀等領域;2)著重內容+語音生成的AI語音產品:對文本、音視頻等信息按需提煉,以語音形式產出,目前在播客、新聞等領域有所嘗試Elevenlabs:美國創企,提供基于多語言 的多類型聲音、風格的語音生成產品。魔音工坊:出門問問旗下產品,提供文字 轉語音的生成產品。剪映:字節跳動的視頻剪輯平臺,提供語 音生成功能模塊。NotebookLM:谷歌推出的AI學習產品, 將上傳的文本、PDF及音頻等各種格式的文 檔轉化為生動的音頻播客。PocketPod:根據客戶需求生成音頻內容,幫助用戶獲取新聞、信息等播客內容。Playnote:美國創企PlayAI的新品,將PDF、文本或視頻轉換為故事、播客或簡報AI音樂生成產品根據用戶的文本提示、旋律提示或音樂元素,快速生成原創或相似風格的音樂作品。Suno
AI:美國創企,AI音樂生成軟件海綿音樂:字節跳動推出的AI音樂創作 工具,Seed-musix是字節推出的音樂生 成大模型SkyMusic:昆侖萬維推出的音樂生成平 臺產品大模型提升語音產品效果;主流市場已被語音技術老牌廠商、國內大廠占據;社交陪伴類有創業機會來源:艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.28在定制化音頻內容生成、音樂生成有產品創新機遇;相較于AI語音轉寫、AI語音交互有更多創業機會視覺模態集中于機器視覺與生成類賽道,前者商業化更成熟,后者多為新興企業2024年視覺模態賽道的投融資中,超半數為C輪以前的前期融資,投融資方向主要集中于以判別為核心的機器視覺賽道和以生成為核心的AI圖像/視頻/3D影像生成賽道兩大方向。從企業成立年限來看,以生成為核心的AI圖像/視頻/3D影像生成類企業中,70%的玩家成立于2023年及以后,多數是受AIGC浪潮影響之下成立的新興企業,說明生成類企業正在成為視覺模態賽道中冉冉升起的投融資新星。但從投融資輪次來看,僅有的2例較為成熟輪次的投融資事件(1例新三板上市,1例D+輪次融資)均發生在以判別為核心的機器視覺賽道中,說明盡管生成類企業勢頭迅猛,但資本市場目前仍對機器視覺賽道的商業化成熟度抱有更高預期。62.5%37.5%以判別為核心的機器視覺賽道以生成為核心的AI圖像/視頻/3D影像生成賽道16%26%54%2%preA-B+輪preIPO及IPO2%種子輪/天使輪C-G輪戰略及股權投資74%18%8%2022及以前成立 2023成立 2024成立33%43%23%pre
A-B+輪種子輪/天使輪戰略及股權投資30%60%2022及以前成立 2023成立 2024成立2024年機器視覺賽道投資輪次與企業成立年限占比分布來源:烯牛數據。艾瑞咨詢研究院自主研究繪制。?2025.3
iResearch
Inc.292024年生成類賽道投資輪次與企業成立年限占比分布10%2024年視覺模態賽道投融資產品應用方向占比分布視覺模態Transformer架構為技術主旋律,持續演進ViT與DiT兩類技術路線Transformer架構最早在2017年由Google研究團隊Vaswani等人提出,而后在語言領域取得了革命性突破。借鑒語言領域的成功經驗,
Transformer架構同樣可將圖像分割為多個小塊(patch),應用自注意力機制,從而大幅提升視覺CV大模型的泛化能力、理解能力及處理模糊復雜影像能力。而在生成領域,融入Transformer架構的DiT模型為擴散模型帶來新思路,相較于U-Net傳統卷積神經網絡,DiT架構模型能夠更好地處理圖像的潛在表示,并捕捉圖像的長距離依賴關系,以生成高質量的圖像。2024年初,在Sora產品驗證DiT路線的涌現能力之后,主流SD模型、Flux模型及國內視頻生成模型多延續此技術架構,并在生成模型的真實性、可控性、可編輯性上持續發力,更大程度釋放模型鏈接需求的技術生產力。AI視覺演進方向CV領域:圖像分類、目標檢測等 圖像/視頻生成領域小模型以CNN為代表大模型以ViT為代表(Vision
Transformer)人臉識別、車輛識別違停違放等行為檢測抽煙檢測、安全帽檢測明廚亮灶檢測等泛化能力增強,可處理更多圖像類目,且標注工作變少可識別分析圖像質量不高、像素較少的影像,可處理復雜影像,具備進一步推理分析能力如意圖識別、微表情識別、人員追蹤、流量統計分析等政策、技術升級驅動商業驅動:前端攝像頭路數及圖像
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 陽光家園委托協議書
- 車輛保單轉讓協議書
- 酒廠股份合作協議書
- 高層年度分紅協議書
- 雪糕生意轉讓協議書
- 餐飲機器轉讓協議書
- 通訊施工安全協議書
- 車輛有償借用協議書
- 設備制造技術協議書
- 酒店預訂年會協議書
- 幼兒園各類檔案借閱登記表
- SCL-90量表詳細
- 蒸汽疏水閥性能監測斯派莎克工程中國有限公司-Armstrong
- 機械創新設計技術結課論文
- 公路工程項目環境保護措施及其可行性論證
- 普通車床的主軸箱設計機械外文文獻翻譯、中英文翻譯、外文翻譯
- 神經外科各種引流管的護理精品課件
- 湘教版初中地理會考重點圖復習匯集
- 隧道CRD法施工工法
- 年產10萬噸飛灰水洗資源綜合利用項目可行性研究報告模板
- 八年級音樂下冊 第7單元《當兵的人》好男兒就是要當兵課件1 湘教版
評論
0/150
提交評論