互聯網行業人工智能應用專題分析報告:國內AI大模型趨勢互聯網大廠AI進程_第1頁
互聯網行業人工智能應用專題分析報告:國內AI大模型趨勢互聯網大廠AI進程_第2頁
互聯網行業人工智能應用專題分析報告:國內AI大模型趨勢互聯網大廠AI進程_第3頁
互聯網行業人工智能應用專題分析報告:國內AI大模型趨勢互聯網大廠AI進程_第4頁
互聯網行業人工智能應用專題分析報告:國內AI大模型趨勢互聯網大廠AI進程_第5頁
已閱讀5頁,還剩44頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

證券研究報告|2024年01月02日人工智能應用專題(4):國內AI大模型趨勢探討,互聯網大廠AI進程梳理行業研究

·

行業專題摘要?

大模型技術本質上

于科研創新與技術積累,我國大模型廠商根據自身特點演繹出不同的發展方向。大模型誕生與技術的積累與不斷創新,伴隨海外技術進步與大模型開源,我國大模型企業也在不斷追趕,包括根據其技術路徑自研或在其開源框架上優化調整。?

有效數據集有限,優質數據集仍舊稀缺,關注具備高質量內容的平臺。大模型的未來發展依賴于訓練數據集的質量,而非僅僅是數量。AI技術把原先難以利用的非結構數據帶入分析領域,內容創作者所聚集的平臺成為高質量數據的重要

。?

大模型后續競爭格局B端與C端分化:C端更易于產生通用底座以及大一統的入口,通過豐富的插件、定制化功能、AIAgent滿足用戶的高度定制化和長尾需求。B端定制化模型或垂類模型性價比更高,不同B端行業可能用各自模型來滿足企業場景、業務流程、模型大小和性能的差異化需求。?

AIAgent框架帶來全鏈路、定制化的信息處理能力,成為生產環節的重要輔助,助力智能硬件“All

inOne”搶占終端流量入口。AIAgent需要標準定義和模型能力進化,同時GenerativeUI可能帶來人機交互方式的革新。?

月之暗面、清華GLM、百川智能:作為獨立的第三方模型廠商,創始人技術背景強,模型迭代速度快,產品布局AIGC等各個領域。?

互聯網大廠騰訊、字節、百度、阿里:結合自身業務場景進行模型和AI應用的開發,同時布局算力、平臺、大模型與應用全環節,關注AI生態建設。?

投資建議:國內模型能力有望快速提升,帶動應用百花齊放。建議積極布局大模型相關廠商和產業鏈機會。?

風險提示:宏觀經濟波動風險,下游需求不及預期風險,AI倫理風險,核心技術水平升級不及預期的風險等。2目錄大模型的競爭格局演繹的關鍵因素獨立的模型團隊—月之暗面、清華GLM、百川智能互聯網大廠的模型和應用進展—騰訊、字節、百度、阿里風險提示010203043大模型技術本質上

于科研創新與技術積累?

海外大廠核心大模型的能力遷移是國內AI發展的重要考量??疾焓欠裼泻M獯髲S核心大模型研發的技術積累和知識遷移到國內,以及這些技術在本土的應用情況和調整,對理解國內外AI技術的差異和互動具有重要意義。?

國內企業大模型技術路線有兩類:①自研效果復現類:參考GPT論文自研復現效果,前期耗時、后續Finetuning對于數據數量質量也有一定要求,能力天花板高;②基于開源迭代類:訓練更順暢但天花板低,依賴開源社區,且開源模型如Llama2比較GPT3.5還是有差距。?

國內企業大模型團隊發展路徑有兩類:①從搜廣推背景轉向大模型研發,如百度和百川;②成立之初主要基于大模型研究路線和學術背景,如月之暗面的楊植麟團隊和清華的智譜團隊。圖1:不同公司/組織/院校近三年top-100AI發文數圖2:海外SuperGlue模型榜單排名(截至2023年12月)??資料

:SergiCastella

i

Sapé,《Mustread:the100mostcitedAIpapersin2022》,ZetaAlpha,2023年3月2日,國信證券經濟研究所整理資料

:SuperGlue,參考文獻:Z

Du、Y

Qian等,《GLM:GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling

》,ComputationandLanguage(cs.CL),2022,arXiv:2103.10360,國信證券經濟研究所整理4基于開源大模型框架進行優化調整、應用創新較易落地?

OpenAI的核心能力主要體現在三個方面:1)數據收集和處理的能力,包括數據

,清洗方式,數據結構等;2)模型結構,包括注意力、隱藏層等設計;3)訓練方法,包括各類超參數,學習率等。海外大模型開源后,我國大模型企業可在其框架上進行優化調整,以百川智能為例:?

基于開源模型提升性能:據GitHub,百川智能通過對LLaMA框架進行修改以提升訓練時的吞吐。此外,在LLaMA較為薄弱的中文語料方面,百川智能采用2000萬條以中英為主的多語言語料訓練分詞模型,顯著提高中文的壓縮率。?

大模型+搜索增強解決方案服務B端場景:百川智能通過借助搜索增強,解決大模型在幻覺和時效性問題,提升了模型的可用性,并拓展了應用領域,如金融、政務、司法、教育等行業的智能客服、知識問答、合規風控、營銷顧問等。圖3:Baichuan-7B對LLaMA框架進行優化后的性能提升圖4:在LLaMA上進行的研究工作的演化圖?資料

:GitHubBaiChuan主頁,國信證券經濟研究所整理資料

:WayneXinZhao、Kun

Zhou等,

《A

SurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經濟研究所整理5高質量訓練數據促進大模型技術的提升,但優質數據集稀缺?

有效數據集有限,優質數據集仍舊稀缺。當前開源榜單公開訓練數量級,現有常見的大模型訓練數據集往往在幾十到幾百B的量級,優質的數據集可能就只有300-500Btoken,進化到多模態數據量有所增加,但總量也不多。有的模型會用萬億級別的數據token訓練,但很多數據其實是無效的。?

大模型的未來發展依賴于訓練數據集的質量,而非僅僅是數量。根據ScalingLaw,Transformer架構的語言模型性能在很大程度上取決于模型大小、數據集大小和訓練計算量,性能與這三個因素之間存在冪律關系,且趨勢跨越多個數量級,而對其他架構細節(如網絡深度或寬度)的依賴相對較小。未來的大模型可能會經歷增長飛輪效應,但關鍵在于訓練數據集的質量。這強調了選擇和使用高質量數據的重要性,而不僅僅是追求數量。單純的用戶數據上不一定會產生飛輪效應,比如某些用戶數據目前只具備統計學的能力,能夠發現邏輯、數學的問題還需要找邏輯、數學數據集去優化。圖5:各大模型訓練數據集對比圖6:ScalingLaw模型性能與模型參數、數據集和訓練計算量成冪律關系??資料

:Wayne?Xin?Zhao、Kun?Zhou等,?《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經濟研究所整理資料

:OpenAI官網,國信證券經濟研究所整理6AI技術將更大范圍的數據帶入分析領域,關注稀缺內容平臺?

AI技術把原先難以利用的非結構數據(占比80%)帶入分析領域。AI浪潮下數據資產的重要性凸顯,Snowflake在財報會提到AI技術把原來客戶無法利用的非結構化數據帶入分析領域構成新的增量。一系列數據公司與產品受益,包括云數據倉庫領域(Snowflake)、非結構化/向量數據庫(MangoDB、Pinecone)、云數據監控(DataDog)和ML/AIOps

領域(Databricks、AWSBedrock、Weights&Biases)。?

內容創作者所聚集的平臺,如字節和騰訊視頻號成為高質量數據的重要

隨著內容創作者轉向音視頻平臺,這些平臺成為了聚集高質量數據的熱點,如字節跳動和騰訊視頻號等平臺。部分觀點類數據可能具有一定時效性,如百度問答和知乎等平臺上的數據。圖7:各大模型訓練數據集對比圖8:AI技術下數據分析各領域的增量?公司模型參數量10T數據規模阿里巴巴智源研究院騰訊M6?1.9?TB圖像和?292GB?文本悟道2.0混元1.75T4.9T1T2T百度文心260B45TB中科院自動化所智譜華章百川智能紫東·太初ChatGLM3百川100B1.42TB中文1.5B、3B和6B2B/7B/13B7B/20B2.6T上海人工智能實驗

書生室2.3T(InternLM-20B)科大訊飛商湯科技星火170B1,04B7B數十億的語言數據集1.6?萬億?token?1300億InternLM春田知韻(抖音)

豆包阿里云

通義千問盤古7B3萬億tokens200B40TB中文文本、3B圖像?資料

:各公司官網、國信證券經濟研究所整理資料

:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,國信證券經濟研究所整理7大模型的競爭格局猜想—C端集中,B端差異化競爭?

C端:通用的大模型技術底座不會太多,可能只會有一個大一統的入口,通過豐富的插件、定制化功能、AI

Agent滿足用戶的高度定制化和長尾需求。從大模型的迭代發展,我們看到底層技術基于Transformer架構的統一化。隨著模型能力的增強,與硬件終端協同可能加劇流量入口的集成和統一。?

B端:不同行業具有各自垂類模型,不同大小的模型適用于不同場景。由于企業場景、業務流程差異化,不同的領域模型功能、數據集、模型大小和性能都有較大差別,定制化模型廠商或小模型性價比更高。目前出現很多競爭廠商在B端發力,比如Cohere、或者在Huggingface上用開源模型改造。圖9:近年來現有(大于10B)大語言模型的時間軸圖10:北美各大企業的AI應用行業分布??資料

:Wayne

XinZhao、Kun

Zhou等,

《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經濟研究所整理資料

:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,國信證券經濟研究所整理8OpenAI商業模式:大模型技術領先,積極嘗試構建生態壁壘?

通過先進的閉源實現商業化,通過開源前代模型構建生態:OpenAI的GPT技術路線是當前模型自研商家優先選擇并跟隨的技術方向,而OpenAI憑借大模型的領先優勢,后續更新到GPT5后,有可能將前代GPT3.5開源,通過更新一代、開源一代來實現自身戰略。領先模型閉源、服務B端客戶實現商業化,落后模型開源繁榮GPT生態與應用建設。?

通過AIAgent的形態去構建流量入口:OpenAI在AIAgent與流量入口領域有許多嘗試,比如插件生態、GPTs。GPTs出現打破過去的軟件孤島、復雜、不能滿足長尾需求的缺點,創建過程工具化標準化而且創建成果產品化。但是AIAgent必須要對個人有全鏈路的信息處理能力,當前GPTs實際上對個人信息的創建和積累是分裂的,比如單人創建不同的GPTs,其實它們之間互不相連,導致可能會產生訓練和數據的浪費。圖11:OpenAI模型演進圖圖12:OpenAI

GPTs應用?DELL-E12021.01DELL-E22022.07DELL-E12023.09?資料:OpenAI官網,參考文獻:Wayne

XinZhao、Kun

Zhou等,

《ASurveyofLarge資料

:Gptshunter官網,國信證券經濟研究所整理LanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國信證券經濟研究所整理9AI

Agent:成為生產環節的定制化輔助,帶來人機交互的革新?

AI

Agent框架為大模型提供結構化思考方法,成為生產環節的重要輔助:大模型作為理解推理能力不斷增強,軟件生產進入低門檻、高定制化時代,面向用戶的長尾、個性化需求,Agent框架可以打造每個知識工作者的AI助理。?

AIAgent需要標準定義和模型能力進化,同時GenerativeUI可能帶來人機交互方式的革新:當前大模型對連續的復雜推理問題包括對多模態信息的交叉處理仍有不足,需要用更復雜、結構化、多維度的數據來進一步學習。另一方面,Agent應用對當前的人機交互方式帶來改變,演進成為同時適用于人類和AI操作的形式。?

案例:Agent以類人的方式與智能手機應用進行交互,使用點擊和滑動等底層操作來操作圖形用戶界面(GUI)。利用大型語言模型的視覺能力以類似人類的方式操作智能手機應用程序。在探索階段,智能體與智能手機應用程序交互并從結果中學習,以創建一個全面的參考文檔。在部署階段,智能體利用這個文檔匯編的信息來有效操作和導航應用程序。圖13:用于操作智能手機應用程序的多模態智能體框架概述圖14:多模態智能體框架在智能手機App操作中的多種應用?資料:ChiZhang,ZhaoYang等,《AppAgent:

MultimodalAgentsasSmartphone

Users》,?

資料:ChiZhang,ZhaoYang等,《AppAgent:

MultimodalAgentsasSmartphoneUsers》,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國信證券經ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國信證券經濟研究所整理10濟研究所整理智能硬件“All

inOne”終端流量入口的搶占之路?

AIGC將帶來無限的內容生產與供給,進而顛覆當前的信息分發方式:a16z曾說過“芯片將計算的邊際成本降到了零,互聯網將分發的邊際成本降到了零,現在AIGC實際上將創作的邊際成本降到零”。每個人都有機會獲得無限的娛樂內容供給,互聯網常見的信息分發方式未來可能都面臨重組。人會從主動生產和管理信息,進化到與AI共同生產以及與AI輔助管控共存。?

智能終端充當人類和AI認知世界的延伸,依托大模型同時滿足生產力、社交娛樂等全面需求。相比軟件產品智能硬件終端更容易演化到allinone的形態,從而搶占終端的流量入口。從蘋果生態來看,智能終端的壁壘同時取決于生態業務場景的廣度和深度,而AI大模型的技術同時帶來兩個維度的革新。圖15:蘋果MR眼鏡圖16:谷歌Pixel

AI手機圖17:AI

Pin資料

:公司官網、國信證券經濟研究所整理資料理:公司官網、國信證券經濟研究所整

資料

:公司官網、國信證券經濟研究所整理11目錄大模型的競爭格局演繹的關鍵因素獨立的模型團隊—月之暗面、清華GLM、百川智能互聯網大廠的模型和應用進展—騰訊、字節、百度、阿里風險提示0102030412獨立的模型團隊—月之暗面、清華GLM、百川智能13月之暗面:清華系新星楊植麟領銜,團隊核心人員多為清華同門?

月之暗面(MoonshotAI)創始人楊植麟自2020年起便堅信“大模型是未來”,2020年下半年為

的盤古大模型做核心技術研發,2021年參與智源研究院的悟道大模型研發。2022年底楊植麟前往美國進行為期2個月的考察,美國民眾對于GPT的狂熱讓他更堅信此時正是成立大模型公司的合適時機,于是他在接下來的1個月內完成首輪融資,拿到來自紅杉等頭部機構6000萬美元的啟動資金,并于3個月內組建起了大約40人的技術研發團隊。?

MoonshotAI于2023年3月成立,成立前其團隊主要通過與其他公司合作,以團隊提供技術、合作方提供算力的形式來完成大模型相關工作。創始團隊核心成員參與了

GoogleGemini、GoogleBard、盤古NLP、悟道等多個大模型的研發,多項核心技術被GooglePaLM、MetaLLaMa、StableDiffusion等主流產品采用。表1:MoonshotAI創始人團隊背景介紹姓名持股比例職位簡介本科畢業于清華大學計算機科學與技術系,博士畢業于CMU計算機系,師從蘋果AI研究負責人RuslanSalakhutdinov和谷歌首席科學家WilliamCohen;博士期間,先后以一作身份,發表Transformer-XL和XLNet兩項工作,谷歌學術被引次數近2萬;據GitHub個人資料,楊植麟曾效力于Google和MetaPlatforms人工智能實驗室,曾任循環智能聯合創始人。MoonshotAI創始人,CEO楊植麟78.97%本碩博均畢業于清華大學計算機系,師從清華大學計算機系副系主任、數據挖掘頂級專家唐杰教授,研究方向是異構數據融合和知識圖譜構建;曾作為核心開發者研發了全球知名的科技大數據分析平臺AMiner,產品服務于BATH等科技巨頭及國家科技部等政府科研管理機構。MoonshotAI聯合創始人,CTO張宇韜周昕宇5%與楊植麟一同畢業于清華大學計算機系,畢業后加入,從事算法量產工作,旨在提升算法生產效率;就職期間,他和10%MoonshotAI聯合創始人研究院基礎科研負責人張祥雨一同研究移動端模型,以共同一作的身份撰寫ShuffleNet論文,中標CVPR,這項工作為包括蘋果3D人臉解鎖在內的各種手機毫秒級人臉解鎖技術的發展提供了關鍵支持。與楊植麟背景類似,先后畢業于清華大學與CMU,研究方向為計算機視覺中的檢測和識別問題;曾就職于MetaFAIR,和隊員吳育昕資料5.96%MoonshotAI聯合創始人

何愷明共同提出組歸一化(GroupNormalization)的方法,吳育昕創建的detectron2,成為Meta受歡迎的AI項目之一;谷歌學術被引次數超過1.9萬次。14:天眼查、國信證券經濟研究所整理2023年首次發布大模型產品Kimi

Chat,長文本能力為核心能力?

基于千億大模型的智能助手Kimi

Chat,核心能力為長文本能力(LongContext):2023年10月9日,MoonshotAI推出首款產品,擁有長達20萬漢字的上下文處理能力,據MoonshotAI官方,這是目前全球市場上能夠產品化使用的大模型服務中所能支持的最長上下文輸入長度。此外,KimiChat還可處理多種文檔格式(如PDF、Excel等),具備較強的多語言能力,以及調用搜索引擎獲取信息,旨在為用戶提供強大、智能的對話伙伴,并為其工作、學習、生活提供助力。表2:MoonshotAI推出的大模型產品Kimi

Chat簡介核心優勢應用實例底層技術處理長文本:依靠長文本技術,KimiChat擁有長達20萬漢字的上下文處理能力,這意味著其能夠覆蓋更多應用場景,且可直接基于全文理解進行問答和信息處理,從而極大程度上解決大模型的“幻覺”問題。?

KimiChat根據提供的文章鏈接,快速總結分析公眾號長文;?

KimiChat根據提供的上市公司財報,快速總結要點;支持多語言:相比當前市面上以英文為基礎訓練的大模型服務,KimiChat在中文上具備顯著優勢,實際使用效果能夠支持約?

可閱讀長篇中文小說(如《三體》),并梳理內容概要、角20萬漢字的上下文,2.5倍于Claude-100k(實測約8萬字),

色介紹等8倍于GPT-4-32k(實測約2.5萬字)。大語言模型、長文本處理技術、注意力機制長程注意力機制:KimiChat通過創新的網絡結構和工程優化,可在千億參數下實現無損的長程注意力機制,不依賴于滑動窗口、降采樣、小模型等對性能損害較大的方案。?

可基于長篇小說、游戲設定進行角色扮演,不會在多次對話后脫離設定?

可一次接收多篇上市公司財報并進行市場分析;?

可一次接收多份出差發票并整理相關信息可處理多種文檔格式:KimiChat可處理多種文檔格式(包括PDF、Excel、CSV等)?

可一次接收多份求職簡歷并根據用戶需求篩選排序出Top5求職者資料

:MoonshotAI官網、國信證券經濟研究所整理15模型版本經歷兩次更新,在多個場景下持續優化模型效果?

KimiChat更新歷程:?

2023年11月15日,KimiChatV1.1

面向全社會開放版本,模型版本更新至moonshot-v1-20231115,主要更新內容包括(1)大幅解決模型在復雜場景下輸出重復的問題;(2)關閉頁面不再導致模型回復停止,同一對話下,各終端同步輸出內容;?

2023年12月25日,KimiChat模型版本更新至moonshot-v1-20231225,主要更新包括(1)內容生成長度提升(2)優化首字回復速度(3)實現從掃描件(文檔、合同、白板等)提取文字的功能,目前已支持掃描文件以PDF格式上傳解析(4)微信小程序端上線“Kimi智能助手”圖18:Kimi

Chat最新版本可從掃描件提取手寫文字并解析圖19:Kimi

Chat上線微信小程序“Kimi智能助手”???資料

:Moonshot?AI官網,國信證券經濟研究所整理資料

:Moonshot?AI官方公眾號,國信證券經濟研究所整理16智譜:清華KEG孵化而來,團隊核心成員多有清華背景?智譜AI由清華大學計算機系教授唐杰領銜的清華KEG(知識工程實驗室)孵化而來,其團隊核心成員多有清華系背景。?

2019年成立以來,智譜AI始終堅持投身大模型技術研發,愿景是“未來讓機器像人一樣思考”,并希望能對標OpenAI;?

2020年6月,GPT-3發布,智譜AI意識到GPT模型已實現越級提升;?

2022年8月,智譜AI推出自研大模型GLM-130B,結合了GPT的單向向后預測模型框架與BERT的雙向預測的模型框架;公司專注于ToB和ToG服務,客戶主要是企業和政府機構。?

2023年,智譜AI獲融資25億,估值超百億人民幣。?目前智譜的合作案例包括:1)G端,跟北京政府合作提供智能客服能產品;跟北京中醫院合作中醫藥在線問診模型構建等;2)B端,跟中石油合作ERP改造企業工作流;跟美團合作對話、廣告、搜索等功能;3)C端,提供ChatGLM通用大模型入口。圖20:智譜股權圖表3:智譜AI創始人團隊背景介紹姓名

職位簡介畢業于清華大學計算機系,博士研究方向為知識圖譜。曾在KDD、ICML等國際頂會和期刊上發表多篇學術論文,榮獲2013年中國電子學會科學技術三等獎、2012年北京市科學技術三等獎及2009年王選新聞科學技術獎二等獎等多項重要獎項。張鵬

CEO劉德

董事長、

師從高文院士,曾任清華數據科學研究院科技大數據研究中心副兵經理主任王紹蘭總裁清華創新領軍博士??資料:天眼查,國信證券經濟研究所整理資料:天眼查、國信證券經濟研究所整理17模型迭代歷程:創新動力充足,多個模型持續迭代GLM:?

2021.9設計GLM算法,發布擁有自主知識產權的開源百億大模型GLM-10B;?

2022.8發布高精度千億大模型GLM-130B并開源,效果對標GPT-3175B,收到70余個國家、1000余個研究機構的使用需求;?

2022.10發布開源的100+語言預訓練模型mGLM-1BChatGLM:?

2023.3發布千億基座的對話模型ChatGLM及其單卡開源版本ChatGLM-6B,全球下載量超過800萬;為實現從GLM到ChatGLM的迭代,智譜AI加入了代碼訓練、進行SFT(Supervised

FineTuning,有監督微調)、加入RLHF(Reinforcement

LearningwithHumanFeedback,基于人類反饋的強化學習);?

2023.6發布全面升級的ChatGLM2模型矩陣,據GitHub,主要更新包括(1)升級基座模型以提升模型在MMLU(+23%)、CEval(+33%)、GSM8K(+571%)、BBH(+60%)等數據集的性能表現(2)上下文長度從2k擴展至32k(3)推理速度提升42%;?

2023.8搭載ChatGLM2模型的AI生成式助手“智譜清言”上線;?

2023.10發布全面升級的ChatGLM3模型及相關系列產品,主要更新包括(1)升級基座模型以提升模型在MMLU(+36%)、CEval(+33%)、GSM8K(+179%)、BBH(+126%)等數據集的性能表現(2)在多模態理解、代碼增強、網絡搜索等功能上進行迭代更新(3)集成自研AgentTuning技術,激活模型智能體能力(4)推出可手機部署的端測模型,支持包括Vivo、小米、三星在內的多種手機以及車載平臺(5)推理速度提升2-3倍,以上更新同樣作用于智譜清言;CodeGeeX:?

2022.9發布代碼生成模型CodeGeeX;?

2023.7發布新一代代碼生成模型CodeGeeX2,主要更新包括(1)代碼能力大幅提升,據GitHub,六種編程語言能力均大幅提升

(Python+57%,C+++71%,Java+54%,JavaScript+83%,Go+56%,Rust+321%);(2)支持編程語言數量大幅提升,達到100余種;18大模型產品涵蓋AI開放平臺、智譜清言及一系列AIGC產品?

智譜AI合作研發大模型GLM-130B,并基于此推出對話模型ChatGLM,開源單卡版模型ChatGLM-6B,并推出AI提效助手智譜清言(ChatGLM)。AIGC模型及其產品矩陣包括高效率代碼模型CodeGeeX、多模態理解模型CogVLM和文生圖模型CogView等;建立大模型MaaS開放平臺,致力于AI生態建設。表4:智譜AI的大模型產品矩陣產品功能介紹應用實例底層模型-為開發者提供開放平臺,使其通過API調用,實現基于ChatGLM系列模型(ChatGLM-130B、ChatGLM-6B、GLM-130B)、CodeGeeX代碼大模型、多模態大模型(CogView、CogVideo)快速搭建AI應用。電子簽約SaaS提供商上上簽集成GLM-130B大模型與行業數據,推出簽約智能產品Hubble哈勃。AI開放平臺基于ChatGLM2開發的千億參數對話模型,支持多輪對話,具備內容創作、信息歸納總結、代碼生成等能力。ChatGLM3:具問答和對話功能的千億中英語言模型,不同于BERT、GPT-3以及T5的架構,是一個包含多目標函數的自回歸預訓練模型。ChatGLM(智譜清言)代碼生成能力:支持100余種編程語言,幫助用戶快速準確生成代碼。CodeGeeX:千億級參數的多編程語言代碼生成大模型,在超過20種編程語言的大型代碼語料庫上進行預訓練?;贑odeGeeX代碼大模型的全能的智能編程助手,

可實現代碼的生成與補全、自動添加注釋、支持主流編程語言,并適配多種主流IDE。

代碼翻譯以及智能問答等功能。CodeGeeX免費智能寫作工具,可生成AI原創內容創意以及完成各種文本任務,如文章、報告、新聞稿、營銷文案等。GLM(GeneralLanguageModel):通用語言模型,通過自回歸空白填充目標進行預訓練,并可在各種自然語言理解和生成任務上進行微調。可根據不同創作模板完成不同類型的文案創作,如“元旦祝?!薄ⅰ拔恼聺櫳钡取懽魍芑贕LM模型的智能對話機器人,可根據用戶定義

可創造多種不同人設,如“林妹妹”、的人設切換對話風格、進行有情感地流暢表達。

“帶貨主播”等。小呆對話GLM?

CogView:全球首個中文的全領域文到圖生成模型,40億級參數;?

CogVideo:是全球首個開源的大規模文本到視頻生成模型,90億級參數。CogView/Cog

基于CogView/CogViedeo大模型的文(中文)生圖

可根據用戶輸入的中文文字描述生成相關圖片/視頻。Video工具19資料:智譜AI官網、智譜官方公眾號、GitHub、國信證券經濟研究所整理百川智能:前搜狗CEO王小川帶領,團隊核心成員多為知名科技公司AI頂尖人才?百川智能由前搜狗公司CEO王小川聯合前搜狗公司COO茹立云于2023年4月10日創立,團隊核心成員多為來自搜狗、百度、、微軟、字節、騰訊等知名科技公司的AI頂尖人才,截至2023年10月,團隊規模170余人,其中碩士及以上學歷員工占比近70%,研發人員占比超80%。融資方面,啟動資金5000萬美元來自創始人王小川及其業內好友個人支持,2023年10月完成A1輪戰略融資,獲阿里、騰訊等科技巨頭及頂級投資機構的3億美元融資金額,創下國內大模型初創企業最快晉升獨角獸的記錄。?目前已有超過200家企業申請百川大模型開源和商業授權,并已將百川模型投入實際生產場景。企業涵蓋互聯網、軟件和信息技術、金融、法律、教育、制造業、企業服務等眾多領域,客戶包括阿里云、騰訊、火山引擎、京東科技、順豐科技、浪潮、中國農業銀行、蔚來汽車等。表5:百川智能創始人團隊背景介紹姓名持股比例

職位簡介畢業于清華大學計算機科學與技術專業,擁有學士、碩士及EMBA學位;曾任搜狗CEO,搜狐高級副百川智能創始人,

總裁兼CTO;先后發明了有5億多用戶在使用的搜狗輸入法、搜狗搜索等互聯網標志性產品;曾帶王小川

76.43%CEO領搜狗公司發展語音、圖像、翻譯等AI技術并率先實用化,帶領搜狗公司成長為國內用戶規模第四大互聯網公司,并赴美上市中國人工智能第一股。畢業于清華大學計算機系,獲學士、碩士、博士學位及長江商學院EMBA學位;曾任搜狗COO,葡萄百川智能聯合創始

智學創始人;曾帶領搜狗搜索在多個搜索領域取得不俗成績,如率先發布分類搜索、推出全新的茹立云

0.77%人知識庫搜索引擎知立方、搜狗語音助手等產品,并成為唯一一家能夠提供“通用搜索”、“微信公眾平臺搜索”及微信內容差異化閱讀服務的搜索引擎。資料:天眼查、國信證券經濟研究所整理20成立8個月內發布8款自研大模型,速度與性能俱佳模型研發方面,自成立以來,百川智能先后發布Baichuan-7B/13B,Baichuan2-7B/13B四款開源模型和Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo四款閉源模型,并與國家級科研機構鵬城實驗室共同發布基于國產算力訓練的最長上下文窗口大模型“鵬城-百川·腦海33B”。表6:百川智能大模型基本信息及測評表現模型基本信息發布時間是否開源

測評表現基于Transformer結構,在大約1.2萬億tokens上訓練而成,參數量70億,支持中英雙語,上下文窗口長度為4096。國內首個開源可商用模型,國內外多榜單排名第一,在中文榜大幅度領先,英文榜首超LlaMA。Baichuan-7B2023.6.15是在Baichuan-7B的基礎上提升參數量到130億,在高質量語料上訓練1.4萬億tokens(同等級別開源模型中訓練數據最多,超LLaMA-13B40%);同時開源預訓練模型(Baichuan-13B-Base)和對齊模型(Baichuan-13B-Chat),服務于開發者與普通用戶。Baichuan-13B同等級開源模型中效果最好的可商用大語言模型,中文榜大幅領先LlaMA-13B,英文榜超越所有同等級開源模型。2023.7.11是得益于團隊的搜索引擎背景,Baichuan-53B采用高質量知識數據進行預訓練,并通過搜索增強(融合指令意圖理解、智能搜索和結果增強等關鍵組件)減少模型幻覺;此外,進行對齊調整以使模型同人類價值觀對齊,從而生成“更令人滿意”的回復內容。Baichuan-53B2023.8.82023.9.62023.9.25否是否-Baichuan2-7B/13B包括Baichuan2-7B、Baichuan2-13B,基于2.6萬億高質量多語言數據訓練而成,在數學、代碼、安全、邏輯推理、語義理解等能力有顯著提升。在MMLU、CMMLU、GSM8K等幾大權威評估基準中,以絕對優勢領先LLaMA2,性能大幅度優于LLaMA2等同等級模型競品。對Baichuan-53B各項能力進行提升(邏輯推理+100%,數學+31%,語言理解+29%,文本創作+18%,知識問答+9%),重點升級邏輯推理與數學能力;通過高質量數據體系和搜索增強極大降低模型幻覺;開放API接口,以方便企業與開發者將其集成至自己的應用程序或服務中。在FacTool測評(查核大模型生成內容的事實準確性)中,Baichuan2-53B的綜合得分為140.5,在主流基礎大模型中僅排在GPT-4之后,處于國內領先水平。Baichuan2-53B上下文窗口長度高達192K,在長窗口文本生成質量、長上下文理解以及長文本問答、摘要等方面全面領先Claude2;通過算法和工程優化,實現窗口長度

2023.10.30和模型性能之間的平衡;以API調用和私有化部署的方式提供給企業用戶。Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10項中英文長文本問答、摘要的評測集上表現優異,有7項取得SOTA,顯著超過其他長窗口模型。否否Baichuan2-Turbo融合長上下文窗口和搜索增強,鏈接大模型與領域知識、全網知識;支持多種文檔(PDF、Word)上傳及網址輸入;開放API。2023.12.19-21資料:百川智能官網、百川大模型官方公眾號、GitHub、國信證券經濟研究所整理目錄大模型的競爭格局演繹的關鍵因素獨立的模型團隊—月之暗面、清華GLM、百川智能互聯網大廠的模型和應用進展—騰訊、字節、百度、阿里風險提示0102030422騰訊:混元大模型+應用解析23騰訊-基礎大模型:混元大模型?

混元大模型是騰訊自研的通用大語言模型。具有超千億的參數規模、超2萬億tokens的預訓練語料。9月,騰訊混元大模型正式通過騰訊云對外開放。用戶可以直接調用API接口,或者將騰訊混元作為基底模型,在公有云上進行精調。?

10月,騰訊混元大模型迎來全新升級,并正式對外開放“文生圖”功能。根據公司介紹,升級后的騰訊混元中文效果整體超過GPT3.5,代碼能力大幅提升20%,達到業界領先水平。?

11月世界互聯網大會烏鎮峰會,騰訊集團副總裁蔣杰還展示了騰訊混元大模型的“文生視頻”能力。?

混元助手是基于騰訊混元大模型的多模態對話Bot產品。隨著9月騰訊混元大模型首批通過備案,混元助手以微信小程序的形式陸續面向公眾開放。在場景的AI聊天頁面之外,還在“靈感發現”頁面提供了多個場景化的應用。除文生文外,混元助手已經支持文生圖功能,尚不支持文生視頻和讀圖功能。圖21:騰訊混元助手小程序圖22:騰訊混元文生圖功能??24資料

:騰訊云AI官網,國信證券經濟研究所整理資料

:騰訊混元官網,國信證券經濟研究所整理騰訊-MaaS:騰訊云TI平臺,打造行業大模型精選商店?

MaaS云服務:騰訊于今年6月首次公布騰訊云行業大模型方案,依托騰訊云TI平臺,打造行業大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務。?

中國銀聯:在單據識別錄入場景,騰訊云TI-OCR訓練平臺整合OCR大模型,支持銀聯快速自定義證件、票據、文本識別,實現業務流程自動化,提升效率并節約成本。?

上海仁濟醫院:運用騰訊云醫療行業大模型,以互聯網醫院適老化服務為重點,打造了高度擬人化的虛擬數字形象“小威護士”,有效提升患者就醫體驗。?

8月起,騰訊云TI平臺全面接入Llama2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多個主流模型。圖23:騰訊云MaaS全景圖???資料:騰訊云智能官網,國信證券經濟研究所整理25騰訊-AI基建:自研紫霄芯片+HCC算力集群+向量數據庫?

騰訊自研芯片已經量產,包括用于AI推理的紫霄芯片:采用自研存算架構和自研加速模塊,可以提供高達3倍的計算加速性能和超過45%的整體成本節省。目前在騰訊會議實時字幕上已實現全量上線,單卡紫霄機器負載可達到T4的4倍,并將超時率從0.005%降低至0。?

騰訊云在4月發布新一代HCC高性能計算集群:采用最新一代星星海自研服務器,搭載NVIDIAH800TensorCoreGPU,性能較前代提升3倍。通過對單機算力、網絡架構和存儲性能進行協同優化,能夠為大模型訓練提供高性能、高帶寬、低延遲的智算能力支撐。?

騰訊云在7月發布AI原生的向量數據庫:之后經過多次迭代升級,在優化版的IVF索引支持下,從最初支持的十億向量規模到現在的千億規模和500萬QPS峰值能力。目前,騰訊云向量數據庫已經在內部服務于騰訊視頻、QQ瀏覽器、QQ音樂等40多個業務,日請求量達1600億次,服務了包括博世、銷售易、搜狐、好未來、鏈家等在內的超過1000家外部客戶。圖24:騰訊云新一代HCC集群圖25:紫霄芯片算力參數跟其他常見芯片的對比圖26:騰訊云向量數據庫資料

:騰訊云官網,國信證券經濟研究所整理資料

:騰訊云官網,國信證券經濟研究所整理資料

:騰訊云數據庫官網,國信證券經濟研究所整理26騰訊-SaaS產品:AI提供了生成式新功能和潛在銷售機會?

根據“騰訊混元”官方公眾號的10月推文,超過180個騰訊內部業務已接入騰訊混元,包括騰訊會議、騰訊文檔、企業微信、騰訊廣告和微信搜一搜等。我們認為,SaaS產品在接入混元大模型后,不僅帶來了更豐富的AI功能,也提供了新的銷售機會,有望帶動SaaS產品用戶數和客單價的提升。?

騰訊會議:AI小助手,已經上線部分功能。提供會前日程協調、會中問答、會后智能紀要、會議待辦項等新功能。其中,“智能錄制不限次(包括智能紀要)”已經加入付費版本專屬權益,有望帶動騰訊會議付費率的提升。?

騰訊文檔:智能助手。支持數十種文本創作場景,提供文檔創作、文本潤色、文本校閱、表格公式及圖表生成等能力,提高創作效率,提升創作體驗。目前智能助手已經率先嵌入智能文檔中,需要申請后參與試用;未來還將嵌入智能表格、PPT、思維導圖等文檔類型。參照NotionAI,智能助手有望帶動騰訊文檔付費率和客單價的提升。?

此外,騰訊企點、企業微信、AI代碼助手等SaaS產品同樣在AI加持下增添了更多新功能,提升了潛在銷售機會。圖27:騰訊會議AI小助手圖28:騰訊文檔智能助手??資料

:騰訊云AI官網,國信證券經濟研究所整理資料

:騰訊云AI官網,國信證券經濟研究所整理27騰訊-廣告平臺:AI一方面增強廣告定向和歸因,另一方面通過AIGC提升廣告創作效率和效果?增強廣告定向和歸因的準確性:2022年6月,騰訊廣告對外公布了借助大模型降本增效的進展:首先以混元AI大模型助力系統深刻理解廣告內容,其次以精排大模型提升廣告和用戶的匹配準確率。騰訊連續4個季度在業績公告中提及機器學習平臺升級和廣告AI模型。?AI智能化創作廣告素材:騰訊廣告以騰訊混元大模型為基礎,結合廣告應用場景,實現含文生圖及文生視頻在內的多種智能化廣告素材創作能力,滿足千人千面。目前,騰訊廣告“AI創意工作臺”已覆蓋電商、文旅、閱讀資訊、游戲等多個行業場景,針對閱讀行業還在持續打磨古言、都市、玄幻等小說人物形象模型,已從9月份開始陸續為廣告主提供“素材創作”、“二次編輯&一鍵投放”、“商品生成”等核心能力。圖29:騰訊廣告AI創意工作臺圖30:使用AIGC素材的生成效率與效果更優?資料:騰訊云AI官網,國信證券經濟研究所整理資料:騰訊云官網,國信證券經濟研究所整理28騰訊-微信Agent:以微信為入口的Agents具備很強的想象空間?

騰訊Q3業績會議上提及過“智能代理”(smartagent)的概念,目前還非常早期,但想象空間很大。?

AIAgents,是一種能夠自主感知環境、進行規劃和決策、使用外部工具的人工智能體。相比于Copilot,AIAgents具備更強的自主性,在復雜任務中參與度更深。目前完全意義上的Agents尚不成熟,市面上工具更多是Copilot。?

假設后期技術能夠實現AIAgents,以微信為入口的Agents具備很強的想象空間:1.微信+小程序提供流量入口和基礎設施,有機會將微信的流量進一步貨幣化;2.增強微信的基礎性APP地位;3.派生更多新的商業模式。圖31:LLM-basedAgent概念框架圖32:多模態智能體框架在智能手機App操作中的多種應用??資料

:復旦大學NLP團隊,國信證券經濟研究所整理參考文獻:XiZ,ChenW,GuoX,etal.Theriseandpotentialoflargelanguagemodelbasedagents:Asurvey[J].arXivpreprintarXiv:2309.07864,2023.資料

:Chi

Zhang,ZhaoYang等,《AppAgent:

MultimodalAgents

asSmartphoneUsers》,Computer

VisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國信證券經濟研究所整理29百度:文心大模型+應用解析30百度-基礎大模型:文心大模型4.0?文心大模型4.0具備強大的理解、生成、邏輯和記憶的能力。根據百度官方公眾號,文心一言于8月31日向全社會開放,至今已有超7000萬用戶。10月17日,在百度世界2023大會上,文心大模型4.0版本正式發布。文心4.0實現了基礎模型的全面升級,在理解、生成、邏輯和記憶能力上都有著顯著提升,其中邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。根據三季度業績會議,與3月的文心一言相比,當前版本的推理成本降低了98%,同等算力條件下QPS提升了50倍。圖33:文心產業級知識增強大模型???資料:百度文心一言官網,國信證券經濟研究所整理31百度-核心廣告:預計在四季度貢獻數億增量收入?

核心廣告:文心大模型重構廣告系統,預計在四季度貢獻數億增量收入。?

1)9月7日,百度營銷發布全球首個AINative營銷平臺“輕舸”。根據業績會議,百度通過文心大模型重構廣告系統,提升廣告素材創作效率和定向能力,“輕舸”可以自然語言和表達、高效推送、隨時調度AI能力,大大提升投放效率,便利用戶投放。至今已有數千名廣告客戶采用新廣告系統,采用這些新功能的廣告客戶在三季度實現了平均高個位數的轉化率提升。在四季度,AI相關舉措有望為百度廣告貢獻數億增量收入。?

2)公司正在測試采用新的對話形式替代原有的落地頁,不僅有望提升廣告轉化率,還將使公司有機會從CPC模式向CPS模式轉變。圖34:百度營銷平臺-輕舸???資料:百度輕舸官網,國信證券經濟研究所整理32百度-智能云:貢獻API調用收入、大模型解決方案收入??智能云:伴隨著文心大模型4.0的發布,公司相信客戶對AI大模型的需求有望打開云業務新的增長空間。根據業績會議,目前來自生成式AI和LLM的收入還比較少,但增速快。大模型的2B收入貢獻分為幾個層面:1)API調用收入:文心4.0已開放面向企業客戶的API,目前文心大模型API的調用量呈指數級增長。2)大模型解決方案收入:百度具備完善的芯片、框架、模型、應用四層技術棧,支持企業客戶基于文心大模型構建企業級大模型和行業應用,也支持企業客戶基于文心千帆平臺訓練自己的大模型,無論客戶選擇何種方式,都將為百度帶來新的創收機會。目前大模型可應用于電商、短視頻、教育、游戲、醫療、金融等六大行業:1)電商行業:通過使用大模型,可以幫助電商平臺提升用戶體驗、增加銷售額同時大大降低運營成本;2)短視頻行業:可以實現內容創作文本的輸出,提高短視頻內容創作者的效率;3)教育行業:可以幫助提升教育教學效果、個性化教育水平、輔助教育決策能力;4)游戲行業:在研發端,可以提升游戲設計、游戲代碼開發的工作效率;在體驗端,可以輔助開發者提供游戲優化方案,提升游戲體驗;5)醫療行業:為醫生提供更加準確和全面的診斷和治療建議,以及幫助醫生進行疾病檢測和預測;6)金融行業:幫助銀行和金融機構進行風險評估、市場預測和欺詐檢測等任務。圖35:百度智能云發布基于文心一言的“超級助理”圖36:百度千帆平臺架構??資料:百度智能云官網,國信證券經濟研究所整理資料:百度智能云官網,國信證券經濟研究所整理33百度-AI重構旗下應用,如百度文庫、地圖、網盤等??運用文心大模型的能力重構旗下應用,為用戶帶來全新AI原生體驗。百度目前已經基于文心大模型重構了百度文庫、地圖、網盤、如流等原有應用,也推出了新的AI原生應用百度GBI和Comate代碼助手。重構后的AI原生應用,在用戶量、活躍度等數據指標方面實現顯著增長。例如,百度文庫AI新功能累計使用用戶達3000萬,付費率明顯提升;百度網盤個人助理“云一朵”用戶累計突破2000萬。各應用AI功能:“云一朵”可以幫助用戶答疑解惑、總結文檔和視頻、提供創作靈感;AI向導可以提供預估行程、沿途規劃、安排聚會地點等服務;百度文庫AI助理可以進行內容總結、創作、PPT編輯等。圖37:百度文庫AI重構圖38:百度網盤AI重構-云一朵、百度地圖AI向導-悠悠??資料:百度官方公眾號,國信證券經濟研究所整理資料:百度網盤官網、百度地圖官網,國信證券經濟研究所整理34阿里巴巴:通義大模型+應用解析35阿里—AI組織架構:云智能團隊主導,全鏈條布局AI?阿里云戰略為“AI驅動,公共云優先”,達摩院和基礎設施事業部負責AI底層基礎設施及芯片研發;集團層面,阿里巴巴成立了基礎設施委員會,由CEO吳泳銘直接統籌負責,協調全集團底層技術基礎設施的規劃與建設,助力AI更好地在集團其他業務落地應用。?根據IDC統計,2022年中國AI公有云服務市場還是呈現出80.6%的正增長,整體市場規模達79.7億元人民幣。2022年中國AI公有云服務市場份額,百度智能云占比28.9%,阿里云占比27.4%,云占比18.7%,騰訊云占比18.7%,其他云廠商占比6.4%。圖39:阿里AI組織架構情況圖40:2022年中國AI公有云服務市場份額資料:雷鋒網,國信證券經濟研究所整理資料:IDC,國信證券經濟研究所整理36阿里—AI基礎設施:自研AI芯片+通義大模型,支持外部AI?芯片:平頭哥半導體(2018年9月成立),目前已有鎮岳、含光、倚天、羽陣等多款芯片產品,其中含光為AI芯片,均已在阿里云、淘寶電商等場景投入應用。?通義大模型:包括統一底座“M6-OFA”,三大通用模型“通義-M6”“通義-AliceMind”“通義-視覺大模型”,以及行業層面的不同垂直領域專業模型。?AI應用情況:自2023年4月通義大模型重磅發布以來,阿里集團董事會主席蔡崇信再2023云棲大會表示,全國80%的科技企業和超過一半的AI大模型公司跑在阿里云上;據公司管理層在FY24Q2業績會議披露,AI在公有云收入占比達到2%。表7:百度阿里騰訊自研芯片情況圖41:阿里巴巴通義大模型系列發布公司自研芯片昆侖芯類別AI芯片百度鴻鵠語音交互芯片RISC-V處理器芯片AI芯片玄鐵系列含光800多模態AI處理器SoC原型曳影1520阿里倚天710羽陣600羽陣611鎮岳510滄海Arm服務器芯片RFID芯片RFID芯片SSD主控芯片視頻處理加速AI芯片騰訊資料紫霄玄靈智能網卡芯片:平頭哥半導體官網、昆侖芯科技官網、百度AI開放平臺、資料:阿里云開發者社區,國信證券經濟研究所整理37騰訊數字生態大會、國信證券經濟研究所整理阿里C端應用—淘寶問問:三大基本模式支撐四大應用場景?

淘寶問問是淘寶App推出的ToCAI應用,可以根據用戶輸入信息,通過深度合成算法解答用戶問題,提供內容建議及相關商品推薦,目前淘寶問問僅向C端使用者開放,底層模型為通義千問。?

自9月上線測試版以來,累計使用人次超500萬;淘寶問問處理的需求中25%是非購物類場景需求,未來有望開拓購物之外的更多使用場景,向泛生活消費類平臺轉型;?

未來有望以接口方式向B端商家開放,助力其將品牌內容、商品優勢更高效傳達給消費者,同時了解消費者更長尾的購物需求。表8:淘寶問問的交互方式、基本模式及應用場景交互方式基本模式應用場景購物場景:用戶已有購物需求,問問提供購買建議,如商品比對Copilot指令模式:通過場景推薦彈幕、選擇指定AI角色的交互方式,自動補全用戶需求,提供輕量級、伴隨式的搜索體驗關鍵詞搜索消費場景:問問主動刺激用戶潛在購物需求,如場景導購方案場景推薦彈幕Q&A問答模式:生成式AI疊加對話式交互,滿足消費者更長尾、個性化的需求生活場景:基于日常生活,同時提供生活技巧及購物建議,如婚禮策劃、烹飪指導選擇指定AI角色雙11大促模式:疊加大促營銷權益,形成精準購物建議陪伴場景:通過關鍵詞搜索的交互方式,問問作為用戶的交談對象,可滿足諸如“給我講一個笑話”的需求資料

:淘寶APP、國信證券經濟研究所整理38阿里B端應用—企業溝通軟件:釘釘全面走向智能化,已開啟商業化?

釘釘開放智能化底座AIPaaS給企業客戶,AIPaaS包含模型調度平臺、模型訓練平臺和插件開發平臺三個部分,降低企業開發運維的門檻,幫助企業數據與大模型建立聯系。目前釘釘軟件的訂閱服務客戶已經超過了10萬家,付費DAU達到2300萬。?

AI商業化情況:釘釘專業版年費9800元基礎上,增加10000元即可獲得20萬次大模型調用額度;在專屬釘釘年費基礎上,增加20000元即可獲得45萬次大模型調用額度,相當于一次調用平均只需不到5分錢。?

與釘釘對比,飛書智能伙伴是開放的AI服務框架,沒有固定的底層模型,更初階更靈活,支持內容創作、內容總結、數據分析、場景構建等功能,目前開放試用,尚未商業化。圖42:釘釘AIPaaS平臺/飛書智能伙伴概覽資料

:釘釘官網,飛書公眾號,國信證券經濟研究所整理39阿里B端應用:萬相臺無界版&阿里媽媽百靈,多種營銷場景智能化?萬相臺無界版和阿里媽媽百靈是阿里媽媽推出的兩大ToB一站式智能營銷投放產品,其中萬相臺無界版以GMV為導向,側重站內投放;阿里媽媽百靈整合站內外媒體資源,側重品牌營銷。二者依托阿里媽媽專屬AI大模型,將消費者觸達、營銷推廣等多種經營場景智能化,助力商家降本增效。?具體案例:日系洗護類品牌Claynal就轉變了以品類詞為核心的投放方式,利用萬相臺無界版7大場景能力找到了全新爆款群,收藏加購成本降低了12%,ROI提升了近24%?據阿里2023年9月季度財報,淘天廣告收入增速快于GMV增速,主要由于萬相臺無界和阿里媽媽百靈提升商家投放效率與投放意愿。圖43:萬相臺無界版覆蓋六大智能經營場景圖44:阿里媽媽百靈包含三大智能化營銷場景????資料:阿里媽媽官網,國信證券經濟研究所整理資料:阿里媽媽官網,國信證券經濟研究所整理40阿里AIGC應用—妙鴨相機:AI在影視行業的應用探索的小荷尖?妙鴨相機是一款基于AI技術的寫真生成工具,由阿里大文娛的張月光帶隊開發。2023年6月,妙鴨相機內測;7月中旬小程序正式上線;7月底妙鴨相機APP上線;上線即爆火,高峰期有4000-5000人排隊,需等待十幾個小時才能出片,后因用戶等待時長過長、數據收集條款侵犯用戶隱私等爭議熱度很快下降。?AI商業化情況:上線伊始,用戶需支付9.9元并上傳20張照片即可生成數字分身并開始生成AI寫真;9月,妙鴨相機宣布推出免費版本,與仍為9.9元的專家模式相比,免費版本等待生成時間較長且模板使用受限。專家模式下會贈送用戶10顆鉆石,后續如需體驗更多模板或下載高清原圖需付費購買更多鉆石。?在妙鴨相機之外,阿里大文娛已經在多個影視工業化垂直賽道進行AI布局。近期阿里大文娛團隊通過自研大模型生成了超寫實數字人厘里,通過真人替身加后期光場制作的方式呈現在劇集《異人之下》之中。傳統特效技術通常需要至少一個月才能完成,使用數字人參演疊加后期制作只需要一周,對于影視行業帶來直接的降本增效。圖45:妙鴨相機區分體驗模式與專家模式圖46:妙鴨相機微信指數趨勢變化????資料:妙鴨相機小程序,國信證券經濟研究所整理資料:微信指數,國信證券經濟研究所整理41字節跳動:云雀大模型+應用解析42字節AI—產品與發展時間線:新AI部門Flow同時發力技術與產品2023年2月2023年4月18日2023年6月布局語言和圖像兩個方向的大模型。其中語言大模型由字節跳動搜索部門牽頭,團隊規模在十數人左右,圖片大模型團隊則由該公司產品研發與工程架構部下屬的智能創作團隊牽頭,整體由朱文佳負責。火山引擎在其舉辦的春季FORCE原動力“原動力大會”上發布了包括自研DPU在內的一系列新云產品,并推出了升級版的機器學習平臺。內部測試一款AI對話類產品“Grace”,也就是豆包的前身,但彼時這一內部項目團隊隸屬字節跳動技術中臺,還沒有組建單獨的產品部門。同月,字節跳動旗下火山引擎發布大模型服務平臺“火山方舟”,可為開發者和企業提供模型訓練、推理、評測、精調等全方位的平臺服務(MaaS,即Model-as-a-Service)。2023年8月17日開始對外測試其AI對話產品“豆包”。豆包是字節推出的大模型產品,可以通過網頁直接訪問,包括豆包本身以及其他多功能小助手,如聊天小寧、寫作助手、智能體創建助手、AI圖片生成、AI漫畫生成、英語學習助手、MUSE音樂電臺等。2023年8月Cici

在海外多個市場上線。2023年8月31日字節云雀大模型成為首批通過《生成式人工智能服務管理暫行辦法》備案的大模型,可正式上線面向公眾提供服務。2023年9月11日“悟空搜索”的應用程序更名為“小悟空”,其主要特色是提供“無廣告搜索”體驗。小悟空應用內集成了一系列基于大語言模型的AI工具,這些工具支持智能對話和輔助推薦功能。2023年11月22日2023年11月底飛書在北京舉辦發布會,正式推出了“飛書智能伙伴”和其他系列

AI

產品。成立了一個專注于

AI

創新業務的新部門

Flow。該部門的技術負責人是字節跳動的副總裁洪定坤,業務負責人是大模型團隊朱文佳,整體團隊規模近150人。Flow將主要聚焦在AI應用層、押注AI大模型方向,后續技術層面更大的模型、端到端的原生多模態,業務層面關注豆包、CiCi等AI原生應用的用戶拓展、DAU增長。資料:公司官網、國信證券經濟研究所整理43字節產品線與AI功能一覽表9:字節產品線傳統功能與AI功能產品名稱通用信息平臺短視頻分享應用創建、編輯和共享短視頻PUGC視頻平臺一站式汽車信息與服務真實專業的汽車內容和選車服務PUGC內容互動社區企業協作與管理平臺面向網文熱愛者的免費閱讀平臺???推薦引擎搜索引擎關注訂閱和內容運營???提供優質內容多樣化創作???短視頻內容社交服務????即時溝通傳統功能音視頻會議在線文檔云盤、工作臺等??海量正版小說免費閱讀體驗?瀏覽其他用戶上傳的視頻內容?為汽車廠商提供高效解決方案AI功能利用AI技術根據用戶的興趣和偏好,為其個性化推薦新聞內容???智能推薦AI視頻剪輯AI實時特效???個性化推薦用戶行為分析AI視頻壓縮????智能語音助手智能推薦智能車輛識別AI咨詢與服務????智能視頻剪輯視頻語音識別智能配樂和配音人像美化??智能語音識別和翻譯智能機器人助手,處理咨詢、問題??精準推薦智能分類?AI會議議程生成產品名稱巨量引擎小荷健康綜合的數字化營銷服務平臺健康知識及服務平臺相機自拍相機?視頻剪輯云上數據產品?傳統功能??智能投放、智能優化數據統計、預算管理???特色案例、醫療科普在線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論