




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
aimer級mmmmmmmm級mmmmmmmmmmmmmmHAIChinaInternetMSCIChinaFeb-22May-22Aug-22Nov-22Feb-23ortsTEMU物流研究及美國尾程配送現狀一覽(HowTEMUfulfillitsordersandaglanceofUSlastmiledelivery)(16Dec2022)阿里巴巴2022云棲大會亮點小結(TakeawayfromAlibaba2022APSARAConference)(7Nov2022)廣深跨境電商調研小結(TakeawayfromE-commerceFieldTripsinGuangzhouandShenzhen)(31Oct2022)稱騰訊控股里巴巴多多團程集團Boss直聘嗶哩嗶哩唯品會愛奇藝微博級mmmmm科技祖龍娛樂GG28Feb2023ChatGPT:細探商業模式與供給端決定因素ChatGPT:ExaminingtheBusinessModelandDeterminingFactorsonSupplySide觀點聚焦InvestmentFocus本篇報告我們回顧梳理了海內外巨頭在ChatGPT上的布局,并分析了未來供給端的決定因素。ChatGPT作為爆款應用出圈,背后有技術和管理上的必然性:ChatGPT在上線5日內突破100萬注冊用戶,兩個月內突破1億用戶,成為全球最快用戶破億的互聯網軟件。技術上,ChatGPT基于Transformer架構,歷經多輪訓練迭代,疊加算力上微軟的大力支持,參數量從最初1.17億進化到了1750億,這帶來了技術上的先發優勢和殺手級的用戶體驗。管理上,OpenAI作為非盈利機構,沒有上市和業績壓力,因此擁有更多試錯空間和更從容的研發氛圍。因此,我們認為ChatGPT可維持其現有優勢,將會是AI時代的贏家之一。而且,參考ChatGPT演變過程,我們認為前期的巨額投入和從容的研發氛圍,也是成為國內該領域最后贏家的必要條件。由此,國內目前各大廠的現狀,仍存在改良空間。商業模式處于探索階段,落地場景上廣告或率先起量,長期會以用戶付費為主導、促成再一次工業革命類的生產力提升:目前ChatGPT的商業化探索仍在早期階段,具體措施包括在C端推出訂閱服務,在B端整合進入微軟云服務生態圈等。長期來看,訓練與硬件成本的下降將為生成式AI技術在B、C端大規模應用提供基礎和支撐,應用場景可包括線上客服、教育、電商、軟件開發、傳媒、藝術、游戲等。但短期而言,較為明確的路徑為革新搜索市場,爭奪廣告份額:微軟Bing的先例可做管中窺豹。不過另一方面,隨著微軟搜索廣告在低基數下的高速增長,谷歌股價或暫時承壓;同理或可解釋百度在OpenAI上的急迫感。國內應用端玩家雖面臨算力掣肘,但短期競爭的決定因素或在于應用場景和轉型決心:參考海外產業鏈,目前中國產業鏈在基礎設施層,主要是高性能芯片方面和海外存在巨大差距。但在芯片被卡脖子的現實下,也預示著國產替代玩家的發展空間(如寒武紀、璧仞科技等),他們可能首先在財務上享受到AI浪潮紅利。而對于應用端的互聯網大廠而言,高性能GPU芯片卡脖子是他們面臨的共同問題,但由于技術敏感性,國內市場此后應為國內玩家主導,所以國內玩家主要還是內部競爭;且目前而言,各家A100囤貨已能滿足現階段需求,且A800即將出貨,以及訓練效率快速提升,卡脖子問題或到2025年方會呈現。從目前技術儲備上看,ChatGPT的出現已經指明了技術迭代的方向,各家糾偏只是時間問題。因此,我們認為國內競爭的關鍵點在于落地場景:巨頭需考慮這些落地場景是侵蝕主營業務的地盤,還是帶來增量為主,并在這個基礎上考量自身的轉型決心。此外,研發氛圍、新業務投入周期、及人才管理等軟實力亦尤為重要-而我們認為,騰訊和字節在這些方面具有優勢、但團隊并不緊迫;百度硬性優勢明顯,急迫感突出,但執行力存疑。后續需緊密關注各家團隊流失率指標。uCFAseccomaoaohtiseccomYulinZhong,CFAzhonghtiseccomJasmineBaiaihtiseccom228Feb202321.1歷經多輪迭代,參數量指數性上升,商業模式已見雛形 3 2.1技術上,多輪迭代訓練后已具備先發優勢 9 2.3科技巨頭躬身入局,發布重視信號 11AI與數據布局 1214 3.3應用上,商業化落地已見雛形;搜索市場份額有望提升 17 4.1防守策略之一:直面競爭 204.2防守策略之二:展開合作 23 ChatGPT于 31 7.1算力:訓練和部署成本仍然昂貴,降本仍是商業化的首要難題 357.2大廠的切入路徑:競爭關鍵因素為技術、應用場景和團隊管理 37328Feb20233ChatGPT是美國OpenAI公司研發的對話AI模型,是由人工智能技術支持的自然語言處理(NLP,NaturalLanguageProcessing)工具,于2022年11月30日正式發布。它能夠學習、理解人類語言,并結合對話上下文,與人類聊天互動,也可撰寫稿件、翻譯文字、編程、編寫視頻腳本等。與現存的其他同類產品相比,ChatGPT的獨特優勢在于:1)基于GPT-3.5架構,運用海量語料庫訓練模型,包括真實生活中的對話,使ChatGPT能做到接近與人類聊天;2)應用新技術RLHF(ReinforcementLearningwithHumanFeedback,基于人類反饋的強化學習),從而能更準確地理解并遵循人類的思維、價值觀與需求;3)可在同一階段內完成模型訓練;4)具有強大算力、自我學習能力和適應性,且預訓練通用性較高;5)可進行連續多輪對話,提升用戶體驗;6)更具獨立批判性思維,能質疑用戶問題的合理性,也能承認自身知識的局限性,聽取用戶意見并改進答案。OpenAIChatGPT訓練模型優化SourceOpenAIWebsiteHTI1.1歷經多輪迭代,參數量指數性上升,商業模式已見雛形2015年,特斯拉CEO埃隆·馬斯克、YCombinator(美國著名創業孵化器)總裁SamAltman、PayPal聯合創始人PeterThiel等投資10億美元,在舊金山創立了非營利性組織OpenAI,致力于開發AI技術。2017年谷歌大腦推出生成式預訓練模型Transformer,經大量數據集訓練后成為當時最高水平的LLM(大型語言模型)。Transformer模型內部創造性地采用了自注意力結構(Self-Attention),相比NLP中的兩大主流結構RNN(RecurrentNeuralNetwork,循環神經網絡)、CNN(ConvolutionalNeuralNetwork,卷積神經網絡),每層具有更佳的計算復雜度,能更好地學習語法、語義等,提高訓練和計算效率;由于未采用循環結構,Transformer處理長序列時也能避免梯度消失或爆炸。具體而言:1)相比不能并行計算的RNN,Transformer允Transformer可使任意兩個單詞間距離為1,計算兩個位置間關聯的操作次數不因距離而增多,從而解決了NLP中長時依賴的難點問題。428Feb20234Transformer模型架構2018年OpenAI公司基于Transformer結構推出GPT-1(GenerativePre-trainingTransformers,創造型預訓練變換模型),參數量為1.17億個,GPT-1超越Transformer成為業內第一。2019年至2020年,OpenAI陸續發布GPT-2、GPT-3,其參數量分別達到15億、1750億,其中,GPT-3訓練過程中直接以人類自然語言作為指令,顯著提升了LLM在多種語言場景中的性能。2019年,OpenAI轉型為封頂盈利機構,成立OpenAiLP公司,同年7月獲得微軟的10億美元投資,9月授予微軟GPT-3模型的獨家使用權(不影響付費用戶使用)。2020年6月,公司發布第一款商業化產品OpenAIAPI。2022年1月,OpenAI在GPT-3基礎上進行微調,并在訓練中加入人類反饋數據,推出InstructGPT。2022年11月30日,OpenAI推出人工智能對話聊天機器人ChatGPT(InstructGPT的兄弟模型),其訓練數據集為開源數據集,且參數量達到GPT-3的10倍以上,輔以人工標注數據與強化學習的運用,實現了突破性進展——ChatGPT能夠圍繞大量話題進行對話,擁有更接近人類的邏輯思維,可借助對話反饋強化學習,且能模仿人類的情緒。例如:1)ChatGPT不僅通曉古今歷史,能識別出問題中的事實性錯誤,還擁有想象力和價值判斷能力,能夠想象古人在現代的生活并從現代價值觀視角進行評判,且語言不乏文學性;2)當用戶重復同一提問時,ChatGPT會分析提問者的反饋,推測其想法、態度,據此調整回答,并結合普世價值觀,給出合理且迎合提問者心理的答戶已高達1億,成為史上活躍用戶規模增長最快的應用。528Feb202352023年2月2日,OpenAI推出ChatGPT的付費訂閱版ChatGPTPlus,提供比免費版更為快速的服務以及新功能優先試用權,月費為20美元。同日微軟宣布旗下的全線產品將與ChatGPT整合,包括云計算平臺Azure以及此前已宣布的搜索引擎Bing(必應)、Office等。2023年2月7日,微軟推出由ChatGPT支持的最新版AI搜索引擎Bing和Edge瀏覽器,次日凌晨宣布已將GPT-4整合到Bing和Edge瀏覽器中。1.2得益于技術提升,應用層面正突飛猛進ChatGPT的問世得益于近年來AIGC(AI-GeneratedContent)技術的持續發展,也對其他AIGC模型具有重要意義,尤其是依托文字、語音模態的類型。未來OpenAI可將ChatGPT與其他AIGC模型集成,拓展更豐富的功能和應用場景,進而助推AIGC浪潮、賦能整個AI產業鏈。Gartner預計,到2025年AIGC將占據所有生成數據的10%。據Frost&Sullivan和頭豹研究院測算,2021年中國對話式AI市場規模為82.7億元,到2026年有望增長至265.8億元,CAGR達26.3%。目前ChatGPT已被應用于多種工作職能中,基于其技術邏輯和特點,中短期內擁有多樣化應用方向與場景,兼顧ToB和ToC,具體主要包括:1)應用于內容創作,提升內容生產效率和豐富度:①完成翻譯、收集素材、選題策劃、寫作稿件等任務(例如美國新媒體巨頭公司Buzzfeed宣布將用ChatGPT輔助內容創作,美聯社使用的Wordsmith每秒可完成2000篇報道),②在文藝、影視等領域,協助編寫劇本和視頻腳本,比如國內海馬輕帆旗下的“小說轉劇本”工具,已深度參與了3萬多集電視劇和8000多部電影的劇本創作過程;③與視頻類AIGC集成,基于文字合成、剪輯視頻以及生成虛擬場景等;2)在商務場景中,協助培訓員工,運用其多輪對話能力擔任智能客服協助營銷、把握消費者需求,從而降低公司用人成本,例如亞馬遜運用ChatGPT生成員工培訓文3)在辦公場景中發揮辦公助手、語音轉換文字、代碼生成等功能,比如微軟計劃將Office軟件與ChatGPT,推出MicrosoftTeams高級版(付費),可自動生成會議筆記;4)在工業場景中,與圖片類AIGC整合、基于對話中的關鍵詞輔助制作設計圖,減少工程設計用時,比如Jasper旗下的StableDiffusion,可基于文本生成圖像,采用了目前全球最大的開放圖像-文本對數據集LAION-5B,且生成效率提高30倍,Jasper的付費用戶目前有IBM、Autodesk等;5)此外,ChatGPT在教育、工業、醫療等行業中也有較大應用空間,比如在教育場景中為學生批改作業、答疑、查漏補缺,在醫療場景中為患者預診、錄入電子病歷現階段海外AIGC賽道玩家數量較多,市場格局尚未定型。其中,領先的生成式AI公司除ChatGPT之外主要有StabilityAI、JaspersAI和Midjourney等,在文字、圖片、音頻生成等領域擁有獨特優勢,且已積累一定的用戶規模。628Feb20236公司對話、文本、圖像生成話對話、文本生成opic對話、語言助手AlabsJurassic話JasperAIJasper,JasperArt成lityAIeDiffusion音頻生成oundAIHoundAI基于文字生成視頻基于文本、圖片生成視頻源:CBInsights,HTIStability.AI公司致力于開發AI開源工具,于2022年8月推出了圖像生成模型StableDiffusion,可根據關鍵詞產生圖片,圖像文本對數量超過5000億,在消費級顯卡上生成的圖像與DALL·E2品質相當,成為其主要競爭對手。StableDiffusion的程序代碼免費、開源,允許所有用戶使用、調整,也可根據自身需求開發應用,已有超20萬用戶運用其源碼開發了圖像、語言、音樂等領域的AI工具,目前各渠道的日活用戶規模累計達1000萬以上。此外,Stability.AI還發布了DreamStudio,使用門檻較低,沒有編程背景的用戶也能輸入提示詞精準生成高質量圖像,最快僅需幾秒,DreamStudio用戶已超過150萬,生成圖像數量超1.7億。目前Stability.AI公司估值約10億美元。728Feb20237DreamStudio操作界面簡潔清晰,參數面板易于操作JaspersAI成立于2021年1月,主要針對商業營銷用途,為商家和個人用戶提供AI文字生成和圖片生成功能。其中,文字生成工具Jasper可幫助用戶生成營銷文案、社交媒體文章、新聞稿、TikTok視頻腳本、郵件等文本,支持29種語言;附加功能圖片生成系統JasperArt可根據用戶輸入的文字生成圖像,并能調整畫法、風格,且擁有無版權圖片庫。據公司數據,使用Jasper生成文案初稿可節省80%的時間,ROI達400%。Jasper和JasperArt均采用付費訂閱制,其中,Jasper訂閱服務分為Starter/BossMode/BusinessMode三檔,收費標準分別為$29/$59/$499每月。相比同業競對公司,JasperAI的主要優勢在于:1)集成大量機器學習模型,包括業界最新的語言生成模型GPT-3.5(由OpenAI開發)和BLOOM(由HuggingFace開發),文字出品質量較高;2)針對目標用戶群體的需求特點對模型進行微調,提供大量實用模板、創作工具(例如翻譯器、抄襲檢驗等),通過優化關鍵詞生成更契合GoogleSEO規則的內容,且速度提升5倍,幫助用戶增大流量曝光、改善營銷效果;3)同時支持圖文生成功能,為用戶創作營銷材料、文藝作品等帶來便利,在電商、社媒、視頻制作等多個新興行業領域具有較高的商業潛力。Jasper同時支持文本和圖像生成功能828Feb20238JasperAI1.25億美元A輪融資,將用于打造核心產品、與更多應用整合以及收購Outrite(一款用于檢查語法和風格的AI軟件,全球用戶數已超過100萬),計劃于2023年整合兩家公司的產品。據公司創始人透露,截至2022年10月,Jasper用戶數已超過10萬;2021年收入達4500萬美元,預計2022年實現收入7500萬美元以上,同比增長約66%。Midjourney是AI繪畫賽道近期最受歡迎的應用,能根據輸入的關鍵詞生成高質量圖像,現已嵌入Discord平臺,用戶基于該平臺的bot機制提交Prompt(即提示詞)即可生成圖片,目前已擁有381萬用戶。Midjourney允許付費用戶創作的圖像用于商業用途,但若收益超過每月2萬美元則需支付20%作為分成,也可與公司官方協定分成比例。Midjourney擅長人像生成,圖像接近照片級品質,制作的3D藝術品也十分逼真、精細,在建筑設計、藝術創作等對圖像質量、審美要求較高的領域擁有顯著優勢,應用前景廣闊。據稱,目前Midjourney每月收入約200萬美元以上。Midjourney各級套餐費用及功能權限ndardPlanlifetimenththmemon--aGPUTime-oloInYoures-???thMode---?ntntntFastobsobsobsobsntinoEarn-???ChatGPT在上線5日內突破100萬注冊用戶,超越Facebook和Twitter(分別用時10個月和2年),兩個月內突破1億用戶,成為全球最快用戶破億的互聯網軟件,對比之下,TikTok和Instagram分別用時9個月和2年半才實現億級用戶量。用戶活躍度方面,據SimilarWeb報告顯示,ChatGPT在1月的日均訪問量達到1300萬人次。我們分析,ChatGPT能夠如此迅速火遍全球,主要得益于:1)ChatGPT長期積累的技術優勢;2)公司大膽嘗試得到市場認可;3)科技巨頭紛紛躬身入局,釋放重視信號;4)大趨勢上,AIGC行業逐漸成熟。928Feb20239TikTokyTelegramGoogleranslateTwitterTikTokyTelegramGoogleranslateTwitter0920月rceUBSHTI臺突破百萬用戶所用時間月50urceFinancialReviewHTI2.1技術上,多輪迭代訓練后已具備先發優勢由OpenAI公司推出的ChatGPT在正式面世之前,GPT家族已有三個基于Transformer技術的自然語言處理模型,分別為GPT-1/2/3,模型每迭代一次,參數量都在幾何式增長,從最初的1.17億增加到第三代的1750億,GPT-3已成為全球最大的語言模型之一。ChatGPT使用的GPT-3.5模型是在GPT-3的基礎上加入ReinforcementLearningfromHumanFeedback(RLHF,人類反饋強化學習)技術和近段策略優化算法,其目的是從真實性、無害性和有用性三個方面優化輸出結果,降低預訓練模型生成種族歧視、性別歧視等有害內容的風險。ChatGPT訓練的過程主要有三個階段。第一步是訓練監督策略,人類標注員對隨機抽取的提示提供預期結果,用監督學習的形式微調GPT-3.5,生成SupervisedFine-Tuning(SFT)模型,使GPT-3.5初步理解指令,這一步與先前的GPT-3模型訓練方式相同,類似于老師為學生提供標答的過程。第二步是獎勵模型,在SFT模型中隨機抽取提示并生成數個結果,由人類標注員對結果的匹配程度進行排序,再將問題與結果配對成數據對輸入獎勵模型進行打分訓練,這個步驟類似于學生模擬標答寫出自己的答案,老師再對每個答案進行評分。第三步是ProximalPolicyOptimization(PPO,近段策略優化),也是ChatGPT最突出的升級。模型通過第二步的打分機制,對SFT模型內數據進行訓練,自動優化迭代,提高ChatGPT輸出結果的質量,即是學生根據老師反饋的評分,對自己的作答進行修改,使答案更接近高分標準。簡而言之,我們分析,ChatGPT的優勢在于,1)使用1750萬億參數的GPT-3為底層模型進行預訓練,為全球最大的語言模型之一;2)算力上得到微軟支持,使用上萬片NVIDIAA100GPU進行訓練,模型的運行速度得到保障;3)算法上使用獎勵模型和近端優化策略進行迭代優化,將輸出結果與人類預期答案對齊,減少有害性、歧視性答案,使ChatGPT更擬人化,讓用戶感覺溝通的過程更流暢。28Feb2023GPT-3.5訓練過程urceOpenAIHTI2.2管理上,OpenAI管理結構更為靈活,為大膽創新奠定了基礎在ChatGPT上線之前,許多科技公司也在培育AI語言模型。如Google一直訓練的LaMDA模型,在2020年開始訓練,初代于2021年5月公布,但由于模型與谷歌的廣告業務發展方向無法匹配,遲遲未推出。該模型使用1370億參數,1.56萬億單詞量,是ChatGPT的5倍。去年夏季曾傳出新聞,Google工程師因為認為LaMDA具有獨立思想而被開除;CEO桑達·皮查伊明確表示,公司將秉持對AI的原則(產品有益于社會發展、安全可靠、對人負責等)以及對信息完整度的最高標準來研發和開放AI產品,Google不同于其他初創公司,不能承擔AI犯下的錯誤對公司的信譽和其他倍受信賴的產品造成的影響,Google對于AI產品的研發和開放持有十分謹慎的態度。既沒有上市,也沒有盈利目標的OpenAI則顯得更為進取。ChatGPT的前身GPT-3模型于2020年發布,在此模型基礎上,公司加入RLHF訓練和PPO,培育出GPT-3.5模型,該模型對應的InstructGPT在2021年1月開始內測,于2022年初對外公布,兄弟版ChatGPT在2022年11月末正式推出,即GPT-3.5模型從灰測到對外公布僅用時不到2年。公司能夠快速且大膽推出ChatGPT,除了基于ChatGPT本身的優越性能,也是為GPT-4收集更多公開對話數據,繼續擴大可用參數規模。盡管ChatGPT仍有明顯缺陷,在推出后屢現“胡說八道”的情況,且面對復雜的數理化問題無法提供正確答案,但瑕不掩瑜,用戶對于這位先行者的錯誤結果展現出更多包容,相比之下,Google于2月6日推出的AI對話機器人Bard由于答案出錯,公司當日股價一瀉千里。占據先發優勢的ChatGPT在面世后迅速風靡各行各業。據S對超過1千名大學生調查顯示,已有89%的學生使用ChatGPT輔助完成作業,48%的學生在做居家測驗時使用ChatGPT,53%的學生將其用于寫論文,22%的學生用于寫論文框架;除了教育行業,廣告從業人員、網文寫手、探店博主等都在嘗試使用ChatGPT輔助撰寫軟文和稿件。企業方面,微軟已宣布將ChatGPT嵌入必應搜索引擎,未來會陸續整合進Windows系列產品、Teams和云服務;奢侈品電商寺庫和美國著名媒體公司BuzzFeed于近期宣布與ChatGPT開展業務合作;亞馬遜員工也在Slack表示已經將ChatGPT應用在多種工作職能中,但目前律師警告員工勿將公司機密信息告訴ChatGPT。28Feb202390%80%70%60%50%40%30%20%10%%9%53%48%2%完成作業居家測驗寫論文構建論文框架urceStudycomHTIChatGPT公開合作公司合作企業合作方式微軟將ChatGPT嵌入Bing搜索將ChatGPT與Teams、Azure云、Windows系列產品整合BuzzFeed運用ChatGPT協助創作個性化內容寺庫電商對AIGC和ChatGPT進行研究,實現與真人類似的互動對話,豐富相關內容2.3科技巨頭躬身入局,發布重視信號在ChatGPT對外公布并成為全球熱點之前,微軟公司早在2019年已經投資10億美元成為OpenAI的金主之一,并在2020年GPT-3發布時獲得獨家授權訪問底層代碼,將API整合到微軟的產品和服務中。此次ChatGPT走紅,微軟繼續加碼100億美元投資。AIGoogle2月21日發出紅色警告,表示類ChatGPT聊天機器人將會顛覆搜索引擎行業,對Google的廣告業務帶來重創,隨后于2月初,Google宣布投資4億美元在OpenAI的競對公司Anthropic,并推出AI聊天機器人Bard,緊跟熱潮。國內同樣可見科技巨頭如百度、阿里和京東等紛紛宣布打造類ChatGPT產品,加速布局AIGC產業。技公司入局時間梳理時間事件2019/07/22微軟向OpenAI注資10億美元2022/09/22微軟獲得GPT-3底層代碼的獨家授權訪問權限2022/11/30ChatGPT面世2022/12/21Google發出紅色警告,宣布將圍繞ChatGPT全面調整Google未來一年在AI領域的工作2023/02/04Google宣布投資4億美元在OpenAI的競對公司Anthropic2023/02/06GoogleCEO發表文章介紹類ChatGPT的AI聊天機器人ApprenticeBard2023/02/07百度官宣類ChatGPT項目文心一言,預計3月對外開放2023/02/08阿里宣布達摩院正在研發類ChatGPT的對話機器人,目前已經開放給員工內測2023/02/10京東公布產業版"ChatGPT":“ChatJD"28Feb20232/012/062/112/162/212/262/3101/0501/1001/1501/2001/22/012/062/112/162/212/262/3101/0501/1001/1501/2001/2501/3002/0402/09900,000谷歌搜索指數變化(2022/12/01-2023/02/09)00ourceGoogleTrendHTI搜索指數變化(2022/11/30-2023/02/12)849565849565800,00000,00000,00000,000400,00033850900,0003385090,00000-30/1105/1210/1215/1220/1225/1230/1204/0109/0114/0119/0124/0129/0103/0208/022.4生成性AI技術逐漸成熟,頭部公司展開算力、算法與數據布局數據、算法、算力布局名稱模型應用數據算力算法OpenAIChatGPT1750億參數,3000億單詞語料庫 (60%來自2016-2019年的C4語料庫,22%來自WebText2數據集,16%來自書本,3%來自維基百科)使用NVIDAV100GPU訓練,使用NVIDAA100GPU運行預訓練+微調(獎勵模型和近端策略優化)GoogleLMApprenticeBardLaMDA模型使用1370億參數,PaLM模型使用5400億參數,Bard使用1.56萬億單詞語料庫,2.1T個令牌自研芯片TPUv4,主要與集群相連應用,每一個集群中包含4096枚芯片,運行速度可以達到百億億次每秒預訓練+微調(評估回答,檢索外部信息)MetaOPT-175BBlenderBot31750億參數,180B的令牌數據集 (來自RoBERTa的訓練數據集、CC100的英文數據集、Pushshift.ioReddit和ThePile數據集)使用128張40gb的NVIDIA預訓練+微調(根據用戶A100GPU訓練反饋持續學習)AmazonAlexaTMAlexa200億參數Inferentia2高性能機器學習推理芯片,運算速度達到2.3千萬億次/秒,搭載了Inf2的實例比使用GPU的實例的吞吐量提高2.3倍,成本降低70%使用Seq2Seq的解碼器-編碼器架構28Feb2023OpenAI:ChatGPT使用的GPT-3.5模型,是由基于1750億參數的GPT-3迭代而來。據悉,GPT-3模型中的世界知識來自3000億單詞的訓練語料庫,其中60%來自于2016至2019年的C4語料庫,22%來自于WebText2(WebText是由OpenAI收集Reddit網站內3分以上的回答整理而來的數據集,截止至2017年12月共匯總8,013,769份文件,規模達到40GB,而WebText2是在WebText的基礎上繼續更新數據至2020年4月,且包含所有語言的回答),16%來自于書本以及3%來自于維基百科。GPT-3.5是在GPT-3這個預訓練大型語言模型的基礎上進行代碼訓練和指引微調迭代的模型,由于GPT-3.5目前沒有接入互聯網,模型內的數據更新截止至2021年。資料顯示,ChatGPT在運算時使用了1萬張NVIDIA的A100GPU(目前被禁止出口中國和俄羅斯市場售賣),單個顯卡的運算速度達到19.5萬億次/秒。在ChatGPT模型內單張A100GPU可以在350毫秒生成1個詞語,而ChatGPT每一個回答包括約30個詞語,以每秒生成15-20個詞語的速度計算,大約需要5張芯片來運行模型和處理文本,需要至少8張芯片來運行服務器。GPT-3.5現已經在微軟AzureAI基礎設施上進行訓練,而微軟對于使用A100GPU的收費是每小時3美元,按照這個價格推算,每生成一個30詞的回答需要1美分(與OpenAICEO對于成本的回應相符)。Google:Google緊跟OpenAI推出的BardAI對話機器人,使用了LaMDA模型。該模型使用1370億參數,主要訓練分為兩個階段。在預訓練階段使用的數據集由1.56萬億單詞組成,后續將這些單詞整理成2.81T個令牌的數據庫進行訓練,數據主要來源是公開的網絡文件。訓練的第二階段是微調,也是LaMDA作為開源模型比GPT-3.5更有優勢的一點。LaMDA的微調包括兩個方面,1)對生成文本進行性能安全和質量評估,主要觀察SSI三個方面,分別是合理性(Sensible)、針對性(Specific)以及趣味性 (Interesting);2)對生成文本進行外部信息檢索,通過學習外部知識,使回答更盡可能不違背事實。第二項微調對比ChatGPT(數據更新截止至2021年),LaMDA獲取的數據量更大,為用戶提供最新的信息回復。在算力上,LaMDA主要使用Google自研TPUv3芯片集群。除了LaMDA之外,Google于2022年4月推出另一大型語言模型PaLM,規模達到5400億參數,使用的芯片是自研TPU最新版v4。TPUv4芯片主要與集群相連應用,每一個集群中包含4096枚芯片,運行速度可以達到百億億次每秒,在測試訓練語言模型BERT時,同樣數量的TPUv4對比NVIDIAA100,TPUv4的速度提升了1.15倍。在訓PaLM,Google使用了兩個TPUv4集群。由于Google的LaMDA和PaLM模型目前暫未全面開放,公司沒有公布模型訓練和使用的成本。Meta:Meta的開源AI對話機器人Blenderbot初代于2020年公布,參數規模為94億,是當時市面上最大系統的3.6倍,經過兩代更迭,Meta在2022年8月推出Blenderbot3,共3個參數版本,最大規模達到1750億,預訓練數據集包括180B個令牌,數據主要來自于RoBERTa的訓練數據集、CC100的英文數據集、Pushshift.ioReddit和ThePile數據集。除了對數據集進行預訓練,Blenderbot3的主要改進是持續學習計劃。在微調的過程中,模型會同時開展對外搜索和對內索取長期記憶,將信息整合輸出回答。在答復發出之后,用戶可以點贊或點反對,Blenderbot3會繼續跟進用戶反饋生成新的對話,繼而收集資料對模型進行微調優化。據資料顯示,Blenderbot3在訓練時使用了128張40gb的NVIDIAA100芯片,推出后僅在美國上線,且只有30億和300億參數規模的兩個小模型對外開放,1750億參數的模型需要額外提交申請方可使用。28Feb2023Amazon:Amazon推出的大規模多語言模型AlexaTM主要用于提升語音助手Alexa的服務,該模型的參數規模只有200億,采用seq2seq(串行到串行)的編碼器-解碼器架構,主要用于多語言翻譯和生成文本摘要。經測試,包括了編碼器架構的AlexaTM在文本摘要和語言翻譯的效果明顯優于只有解碼器架構的GPT-3和PaLM。作為世界頭部云廠商,Amazon更多發力在自研芯片和處理器,在2022年舉行的云科技re:Invent全球大會上,Amazon公布了3款新芯片及對應的彈性云計算應用實例。其中Inferentia2高性能機器學習推理芯片是為運行1750億參數規模的大型語言模型而生,相比前一代Inf1提高3倍計算性能,運算速度達到2.3千萬億次/秒,對比基于GPU的同類應用實例,搭載了Inf2的實例吞吐量提高2.3倍,成本降低70%。3.微軟作為破壞性創新者,在算力+算法+應用生態上已呈現完整布局作為OpenAI的主要投資人,微軟在AIGC算法領域布局較早,其2019年3月就對OpenAI進行了10億美金注資。今年1月24日,微軟公司在官方博客宣布已與OpenAI公司擴大合作伙伴關系,兩家公司合作伙伴關系進入第三階段,微軟將向OpenAI進行一項為期多年、價值數十億美元的投資,以加速其在人工智能領域的技術突破。我們認為,微軟在AIGC領域的完整生態,可助力其在未來發展中保持優勢。具體而3.1強大的算力為微軟在AI領域奠定了良好基礎自2019年注資OpenAI開始,微軟便成為了OpenAI的獨家云計算服務商。微軟的云服務一直為OpenAI的產品、API服務和研究中所有的工作負載提供支持,同時雙方在Azure上合作研發人工智能超級計算技術。此后,微軟于20年便推出了用于在Azure上訓練超大規模人工智能模型的超級計算機,其擁有超過28.5萬個CPU核心和1萬個GPU,其中每GPU擁有400Gbps網絡帶寬。根據微軟20年Build開發者大會介紹,此超算平臺性能位居全球前五,并且得益于在Azure上托管,這臺超級計算機擁有現代云計算基礎設施的各種優點,包括快速部署、可持續發展的數據中心并可以訪問所有Azure服務。強大的算力是ChatGPT不斷迭代進化的基礎:從數據需求看,GPT3.0使用了1750億個參數進行訓練,根據Linux中國報告,GPT-4預計將使用數萬億參數。這預示著更多的算力需求以及高集中度的云服務。從專注于感知型(圖像、聲音和視頻等感官數據的解讀)人工智能進化到生成型人工智能(新內容的創建),這將需要成倍增長的計算能力。我們認為,微軟的強大的算力疊加生態服務,為公司在AIGC領域奠定了良好基礎,且這一優勢已在過去云基礎服務市場所驗證:在全球云基礎設施服務市場,根據SynergyResearchGroup數據顯示,微軟Azure在2Q22市場份額已達到21%,僅次于亞馬遜AWS,并呈節節上升之勢。28Feb2023SourceSynergyResearchGroup;HTI3.2AIGC算法層面,微軟在自研與合作上同時進行:1)與OpenAI緊密合作,后者已在為微軟定向研發下一代大型語言模型(LLM)-根據2月8日微軟發布會介紹,這一模型專為搜索服務定制,其吸取了ChatGPT和GPT-3.5的重要經驗,而且速度更快、更準確,這一模型將搭載在全新的Bing服務上。此外,微軟與OpenAI合作研發的“PrometheusModel”也將應用在新的Bing搜索服務上,其可提高搜索結果相關性,同時更加安全;2)此外,微軟聯手英偉達推出了威震天-圖靈自然語言生成模型(MegatronTuring-NLG),其包含5300億參數,幾乎三倍于ChatGPT3的參數數量,為目前全球規模最3)同時在去年4Q,微軟推出了新的視覺基礎模型Florence,其具有6.4億參數量,該模型將表征從粗粒度(場景)擴展到細粒度(對象),從靜態(圖像)擴展到動態 (視頻),從RGB擴展到多模態。通過結合來自Web規模圖像-文本數據的通用視覺語言表征,Florence模型可以輕松地適應各種計算機視覺任務,包括分類、檢索、目標檢測、視覺問答(VQA)、圖像描述、視頻檢索和動作識別;28Feb2023Source研究院;HTISource軟;HTI28Feb2023NLP數量正呈指數增長SourcePublicInformation;HTI3.3應用上,商業化落地已見雛形;搜索市場份額有望提升首先,21年微軟與OpenAI共同推出AI編程工具GitHubCopilot。在2022年6月22日,Copilot已正式上線,定價每月10美元(約66.9元人民幣)或每年100美元(約669元人民幣),對學生用戶和流行開源項目的維護者免費提供。根據微軟CEO納德拉,最近在GitHubCopilot上突破了1億開發者,且有用戶使用GitHubCopilot構建了80%的代碼。其次,微軟也在將ChatGPT整合進入自身的云生態之中。據微軟披露,ChatGPT版Teams工具可以輔助用戶完成更多的辦公功能,比如起草工作郵件,記筆記、做會議紀要等事務性工作,并且能夠自動提供在辦公平臺上舉行的會議的回顧,根據會議討論情況生成任務清單,并提供會議記錄和總結。另外,微軟旗下的Dynamics365ERP產品宣布在VivaSales客戶關系管理軟件中集成ChatGPT,可以生成對企業客戶的電子郵件回復,進一步代替人工完成重復的文字工作。此外,近期關注度更高的是其即將推出的搭載了AI功能的Bing搜索引擎。根據微軟CEO納德拉在2月8日的發布會上所言,傳統搜索引擎痛點主要在于結果不準確,而新的Bing搜索引擎將有效解決這一痛點:“目前的搜索引擎,人們40%的時間都是點擊搜索鏈接并立即返回,這表明搜索結果并不可信,我們希望在搜索領域再次進行創新-微軟稱其為’您的網絡副駕駛’,這個副駕駛的核心是一個全新的Bing搜索引擎和Edge網絡瀏覽器,其中Bing將直接回答您的問題,并提示您發揮更多創意”。28Feb2023具體來講,全新Bing在技術上將有四重突破:1)模型上:Bing將在OpenAI的下一代LLM(大型語言模型)上運行,其專為搜索定制,帶來全新的交互體驗;2)搜索算法上,微軟與OpenAI合作的“PrometheusModel”可提高搜索結果相關性,同時更加安全;3)將人工智能應用于核心搜索算法。微軟將AI模型應用于其核心必應搜索排名引擎,從而實現了二十年來相關性的最大躍升。有了這個AI模型,即使是基本的搜索查詢也更加準確和相關;4)用戶體驗設計上,新的Bing將帶來集答案、聊天和瀏覽一體的搜索體驗。更好的體驗具體體現在:1)更相關的答案:新版必應將會改進用戶搜索體驗,在一些簡單的事情如體育比分、股票價格和天氣等,新必應會提供更相關結果,如果用戶需要,它還會提供一個新的側欄,顯示更全面的答案。2)完整的答案:必應會審查從網絡上搜索到的結果,從而找到并總結用戶想要的答案。例如這一問題「如何用雞蛋代替蛋糕中的另一種成分」,新版必應能夠給出詳細說明,而無需滾動瀏覽多個結果。3)全新的聊天體驗:對于更復雜的搜索,比如計劃詳細的旅行行程或研究要買什么電視,新版必應提供了新的交互式聊天功能。聊天體驗使用戶能夠通過詢問更多細節、清晰度和想法來優化搜索,直到獲得用戶正在尋找的完整答案,并提供可用鏈接,以便用戶可以根據搜索結果采取行動。4)內容生成:有時用戶需要的不僅僅是答案,還需要靈感。必應可以通過生成內容來幫助達到此目的。例如它可以幫助編寫電子郵件、創建規劃假期行程、預訂旅行和住宿的鏈接、準備工作面試等。必應還引用了信息所有來源,用戶可以看到它引用網絡內容的鏈接。5)瀏覽器AI助手:Edge瀏覽器進行了更新,包括AI功能和外觀,并添加了兩個新功能。聊天和撰寫。借助Edge側邊欄,用戶可以得到一份冗長的財務報告摘要,從而獲得報告關鍵要點,然后用戶也可以使用聊天功能來獲得與競爭公司財務狀況的比較,并自動將結果放入表格中。SourcePublicInformation;HTI28Feb2023公司對搭載了全新AI功能的Bing搜索商業化前景充滿信心。事實上,公司本身的廣告業務已連續兩年快于市場增長(微軟22年搜索與新聞廣告收入約180億美金,兩年CAGR為24%,快于全球數字廣告市場19%增速)。根據eMarketer數據,全球數字廣告市場22年規模為5700億美金,其中40%為搜索廣告,據此計算可得知微軟僅占搜索市場6%份額,而谷歌份額高達70%。未來來看,公司認為不斷優化的Bing搜索體驗將助力其獲得市場份額,尤其是國際市場份額(考慮到公司在大型語言模型上的優勢將助力滲透海外當地市場)。根據公司測算,每一個百分點的市場份額提升,將為其帶來20億美金的廣告收入增量,約占22年公司搜索與新聞廣告收入11%。全球數字廣告市場收入(十億美金)微軟搜索與新聞廣告增速Source軟;HTI我們發現,受到ChatGPT直接負面影響的玩家(如搜索引擎),更多是通過加速推出自研的聊天機器人來進行對抗:Google這樣可以提供算力和資金的巨頭同時采用聯合和投資ChatGPT的競對的手段來建立自己的護城河。而AI實力較弱的下游公司,更多是采用合作的態度對待ChatGPT。非直接對抗,有自己AI研發能力的公司,比如Amazon會采用謹慎合作的態度,在使用ChatGPT功能時,同時防止自身信息泄露。2028Feb2023204.1防守策略之一:直面競爭ChatGPT的問答模式,長期來說,很可能在目前Google壟斷的搜索引擎市場撕開裂縫,特別是跟Microsoft結合之后。Google的搜索廣告業務在變現端也會承壓,因為其廣告業務建立在從關鍵詞到鏈接到頁面的基礎上,頁面給到廣告以展示空間,而用戶的瀏覽記錄也是公司的數據資源,幫助提高廣告投放的效率。鑒于ChatGPT的迅猛的發展勢頭以及未來很大可能的對GoogleAI地位和搜索業務的挑戰,在ChatGPT推出后,Google對其是對抗態度,主要舉措包括對ChatGPT的競對進行投資和合作,以及,緊急發布自研聊天機器人。(1)谷歌CEOSundarPichai在公司內部發布了“紅色警報”(CodeRed),并稱將圍繞ChatGPT,全面調整2023年谷歌在AI領域的工作。據《紐約時報》,谷歌內部包括研發、安全和信任等多個部門的團隊被重新分配工作,輔助開發新的AI技術原型和產GoogleCloud為Anthropic首選云供應商,為其提供AI算力。Anthropic,由OpenAI前研究副總裁達里奧·阿莫迪(DarioAmodei)、GPT-3論文一作TomBrown等人于2021年成立,推出了聊天機器人Claude,在此之公司發布了論文,描述了一個基于無監督方式訓練、520億參數的模型AnthropicLMv4-s3,直接對標OpenAI的GPT-3模型。目前,Claude尚未向公眾發布,計劃在未來幾個月內擴大個人對Claude的訪問。Anthropic強調其旨在構建“可靠、可解釋和可操縱的人工智能系統”。這個目標讓Anthropic比OpenAI更加謹慎和可靠,但也限制了Anthropic的模型開發速度。據拿到內部試用權的網友,Claude在邏輯性和信息正誤判斷上,優于ChatGPT。Google這一舉動表現出,其可以基于Google云計算平臺來跟生成式AI公司綁定關系,從而搭建AI護城河的意圖。除了Anthropic,Google云也和Cohere和C3.ai合作,未來會發布更節。(3)另外,2023年2月8日,Google開發布會展示Bard,并表示未來幾周將提供更廣泛的服務,比如整合了聊天機器人的新搜索頁面(該搜索頁面,可能會使用問答形式,主搜索頁面提供五個不同的潛在問題提示,搜索欄還會添加聊天標志)。Google強調,Bard會把世界上的信息知識和Google的語言模型結合,基于實時網絡。Bard目前向有限開發者推出,而不像ChatGPT一樣,一開始便全開放。2128Feb202321GooglerceGoogleHTIRDrceGoogleHTI其他的搜索引擎玩家也采取了相應的措施,推出結合自己優勢的聊天機器人產品,比如Neeva,意圖推出能夠同時展示綜合答案和相關網頁來源的問答產品,使用戶能夠確定結果的真實性和可信度。對比ChatGPT和Bard,我們認為兩者都都可以將復雜的信息和多個視角提煉成易于理解的文字輸出格式。不同的點有1)因為兩者基于的模型不同,從而實現的高效的場景是不同的,Bard基于LaMDA的模型,在大量的對話數據上訓練,能夠生成有對話2228Feb202322性和語義意義的文本;ChatGPT基于GPT模型,是用于生成語言的,有助于任何需要生成文本的工作,如文章寫作,故事寫作等;2)目前開放的范圍,ChatGPT大于BARD,前者面向公眾開放,已經有1億月活用戶(2023年1月);后者目前只是面對有限的開發者開放測試。ChatGPTBARD股東\所屬公司微軟\OpenAIGoogle語言模型GPT-3.5MDA模型目的GPT是用于生成語言的,有助于任何需要文本生成的工作,如文章寫作,故事寫作等LaMDA是用來實現對話,在大量的對話數據上訓練,能夠生成有對話性和語義意義的文本模型架構TransformerTransformer開源范圍公眾有限,較GPT使用范圍少信息來源目前ChatGPT的信息則來源于2021年之前,整合微軟Bing之后,理論上也可以獲得實時的信息互聯網實時信息以及Google生態的維基百科文章、書籍和網頁等更適用于文本生成和回答問題等理解上下文和詞語關系更優urceProjectProHTItGPTrceGoogleHTI雖然,ChatGPT的開放比Google更早,但我們認為Google仍有優勢進行追趕:1)全球搜索主導地位,無論從用戶量、用戶搜索行為數據還是搜索資源上,Google有優于OpenAI和微軟;2)Google儲備了許多大型AI語言模型,包括BERT,MUM和LaMDA等,所有這些都被用于改進谷歌的搜索引擎和AI相關輸出,Google后續還有PaLM (可達5400億參數);3)更強的資金實力,Google在利潤規模,研發費用規模上明顯高于Microsoft.長期來說,我們還是看好Google在AI方面的技術、資金和數據優勢,不過短期來說,Google勢必要投入更多的時間和資源在AI研發上來應對OpenAI帶來的威脅。因此,我們認為Google短期利潤承壓。2328Feb202323Google,Microsoft,OpenAI財務對比億美元,2022年GoogleMSFTOPENAI收入2,8282,04110(2024年)金流600596研發費用395266研發費用占比Non-GAAP凈利潤7937614.2防守策略之二:展開合作一些非搜索引擎類公司對ChatGPT采取的是合作態度,特別是內容創作,分發等公司,比如Buzzfeed宣布計劃采用ChatGPT協助內容創作。亞馬遜對ChatGPT是采取謹慎合作的態度,據Slack,亞馬遜的員工已經使用ChatGPT運用在各種工作職能,包括回答面試問題、編寫軟件代碼和創建培訓文檔等.但是律師警告員工信息保密政策,即不要向ChatGPT提供“任何亞馬遜機密信息。亞馬遜AmazonWebServices(AWS)云部門已經成立了一個小型工作組,以更好地了解人工智能對其業務的影響。亞馬遜為員工使用ChatGPT設置了許多內部防護措施。例如,當員工使用工作設備訪問ChatGPT網站時,會彈出防火墻警告消息。ChatGPT目前并沒有正式進入中國,根據其目前在海外的產業結構,可以分為上游基礎設施層,中游模型層、和下游應用層:基礎設施層:主要包括硬件制造商,云廠商以及數據服務商,用以承載AI模型的訓練和推理。根據ChatGPT的回答,它的基礎設施構建在云上,由大量的高端CPU和GPU組成的高性能計算機集群,以及網絡環境和存儲系統組成。OpenAI采用的是微軟Azure云服務,其他海外AI云廠商還包括亞馬遜AWS和谷歌GCP這樣的頭部云廠商,以及CoreWeave這樣的專門GPU云廠商等。2428Feb202324ChatGPT對自身基礎設施情況的回答ceChatGPTHTI根據微軟在20年披露,為OpenAI打造的超級系統擁有超過28.5萬個CPU核心和超過一萬個GPU,根據騰訊研究院報告,大模型的訓練成本高達2760萬美元(約2億人民幣),而ChatGPT22年收入約為1000萬美元,目前該產業鏈的最大價值獲得者仍在基礎設施端。業內普遍認為該系統主要使用的是英偉達GPU,根據JPR統計,英偉達3Q22在高端GPU的出貨量市占率高達90%,是AI芯片的絕對龍頭,其他海外玩家主要包括AMD,英特爾等芯片廠商,以及類似谷歌和蘋果這些為自家產品推出自研AI芯片的科技廠我們把ChatGPT用于訓練模型的數據源也考慮進基礎設施層,根據ChatGPT的回答推斷,ChatGPT既使用外部數據合作方也使用自身的數據集進行訓練。一般提供AI云服務的云廠商也會提供機器學習和AI訓練所需的數據集,其他海外數據方還包括一些專門的數據商,例如Kaggle(擁有超過5萬組公共數據集和超過40萬組非公共數據集)。2528Feb202325ChatGPTChatGPT對自身數據來源的回答2ceChatGPTHTIceChatGPTHTI模型層,即ChatGPT所在的環節,是整個產業鏈的核心,模型層的技術突破才使整個產業鏈得以實現。除了ChatGPT外,海外其他頭部玩家還包括和谷歌研發的和ChatGPT一樣同為Transformer-based語言訓練模型的BRET,Stability.AI的開源圖片生產AI項目StableDiffusion等。應用層,即基于模型層的訓練模型,開發終端應用或插件的公司,可以大致分為三類:1)以API接口的形式在自家App或插件上接入其他廠商模型來面向終端用戶,例如接入ChatGPT接口的文案自動生成平臺Jasper,使用OpenAICodex提供實時的代碼編寫或輔助服務的GitHubCopilot等。2)采用自研模型的生成式AI產品,例如ChatGPT本身和谷歌AlphaGo等;3)將AI模型本身作為產品出售的公司,例如Runway等。類比海外產業鏈,中國產業鏈尚在形成過程中,我們認為:中國產業鏈在基礎設施層,主要是芯片方面和海外存在巨大差距,但這在芯片被卡脖子的現實下,也預示著發展空間。其次國內模型層的研發存在落后1-2年,但我國產業鏈在云基礎設施市場增速較高,且在下游應用端存在競爭優勢。具體而言:2628Feb202326.5ChatGPT使用其他海外主要玩家中國主要玩家上游-基礎設施芯片云計算數據英偉達GPU華為、百度、騰訊、阿里、寒武紀、璧仞科技、墨心人工智能微軟Azure亞馬遜AWS,谷歌GCP,CoreWeave等OpenAI+數據合作方Kaggle(machinelearning和AI數據集提供商),亞馬遜AWS,谷歌GCP,微軟Azure百度,騰訊,字節,海天瑞聲(AI數據標注服務商)模型作為底層ChatGPT自研BERT(谷歌),StableDiffusion(Stability.AI)新興機構:智源研究院,之江實驗室,鵬城實驗室,IDEA下游-應用自研模型接入他人模型將模型作為產品售賣ChatGPT自研谷歌,Midjourney,頭部互聯網廠商:百度(文心百中,文心一格),網易,京東,字節,騰訊;技,靈動音科技等Jasper,GitHubCopilotRunwaySourceaz量子位,HTI中國AI云基礎設施市場增速可觀,但在芯片方面差距巨大:根據IDC,2022年中國AI公有云服務市場規模將達74.6億元,同比增長69%,而根據Technavio預測推算,2022年全球AI云服務市場規模約為545億元,中國公有云市場規模占比全球市場約為8%。同時Technavio預測全球AI云服務市場在2022-26年CAGR約為21%,遠低于中國市場增速;并且在過去三年間,中國AI公有云服務市場的增速均高于中國整體AI軟件市場的增速,說明中國AI公有云市場正在蓬勃發展,并有望提升在全球市場的份額。其中主要玩家包括百度云,阿里云,華為云和騰訊云等,根據IDC和我們的估計,1H22這四家頭部玩家依次占據28%/28%/21%/17%的市場份額。對比2020年到1H22的市場份額變化,可以發現,百度智能云四年居第一,但其市場份額在逐步縮小,從33%收縮到了28%,騰訊云的市場份額從19%收縮到了17%,而華為云的份額從12%擴張到了21%,華為云在逐步擴張勢力。中國AI公有云市場規模(億元)74.674.644.144.124.124.12019202020212022AI公有云市場規模(億元)AI公有云市場規模(億元) 中國AI市場增速rceIDCHTI在芯片層面,根據%其他,6%百度智能云,28%騰訊云,28%華為云,21%阿里云,28%rceIDCHTI目前中國仍以GPU為主實現數據中心計算加速,市場占有率近90%;和國際情況類似,國內GPU的主要供應商同樣是英偉達。但在22年8月美國政府禁止英偉達向中國出口其廣泛用于AI產業的高端A100和H100芯片以及搭載這兩款芯片的系統或設備,以及未來性能更高的芯片。隨之,英偉達選擇推出性能較低的替代產品A800來繞過監管,但其芯片間傳輸性能較A100下降了50%,對于多芯2728Feb202327片訓練場景,傳輸性能的降低意味著訓練效率的降低。同時,比較A800和國際領先的H100,其在制程、性能和傳輸速度上都和H100有較大差距,意味著國內AI訓練和推理在芯片硬件端的條件和國際存在較明顯差距。雖然短期而言,A800依然可用于AI模型訓練,且國內還有部分A100存量可以使用,但本身A800就與英偉達海外流通產品有性能差距,隨著英偉達未來不斷迭代其高性能芯片,國內玩家在算力方面的追趕依然具有挑戰性。芯片產業一直是我國被美國卡脖子的行業之一,目前國內進行自研AI云端計算芯片的龍頭企業主要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數學教學環節課件圖片
- 教顏色的單詞課件
- 開禮盒教學課件
- 【蘇州】江蘇蘇州常熟經開區遴選事業單位工作人員6人筆試歷年典型考題及考點剖析附帶答案詳解
- 敦煌古箏活動方案
- 舊衣扎染活動方案
- 文化體育游泳活動方案
- 數據共享沙龍活動方案
- 時光小院手工活動方案
- 無人機經營活動方案
- 嬰幼兒語言發育篩查量表優質資料
- 《屹立在世界的東方》示范課教學課件【人教部編版小學道德與法治五年級下冊】
- GB/T 16924-2008鋼件的淬火與回火
- 基礎護理學:肌內注射
- 應急值守專題培訓課件
- DB23T 1318-2020 黑龍江省建設施工現場安全生產標準化實施標準
- 新加坡公司法-英文版
- 醫院管理腎內科腹膜透析護理常規
- 自動控制原理浮球液位控制系統課程設計
- 離婚一方財產轉移
- 隧道施工安全技術教育培訓記錄(共19頁)
評論
0/150
提交評論