計算機行業重大事項點評:AI洞察字節與OpenAI等Agent多點更新_第1頁
計算機行業重大事項點評:AI洞察字節與OpenAI等Agent多點更新_第2頁
計算機行業重大事項點評:AI洞察字節與OpenAI等Agent多點更新_第3頁
計算機行業重大事項點評:AI洞察字節與OpenAI等Agent多點更新_第4頁
計算機行業重大事項點評:AI洞察字節與OpenAI等Agent多點更新_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目 錄一、AI洞察:字節與OpenAI等Agent多點更新 4二、國內 5(一)紅中布XBench:AI學術估系新 51XBench的要能 52、估制紹 53Xbench蹤Agent品市變化 7(二)豆上視通功能:AI進實視互時代 91、心術破架級 92、活景能視驗 103AI智能業變引領 10(三)QQ瀏器出首個考Agent“AI高通” 1、托元術打考智服新桿 2、周精護航 (四)昆天超智體(SkyworkSuperAgents)動App正上線 1、創動公范引領AI辦公能型 三、國外 12(一)OpenAI升級Operator智體推能躍新臺階 121、要塊新 12四、投資建議與相標的 13五、風險提示 14圖表目錄圖表1 Xbench-雙軌圖 6圖表2 AGITracking架介紹 6圖表3 ProfessionAligned下家維式建務流程 7圖表4 OpenCompass始估力計果 8圖表5 Agent行三個TMF階段 8圖表6 包新頻能展示 9圖表7 包新頻能展示 10圖表8 AI高考界紹 圖表9 OpenAI更推文 13一、AI洞察:字節與OpenAI等Agent多點更新5月26日AI領域動態:國內方面:AIXBenchAI理論能AIAIXBenchAIAIAppAIAIAIAIAIQQ瀏覽器推出高考Agent“AIAgentAgentAgent(SkyworkSuperAppAgent使得用戶可以在移動設備上隨時隨地利用碎片化時間進行辦公、學習等操作,為Agent國外方面:OpenAIOperator4oo3Operator智能體能夠更精準地捕捉用戶指令需求。O3版本的升級極有可能激發其他企業加快AgentAgentAI我們認為AI細分領域產品的不斷推出,有望加速AI在日常生活中的滲透。二、國內(一)紅杉中國發布XBench:AI學術評估體系更新526日投資公司紅杉中國正式推出全新AI基準測試工具(xbench:ackngAgensPodct,ScanghPoesonAgnedReaodEauaonAI1、XBench的主要功能雙軌評估AIAI長青評估機制Agent核心評估集xbench-ScienceQA和xbench-DeepSearch(垂直領域智能體評測實時更新與Agent2、評估機制介紹Xbench1)雙軌評估估機制介紹xbenchxbench-AGIxbench-ProfessionAlignedAGITrackingAgentxbench-AGITracking01AI關鍵能力在AGITracking01ProfessionAligned圖表1 Xbench-雙軌框架圖紅杉中國官網紅杉中國官網GIackngxbenhScenceAxbecDeepSach專注于評估AI紅杉中國官網圖表2 AGI框架介紹紅杉中國官網ProfessionAlignedAgentProfessionAlignedxbenchProfessionAligned可評估的任務項。對于部分暫不可評估的任務,通過模擬方式轉化為可評估形式。評估LiveTMFAgent圖表3 ProfessionAligned下專家思維模式構建務流程紅杉中國官網紅杉中國官網EegeenaLiveBenchLiveCodeBenchAICapacityxbench的評測。針對ProfessionAlignedEvals:xbenchLivexbenchAgent3、Xbench追蹤Agent產品市場變化相關報告AgentXbenchAgentAgent選擇運用項目反應理論(IRT,ItemResponseTheory)xbench-IndexAgent得出的能力評分,不僅能直觀呈現模型能力隨時間的增長軌跡,而且即使評估題目處于動態更新過程中,也能清晰捕捉到能力發展速度和關鍵突破節點。Xench團隊通過OpenCompassGoogleGemini202410升,以及Deepseekv2R1的相關報告評估方式可以突破時間限制。圖表4 OpenCompass原始評估能力估計紅杉中國官網紅杉中國官網xbench評估了Agent的技術-市場契合點。Xbench團隊認為每個專業領域會經歷三個TMF1.TMFAgent2.AgentHumanAI(1)(2)AIProfit3.AgentAgentAgents紅杉中國官網圖表5Agent行業三個TMF階段紅杉中國官網XbenchAI12AI2對于Xbench這樣的專業對齊評估體系而言,其致力于攻克的核心難題,便是探索出一套AI度落地與應用提供精準指引,推動AI(二)豆包上線視頻通話功能:AI進入實時視覺交互時代APPAI進行AI豆包公眾號圖表6 豆包更新視頻能展示豆包公眾號1、核心技術突破與架構升級此次豆包視頻通話功能的上線,依托于視覺理解模型的三大核心技術突破。通過多模態信息融合架構,模型能夠同時處理視覺畫面與語音指令,實現跨模態數據的深度解析;借助任務自適應學習算法,從人文景點講解到高等數學公式推導,均可精準完成差異化復雜任務;配合實時網絡知識圖譜,動態抓取權威信息,確保輸出內容的準確性與時效性。202412(CNN)Transformer“+聽”2、生活場景智能化視頻體驗AIAI結合游客偏好動態生成個性化講解內容;教育領域,創新性實現“所見即所問”的即時互動,無論是晦澀的學術圖表解析,還是復雜的數學應用題,均可通過視頻輸入快速獲即可3、AI智能行業變革引領AIAI看+聽”AI圖表7 豆包更新視頻能展示豆包豆包app應用展示(三)QQ瀏覽器推出行業首個高考Agent“AI高考通”1、依托混元技術,打造高考智能服務新標桿QAI74928001600AgentAI+2、全周期精準護航“AI作文輔導圖表8 AI高考通界面介紹騰訊網騰訊網(四)(SkyworkSuperAgents)移動App正式上線據昆侖萬維官方消息,昆侖萬維宣布旗下天工超級智能體(SkyworkSuperAgents)App正式上線。1、開創移動辦公新范式,引領AI辦公智能轉型AppAIAgentOfficeAIPPT與PC端賬號和信息的無縫打通,確保用戶在不同設備間切換時工作進度不受影響,真正實現隨時隨地、高效協同的辦公體驗。支持搭建私人知識庫的功能,更是滿足了用戶對個性化、私密化知識管理的需求,讓辦公更加靈活且安全。deepresearchMeta與Huggingface的GAIA82.42OpenAIManusOpenAIAIAI三、國外(一)OpenAI升級Operator智能體:推理能力躍升新臺階OpenAI5月宣布將其自主網頁瀏覽代理Operator從o3Pro或Enterprise2001、主要模塊更新1)感知推理架構優化基于AP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論