




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
專家委員會委員(按姓氏拼音字母排序)步文博復旦大學漆遠復旦大學、上海科學智能研究院龔新高復旦大學沈維孝復旦大學金亞秋復旦大學吳力波復旦大學、上海科學智能研究院彭慧勝復旦大學張人禾復旦大學研究團隊第一章徐增林復旦大學、上海科學智能研究院程遠復旦大學、上海科學智能研究院楊燕青上海科學智能研究院徐燕上海科學智能研究院第二章邱錫鵬復旦大學付彥偉復旦大學王守巖復旦大學第三章朱雪寧復旦大學高衛國復旦大學李穎洲復旦大學第四章向紅軍復旦大學季敏標復旦大學劉智攀復旦大學曹風雷上海科學智能研究院第五章應天雷復旦大學郁金泰復旦大學程遠復旦大學、上海科學智能研究院朱思語復旦大學、上海科學智能研究院彭漢川復旦大學徐書華復旦大學第六章李昊復旦大學、上海科學智能研究院張宏亮復旦大學第七章第八章吳力波復旦大學、上海科學智能研究院唐世平復旦大學胡安寧復旦大學周葆華復旦大學吳肖樂復旦大學傅曉明復旦大學文少卿復旦大學楊慶峰復旦大學湯維祺復旦大學第九章應天雷復旦大學吳文婷施普林格·自然張嘉慧施普林格·自然RebeccaDargie施普林格·自然JohnPickrell施普林格·自然數據支持巨蓉施普林格·自然黃玨珺施普林格·自然陳佳怡施普林格·自然VivekAggarwal施普林格·自然項目協調徐曉創復旦大學楊燕青上海科學智能研究院王曉夏施普林格·自然丁思嘉施普林格·自然張瑤瑤施普林格·自然排版設計趙新武施普林格·自然SouNakamura施普林格·自然第一章序言 2.發展與態勢 3.數據分析 1.從大語言模型走向自主智能體 2.具身智能 3.腦機接口 第三章數學 4.科學計算 5.復雜系統 第四章物質科學 第五章生命科學 3.神經科學 第六章地球與環境科學 2.環境科學 3.生態科學 第七章工程科學 3.微電子 第八章人文社會科學 2.人文科學 第九章展望與政策1.未來挑戰與研究方向 2.政策框架 113232第一章序言科學智能白皮書2025第一章序言1.定義與范式面向科學研究的人工智能(AI)創新和人工智能驅動的科學研究的總和可被定義為科學智能(AIforScience,AI4S),是體現了人工智能創新與科學研究雙向促進與深度科學研究促進人工智能創新。傳統科研范式大致可分為經驗歸納(實驗科學)、理以及數據密集型科學2。實驗科學由自然現象和實驗結果歸納出一般性規律,但沒有抽象出經驗規律背后的普適理論。理論科學基于自然現象或實驗結果,提煉科學問題并形構建普適理論,但難以在復雜系統中實驗驗證。計算科學以科學模型為基礎,通過數值方法模擬復雜系統,但需要簡化模型以及提發現統計關聯,一定程度上避免了提出科學假設,但無法發現因果關系,且難以分析低質量數據和發現復雜系統中的規律。當前的科學研究主要面臨系統復雜性的挑戰,相互關聯的自然、技術和人類系統受到跨時間和空間尺度作用力的影響,導致復雜的相互作用和涌現行為1。傳統科學研究方法難以應對這些復雜性挑戰,迫切需要新的科學研究方法。針對復雜數據中的因果關系,發展了一系列新的因果推斷方法。針對高質量科學數據缺乏問題,如大氣數據、天文數據等,發展了生成式人工智能技術,如擴散模型和大語言模型。針對處理復雜系統的局限性,發展了融合先驗知識的深度學習,將先驗知識嵌入深度神經網絡,在增強模型可解釋性的同時,顯著提高模型的泛化能力,如物理信息神經網絡3。人工智能創新重塑傳統科學研究過程,加速科學發現。人工智能通過融合數據和先驗知識的模型驅動、假設生成與驗證、自動與智能化實驗以及跨學科合作等方式,加速科學發現。傳統科學發現以實驗觀察和理論如物理定律。人工智能則采用模型驅動的方式,從大規模數據中自動發現隱藏的規律,第一章序言科學智能白皮書20255454傳統科學發現從大規模解空間中生成候選假設并驗證,效率低且難以找到高質量解4。人工智能憑借強大的數據處理和分析能力,可以更有效地探索解空間,生成高質量的候選假設。例如,在純數學領域,機器學習可以輔助數學家發現新的猜想和定理5。科學研究依賴于實驗評估理論。傳統的實驗設計和優化方法依賴人工經驗和反復試錯,成本高且效率低,如材料合成以及核聚變。人工智能與機器人技術結合可以實現實驗的自動化設計與執行,并根據實時數據調整實驗參數,優化實驗流程和候選對象。總之,人工智能可以有效整合不同學科的數據和知識,打破學科壁壘,促進多學科深度融合,解決學科的挑戰性問題。跨學科合作不僅拓展了各學科的研究邊界,還催生了計算生物學、量子機器學習、數字人文等1.P.Berens.etal.AIforscience:anemergingagenda.arXivPreprint,/abs/2303.04217v1(2023).2.T.Hey.etal.TheFourthParadigm:Data-IntensiveDiscovery,Microsoft(2009).3.Raissi,M.etal.Physics-informedneuralnetworks:adeeplearningframeworkforsolvingforwardandinverseproblemsinvolvingnonlinearpartialdifferentialequations.J.Comput.Ph4.Griffin,C.etal.Anewgoldenageofdiscovery:seizingtheAIforscienceopportunity.Technicalreport,/deepmind-media/DeepM/Assets/Docs/a-new-age-of-discovery_nov-5.Davies,A.etal.Advancingmathematic2.發展與態勢2.1最新進展隨著深度學習、生成模型與強化學習等技術的突破,人工智能不僅能從海量數據中識別人類難以察覺的復雜模式,更展現出自主提出科學假設、設計實驗方案、優化研究AlphaFold31突破性地實現了對幾乎所有分子類型的蛋白質結構預測,提高了蛋白-配體相互作用預測的準確度,為新藥研發、疫GraphCast模型2、華為“盤古”大模型3、復旦大學“伏羲”大模型4等AI氣象模型顯著提升了全球天氣預報能力,實現更長時間尺度、更高精度的天氣預測。普林斯頓等離子物理實驗室利用強化學習優化等離子體控制,解決撕裂不穩定性問題,加速核聚變能源的實現5。加州大學伯克利分校和勞倫斯伯克利國家實驗室利用機器人執行實驗,機器學習規劃實驗并結合主動學習優化實驗過程,研發用于無機粉末固態合成的自動實驗2.2前沿科學問題與突破路徑2.2.1如何構建跨尺度的科學智能模型科學研究涉及從原子尺度到宏觀系統的跨尺度建模,但當前AI模型通常僅適用于單一尺度,缺乏有效的多尺度耦合機制。為了解決這一挑戰,可以從以下幾個方利用物理模型與AI的耦合建模,將已知的物理規律嵌入到AI模型中構建跨尺度關聯,打造“灰盒模型”,提高模型的可信度和計算效率。開發跨尺度、多模態統一的神經網絡架構,用于從微觀到宏觀的統一建2.2.2如何提升AI模型在科學研究中的泛化性模型可能無法學習到有效的特征,難以適應新的領域或任務,限制了其在實際科學問題為了解決這一挑戰,可以從以下幾個方利用生成式模型生成高質量科學數據,補充數據稀缺領域的樣本多樣性。通過預訓練跨領域基礎模型,結合小樣本學習技術,快速適應新任務或學科場景2.2.3如何利用AI拓展科學發現的創新邊界AI目前仍局限于已有知識的重組與推理,主要通過對已有數據的模式識別和重組來生成結果,而缺乏真正的創造性思維。科學研究往往涉及跨學科的知識和數據,AI模型在整合不同領域的知識時存在困難。如何使其真正參與科學假設的提出和驗證,仍是為了解決這一挑戰,可以從以下幾個方構建跨學科知識圖譜、因果推理和生成模型,整合多領域知識庫,使AI能夠從已有知識中提取洞察并提出新穎的科學假設。建立強化學習驅動的AI輔助實驗設計、數據分析、理論建模的閉環系統,實現自動化科學發現。開發可視化工具與交互界面,將AI生成的假設映射為可解釋的科學邏輯鏈,支持領域專家進行修正與理論完善。1.Abramson,J.etal.AccuratestructurepredictionofbiomolecularinteractionswithAlphaFold3.Nature2.RemiLametal.,Learningskillfulmedium-range3.Bi,K.etal.Accuratemedium-rangeglobalweatherforecastingwith3Dneuralnetworks.Nature619,533–538(2023).4.Chen,L.etal.FuXi:acascademachinelearningforecastingsystemfor15-dayglobalweatherforecast.npjClim.Atmos.Sci.6,190(5.Seo,J.etal.Avoidingfusionplasmatearinginstabilitywithdeepreinforcementlearning.Nature6.Nathan,J.S.etal.AnautonomouslaboratoryfortheacceleratedsynthesisofnovelmaterialsNature624,86–91(2024).3.數據分析本研究中,人工智能(AI)相關領域數學、物質科學、生命科學、地球與環境ResearchIntelligence)《自然》AI相關出版物數量、引用量以及自然指數(Nature2015-2024年全球AI相關出版物進行了系統性分析。數據結果顯示,AI和AI4S研究正經歷規模擴張與范式變革的雙重突破。加速井噴AI4S領域的學術出版物總量快速增長。力推動了AI研究整體的井噴態勢。如圖1.1所示,全球AI論文數量在過去十年間激增近三倍——從30.89萬篇增至95.45萬篇,年均增長率為13.7%。2020年是一個重要加速點,前后相較,年均增長率從10.9%躍升至16.0%。同期AI核心領域論文占比提升了6.4個百分點,這源于AI4S論文的2020后年則以19.3%的速度擴張。其中,工程科學和生命科學最為突出,年均增長升至16.1%和28.9%。物排名前五的國家/地區格局發生了轉變(圖1.2)。中國增長勢頭尤為顯著,出版越歐盟,居全球首位,2022年超越歐盟和美國的總和。印度也展現出明顯的追趕態為美國的1/32024年提升至8.51萬篇,幾乎與美國(8.57萬篇)齊平。 0——AI4S總量0 0第一章序言科學智能白皮書20257676 0 03.2美國高質優勢仍存,中國引領應用創新從科研質量上看,美國仍保持優勢。如圖1.3所示,基于自然指數追蹤的高質量前沿研究期刊發表的AI相關論文引用量,美國始終保持領先地位,2020年達到30.28萬次。中國的崛起頗具顛覆性,引用量從至2024年,中國的AI相關論文球總量的40.2%,實現了對美國(占全球總量的42.9%)的快速追趕。需要指出的是,由于引用數據隨著時間推移而積累,盡管目前統計顯示2020年后引用數據趨勢下降有中國在AI應用領域的創新同樣體現了從“跟隨者”到“引領者”的跨越。圖1.4聚焦于專利、政策文檔與臨床試驗中的引用數據。中國憑借持續高速增長,于2016年檔與臨床試驗中的引用占比高達41.6%,遙遙領先。同樣,由于引用數據隨著時間推移而積累,目前統計顯示近年引用數據趨勢下降有所失真,但大體不影響國別間比較趨勢3.3AI4S國別優勢各異,中美仍是最重要科研合作伙伴2024年AI出版物領域構成揭示了不同國家/地區在AI4S研究方向上的優勢和特點(圖1.5)。美國、歐盟和英國聚中國以工程科學(38.9%)為主導,物質科度則形成工程科學(25.9%)為主,人文社7.4%5.5%38.9%35.0%6.7%33.0%6.9%3.2%20.6%32.8%24.8%2.8%7.4%5.5%38.9%35.0%6.7%33.0%6.9%3.2%20.6%32.8%24.8%2.8%5.4%9.4%25.9%15.3%10.8%5.4%9.4%25.9%15.3%10.8%第一章序言科學智能白皮書20259898數據顯示,AI和AI4S的全球合作依舊穩步攀升。國際合作的AI出版物總量從物總量從2.99萬篇躍升至9.48萬篇,均增長了三倍左右(圖1.6)。AI出版物的中美合作在2020年到達頂峰后有所下滑,但依舊是全球規模最大的雙邊合作。至202同期,中國與歐盟、英國、加拿大及澳大利亞的科研紐帶顯著增強,中歐合作從20150國際合作AI出版物數量國際合作AI4S出版物數量廠圖1.7|AI出版物國際合作趨勢-中國vs美國(前五國家/地區2015-2024,單位:篇)3.4AI4S引領范式變革:哪些AI技術學科革命,其核心特征是領域科學和AI方法的深度融合與適配。通過科學家提出關鍵如今,大語言模型(LLMs)已經成為物質科學、生命科學、社會科學等領域的通用科研工具。強化學習方法在工程系統控制、數學定理證明及物理模擬等復雜場景中占據主導地位。計算機視覺技術在生命科學和地球環境領域滲透顯著。此外,分布式學習、圖神經網絡、可解釋AI和邊緣智能在不同學科中均得到廣泛應用。AI技術圖譜揭示了一個根本性轉變:AI不僅是科學研究中可用工具集的擴展和創新,更是推動科學范式變革的“元技術”。一場AI4S革命,正在重塑人類科學發現的未來圖景。圖1.8|科學智能中最獲青睞的AI技術(2015-2024)物理信息機器學習物理信息機器學習數據共享多尺度建模逆向設計圖神經網絡邊緣計算符號回歸數據共享多尺度建模逆向設計圖神經網絡邊緣計算符號回歸多模態大模型虛擬現實聯邦學習多模態大模型虛擬現實聯邦學習基于主體的模型基于主體的模型復雜系統復雜系統混合精度算法隨機梯度下降方法大語言模型混合精度算法隨機梯度下降方法大語言模型物質科學物質科學泛化能力泛化能力策略優化策略優化圖神經網絡分布式學習圖神經網絡分布式學習生成模型生成模型擴散模型擴散模型因果推斷因果推斷邊緣智能循環神經網絡啟發式算法非凸優化邊緣智能強化學習模型分割人工智能輔助臨床決策模型分割模型壓縮生命科學演化模擬生命科學多模態大模型多模態大模型從頭設計隨機森林從頭設計隨機森林基礎模型基于主體的模型基礎模型基于主體的模型可解釋人工智能圖像處理可解釋人工智能圖像處理遺傳算法數據增強遺傳算法數據增強大語言模型計算機視覺大語言模型計算機視覺生態系統動態模擬物理約束生態系統動態模擬物理約束跨尺度建模模型可解釋性跨尺度建模模型可解釋性第二章全球AI核心領域出版物從2015年方面優勢顯著,印度加速追趕,總量已超越美國,接近歐盟。從數據分析和關鍵詞詞云看,研究主題呈雙聚焦:科學智能白皮書2025圖2|AI核心領域出版物總量、國家趨勢(單位:千篇)與關鍵詞詞云(2015-2024)5004504003503002502000mn總量中國歐盟美國印度英國806040200可解釋性可解釋性智能體極端風險檢索增強生成智能體極端風險檢索增強生成博弈論深度推理博弈論深度推理動態異構冗余架構動態異構冗余架構前沿模型第二章AI前沿科學智能白皮書20251.從大語言模型走向自主智近年來,以大語言模型(LLM)1-3為代表的人工智能(AI)技術快速發展,已在多個領域展現出先前技術所不具備的涌現能力。借助千億級參數規模,大語言模型不僅實現了海量知識整合和邏輯推理能力的突破,還展現出向通用人工智能演進的巨大潛力,具有重要的研究和應用價值。學術界與工業界紛紛將目光聚焦于大語言模型的相關研究,力圖突破計算復雜度高、安全對齊難、可解釋性弱等短板。與此同時,隨著訓練數據、算力資源逐漸面臨增長瓶頸,研究者正積極尋找繼續提升模型能力的第二擴展定律,推動模型向知識增強4、多模態融合5,6和深度推理7,8方向演進,逐步催生出具備自主學習和決策能力的智能體系統9。這一趨勢不僅拓寬了人工智能的應用邊界,更為實現真正意義上的通用人工智能(AGI)奠定了堅實以大語言模型為核心的人工智能技術正邁入全新發展階段。在訓練數據和算力資源二擴展定律”,即從訓練階段的規模效應延伸到推理階段,通過模型架構革新與軟硬件協同設計,實現參數效率的指數級提升10,進而大幅降低訓練和推理的能耗。這一戰略轉變為持續推動模型能力升級提供了新路徑。在技術演進方面,研究者聚焦于多個前1.2.1知識增強:為彌補大語言模型長尾或領域知識不足、內在知識難以動態更新等問題,檢索增強生成技術4通過對外部知識庫的充分利用,使得模型能夠快速獲取專業知識和最新信息,有效提升了大語言模型的應用面和輸出內容的可信度。Gemini為代表的多模態大模型5,6通過跨模態對齊技術,實現了視覺、語音、文本等多模態信息的高效整合,大幅拓寬了模型應用DeepSeekR18為代表的推理模型,在解題回答中引入類似人類“思考—反思”的推理機制,用更長推理時間換取更高質量答案,在數學、科學和編程等復雜任務上取得顯著4)自主智能體:多智能體系統9依托大語言模型的認知與推理能力,通過自主感知、任務規劃、記憶系統及外部工具調用,顯著提升了任務完成效率和系統協同能力。5)安全可信:大語言模型安全可信研究正沿著"可解釋性增強-價值對齊校準-可信評估體系"三位一體的技術路徑縱深突在應用層面,這些技術的突破正在引領人工智能邁向爆發性應用期。業界正積極將大語言模型及其衍生技術推廣至辦公助手、不斷拓寬實際應用邊界。當前的技術革新和應用實踐預示著未來通用人工智能將不斷向更高層次演進,為全球產業轉型和社會發展1.3前沿科學問題和突破路徑高效架構、全模態模型、情感認知和群體智能等方向進行探索和突破,解決各自獨特的1)探索更高效且更通用的模型推理能力提升方法。優化強化學習策略與獎勵信號設計,提高模型的學習與搜索效率,并利用人類反饋不斷自我修正,突破復雜問題推理和長序列生成挑戰,并將模型推理能力推廣至更廣闊的實際應用場景中。2)尋找可以支撐模型能力提升的下一代擴展定律。在預訓練和推理階段的擴展定律之外,探索多智能體協作、物理世界交互和動態知識更新等下一代擴展方向。3)設計軟硬一體的高效模型架構。利用分布式訓練、混合精度計算及專用硬件加速技術,加速模型訓練和推理速度,使得大模型能夠更快地響應實時任務需求,提升整4)設計支持理解和生成的統一全模態模型。突破支持高效理解和生成的全模態模型架構,優化跨模態特征的融合與對齊,解決細粒度感知不足、幻覺頻現以及空間能力欠缺等問題,為世界模型奠定基礎。5)探索大模型情感感知和認知調控技術。突破大模型的性格化和擬人化技術,增強大模型的跨模態情感感知能力,實現情境自適應的個性化情感調控機制,實現擬人化6)構建基于多智能體協作的自組織群體智能。探索復雜場景下的多智能體深度集成和自組織協作機制,構建可擴展的智能體協作框架,為未來人機共生智能化社會提供為更快地邁向通用人工智能,研究者需要突破上述大語言模型前沿科學問題,推動未來人工智能技術在科學研究、數字經濟等1.OpenAIetal.GPT-4TechnicalReport.(22.Touvron,H.etal.LLaMA:Openandefficientfoundationlanguagemodels.ArXivpreprint3.Sun,T.etal.MOSS:Anopenconversationallarge4.Lewis,P.etal.Retrieval-augmentedgenerationforknowledge-intensiveNLPtasks.ArXivpreprintunderstandingacrossmillionsoftokensofcontext.6.Zhan,J.etal.AnyGPT:UnifiedmultimodalLLMwithdiscretesequencemodelin7.Zeng,Z.etal.Scalingofsearchandlearoadmaptoreproduceo1fromreinforcement(2024).reasoningcapabilityinLLMsviareinforcement9.Xi,Z.etal.Theriseandpoten11.Ma,X.etal.Safetyatscale:Acomprehensivesurveyoflargemodelsafety.ArXivpreprint2.具身智能2.1背景具身智能是基于物理本體感知和行動的智能系統,通過與環境交互感知信息、規劃任務、做出決策并控制本體完成任務,產生智能行為并持續演進。具身智能需可信、行為符合人類價值并能自我進化。2.2最新進展具身智能技術近年來取得突破性進展,在感知、決策、控制及商業化應用等方面實現重大提升。高精度傳感器增強了智能體的環境感知能力,融合感知與推理的動態四維世界模型提升了對復雜環境的理解與適應性,而強化學習與深度學習的 PhysicalIntelligence的π02實現了從 視覺與語言輸入直接生成機器人動作的能力。FigureAI推出的Helix3是全球首 系統架構4,為智能機器人控制提供了全 新范式。人形機器人正加速演進,特斯拉Optimus二代5在工業與服務領域逐步 Technologies公司的NEOGamma7等 多功能家務機器人展現出強大的實用能力,推動機器人在日常生活中的應用。此外,具身智能在醫療、神經科學和虛擬現實等領域實現重要突破。復旦大學加福民團隊開發腦脊接口技術,讓癱瘓者重獲行走能力;復旦大學類腦院構建千億級神經元數字孿生平臺8,推動神經調控應用發展;VR技術與具身智能結合,增強沉浸體驗,推動未來人機交互革新。具身智能正邁向產業化,賦能醫療、制造、家用機器人及虛擬現實等多個領域。2.3前沿科學問題和突破路徑2.3.1基礎模型現有具身智能基礎模型的泛化能力有限,難以適應不同物體類別、場景和任務。如何提升跨本體、跨場景、跨任務的泛化能力,實現通用具身智能,是關鍵科學問研發新一代具身基礎模型,重點探索視覺-語言對齊(VLA)和雙系統大模型。VLA通過對齊視覺與語言信息,提升機器人對指令的理解與執行能力。雙系統模型由反應系統和推理系統組成,分別負責即時響應與深度推理,以提升機器人決策能力。應用包括人機交互、機器人自主導航等,但在多模態學習與系統復雜度方面仍面臨挑戰,需要在效率與復雜度之間找到平衡。2.3.2數據引擎具身智能系統的數據獲取和融合仍面臨數據質量參差不齊、數據標注成本高、跨模態數據同步性不足等問題,限制了模型的泛化和適應性。研發多源異構數據采集與融合技術,構建高質量數據引擎。推動統一的數據采集與多模態融合平臺建設,確保數據標準化與時間同步,促進開放數據集生態建設。多模態數據融合技術利用深度學習與融合算法整合視覺、觸覺、聽覺等信息,增強智能系統在復雜環境中的感知與決策能力,提高系統的適應性和可靠性。2.3.3交互能力目前的具身智能交互方式仍顯生硬,難以實現自然流暢的人機交互。如何提升具身智能的情感感知和交互能力,使其更自然、更人性化,是核心科學問題。研究情感計算與多模態交互技術,優化具身智能體的互動體驗。通過融合視覺、聽覺和觸覺信息,提高交互的沉浸感與效率。面對實時性與穩定性的挑戰,需要確保系統能夠快速響應,同時保持穩定數據傳輸。任務規劃與執行層面,要求智能體具備自主探索與決策能力,優化數據獲取、模型泛化和實時性。個性化與泛化性的平衡也是關鍵,需減少數據依賴,增強對不同用戶和環境的適應能力。2.3.4本體研制現有具身智能硬件在靈活性、感知精度和適應性方面仍存在局限,難以滿足復雜任務的需求。如何打造兼具敏捷性與適應性的物理載體,是亟待解決的科學問題。研發融合仿生結構、智能感知與先進驅動技術的新型具身智能硬件。利用多種傳感器(視覺、觸覺、聽覺等)實現環境感知和自身狀態監測。視覺感知依賴相機與LiDAR進行物體識別和深度感知,觸覺傳感器提供力反饋與紋理感知,聽覺模塊通過語音識別處理聲音信號。運動控制方面,采用路徑規劃、動力學模型和協調控制方法,確保高效任務執行。同時,柔性電子與新型聚合物材料可提升感知精度,并通過集成設計增強數據采集能力和設備性能。2.3.5可信機制具身智能的決策透明性和安全性仍存在較大挑戰,智能體行為是否符合人類價值觀、如何防范惡意操控和數據隱私泄露,是核心問題。構建完善的可信評估與增強體系,以保障具身智能的可靠性。重點研究風險感知與價值對齊技術,使智能體的行為符合倫理規范和社會價值觀。針對醫療、通信、娛樂等領域的應用,需加強安全防護機制,防范數據隱私泄露、惡意操控和未經授權訪問等風險。同時,法律與倫理層面需要完善法規框架,以應對數據所有權、責任追究等問題,防止技術濫用帶來的倫理困2.3.6具身智能評估當前的具身智能評估體系尚不完善,缺乏統一基準,難以全面衡量智能體的控制能力、任務規劃能力和泛化能力。如何建立科學合理的評估體系,是關鍵挑戰。研發系統化的具身智能評估框架,以更全面地衡量智能體的能力。需解決多方面問題,包括:現有評估方法偏重單一模態,忽略跨模態融合效果;智能體的泛化能力評估尚不充分;持續學習評估需解決災難性遺忘問題;模擬環境與真實世界的差距影響評估準確性;多機協同任務的同步問題仍待優化;高層次決策任務與低層次執行任務的綜合評估體系亟待建立。未來需跨學科合作,構建更完善的評估框架,以促進具身智能技術的發展與落地應第二章AI前沿科學智能白皮書2025transferwebknowledgetoroboticcontrol.ArXiv2.PhysicalIntelligence,π:Avision-languageflowmodelforgeneralrobotcReport(2024).3.FigureAI,Helix:Avision-lageneralisthumanoidcontrol(2025).4.NVIDIA,GR00TN1:generalisthumanoidrobots.TechnicalReport(5.Tesla,Optimus.Available:https://www.tesla.com/6.StanfordUniversity,MobileALOHA:Learningbimanualmobilemanipulationwithlow-bodyteleoperation(2023)www.1x.tech/neo(2025)8.Lu,W.etal.Imitatingandexploringthehumanbrain'srestingandtask-performingstatesviabraincomputing:scalingandarchitecture.Nat.S3.腦機接口3.1背景腦機接口技術為腦科學研究提供了全新的因果研究范式,并為腦疾病治療開辟了靶向干預新路徑。此外,該技術的發展不僅將驅動人工智能技術突破生物智能解析瓶頸,還將為類腦智能與具身智能的理論演進提供新路徑,同時通過搭建人-機-環境智能融合接口系統,為構建可持續的智能社會生態系統奠定技術基礎。通過建立大腦與外部設備的直接通信連接,腦機接口技術實現了神經活動的記錄、解碼與刺激功能。當前,腦機接口正深度整合神經科學與人工智能技術,其發展軌跡已從單向的神經信息解析、神經調控信息寫入,加速向腦機雙向交互及腦智融合方向演進。3.2最新進展神經信息運動解碼研究已取得顯著進展1,科學家們正在探索基于神經活動的言語、情感及意識解碼技術2,3。基于神經信息解碼建立疾病相關生物標記,為抑郁癥等精神疾病的藥物研發與神經調控精準治療提供了重要應用依據4。神經調控技術通過光、聲、電、磁等物理手段及化學方式調節神經活動,其中經顱磁刺激加速療法為抑郁癥治療提供了創新性解決方案,超聲神經調控在阿爾茨海默癥等疾病治療領域展現出廣闊應用前景,光遺傳學技術已進入人體臨床試驗階段5,動能神經調控則可能成為未來新型神經調控手段6。通過整合神經信息解碼技術與神經調控及神經反饋機制,腦機接口可以實現高精度的外部設備控制或腦功能精準調控7,不僅使癱瘓患者恢復運動功能成為可能,更為抑郁癥等精神疾病治療提供了全新路徑,實現了癱瘓患者重新行走8、抑郁癥治療9突破。美敦力公司研發的自適應閉環腦深部電刺激系統10已在歐美地區進入臨床應用階段,該系統通過實時監測與動態調控神經環路活動,顯著提升了帕金森病等神經系統疾病的治療效果。這一進展標志著腦機交互精準神經調控技術正式邁入臨床應用新紀元。當前人工智能技術的迭代升級正推動腦機接口研究邁向認知增強的新維度,突破性方向。科學家融合腦機接口技術成智能體,發現虛擬控制網絡中的激活狀態準確預測了真實老鼠大腦中測得的神經活動,虛擬大鼠智能體能夠模仿完成真實大鼠的所有復雜任務,甚至可以完成新的任務11。這項突破不僅為解析運動控制的神經機制提供了全新研究范式,更預示著“腦智融合科學”這一交叉學科的誕生,其在智能機器人、自學習神經調控系統、腦啟發智能系統構建等方面具有重要應用前腦機接口歷經五十年發展,實現了從單向神經信號解析到雙向信息交互腦機接口范式轉換,并向腦功能與智能融合方向持續突破。多模態神經調控與解碼算法融經計算與AI融合推動腦機接口技術向認知增強技術發展,而交互維度將跨越神經信號解析至認知交互,物理接口擴展至虛擬現實、智能環境等多模態協同。神經機制、神經技術與人工智能深度融合的發展趨勢預示著腦機接口技術正式邁入智能增強與認知重塑的新階段。3.3前沿科學問題和突破路徑人腦作為大規模的復雜動力系統,其網絡化連接模式、動態時變特性和非線性交互機制,構成了神經解碼與編碼技術實現可靠性和穩定性的核心挑戰。如何實現神經集群復雜功能的特異性調控?針對興奮性/抑制性神經元、感覺/運動神經元等特定神經群體,通過跨時空尺度的神經信息解碼與編碼研究,結合超聲、光學等技術手段建立從單神經元到神經環路層級的毫秒級時間精度與微米級空間分辨率的神經功能監測調控體系,將為神經疾病與精神障礙治療提供特異性神經調控解決方案。如何實現神經元物理與化學交互作用的精準調控?腦功能實現機制不僅涉及神經元電活動及神經環路動態互作,更依賴于分子層面的調控要素(包括神經遞質、受體蛋白、離子通道等)。通過整合分子調控網絡與神經刺激技術體系,可在多維度實現神經系統的分層精準調控,進而達成更高效、更精細的全腦神經功能干預目如何實現腦功能動態過程的精準調控?建立基于神經生理與神經遞質等信息的疾病特異性生物標記體系,構建神經環計算-控制功能的智能神經調控芯片,最終形成具備神經信息實時感知、動態建模與智能決策能力的閉環腦機交互系統,實現神經核團、神經環路功能動態自適應調控。如何實現腦智融合自學習策略?將多模態神經信息編碼框架與具身智能大模型進行深度融合,通過構建自然化人機交互學習范式,將顯著增強智能體的自主決策能力與環境適應性。通過動態自學習機制實現神經信息解碼與功能重編程,不僅能驅動實體機器人及智能設備的精準操控,還可建立虛擬世界中智能體間的多模態交互通道,最終形成具備沉浸式體驗與實時神經與認知功能響應能力的腦智融合系tetraplegiausinganeurallycontrolledroboticarm.2.Chang,EF.Brain-computerinterfacesforrestoring3.Vansteensel,MJ.etal.Fullyimplantedbrain-computerinterfaceinalocked-InpatientwithALS.4.Wu,W.etal.Anelectroencephalographicsignaturepredictsantidepressantresponseinmajordepression.Nat.Biotechnol.38,439-447(2020).5.Sahel,JA.etal.Partialrecoveryofvisualfunctioninablindpatientafteroptogenetictherapy.Nat.Med.6.Yang,M.etal.IntermittentvibrationinducessleepviaanallatostatinA-GABAsignalingpathwayandprovidesbroadbenefitsinAlzheimersdisease7.Herron,J.etal.Theconvergenceofneuromodulationandbraincomputerinterfaces.8.Lorach,H.etal.Walkingnaturallyafterspinalcord9.Alagapan,S.etal.Cingulatedynamicstrackdepressionrecoverywithdeepbrainstimulation.10.Oehrn,CR.etal.ChronicadaptivedeepbrainstimulationversusconventionalstimulationinParkinson'sdisease:ablindedrandomizedfeasibilitytrial.Nat.Med.30,3345-3356(2024).11.Aldarondo,D.etal.Avirtualrodentpredictsstructureofneuralactivityacrossbehaviours.4.AI內生安全4.1背景面對新一輪生成式人工智能浪潮,如何兼顧發展與安全已成為國際社會的共性難題1:一方面,AI系統在數據采集、模型訓練到實際部署推理全生命周期均存在安全漏洞,現有安全防護體系在應對新型威脅時往往出現系統性失效;另一方面,大模型智能體技術范式快速演進,其依托AI系統軟件將基礎大模型的生成內容轉換為作用于數字或物理世界的行為,若缺少安全管控,將導致AI生成內容風險向物理域、社會域快速外溢。因此,將內生安全理念融入基礎大模型研發、AI系統軟件設計和訓練部署全過程,是構建自主可控的內生智能防護體系的關鍵2。4.2最新進展AI系統全生命周期均面臨嚴峻安全挑戰:數據采集階段,投毒攻擊通過注入噪聲或惡意樣本,誤導模型學習;訓練階段,通過植入模型后門,使其具備隱蔽功能;推理階段,對抗樣本、模型幻覺和風險內容生成已成為主要威脅。超大規模參數、極深網絡結構的基礎大模型生成行為可解釋性差、安全對齊內生性不強,易遭受越獄、提示詞注入、隱蔽后門等對抗誘導3。當前多采用的“外部加固”策略難以適應AI系統的動態演進和模型復雜特性。當前AI安全領域尚未形成完備理論框架,缺乏對智能系統自身安全能力的度量方法。另一方面,基礎大模型行為所具有的非預設性,使得前沿AI系統或帶來重大紅線風險:國內外已關注到前沿AI系統已突破自我復制4、欺騙5等紅線能力邊界。因此,需通過AI內生安全理論原始創新,建立內生治理與外部管控相結合的安全體4.3前沿科學問題和突破路徑4.3.1AI內生安全理論AI內生安全需在模型設計之初嵌入安全機制,實現“安全即特性”目標,例如:通過自適應機制自動調整模型參數;結合可信執行環境保護分布式訓練隱私安全。構建AI系統內生安全架構,整合可信計算、零信任框架是重要研究方向。突破路徑:傳統安全范式試圖通過“封堵查殺”的被動防御手段干預外因,無法化解系統構造缺陷引發的本源性矛盾。動態異構冗余架構6將安全屬性從代碼的脆弱性轉向架構的確定性,使內生安全矛盾在系統層實現演進轉化或動態和解2。動態異構冗余架構通過多模型集成、異構算法模型、多態執行體與策略化調度機制的深度融合,使攻擊者難以捕捉穩定的攻擊界面;通過算法異構化部署、模型動態遷移及特征空間重構,打破攻擊所需的靜態環境假設,增強AI系統在復雜環境中的穩定性和安全性7。4.3.2AI系統安全評估與防護現有安全評估依賴靜態測試和對抗攻擊實驗,難以全面評估開放環境下AI系統的安全性。為持續監測通用大模型的安全風險,發展自動化、覆蓋面廣、風險發現能力強的AI動態安全評測技術尤為重突破路徑:構建自動化安全評估工具,法,探索通用安全標準;研究面向內生安全的大模型風險靶向挖掘技術,發現代表性風險用例,形成風險數據庫;研究基礎大模型內容風險控制機制,包括算法、內容規范,防治AI產生破壞性的虛假信息。4.3.3前沿AI系統風險感知與治理面向前沿AI系統的紅線風險,研制主動風險感知技術,建模智能體行為失控機制,形成系統化、實操性強的風險評估體系,對預警和治理前沿AI系統至關重突破路徑:研究工具交互、環境感知、思維推理、記憶增強等優化方法,動態激發基礎大模型潛能,主動感知風險紅線突破點;從大模型、訓練數據和系統軟件出發,研究面向大模型關鍵危險能力的抑制方法,實現面向紅線的大模型行為編輯與對齊方法,構建具備智能風險感知能力的AI系統軟件。1.Bengio,Y.etal.Managingext2.鄔江興.論網絡空間內生安全問題及對策.中國科學:信3.Ma,X.etal.Safetyatscale:Acomprehensivesurveyoflargemodelsafety.arXivpreprintarXiv:4.Pan,X.etal.FrontierAIsystemshavesurpassedtheself-replicatingredline.arXivpreprintarXiv:5.Meinke,A.etal.Frontiermodelsarecapabl(2024).6.吳鋌等.基于執行體劃分的防御增強型動態異構冗余架7.Wei,D.etal.Mimicwebapplicationstechnologybasedondhrarchitectur.InternationalConferenceonArtificialIntelligenceandIntelligent第三章2015至2024年間,全球數學領域AI出版物從2.12萬篇增至4.12萬篇,呈現近兩倍增長(圖3)。中國于2017年后持續超越歐盟與美國;印度2020年后增長加速,逐步拉近與美國的差距。在基礎理論、模型設計以及算法層面,數學是AI理論和創新之基礎。在運籌優化、科學計算和復雜系統等領域,數學和AI深度融合,協同創新。數據分析和關鍵詞詞云顯示,強化學習、循環神經網絡、生成模型和擴散模型等關鍵詞最被這一領域科學家看重,體現了底層理論創新和跨學科科學智能白皮書2025圖3|數學領域AI出版物總量、國家趨勢(單位:千篇)與關鍵詞詞云(2015-2024)4540252050mn總量中國歐盟美國印度英國86420策略優化循環神經策略優化循環神經泛化能力泛化能力強化學習混合精度算法反問題強化學習混合精度算法反問題因果推斷生成模型函數空間擴散模型因果推斷生成模型函數空間擴散模型數值模擬數值模擬隨機梯度下降方法科學計算非凸優化啟發式算法圖神經網絡隨機梯度下降方法科學計算非凸優化啟發式算法圖神經網絡第三章數學科學智能白皮書20251.基礎理論以數學為視角,利用數學理論與數值方法推動人工智能理論的發展,其研究可分為三大層面:人工智能基礎理論、模型設計以在人工智能(AI)基礎理論方面,核心問題之一是分析深度學習模型的表達能力。數學工具如函數空間、逼近論和數值分析為揭示神經網絡內在的非線性結構提供了方法論支持,并奠定了模型穩定性和泛化能力的理論基礎。研究者借助這些工具構造出如巴倫空間、變分空間等由神經網絡誘導的函數空間,從而量化網絡表達能力。同時,通用近似定理證明通過加寬或者加深前饋神經網絡能夠以任意精度逼近緊集上任意連續函數。尤其是在逼近本質低維的高維函數時,神經網絡可以有效回避高維維度災難問題,這在一定程度上解釋了深度學習處理復雜模式的能力。對于其他網絡結構,數學同樣發揮著作用:圖神經網絡(GNN)的信息傳播和聚合過程可通過圖論和圖拉普拉斯算子的譜分析來解釋;將深度學習模型視作動力系統,通過微分方程和穩定性理論分析循環神經網絡(RNN)的隱藏狀態演化,不僅揭示其長序列穩定性,也預示激活函數選擇不當時可能引起的梯度消失風險;動力系統中的平衡點、吸引子和分岔理論進一步為神經網絡訓練過程中的動態行為提供理論支撐,指在人工智能模型設計方面,數學理論指導著網絡結構設計、學習范式等。例如,擴散模型的架構根植于概率論和隨機過程,其正向過程利用馬爾可夫鏈逐步注入高斯噪聲使數據退化,逆向過程則依賴參數化條件概率逐步剝離噪聲實現重構,構成一個可逆隨機過程。這樣的設計在確保生成樣本多樣性的同時,也保證了高質量的重構。此外,RNN利用遞歸結構捕捉時序數據的動態特性,其狀態更新可用差分或微分方程描述,而殘差網絡(ResNet)則通過引入跨層“捷徑”聯結,緩解深層網絡中梯度消失問題,其理論分析依賴于線性代數和微分方程,從在人工智能算法實現層面,數學不僅體現在數據預處理、損失函數構造上,也貫穿于優化算法設計。數據預處理方面,通過統計建模與樣本生成技術改善數據質量:針對進行參數估計并采用概率插補;面對類別不平衡,可利用過采樣或線性插值在特征空間內擴充少數類樣本,從而增強模型魯棒性。損失函數設計中,正則化方法(如L1正則化促進稀疏性、L2正則化限制參數幅度)起到控制模型復雜度和防止過擬合的作用,此外還可依據神經網絡誘導的新型函數空間設計專門的正則項。優化算法和數值算法分析皆依賴于數學理論,不僅有助于訓練過程的高效實現,還可以為模型部署提供支持,例如利用張量分解降低計算復雜度,或通過拓本部分的前沿科學問題可以分為兩類,一類聚焦于揭示人工智能模型結構內蘊的數學理論;另一類著眼于人工智能算法分析。第一類前沿科學問題通過先分析一般簡單深度神經網絡模型的表達能力,再分析復雜常用模型的表達能力,為模型的可解釋性奠定第二類中的關鍵前沿科學問題之一是泛化性。正則化、隱式正則化理論研究已經為模型泛化性奠定了基礎,進一步將求解問題的數學理論融入算法設計,有望得到具有一定總之,數學為深度學習和人工智能中的可解釋性、泛化性及新型算法開發提供了堅實的理論支撐。未來的前沿研究將進一步探索數學與人工智能各層面之間的深度融合,1.Barron,A.R.Universalapproximationboundsfor2.Cybenko,G.Approximationbysuperpositionsofasigmoidalfunction.Mat3.E,W.Thedawninmathematics,Not.Am.Math.Soc4.Engl,H.W.etal.Regularizationofinverseproblems.MathematicsanditsApplications,375,(1996).5.Pereverzyev,S.V.Anintroductiontoartificialintelligencebasedonreproduspaces.SpringerNature(2022).6.Zhou,D.X.Universalityofdeepconvolutionalneuralnetworks.Appl.Comput.Harmon.Anal.48,2.優化優化是人工智能的核心驅動力之一,貫穿于模型訓練、參數調整、性能提升等整個過程,并廣泛應用于人工智能的各個分支,如監督學習中的參數優化,無監督學習的結以及自然語言處理中大語言模型的分布式優機器學習中的大多數任務可以被建模成一個優化問題,然后通過設計算法尋找好的參數以實現模型在特定任務上的良好表現。因此隨著人工智能的蓬勃發展,最優化方法也得到了廣泛研究。利用梯度信息的隨機梯度法和小批量隨機梯度法等是最基礎也是最重要的一類方法,適用于大規模數據集的訓練。進一步地,帶有動量的隨機梯度法在參數更新中通過累積歷史信息,能夠加快收斂雜的一些自適應優化算法,則利用二階信息這些方法在運行過程中,還可以巧妙結合概率統計方法,以應對訓練過程中的噪聲、數據分布偏差及其他不確定性因素。此外,遺傳算法和粒子群優化等啟發式算法在解決某些高維非凸問題時展現了較好的魯棒性,貝葉斯優化則成功應用于深度學習中的模型超參數調優、機器學習算法的自動化調參,以對于凸優化問題,大多數梯度類算法能夠收斂到全局最優;而對于機器學習中更常見的非凸優化問題,在光滑性、弱凸性或PL條件等假設下,能夠建立收斂到穩定點甚至全局最優點的理論結果。優化動力學、神經正切核以及隱式正則化等理論則試圖揭示深度學習在實踐中取得成功的原因,并探究其泛化性的理論保障。對于大規模問題的分布式優化算法,不僅需要關心其計算復雜度或者迭代復雜度,通信復雜度對提高計算效率也人工智能的發展對優化也有促進作用,特別是大語言模型強大的生成能力。傳統的優化建模依賴專家經驗,而大語言模型能夠利用專家知識,將自然語言描述的業務問題轉化為優化模型,并調用求解器進行求解。例如,在物流路徑優化任務中,模型可自動識別關鍵變量、約束條件和目標函數,并生成混合整數規劃模型。然后通過調用Gurobi、CPLEX等求解器,直接生成可執行的優化代碼,實現對實際場景任務的高效求解。此外,大規模求解器中往往有許多啟發傳統的方法一般是人工編寫,或者自定義搜索空間然后進行調參,這兩種方法都費時費力,并且效果局限于所定義的搜索空間。相比之下,大語言模型可以借鑒已有知識,編寫許多非常高效的啟發式規則,并極大提升算法性能。例如,在旅行商、車輛路由等問題中,常用遺傳算法中的啟發式規則可以使用大語言模型進行編寫;而在可滿足性問題中,主流CDCL算法中的啟發式規則也可以總的來講,優化在人工智能的發展過程中起著不可或缺的作用,而人工智能的發展反過來又能促進優化建模以及優化算法的設計。不過盡管當前已經取得了非常矚目的進展,未來仍面臨許多挑戰與機遇,前沿科學問題包括如下幾個方面。首先,結合實際計算架構發展高效的算法是一個需要不斷與時俱進的研究主題。當前優化方法以一階算法為主,而能否發展高效的二階算法同樣值得探究。對于一些特定的問題,比如大模型中長序列、稀疏獎勵下的強化學習策略優化問題,如何設計高效的方法仍然還有很大的空間。另外,盡管大模型已經初顯對優化建模與算法設計的促進作用,但是如何設計運作可控的機制還需要更加深入的研究。理論方面,機器學習中優化算法的泛化性研究在理想情形下已經有了一些進展,但是離對實際應用產生有效的促進作用仍有很長的路要1.Bottou,L.etal.Optimizationmethodsforlarge-2.Ahmed,T.etal.Unveilingthepotentialoflanguagemodelsinformulatingmath3.Romera-Paredes,B.etal.Mathematicaldiscoveriesfromprogramsearchwithlargelanguagemod3.統計統計學作為數據科學的基礎,為人工智它通過數據分析、模型構建和優化算法,幫助人工智能系統應對不確定性、提取特征并實現高效決策。統計學中的收斂性質分析和統計推斷,為人工智能模型的可解釋性和可靠性提供了堅實理論。概率論和信息論在解釋模型不確定性、構建優化理論上具有決定作用;而線性回歸、廣義線性模型與高維數據建模方法等統計工具,則成為機器學習和深度學習構建模型的重要基石。此外,統計學在數據預處理、特征選擇與模型評估中也發揮著指導作用,為人工智能性能提升提供保障。與此同時,深度學習、生成模型、強化學習等現代技術的興起,又使統計學與人第三章數學科學智能白皮書2025深度神經網絡仍處于經驗階段,其內在機理和理論證明常被視為“黑箱”。因此,如何基于統計理論刻畫神經網絡的收斂速度最小化是目前該領域的前沿問題。可借助非參數回歸理論,以最小二乘或凸損失構建收斂速對于擴散模型、生成對抗網絡等生成模型,其統計性質的理論基礎仍較薄弱。目前相關的前沿科學問題包括兩個方向:一方面,如何評價生成模型估計無條件分布的效果,是一個重要課題。可基于沃瑟斯坦距離等赫爾德類概率度量手段,建立分布估計誤差界,評估生成器
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同終止協議書倒簽
- 智慧城市物流配送智能化改造策略
- 倉庫分租合同協議書怎么寫
- 景區土地合同協議書范本
- 廠房經紀人合同協議書
- 設備合同解除協議書范本
- 運動類創業計劃書模板范文
- 運動康復專業創業計劃書
- 中國特種耐火材料項目投資計劃書
- 購買股份合同協議書樣本
- 2025年基金與投資管理考試試卷及答案
- 書畫培訓合作合同范本
- 馬幫運輸安全協議書
- 杭州市2025年中考作文《勇敢自信》寫作策略與范文
- 2025年安全生產考試題庫(礦業行業安全規范)試卷
- 起重機司機(限橋式)Q2特種設備作業人員資格鑒定參考試題(附答案)
- 中職數學拓展模塊課件-正弦型函數的圖像和性質
- 六年級學生心理疏導教育
- 熱點主題作文寫作指導:古樸與時尚(審題指導與例文)
- 河南省洛陽市2025屆九年級下學期中考一模英語試卷(原卷)
- 成都設計咨詢集團有限公司2025年社會公開招聘(19人)筆試參考題庫附帶答案詳解
評論
0/150
提交評論