2025年機器語言大模型賦能軟件自主可控與安全可信報告-清華大學(朱文宇)_第1頁
2025年機器語言大模型賦能軟件自主可控與安全可信報告-清華大學(朱文宇)_第2頁
2025年機器語言大模型賦能軟件自主可控與安全可信報告-清華大學(朱文宇)_第3頁
2025年機器語言大模型賦能軟件自主可控與安全可信報告-清華大學(朱文宇)_第4頁
2025年機器語言大模型賦能軟件自主可控與安全可信報告-清華大學(朱文宇)_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

機器語言大模型賦能軟件自主可控與安全可信朱文宇清華大學中國電機工程學會中國電機工程學會n中國電機工程學會n背景…關鍵問題…典型應用總結…中國電機工程學會中國電機工程學會安全可信安全可信互聯網)各種通信技術)各種通信技術301背景-需求1:軟件生態面臨自主可控難題中國電機工程學會關鍵軟件長期由國外主導面臨斷供、安全、知識產權風險移動端操作系統分布情況移動端操作系統分布情況工業控制軟件產品:ERP、CRM、SCM挑戰:關鍵軟件閉源,供應鏈風險高,自主可控難度大4背景-需求2:軟件生態面臨安全可信難題中國電機工程學會軟件安全風險未知落的物作期情落的物作期情漏洞問題層出不窮惡意代碼急劇增長成為網絡攻擊的重要突破口病毒病毒(伊朗核設施)iPhone越獄&安卓Rootn電網斷電(烏克蘭)WannaCry(勒索150+國家)電網斷電(烏克蘭)挑戰:目標軟件閉源,分析難度大,安全問題隱藏深5中國電機工程學會背景關鍵問題…智能化方案…典型應用總結…602關鍵問題-軟件開發與安全碳件設新貓位碳件設新自主自主即作系統電電NARI疆軟件分析理解KingdoeNARI疆軟件分析理解Kingdoe⑤⑤應用領罐安全可信軟件分析理解n發現安全問題軟件設計開發發現安全問題軟件測試部署防范安全問題關鍵問題是分析、理解目標(閉源)軟件軟件測試部署防范安全問題關鍵問題是分析、理解目標(閉源)軟件7關鍵挑戰1:軟件分析——二進制信息缺失voidanswer(char*na源代碼源代碼}}intx=40+intx=40+機器碼符號、類型、邊界等信息逐步優化/丟棄匯編碼8n02關鍵挑戰1:軟件分析——二進制信息缺失n中間表示中間表示IR告4=calli64名5=addi6483,17=call#include<sLdlib.h>#include<sLdlib.h>源代碼}returny*y;}}反編譯7f4547f454反匯編無中生有,恢復缺失的信息 9printf("Hey8s,the}returny*y;}intint}②語義分析嚴重依賴人工經驗代碼軟件代碼功能分析:內存分配、加密解密?敏感數據如何流動?能分析安全分析鏈性能優化逆向漏洞③泛磁泛磁NARI思改運互聯應用領域軟件分析信息缺失軟件分析中國電機工程學會人在回路軟件理解軟件理解功能開發中國電機工程學會S*背景……中國電機工程學會信息缺失人在信息缺失人在應用領域軟件分析軟件理解軟件分析軟件理解A中A中#其出是◎NARIA部晶連改運互聯信息自信息自動補償。現有大語言模型難以分析二進制程序(閉源軟件)自然語言源代碼二進制程序(機器語言)人類需求設計實現x編譯部署21005011加載運行中國電機工程學會中國電機工程學會i程序執行(機器語言)進程進程(時刻1)通用大模型中國電機工程學會方案簡介:大語言模型中國電機工程學會(自注意力機制)(自注意力機制)少量算力(8張4090卡)十萬算力適量算力(10+英偉達卡*天)百萬算力(1000+英偉達卡*天)億元算力提示詞提示詞工程推理(按需)Nx知識增強NxN(廠商)N工具使用工具使用Gnrokg適量標注數據muts適量標注數據muts模型優化模型優化專業數據自動生成(源代碼、二進制、文本、二進制標注數據)關鍵技術突破關鍵技術突破技術技術注、對齊·優化模型設計,深刻理解機器語言,對齊人類專家·自研機器語言模型訓練方法··自研機器語言模型訓練方法·完善的機器語言模型基礎設施IEEES&P·大規模機器語言-自然語言-源代碼多模態對齊數據開數據<100GB多個關鍵技術零的突破多個關鍵技術零的突破S修改模型設計,融入代碼領域知識(指令語義、跳轉關系等)ax40046F:calljsjsrsp,20h11:xor17:pop25:jmpJUMP_14jmp03關鍵技術2:基于對比學習的語義理解中國電機工程學會r03關鍵技術3:基于多模態學習的語義理解中國電機工程學會利用多模態技術,將語義空間與人類意圖對齊,更準確地表示二進制代碼語義03我們的解決方案:機器語言大模型MLM中國電機工程學會版權保護版權保護性能功能優化翻譯軟件性能功能優化翻譯軟件遷移工具生成分析分析攻防分析多平臺語義摘要語義語義摘要語義搜索功能分類函數命名類型輸入格式語義語義比較多架構xB6xB6ARMMIPS調用圖譯調用圖譯邊界邊界控制流圖關系中國電機工程學會背景智能化方案典型應用…軟件逆向分析目標軟件反編譯生成C代碼突破卡脖子技術軟件一致性檢測可執行程序源代碼解決采購痛點AA生態軟件(無源碼)B生態軟件信創國產化、老舊軟件升級遷移漏洞挖掘目標軟件目標軟件漏洞大模型賦能0day、1day漏洞挖掘目標軟件軟件成分細粒度、高速、語義對齊的二進制代碼比對軟件A侵權?中國電機工程學會s04Demo-顛覆工作模式的智能逆向分析中國電機工程學會s·將黑盒二進制程序變成白盒代碼專家一樣理解二進制程序語義·將專家從繁瑣的底層代碼分析中解放出來,專注高層分析任務中國電機工程學會S背景…關鍵問題…智能化方案典型應用…05軟件自主可控、安全可信解決方案:大語言模型salesforce輝輝信息人在中國電機工程學會KSI*中國電機工程學會KSI*軟件分析軟件理解電子半導體軟件分析軟件理解石油石化生產制造石油石化力水濾信息自信息自圖對齊內容自動生成05機器語言大模型MLM(全球首個)中國電機工程學會功能安全分析、性能優化、功能拓展功能工具性能生成優化漏洞工具性能生成優化漏洞攻防保護軟件遷移分析多平臺語義分析語義搜索功能分類語義語義搜索功能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論