人工智能行業市場前景及投資研究報告:機器語言大模型賦能軟件自主可控-worldreportmarket_第1頁
人工智能行業市場前景及投資研究報告:機器語言大模型賦能軟件自主可控-worldreportmarket_第2頁
人工智能行業市場前景及投資研究報告:機器語言大模型賦能軟件自主可控-worldreportmarket_第3頁
人工智能行業市場前景及投資研究報告:機器語言大模型賦能軟件自主可控-worldreportmarket_第4頁
人工智能行業市場前景及投資研究報告:機器語言大模型賦能軟件自主可控-worldreportmarket_第5頁
已閱讀5頁,還剩21頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

匯報提綱中國電機工程學會00背景關鍵問題智能化方案典型應用總結背景-軟件是網絡空間的基石中國電機工程學會01CEE自主可控安全可信RIG大數據人工智能物聯網區塊鏈云計算智慧城市互聯網各種計算終端服務器超級計算機衛星各種通信技術超高速光纖WiFi3G5G4GA背景-需求1:軟件生態面臨自主可控難題中國電機工程學會CEE01關鍵軟件長期由國外主導安全、知識產權風險面臨斷供、移動端操作系統分布情況PC端操作系統分布情況Matlab(2020)0.04NTAAINMATLABXCodeGhost(2015)NO.1895SOLARWINDSHACKEDOOSolarWinds(2020)工業設計軟件工業信息管理軟件CAD(計算機輔助設計)軟件CAE(計算機輔助工程驗證)軟件CAM(計算機輔助制造)軟件工業控制軟件GE/西門子、MES、DCS、SCADA產品:ERP、CRM、SCMTheXz/IzmaBACKDOOR企業:SAP、Oracle、Saleforcexz(2024)挑戰:關鍵軟件閉源,供應鏈風險高,自主可控難度大背景-需求2:軟件生態面臨安全可信難題中國電機工程學會01軟件安全風險未知成為網絡攻擊的重要突破口NumberofCVEspublishedinNVDeachwee震網病毒000700MIRAI漏洞問題層出不窮ENXOS(伊朗600核設500施)MIRAI僵戶網絡400100iPhone越獄&安卓Root820092911201320152017201920212021TotalmalwareTEST惡意代碼急劇增長2:23:5737ROOTwDoiPay06:23:57137PowerOutagCausedbyHackers-BbitcolnBeereWannaCry(勒索150+國家)電網斷電(烏克蘭)挑戰:自標軟件閉源,分析難度大,安全問題隱藏深5匯報提綱中國電機工程學會00背景關鍵問題智能化方案典型應用總結關鍵問題-軟件開發與安全中國電機工程學會02件設費應用領ORACLESAP用友自主可控安全風險發現與防范LenovoKingdeeSIEMENSSptcWindowsLuxDSDASSULTAAUTODESK自主可控安全Ansyssynapsys目標軟件可信開發工具ABBORACLE中控·SUPCONNNARIABBSIEMENS聯軟件分析理解發現安全問題防范安全問題軟件分析理解軟件設計開發軟件測試部署CheaORAC關鍵問題是分析、

理解目標(閉源)軟件關鍵挑戰1:車軟件分析二進制信息缺失中國電機工程學會02中間表示IR源代碼#include<stdio.h>#include<stdlib.h>defineiat@answer(is*,i8*)#0calc.ccal1i64@strlen(i8*$D)#364calli64@strlen(i8*$l)#3printf("Hey&s,theansweris:dn",nare,x);voidcalc(inty)(returny*y;87-callnoaliasib*@ma11oc(164%6)#4匯編碼answer:.LFB5:88=calli6*voidmain(intargc,char*argv[l)(intx=40.+atoi(argv[2]),@strcpy(i8+$7,cfistartprocinty=calc(x);pushg%rbp號9-getelementptrinboundsi8,ia*.cft-defcfa.offset16answer(argv[ll,y);#7,164$3cfi_offset6,-16movq%rsp,%rbp#10=calli8*.cfidef.cfa_registersubqs16,%rspmovq18*1)#4機器碼%rdt,-8(%rbp)chao@calc$xxdcalcmovl%est,-12(%rbp)00000000:7f454c4602010100000000000000000000000010:03003e0001000000ELFmoVL-12(%rbp),%edx-8%rbp),%rax00008005

000000000000movqmovqleag%rax,%rs00000020:40000000000000000030:0000000000003800000000000000000078190900400000000000LCO(%rip),%rdiSo%eax4000040000000000000040000000000000001d000000000000001c00movl00000040:00000050:00000060:00000070:00000080:060000000000000000000000printfePLT40000000f801000008000000nop4000f801符號、類型、邊界等信息逐步優化/丟棄leavecfi_def_cfa78O0EO0400ret380200000000000038020000000000008關鍵挑戰1:車軟件分析二進制信息缺失中國電機工程學會02中間表示IR#include#incluce<stdio.h><stdlib.h>源代碼definei8tanswer(i8*,18*)#01calc.c#3calli64@strlen(i8*各0)#3voidanswer(char*name,intx)f#4=ca1l164printf("Hey&s,theansweris:&dln",name,x);@strlen(i8+g1)#3#5add1643,1#6-addi64#5,84#7=callnoaliasig+voidcalc(inty)treturny*yi@ma11oc(16486)#4匯編碼answer:LFB5:88=cal118+voidmain(intargc,char*argv[l)(intx=40+atoi(argv[2]);estrepy(i8+$7,18*g0)#4cfi_startprocpusha%rbpinty-calc(x):a9=getelementptrinboundsi8,i8t87.164$3反編譯cfidefcfa_offset16.cfi_offset6,-16answer(argv[llry);810-cal118*dqu%ds.%bAow"cfi_def_cfa_registersubqS16,%rsp@strcpy(i8*$9,18*¥1)#4機器碼reti8*%?movq%rdi,-8(%rbp)chao@calc$xxdcalcmovl%esi;-12(%rbp)-12(%rbp),%edx0000ELFmovl00000000:7f454c460201010000000000000000000010:03003e0001000000lifting00000000000000001c00movq-8(%rbp),%rax%rax,%rsi80050000movq00000020:4000000000004000000038000000000000007819

0000Lce(%rip),%rdiLeag00000030:00000000006040004000f8014000

1d00movX00%0S000000000000反匯編00000040:06000000040000000050:4000000000000060:f80100000000000000000000callprintfePLT00000000dou00000000Leavecfi.def_cfa7,8ret無中生有,恢復缺失的信息00000070:08000000000000000300000004000000800000080:380200000000000038020000000000009關鍵挑戰2:車軟件理解人在回路中國電機工程學會02源代碼#incluae#include<stdio.h><stdlib.h>2代碼功能分析:calc.c語義分析內存分配、加密解密?voidanswer(char*name,intx)(敏感數據如何流動?printf("Hey&s,theansweris:sdln",nare,x):voidcaic(inty)(returny*y;嚴重依賴人工voidmain(intargc,char*argvll)(功

性intx=4o+atoi(argv[2]);inty=calc(x);?answer(argv[ll,y);經驗能分能分析

析安全分析機器碼chao@calc$xxdcaloELF供應惡意逆向00000000:7f454c4602010100000000000000000000000010:03003e00010000008005000000000000漏洞鏈代碼破解00000000781900000000000000000020:4000000000000030:3800

0060

40001d001c004000

00000000000040000400軟件轉寫性能優化00000040:0600000000000050:0000000000000000000000000000000000000000000000000000000000004000f8010800000000004000f80100000000000000000060:00000070:0000030038020400000010000000000080:38020000000000008問題總結中國電機工程學會02人在回路信息缺失硬件設備應用領城ORACLESAP用友安全分析LenovoKingdee研發說計單作系統WindowsSptcSIEMENSDSDRSERUETAAUTODESKLmuxoAnsyssynopsys日標軟件開發工具AnBscneider中控·SUPCONORACLE軟件分析軟件理解放入式軟伴ABBSNARI功能開發SIEMENSTBMChea致通互聯.Kingdee111匯報提綱中國電機工程學會00背景關鍵問題智能化方案典型應用總結12智能化解決方案:大語言模型中國電機工程學會03人在回路信息缺失應用領城硬件設備ORACLESAP用友安全分析LenovoKingdee研發設計單作系院SptcSIEMENSWindowsLmuxAAUTODESKAnsyssynupsys日標軟件開發工具ABBORACLE信裝電子中控·SUPCON軟件分析軟件理解最入式款件ABBNARI功能開發SIEMENSTBMCheaORAC致通互聯Kingdee信息自動補償人類意圖對齊內容自動生成13現有大語言模型難以分析二進制程序(閉源軟件)中國電機工程學會03軟件可以抽象為三個維度的表示源代碼二進制程序(機器語言)程序執行(機器語言)自然語言Hnnledacataio.進程進程人類需求意圖arswazicharana,ctHB1FD0時刻N)(時刻1)設計實現編譯部署加載運行arg40+.x;:4132DE320DMLM011010110101MachineLanguageModelChatGPTcodellama機器語言是網絡空間基石,但是缺少智能化解決方案通用大模型代碼大模型14方案簡介:大語言模型中國電機工程學會03海量算力適量算力少量算力Transformer架構(自注意力機制)(1000+英偉達卡*天)(10+英偉達卡*天)(8張4090卡)億元算力百萬算力十萬算力Dutpu提示詞工程預訓練微調推理RAG知識增強(專業用戶)(普通用戶)(廠商)工具使用海量數據適量標注數據目標數據(TB級高質量數據)(MB級高質量數據)(按需)專業數據自動生成模型優化源代碼,二進制、文本、二進制標注數據)(面向二進制軟件)15關鍵技術突破中國電機工程學會03數據技術工程大規模機器語言-自然全自動數據生成、標注、對齊優化模型設計,深刻理解機器語言,對齊人類專家·自研機器語言模型訓練方法語言-源代碼多模態對齊數據完善的機器語言模型基礎設施·100TB規模,業界公開數據<100GB010100ConferenceISSTAacmNDSSUSENIXSIGSACISSTA:InternationalSymposiumonSoftwareTestingandAnalysisSECURITYSYMPOSIUMIEEES&P多個關鍵技術零的突破16融合領域知識的模型優化關鍵技術1:中國電機工程學會03修改模型設計,融入代碼領域知識(指令語義、跳轉關系等)0x400467:test0x40046A:js1:testraxraxrbxrax,rax0x40047CJUMP_20rdi4:js6:mov0x40046C:mov0x40046F:rdi,rbxputscallTokenizationandNormalization9:callputsInputtokentokenembeddingpositionembedding8x400474:xor0x400476:addeax,rsp,rbxeax20h11:xoreaxrspeax14:

ppe<const>17:19:popretnrbx8x40047A:pop0x40047B:jumpembedding(JUMP_14)jumpembedding(JUMP_20)retnleacall8x46047C:0x400483:28:leacallrdi<str>rdi,stresub_4005700x40847623:<function>JUMP_140x400488:jmp25:jmpPuInput<CLS>testraxraxJUMP_20addrsp<const>lea<str>jmpJUMP14<function>TokenEE..ErdEJUMP_20EespEestrEcallEUMP_14Embeddings+++PositionEmbeddings/SSTA2022jTrans:Jump-AwareTransformerforBinaryCodeSimilanityDetection."17基于對比學習的語義理解關鍵技術2:1中國電機工程學會03利用對比學習技術,使得語義相似的二進制代碼embedding接近queryfunctionvectordissimilarfunctionvectorsimilarfunctionvectorsimilarfunctiondissimilarfunctioncossimilarity0.98functionpoolcossimilarityer0.46queryfunction18關鍵技術3:基于多模態學習的語義理解中國電機工程學會03利用多模態技術,將語義空間與人類意圖對齊,更準確地表示二進制代碼語義AssemblyEmbeddingw/oAlignmentAssemblyEmbeddingExplanationEmbeddingAssemblyCodeExplanationsSemanticSpaceThiscodereadsnetwork0:1:endbr64pushrbxmovdataandassignsittoalist.Itdoesthisbylooping2:rbxcs:qword_xrbx,rbxxthroughthelistofnetworkdataandassigningthedata3:testshortINSTR12totheirrespectivenames.5.movmovrax,[rbx]6:rdx,[rax+20h]Tags:network,data,monitoring.AssemblyCodeandExplanationPai"CLAP:LearningTransferableBinaryCodeRepresentationsWithNaturalLanguageSupervision."/SSTA2o2419機器語言大模型MLM我們的解決方案:03安全分析功能拓展性能優化、EXEELF漏洞工具

性能

功能

軟件供應鏈MACH-OAPT翻譯分析

攻防

保護

分析優化遷移生成全場景智能化,開創軟件分折新范式WindlowsMacosLinux多平臺語義分析MLM功能

語義語義搜索

分類

比較函數

函數類型命名多場景多能力0110語義輸入格式10110101摘要MachineLanguageModel語義理解超越人類專家水平,高效輔助逆向分析多架構結構分析ARMx86MIPSPPC函數反函數

跳轉控制反編intel指令譯ARM調用treescale邊界

邊界

關系匯編

流圖圖AMDZGBROADCOHIBM反匯編核心功能全面超越IDAPro20匯報提綱中國電機工程學會00背景關鍵問題智能化方案典型應用總結21典型應用中國電機工程學會04軟件逆向分析軟件供應鏈分析軟件生態遷移1001010000110010010100001100MLMMLM001036L001010MLMHH0001100001100A生態軟件目標軟件B生態軟件目標軟件軟件成分(無源碼)反編譯生成C代碼突破卡技術信創國產化、老舊軟件升級遷移細粒度、高速、語義對齊的二進制代碼比對軟件一致性檢測漏洞挖掘軟件保護分析10010100010001MLM100101000100010001100MHLM0001100100101000100011001000100MLM軟件A侵權?0001100自標軟件00011可執行程序漏洞缺漏?軟件B源代碼破解取證難題解決采購痛點1day漏洞挖掘大模型賦能oday22Demo-顛覆工作模式的智能逆向分析中國電機工程學會04MLM機器語言大模型將黑盒二進制程序變成白盒代碼首次實現像人類專家一樣理解二進制程序語義將專家從繁瑣的底層代碼分析中解放出來,專注高層分析任務示文件23匯報提綱中國電機工程學會00背景關鍵問題智能化方案典型應用總結24安全可信軟件自主可控、中國電機工程學會05解決方案:大語言模型硬件設備經營管理應用領域信息缺失人在回路SAD高欣型制造業ORACLEhpsalesfore用友Lenovo.Kingdee功能開發研發設計操作系統WindowsptcSIEMENSDASSALTAAUTODESKLinuxAnsyssynopsyscadencezwsoFT中望軟件神軟流程型制造業生產制造SI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論