




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
報告題目:AI大模型技術在電力系統中的應用單位:香港中文大學(深圳)時間:2025年6月10日香港中文大學(深圳)TheChincseUnivcrsltyocHongKong.Sxnzhen01大語言模型與智能體技術簡介決策式Al決策+認知+感知+學習+執行+社會協作重大突破(1980s~2010年)習模型(2011年~2016年)啟“大模型時代“Sora推出(2017年~)“來源;艾瑞2023年AIGC場景應用展望研究報告什么是語言模型你好。你也好。你也好。真實分布你也好。真實分布你也好。你好。V我50。給定相同前綴,語言模型是輸出能近似人類語給定相同前綴,語言模型是輸出能近似人類語言分布的模型。□學習文字接龍(prefixLM),無需標注,自監督(self-supervised)書籍論文“書籍論文私有知識庫私有知識庫理)你好美LLM架構與訓練:預訓練階段·大數據:知識的來源,包含各種語言現象及語義知識,直接決定了模型的學習范圍容納大數據的載體,通常由深度神經網絡構成,學習大數據中的統計信息與抽象知識·大算力:處理大數據和大模型的并行計算集群,通常包含GPU、TPU等高性能運算設備大數據大模型大數據大模型直接全量參數微調問題:耗費GPU資源多,通常需要A100*8以上(百萬RMB)核心優勢:訓練參數量少,70億參數使用LoRA只微調效果好,LoRA效果不差于全參數微調,優于其他微調方式GPU要求低,3090*4即可微調7b模型十WW2.44±別GPT-2L(PreLayer)68.9±38.70+470.38.8570.4.8.89±m2454mTable3:GPT-2medium(M)andlarge(L)withdifferentalaptatChallenge.Forallnetrics,higherisbeorfewertrainableparameters.Confidenceintervalsareshownforexperimennumberspublishedinpri量化人類喜好,訓練打分模型基于強化學習,迭代最終模型加入代碼數據,重新訓練。量化人類喜好,訓練打分模型基于強化學習,迭代最終模型加入代碼數據,重新訓練。世界最高的山峰是?選擇問題重新選擇問題生成回答生成分數總結下面文章文章的大意是。。。打分模型打分模型訓練獎勵模型數據上,訓練大語言模型自監督學習監督學習強化學習LLM架構與訓練:各個訓練階段綜合來看..數干億單詞:圖書、百科、網頁等標注用戶指令數萬用戶指令和對應月級別訓練時間SFT模型天級別訓練時間強化學習十萬量級用戶指令天級別訓練時間0所⑥0Agent(自主智能體)考古學:通用定義典型實例能夠自動感知環境jumpforward/backstrafe常用工具:LLMAgent:關鍵能力一任務分解與試錯吧7mWag,uelG,GaudesC.CpakiaeDspmr.UaosnyMelrelgtededolngrdtaukplwdnkrobfeodagosopserdnrccen.Te4tfeiei0dgnMikbatndmokthatraakpardcthucnrbuatyacarpliTSiseratnikaiasdbtspmanphtieei.Thei子目標子目標子目標子目標Thought:...Action:..Obs:...Thought:...THETRAGEDYOFATHREE感覺訊息(祝/髦/嗅/味/髑)感覺訊息(祝/髦/嗅/味/髑)短期記己憶/工作記憶i*I'aplasnlngatHocpotQACoTMMLU1ee,Llama2)ToolsCorreettrajactarintTheught3-4-57-5-12AnyCThFe4ctfarmatForsi1-fxMeplEbpX★息④mLcLargeLanguageModeLM-friendlyenvironmentfeedbackAAFine-TuningandPromptOptimization:LLMAgent:新的模型能力獲取范式參數學習參數學習輸出輸入參數學習模型輸出將文本分類為中性、輸出我覺得食物還可以。提示詞能力參數學習參數學習智能體相關的提示詞6能力機制養香港中文大學(深圳)TheChincseUnivcrslyccHongKo02LLMAgents在電力系統研究中的應用思考大模型的核心能力邏輯推理LLMAgent在新型電力系統中的應用思考LLMAgent的潛在應用領域:·機器代人(機巡、客服、公文寫作等)·工作流重構(調度運行規劃)·多模態數據融合(數字化服務)·電力系統機理研究(Al4S)薛禹勝,新型能源體系(CPSS-EEE)的多目標協調規劃,/s/fodienZxB24j9MRX6qFa9w趙俊華,文福拴,黃建偉,等.基于大語言模型的電力系統通用人工智能展望:理論與應用[J].電力系統自動化,2024,48(6);13-28.大模型/領域小模型·適用于誤決策代價比較小的簡單機器代人場景;文本數據業務數據圖像數據·適用于需要引入文本、視頻等多種模態數據,且誤決策代價較小的場景;·不適用于需要對電力系統精確量化的場景;微調聯合推理訓練·實現推理與計算的統一;·較好的模擬因果模型背后的物理機理;·神經網絡架構尚有待探索;·可解釋性不足;推理大模型文本數據業務數據符號數據微調/RL大語言模型PINN因果模型符號模型(SPT)知識表示快速數值因果分析/符號推理計算可靠數值計算·推理大模型作為“大腦”,主要負責問題的規劃、任務的分解與高層次推理;·因果模型可在部分必要場景下,保證決策結果的可靠性;推理大模型文本數據文本數據人機協同符號數據訓練訓練知識表示快速數值因果分析/符號推理計算可靠數值計算·必要的場景中,可以將人引入多智能體框架中;·人可以向智能體提供反饋,并作為最終決策者判定決策質量;andmethods,IEEETran信息物理社會系統仿真·大模型的“智能涌現”現象,再次表明復雜系統的研究問題無法完全在還原論的框架下解決。·受薛禹勝院士的整體還原論(WRT)方法論的啟發,我們在思考如何將大模型應用于解決復雜的信息物理社會系統(CPSSE)的仿真問題。·WRT以CPSSE框架刻畫復雜系統,以混合動態仿真來提取對象系統的高維仿真軌跡,基于軌跡動力學的時空保熵映射,將復雜系統的研究從線性的“局部還原”提升為非線性的“整體保熵還原”。·大語言模型可以基于仿真或實測軌跡數據,基于其內化的理論常識,以一定概率在局部自主進行邏輯推理,實現對復雜系統局部的可解釋性。·基于大模型內化的理論常識,大模型也可以用作嚴格因果模型與近似模型的選擇器。·我們的初步研究表明,大語言模型已具有模仿人進行系統性邏輯思維的能力。因此,可以在CPSSE仿真中,結合真人、因果模型和大語言模型,實現更精確的人機混合仿真。問題,目前尚無法完全解決。現階段,“人機混合智能”可能是最符合電力系統實際的解決方案。·CPSSE仿真問題解決后,通過CPSSE對實際系統進行反饋,構建大模型驅動的數字孿生,是研究的終極香港中文大學(深圳)TheChincseUnivcrslyccHongKo基于大語言模型實現高適應性負荷預測(多模態數據融合)·傳統方法局限:1.難以應對特殊事件發生時,短期電力負荷的快速變化或極端波動;2.不能適應超出歷史數據涵蓋范圍的新場景;3.無法基于文本數據(新聞事件)進行預測推理。量多源數據,通過Agent篩選實時相關新聞并理解文本邏輯,顯著提升預測的適應性和精確度。新新聞+地理+歷史負荷+氣象數據+典型天temperature,humidity,windpoier,andpressure);Output:{Tieseriesofactualloadinthepredictiondate},ITA-LF框架圖- 新聞事件相關的文本數據的引入,有效提升在特定事件發生時負荷預測精確度。NeNewsNews:LoadNews...increasingrasidenialelectricityus(kWh)higherpowerloaddharingpeakhours一·Agent對新聞事件的篩選,在提升大模型輸入token效率的同時增強預測精確度:LoadDemandPrediction(kW)LoadDemandPrediction(kW)2TextualPrompt·基于新聞和負荷數據的ITA-LF預測效果普遍優于現有方法:6.71%93.92%6.09%94.70%5.42%95.06%·預測效果普遍優于現有方法,在不同時間和地理維度的適應性強,顯著提升預測的適應性和精確度:NSIV48頁048頁0ITA-LF(Ours)4400ReformerInformerAutoformer444基于LLM的負荷預測顯著提升準確性和可靠性,優化對突發變化的應對,突出了語言處理在整合非結構化信息中的作用,標志負荷預測及時序決策研究范式的轉變。調度大模型研究背景基于前期研究,我們發現可以將調度、市場行為以大語言模型的形式建模(語言模型化),解決傳統調度支撐體系中調度行為沒有有效建模工具的問題。我們希望實現調度行為數據(包含語音、拓撲結構、文本等多模態數據)、調度規程及系統工況等數據的統一表示,基于大語言模型多智能體實現調度行為的理解、推理、操作序列生成、智能博弈策略生成、市場波動響應及決策優化等目標,提高調度安全性與效率。事故處置鋪助決策B人類調度與(日志、語音)建模6LL建模6LLM哪溶電話保信躬晚切壁屋那悅臺賬目標事故處世鎮咖決策大腳型事故處世鎮咖決策大腳型“法4審恢括果事故處冒鋪mi決蓋太橫制/8進被瘤星助五0目標性能提升度決策推理與智能生成性能提升度決策推理與智能生成大模型訓練數據集大模型訓練數據集instruction";"Describethenainreasonforwindingfailuinrut":"cnoinput>°,output"!"Tnsulationdeterioration,oftencausedbynnisture,overheating,vibratian,vwoltage2instruction”:"ExplainthepotentialceusesoftapchangerfailuresintransForners.",output":"1apchangerfallurescanbecausedbyanalfunctionofthenechanicalswitchingresistancelaadcontacts,insulationtracking,pverheating,orcontaninationoftheinsulating{instruction:"Mhatarethepossiblereasonsfortraouitput:"Possiolereasonsfortransforxerbushingfalluresincludegenerinternalmoisture,lossofoil,vancalisn,andexteraltlashovercausedbyaninals."f"instruction";"Prowideanexanoleofaoutput”:"statisticsshowthatwinding+ailuresnostfrequentlycausetransforner"instruction!"5uggestsoBeneasursstoproutput”;"Topreventtmoisturelevels,avoidirgowerheatirg,minimizirgvibration,protectingagainstwoltagesur調度大模型交互頁面調度大模型交互頁面oqistionstodeteminetheoptmalgenerationschedulesandbusvoagemmineizthetotblcostofgcneratonwlemstcalnapeeentation.3.Sohdponlinarprerammingtechniqus,4.Censtraintsintmls,andtransmlsshonilineco,清除歷史對話業務場景支持:業務場景支持:穩定性穩定性穩定性測試集評測體系:測試集評測體系:■評測圍繞調度大模型在事實性、邏輯性、穩定性、公平性、安全性、表達能力六大類二十四個子維度展開評估。測試集題型設定:測試集題型設定:評測方法:評測方法:GeneralMeeting,2024(BestPaperSessio傳統經濟學仿真面臨的困難傳統方法大多依賴于數學模型。當仿真涉及多個參與者和復雜策略時,傳統方法往往難以應用,因為計算和分析的復雜度極高。動態博弈求解難度大:在動態和不完全信息的博弈情境中,傳統方法很難求得收斂解。泛化性較差:對于那些需要快速適應新信息和變化的實際應用場景,傳統的數學方法缺乏靈活性。大模型經濟學仿真的潛力推理能力:LLMs擁有處理復雜問題和理解復雜語境的能力,這使它們能夠理解和分析復雜的博弈策略。泛化能力:得益于LLM出色的zero-結合大量歷史案例,提高仿真的準確性和效率。通過模擬市場中player行為或策略,為 市場外部擾動。交易決策外部干擾組織者規則設計機制設計市場信息公示·國際形勢經濟形勢資本損益市場內部交易者大模型決策技術擾動參數生成大模型生成交易前市場出清結果模型輸出交易影響x?背景回顧背景回顧提示詞工程和檢索增強生成技術擬電力交易員工作環境,給出機組工況、斷面阻塞、燃料成本、碳成本、系統運行情況度逐步推理;StandardPrompting市場相關論文、政策文件、國內外市場研報、仿真模型數據、市場運行數據、系統工況數據等多場景多模態數據,LLM無需增量訓練即可初步理解應用領域知識。提示詞工程記憶知識問答鏈結果用戶大語言模型向量存儲基于大語言模型的碳市場均衡分析viof(,Shenzhen均衡的重要性均衡的重要性現有研究局限性現有研究局限性泛化性較差:傳統方法在應對新信息和變化時缺乏靈活性難以捕捉復雜市場動態:隨著數據和復雜性增加,傳統方法難以全面、精確地大語言模型優勢大語言模型優勢精確理解與分析市場動態:大語言模型在處理復雜數據和市場動態方面表現出強大的推理與適應能力:大語言模型具備卓越的推理能力和泛化能力,能夠迅多主體策略模擬與優化:將大語言模型與代理模型結合,能有效模擬多主體行工具工具模型模型碳市場均衡解是否十十定義:設計和優化提示詞,引導大語言模型生成所需輸出應用:構建求解策略和判斷優勢:提高模型響應的準確定義:動態調用外部工具或應用:利用求解工具和判斷工具,特別是通過Python進定義:由多個自主決策的代理組成,模擬市場參與者行為。終求解市場均衡。優勢:提供更準確的市場預測和均衡解。控排企業賣家一或賣出碳配額(決策變量) 賣家買家時,最大化交易收益與機會收益之和買家TheChineseUniversityofHongKong,Shenzhen碳市場QQP十P十1季度凈交易額加權價格企業仿真數據碳市場企業機組信息碳市場企業回歸分析、市場企業量,價格彈性)p值;0.8025152265417496948香港中文大學(深圳)The香港中文大學(深圳)TheChineseUniversityofHongKong,Shenzhen結果示例:工具調用結果示例:指令工程結果示例:工具調用結果示例:指令工程綜上,基于碳市場的設定,寫一下四個玩家的KKT方程并求解。為了求解四個玩家在碳市場中的KKT方程并找到最優的b和b,4的表達式,我們需要聯立方程并求解。讓我們詳細推導并實現代碼。我們需要滿足以下KKT條件:1.Stationarity:拉格朗日函數對b的偏導數應為零。2.PrimalFeasibility:約束條件應滿足。3.DualFeasibility:拉格朗日乘子λ;≥0。定義變量和參數拉格朗日函數=3:#處理最后一解eq=sp.Eq(sp.d1ff(Lagrangians[eq=sp,Eq(sp.diff(Lagrangians[il,代碼示例:多代理模型代碼示例:多代理模型評估模型回應生成質量evaluation_promptevaluation_promptevaluation_prompt_gen(strategy,finaevaluation_output,evaluchatgpt_agent(evaluatscore_match=re.search(r"'sscore=score+fprint("Novalid評估模型生成解是否為均衡解defequilibrium_judge(game_setting,sr_resprompt=equilibriequilibrium_response=chatgpt_agent(proclean_markdown_code(equilibriumreturnexecute_python_code(cleaned_python_code)注:真實實驗中大語言模型均通過調用API實現,為展示清晰用網頁端的效果代替。燃氣機組燃氣機組組組示例企業參數香港中文大學(深圳)0富余碳配額(萬噸)大國企中國企燃料類型煤炭煤炭天然氣煤炭富余配額(t)價格彈性系數注:以機會收益中的(1+預期上漲率)*(1-配額折算率)=0.8為例。基于大語言模型的碳市場均衡分析基于大語言模型的碳市場
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年水利工程師資格考試試卷及答案
- 2025年全國職業資格考試試卷及答案
- 2025年臨床醫學專業執業考試試卷及解答
- 2025年交通運輸管理專業考試試題及答案
- 2025年航空工程技術考試試題及答案
- 2025年創新思維與團隊合作能力綜合考試試卷及答案
- 2025年互聯網金融的法律風險與合規路徑的考試卷及答案
- 2025年法學專業學位研究生入學考試試題及答案
- 物資發放領用管理制度
- 物資采購流程管理制度
- 出版社編輯聘用合同模板
- 臨床試驗申辦方的職責
- 傳統文化與現代經營管理(北京大學)學習通測試及答案
- 2025年臨床醫師定期考核必考復習題庫及答案(900題)
- 醫保藥械管理制度內容
- 新聞、記者采編人員崗位職業技能資格基礎知識考試題及答案
- 【MOOC】當代社會中的科學與技術-南京大學 中國大學慕課MOOC答案
- 3D打印技術與應用知到智慧樹期末考試答案題庫2024年秋西北工業大學
- 《常州紅梅公園》課件
- 軟件正版化工作培訓
- 《限額以下小型工程施工安全管理辦法(試行)》知識培訓
評論
0/150
提交評論