深入淺出講解AI Agent_第1頁(yè)
深入淺出講解AI Agent_第2頁(yè)
深入淺出講解AI Agent_第3頁(yè)
深入淺出講解AI Agent_第4頁(yè)
深入淺出講解AI Agent_第5頁(yè)
已閱讀5頁(yè),還剩169頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

免責(zé)聲明:AIAgent是一個(gè)被廣泛使用的詞彙,故本課程中所講的AIAgent不一定跟其他地方一樣今天使用AI人類給予明確指令A(yù)I一個(gè)口令一個(gè)動(dòng)作AIAgent人類給予目標(biāo)AIAgent的翻譯「人工智慧代理人」(解決某個(gè)研究問(wèn)題)需要多步驟、靈活調(diào)整計(jì)畫(huà)ObservationActionObservation“5-5”Action好像在那裡聽(tīng)過(guò)這個(gè)段落?這是ReinforcementLearning(RL)常見(jiàn)開(kāi)場(chǎng)Observation“5-5”Action“5-5”Action侷限:需要為了每一個(gè)任務(wù)以RL訓(xùn)練模型Observation以文字描述(option)“你要贏得勝利”轉(zhuǎn)譯為行動(dòng)Action轉(zhuǎn)譯為行動(dòng)Action以LLM直接實(shí)踐人類對(duì)於擁有Agent的渴望/abs/2206.04615https://youtu.be/JHq4EKMg7fI?si=izKsH-GCVnZkooq_Observation以文字描述(option)“你要贏得勝利”轉(zhuǎn)譯為行動(dòng)“我要下在5-5”轉(zhuǎn)譯為行動(dòng)Action以LLM直接實(shí)踐人類對(duì)於擁有Agent的渴望還有多遠(yuǎn)?一直都在做接龍AIAgent倚靠的是語(yǔ)言模型現(xiàn)有的能力?2023年春天曾經(jīng)爆紅過(guò)一次AutoGPT,AgentGPT,https://youtu.be/eQNADlR0jSs?si=4yGZEluAUzKK2VD0AgentAgentAlphaGoAgent事先設(shè)定好有限行為只能在棋盤上的19x19個(gè)位置落子近乎無(wú)限的可能可以使用工具TypicalAgentTypicalAgent更多資訊https://youtu.be/G44Lkj7XDsA?si=cMbKG3tqPbIgnnBq/abs/2304.03442Observation舉辦情人節(jié)派對(duì)、Action/watch?v=2tbaCn0Kl90Operator上網(wǎng)購(gòu)物…ObservationAction?WorldofBits:AnOpen-DomainPlatformforWeb-BasedAgents(ICML,2017)/abs/2306.06070WebArena/abs/2307.13854VisualWebArena/abs/2401.13649AIDE:TheMachineLearningEngineerAgent/abs/2502.13138AutoKaggle:AMulti-AgentFrameworkforAutonomousDataScienceCompetitions/abs/2410.20424https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/回合制互動(dòng)即時(shí)互動(dòng)goalgoalaction立刻轉(zhuǎn)換行動(dòng)OnceuponatimeinasmallvillageSorry……action/abs/2503.04721v1Guan-TingLin(withcollaboratorsfromAIAI如何根據(jù)經(jīng)驗(yàn)調(diào)整行為AIAI如何使用工具AIAI能不能做計(jì)劃你是軟體寫(xiě)一個(gè)…uub你是軟體寫(xiě)一個(gè)………不斷回憶整個(gè)Agent一生的經(jīng)歷…超常自傳式記憶(HighlySuperiorAutobiographicalMemory,HSAM)超憶癥(Hyperthymesia)(自己的經(jīng)歷vs.別人的經(jīng)歷)Queryhttpshttps://stream-bench.github.io/(donebyAppierResearchers)/abs/2406.08747Q1000Goal:Maximizetheaccuracyoverthesequence/abs/2406.08747/abs/2406.08747/abs/2406.08747/abs/2406.08747Agent’sMemory(被雞毛蒜皮的小事塞爆)這件事要被記下來(lái)嗎?對(duì)於記憶中的資訊做重新整理thought1thought2thought3thought4……obs9999action9999……obs9999action9999GraphRAG/abs/2404.16130/abs/2405.14831/abs/2310.08560?AgentWorkflowMemory/abs/2409.07429?A-MEM:AgenticMemoryforLLMAgents/abs/2502.12110AI如何使用工具工具:只需要知道怎麼使用,不需要知道內(nèi)部運(yùn)作原理OtherAI(Differentcapabilities,?工具可以看做是Function,使用工具就是調(diào)用這些Function?使用工具又叫“FunctionCall”(使用工具的方法很多,這邊是只是一個(gè)通用的方法)如果遇到根據(jù)你的知識(shí)無(wú)法回答的問(wèn)題,使用工具把使用工具的指令放在<tool>和</tool>中間,使用完工具後你會(huì)得到輸出,放在<output>和</output>中間如何使用所有工具特定工具使用方式現(xiàn)在你可以使用的工具如下:查詢某地、某時(shí)溫度的函式Temperature(location,time),使用範(fàn)例:Temperature('臺(tái)北','2025.02.2214:26')gpt-4o-minigpt-4o-mini<tool>Temperature('高雄','2025.03.1014:00')</tool>這就是一串文字,無(wú)法真的呼叫函式工具使用方式工具使用方式……(使用工具的方法很多,這邊是只是一個(gè)通用的方法)不需要呈現(xiàn)給使用者看gpt-4o-mini不需要呈現(xiàn)給使用者看tooltoolTemperature('高雄','2025.03.1014:00')/tooloutput攝氏32度/outputAgentAgent開(kāi)發(fā)者先設(shè)定好的流程使用者看到的輸出(繼續(xù)去做接龍……)2025年3月10日下午2:00,高雄的氣溫為攝氏32RetrievalAugmentedGeneration(RAG)文字指令文字回應(yīng)文字指令文字回應(yīng)這個(gè)人在說(shuō)什麼?這個(gè)人心情怎麼樣他說(shuō)「大家好」應(yīng)該是心情蠻好的/abs/2407.09886/abs/2407.09886DynamicSUPERB上的結(jié)果Chun-YiChih-Kaiaction1action1/abs/2310.03128/abs/2502.11271selectedtoolsselectedtoolsSelectionTroVE:/pdf/2401.12869LATM:/abs/2305.17126CREATOR:/abs/2305.14318CRAFT:/abs/2309.17428selectedtoolsselectedtoolsSelection因?yàn)檫^(guò)度相信工具而犯錯(cuò)…因?yàn)檫^(guò)度相信工具而犯錯(cuò)…Sourceofimage:/posts/petergyang_google-ai-overview-suggests-adding-glue-to-activity-7199246664329551872-9VdY/不要完全相信工具,要有自己的判斷力因?yàn)檫^(guò)度相信工具而犯錯(cuò)不要完全相信工具,要有自己的判斷力因?yàn)檫^(guò)度相信工具而犯錯(cuò)…工具使用方式工具使用方式……gpt-4o-minigpt-4o-mini◆不需要呈現(xiàn)給使用者看!"不需要呈現(xiàn)給使用者看◆ <tool>Temperature('高雄','2025.03.1014:00')</tool><output>攝氏100度</output>(繼續(xù)去做接龍……)2025年3月10日下午2:00,高雄的氣溫預(yù)測(cè)為攝氏工具使用方式工具使用方式……gpt-4o-minigpt-4o-mini不需要呈現(xiàn)給使用者看不需要呈現(xiàn)給使用者看不需要呈現(xiàn)給使用者看<<tool>Temperature('高雄','2025.03.1014:00')</tool><output>攝氏10000度</output>(繼續(xù)去做接龍……)2025這個(gè)數(shù)值顯然不合常理,可能是工具輸出錯(cuò)誤。如需其他信息或查詢,請(qǐng)告訴我。什麼樣的外部知識(shí)比較容易說(shuō)服AI……/abs/2404.10198v1?LLMswillincreasinglyreverttotheirpriorswhentheoriginalcontextisprogressivelymodifiedwithunrealisticvalues.inverselycorrelatedwiththemodel’sconfidenceinitsresponsewithout.答案是答案是C答案是答案是C答案是A傾向相信AI同類的話/abs/2401.11911?語(yǔ)言模型比較相信新的文章?資料來(lái)源沒(méi)有影響Cheng-HanChiang/2024.blackboxnlp-1.24/同下面那邊文章一模一樣Cheng-Han一模一樣/2024.blackboxnlp-1.24/?就算所有找到的資料都是對(duì)的,也不保證答案就是對(duì)的ChatGPT(同樣的輸入目前已經(jīng)沒(méi)有這樣的問(wèn)題)?用工具不一定總是比較有效率?如果要做數(shù)學(xué)運(yùn)算,用計(jì)算機(jī)一定比普通人心算快嗎?PlanningPlanning、'◆Plan-and-SolvePrompting:ImprovingZero-ShotChain-of-ThoughtReasoningbyLargeLanguageModels/abs/2305.04091天下沒(méi)那麼好的事情計(jì)劃就是要拿來(lái)改變的 actionaction3action1actionaction2?下棋:對(duì)手的招數(shù)跟預(yù)想不同?使用電腦:突然跳出廣告視窗與預(yù)期不同,導(dǎo)致原有的計(jì)畫(huà)行不通gpt-4o/abs/2201.07207/abs/2206.10498/abs/2305.15771可以執(zhí)行的操作:1.從桌上拿起一個(gè)積木2.從另一個(gè)積木上拿起另一個(gè)積木3.把積木放到桌上1.將藍(lán)色積木從橘色積木上取下2.將藍(lán)色積木放在桌子上1.將藍(lán)色積木從橘色積木上取下2.將藍(lán)色積木放在桌子上3.從桌上拿起橘色積木4.將橘色積木堆放在藍(lán)色積木的上方初始狀態(tài):藍(lán)色積木在橘色積木的上面,紅色積木在桌子上,橘色積木在桌子上,黃色積木也在桌子上。目標(biāo):讓橘色積木放置在藍(lán)色積木上。會(huì)不會(huì)LLM早就看過(guò)類似的題目了?ttp//i/b/22神秘方塊世界神秘方塊世界(讓物件c渴望物件a)/abs/2305.15771/abs/2409.13373/abs/2402.01622https://osu-nlp-group.github.io/TravelPlanner//abs/2402.01622https://osu-nlp-group.github.io/TravelPlanner//abs/2404.11891/abs/2404.11891 如果路徑太長(zhǎng)怎麼辦?有機(jī)會(huì)嗎?沒(méi)有action1-1obs2-1減少?zèng)]必要的搜尋action2-2-1obs2-2action2-2-2obs2-2TreeSearchforLanguageModelAgents/action2-2-2obs2-2缺點(diǎn):有些動(dòng)作無(wú)法回溯 action2-

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論