第一部分用搜索方法求解問題_第1頁
第一部分用搜索方法求解問題_第2頁
第一部分用搜索方法求解問題_第3頁
第一部分用搜索方法求解問題_第4頁
第一部分用搜索方法求解問題_第5頁
已閱讀5頁,還剩26頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1.8博弈作者朱福喜朱三元1.8.1概述博弈一向被認為是富有挑戰性的智力的游戲,有著難以言語的魅力。博弈問題常與對策問題聯系在一起。對策論(GameTheory)用數字方法研究對策問題。一般將對策問題分為零和對策和非零和對策。最典型的零和對策問題是我國古代齊王與田忌賽馬的問題。該問題是齊王與田忌都有可分為上、中、下三匹馬。齊王的上馬、中馬、下馬都比田忌相應的上馬、中馬、下馬好,但田忌的上馬比齊王的中馬好,田忌的中馬比齊王的下馬好,聰明的田忌采取了下述對策后一舉取勝:作者朱福喜朱三元作者朱福喜朱三元非零和對策的例子有:囚犯難題(Theprisonerdilemma)。該問題是有兩個嫌疑犯A和B,暫時還沒有獲得他們犯罪的確定的證據?,F對他們判刑的規則是:作者朱福喜朱三元博弈雖然自古就是人與人的對弈,但自從有了計算機以后,人們開始就有用計算機下棋的想法,早在60年代就已經出現若干博弈程序,并達到較高的水平,現已出現計算機博弈程序能夠與人類博弈大師抗衡的局面。舉世瞻目的人機對弈是1997年IBM公司編制的深藍(deepblue)計算機與國際象棋大師卡斯帕羅夫對弈,取得了三勝二和一負的好成績。博弈的研究不斷為人工智能提出新的課題,可以說博弈是人工智能研究的起源和動力之一。作者朱福喜朱三元博弈問題對人的深層次的知識研究提出了嚴峻的挑戰。如何表示博弈問題的狀態,博弈過程和博弈取勝的知識,這是目前人類仍在探討之中的問題。要提高博弈問題求解程序的效率,應作到如下兩點:改進生成過程,使之只生成好的走步,如按棋譜的方法生成下一步;改進測試過程,使最好的步驟能夠及時被確認。作者朱福喜朱三元要達到上述目的有效途徑是使用啟發式方法引導搜索過程,使其只生成可能贏的走步。而這樣的博弈程序應具備:一個好的(即只產生可能贏棋步驟的)生成過程。一個好的靜態估計函數。下面介紹博弈中兩種最基本的搜索方法。作者朱福喜朱三元1.8.2極小極大搜索過程1.極小極大搜索的思想極小極大搜索策略是考慮雙方對弈若干步之后,從可能的步中選一步相對好的走法來走,即在有限的搜索深度范圍內進行求解。為此要定義一個靜態估計函數f,以便對棋局的勢態作出優劣估計。這個函數可根據棋局優劣勢態的特征來定義。作者朱福喜朱三元這里規定:MAX代表程序方MIN代表對手方P代表一個棋局(即一個狀態)有利于MAX的勢態,f(P)取正值有利于MIN的勢態,f(P)取負值勢態均衡,f(P)取零f(P)的大小由棋局勢態的優劣來決定。作者朱福喜朱三元使用靜態函數進行估計必須以下述兩個條件為前提:(1)雙方都知道各自走到什么程度、下一步可能做什么。(2)不考慮偶然因數影響。在這個前提下,博弈雙方必須考慮:(1)如何產生一個最好的走步。(2)如何改進測試方法,能盡快搜索到最好的走步。作者朱福喜朱三元MINMAX的基本思想是:(1)當輪到MIN走步的結點時,MAX應考慮最壞的情況(因此,f(p)取極小值)。(2)當輪到MAX走步的結點時,MAX應考慮最好的情況(因此,f(p)取極大值)。(3)當評價往回倒推時,相應于兩位棋手的對抗策略,不同層上交替的使用(1)、(2)兩種方法向上傳遞倒推值。作者朱福喜朱三元2.極小極大搜索算法極小極大過程的算法如下:1.T:=(s,MAX),OPEN:=(s),CLOSED:=();{開始時樹由初始結點構成,OPEN表只含有s.}2.LOOP1:IFOPEN=()THENGOLOOP2;3.n:=FIRST(OPEN),REMOVE(n,OPEN),ADD_TO_LAST(n,CLOSED);//約定加到尾部作者朱福喜朱三元4.IFn可直接判定為贏、輸或平局THENf(n):=∞∨-∞∨0,GOLOOP1ELSEEXPAND(n)→ni,ADD({ni},T)IFd({n})<kTHENADD_TO_LAST({ni},OPEN),GOLOOP1ELSE計算f(ni),GOLOOP1;{n達到深度k,計算各端結點f值}5.LOOP2:IFCLOSED=NILTHENGOLOOP3ELSEnp:=LAST(CLOSED);作者朱福喜朱三元6.IF(np∈MAX)∧(f(nc∈iMIN)有值)(其中nci為np的下一層節點)THENf(np):=MAX{f(nci)},REMOVE(np,CLOSED);{若MAX所有子節點均有值,則該MAX取其極大值。}IF(np∈

MIN)∧(f(nci

∈MAX)有值)THENf(np):=MIN{f(nci)},REMOVE(np,CLOSED);{若MIN所有子節點均有值,則該MIN取其極小值。}作者朱福喜朱三元7.GOLOOP2;8.LOOP3:IFf(s)=NILTHENEXIT(END∨Mark(Move,T));{s有值,或結束或標記走步}其中ADD_TO_LAST約定加入節點到表的尾部,END表示失敗或成功或平局退出,MARK標記一個走步。作者朱福喜朱三元3.算法膏分析添與舉鳥例該算貼法分掏三個虛階段課進行征。第一太階段漢為步梨驟2-4,使寫用寬糠度優凝先法貼生成環規定亂深度嬌的全侍部博蘭弈樹境,然插后對烏其所內有端螺節點基計算鄙其靜授態估移計函么數值鐘。第二閣階段辦為步醋驟5-7是從拼底向津上逐孕級求凈非終缸結點貿的倒方推估害計值古,直塊到求哈出初屯始節脫點的烈倒推聞值f(彎s)為止訂。f(相s)的值塊應為ma扶x肉mi冠n…除.饑{f夠(ni1堆i2格i3著…ik)},其吼中nik表示膊深度袍為k的端鐮節點被。第三桃階段彼,根川據f(s)可選炕的相赤對好賣的走榜步,驗由Ma葛rk插(裳Mo閣ve窯,嘴T成)標記衫走步尋。作者余朱憐福喜擊朱三叨元例1.拴25在九輪宮格晚棋盤泳上兩眉位選紀手輪肉流在葡棋盤勢上擺均各自瓣的棋底子,朝每次燙一枚殿,誰戴先取鏡得三饒子一矮線的墾結果祝就取拿勝。設程薄序方MA和X的棋女子用X表示對手顧方MI表N的棋至子用O表示.作者盒朱明福喜練朱三佳元靜態傷估計挪函數竊為:+∞當p為MA士X贏f(愈p)新=距-∞當p為MI漫N贏全部纖空格所放X后三畏字成注一線疾的總景數)-(全賤部空鼓格放O后三塵字成劉一線吧的總旱數)例如君,P的格過局為寶:作者駁朱贊福喜競朱三托元則可覆得f(陸p)=項5慘–消6價=響-1?,F在衣考慮苗走兩媽步的條搜索沿過程可,即維算法董中K=餡2。利控用棋黎盤對鬼稱性迷條件紹,則MA環X走第銜一步射棋調罷用算緒法產樓生搜某索樹浮如圖2-單46所示澆。作者窮朱退福喜辦朱三微元作者漂朱闊福喜肢朱三秀元作者級朱芽福喜且朱三鑒元作者瘡朱唇福喜炭朱三村元1.樸8.彩3α-隙β剪枝稈算法作者狠朱澡福喜椒朱三團元這時穿其中邪一個MI枝N節點萄要生聾成A,蜓B,租C,綿D四個犁節點秧,然蹤蝶后逐聞個計瘋算其評靜態攤估計獅值,距最后話求得艦倒推溪值-∞,把零它賦目給這粒個結抗點。素其實組生成名節點A后,烘如果稿馬上仔進行衫靜態疫估計拿,得訊知F(階A)庫=偽-∞之后伐,就糖可以倍斷定殲生成B,扔C,顛D以及黨進行傭估計卻是多貼余的辜,該MI血N節點轉的倒研推值疏一定皮是-∞。作者綿朱病福喜課朱三爐元α-遞β剪枝妖法就心是把鳴生成也后繼漿和倒礎推值肥估計稍結合行起來按,及嗚時剪某掉一喬些無陶用分期枝,悠以此彩來提荷高算茶法的晝效率嚴。α-吊β剪枝閣法,享采用畝有界促深度淘優先電策略伶進行召搜索掘,當教生成哲節點繡達到奇規定抗的深色度時悔,就瘡立即賢進行競靜態傘估計框,而規一旦由某個初非端已節點階有條絹件確仆定倒稿推值細時,俘就立納即賦患值。作者掙朱倍福喜錫朱三份元當生蘆成到球節點6后,照節點1的倒瘦推值剖可確砌定為-1。作者騎朱躲福喜寇朱三港元這時龜對于熄初始巧節點S來說釀,雖縱然其辟他子癢節點比尚未闊生成岸,但鉛由于S屬于茄極大發層,廈所以介可以榆推斷求它的管倒推拖值不遵會小垃于-1。我們由定義觸極大棍層的么這個薪下界番值為α。因石此S的α=該-史1。S的α值為-1,說帖明的S倒推邪值不招會比-1更小心,但論會不純會比-1更大仿,還皺取決駝于其頃他后哭繼節累點倒秩推值您。我孤們繼尋續生革成搜唯索樹錄。當第8個節調點生胞成后謎,其嘗估計調值為-1,就踢可以箭斷定助節點7的倒曬推值害不可闊能大彈于-1。作者番朱飽福喜迅朱三礎元定義蹈極小厘層的玻這個左上界哨值為β。因此匙現在奸可以咸確定冷節點7的β=拘-交1。有了死極小娃層的β值茄,容例易發夾現α≥鹽β時,顛節點7的其扁他子括節點督不必司生成克,因飽為S的極頭大值咬不可恨能比彎這個β值小跡,再色生成量無疑匯是多布余的輔,因孟此可喘以進遞行剪樂枝。只要家在搜勇索過登程中太記住輔倒推碰值的慮上下盜界并干進行泥比較溉,當α≥哪β時就糠可以恢實現公修剪萍操作壞。作者發朱子福喜思朱三作元α,β值還診可以餅隨時涉修正伸,但幕極大悠層的α倒推蔬值下課界永布不下懂降,售因為嫁實際勒的倒蹲推值蜻取后禽繼節公點最眠終確喂定的敏倒推縣值中擦的最冬大者秧。同理恰,極崖小層嚼的倒捏推值營上界β永不波上升彈,因病為實竹際倒何推值景取后戒繼節筆點最庭終確儉定的貍倒推冶值中姑的最漏小者道。作者銀朱搭福喜乳朱三具元α-蛋β過程辣的剪兼枝規眾則(1)α剪枝屋:若寸任一雕極小醒值層修節點授的β值小恨于或翁等于天它任夫一先卸輩極撞大值亮層節問點的α值,錦即α(先陽輩層保)≥β(后茄繼層鉤),剛則可固中止渴該極父小值艱層中蠅這個巧節點衣以下脫的搜頃索。抹該節陽點最呀終

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論