


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、模擬智能的整體思路 模擬智能的整體思路、自編程序1、自編程序的基本要點。下面我們看一看現在所有人工智能程序整體的不足:它們是采用由研究人 員分析人類智能的特點,然后把這些特點模型化、算法化,有時還采用一些數 學理論進行處理,最后編成程序。一旦程序編成,系統就會按程序固定的方式 進行智能處理工作。既不靈活又受編程人員對智能認識的限制。而人類智能是靈活的,它可以隨情況的變化想出新的處理方式來。先不考 慮這個 想出”的來源,就是這種現象也表明人類智能不是按某些固定的方式進 行操作的。我們首先要由此開始模擬人類智能。智能的本質是大腦的某類操作能力, 某些對信息的操作能力,在計算機中, 操作是由程序實現
2、的。因此我們首先把智能與計算機某些程序對應起來(我們 先不要在它們是那些程序上考慮),人類智能不斷出現新的處理方式,相當于計 算機不斷自己編寫新的程序。于是我們模擬人類智能的思想先(僅僅是先”還有很多 后”否則智能問題就太簡單了)要解決計算機自編程序問題。如果從目前計算機程序語言考慮,問題就麻煩了。比如我們用 C+語言自 編程序,就會出現如何讓計算機理解語言、語法?如何設計程序?如何調試程 序?而這些則首先需要計算機有較高的智能才能做到,我們便陷入一個不能前進 的死胡同。但是我們觀察我們肢體活動的過程,就會發現那不過是一些小動作的直接 連接。按照這種觀察。我們可以得到這樣一種編制程序的方法,首
3、先編寫一些 成功運行的小程序塊,然后用把它們前后連接的方式組成大程序。這就是我們 需要的自編程序的方法。循環怎么辦?條件轉移怎么辦?我們還以肢體活動為參考,肢體活動是在 大腦指揮下工作的,肢體活動程序是按大腦指揮調用的,這與計算機程序不同。 計算機程序一旦運行,程序便取得完全的控制權,沒有另外的東西監視控制它, 必須由程序中的循環、轉移語句控制程序的流向。我們模擬人類智能,也要另 設一個控制運行的系統,因此自編程序中不需要有循環和轉移存在,這樣就不 必考慮程序編寫時由這些語言造成的死機問題。到此,我們已經解決了計算機模擬人類智能的自編程序功能的程序結構和 編寫方式問題。預先設置一些小程序作為自
4、編程的原料料,然后用把它們連接 到一起的方式編寫程序。(其實我們使用的高級計算機語言,也是預先編制好很 多小程序,用高級計算機語言調用它們,我們寫的高級語言源程序也是對那些 小程序的一種連接。)但是我們這樣還不能真正的讓計算機自編出程序來,因為還有一些重大問 題我們沒有解決,程序將如何產生?程序產生后將如何調試?我們以后再介紹。2、這里自編的程序與原來計算機程序的異同比較。通過上面的敘述,我們可以看出這里的自編程序與目前計算機的程序有很大差別,也有相同的地方。首先看相同的地方:這里的程序也是由計算機執行的,因此它的基本元素還是 計算機語言。但是這里的程序還有很多與計算機程序不同的地方。a、在這
5、種程序的基本單元是建立在計算機語言之上的小程序,這些小程序必須能夠獨立的成功的運行。b、 編寫程序只需要對小程序進行簡單的連接, 編寫程序是不需要高智能的參與。c、 在這種自編程序中沒有流向控制,因此程序不會因為流向問題而出現死機。d、因為程序中沒有流向控制,程序的流向還要由主系統控制,編寫后的程序不象 目前計算機程序那樣可以獲得對計算機的完全控制權,而是在主系統的監視和 控制下執行程序。由于這種自編程序的這個特點,因此它的能力就完全受到小程序的性能的限制, 只要小程序選擇的適當,很難出現失控(計算機的運行超出控制者的控制)的 情況。當然由于程序的控制權在主系統程序手中,主系統的編寫會使智能系
6、統 具有主動性和自主性,然而這正是我們需要的。擔心系統會失控要從主系統的 編寫(它是人編程序)入手。3、自編程序母程序的選擇自編程序是一種基本技術,它可以應用在各種形式的智能系統之中,這就 是我們這里要介紹的自編程序的目標選擇。可以這樣說,目前的任何一種人工 智能程序,加入我們介紹的自編程序技術,都可以使該智能系統的智能得到在 工作中的改善提高的效果。表面看,我們用一些已經成功運行的人工智能程序 (如一些專家系統程序、一些推理機程序、一些人工神經網絡程序)加入自編 程序技術,進行程序的改進和提高,比較容易見成效。然而由于他們的程序在 原理上與我們的自編程序有所不同,往往很難從他們的程序中分解出
7、直接連接 不用流向控制的小程序(這里的小只是相對于自編程序而言,有時并不真?。?因此無法實現我們意義的自編程序,以改進這些人工智能系統的性能。另外,很多人工智能系統程序都有自己的專利保護和加密措施。我們把他 們的程序改進為自編程序的系統及會遇到侵犯人家專利的問題,又會受加密的 影響而無法掌握人家程序的核心,從而使我們的改進措施無效。所以我以為, 雖然在目前的人工智能系統上添加自編程序技術以改進和提高它們的性能,是 最簡便易行的方法,但是實行起來的難度卻是最大的。因此我們可以以語言系統為目標,構建以自編程序技術為核心的智能系統 是目前較為簡單的方法。它是以各種語言為處理對象,以自編程序為處理語言
8、 的程序。以實現圖靈檢測似的人際交流,并在收集人類知識的基礎上提出自己 見解和觀點為智能目標的強人工智能系統。表面上看,這種強人工智能除去野 心比目前的自然語言理解系統大以外,沒有多少差別。但是實際情況卻不同。 由于自編程序技術的基點是系統自己生成能力,因此在編寫系統程序時,我們 根本不必考慮系統的詞匯庫問題,不必考慮系統的語法和語言邏輯問題。這些 問題完全由系統在學習中自己解決。我們在編制系統程序(它一定要由人來編 寫)只考慮系統的理解能力、表達能力、提出解決問題能力、自主決策能力是 怎樣來的,而不必為系統考慮理解能力、表達能力、提出和解決問題能力、自 主決策能力的程序是什么樣子。大家應該注
9、意到,這是一個與現在編程思想絕 對不同的一種新編程思想。我們還可以以神經元信息為目標,構建智能系統。它比以語言為目標的系 統要復雜一些,但是它與人類智能更加接近。因為神經元信息中包含著感覺信 息,這就使我們的智能系統可以實現由感覺到提出理論的全面的類似人類智能 的模擬。也就是說,我們的可以使我們模擬的強人工智能由感覺獲得的信息一 直到把它們加工為科學理論。在以神經元信息為目標的構建智能中又有以模擬反射為基礎和以模擬神經 兀網絡為基礎兩種,以模擬反射為基礎與模擬神經兀為基礎的區別在于,反射 只考慮大腦神經聯系的起點與終點,不考慮中間的傳遞過程。神經元網絡則需 要考慮信息傳遞的所有中間過程。4、自
10、編程序的產生和檢驗。我們前面已經指出,用自編程序作為切入點可以解決智能系統的靈活性問 題。同時我們也已經對程序的結構進行了新的解釋,使我們現在的程序可以方 便地由計算機自編。但是程序的是怎樣產生的和程序產生后如何調試的問題還 沒有解決。顯然這兩個問題不解決,你就是把自編程序吹得天花亂墜,也不能 解決智能問題。但是我們也應該看到,我們現在確定的程序是由一些能夠成功運行的小程 序直接連接而成的,在這種程序的結構中,沒有控制程序流向的轉移和循環。 這樣一種程序可以再無智能或智能很低的情況下編制和調試。這也是為什么我 們如此限制自編程序的結構的主要原因。下面我們首先介紹一種沒有智能情況下自編程序的過程
11、。我們考慮這樣的情況,我們面前已經有一些能夠成功運行的小程序。如何 把它們連結成大程序呢?我們可以用一個隨機組合操作。隨便地把一個小程序 與另一個小程序連接起來,這種隨機地連接當然不需要什么智能。它是連接出 來的東西也不能夠正確的執行什么任務。我們就把這種操作作為自編程序的第第二步是把連接的東西記錄下來,以便使系統知道已經做過那些連接。我 們把這種記錄叫做印象程序。第三步是把這個程序拿去執行,并有人或系統自身(有人監視的系統功能 比較簡單,但是自動化程度差。資深堅實的自動化程度高,但是系統的結構會 幾倍的復雜。)監視程序的執行,把執行結果統治給系統。第四步是把成功的印象程序保存為最后的程序,這
12、種程序叫做經驗程序。只有如果連接的程序執行不成功,就進入第五步。那時就返回第一步重新隨機 連接小程序,重新形成印象程序。同時把不成功的程序紀錄為負經驗程序,也 就是失敗的印象程序。在重返第一步隨機組成新程序后先把新組成與負經驗程 序比較,如果相同,就把它否定掉,不進入第二步(紀錄為新印象程序)。那些與負經驗程序不同的才被記錄為新印象程序。然后繼續執行第二、第三、 第四步。如果再次不成功,就再次返回第一步。直到找出一種成功的隨機連接 后的程序。上述過程也是一個計算機程序,它就是系統程序的一個核心部分,它是自 編程序的母程序。我們可以把上述過程作為一個流程為計算機編寫自編程序的 母程序。這個母程序
13、可以同時完成自編程序的編寫和調試工作。上述過程的核心操作是隨機連接,因此完全不需要有智能的參與,就可以 自編出新程序來。因此可以成為我們由無智能狀態產生出智能的基本系統程序。 有關智能的操作,都可以有這個無智能的自編程序系統編出。當然我們也可以看出,這個自編程序的方式產生一個新程序的速度會很慢。 它要在大量隨機連接中通過試運行選擇出能夠運行的新程序。如果我們的模擬 智能系統的全部能力都靠這種方式編寫程序,那么系統生成智能的速度就會太 慢了。因此我們還要通過其他方式為我們的模擬智能系統實現自編程序。我們把我們的模擬智能系統自編程序已產生新的能力的過程叫做學習過 程。5、組合不爆炸在計算機理論中流
14、傳著一種組合爆炸的說法,這種說法是組合就會引起組 合出的東西無限增加,最后導致組合成為計算機無法承受的操作。人們把這種 計算機無法承受的組合叫做組合爆炸。在上面我們介紹的無智能自編程序過程中,核心操作是隨機組合,于是有 些人又會提出組合爆炸的老問題。但是凡事都需要具體事情具體分析。如果組 合時的元素(組合所用材料)數量很少,組合就不會爆炸。因此在自編程序隨機組合小程序時,如果選擇的小程序是圍繞找一個目標 進行的,而不是漫無邊際的選擇小程序,那么組合采用的元素就會很少,就不 會出現組合爆炸。這就是組合不爆炸。在上述自編程序的母程序設計中,我們設計了印象程序,負經驗程序,也 是為了減少在自編程序時
15、,重復那些不成功的組合。加快隨機組合的時間。這 一切都會使我們的隨機組合不連帶著組合爆炸。二、模擬智能系統的學習過程。1、模擬智能系統的學習是完全不同于計算機學習理論的學習。計算機學習理 論沿用人編智能程序的老思想。他們提出學習理論也是為了讓計算機模擬的智 能更靈活,解決問題更好。有時用人力來解決問題費時費力,想發揮計算機的 高速特點。因此初衷不是壞的。但是他們定義的學習把方向搞偏了。他們為了 計算機理論的方便主觀的定義了學習,學習成了一種解決問題的過程。成立一 個搜索問題解的過程。因此我 稱贊”他們是對學習概念的強奸。那么什么是學習呢?學習是學習主體通過與學習客體相互作用,獲得學習 對象的過
16、程。學習主體也叫學習者,它可以是人、動物和一切具有學習能力的 設備。學習客體也叫學習環境,它包括環境對學習主體的一切作用。學習對象 是學習中獲得的東西。它包括能力和資料兩大類。以往的學習理論都很輕視能 力的學習,包括教育理論研究的學習也是這樣。而我們認為學習中獲得能力是 智能的關鍵。智能是一些能力,它在人類個體出生時是沒有的或不健全的(動 物也是這樣),就是靠在學習中不斷獲得智力操作的能力而使智能產生的,使智 能發展的。而對于計算機系統來說,在學習中獲得能力與該計算機能夠自編程 序是一個含義。計算機學習理論定義的學習,是把計算機作為一個單純的工具,讓計算機 替編程者解決問題,這種計算機的能力是
17、研究者或程序員編寫進去的。使計算 機有一定的學習能力,也是為了解決問題的方便。然而這種對學習概念的強奸, 就扼殺了學習的最最主要的功能,也就是在學習中自編程序(獲得能力)的功 能。其性質的惡劣與強奸女人扼殺她們做正常女人的功能是異曲同工的。2、自主學習過程。我們在前面所說的由隨機連接小程序來自編程序的流程,我們叫做自主學 習過程。這種學習過程的在人類遇到前所未遇的問題時,也會采用這種方式, 比如有些問題擬按規律考慮不出結果,你就可能瞎猜,這種瞎猜就類似于前面 的隨機連接。自主學習過程是有實驗基礎的學習。它就是桑代克迷籠實驗。桑代克實驗是最早使動物自己學會動作的實驗。在當時引起很大的轟動。 他能
18、夠讓貓自己學會打開籠子,那時是很稀罕的事情。這個實驗現在看來就不再那么神奇。不過桑代克當時能夠想出這個實驗的 確不簡單!桑代克準備好一個裝有看門機關的籠子,這個籠子后來叫做迷籠。 他把饑餓的貓放到籠子里,關好門,籠外放上食物。然后觀察貓的動作。起初, 貓胡亂的動作,根本無法打開籠門的插銷。經過很長時間后,貓偶然碰到籠門 的插銷,把門打開。觀察者統計這段動作的時間。然后把同一只貓在饑餓時再次放到籠中重復這個實驗。觀察貓的動作并統 計時間。可以看到貓繼續用胡亂的動作試圖出籠。并最終偶然打開籠門出籠吃 食物。這個過程進行多次后,就會發現,貓的錯誤動作越來越少,從放入籠子 到出籠的時間越來越短。最后,
19、貓可以在一放到籠子以后,馬上打開籠門,跑 出籠子吃食物。這表明貓已經通過大量的胡亂動作,經過學習學會了打開籠門 的動作。這個實驗的重要在于它是貓在沒有任何模仿或引導的情況下,自己學會了 打開籠門。由于這個學習完全是胡亂加偶然,顯然是不需要任何智能的學習, 而形成的經驗是比較復雜的操作。它為我們指出了人類個體完全可以通過這樣 的方式學習,從無智能到有智能,從無意識到有意識。我對嬰兒動作學習的觀 察,也證實了這一點。我們應該看到,貓學會打開籠門的動作完全是自己獨立學習而成的。人為 的實驗條件只是對貓學習的環境設置,在實驗中人不能通過任何方式引導或誘 導貓學會動作。因此貓在學習中完全是自主的。我在我
20、的學習理論中,一直把 桑代克類型的學習過程叫做自主學習過程。為什么叫它為自主學習過程呢?桑代克實驗表現出的學習,是在機體對 件事情毫無經驗的情況下進行的。沒有經驗,它就用胡亂加偶然的方式學習經 驗,形成應付環境的操作方法。這個過程沒有任何其它什么來教它,甚至不用 同種類的生物來教它,顯示了系統完全的自主性。這個實驗提示我們,如果要求一個系統擺脫人編程序的限制,就必須讓它 能夠學習,這種學習不是為了求某種解的答案,而是學會一種解決問題的操作, 并且以后不斷使用這個操作解決問題。這種學習是一種能夠自編程序的學習。 而自主學習過程是系統自主獨立的一種模式。一個計算機系統,如果其底層的 程序不編寫任何
21、智能,而是靠自主學習積累經驗,自編程序,那它就會發展出 智能,并進而發展出高級智能。計算機通過這種模式,其系統可以不用人編智 能程序,而在遇到原來沒有遇到的事物時,通過胡亂加偶然,形成新的程序。 于是系統就可以擺脫人編程序,自主地產生出智能了。當然,如果所有后天性的程序都用胡亂加偶然的方式,系統每形成一個程 序都會很慢,要系統學會人類智能是不可能的。其實這并不是問題,人類個體 如果脫離人類社會,獨立通過胡亂加偶然的方式學習,也不會產生人類智能。 狼孩、野生兒、囚禁兒不能產生人類智能,就是這個道理。胡亂加偶然的方式 只是系統的一個獨立自主的方式,完全掌握人類智能,還需要學習人類的知識 和經驗。3
22、、自主學習過程在自編程序中的發動機制(需要機制與獎懲機制之爭)。我們在前面已經片斷地介紹了由自主學習過程實現電腦自編程序的母程序 流程。它并不完整,因為它沒有發起和終止程序編寫的部分。我們知道,傳統的計算機程序都是由程序操作人員或用戶來發動它的每一 個程序的運行的。而人類只能則不可能是由其它人來發動的。它是大腦自主發 動的。是什么東西是大腦自主地發動它的活動呢?我們認為是大腦自主發動活 動的是需要機制,需要機制的初級形式是欲望,也就是說需要與欲望是一回事, 欲望是一種低級需要而已。在這個智能系統的驅動力問題上,我發現人們有很大的爭執,不少人認為這個 發動機制應該是獎懲機制。于是我們對智能系統自
23、編程序的討論,不得不轉向 對系統驅動力的研究。首先我們回憶一下獎懲理論的來源。在桑代克迷籠實驗成功以后,他對自己的實驗提出解釋。他把這個實驗的 過程叫做嘗試錯誤學習。他認為貓學會動作的原因是獎勵,也就是貓在打開迷 籠后獲得食物,獲得了食物的獎勵。而這種獎勵使貓學會的動作得到漸漸的鞏 固。就此他提出嘗試錯誤的驅動力是獎勵與懲罰,并確立了自己的獎勵與懲罰 理論。他的獎勵與懲罰理論由于迷籠實驗和一系列白鼠走迷津實驗的支持,在當時很 有影響。但是后來被認知學派的托爾曼用實驗證偽。托爾曼設計了一個實驗,他讓兩組白鼠學習走迷津。迷津中設置著較復雜 的道路,在其中一個地方放有食物(每次都放到同一地點)。學習
24、的目的是讓白鼠學會從迷津中迅速的找到食物。所以采用一組(即不止一只)白鼠,就是為 了計算學習所需時間,取統計的結果。這兩組白鼠一組是對照組,這一組從實 驗一開始就在迷津中放好食物。另一組是主要實驗組,開始在迷津中不放食物, 這樣白鼠會沒有獎勵地在迷津中白跑。到實驗中期再在迷津中放入食物,讓白 鼠進行找到食物的學習。如果桑代克理論成立,獎勵是學習的關鍵因素,那么主實驗組的白鼠會因 為最初沒有獎勵,什么也學不到,它們的學習時間等于比對照組的少。顯然最 后學會的時間要比對照組長(把白跑的時間也計算在內)。然而托爾曼實驗的最后結果是主實驗組比對照組的學習時間要短。這說明 在白跑過程中,盡管沒有獎勵,白
25、鼠也在學習迷津里的道路情況。從而證明獎 勵不是學習的關鍵因素。推翻了桑代克理論。托爾曼是認知學派的,他的解釋是在白鼠最初的學習中,頭腦中形成了對 道路的認知地圖。至于為什么形成這個地圖,他認為這是白鼠本來的欲望。我認為托爾曼實驗的意義就在于它推翻了獎勵是學習的關鍵因素。但是,獎懲理論并沒有因為托爾曼實驗對他的證偽而退出心理理論。這是 因為桑代克屬于心理學行為學派,托爾曼屬于心理學認知學派,兩派誰也不服 誰,各自堅持各自的說法。他們的觀點又分別帶到人工智能理論中來。于是在 一些人工智能理論中,獎懲理論還有它的市場。由于托爾曼對他的實驗解釋得也不好,我就用需要機制來代替托爾曼的認 知地圖理論解釋托
26、爾曼實驗。需要機制理論是這樣:機體發動活動(活動的驅 動力)是有需要機制完成的。當機體產生需要后,便會在機體內尋找經驗進行 活動以實現需要,如果沒有相應經驗,就會發動學習活動積累相應的經驗。4、需要機制的計算機模擬。有很多人認為計算機不可能有自己的欲望,這是 一種對計算機的誤解。不是計算機不可能有自己的欲望,而是編程者不想讓計 算機有自己的欲望。我的這種說法絕對不是我個人的想象,請看下面的證據。 在現在的計算機程序中已經表現出程序的一些需要。例如當程序需要你輸入一 些指示時它會提醒你,并等待你的輸入,你輸入的東西滿足它的要求后再繼續 后面的運行。你輸入的東西不滿足它的要求,它就拒絕運行或再次提
27、示你。當 然,這種程序的需要,是編程人員為了自己程序目標設置的需要,不是計算機 自身的需要。但是既然我們可以在編程時為程序的目標設置需要,也就可以在 編程時考慮計算機自己的需要是什么,為計算機設置自己的需要。這就會使計 算機具有了自己的欲望。當然這里所謂的計算機自己的需要還是靠程序模擬出 來的,而不是計算機自己生長出來的。從理論上講,計算機模擬的自己的需要,可以完全與人類一致。比如人們往往 最常用來調侃的問題就是:計算機能夠有性欲嗎?其實從理論上是完全可能的 它也可以分不同層面的模擬。比如僅在語言層面上模擬,你可以分別編制女性 程序和男性程序。你可以使不同程序在不同性需要的驅動下,對異性語言感
28、興 趣,愿意與異性(人或程序)交談。也可以進一步為機器人編制不同性別的程 序,完善它們的外設結構,使它們可以在性需要的驅動下與異性交往。當然, 理論上的可能必須與實際的需要相一致才能轉化為商品。如果實際上我們并不 需要有性別的計算機,那么它們就不會出現在市場上。那么在程序中需要機制是什么樣的結構呢?簡單的需要機制就是一些專門設置 的雙值變量,我叫做需要變量。一個值表示需要的滿足,另一個值表示需要的 不滿足。一個計算機系統具有多種需要,就為它設置多個需要變量。需要由模,激發擬感覺機制或一般的計算機輸入系統激發(激發方式根據程序目標確定) 時把需要變量置“1 ”,表示需要的不滿足。再由這個不滿足態
29、發動系統內的相 關程序以滿足需要的活動。(例如我們設計這樣一個有趣的小程序,設置一個饑 餓需要,當外部輸入一種食品詞匯時,就激發了這個饑餓需要,饑餓需要的1 值就會搜索并調出系統中一些有關食品的詞,當調用完成后,程序自動把饑餓 需要置0,此項需要終止。如果我們為這個程序設置多種需要,我們用不同詞 匯引誘這個程序,就會看到程序在自己的需要的驅動下,為我們調用出不同滿 足需要的詞匯來。)復雜的需要變量應該是一個多值不連續的變量,不同值表示不滿足或滿足 的不同程度,它們也相應表示出該需要激發后調用程序的優先響應級別。更復雜的需要機制應該能夠以基本需要(原始欲望)為基礎,產生出一些 高級需要,組成由低
30、級到高級的需要層次。這種復雜的需要機制,有一個專門 的理論支持,那就是 需要在學習中生成理論”,我們在較后的時候再作詳細介 紹。5、需要機制與獎懲機制有什么區別?如果簡單的分析,把需要的滿足于獎勵對應起來,把需要的不滿足于懲罰 對應起來,那么需要機制與獎懲機制幾乎一樣。問題是這樣的分析有一個缺點, 它忽視了懲罰只是需要不滿足的一種形式。懲罰不等于沒有得到需要。懲罰往 往是得到了與需要相反的東西。而相反的東西作為懲罰,雖然會起到禁止機體 的一些行為的作用,但有時也會起到機體反抗行為的作用。用獎懲機制代替需 要機制,就會使我們的模擬智能系統失去模擬后一種現象的機會,就會使模擬 系統顯得太乖了!不能
31、具有強烈的個性。另一個問題是托爾曼實驗指出的事實,在需要沒有得到滿足的學習中,系 統也能夠通過大量的反復得到一些與需要滿足無關的東西,這些東西可能暫時 滿足不了此需要,但是日后會滿足另外的需要。因此用需要機制作為系統的內 驅力,系統會顯示出一種無意識的 遠見”。而用獎懲機制代替需要機制,沒有 獎勵,學習即告失敗,它就會使系統呈現出一種無意識的短見”。從發展前途看,顯然有 遠見”的系統比 短見”的系統獲得的能力更多。因此我認為有些人以為兩種機制差不多的看法是錯誤的,就以上的分析看, 從將來的程序結構看,需要機制不會比獎懲機制復雜,但是從能力看,需要機 制的系統就會比獎懲機制的系統強很多。因此我主
32、張采用需要機制作為系統的 內驅力,而反對用獎懲機制作為系統的內驅力。6、完整的自主學習過程。我們在花費一些篇幅討論了系統活動的內驅力以后,就可以回過頭來繼續 討論系統的自主學習能力問題。自主學習能力是由人編程序完成的,它是我們 說的母程序中的一部分。這種能力與人類出生后的先天性能力相當。它本身不 是系統自編程序的一部分。從我們前面的介紹的學習過程流程可以看出,自主學習能力是一個具有循 環結構的程序,因此它也不具有我們提出的可自編程序的特征。完整的自主學 習能力程序基本就是按前面介紹的流程編寫的,只是要在那個流程的前面增加 一個需要機制中需要變量發動學習,每一次學習成功,要由成功信息為需要變 量
33、置零,由需要變量的滿足終止一次學習。由多次學習確認自編程序的完成, 形成可調用的自編程序。自主學習能力是一個循環反饋程序,其循環性我們可以從前面的介紹中看 出。其反饋性是由輸入信息來確定自編程序運行的效果。反饋機制的結構要看 計算機的結構確定,如果計算機只是一臺家用微機,那么只好靠人用鍵盤或鼠 標來輸入反饋信息。如果計算機系統有模擬感覺的機制,那么就可以自行獲得 反饋信息來進行學習了。顯然后者與人類智能更加相像。我們在提出理論是并 不具體要求使用計算機的形式,就是為了使我們的模擬人類智能系統有更強的 適應性,使他在任何情況下都能夠表現出較好的智力水平。這里大家要注意一個概念的使用,我們一直把程
34、序叫做自主學習能力程序, 而不叫做自主學習過程程序。因為學習過程是由具有學習能力的學習主體和學 習環境共同作用的過程,在我們的學習過程理論中,沒有學習過程程序。學習 過程也不是個程序。更清晰地說,學習過程是一個比程序大得多的概念。而計 算機學習理論是把學習編寫成程序的,這也是我們的學習過程理論與計算機學習理論完全不同之處自編程序的調用是由系統程序(它也是人編程序,涵蓋著母程序)實現的 在需要產生時(需要變量被輸入信息置1時)系統程序首先發動檢索自編程序 的操作,如果有自編程序可以滿足需要,就優先調用自編程序。如果沒有自編 程序滿足需要,就發動自主學習活動自編滿足需要的程序。系統程序的這一部 分
35、,就保證了自編程序的調用。其結構顯然非常簡單。7、自主學習過程的進一步完善。A、基本途徑說明。在上面的討論中,有一點我們要非常清楚,自主學習 過程雖然可以自編程序,但是其編程效率非常最低。如果我們的系統只有這一 種學習能力,其發展到人類智能很有可能要經歷人類智能發展史所需要的時間, 這是我們絕對不能忍受的。因此系統的學習能力要進一步完善。這里我們首先 要討論在自主學習過程基礎上的完善。這個完善途徑有兩條。一條是在原來自編程序的方式基礎上的提高。另一 條是增加伴隨學習過程。E、在原來自編程序方式上提高。在原來自編程序方式上提高,還有兩個 途徑:一條是提高小程序的級別,另一條是充分利用負經驗。C、
36、什么是提高小程序的級別?小程序是人編程序,它們是我們經過充分 考慮編寫出的生成思維和意識的基本程序。在初步的自主學習過程中,這些小 程序連接起來,成為自主學習過程自編出的程序。這些程序不僅可以用來實現 特定的需要,也可以被自主學習能力中的隨即操作調用來執行其它任務,通過 效果檢驗確定能否成功。這種隨即調用來執行其它任務是在模擬心理活動中的 經驗移用(把一種經驗用到其他方面)。移用是一種重要的心理活動現象,它對 于智能的形成具有非常大的意義。自主學習能力的隨即操作還可以把自編成的程序作為小程序來使用,把它 們連結為更大的程序。這樣,自編程序使用的小程序已經不是原來意義的小程 序,而包括已經自編出
37、的程序了。這樣既擴大了編程時用小程序的數量,也提高了編成的靈活性。我們所說小程序級別的提高,就是說原來意義的小程序提 高為自編程序。這個提高可以反復,也就是說凡是以前自編出的程序,不管它 是由基本小程序組編的,還是有自編程序再次組編的,都可以繼續組變成更大 的程序。這種組編也不會出現組合爆炸的現象。因為對失敗程序的負經驗紀錄, 排除了大量不合理組編的出現。8、伴隨學習對智能的意義。A、伴隨學習相當于肌體的隨行記者。伴隨學習在機體活動中相當于一個 隨行記者,它可以把機體的活動情況隨時記錄下來。當這些記錄中包含一些新 活動的雛形時,這些記錄就對智能的發展起了非常大的作用。下面我們通過一 個具體的例
38、子來體會伴隨學習的意義。E、預測表現和預測活動。例如:在貓的頭腦中記錄著這樣一段事件,主 人穿好衣服,開門,自己跟著主人出去玩,滿足了自己出去玩的欲望。這個事 件經常發生,在貓的頭腦中建立了牢固的反射。每當主人穿好衣服,通過反射 鏈,就激發貓出去玩的欲望,貓就隨機采取了一個嘗試滿足出去玩欲望的動作 (例如到門口等的動作)。爾后貓出去玩的欲望得到滿足,貓的這個動作便被確 認。以后,一旦主人有穿衣服的動作,貓就跑到門口等(有時候主人并不出門, 它就等錯了!)。貓的這種活動表現出貓有一定的預測能力。但是在我們上述的 描述中,只通過簡單的反射,不需要更復雜的心理活動參與,貓就可以完成上 述動作。但是加
39、入伴隨學習后,上述過程就不同了。如果伴隨學習把大腦活動也記 錄下來,記錄為:某反射鏈的一個環節發生,激發該反射鏈中的一個欲望,要 用某個動作實現這個欲望。并且通過多次預測現象的發生,使這個紀錄被鞏固。 那么當大腦調用這條記錄時,一個新的大腦功能一一預測,就產生了!因為當大腦調用那條被鞏固的伴隨記錄進行活動時,它就是在主動進行預測了。這種 預測與完全依賴反射實現的預測表現具有不同的性質??赡苡行┤诉€理解不了預測表現與預測活動的區別,預測表現是由反射激 發加隨機行為的結果,預測活動時由預測經驗(即伴隨學習的記錄)進行的活動。前者具有隨機性,后者已經成為一種確定的活動了。C、預測表現和預測活動的比較
40、。在上面的過程中,如果沒有伴隨學習,就不 會形成對預測的紀錄。預測就只能停留在表現層次,也就是說預測只能是附屬 于反射功能的一種行為。然而有了伴隨學習情況就不同了,它為預測記錄了經 驗,大腦可以不通過反射功能,而通過對預測經驗的調用來進行預測。預測便 成為一個獨立的活動了。下面我們對比反射型預測和經驗型預測(這是兩個為討論方便暫時使用的 概念)的操作流程:反射型預測:反射鏈的形成 外部刺激激發反射鏈的一個環節 整個 反射鏈被激發 反射鏈中的一個欲望被激發 隨機發動一個動作去滿足于 網(這實際發動起一個自主學習過程)一一通過學習得到一個確定的滿足欲望的活動。學習后,機體便產生對于這個特定刺激用特
41、定活動(自主學習確定的)表 現的預測表現。經驗型預測:在反射型預測學習時記錄伴隨經驗(預測經驗)一一外部刺激激發經驗一一找并激發相應反射鏈 一一激發反射鏈中的欲望 一一發動自主學 習確定實現表現的動作 確定預測表現的動作。學習后,機體也產生一個與特定刺激對應的特定的預測表現活動。對比后,我們會發現后者比前面多了一個環節,這從程序求簡的原則上看 好像是不利的。但是正因為多了這一個環節,大腦就新產生了一個活動一一預測活動。大腦就向思維的產生邁進一步。9、模仿學習能力。A、模仿學習。在過去我們養貓時,貓是自己捉老鼠吃的,母貓如果有了 小貓,在小貓動作能力基本形成后,母貓就會教小貓學捉老鼠。它把捉到的
42、老 鼠不咬死,而是在小貓面前放開捉住,然后再放開,讓小貓學著捉。這就是模 仿學習。人類的模仿學習就更多了。顯然由于模仿學習有模仿對象的存在,系統可以減少學習時間,因此我們 要我們的模擬智能系統有模仿學習能力是加快系統學習速度的一個好方法。表面看,模仿學習只不過是增加一個模仿對象而已。但仔細從計算機模擬 角度考慮,就會發現模擬模仿學習會對系統提出很高的要求。例如如何讓系統 接收對象的活動模式?如何讓系統按模仿對象的活動模式活動?前者要求系統 有較好的模擬感覺設備,后者要求系統有較好的模擬活動設備。這也不是說在家庭微機上我們不能模擬模仿學習過程了,只是很不像而已 例如我們可以用字符串表示某種活動的形象,用另一些字符串表示模仿出來的 形象,一般說,這種PC機上的模擬,只有我們實驗者承認它是模擬模仿學習, 很難叫局外人承認這一點。但是它的優點是給出模擬模仿學習的程序結構,一 旦用到機器人上,把程序稍加修改移植過去就可以了。E、模仿學習
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園小班數學公開課教案匯編
- 幼兒園小班美術教案涂色大菠蘿
- 貓咪奪命測試題及答案
- 裝修員工培訓方案
- 血液系統疾病的護理
- 節能電池考試題及答案
- 江蘇保安考試題及答案
- 沙漠壓力測試題及答案
- EMC布線考試題及答案
- 林草局遴選試題及答案
- 2023年黑龍江省文化和旅游系統事業單位人員招聘筆試模擬試題及答案解析
- 2023年江西新余市數字產業投資發展有限公司招聘筆試題庫含答案解析
- LY/T 3323-2022草原生態修復技術規程
- 部編版六年級語文下冊課件第1課《北京的春節》《臘八粥》
- 涂裝工模擬練習題含答案
- 2023-2024學年河南省永城市小學數學二年級下冊期末評估測試題
- 乳腺疾病的超聲診斷 (超聲科)
- 服務精神:馬里奧特之路
- 《建筑施工安全檢查標準》JGJ59-2011圖解
- 華為大學人才培養與發展實踐
- 醫療垃圾廢物處理課件
評論
0/150
提交評論