




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
人工智能應用新編21世紀高等職業教育精品教材·電子與信息類項目1認識人工智能通過對本項目的學習,了解人工智能的概念,認識人工智能的學派,理解人工智能的發展趨勢和倫理,熟悉Python程序的書寫。了解人工智能的概念理解人工智能的學派理解人工智能的發展趨勢理解人工智能的倫理熟悉Python程序的書寫人工智能是研究使計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規劃等)的學科,主要包括計算機實現智能的原理、制造類似于人腦智能的計算機,使計算機能實現更高層次的應用。1.1人工智能簡介人工智能可分為三類:弱人工智能、強人工智能與超人工智能。弱人工智能就是利用現有智能化技術,來改善我們經濟社會發展所需要的一些技術條件和發展功能,也指單一做一項任務的智能。人工智能分類強人工智能強人工智能則是綜合的,它是指在各方面都能和人類比肩的人工智能,人類能干的腦力活它都能干,例如能干很多事情的機器人。超人工智能哲學家、牛津大學人類未來研究院院長尼克·波斯特洛姆(NickBostrom)把超人工智能(ArtificialSuperIntelligence,ASI)定義為“在幾乎所有領域都大大超過人類認知表現的任何智力”。現階段所實現的人工智能大部分指的是弱人工智能,并且已經被廣泛應用。一般而言,限于弱人工智能在功能上的局限性,人們更愿意將弱人工智能看成是人類的工具,而不會將弱人工智能視成威脅。人工智能的起源人工智能的概念在20世紀五六十年代時正式提出,1950年,一位名叫馬文·明斯基(后被人稱為“人工智能之父”)的大四學生與他的同學鄧恩·埃德蒙一起,建造了世界上第一臺神經網絡計算機。這也被看作是人工智能的一個起點。同樣是在1950年,被稱為“計算機之父”的阿蘭·圖靈提出了一個舉世矚目的想法——圖靈測試。圖靈測試人工智能的歷史2.人工智能的發展從20世紀60年代到80年代,人工智能經歷了快速發展的階段。在這個時期,人們開始研究機器學習、神經網絡等技術,使得人工智能的應用范圍不斷擴大。1985年,機器學習領域的神經網絡算法被發明,這一算法在語音識別、圖像識別等領域得到廣泛應用。3.人工智能的低谷在20世紀90年代初期,人工智能經歷了一次低谷期。由于當時計算機計算能力較弱,加之數據集和算法方面的限制,導致人工智能的應用受到限制。但是,在這個時期,人們開始研究支持向量機、隨機森林等新的機器學習算法,并且計算機計算能力不斷提升,這些因素為人工智能的復興奠定了基礎。4.人工智能的復興21世紀初,隨著大數據和云計算等技術的出現,人工智能再次進入了快速發展的階段。人們開始研究深度學習、自然語言處理、計算機視覺等技術,使得人工智能的應用范圍更加廣泛。目前,人工智能已經應用于醫療、金融、交通等多個領域,并且在未來還有很大的發展空間。
人工智能的研究內容人工智能的研究是高度技術性和專業的,各分支領域都是深入且各不相通的,因而涉及范圍極廣。人工智能學科研究的主要內容包括:知識表示、認知、自動推理和搜索方法、機器學習和知識獲取、知識處理系統、自然語言理解、計算機視覺、智能機器人、自動程序設計等方面。我國的人工智能發展現狀伴隨著人工智能研究熱潮,我國人工智能產業化應用也蓬勃發展。智能產品和應用大量涌現,人工智能產品在醫療、商業、通信、城市管理等方面得到快速應用。2017年7月5日,百度首次發布人工智能開放平臺的整體戰略、技術和解決方案。這也是百度AI技術首次整體亮相。其中,對話式人工智能系統,可讓用戶以自然語言對話的交互方式,實現諸多功能;Apollo自動駕駛技術平臺,可幫助汽車行業及自動駕駛領域的合作伙伴快速搭建一套屬于自己的完整的自動駕駛系統,是全球領先的自動駕駛生態。2017年8月3日,騰訊公司正式發布了人工智能醫學影像產品——騰訊覓影。同時,還宣布發起成立了人工智能醫學影像聯合實驗室。2017年10月11日,阿里巴巴首席技術官張建鋒宣布成立全球研究院——達摩院。達摩院的成立,代表著阿里巴巴正式邁入全球人工智能等前沿科技的競爭行列。
此外,科大訊飛在智能語音技術上處于國際領先水平;依圖科技搭建了全球首個十億級人像對比系統,在2017年美國國家標準與技術研究院組織的人臉識別技術測試中,成為第一個獲得冠軍的中國團隊。人工智能研究的主要學派符號主義(Symbolism)是一種基于邏輯推理的智能模擬方法,又稱為邏輯主義(Logicism)、心理學派(Psychlogism)或計算機學派(Computerism),其原理主要為物理符號系統假設和有限合理性原理,長期以來,符號主義一直在人工智能中處于主導地位。連接主義連接主義(Connectionism)又稱為仿生學派(Bionicsism)或生理學派(Physiologism)。是一種基于神經網絡及網絡間的連接機制與學習算法的智能模擬方法。其原理主要為神經網絡和神經網絡間的連接機制和學習算法。這一學派認為人工智能源于仿生學,特別是人腦模型的研究。行為主義行為主義又稱進化主義(Evolutionism)或控制論學派(Cyberneticsism),是一種基于“感知——行動”的行為智能模擬方法。
行為主義最早來源于20世紀初的一個心理學流派,認為行為是有機體用以適應環境變化的各種身體反應的組合,它的理論目標在于預見和控制行為。人工智能的發展趨勢總的來說,未來人工智能的發展趨勢可能包括以下幾個方面:多模態智能技術:結合多種感知模態和認知模型,實現更加全面和智能的識別和分析。深度學習技術的進一步發展:深度學習是人工智能領域的重要技術之一,未來可能會向更加高效和復雜的應用方向發展。自主決策和自主控制:人工智能將逐漸實現自主決策和自主控制,例如在自動駕駛、機器人等領域中的應用。跨領域應用:人工智能將在更多的領域得到應用,例如醫療健康、金融、教育等。數據安全和隱私保護:隨著人工智能應用的普及,數據安全和隱私保護將成為需要關注的重要問題。更加智能化和個性化的用戶體驗:隨著技術的不斷進步,人工智能將能夠提供更加智能化和個性化的用戶體驗。新的商業模式和創新機會:人工智能將創造新的商業模式和創新機會,例如智能家居、智能醫療健康等領域。人工智能的三大核心目前,人工智能發展的可謂如火如荼。人工智能是利用機器學習和數據分析,對人的意識和思維過程進行模擬、延伸和拓展,賦予機器類人的能力。其實,人工智能是有三大核心要素的,那就是算法、算力、數據。數據實現人工智能的首要因素是數據,數據是一切智慧物體的學習資源,沒有了數據,任何智慧體都很難學習到知識。在如今這個時代,無時無刻不在產生數據(包括語音、文本、影像等等),人工智能產業的飛速發展,也萌生了大量垂直領域的數據需求。算法算法是一組解決問題的規則,是計算機科學中的基礎概念。人工智能是指計算機系統能夠模仿人類智能的一種技術,其核心是算法。人工智能算法是數據驅動型算法,是人工智能背后的推動力量。主流的算法主要分為傳統的機器學習算法和神經網絡算法,目前神經網絡算法因為深度學習(源于人工神經網絡的研究,特點是試圖模仿大腦的神經元之間傳遞和處理信息的模式)的快速發展而達到了高潮。算力算力是指計算機或其他計算設備在一定時間內可以處理的數據量或完成的計算任務的數量。算力通常被用來描述計算機或其他計算設備的性能,它是衡量一臺計算設備處理能力的重要指標。人工智能倫理在人工智能應用廣度和深度不斷拓展的過程中,也不斷暴露出一些風險隱患(如隱私泄露、偏見歧視、算法濫用、安全問題等等),引發了社會各界廣泛關注。面對人工智能發展應用中的倫理風險,全球各國紛紛展開倫理探討,尋求應對人工智能倫理風險的路徑和規范,以保證人工智能的良性發展。因此,人工智能倫理(AIEthics)成為社會各界關注的議題,并成為一個備受關注的研究領域。人工智能倫理是探討人工智能帶來的倫理問題及風險、研究解決人工智能倫理問題、促進人工智能向善、引領人工智能健康發展的一個多學科研究領域。人工智能倫理領域所涉及的內容非常豐富,是一個哲學、計算機科學、法律、經濟等學科交匯碰撞的領域。Python是一種計算機程序設計語言,是一種面向對象的動態類型語言。Python最早是由GuidovanRossum在八十年代末和九十年代初,在荷蘭國家數學和計算機科學研究所設計出來的,目前由一個核心開發團隊在維護。1.6人工智能常用語言人工智能應用新編21世紀高等職業教育精品教材·電子與信息類主編黃源楊鑒余法紅項目2人工智能的數學基礎通過對本章的學習,了解微積分的概念,理解線性代數,理解概率論與數理統計,理解人工智能的最優化理論,理解人工智能的形式邏輯。了解微積分的概念理解線性代數的概念理解概率論與數理統理解人工智能的最優化理論熟悉人工智能的形式邏輯2.1微積分微積分又稱為“初等數學分析”,它是一門純粹的數學理論,也是現代數學的基礎,在商學、科學和工程學領域有廣泛的應用,主要用來解決那些僅依靠代數學和幾何學不能有效解決的問題。在人工智能的發展過程中,微積分是一種非常重要的數學工具,它可以幫助人們理解和優化人工智能算法的性能。有了微積分,人類就能把握運動的過程。微積分成了人們描述世界、尋求問題答案的有力工具。微積分促進了工業大革命,帶來了大工業生產,許多現代化交通工具的產生都與微積分相關。微積分知識在人工智能算法中可以說無處不在。。2.2線性代數線性代數研究的是向量空間以及將一個向量空間映射到另一個向量空間的函數。在人工智能中線性代數是計算的根本,因為所有的數據都是以矩陣的形式存在的,任何一步操作都是在進行矩陣相乘、相加等等。線性方程組的一般形式為:線性方程組的解是一個n維向量(稱為解向量),它滿足:當每個方程中的未知數
都用
替代時都成為等式。2.3概率論與數理統計概率論與數理統計是研究人工智能、機器學習領域的理論基礎。概率論是研究隨機現象數量規律的數學分支,是一門研究事情發生的可能性的學問。而數理統計則以概率論為基礎,研究大量隨機現象的統計規律性。概率與統計概率與統計由于其源于生活與生產,又能有效地應用于生活與生產,且應用面十分廣泛,因此除了可以應用于解決人們生活中的各類問題外,在前沿的人工智能領域,同樣有著重大的作用。例如,機器學習除了處理不確定量,也需處理隨機量。而不確定性和隨機性可能來自多個方面,從而可以使用概率論來量化不確定性。又例如,在人工智能算法中無論是對于數據的處理還是分析,數據的擬合還是決策等,概率與統計都可以為其提供重要的支持。當隨機試驗次數
增大時,事件
發生的頻率
將穩定于某一常數
,則稱該常數
為事件
發生的概率。此定義稱為概率的統計定義,這個定義沒有具體給出求概率的方法,因此不能根據此定義確切求出事件的概率,但定義具有廣泛的應用價值,它的重要性不容忽視,它給出了一種近似估算概率的方法,即通過大量的重復試驗得到事件發生的頻率,然后將頻率作為概率的近似值,從而得到所要的概率。有時試驗次數不是很大時,也可以這樣使用。2.4最優化理論最優化理論是關于系統的最優設計、最優控制、最優管理問題的理論與
方法。最優化,就是在一定的約束條件下,使系統具有所期待的最優功能的組織過程。是從眾多可能的選擇中做出最優選擇,使系統的目標函數在約束條件下達到最大或最小。最優化是系統方法的基本目的。現代優化理論及方法是在20世紀40年代發展起來的,其理論和方法愈來愈多,如線性規劃、非線性規劃、動態規劃、排隊論、對策論、決策論、博弈論等。最優化問題通常情況下,最優化問題是在無約束情況下求解給定目標函數的最小值;在線性搜索中,確定尋找最小值時的搜索方向需要使用目標函數的一階導數和二階導數;置信域算法的思想是先確定搜索步長,再確定搜索方向;以人工神經網絡為代表的啟發式算法是另外一類重要的優化方法。凸函數凸函數是在人工智能的算法模型中經常見到的一種形式。它擁有非常好的性質,在計算上擁有更多的便利。遺傳算法遺傳算法是模擬人類和生物的遺傳進化機制,主要基于達爾文的生物進化論“物競天擇”、“適者生存”和“優勝劣汰”理論。具體實現流程是首先從初代群體里選出比較適應環境且表現良好的個體;其次利用遺傳算子對篩選后的個體進行組合交叉和變異,然后生成第二代群體;最后從第二代群體中選出環境適應度良好的個體進行組合交叉和變異形成第三代群體,如此不斷進化,直至產生末代種群即問題的近似最優解。遺傳算法的應用遺傳算法通常應用于路徑搜索問題,如迷宮尋路問題、8字碼問題等。遺傳算法提供了一種求解復雜系統問題的通用框架,它不依賴于問題的具體領域,對問題的種類有很強的魯棒性,所以廣泛應用于很多學科,如工程結構優化、計算數學、制造系統、航空航天、交通、計算機科學、通信、電子學、材料科學等。蟻群算法蟻群算法是一種群智能算法,它是由一群無智能或有輕微智能的個體(Agent)通過相互協作而表現出智能行為,從而為求解復雜問題提供了一個新的可能性。“螞蟻系統”是基本的蟻群算法,為其他蟻群算法提供了基本框架,該基本框架主要由初始化、構建解和信息素更新三部分組成蟻群算法2.5形式邏輯邏輯方法是人工智能研究中的主要形式化工具,邏輯學的研究成果不但為人工智能學科的誕生奠定了理論基礎,而且它們還作為重要的成分被應用于人工智能系統中。在人工智能的研究中,用形式邏輯實現知識表示是一種普遍的方法。形式邏輯可謂包羅萬象,其最簡單的實例就是由古希臘哲學家亞里士多德提出并流傳至今的三段論,它由兩個前提和一個結論構成:每個三段論中,必須有一個前提是肯定的并且必須有一個前提是全稱命題。在每個三段論中,兩個前提中否命題的數目必須與結論中否命題的數目相同。每個證明都是且只能是通過三個詞項得到的。例如,人工智能三段論:科學是不斷發展的(大前提)人工智能是科學(小前提)所以,人工智能是不斷發展的(結論)亞里士多德的貢獻不僅在于證明了人工智能的不斷發展,更在于確定了在大前提和小前提的基礎上推導出一個結論的形式化過程,這個過程完全擺脫了內容的限制。由此誕生的符號推理給數理邏輯的研究帶來了深遠的影響。人工智能應用新編21世紀高等職業教育精品教材·電子與信息類主編黃源楊鑒余法紅項目3人工智能與大數據通過對本章的學習,了解大數據的概念,理解數據采集,數據清洗,數據存儲、數據計算、數據分析與可視化、數據治理以及大數據安全,理解人工智能與大數據的關系。了解大數據的概念理解數據采集,數據清洗,數據存儲、數據計算以及數據分析與可視化人工智能與大數據的關系當前,大數據產業正快速發展成為新一代信息技術和服務業態,即對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,并從中發現新知識、創造新價值、提升新能力。大數據概述大數據是信息技術發展的必然產物,更是信息化進程的新階段,其發展推動了數字經濟的形成與繁榮。大數據與智能制造大數據智能制造能夠實現產品故障診斷與預測,降低生產過程能耗,控制產品生命周期。典型企業有海爾集團,在其互聯工廠布置上萬個傳感器,每天產生數萬組數據,不僅對整個工廠的運行情況進行實時監控,實時報警;同時基于這些傳感器布置在設備之中,對自動化設備可進行實時預警,在設備發生故障之前,通過大數據預測的方式對設備進行及時維護修復。數據采集作為大數據生命周期的第一個環節,是指通過傳感器、攝像頭、RFID射頻數據以及互聯網等方式獲取的各種結構化、半結構化與非結構化的數據。數據采集在大數據時代,數據清洗通常是指把“臟數據”徹底洗掉,所謂“臟數據”是指不完整、不規范、不準確的數據,只有通過數據清洗才能從根本上提高數據質量。數據清洗數據清洗的原理數據清洗的原理為:利用有關技術,如統計方法、數據挖掘方法、模式規則方法等將臟數據轉換為滿足數據質量要求的數據。數據清洗按照實現方式與范圍,可分為手工清洗和自動清洗。在數據清洗中,原始數據源是數據清洗的基礎,數據分析是數據清洗的前提,而定義數據清洗轉換規則是關鍵。在數據清洗中具體的數據清洗規則主要包括有:非空檢核、主鍵重復、非法代碼清洗、非法值清洗、數據格式檢核、記錄數檢核等。異常值檢測數據存儲如今大數據的火熱,帶來的第一道障礙就是關于大數據存儲的問題。大數據因為規模大、類型多樣、新增速度快,所以在存儲和計算上,都需要技術支持,依靠傳統的數據存儲和處理工具,已經很難實現高效的處理了。目前常見的大數據存儲方式主要有分布式存儲、NoSQL數據庫和云數據庫三種。(1)分布式存儲分布式存儲最早是由谷歌提出的,其目的是通過廉價的服務器來提供使用與大規模,高并發場景下的Web訪問問題。(2)NoSQL數據庫NoSQL數據庫又叫做非關系數據庫,和數據庫管理系統(RDBMS)相比,NoSQL不使用SQL作為查詢語言,其存儲也可以不需要固定的表模式,用戶操作NoSQL時通常會避免使用RDBMS的JION操作。(3)云數據庫云數據庫是指被優化或部署到一個虛擬計算環境中的數據庫,是在云計算的大背景下發展起來的一種新興的共享基礎架構的方法,它極大地增強了數據庫的存儲能力,消除了人員、硬件、軟件的重復配置,讓軟、硬件升級變得更加容易。因此,云數據庫具有高可擴展性、高可用性、采用多租形式和支持資源有效分發等特點,可以實現按需付費和按需擴展。數據計算面向大數據處理的數據查詢、統計、分析、挖掘等需求,促生了大數據計算的不同計算模式,整體上人們把大數據計算分為離線批處理計算、實時交互計算和流計算三種。(1)離線批處理計算隨著云計算技術到廣泛的應用的發展,基于開源的Hadoop分布式存儲系統和MapReduce數據處理模式的分析系統也得到了廣泛的應用。(2)實時交互計算當今的實時計算一般都需要針對海量數據進行,除了要滿足非實時計算的一些需求(如計算結果準確)以外,實時計算最重要的一個需求是能夠實時響應計算結果,一般要求為秒級。實時和交互式計算技術中,Google的Dremel系統表現最為突出。Spark是由加州大學伯克利分校AMP實驗室開發的實時數據分析系統,采用一種與Hadoop相似的開源集群計算環境,但是Spark在任務調度、工作負載優化方面設計和表現更加優越。(3)流計算。傳統的流式計算系統,一般是基于事件機制,所處理的數據量也不大。新型的流處理技術,如Yahoo的S4主要解決的是高數據率和大數據量的流式處理。S4是一個通用的、分布式的、可擴展的、部分容錯的,可插拔的平臺,開發者可以很容易的在其上開發面向無界不間斷流數據處理的應用。數據分析與可視化數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,未提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據可視化在大數據技術中也至關重要,因為數據最終需要為人們所使用,為生產、運營、規劃提供決策支持。選擇恰當的、生動直觀的展示方式能夠幫助人們更好地理解數據及其內涵和關聯關系,也能夠更有效地解釋和運用數據,發揮其價值。在展現方式上,除了傳統的報表、圖形之外,人們還可以結合現代化的可視化工具及人機交互手段,甚至增強現實技術等來實現數據與現實的無縫接口。數據治理數據治理是指對數據的收集、存儲、共享、分析和使用等過程進行規范和管理,以保證數據的質量、安全和合規,促進數據價值發揮。數據治理涉及數據擁有者、數據提供者、數據使用者和數據監管者等多個利益相關方,包括政府、企業、公共組織、公眾等不同主體,涵蓋政府數據、公共數據、企業數據、互聯網數據、個人數據等。圖3-11顯示了國家標準GB/T34960的數據治理框架。該數據治理框架比較符合我國企業和政府的組織現狀,更加全面地和精煉地描述了數據治理的工作內容,包含頂層設計、數據治理環境、數據治理域和數據治理過程。大數據安全數據是國家基礎性戰略資源,沒有數據安全就沒有國家安全。以數據為核心發展數字經濟是實現新舊動能轉換、培育新業態發展的重要路徑,數據作為一種新型生產要素,已成為推動我國經濟高質量發展的重要資源。近年來,我國不斷推進網絡強國、數字中國、智慧社會建設,以數據為新生產要素的數字經濟蓬勃發展,數據的競爭已成為國際競爭的重要領域。大數據時代的數據安全問題主要包括數據被濫用、誤用和被竊取這幾種情況。(1)數據被濫用數據濫用指的是對數據的使用超出了其預先約定的場景或目的。例如員工在沒有工作場景支持的情況下訪問了客戶的個人敏感信息,這是大量內鬼倒賣個人信息而組織卻不知道的主要原因之一。需要強調的是,在今天的大數據業務環境下,無法做到針對每一條個人信息、每一個員工在每一個工作場景的請求下,進行單獨的數據訪問許可授權。(3)數據被誤用數據誤用指的是在正常范圍內在對數據處理的過程中泄露個人敏感信息。這是在大數據時代變得更加突出的典型問題。大數據時代,是通過對數據的各種分析,帶來各種業務創新、保持業務價值的。但是,這個分析過程,是否泄露某個特定人的隱私,就屬于是否誤用的問題。企業如果知道用戶的喜好和需求,就可以給用戶發送更加精準的廣告、提供更加適合的服務,但是在這個過程中,用戶是不希望自己的一舉一動都被企業了如指掌地看到,自己成了沒有隱私的透明人。如今,大家都在采集和分析數據,但是很多企業還缺乏技術能力或者安全意識,避免這些數據在分析處理的全過程,不會泄露用戶的隱私。(3)數據被竊取數據被竊取在本質上和系統安全相關。外部或者內部的網絡攻擊者,通過各種技術手段非法入侵系統,目的可能是為了偷取數據,這就變成數據安全問題。如今,大量網站或應用的安全防護水平不高,導致黑灰產人員可以從中大量竊取數據,最終令用戶防不勝防。另外,內部人員入侵作案,偷取客戶數據或者公司商業秘密,數量往往比外部入侵的比例要大很多。可是,很多企業依然只重視對外部入侵的防御而忽視了內部入侵的防范,或者只重視了系統安全層面的防御能力,而沒有意識到數據安全層面的不同。鑒于大數據的戰略意義,我國高度重視大數據安全問題,近幾年發布了一系列大數據安全相關的法律法規和政策。3.2人工智能與大數據人工智能是計算機科學的一個分支,它模仿人類的一系列思考和做出決策的能力。在這些能力的幫助下,機器可以做出自動化決策,解決復雜問題,以及更有利地應用數據和信息。DIKW模型是一個關于數據(Data)、信息(Information)、知識(Knowledge)、智慧(Wisdom)的模型,該模型如圖3-13所示。大數據建模DIKW模型將數據、信息、知識、智慧納入到一種金字塔形的層次體系,展現了數據是如何一步步轉化為信息、知識、乃至智慧的方式。當系統采集到原始的數據后,然后通過加工處理得到有邏輯的信息,再通過提煉信息之間的聯系獲得規則和知識、形成行動的能力和完成任務,最終使用對各種知識進行歸納和綜合形成關注未來不確定性業務的預測能力,這樣系統才能真正做到感知、分析、推理、決策、控制功能。工業大數據工業大數據的建模要求用數理邏輯去嚴格的定義業務問題。由于工業生產過程中本身受到各種機理約束條件的限制,利用歷史過程數據定義問題邊界往往達不到工業的生產要求因此,人們往往需要采用數據驅動+模型驅動+場景部署的多輪驅動方式,實現數據和機理的深度融合,去解決實際的工業問題。使用時序數據分析工業生產中的機器異常狀況數控車床壽命預測模型人工智能應用新編21世紀高等職業教育精品教材·電子與信息類項目4機器學習通過對本章的學習,了解機器學習的概念,理解機器學習的算法了解機器學習的概念理解機器學習的算法機器學習,通俗地講就是讓機器來實現學習的過程,讓機器擁有學習的能力,從而改善系統自身的性能。對于機器而言,這里的“學習”指的是從數據中學習,從數據中產生“模型”的算法,即“學習算法”。4.1認識機器學習在實際應用中,機器學習將大量數據加載到計算機程序中并選擇一種模型“擬合”數據,使得計算機(在無需幫助的情況下)得出預測。4.2機器學習的分類在機器學習中,根據學習方式的不同,可以將機器學習分為監督學習、無監督學習、半監督學習以及強化學習。監督學習(SupervisedLearning)是機器學習中的一種方法,可以由訓練數據中學到或建立一個學習模型(LearningModel),并依此模型推測新的實例,如圖4-3所示。4.2.1監督學習監督學習(SupervisedLearning)表示機器學習的數據是帶標記的,這些標記可以包括數據類別、數據屬性及特征點位置等。常見的監督學習有分類和回歸。分類(Classification)是將一些實例數據分到合適的類別中,分類的預測結果是離散的。回歸(Regression)是將數據歸到一條“線”上,即為離散數據生產擬合曲線,因此其預測結果是連續的。圖4-7顯示了監督學習的標簽。例如,當要訓練機器識別“狗”的圖片時,需要首先用大量狗的圖片進行訓練,最后再將預測結果與期望結果進行比對,從而判斷該模型的好壞。4.2.2無監督學習無監督學習的訓練樣本的標記信息是未知的,目標是通過對無標記訓練樣本的學習來揭示數據的內在性質及規律。無監督學習(UnsupervisedLearning)表示機器從無標記的數據中探索并推斷出潛在的聯系。常見的無監督學習有聚類和降維。聚類技術是一種無監督學習,是研究樣本或指標分類問題的一種統計分析方法。聚類與分類的區別是其要劃分的類是未知的。常用的聚類分析方法有系統聚類法、有序樣品聚類法、動態聚類法、模糊聚類法、圖論聚類法和聚類預報法等。降維(DimensionalityReduction)是將數據的維度降低,在實際應用中,可以通過一系列的轉換將數據的維度降低,數據的降維過程如圖4-9所示。無監督學習常常被用于數據挖掘,用于在大量無標簽數據中發現些什么。它的訓練數據是無標簽的,訓練目標是能對觀察值進行分類或者區分等。例如無監督學習應該能在不給任何額外提示的情況下,僅依據所有“貓”的圖片的特征,將“貓”的圖片從大量的各種各樣的圖片中將區分出來。“半監督學習”術語第一次于1992年被正式提出,其思想可追溯于自訓練算法。半監督學習突破了傳統方法只考慮一種樣本類型的局限,綜合利用有標簽與無標簽樣本,是在監督學習和無監督學習的基礎上進行的研究。半監督學習包括半監督聚類、半監督分類、半監督降維和半監督回歸四種學習場景。常見的半監督分類代表算法包括生成式方法、半監督支持向量機、半監督圖算法和基于分歧的半監督方法這四種算法。4.2.3半監督學習4.2.4強化學習強化學習(ReinforcementLearning,RL),又稱再勵學習、評價學習或增強學習,是機器學習的范式和方法論之一,用于描述和解決智能體在與環境的交互過程中通過學習策略以達成回報最大化或實現特定目標的問題。強化學習主要包含智能體、環境狀態、獎懲和動作這四個元素以及一個狀態,其中智能體存在于一個環境的內部。強化學習通常被用在機器人技術上(例如機械狗),它接收機器人當前狀態,算法的目標是訓練機器來做出各種特定行為。工作流程一般是:機器被放置在一個特定環境中,在這個環境里機器可以持續性地進行自我訓練,而環境會給出或正或負的反饋。機器會從以往的行動經驗中得到提升并最終找到最好的知識內容來幫助它做出最有效的行為決策。K-Means算法也叫作K均值聚類算法,它是最著名的劃分聚類算法,由于簡潔和效率使得它成為所
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 保險服務外包合同
- 耐熱不銹鋼冷軋薄板企業縣域市場拓展與下沉戰略研究報告
- 磷化鎵單晶和單晶片企業數字化轉型與智慧升級戰略研究報告
- 酶工程與發酵工程企業ESG實踐與創新戰略研究報告
- 電離室企業ESG實踐與創新戰略研究報告
- 復合材料真空導入成套裝備企業數字化轉型與智慧升級戰略研究報告
- 臟器生化制藥機械企業數字化轉型與智慧升級戰略研究報告
- 衛星式柔板印刷機企業數字化轉型與智慧升級戰略研究報告
- 絹折扇企業數字化轉型與智慧升級戰略研究報告
- 2024年西昌市人民醫院招聘考試真題
- YY-T 0954-2015 無源外科植入物-I型膠原蛋白植入劑
- 12-2017-2021年陜西中考數學真題分類匯編之統計與概率
- 膿毒血癥課件
- 2024年時事政治熱點題庫200道含完整答案(必刷)
- 2024年北京亦莊國際投資發展有限公司招聘筆試沖刺題(帶答案解析)
- 對方當事人送達地址及相關信息確認書
- 屈光性白內障手術發展
- 基于物聯網的智能衣柜
- 醫院政工查房
- 緩和醫療-以死觀生的生活智慧智慧樹知到期末考試答案2024年
- 拔河比賽技巧知識講座
評論
0/150
提交評論