




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、人工智能十大經典應用領域及其技術原理本文通過案例分門別類地深入探討人工智能的實際應用。案例甚多,此處所列舉的僅是九牛一毛。本該按行業或業務對這些案例進行分類,但相反我選擇按在行業或業務中最可能應用的順序來分類。本文將使用“算法”一詞,以高度簡化的方式來描述單個算法、模型或者使用多種算法的軟件。在每個類別中,逐一討論數據輸入的類型、作為黑箱的算法以及輸出(為了簡便易行,即使真實算法不是黑箱也暫且把它當成黑箱)。因為這是高層次的概述,所以我鼓勵你深入研究感興趣的具體應用,搞清楚它們究竟是如何應用于行業或者業務活動的。目前也有很多資源可供使用,以學習所涉及的技術細節和具體算法。一、預測分析預測是預測
2、分析或者預測建模的同義詞,這是根據有標簽,以及有時甚至無標簽的輸入數據來判斷輸出數據的過程在機器學習和人工智能中,預測分析可以進一步細分為回歸和分類。下面將對使用有標簽數據(有監督)進行預測的兩個子類進行討論。回歸圖1T展示了在回歸方法中輸入有標簽數據,經預測模型處理,然后從連續數列中生成數值的過程(例如股市的閉市價)。輸人一模型*偷出連續數值有標簽數據閉市價勺5美元/股數應用包括客戶全周期的股票價值和凈利潤、收入及其增長預測、價格變動、信貸違約風險以及股票交易計算。分類分類指的是輸入有標簽數據,經過分類模型處理后,把輸入數據分成一類或多類的過程,如圖所示。垃圾郵件過濾器是二元分類應用的標準案
3、例。電子郵件是經分類模型處理后的輸入數據,輸出數據是確定了的垃圾郵件或者非垃圾郵件,非垃圾郵件專指那些不含垃圾內容的好郵件。垃圾郵件會被送入垃圾箱,而非垃圾郵件則被送入收件箱。假如引入第三個類別“不確定”,那么分類器現在就可以把輸入的郵件分成三類。因為超過了兩個類別,所以這是多元分類的例子。在該例子中,電子郵件的客戶端可能有“疑似垃圾郵件”的文件夾供用戶審查每封郵件,并以此訓練分類器更好地區分垃圾與非垃圾郵件。如果要把輸入數據分成三類或更多類,那么算法可以為輸入數據選擇單一類別或者計算輸入數據屬于每個類別的概率。在后一種情況下,可以采用概率最大的類別作為選擇的結果,或者采用所有類別的概率來按你
4、自己定制的規則處理。在這種情況下,假定一封剛收到的郵件被確定有85%的可能性是垃圾郵件,10%的可能性是非垃圾郵件,5%的可能性為不確定。因為是垃圾郵件的可能性比較高,因此可以判定該郵件為垃圾郵件,或者以其他方式來使用計算出的概率最后,某些算法可以為同一輸入分配多個標簽。這里有一個與圖像識別相關的例子,假設輸入的數據是紅蘋果的圖像,那么算法可以為該圖像分配紅色、蘋果和水果等多個不同的標簽。該案例為圖像分配所有三個類別的做法是合適的應用包括信用風險、貸款審批和客戶流失。分類可以與本文后續討論的識別應用相結合。二、個性化和推薦系統推薦系統是依據現有信息進行推薦的一種個性化形式,其結果與各個用戶甚為
5、相關。其可以用來提高客戶轉化率、銷售率、滿意度和留存率。事實上,亞馬遜就是通過增加這些引擎把營業收入提高了35%,75%的Netflix觀賞節目也來自于這樣的推薦。推薦系統是一種特別的信息過濾系統。也可以通過用戶搜索、排名和評分的辦法來完成個性化。推薦系統根據諸如商品或者用戶等的輸入數據,經過推薦模型或者引擎的處理來完成推薦(例如產品、文章、音樂、電影),如圖所示。粘人推薦引擎推薦貨晶數據堆于內容的用口數據聯合過泄值得一提的是與推薦系統相關的“冷啟動問題”。冷啟動是指智能應用尚未擁有足夠的信息來為特定用戶或者群體做出高度個性化和關聯度的推薦。例如,用戶尚未產生關于它們的偏好、興趣或購買歷史的信
6、息。另一個例子是當商品(例如衣服、產品、視頻、歌曲)岡I剛面世的時候。有幾種技術有助于解決這個問題,但因篇幅所限就不深入討論了。推薦系統應用包括推薦產品、視頻、音樂、歌曲、書籍和電視節目(例如亞馬遜、Netflix、Spotify)。除了推薦以外,也包括個性化的內容,包括新聞、報道、電郵和定向廣告(例如推特)。其他的案例還包括個性化醫療計劃、個性化圖像和圖標(例如YouTube、Netflix、Yelp)、葡萄酒推薦、個性化購物(例如完美的夾克衫搭配)、時尚穿搭(例如StitchFix)以及全套的自動化推薦。三、計算機視覺計算機視覺是一個廣闊的領域,它包括涉及諸如圖像和視頻之類視覺信息的模式識
7、別(下一節將討論另外一種技術)。計算機視覺以照片、靜止的視頻圖像和一系列圖像(視頻)作為輸入,經過模型的處理,產生輸出,如圖所示。輸入算法輸出圖像靜止的視頻圖橡系列圖像檢測識別發現動作分析輸出可以是識別、檢測和發現某個目標、特征或者活動。視覺相關的應用隱含著一定程度的自動化,特別是自動化視覺,通常需要人在應用中參與(例如檢查)。機器視覺一詞用來描述在工業應用中的類似或者有一定重疊度的技術,諸如檢查、過程控制、測量和機器人。計算機視覺有許多有趣而且強大的應用,同時應用場景也在快速增加。例如,可以在下述場景中使用計算機視覺:視頻分析和內容篩選唇讀指揮自動化機器(例如汽車和無人機)視頻識別和描述視頻
8、字幕識別像擁抱和握手之類的人際交互動作機器人及其控制系統人群密度估算清點人數(例如排隊、基礎設施規劃、零售)檢查與質量控制零售客戶步行路徑分析以及參與度分析無人航空器(UAV)經常被稱為無人機。通過應用計算機視覺,無人機能夠執行檢查(例如石油管道、無線信號塔)完成建筑和區域搜索、幫助制作地圖和送貨。計算機視覺現在正廣泛應用于公安、安保和監控。當然,這類應用也要注意符合倫理道德,保護人們的利益。計算機視覺還有最后一件事值得一提。通過看、聞、聽、觸和味五大感覺,人類能夠感知環境和周圍的世界。感官捕獲信息,然后傳遞到神經系統進行轉換,同時也決定應該采取什么行動或者應該做出什么樣的反應。計算機視覺是對
9、特定人工智能應用視覺的一種類比。四、模式識別模式識別涉及輸入非結構化數據,經過模型處理,繼而檢測是否存在某種特定的模式(檢測),然后為識別出的模式分配一個類別(分類),或者發現所識別模式的主題(識別),如圖所示。這些應用的輸入可以包括圖像(包括視頻一一一系列靜止的圖像)、音頻(例如講話、音樂和聲音)和文本。文本可以根據其特性進一步細分為電子、手寫或者打印(例如紙、支票、車牌號)。以圖像為輸入的目的可能是檢測目標、識別目標、發現目標,或者三者皆有。人臉識別就是一個好例子。訓練模型來檢測圖像中的人臉,并對檢測到的目標進行分類,打上人的標簽,這就是目標檢測的例子,這里的目標是未經識別的人臉。“檢測”
10、用來指代所發現的不同于背景的目標。其也包括對目標位置的測量和圍繞被檢測目標邊際框的具體測量。識別是指為檢測到的目標分類或打標簽的過程(在本案例中是人臉),識別會更進一步,并為所識別的人臉分配一個身份,呈現了一些圖像識別的案例。如圖所示:諸如人臉識別這樣的生物特征識別技術可以用來為圖中的人自動打標簽。生物特征識別的另外一種形式是根據指紋來識別。其他的應用包括:讀出視頻和音頻中的文字在圖像上打標簽和分類汽車保險中基于圖像來評估汽車受損程度從視頻和音頻中提取信息基于面部和聲音的情感識別面部表情識別音頻識別的應用包括:語音識別將語音轉換為文本分離并識別出講話者基于聲音、實時客服和銷售電話的情感智能分析
11、伐木和森林砍伐聲音檢測缺陷檢測(例如制造過程中的缺陷或零配件失效)最后,手寫或打印的文本可以通過光學字符識別(OCR)和手寫字符識別轉換為電子文檔。文檔也可以轉換為語音,但這被認為更可能是人工智能的生成性應用,而不是識別性應用。本文稍后會討論生成性應用。五、聚類和異常檢測聚類和異常檢測是兩種最常見的無監督機器學習技術。它們也被認為是模式識別技術。如圖所示:這兩個過程都以無標簽數據作為輸入,經過相應算法(聚類或異常檢測)的處理,在聚類的場景下完成分組,或者在異常檢測場景下確定是否屬于異常。我們首先討論聚類。聚類把無標簽數據中相似的數據聚合成組。具體的組數由完成聚類任務的人(通常是數據科學家)決定
12、。并沒有絕對正確或者錯誤的組數,但對某一特定的應用,通常可以通過試錯來確定理想的組數。因為數據沒有標簽,所以聚類者必須為每組指定某種含義或標簽以便清楚地描述(例如運動狂)。然后用模型把新數據分配給某個組,從而假定該組的標簽或描述。可以把這個過程想象成某種形式的預測分類,也就是為每個新數據點分配一個類(通過分組標簽)。把新數據點(例如客戶)分配給集群(細分市場),會為我們提供一種可以精準定位、個性化以及策略性定位產品的更好方法,并可以用合適的方式來對每個細分市場的客戶進行營銷。聚類應用包括細分和聚焦市場與客戶、三維醫療影像分析、按照購物習慣分類產品以及社交媒體分析。異常檢測是用來檢測異常數據(高
13、度不尋常、偏離常規或畸形)模式的一種技術。異常檢測應用包括基于音頻的缺陷和裂紋檢測、網絡安全、質量控制(例如制造缺陷檢測)以及計算機與網絡系統健康(例如NASA的缺陷和錯誤檢測)。在網絡安全的異常檢測應用方面,常見的威脅包括惡意軟件勒索軟件、計算機病毒、系統和內存攻擊、拒絕服務(DoS)攻擊、網絡釣魚、不需要的程序執行、憑據盜竊、數據傳輸和盜竊等。毋庸諱言,這方面的異常檢測場景層出不窮。六、自然語言自然語言是人工智能發展與應用中非常有趣且令人激動的領域,通常分成三個子領域:自然語言處理(NLP)、自然語言生成(NLG)和自然語言理解(NLU)。讓我們分別進行討論。1.NLP自然語言處理(NLP
14、)輸入文本、語音或手寫形式的語言,經過NLP算法處理后,輸出結構化的數據,如圖所示。現在有很多潛在的NLP場景和輸出。值得一提的是,有時NLP也被認為是NLG和NLU的超集,因此人工智能自然語言應用在總體上可以被認為是NLP的一種形式。也有人認為它是自然語言應用的特定集合,我們正在討論的就是其中的一部分。與NLP相關的具體任務和技術包括:量化和目標文本分析語音識別(語音轉換為文本)話題模型(例如話題以及文檔中討論的主題)文本分類(例如電視劇權利的游戲)情感分析(例如正面、負面、中性)主體檢測(例如人、地點)命名識別(例如大峽谷、邁爾斯戴維斯)語義相似性分析(例如不同詞和文本之間在總體上意思的相
15、似性)為部分語音打標簽(例如名詞、動詞)機器翻譯(例如英文到法文的翻譯)一個具體的NLP應用涉及公司會議錄音、文本轉換,然后提供會議總結,其中包括圍繞不同話題的分析和會議表現,另外一個應用采用NLP來對招聘面試進行分析,并根據性別中立性、語調、措辭等因素給出整體評分。它還為提高評分和整體工作描述提供優化建議。其他的應用還包括:基于情感的新聞聚合情感驅動的社會媒體調查以及品牌監控基于消息板的父母疫苗關注分析電影評論和產品評論的情感分析動物聲音轉換現在有許多云服務提供商通過NLP服務和API接口來提供這方面的一些功能。2.NLGNLG以結構化數據的形式來輸入語言,經過NLG算法處理,產生對應語言作
16、為輸出,這種語言輸出可以是文本或者文本轉換為語音的形式。結構化輸入數據的案例可以是比賽中運動員情況的統計數據、廣告效果數據或者公司的財務數據。如圖所示:應用包括:根據句子和文檔自動產生文本概述簡要回顧(例如新聞和體育)關于圖片的故事業務分析報告概要招聘人員參與醫院研究自然語言形式的患者醫院賬單夢幻足球選秀總結和每周比賽回顧房產描述和房地產市場報告與公司收入報告相關的新聞發布安德烈卡帕西創建的模型可以自動產生維基百科文章、嬰兒姓名、數學論文、計算機代碼和莎士比亞的模型。其他的應用包括生成手寫文本甚至創作笑話。NLU最后,NLU以語言為輸入(文本、語音或手寫),經過NLU算法的處理,產生可以被理解
17、的語言作為輸出,所產生的可理解語言可以用來采取行動、生成響應、回答問題、進行對話等。如圖所示:語言NLU算法“理解”文本響應語音轉換対文木基本動作乎寫轉檢為文本“理解”一詞可以非常深奧且具有哲學性質,并會涉及領悟的概念,注意到這一點非常重要。理解所指的能力,往往不僅是領悟信息(與死記硬背相反),而且是把理解的信息與現存知識整合,并以此作為不斷增長的知識基礎。缺乏與人類相似的語言理解和領悟是今天基于自然語言的人工智能應用的一大缺憾,其根源在于讓機器獲取與人類相似的語言理解能力難于上青天。還記得前面關于人工智能現狀和人工智能難題的討論嗎?這就是一個明證。在不進行全面哲學討論的情況下,讓我們僅用術語
18、“理解”來表示算法(重申,大大簡化)能夠對輸入語言做更多的工作,而不僅是解析并執行簡單的任務,如文本分析。NLU要解決的問題顯然比NLP和NLG(普通人工智能問題)難得多,而且NLU是實現通用人工智能(AGI)的主要基本組成。目前的NLU日益完善,已經有了包括個人虛擬助理、聊天機器人、客戶成功(支持與服務)代理、銷售代理等在內的應用。這些應用通常包括某些形式的手寫內容或語音對話,經常圍繞著信息搜集、問題解答或者某些協助性工具。個人助理的具體應用案例包括諸如亞馬遜的Alexa、蘋果的Siri、谷歌的Assistant以及Nuance的Nina。聊天機器人的應用案例包括潤滑油專家、工作面試、學生貸
19、款顧問和商業保險專家。這是人工智能研究非常活躍和有潛在發展空間的領域,絕對值得關注。七、時間序列和基于序列的數據多數情況下,數據都是按照序列采集的,因此數據的序列極為重要而且由特定索引所確定。最為常見的數據序列索引是時間,按時間排序的數據被稱為時間序列數據。每天交易時段股票的價格波動、DNA序列、物聯網傳感器數據,以及諸如風向等科學現象,都是時間序列的好例子。時間序列分析和建模可用于學習、判斷和預測基于時間的事件,包括趨勢、季節變動、循環和噪聲。對某些特定應用,字母和單詞的序列也是有效的序列數據,這些序列被打上不同的標簽,諸如n-grams、skip-grams、句子、段落,甚至語言本身,其中
20、語言是以語音、文字或者電子的方式來表達的。另外,音頻和視頻也是序列數據。應用包括:預測(回歸與分類)異常檢測預測貨幣的未來兌換率健康趨勢的實時追蹤市場預測天氣預報基于序列的推薦情感分析DNA測序文本生成序列到序列的預測(如機器翻譯)八、信息搜索、提取、排序和評分許多強大的人工智能應用都圍繞著信息的搜索、提取和排序(評分)。這特別適用于非結構化和半結構化數據,例如文本文檔、網頁、圖像和視頻。可以使用這類數據(有時候輔以結構化數據)來提取信息、提供搜索或優化處理推薦,以及按照相關性、重要性或優先級來對條目進行排序或評分這組技術大多都與個性化有關,因為搜索結果和其他條目可以按照針對某個用戶或群體的相
21、關性的大小排列或排序。目前,有許多搜索任務都是通過鍵盤輸入或者語音提供給諸如谷歌這樣的搜索引擎,該引擎使用谷歌獨有的人工智能搜索算法。電子商務應用也使用他們自己的引擎來搜索產品,搜索過程可以由文本、聲音(語音)及視覺輸入驅動。文本搜索包括谷歌搜索、微軟的Bing,以及分布式、透明和社區驅動的搜索。基于聲音和圖像的搜索應用包括:衣服和時裝搜索歌曲和藝術家搜索Pinterest鏡頭搜索圖像和視頻搜索字體搜索視頻搜索基于圖像內容進行搜索。早就有購物應用采取這種方式。用戶把拍攝的照片提交給視頻搜索引擎。接著用照片產生相似性搜索結果,諸如衣服。有些圖像引擎也能以視覺方式展示相似的其他產品和推薦。除了分類
22、技術以外,還有排序和評分技術,包括下述這些應用:銷售線索評分信息與文檔檢索(例如網頁搜索)機器翻譯致病基因搜索與發現測定蛋白質的順序結構九、強化學習強化學習(RL)與這里迄今描述過的人工智能技術迥然不同(簡單回想一下前面提到的人類學習的方法)。基本的想法是有一個代理在虛擬環境中行動以獲得積極的回報。每個動作都會引起環境狀態的變化,而且每個動作都由稱為策略的模型來決定。策略嘗試確定在給定狀態下要采取的優秀操作。如果暫時不理解請別擔心;我會舉個例子,希望能解釋得更清楚,很形象地展示了強化學習。如圖所示:代理C壞境你可以考慮以游戲吃豆女士(Ms.Pac-Man,為何不是Ms.Pac-Woman?)為
23、例。吃豆女士的目標是吃掉屏幕上所有的點,但是更大的目標是從可能吃掉的點中獲得最多的分數。為什么得分最多才是真正的目標?或者說為什么要玩這個游戲?首先,得分越多,能得到的自由生命就越長,自由生命越長就能玩得越久,就可以繼續積累更多的分數。其次,如果能完成比賽或者創造世界紀錄,就能獲得正式的“吹牛權”誰不希望呢?在這種情況下,得分是獎勵,吃豆女士是代理,環境是屏幕,參與其中的人(玩家)是通過操縱游戲控制桿決定采取行動的策略。當然環境是有狀態的。有一個普通的不易察覺的情況,那就是在吃豆女士吃屏幕上的點和水果時,必須躲開追趕她的幽靈,還有一個不可戰勝的情況,那就是當吃豆女士吃了無敵藥丸(我不知道它到底叫什么)后,她就可以吃掉幽靈從而得到很多額外的分。決定無敵與非無敵的是環境狀態的變化,也是代理人在環境
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度江蘇省二級注冊建筑師之法律法規經濟與施工基礎試題庫和答案要點
- 2024年度江蘇省二級造價工程師之土建建設工程計量與計價實務押題練習試題A卷含答案
- ui設計師面試題及答案
- 職高班主任工作總結示例
- T/CADBM 5-2018智能恒溫休閑池
- 光纖入戶維護承包協議書
- 復婚協議書和婚前協議書
- 灌溉溝渠承包合同范本
- 親子游泳項目安全協議書
- 服裝定制合作合同范本
- 2025屆天津市蘆臺一中高三一模-化學試卷
- 蘇教版數學一年級下冊(2024)第七單元觀察物體(一)綜合素養測評 A 卷(含答案)
- 市政道路工程施工組織設計方案
- 活動策劃服務投標方案(技術方案)
- 2024年版豬場員工勞動合同模板3篇
- Unit 6 Section A 1a-2c 說課課件2024-2025學年人教版英語八年級下冊
- 2024年中國養老產業商學研究報告-銀發經濟專題
- 保衛管理員三級練習題
- DBJ51T033-2014 四川省既有建筑電梯增設及改造技術規程
- 武昌實驗中學2025屆高三下第一次測試數學試題含解析
- 養老護理員培訓課程內容(范本)
評論
0/150
提交評論