




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
BasisofArtificialIntelligenceApplication人工智能應用基礎模塊一
人工智能概述01人工智能Artificial
IntelligenceAI1956年8月達特茅斯(美國)2016年阿爾法狗(AlphaGo)姓名英文名簡稱誕生年月籍貫成名作品擅長技能涉獵專業優點缺點:::::::::視覺、語音、自然語言處理等數學/計算機/生物/哲學等冷靜、循規蹈矩它是誰?啥背景?有何用?怎么玩?下載安裝Anaconda套件創建HelloAI.py文件并編碼及運行
安裝百度SDK并注冊百度帳號1、任務描述任務1:HelloAI開發環境搭建本次任務是安裝開發環境,并通過簡單編碼測試環境;安裝百度人工智能SDK并注冊用戶,為后續實驗作準備。2、環境要求網絡通信正常推薦Winsows操作系統3、任務設計1.熟悉人工智能的概念2.了解人工智能發展歷史3.了解人工智能主流技術4.熟悉人工智能典型應用5.能選型開發語言和環境6.能編寫并運行簡單代碼7.培養工匠精神及四個自信重點:1.人工智能的概念與歷史2.人工智能相關技術及應用3.人工智能開發環境搭建難點:1.人工智能的概念2.人工智能開發環境搭建知識?技能?素質重難點人工智能應用基礎BasisofArtificialIntelligenceApplication1.1人工智能的概念1.2人工智能的發展歷史1.3人工智能的主要技術領域1.4人工智能的典型應用1.5任務1:AI開發環境搭建
人工智能(ArtificialIntelligence,AI)是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能相關學科1、人工智能的定義1.1人工智能的概念人工智能產業鏈算力算法數據計算機視覺智能語音自然語言處理安防制造金融交通零售醫療教育……智能汽車機器人智能家居無人機穿戴設備AR/VR智能手機智能裝備……人的智能智慧能力IntelligenceArtificial
AI人工的人造的模擬的智能感知記憶思維學習創造語言行為情感智能的特征有思維能學習有創造性有情感智能標準爭議:智能是否包括意識?1、人工智能的定義1.1人工智能的概念今年幾歲?你猜猜看不想回答5分鐘內回答詢問者的一系列問題30%
的詢問者誤認為對方是人類通過電腦(機器)具有智能?思考:你需要判斷對方是人類還是計算機,作為圖靈測試的詢問者,你準備了哪些問題?2、圖靈測試智能的判別——機器能不能騙過人類?1.1人工智能的概念
GoogleDuplex:首次在語音方面通過了圖靈測試任務一:成功預定美發服務,并使用了“嗯哼”嘆詞任務二:預定就餐的電話遇上接聽員誤解,能及時澄清2、圖靈測試2018年案例1.1人工智能的概念
生成式人工智能:自動生成視頻,自動合成配音生成視頻2:《男人和貓國王》由AI根據提示詞進行配音2、圖靈測試2024年案例:OpenAI公司的Sora模型自動生成視頻1.1人工智能的概念
生成式人工智能:可能被用于電信詐騙2、圖靈測試生成式人工智能的另一面1.1人工智能的概念另:2024年初,騙子假冒CFO和員工,DeepFake公司被騙走了1.8個億3、人工智能按能力分類
弱人工智能(ArtificialNarrowIntelligence,ANI)也稱為專用人工智能或限定領域人工智能,指的是專注于且只能解決特定領域問題的人工智能。弱人工智能(阿爾法狗)強人工智能(科幻片中)強人工智能(Artificialgeneralintelligence,AGI)也稱為通用人工智能,指的是在各方面都能和人類相當的智能機器,它能勝任人類所有智力性工作。超人工智能(跨越奇點)超人工智能(ArtificialSuperIntelligence,ASI)在幾乎所有領域都比最聰明的人類大腦都聰明很多,包括科學創新、通識和社交技能。1.1人工智能的概念1.1人工智能的概念1.2人工智能的發展歷史1.3人工智能的主要技術領域1.4人工智能的典型應用1.5任務1:AI開發環境搭建1.2人工智能的發展歷史1、人工智能的誕生圖靈機:理論計算機模型(圖靈)1936神經元:神經生理學家麥克洛奇和數理邏輯學家匹茲1943ABC:愛荷華州立大學世界上第一臺數字計算機1937ENIAC:賓西法尼亞大學,第二臺電子計算機第一臺通用計算機19461.2人工智能的發展歷史1、人工智能的誕生艾倫?圖靈:圖靈測試馬文?閔斯基:世界上第一個神經網絡模擬器snare喬治?戴沃爾:世界上第一臺可編程機器人達特茅斯會議:人工智能19511950195619541、人工智能的誕生1956年夏季,以麥卡錫、明斯基、羅切斯特和香農等為首的一批的年輕科學家在美國達特茅斯學院聚會,首次提出了“人工智能”這一術語。參會者2006年重聚達特茅斯,由左至右順序:摩爾、麥卡錫、明斯基、賽弗里奇、所羅門諾夫1.2人工智能的發展歷史是什么因素推動了浪潮的興起?是什么瓶頸導致了寒冬的降臨?人工智能的三次浪潮195619601985迄今1974-801987-9320061.2人工智能的發展歷史機器人安防語音…技術…算力算法數據應用場景…視覺?核心:西蒙和紐厄爾推崇的自動定理證明方法。?1958年,西蒙提出四大預言:–不出十年,AI將成為世界象棋冠軍,證明所有定理,譜寫優美音樂。–2000年,AI將超越人類。1964年,一臺叫做STUDENT的機器能證明應用題1966年,一臺叫做ELIZA的機器實現簡單人機對話
1972年,世界上第一個全尺寸人形智能機器人2、第一次浪潮:
邏輯智能興盛(1956-1970)1.2人工智能的發展歷史然而:算法缺陷:基于的數學模型和數學手段有一定的缺陷性能不足:計算復雜度以指數程度增加并且:缺乏常識:邏輯證明器、感知器、增強學習等只能做很簡單、非常專門且很窄的任務,稍微超出范圍就無法應對。
劍橋大學數學家詹姆教授等人指責:
“人工智能即使不是騙局也是庸人自擾”2、第一次浪潮:寒冬1.2人工智能的發展歷史在數學模型方面的重大進展
Hopfield神經網絡(1982)BP反向傳播算法(1986)LeNet卷積神經網絡(1989)3、第二次浪潮:計算智能興盛
應用成果XCON專家系統,每年節省4000萬(1980)能與人類下象棋的高度智能機器(1989)能識別郵編的機器,精度可達99%以上1.2人工智能的發展歷史專家系統所使用的Lisp等機器,期望實現自然語言處理、知識工程、工業分析,然而:
缺乏更多真實應用場景
BP神經網絡的設計也缺少嚴格的數學理論支持–
1987年華爾街大崩潰,政府經費開始下降,投資界熱情消失–87-93年蘋果、IBM推廣第一代臺式機,得到資本界的青睞結果:–相關公司近乎全線破產,
人工智能又一次成為欺騙與失望的代名詞3、第二次浪潮:低谷1.2人工智能的發展歷史4、第三次浪潮:認知智能浪潮1997年IBM的“深藍”3.5:2.5世界象棋冠軍卡斯帕羅夫2011年IBM的Watson
1>1+1智力問答《危險》冠軍肯.詹寧斯
布拉德.魯特2016年谷歌的AlphaGo
4:1世界圍棋冠軍李世石博弈等高智商領域1.2人工智能的發展歷史?1997Vs?2016
?發表深度學習論文《科學》,Hinton,2006《自然》,三巨頭,2015左起:YannLeCun(Facebook)GeoffreyHinton(谷歌/多倫多大學)YoshuaBengio(蒙特利爾大學)吳恩達(deeplearning.ai)4、第三次浪潮:認知智能浪潮2006年起理論研究領域1.2人工智能的發展歷史作者:何愷明ResNet
:152層ImageNet:1400萬+對人類視覺能力的突破對比對象錯誤率(%)深度殘差網絡3.57接收過訓練的人5.12014年冠軍6.64、第三次浪潮:認知智能浪潮2015年技術應用領域1.2人工智能的發展歷史COCO數據集上ResNet目標檢測結果是的
會有退潮的時候
但是
不會斷崖式跌落實際應用4、第三次浪潮:退潮?數據、算法、算力的支撐1.2人工智能的發展歷史人工智能大數據云計算物聯網控制采集計算存儲計算學習反饋智能汽車機器人智能家居無人機穿戴設備AR/VR智能手機智能裝備安防醫療金融制造零售交通教育農業計算機視覺技術智能語音技術自然語言處理技術智能機器人應用層技術層高性能芯片/服務器機器學習/深度學習傳感器/物聯網基礎層算力算法數據本課程重點闡述:AI技術與應用概要介紹算法1.2人工智能的發展歷史深度學習?機器學習
?人工智能
1.1人工智能的概念1.2人工智能的發展歷史1.3人工智能的主要技術領域1.4人工智能的典型應用1.5任務1:AI開發環境搭建1、計算機視覺1.3人工智能的主要技術領域人臉識別字符識別典型應用:圖像問答什么牌子的汽車?價值是多少?邊上有沒有車模?展會效果自動分析:會場有多少人?某人年齡如何?某人性別如何?識別結果
(信息已經脫敏處理)姓名
史**性別
男民族
漢出生1970****住址
江蘇省無錫市南長區……身份號碼3201061970**ABCDEF語音識別:會議記錄語音合成:
中央臺虛擬主播2、語音處理1.3人工智能主要技術領域視頻來源:網易視頻聊天機器人機器翻譯3、自然語言處理及知識圖譜1.3人工智能主要技術領域工業機器人服務機器人輪式移動機器人4、智能機器人1.3人工智能主要技術領域北京冬奧會無人車火炬接力
機器狗的進化:
行走自如4、智能機器人1.3人工智能主要技術領域
機器狗的進化:無私協助視頻來源:澎湃視頻來源:澎湃
日本大阪人形機器人4、智能機器人1.3人工智能主要技術領域視頻來源:優酷視頻1.1人工智能的概念1.2人工智能的發展歷史1.3人工智能的主要技術領域1.4人工智能的典型應用1.5任務1:AI開發環境搭建無人機等智慧教育智能測評兒童陪伴個性化輔導智能安防智能監控安保機器人智慧醫療醫學影像分析健康監測診斷智能醫療設備智能金融智能投顧智能客服金融監管電商零售倉儲物流智能導購和客服自動駕駛智能汽車公共交通快遞用車智能制造設備維護產品檢測個人助理手機語音助理家庭管家陪護機器人智能家居娛樂系統遙控控制音樂系統指紋鎖智慧農業1.4人工智能典型應用“歌神”張學友又名“神捕”2018年:助警方一年抓80余名逃犯核心技術:AI人臉識別1、智能安防1.4人工智能典型應用甲狀腺結節識別、診斷超聲機器人:準確率85%超聲醫生:準確率75%在醫學影像領域:疾病篩查、病灶定量、病灶定性等三類,已覆蓋肺結節、乳腺癌、心血管、皮膚癌等許多病種2、智慧醫療1.4人工智能典型應用案例一:電池片瑕疵檢測,AI替代人工保護視力、速度快案例二:智能分揀系統3、智能制造1.4人工智能典型應用智能家居
度秘微軟小娜阿里小蜜蘋果Siri等4、智能家居與個人助理1.4人工智能典型應用交通銀行智能客服:50+萬累計服務客戶,95+%準確率中國移動智能福娃:1000萬月訪問量,90%識別,1.1億元5、智能客服視頻來源:騰訊視頻時尚電商6、電商零售1.4人工智能典型應用用戶畫像風險防范7、智能金融兒童陪伴:小丹智能機器人個性化學習:松鼠AI8、智慧教育1.4人工智能典型應用1.1人工智能的概念1.2人工智能的發展歷史1.3人工智能的主要技術領域1.4人工智能的典型應用1.5任務1:AI開發環境搭建2017年11月,首批4家2018年9月,商湯科技2019年8月,第3批10家序號公司平臺特性1百度自動駕駛2阿里城市大腦3騰訊公司醫療影像4科大訊飛智能語音5商湯科技智能視覺6華為基礎軟件………人工智能技術如水與電:即開即用非專業人士:直接調用API接口任務一:HelloAI開發環境搭建國家新一代人工智能開放創新平臺15家Java
C++/C#Python:簡單易學
語法簡單,易上手編程思想符合人類的思維邏輯開發語言與開發環境的選型任務一:HelloAI開發環境搭建VSCode
PycharmAnaconda+Spyder:最便捷
開發語言
開發環境
VSCode:最流行的框架Pycharm:與Python集成較好下載安裝Anaconda套件創建HelloAI.py文件并編碼及運行
安裝百度SDK并注冊百度帳號1、任務描述任務一:HelloAI開發環境搭建本次任務是安裝開發環境,并通過簡單編碼測試環境;安裝百度人工智能SDK及注冊用戶,準備后續實驗。2、環境要求網絡通信正常推薦Windows操作系統3、任務設計4、任務實施任務一:HelloAI開發環境搭建下載安裝Anaconda套件下載?
Anaconda3.5及以上版本即可采用默認設置安裝Anaconda,其中:①勾選加入環境變量
②勾選默認Python環境
③啟動Spyder?①②③4、任務實施任務一:HelloAI開發環境搭建HelloAI測試環境創建HelloAI.py文件(注意保存路徑盡量簡潔,可在E盤下新建一個文件夾)Windows【開始】
Anaconda3
Spyder
File
Saveas
HelloAI.py①輸入②運行③查看①輸入代碼:輸入一行代碼print(“HelloAI!”)
③查看:在IPythonconsole窗口中觀察結果②運行:點擊
“filerun”編譯執行按鈕編碼及運行4、任務實施任務一:HelloAI開發環境搭建安裝百度SDK并注冊帳號安裝百度SDK【開始】
Anaconda3
AnacondaPrompt①在命令窗口中輸入
pipinstallbaidu-aip百度AI開發平臺網頁右上角點擊【控制臺】先注冊百度帳號,然后登錄網頁右上角點擊②個人帳號
進入③用戶中心完成④個人實名認證注冊百度帳號(建議用谷歌瀏覽器)①②③④5、常見問題任務一:HelloAI開發環境搭建疏忽不注重文件保存路徑,導致后續難以找到文件位置未進行實名認證,導致后續實驗時再花時間認證語法錯誤英文括號(),寫成了中文括號()英文雙引號"",寫成中文雙引號“”print前面有空格6、拓展設置任務一:HelloAI開發環境搭建背景設置:Spyder菜單
Tools
Preferences
①
Syntaxcoloring
②
SpyderDark代碼提示:Spyder菜單
Tools
Preferences
③
IPythonconsole
④
AdvancedSettings背景設置與代碼提示①②⑥③④⑤BasisofArtificialIntelligenceApplication人工智能應用基礎模塊二計算機視覺技術02小張是公司的檔案管理人員,每天要處理大量歷史文件及單據,小張用過人臉識別,也用過拍照識花小程序,他就盼望著有一款軟件,能夠識別紙質文件上的文字。求人不如求己!讓我們一起學一學計算機視覺,做一做文字識別項目!網絡通信正常已安裝Anaconda集成環境已安裝百度SDK并注冊用戶1、任務描述準備一張含有文字的圖片在百度平臺創建OCR應用并獲取鑒權信息
編寫五行代碼編譯運行并查看結果2、環境要求3、任務設計本次任務是借助百度OCR接口,將給定圖片中的文字識別出來。效果如下所示。}任務一請掃碼完成集成環境&百度平臺1.熟悉計算機視覺的概念2.了解計算機視覺的基本任務3.了解計算機視覺的技術應用4.了解機器視覺技術與應用5.能編程實現OCR文字識別6.提升民族自豪感重點:1.計算機視覺的概念2.計算機視覺的常見應用3.OCR文字識別實踐難點:1.計算機視覺的概念2.文字識別應用實踐知識?技能?素質重難點人工智能應用基礎BasisofArtificialIntelligenceApplication2.1計算機視覺的概念2.2計算機視覺的基本任務2.3計算機視覺的技術應用2.4機器視覺技術與應用2.5任務2:OCR文字識別
計算機視覺(ComputerVision,CV)是使用計算機及相關設備對生物視覺的一種模擬,屬于人工智能中的感知智能范疇。它是一門研究如何使機器能“看”的學科。生物視覺計算機視覺1、計算機視覺的定義2.1計算機視覺的概念80%↑信息
來自視覺計算機視覺的主要基礎研究有圖像分類、語義分割、實例分割、目標檢測、目標跟蹤等,應用技術主要有OCR文字識別、人臉識別、人體分析、動植物分類等,在交通、安防、醫療、金融等多個領域取得了廣泛的應用。計算機視覺技術與應用框架2、計算機視覺技術與應用框架2.1計算機視覺的概念金融服務……交通教育制造零售醫療安防業務場景圖像分類……基礎研究語義分割實例分割目標檢測目標跟蹤人臉識別圖像檢索車牌識別目標長跟蹤圖像OCR3D重建手勢姿態直播鑒黃人車行為分析衛星圖像分析無人駕駛美圖修圖
應用技術看圖說話動植物分類工業視覺圖像生成醫療影像診斷煙火檢測3、典型案例:車牌識別2.1計算機視覺的概念圖像采集圖像預處理車牌定位字符分割字符識別結果輸出圖源:智通視訊2.1計算機視覺的概念2.2計算機視覺的基本任務2.3計算機視覺的技術應用2.4機器視覺技術與應用2.5任務2:OCR文字識別2.2計算機視覺的基本任務計算機視覺的三(四)大基本任務:分類、分割、檢測定位圖像分類檢測語義分割定位與跟蹤實例分割視頻來源:知乎1、圖像分類2.2計算機視覺的基本任務圖像分類(Imageclassification)是讓計算機觀察一幅圖片,將圖片上的對象進行識別分類。它能準確地預測給定圖片屬于哪個類別,主要解決圖像中的對象“是什么”的問題。2、語義分割2.2計算機視覺的基本任務語義分割(SemanticSegmentation)是計算機視覺中的基本任務,旨在以有意義的方式對像素進行分組。語義分割實際上相當于像素級分類,即將圖像中的每個像素進行分類。3、實例分割2.2計算機視覺的基本任務實例分割(InstanceSegmentation)是檢測并標記圖像中出現的每個不同的感興趣對象。它是目標檢測和語義分割的結合。即先將圖像中每個目標檢測出來,再對每個像素打上標簽。4、目標檢測2.2計算機視覺的基本任務目標檢測(Objectdetection)利用圖像分類技術找出圖像中所有感興趣的對象,確定它們的類別和位置(目標定位)。目標檢測主要解決圖像中“有沒有”特定對象及“在哪里”的問題。5、目標定位(跟蹤)2.2計算機視覺的基本任務目標定位主要解決圖像中特定對象“在哪里”的問題目標跟蹤(ObjectTracking)是指對圖像序列中的運動目標進行檢測、提取、識別和跟蹤,獲得運動目標的運動參數,進行處理與分析,實現對運動目標的行為理解,以完成更高一級的檢測任務。單目標Vs多目標靜態背景Vs動態背景2.1計算機視覺的概念2.2計算機視覺的基本任務2.3計算機視覺的技術應用2.4機器視覺技術與應用2.5任務2:OCR文字識別文字識別2.3計算機視覺的技術應用人臉識別計算機視覺的四類常見應用認識萬物識別結果
北京天安門0.851旗幟0.675升國旗0.496城樓0.261轎車0.04識別結果
(身份證號已作脫敏處理)姓名
史**性別
男民族
漢出生1970****住址
江蘇省無錫市南長區……公民身份號碼3201061970********人體分析1、人臉識別及其應用2.3計算機視覺的技術應用人臉檢測與追蹤五官關鍵點檢測表情、年齡、種族等活體檢測與驗證人臉像素解析人臉識別、檢索人臉識別也叫人像識別、面部識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。相關技術還有關鍵點檢測、活體檢測等。通常是用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別。1、人臉識別及其應用2.3計算機視覺的技術應用1:1確認,你是你!1:N識別,你是誰?公司錯誤率公司錯誤率Baidu0.23%香港中文大學0.47%Tencent0.35%Face++0.50%Google0.37%Human0.80%6000對1:1驗證錯誤率(權威數據集LFW)1、人臉識別及其應用2.3計算機視覺的技術應用原始視頻語義分割美白效果唇彩效果人臉語義分割1、人臉識別及其應用2.3計算機視覺的技術應用屬性屬性值概率性別male0.999399微笑normal0.886581美丑79.2005raceyellow0.994061age30.6591屬性屬性值概率性別female0.760808微笑smile0.996415美丑66.7688raceyellow0.994061age19.6143屬性屬性值概率性別male0.974683微笑laugh0.956921美丑76.0172racewhite0.981642age5.04445人臉屬性分析1、人臉識別及其應用2.3計算機視覺的技術應用人證對比人臉驗證人臉識別人臉編輯金融核身考勤認證安檢核身考試驗證人臉登錄密碼找回刷臉支付人臉閘機VIP識別明星臉安防監控人臉美化人臉貼紙1、人臉識別及其應用2.3計算機視覺的技術應用人臉編輯
美化貼紙美化貼紙人臉融合屬性編輯1、人臉識別及其應用2.3計算機視覺的技術應用高鐵站人臉閘機人證對比刷臉入園、入住、就餐防止黃牛倒票防止一票多人共用景區人臉閘機攝像頭:掃描自己面部信息車票讀碼器:藍色實名制磁卡車票身份證讀取器:芯片中高清照片1、人臉識別及其應用2.3計算機視覺的技術應用紅燈亮起后,識別到有行人越過停止線系統自動抓拍4張照片,保留15秒視頻截取違法人頭像。預先將在逃人員圖像信息錄入數據庫中攝像頭捕捉信息并和數據庫比對跟逃犯數據庫匹配成功,則系統警告安防交通抓捕逃犯抓拍交通違法:人臉抓拍系統1、人臉識別及其應用2.3計算機視覺的技術應用采用動作配合式活體驗證(圖源:AI百度)活體檢測2、人體分析及其應用2.3計算機視覺的技術應用
人體分析是指準確識別圖像中的人體相關信息,能提供人體檢測與追蹤、關鍵點定位、人流量統計、屬性分析、人像分割、手勢識別等能力。2、人體分析及其應用2.3計算機視覺的技術應用
關鍵點檢測屬性分析人像分割手勢識別2、人體分析及其應用2.3計算機視覺的技術應用統計圖像中的人體個數和流動趨勢,以俯拍角度為主要識別視角,適應人群密集場景人流量統計2、人體分析及其應用2.3計算機視覺的技術應用安防監控智慧零售體育娛樂駕駛監測3、通用圖像處理及應用2.3計算機視覺的技術應用圖像識別分類/tech/imagerecognition/general
1億+圖片,10w+標簽,世界上最大的圖像識別訓練集10倍于最大公開數據集imagent全庫(1000多類,1400萬圖片)訓練了世界上最大規模的圖像識別模型,支持類別達4w類3、通用圖像處理及應用2.3計算機視覺的技術應用應用類別動物識別車輛檢測植物識別風格遷移3、通用圖像處理及應用2.3計算機視覺的技術應用圖像問答/pcpage/index?tpl_from=pc4、光學字符識別及其應用2.3計算機視覺的技術應用
光學字符識別(OpticalCharacterRecognition,OCR)是指用掃描儀等電子設備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。OCR是人工智能最常用技術之一,目的是讓“計算機”和“人”一樣,能看圖識字。文字檢測文字識別輸出結果預處理OCR處理的一般流程4、光學字符識別及其應用2.3計算機視覺的技術應用早在上世紀八十年代,光學字符識別就開始應用于美國郵政編碼的識別工作。OCR技術能識別PDF文件中的信息
圖片來源:百度AI4、光學字符識別及其應用2.3計算機視覺的技術應用技術基礎:深度學習技術
功能:整圖文字檢測、定位、識別等;應用場景:印刷文字、票據、身份證、銀行卡等代替用戶輸入
反作弊、街景標注、視頻字幕識別、新聞標題識別深度學習算法數千萬訪問量的產品群千萬級別訓練數據文字識別服務4、光學字符識別及其應用2.3計算機視覺的技術應用金融:證件身份證、銀行卡、駕駛證、行駛證、營業執照等證照識別操作;身份證識別:可直接導入Excel中銀行卡識別識別結果姓名
史**性別
男民族
漢出生1970****住址
江蘇省無錫市南長區……公民身份號碼3201061970********4、光學字符識別及其應用2.3計算機視覺的技術應用發票等文檔識別圖片來源:ai.baidu應用場景:保險、醫療、電商、財務等
大量票據錄入工作場景參考案例:泰康、太保、中電信達等圖源:知途教育財務醫療:票據4、光學字符識別及其應用2.3計算機視覺的技術應用應用場景:保險基于圖像技術識別道路標識牌、OCR技術識別文字信息、識別駕駛證、行駛證、車牌等證照參考案例:百度地圖、地圖車生活應用場景:
識別視頻字幕,視頻新聞標題等文字信息,幫助客戶進行視頻標識,視頻建檔。參考案例:CCTV,廣電總局視頻中字幕建檔在某些需要對視頻進行標注、分類、建檔、商業廣告插入的情境中,人工標注成本巨大視頻中標題建檔在某些需要對視頻中的新聞標題、專題文字進行標注整理等環節,人工成本巨大。4、光學字符識別及其應用2.3計算機視覺的技術應用應用場景:題目識別、輸入、搜索等參考案例:作業幫、教育網站圖片選自作業幫應用場景:中外文識別,拍照識別文字/翻譯應用場景:幫助生僻字需求用戶識別文字參考案例:百度翻譯、百度詞典生活2.1計算機視覺的概念2.2計算機視覺的基本任務2.3計算機視覺的技術應用2.4機器視覺技術與應用2.5任務2:OCR文字識別1、機器視覺的概念2.4機器視覺技術與應用機器視覺是用機器代替人眼來做測量和判斷。典型的機器視覺應用系統包括圖像捕捉、光源系統、圖像數字化模塊、數字圖像處理模塊、智能判斷決策模塊和機械控制執行模塊。1、機器視覺的概念2.4機器視覺技術與應用機器視覺側重工程的應用,強調實時性、高精度和高速度,對相機、鏡頭、光源及圖片質量有極高的要求。圖像采集時,在指定相機、鏡頭、光源下以固定距離拍攝產品。對比計算機視覺機器視覺應用領域生活工業/產品典型任務分類、檢測、分割、追蹤識別、檢測、測量、定位成像設備相機或攝像頭專用相機及專用鏡頭光源要求普通高(調試選定光源)成像質量普通高(產品距離固定)處理速度普通實時、高速處理精度期望較高精度極高精度2、機器視覺的應用2.4機器視覺技術與應用尺寸測量示例識別:對不同種類的產品進行自動識別,如電子元器件、機械零件、食品包裝等。瑕疵檢測:通過對產品表面、形狀、顏色等特征進行分析檢測產品的瑕疵、缺陷、劃痕、裂紋等問題。定位:通過對產品或物體的位置、方向、姿態等進行識別和測量實現自動化定位和對位,如自動對位焊接、裝配等。測量:通過對產品或物體的尺寸、形狀、角度等進行測量實現自動化尺寸檢測、角度測量等。比如通過定位零件的兩個中心孔來測量孔距。2、機器視覺的應用2.4機器視覺技術與應用半導體及電子行業的應用占40%-50%醫藥、汽車等行業2.1計算機視覺的概念2.2計算機視覺的基本任務2.3計算機視覺的技術應用2.4機器視覺技術與應用2.5任務2:OCR文字識別網絡通信正常已安裝Anaconda集成環境已安裝百度SDK并注冊用戶1、任務描述任務2:OCR文字識別準備一張含有文字的圖片在百度平臺創建OCR應用并獲取鑒權信息
編寫五行代碼編譯運行并查看結果2、環境要求3、任務設計本次任務是借助百度OCR接口,將給定圖片中的文字識別出來。效果如下所示。}任務一請掃碼完成集成環境&百度平臺登錄
①
進入“通用文字識別”場景②開放能力
③文字識別
④通用場景文字識別
⑤立即使用領取免費資源⑥去領取
⑦通用場景OCR⑧全部
⑨0元領取創建應用⑩去創建
?填寫應用名稱(自定義)
?填寫應用描述(自定義)
?立即創建獲取密鑰?文字識別
?應用列表
?顯示你的密鑰序號應用名稱AppIDAPIKeySecretKey1MyOCR19077346E8noZQp…******顯示2文字識別17149894XD6sbUZ…******顯示②??③④①⑤⑥⑩?創建OCR應用并獲取秘鑰任務2:OCR文字識別4、任務實施任務2:OCR文字識別左側為參考代碼,其中:圖片資源應與源代碼文件在同一目錄下學有余力的同學可繼續探索下方代碼,優化輸出效果參考代碼4、任務實施任務2:OCR文字識別調用OCR功能,平臺返回原始信息提取文字信息,優化輸出結果編譯運行結果4、任務實施任務2:OCR文字識別常見問題一:語法錯誤使用了中文字符,比如英文括號(),寫成了中文括號()英文單引號'',寫成中文單引號‘’
英文雙引號"",寫成中文雙引號“”括號、單引號、雙引號不完整,只有半邊變量定義時的名字與變量使用時的名字不一致,比如定義時寫成result=3
使用時寫成print(reault)5、常見問題任務2:OCR文字識別常見問題二:編譯錯誤錯誤代碼Code6:誤注冊了其它應用,如圖像搜索技能等錯誤代碼Code14:AK、SK抄寫錯誤,有空格等Nosuchfile:磁盤下沒有相應的資源(沒有圖片文件,或者文件名字不一致)不注意字母的大小寫,比如把AipOcr寫成了Aipocr等其它錯誤建議復制錯誤提示詞,在百度上搜索問題的原因與解決方法5、常見問題本次項目利用百度人工智能開放平臺實現了圖片轉文字功能。在此基礎上,學員們可以進一步探索:深入創新:如果手頭有大量的標準化紙質單據或圖片(如增值稅發票、身份證等)需要識別出各個單項的值,將來可以錄入excel表格,應該如何實現?遷移創新:如果手頭上有許多植物的圖片,但不知道植物的名字,我們能否通過編程,讓人工智能來告訴我們?提示:AipImageClassify
模塊中的plantDetect
方法任務2:OCR文字識別6、拓展創新任務2:OCR文字識別零代碼教學軟件,用戶僅需到官網上獲取該應用對應的APPID、AK、SK,即可獲得訪問權限,完成文字識別、圖像分類、人體分析等實驗。BasisofArtificialIntelligenceApplication人工智能應用基礎模塊三智能語音技術01
錄音北京明天的天氣怎么樣?識別北京明天是晴天,最高氣溫28度,適合郊游。合成問答播放小紅是公司的客服,每天要回復很多客戶的電話,嗓子經常會變得沙啞。她一直盼望著:能不能把回復的文字轉換成音頻,自動播放給客戶?任務3:TTS文字轉語音網絡通信正常已安裝Anaconda集成環境已安裝百度SDK并注冊用戶1、任務描述準備一段文字(或文本文件)
在百度平臺創建語音應用并獲取鑒權信息
編寫六段代碼編譯運行并收聽結果2、環境要求3、任務設計本次任務是借助百度語音接口,將給定的文字轉換成語音并播放出來。效果如下所示。}任務一請掃碼完成集成環境&百度平臺我愛北京天安門,天安門上紅旗飄!1.熟悉語音處理的概念2.了解語音識別、語音合成、聲紋識別、喚醒詞等常用技術3.了解語音處理的常見應用4.能將文字轉化為語音5.提升四個自信與工匠精神重點:1.語音處理的概念2.語音處理的相關技術與應用3.TTS文字轉語音實踐難點:1.語音處理的相關技術2.文字轉語音實踐知識?技能?素質重難點人工智能應用基礎BasisofArtificialIntelligenceApplication3.1語音處理的概念
3.2語音處理的常用技術3.3語音處理的常見應用任務3:TTS文字轉語音語音處理(speechsignalprocessing)是研究語音發聲過程、語音信號的統計特性、語音的自動識別、機器合成以及語音感知等各種處理技術的總稱。它是一門研究如何讓機器能夠“聽”和“說”的學科,屬于人工智能中的感知智能范疇。語音處理概念圖1、語音處理的定義3.1語音處理的概念語音處理主要研究RNN,LSTM等基礎算法,實現語音識別(包括語音喚醒)、語音合成、語音增強、聲紋識別、語音評測等應用技術方向。目前,語音技術已經在智能家居、手機助理多個領域取得了良好的應用。語音處理技術與應用框架2、語音處理技術與應用框架3.1語音處理的概念MFCCGMM-HMM…DNN-HMMRNNLSTM基礎算法語音識別語音合成語音增強……聲紋識別應用技術手機汽車家居客服金融可穿戴智能機器人…業務場景3.1語音處理的概念
3.2語音處理的常用技術3.3語音處理的常見應用任務3:TTS文字轉語音語音識別:說的是什么?語音合成:替我說話!語音增強:消減噪音,讓我聽得清楚點聲紋識別:是誰在說話?語音評測:你的發音水平如何?常用技術3.2語音處理的常用技術語音識別,又稱自動語音識別(AutomaticSpeechRecognition,ASR),是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,它是利用計算機自動對語音信號的音素、音節或詞進行識別的技術總稱。1、語音識別3.2語音處理的常用技術語音識別一般流程科大訊飛棵大訓非kēdàxùnfēi語言處理科大訊飛信號處理特征提取模型匹配聲學模型聲學庫語言模型文本庫1、語音識別3.2語音處理的常用技術輸入語音有效語言檢測接口層特征提取語音識別語言模型聲學模型識別結果語音前處理數據預處理語音訓練集聲學模型訓練文本訓練集數據清洗和正規化模型訓練和優化語言模型訓練系統流程HMMCNNDNN
RNN1、語音識別3.2語音處理的常用技術語音編碼語音質量16K16bit、8K16bit、Speex壓縮避免丟音、截幅、音量過小等理想音頻丟音截幅音量過小輸入語音:較高質量1、語音識別3.2語音處理的常用技術聲學一致性:待識別語音和語音訓練集具有一致性數據預處理(NoiseRobust)語音訓練集聲學模型遠場近場設備降噪用戶口音聲學匹配:聲學一致性聲學模型訓練1、語音識別3.2語音處理的常用技術文本一致性:待識別領域和文本訓練集具有一致性語言模型語言模型訓練數據清洗和正規化模型訓練和優化文本訓練集領域數據核心詞匯wǒ
xǐ
huān
bǎi
dù我喜歡文本匹配:文本一致性百度擺渡!1、語音識別3.2語音處理的常用技術語音識別語義理解對話管理語音喚醒聲紋識別大白你好小明你好語音合成語音喚醒:在手機、玩具、家電等設備在休眠或鎖屏狀態下,能檢測到用戶發出的“小度小度”或“小愛同學”等喚醒詞,讓處于休眠狀態下的設備直接進入到等待指令狀態,開啟語音交互第一步。1、語音識別3.2語音處理的常用技術特征提取關鍵詞識別聲學模型庫>閾值?得分接受拒絕錯誤拒絕率(FRR)錯誤接受率(FAR)功耗語音喚醒:喚醒詞設計簡單易記日常少用易于喚醒3-4個音節語音識別主要包括語音聽寫、語音轉寫等細分應用,以及語音喚醒這個特殊應用。1、語音識別3.2語音處理的常用技術對比語音聽寫語音轉寫音頻時長≤60秒介于60秒與5小時實時性要求高低適用場景手機語音輸入、智能語音交互、語音指令、語音搜索等語音質檢、會議訪談、音頻內容分析等語音合成又稱文語轉換(TextToSpeech,TTS)技術,是將任意文字信息實時轉化為標準流暢的語音朗讀出來,它是通過機械的、電子的方法產生人造語音的技術。2、語音合成3.2語音處理的常用技術文本輸入
語言處理
韻律處理
單元合成
語音輸出語音合成一般流程聲學模型語言模型語法分析發音提示……波形拼接參數合成……2、語音合成3.2語音處理的常用技術目前的語音合成技術已與真人無異文本分析(文本正則、分詞、詞性標注、注音)韻律停頓預測聲學參數預測單元選擇聲碼器在線合成離線合成語音增強(speechenhancement)是從帶噪語音信號中提取盡可能純凈的原始語音,抑制、降低噪聲干擾,以改進語音質量、提高語音可懂度的技術。3、語音增強3.2語音處理的常用技術智能語音交互中的語音增強在語音識別、說話人識別、語種識別等各種以語音為信息載體的智能交互應用中,都面臨著噪聲干擾,使得有用語音信息畸變,語音質量降低,影響了機器對人類命令和語音信息的辨別和理解。聲紋識別也稱為說話人識別,包括說話人辨認和說話人確認。4、聲紋識別3.2語音處理的常用技術說話人辨認(SpeakerIdentification)是1:N問題:門禁、考勤、縮小刑偵范圍時可能需要辨認技術,用以判斷某段語音是若干人中的哪一個所說的年齡性別識別機器對已被授權輸入的音頻數據進行分析,輔助判定說話者的年齡范圍(小孩、中年、老年)及性別(男,女)Ta是誰?是Ta嗎?說話人確認(SpeakerVerification)是1:1問題:銀行、證券等實名制領域進行交易時,需要確認技術,用以確認某段語音是否是本人所說的語音評測(SpeechEvaluator)通過智能語音技術自動對發音水平進行評價、發音錯誤、缺陷進行定位和問題分析。5、語音評測3.2語音處理的常用技術科大訊飛語音評測流程可以對中英文的朗讀發音進行評分和問題定位。針對字、詞、句、篇章等類型,返回準確度、流暢度、完整度、聲韻調型等多維度評分,用于提升發音水平。3.1語音處理的概念3.2語音處理的常用技術3.3語音處理的常見應用任務3:TTS文字轉語音1、語音識別應用3.3語音處理的常見應用社交聊天社交聊天發送實時語音,支持中文,英文識別,方言支持廣東語,四川話。讓溝通交流更加準確案例:游戲娛樂語音聊天轉文字,讓用戶在操作的同時也可看到聊天內容案例:語音輸入法擺脫生僻字和拼音障礙,將所輸入文字,直接用語音的方式輸入,讓輸入法更加便捷案例:
語音搜索搜索內容直接以語音的方式輸入,讓搜索更加高效案例:2、語音合成應用3.3語音處理的常見應用出行、娛樂語音指令解放雙手機器人解說體育賽事農家數字書屋解放雙手用耳朵獲取知識2、語音合成應用3.3語音處理的常見應用功能:通過語音“說出”用戶的需求,智能家居就能識別,執行。案例:智能電視系統,直接根據語音操作3、語音增強應用3.3語音處理的常見應用軍事任務中的應用公安、國防等領域中的背景噪聲裝甲兵坦克海軍輪船駕駛室炮兵在操作火炮時空軍的地勤保障場所和設備,單兵惡劣的戰爭環境語音增強4、聲紋識別3.3語音處理的常見應用“小度小度,給我來首歌”“馬上播放小兔子乖乖”語音識別(ASR)Service語義理解(NLP)識別文本語音喚醒(Wakeup)聲紋辨認?聲紋確認?精準回應!3.1語音處理的概念3.2語音處理的常用技術3.3語音處理的常見應用任務3:TTS文字轉語音任務3:TTS文字轉語音網絡通信正常已安裝Anaconda集成環境已安裝百度SDK并注冊用戶1、任務描述準備一段文字(或文本文件)
在百度平臺創建語音應用并獲取鑒權信息
編寫六段代碼編譯運行并收聽結果2、環境要求3、任務設計本次任務是借助百度語音接口,將給定的文字轉換成語音并播放出來。效果如下所示。歡迎使用百度人工智能開放平臺!}任務一請掃碼完成集成環境&百度平臺任務3:TTS文字轉語音登錄
?
進入“語音識別”場景①開放能力
②語音技術
③語音合成
④(進入下一個頁面)立即使用領取免費資源⑤去領取
⑥語音合成
⑦
全部
⑧0元領取創建應用⑨去創建
⑩填寫應用名稱(自定義)
?填寫應用描述(自定義)
?立即創建獲取密鑰?文字識別
?應用列表
?顯示你的密鑰序號應用名稱AppIDAPIKeySecretKey1MySpeech22898059BOrie9B…******顯示2短語音識別25780364YnsT00u…******顯示①??②③⑤⑨?創建語音應用并獲取秘鑰4、任務實施任務3:TTS文字轉語音參考代碼4、任務實施左側為參考代碼,其中:如果用于合成的文字來自于文本文件,則該文本文件應與源代碼文件在同一目錄下需要領取免費資源包任務3:TTS文字轉語音編譯運行結果4、任務實施調用系統播放器,直接播放語音不顯示返回信息,直接保存音頻任務3:TTS文字轉語音常見問題:編譯錯誤英文括號()單引號''雙引號""寫成了中文符號英文錯誤代碼Code6:誤注冊了其它應用,如圖像搜索技能等錯誤代碼Code14:AK、SK抄寫錯誤,有空格等5、常見問題常見問題:疏忽程序能編譯,無錯誤提示,但沒有合成語音文件:查看是否領用了語音合成免費資源能正常播放語音,但找不到音頻文件:SpyderFileSaveas查看源文件路徑
任務3:TTS文字轉語音本次項目利用百度人工智能開放平臺實現了語音合成功能。在此基礎上,學員們可以進一步探索:深入創新:上一模塊中,我們已經學會了識別紙質文件上的文字。本次任務,我們能將文字轉化為語音了。請考慮一下,我們能不能讓人工智能“念書”呢?遷移創新:
我想換主播!怎么辦?提示:如果想選擇不同的發音人、語速、語調等,可修改代碼#4部分)
6、拓展創新
#4添加參考代碼:,{'per':2,}
增加發音人參數項,參數設置為2任務3:TTS文字轉語音零代碼教學軟件,用戶僅需到官網上獲取該應用對應的APPID、AK、SK,即可獲得訪問權限,完成語音合成、語音識別等實驗。BasisofArtificialIntelligenceApplication人工智能應用基礎模塊四自然語言處理04小芳是公司的產品設計師,非常關心用戶對產品的體驗。網絡上充斥著大量的產品評價,憑借人力是難以顧全的,只能靠機器來識別。比如"客服還不錯,東東用起來很方便,就是物流非常慢",先肯定優點,后面轉折指出問題,機器會怎么看待這條評價?是負面評價嗎?一起來試一試!任務四:客戶評價情感分析網絡通信正常已安裝Anaconda集成環境已安裝百度SDK并注冊用戶1、任務描述準備一段客戶評價文字在百度平臺創建Nlp應用并獲取鑒權信息
編寫五行代碼編譯運行并查看結果2、環境要求3、任務設計本次任務是借助百度Nlp接口,識別出客戶對產品評價的情感傾向。效果如下所示。}任務一請掃碼完成集成環境&百度平臺1.熟悉自然語言處理的概念2.了解自然語言處理的技術3.了解自然語言處理的應用4.了解知識圖譜及應用5.能編程實現客戶評價情感分析6.增強四個自信重點:1.自然語言處理的概念2.自然語言處理的技術與應用3.
客戶評價情感分析實踐難點:1.自然語言處理的概念2.客戶評價情感分析應用實踐知識?技能?素質重難點人工智能應用基礎BasisofArtificialIntelligenceApplication1、自然語言處理的概念2、自然語言處理的基礎技術3、自然語言處理的常見應用4、知識圖譜及應用5、任務四:客戶評價情感分析
自然語言處理(NaturalLanguageProcessing,NLP)是研究如何讓機器理解與生成自然語言的學科,目的是實現人與計算機之間用自然語言進行有效通信,屬于人工智能中的認知智能范疇。自然語言理解:人工智能皇冠上的明珠1、自然語言處理的定義4.1自然語言處理的概念自然語言人工語言人類社會約定俗成程序設計語言漢語,英語等C++,Java,Python等簡潔長度和規則上都有一定的冗余含糊、歧義無二義性如果李春來到了無錫,我請他吃飯。自然語言處理的基礎研究包括詞法分析、句法分析、語義分析、篇章分析等,應用技術包括機器翻譯、文本摘要、情感分析、文本理解、信息抽取等。在商品推薦、對話機器人、機器翻譯、輿情監控,廣告、金融風控等領域取得了良好的應用。2、自然語言處理技術與應用框架4.1自然語言處理的概念自然語言處理技術應用框架自動問答智能對話情感分析評價分析內容搜索知識推理機器翻譯話題檢測內容推薦商品理解文本理解意圖理解文圖轉換多輪對話語言生成社媒分析應用技術智能交互翻譯商品搜索廣告風控翻譯廣告風控智能交互業務場景基礎算法詞法
分析分詞實體識別詞性標注詞義消歧句法結構深層方法句法分析依存關系句法
分析詞義消歧語義角色標注拼寫檢查語義
分析篇章結構主題模型指代消解摘要篇章
分析3、自然語言處理中的歧義模糊詞法分析歧義例如:他背著母親和姐姐悄悄的出去玩了。語法分析歧義例如:咬死了獵人的狗。語義分析歧義例如:開刀的是他父親。指代不明歧義例如:小王回到宿舍,發現老朱和他的朋友坐在那里聊天。新詞識別例如:我很喜歡吃雞。語言行為與計劃的差異例如:你能把鹽遞過來嗎?4.1自然語言處理的概念1、自然語言處理的概念2、自然語言處理的基礎技術3、自然語言處理的常見應用4、知識圖譜及應用5、任務四:客戶評價情感分析4.2自然語言處理的基礎技術自然語言處理中的常用技術分詞(WordSegmentation)將連續的自然語言文本,切分成具有語義合理性和完整性的詞匯序列命名實體識別(NamedEntityRecognition)識別自然語言文本中具有特定意義的實體(人、地、機構、時間、作品等)詞性標注(Part-of-SpeechTagging)為自然語言文本中的每個詞匯賦予一個詞性(名詞、動詞、形容詞等)依存句法分析(DependencyParsing)又稱依存句法分析(dependencysyntacticparsing),簡稱依存分析,作用是識別句子中詞匯與詞匯之間的相互依存關系。語義分析(SemanticAnalysis)
基礎語言工具詞法分析分詞、詞性標注、命名實體識別詞向量表示與語言模型詞語的向量化來實現文本的可計算,語義挖掘、相似度計算等應用短文本相似度高精度的短文本相似度服務,幫助快速實現推薦、檢索、排序等應用解決方案集成評論觀點抽取自動抽取和分析評論觀點,實現輿情分析、用戶理解,支持產品優化和營銷決策機器翻譯支持全球多種語言實時互譯4.3自然語言處理的常見應用詞法分析:分詞、詞性標注、命名實體識別2003年10月15日,楊利偉乘由長征二號F火箭運載的神舟五號飛船首次進入太空,象征著中國太空事業向前邁進一大步,起到了里程碑的作用。4.2自然語言處理的基礎技術詞法分析:分詞切分歧義組合型歧義:中華人民共和國粗粒度的分詞中華人民共和國細粒度的分詞中華/人民/共和國交集型歧義:羽毛球拍賣完了羽毛球拍/賣完/了羽毛球/拍賣/完了真歧義:下雨天留客天留我不留下雨天/留客天/留我不/留下雨/天留客/天留/我不留未登錄詞新詞熱詞:神馬、不明覺厲、吃雞、房奴、給力等專有名詞:拜登、南蘇丹、泰康人壽、亮劍、花唄專業名詞:
禽流感、三聚氰胺等人名:……未登錄詞增長速度太快未登錄詞長度不定,來自普通詞匯將連續的自然語言文本,切分成具有語義合理性和完整性的詞匯序列4.3自然語言處理的常見應用詞向量:利用大數據和深度學習模型,將語言詞表中的詞映射成一個長度固定的向量。所有的詞向量構成一個向量空間,每一個詞都是這個詞向量空間中的一個點,據此實現詞匯本身的向量化表示和詞匯之間的相似度計算。詞向量詞匯語義相似度4.2自然語言處理的基礎技術西瓜呆瓜草莓“西瓜”在語義上更像“呆瓜”還是“草莓”???√(0.018,0.4696,0.5076,-0.5987,…)向量化表示:(0.1858,0.0353,0.1479,0.2210,…)(0.2251,0.2862,0.0347,0.0413,…)向量化表示:0.1150.325相似度計算:文本語義相似度4.2自然語言處理的基礎技術車頭如何放置車牌前牌照怎么裝如何辦理北京牌照“車頭如何放置車牌”跟哪句話的語義更接近???(0.844,-0.039,-0.789,-0.499,…)(0.355,0.238,-0.671,-0.743,…)(0.197,0.619,-0.849,-0.652,…)0.4860.762√向量化表示:向量化表示:相似度計算:1、自然語言處理的概念2、自然語言處理的基礎技術3、自然語言處理的常見應用4、知識圖譜及應用5、任務四:客戶評價情感分析1、機器翻譯機器翻譯(MachineTranslation)又稱為自動翻譯,是指運用機器,通過特定的計算機程序將一種文本或聲音形式的自然語言,翻譯成另一種文本或聲音形式的自然語言。4.3自然語言處理的常見應用他說:“我訪問的目的是加強中國和津巴布韋之間的傳統友誼,深化務實合作,把兩國關系提高到更高水平,為兩國人民帶來更多的好處。”一種自然語言(源語言)翻譯另一種自然語言(目標語言)計算機4.3自然語言處理的常見應用1、機器翻譯瀏覽外文網站研讀國外論文跨語言面對面溝通語言在線交流背誦外語單詞學習作文寫作學習閱讀商業貿易往來會議展覽溝通商貿了解國外旅游信息國外旅游打通語言障礙旅游交流在線翻譯2、垃圾郵件分類垃圾郵件過濾器是抵御垃圾郵件問題的第一道防線,其工作原理是“關鍵詞過濾”,即如果郵件中存在常見的垃圾郵件關鍵詞,就判定為垃圾郵件。正常郵件中也可能有這些關鍵詞,非常容易誤判垃圾郵件也會進化,通過將關鍵詞進行變形,很容易規避關鍵詞過濾4.3自然語言處理的常見應用通過自然語言處理方法,學習大量的垃圾郵件和非垃圾郵件,收集郵件中的特征詞,生成垃圾詞庫和非垃圾詞庫,然后根據這些詞庫的統計頻數計算郵件屬于垃圾郵件的概率,以此來進行判定,則能夠相對準確地判斷郵件是否為垃圾郵件。3、信息抽取信息抽取是把文本里包含的信息進行結構化處理,變成表格一樣的組織形式。輸入信息抽取系統的是各種各樣文檔中的原始文本,輸出的是固定格式的信息點。可以從指定文本范圍中提取出時間、地點、人物、事件等重要信息,幫人們節省大量時間成本,提高效率。
4.3自然語言處理的常見應用例:10月28日,AMD宣布斥資350億美元收購FPGA芯片巨頭賽靈思,這兩家傳了多年緋聞的芯片公司終于走到了一起。抽取結果事件:收購時間:2020年10月28日收購者:AMD被收購者:賽靈思收購金額:350億美元信息抽取子任務抽取結果實體抽取公司名:AMD公司名:
賽靈思關系抽取賽靈思時間表達式抽取10月28日時間表達式歸一化2020年10月28日4、文本情感分析文本情感分析又稱意見挖掘、傾向性分析,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。互聯網(如博客和論壇以及社會服務網絡如大眾點評)上產生了大量的用戶參與的、對于諸如人物、事件、產品等有價值的評論信息。網絡管理員可以通過瀏覽這些主觀色彩的評論來了解大眾輿論對于某一事件的看法企業可以分析消費者對產品的反饋信息,以便作出反饋或改進4.3自然語言處理的常見應用5、智能問答智能問答系統以一問一答形式,精確地定位網站用戶所需要的提問知識,通過與網站用戶進行交互,為網站用戶提供個性化的信息服務。首先要正確理解用戶所提出的問題,抽取其中關鍵的信息,然后在已有的語料庫或者知識庫中進行檢索、匹配,將獲取的答案反饋給用戶。分為檢索式問答、社區問答以及知識庫問答三種。4.3自然語言處理的常見應用第一輪Q1:上海明天下雨嗎
第二輪Q2:這周六呢改寫后本輪Q2rev:上海這周六下雨嗎6、個性化推薦個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。4.3自然語言處理的常見應用個性推薦熱搜新聞詞今日頭條的新聞推薦知乎上的話題推薦購物平臺的商品推薦直播平臺的主播推薦4.3自然語言處理的常見應用麻省理工學院為無人機配備RFID技術,進行倉庫貨物管理麻省理工學院的研究團隊為無人機在倉庫中使用RFID技術進行庫存查找等工作,創造了一種聰明的新方式。它允許公司使用更小,更安全的無人機在巨型建筑物中找到之前無法找到的東西。使用RFID標簽更換倉庫中的條形碼,將幫助提升自動化并提高庫存管理的準確性。與條形碼不同,RFID標簽不需要對準掃描,標簽上包含的信息可以更廣泛和更容易地更改。它們也可以很便宜,盡管有優點,但是它具有局限性,對于跟蹤商品沒有設定RFID標準,“標簽沖突”可能會阻止讀卡器同時從多個標簽上拾取信號。掃描RFID標簽的方式也會在大型倉庫內引起尷尬的問題。固定的RFID閱讀器和閱讀器天線只能掃描通過設定閾值的標簽,手持式讀取器需要人員出去手動掃描物品。幾家公司已經解決了無人機讀取RFID的技術問題。配有RFID讀卡器的無人機可以代替庫存盤點的人物,并以更少的麻煩更快地完成工作。一個人需要梯子或電梯進入的高箱,可以通過無人機很容易地達到,無人機可以被編程為獨立地導航空間,并且他們比執行大規模的重復任務的準確性和效率要比人類更好。目前市場上的RFID無人機需要龐大的讀卡器才能連接到無人機的本身。這意味著它們必須足夠大,以支持附加硬件的尺寸和重量,使其存在墜機風險。麻省理工學院的新解決方案,名為Rfly,允許無人機閱讀RFID標簽,而不用捆綁巨型讀卡器。相反,無人機配備了一個微小的繼電器,它像Wi-Fi中繼器一樣。無人機接收從遠程RFID讀取器發送的信號,然后轉發它讀取附近的標簽。由于繼電器很小,這意味著可以使用更小巧的無人機,可以使用塑料零件,可以適應較窄的空間,不會造成人身傷害的危險。麻省理工學院的Rfly系統本質上是對現有技術的一個聰明的補充,它不僅消除了額外的RFID讀取器,而且由于它是一個更輕的解決方案,允許小型無人機與大型無人機做同樣的工作。研究團隊正在馬薩諸塞州的零售商測試該系統。新聞摘要、文章分類等200字摘要麻省理工學院的研究團隊為無人機在倉庫中使用RFID技術進行庫存查找等工作,創造了一種聰明的新方式。使用RFID標簽更換倉庫中的條形碼,將幫助提升自動化并提高庫存管理的準確性。幾家公司已經解決了無人機讀取RFID的技術問題。麻省理工學院的新解決方案,名為Rfly,允許無人機閱讀RFID標簽,而不用捆綁巨型讀卡器。無人機接收從遠程RFID讀取器發送的信號,然后轉發它讀取附近的標簽。820字報道量大,難以閱讀7、語言生成1、自然語言處理的概念2、自然語言處理的基礎技術3、自然語言處理的常見應用4、知識圖譜及應用5、任務四:客戶評價情感分析1、知識圖譜的定義4.4知識圖譜及應用找到最想要的信息提供最全面的摘要讓搜索更有深度和廣度
知識圖譜(KnowledgeGraph),在圖書情報界稱為知識域可視化或
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級數學(上)計算題專項練習附答案
- 安徽省2025年下半年銀行招聘考試:資本市場考試試題
- 2025漢中職業技術學院單招《物理》檢測卷(基礎題)附答案詳解
- 荊門市2025中考適應考試理科綜合試題-0
- 2024年青海省工業和信息化廳下屬事業單位真題
- 2024年海口市社會保險服務中心招聘下屬事業單位考試真題
- 2024年安康市寧陜縣特崗教師招聘筆試真題
- 墜積性肺炎診療與管理要點
- 護理床頭健康教育實施規范
- 心內科護理要點與實踐
- 2025年高考河北卷物理真題(解析版)
- 2025春季學期國開電大本科《經濟學(本)》一平臺在線形考(形考任務1至6)試題及答案
- 武漢大學2020年強基計劃物理試題(解析版)
- 2025春國開《創業基礎》形考任務1-4答案
- 《紅樓夢》PPT課件(優秀)
- 新高考英語讀后續寫——故事編寫思路
- 最新煙葉儲存保管方法標準
- Y620優眾變頻器說明書
- 《丹江城區普通住宅小區物業服務收費管理辦法》
- CYD-128(環氧樹脂)MSDS
- 3船舶操作手冊
評論
0/150
提交評論