


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
分析:人工智能狂熱背后機器翻譯的革新
但熱度終究會退卻,真正回歸產業、產品和用戶需求時,我們除了那些科幻式的暢想和預測,還需要理解,基于現有的研究進展,人工智能可以給我們帶來什么真正有價值的東西,幫助我們解決哪些切實需求。比如說,我們可以得到更好的搜索結果;手機上的語音助手帶給我們一種全新的、更加省力的人機交互方式;計算機能夠讀出、辨別圖像中的內容等等。除此之外,人工智能還有一個非常重要的應用領域,也是可以改變全世界交流方式的工具——機器翻譯。1、語言和機器翻譯的重要性機器翻譯之所以重要的原因是在于語言對人類的重要性,《圣經·創世記》有個故事,當時人類聯合起來興建希望塔頂通天能傳揚己名的巴別塔。為了阻止人類的計劃,上帝讓人類說不同的語言,使人類相互之間不能溝通,計劃因此失敗,人類自此各散東西。科幻作家斯蒂芬森也在著名科幻小說《雪崩》中將語言稱為人類大腦的最底層結構,對人類的精神起到了至關重要的作用。LeraBoroditsky認為我們使用的語言在影響著我們對世界的感知,塑造了我們的行為方式和思維模式,AlanYu稱之為“語言塑造世界觀”。不同的語言帶來了文化的多樣,也對每個個人產生了決定性影響。但世界上存在的多種語言給我們帶來的不便也是顯而易見,它影響了人類最基本的需求——溝通交流。語言是人類智能的體現,是人類區別于其它生物的基本能力。而人工智能長久以來的目標就是讓機器完成那些以前只能靠人類自身才能完成的任務,所以在人工智能的具體應用,如何讓機器幫助人類進行語言翻譯就顯得尤為重要了。2、機器翻譯的產生與發展機器翻譯一直被公認為是人工智能領域最難的課題之一。讓機器理解語言,進而實現不同語言之間的翻譯,不僅僅是幾代科學家們孜孜追求的技術夢想,也寄托著普羅大眾實現自由溝通交流的美好愿望。《星際迷航:企業號》里有這樣的情景:星艦通訊指揮官佐藤星利用翻譯器發明了linguacode矩陣,通過把翻譯器集成到星艦人員佩戴的交流別針上或者植入耳朵里,說不同語言的人們就可以進行自由交流。這就是理想態的機器翻譯。機器翻譯是人們最早設想的計算機應用領域之一,1949年由Weaver提出。機器翻譯技術的發展一直與計算機技術的發展緊密相隨。從早期的詞典匹配,到詞典結合語言學專家知識的規則翻譯,再到基于語料庫的統計機器翻譯,隨著計算機計算能力的提升和多語言信息的爆發式增長,機器翻譯技術逐漸走出象牙塔,在近10年中開始為普通用戶提供實時便捷的翻譯服務。而近幾年,許多科技巨頭也公布了和機器翻譯相關的產品或服務。機器翻譯在近幾年取得突破進展的原因在于兩方面:第一是深度學習(模擬神經網絡)技術的出現,比如說百度此次發布的翻譯系統,就是借助計算機模擬的海量神經元仿效人腦“理解語言,生成譯文”,同時結合百度已有的統計機器翻譯技術,使得機器翻譯質量實現了質的飛躍。基于深度學習的翻譯系統的核心是一個擁有無數結點(神經元)的深度神經網絡。一種語言的句子被向量化之后,在網絡中層層傳遞,轉化為計算機可以“理解”的表示形式,再經過多層復雜的傳導運算,生成另一種語言的譯文。科技巨頭在機器翻譯方面取得的成績和他們在自然語言處理、深度學習等領域的布局和積累是分不開的。第二是海量數據的積累,百度的人工智能專家曾把算法比作火箭的發動機,把數據比作火箭的燃料,這兩者缺一不可。還是以百度舉例,百度已有的統計翻譯系統是用大量文本語料庫的統計信息來訓練概率模型而建立起來的。這種方法并不需要一個復雜的中間語言概念本體,不需要手工建立源語言和目標語言的語法,也不需要人工標記的數據庫。它所需要的只是數據——翻譯實例,從這些翻譯實例中可以學習得到翻譯模型。就像百度副總裁王海峰所說,百度翻譯在基于大數據的翻譯模型、翻譯知識獲取、樞軸語言翻譯等方面取得了重大技術突破。倪光南院士也把大數據比作“第四種科學范式“,稱其為”一個強大的工具”。而數據的積累是搜索巨頭得天獨厚的優勢,也成為了能夠在機器翻譯方面取得進展的必備條件。3、機器翻譯應用的重要意義上文提到,對于人工智能,我們現在最為關心的是該項技術的應用場景,能夠在哪些方面解決我們的切實需求。對于機器翻譯來說,不管是它應用范圍的廣度,還是其發揮作用的重要性,都具有不可估量的想象空間。值得慶幸的是,我們已經可以從這些科技公司發布的產品看到機器翻譯在未來的廣泛應用。百度副總裁王海峰在第十屆中國電子信息技術年會互聯網機器翻譯論壇的演講中表示,通過在理論、技術、應用上的創新和突破,百度機器翻譯已經實現了大規模產業化。通過免費開放API,該項技術成果支持了包括華為、金山等企業的超過7000個第三方應用。不同語言造成信息交流的障礙。互聯網的出現使世界變平,這更有利于信息的流動和共享,但再進一步來說,我們不只要獲得信息,還要讀懂這些信息,這就對不同語言間的信息交流產生了影響,提高了信息交流成本。而機器翻譯的出現就幫我們所有人解決了這個難題,除了書面信息以外,機器翻譯和語音識別技術的結合可以為我們在語音通話時提供實時便捷的翻譯。對于每個用戶來說,我們在出國旅游時,借助一個APP就能與當地人進行實時的無障礙溝通,通過拍照識別路牌和菜單;瀏覽國外網站也可以及時翻譯成本國語言。從行業來講,機器翻譯的出現對互聯網教育、旅游、金融、傳媒和外貿等行業都能產生積極影響。從國家層面來講,機器翻譯的意義同樣重要,這也是中國、美國、日本和歐盟都對機器翻譯大力投入的原因。清華大學計算機系孫茂松教授稱,從國家戰略角度看,機器翻譯是重要的國家軟實力之一,從老百姓角度看,包括做生意、旅游等,機器翻譯都是不可缺少的工具,它的社會、經濟效益是不可低估的。比如說,機
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育分級信用管理制度
- 設備安裝過程中材料和人力資源計劃
- 康復醫學科設備管理制度
- 高中物理信息化教學計劃
- 食堂洗碗區管理制度
- 小學科學教育主題活動計劃
- 2025蘇教版二年級多媒體教學計劃
- 2025-2030年中國FBT專用黏結膠行業調研分析及投資戰略研究預測研究報告
- 2025-2030鋸棕櫚漿果行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030輸送鏈輪行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- DZ∕T 0214-2020 礦產地質勘查規范 銅、鉛、鋅、銀、鎳、鉬(正式版)
- 2024年新教科版六年級下冊科學期末綜合測試卷(十九)
- 精神科進修匯報
- 2023年新高考天津卷歷史高考真題解析(參考版)
- 人工智能在文化遺產數字化保護中的應用
- GB/T 41666.4-2024地下無壓排水管網非開挖修復用塑料管道系統第4部分:原位固化內襯法
- 智能安防行業的技術應用與商業模式
- 煤礦機電和運輸安全管理
- 畢業班會主題課件-期末考前動員會-24張幻燈片
- 民事訴訟檢察監督制度研究
- 日本旅游路線展示課件
評論
0/150
提交評論