




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
云知聲智能語音交互應用
321云知聲公司簡介聲紋識別技術介紹語音識別技術介紹語音識別技術介紹1.技術領先2.持續學習3.私有部署國內首批公共語音云服務提供商(2012年9月)國內首家基于深度神經網絡(DNN)的語音云服務(2013年1月)業界最高的語音識別準確率(>96%)業界最快的語音識別響應速度(<0.15倍實時)業界最經濟高效的服務支持能力(單臺服務器支持>80路并發轉寫)領先而極具特點的語音技術4語音合成具有極高自然度與可懂度的中英文語音合成技術。超過30個領域的自然語言理解技術,讓機器理解人說的話。語義理解(NLU)語音識別與轉寫國際領先的中文語音識別與轉寫技術,包括基于服務器的在線識別以及基于終端設備的離線識別。完全自有知識產權完善的技術圖譜5抗噪特征提取精準數據建模高效識別引擎獨創的語音增強、信道及說話人規整技術,有效抑制環境噪聲干擾,極大地提高了語音識別在各種復雜環境下的準確率。高效的數據利用效率:為達到相同識別率,只需要使用業界平均水平的1/3的訓練數據量。業內最高效的識別引擎,在具備高精度識別性能前提下,識別速度是同類產品的三倍以上。三大技術創新針對移動互聯環境下語音識別技術所面臨的問題,不斷進行技術改進,用最少的訓練樣本達到業內最佳的識別精度以及最高效的識別速度(領先對手三倍)。6部署方式私有云公有云PC端移動端一套私有云支持多種客戶端應用聲紋識別技術1.聲紋識別介紹2.支持多個平臺3.參與測評語音檢測噪聲抑制特征提取聲紋模型聲紋匹配聲紋注冊聲紋確認/辨認相似度得分通過人不同的聲紋鑒別人的身份,實現賬號登錄聲紋識別技術對比文本無關文本相關語音內容注冊、識別語音內容不受限制注冊、識別語音內容相同語音長度為保證性能,一般要求注冊不少于30s,測試不少于10s較短,2s~5s即可應用場景遠程后臺監控,海量數據搜索聲紋密碼聲紋識別按照文本內容是否受限制,分為兩類:聲紋識別分類支持平臺NIST全球話者識別評測美國國家標準技術署(NIST)舉辦著多項計算機領域的最高水平評測項目,幾乎每一項都代表著該領域的世界頂尖水平。聲紋識別評測(SpeakerRecognitionEvaluation,SRE),是NIST正在進行的評測項目中歷史最悠久,參加單位最多,重要性最高的項目之一。是全球影響力最大的、最權威的聲紋識別技術評測,是對全球相關研究機構學術及技術水平的一次公開公平的檢驗。歷屆參賽單位摘要幾十家國內外著名高校、研究所、公司,如麻省理工學院(MIT)、卡耐基梅隴大學(CMU)、斯坦福(Stanford)、IBM、微軟、摩托羅拉、PerSay,清華、中科院聲學所、中國科大、LPT(意大利Loquendo公司)、CRIM、Brno(布爾諾科技大學)等。團隊歷屆成績一覽NIST聲紋識別評測始于1996年,我們團隊自2002年起(國內最早)第一次參加NIST評測開始,一直積極參加聲紋識別評測,與國內外頂尖的高校、科研機構、公司交流學習。比賽成績一直在國內保持第一,國際上也處于領先水平。2002、2008、2010年和2012年,獲多項全球第一。年份成績2002第一次參加就獲得第一(金星獎)20042項第一、4項第二20052項第一、2項第二2008總名次第一2010總名次第一2012總名次第一NISTSRE08縱軸指標越低越好我們團隊MITPersay斯坦福中科院自動化所IBM清華大學NIST10參賽單位數量和質量均創歷史之最。國內外報名單位達五十多家,如斯坦福、麻省理工學院、IBM、香港中文大學、意大利都靈理工大學、科大訊飛、清華、中科院聲學所、卡耐基梅隴大學等。所有參賽單位共提交了109個系統。歷屆評測活動中數據規模最大、信道交叉種類最多,難度最高。斯坦福MIT中科院聲學所CRIM清華大學香港中文大學我們團隊NISTSRE10
單位名稱子任務1子任務2子任務3子任務4子任務5子任務6子任務7子任務8我們團隊第一名第一名第一名第2名第4名第6名第一名第一名斯坦福97511128意大利都靈理工大學26652833MIT電腦及人工智能實驗室23133323971517美國馬里蘭大學1611131320152522中科院聲學所363782910142221香港中文大學313317731262015IBM研究中心34322357163840清華大學電子工程系3741463637233535浙江大學計算機學院4444404442414141云知聲聲紋識別最新性能相比2010年系統加入最新的噪聲抑制和VAD算法加入最新的模型構建及失配補償技術iVector+lengthNormalization+Variance-SpectraNormalization+PLDANIST2010core-extenddet5(tel)NISTSRE12官方結果斯坦福我們團隊cogent清華3浙大中科院聲學所Nuance+LPT清華1訊飛騰訊清華2IBM香港理工清華深圳研究院云知聲公司介紹1.成長最快的語音企業2.完整的產品體系
3.卓越的技術研發和創新能力專注于語音交互所有技術、產品與服務均圍繞著語音識別與語音交互,是最專業的語音交互技術服務提供商。依托于移動互聯網,了解用戶通過智能語音云對用戶極為了解,包括用戶的口音、性別、說話習慣、使用環境等。等。打破壟斷、高速發展云知聲成立不到兩年,被譽為行業鯰魚,打破壟斷格局,高速發展,合作伙伴超過6000家。最專業的語音交互服務提供商云知聲成立于2012年6月29日。總部位于北京,在上海、深圳設有分公司和辦事處。目前云知聲已推出了一系列語音識別服務中間件和語音識別服務云平臺,廣泛應用在移動互聯網、智能家電、可穿戴設備、車載導航、醫療、教育、呼叫中心等領域,為企業和用戶提供專業的語音識別服務。21云知聲人是一支多元化的團隊,年輕富有活力。基礎研發工程師80%擁有博士學位,多人具有超過十年的研發和應用經驗。產品和市場運營人員來自國內外知名互聯網企業。公司成立不到500天,完成1億人民幣的A輪融資。云知聲語音云已有超8000家合作伙伴,覆蓋互聯網、智能家電、車載導航、智能穿戴、在線教育、智能客服、智能芯片等眾多領域。領先的識別性能、穩定的識別服務、便捷的技術支持、快速增長的合作伙伴。云知聲和您一起共贏。實力雄厚,發展迅速多元化團隊1億8000家22專業所有技術、產品與服務均圍繞著語音識別與語音交互,是最專業的語音交互技術服務提供商創新開放共贏依托于移動互聯網,模式創新不限領域、不限形態、不限商業模式和合作伙伴一起,攜手共贏23超大用戶容量支持億級用戶規模億級平臺健壯穩定>99.99%服務可用性>99.99%快速響應3G/WIFI下平均響應100ms<100ms語音識別占用極低流量<2KB/s<2KB/s語音平臺性能卓越通用汽車以上展示僅為部分成功案例
傳統企業智能終端移動互聯網
移動
應用基于語音云的示例應用——云知聲語音輸入法應用場景:移動互聯網-智能語音輸入軟件功能特點:語音識別準:平均準確率超過95%;離線語音識別:信號不好或無網絡時用戶可自由切換到離線識別,有較高的識別率保證;支持多語種:可識別普通話、英語、粵語三種語言;識別反應快:Wi-Fi或3G下幾乎實時返回識別結果;語音輸入快:每分鐘輕松輸入200-300字,非語音輸入方式望塵莫及;不怕有口音:完美識別標準普通話及有口音的普通話;超省流量:輸入100字只需要20-40kB流量,1M流量可輸入2500字;自動加標點:智能引擎根據用戶輸入內容為用戶添加必要的標點符號;掃碼即刻下載使用26
移動
應用聯想樂云記事應用場景:移動互聯網-智能云筆記軟件功能描述:樂云記事是聯想推出的萬能記事本。結合文字、拍照、錄音等,全方位記錄您的生活、工作或學習。語音自動識別成文字,讓手機聽懂你,化身小助理。記錄安全保存云端,手機、電腦一樣看。應用特點:云知聲為樂云記事提供智能語音解決方案。顛覆以往云記錄應用的錄音功能,錄音的同時即可轉為文字,語義識別,識別用戶想做的事,自動設為代辦事項,并進行提醒。掃碼即刻下載使用27
移動
應用杏樹林-病歷夾應用場景:智能醫療、電子病歷功能描述:能有效幫助醫生快速記錄病歷,把醫生朋友從“病歷海”中解放出來,有更多的時間和精力用于問診和學習節省寶貴的人力成本,提高生產力。應用特點:云知聲研發的國內醫學領域首個語音識別引擎針對醫學數據庫(數百萬的醫學專有名詞、數千小時的語料積累、極其復雜的中英文混合表述方式)做了大量模型優化對醫學專業內容的一次性識別率達到93%,同時輔以云端語義校正技術,整體識別率接近100%掃碼即刻下載使用28
智能
電視樂視超級電視應用場景:智能電視、電視盒子,顛覆你的客廳功能描述:通過超級遙控器的語音功能,讓你無需動手也能遙控電視。海量視頻,拋開復雜拼音輸入,所說即所得。更多功能隨心語控,輕松換臺、調節音量、看節目單、了解天氣、查看股票,只動嘴、無需動手。應用特點:云知聲和你一起擁抱智能化、信息化、智慧化的家電時代顛覆了傳統操作體驗,真正把互聯網和智能語音“植入”進電視里完美支持iPhone,Android手機與電視連接,任何空閑時間、任何地點都可以追劇。29
智能
電視樂視語音助手應用場景:智能電視、電視盒子,顛覆你的客廳功能描述:電視也能玩Siri!智能語音輸入,無需動手也能操控超級電視。電視上也能通過語音發微博、查股票、搜影視、調音量、看節目、查天氣。應用特點:對電視進行常用的操作,無論上網與否都能實現語音控制。30智能車載通用汽車應用場景:智能車載功能描述:NGI車載平臺基于WIFI熱點向用戶提供互聯網服務。應用特點:云知聲為NGI車載平臺所有智能應用提供語音交互支持提供語音識別及語音合成兩套方案基于WebService提供服務,系統集成及其簡單提供靈活及高效率的語音壓縮及傳輸方案31智能車載奔騰ARS車載智能終端應用場景:智能車載功能描述:導航相關:“我要去陸家嘴”,“我要找最近的加油站”生活信息服務
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025公司安全管理人員安全培訓考試試題附完整答案【有一套】
- 2025-2030年中國車庫起重設備行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國超級濃縮洗滌劑行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國敗血癥合作行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國諧波傳動精密齒輪減速器行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國設立醫院行業發展分析及發展前景與趨勢預測研究報告
- 2025-2030年中國角豆樹行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國西門尼亞美洲籽油行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國補腎藥物行業市場深度分析及前景趨勢與投資研究報告
- 2025-2030年中國蝦青素軟糖行業市場現狀分析及競爭格局與投資發展研究報告
- 影視文化試題及答案解析
- 施工現場安全施工方案
- DB63T2004-2021 瀝青路面就地冷再生基層技術規范
- 華為結構面試題及答案
- 第7講 隋唐時期經濟發展與文化繁榮 課件【知識提要】高三歷史統編版一輪復習
- 2025年遼寧省盤錦市興隆臺區遼河油田實驗中學中考二模化學試題(含答案)
- 高職高專英語教材電子版單選題100道及答案
- 杭州銘赫科技有限公司新增年產1260萬件精密粉末冶金零部件技術改造項目環評報告
- 2025年初級會計職稱考試試卷及答案
- (二模)2025年4月濰坊市高三高考模擬考試語文試卷(含答案)
- 2025-2030中國柴油機旋轉UPS(DRUPS)行業市場發展趨勢與前景展望戰略研究報告
評論
0/150
提交評論