




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一、工作概況
(一)產品和行業發展情況
隨著自然語言處理技術不斷進步,機器翻譯系統和相關技術也得到飛速發展。
特別是近年來,人工智能理念和技術的應用直接促進了機器翻譯系統及相關產品
發生了翻天覆地的變化。總體上,機器翻譯的變化源于三方面:從基于規則、到
基于統計模型、到基于神經網絡,從基于詞、到基于短語、到基于整句,從必須
使用大規模平行語料庫、到可以使用單語語料庫、到實現零數據翻譯。由此而誕
生的智能機器翻譯系統也加速了人工智能理念和技術的落地。從單純的文本輸入、
到語音輸入、到OCR識別,從PC端的個人用電子辭典、到移動終端的面對面
交流用翻譯APP、到大型會議上“云+端”模式的實時翻譯系統,從字詞翻譯、
到自然語言意譯、到滿足文化、情感和專業領域需求的交流翻譯。可以說,機器
翻譯的智能化是當前人工智能各項技術最具代表性的應用之一。
當前,全球貿易自由化已成為世界大多數國家的共識。隨著中國“一帶一路”
戰略的建設和習近平總書記關于“構建人類命運共同體”的倡議,不同語言之間
交流的成為實現國際交流的前提、基礎和重要內容,市場需求巨大。目前,市場
上出現了各種各樣的智能機器翻譯系統,然而,種類繁多的產品和服務究竟有多
少能真正達到智能化水平,仍然缺少統一的評判標準依據,難以保證機器翻譯智
能化產品和服務的高質量要求,極易導致基于人工智能的機器翻譯市場魚目混雜、
劣幣驅逐良幣,阻礙人工智能產業的正常發展。
綜上所述,目前亟需制定人工智能機器翻譯智能能力等級評估的國家和行業
內統一標準,為規范市場準入、保障用戶權益、提高市場整體質量,提供標準依
據;為整合產學研力量、促進人工智能產業發展,提供標準引領。
(二)標準情況
國際方面,根據在ISO、IEC和ITU-T三大國際標準化機構上的檢索,在機
器翻譯方面,國際上標準化工作集中于翻譯技術和服務本身,涉及的標準化技術
組織包括:ISO/TC37/SC5Translation,interpretingandrelatedtechnology,
ISO/IECJTC1/SC35Userinterfaces,ITU-T/SG16Multimedia;在人工智能方
2
面,國際標準化組織ISO/IECJTC1/SC42Artificialintelligence正在進行人工智
能基礎、算法、系統和可信賴方面標準化研究。目前,本標準項目尚未有對應的
國際標準或國外先進標準,可爭取國際標準化研究和立項;
國內方面,根據在國家標準委全國標準信息公共服務平臺的檢索,在翻譯方
面,國家標準化工作集中于翻譯服務和質量要求,已發布實施了GB/T
19363.1-2008翻譯服務規范第1部分:筆譯,GB/T19363.2-2006翻譯服務
規范第2部分:口譯,GB/T19682-2005翻譯服務譯文質量要求。這些標準年
代較為久遠,并且以人工翻譯為對象,尚未有機器翻譯評價的國家標準。
(三)任務來源
2018年9月14日,中國電子工業標準化技術協會下達2018年第四季度第
一批團體標準,擬研制《信息技術人工智能機器翻譯智能能力等級評估》相關
標準。本標準為自主制定標準,計劃編號為CESA-2018-4-006,歸口單位為中國
電子技術標準化研究院,由中國電子標準化技術研究院聯合科大訊飛股份有限公
司牽頭組織編制。
(四)主要工作過程
1.準備階段
2018年6月,項目立項并籌備組織開展標準的制定工作;
2018年7月,召開工作組啟動會議,標準工作組提交工作計劃及人員組
成等方案;
2018年8月,進入調研階段,標準編制組前期以資料調研方式,收集相
關標準、項目文檔進行大綱設計;
2.立項階段
2018年9月,標準編制組以標準大綱草案為基礎,進行立項論證,通過
立項;
3.起草階段
2018年10月,標準編制組經過多次研究和討論,充分聽取各單位的意
見并研究相關資料;形成標準草案稿;召開兩次工作組內部標準草案稿的工作組
研討會,標準編制組針對研討會上的相關問題;
2018年11月上旬,明確標準的各模塊內容,對草案完善并形成征求意
3
見稿;
4.征求意見階段
2018年11月中旬,標準編制組完成標準征求意見稿、編制說明;
擬于2018年11月下旬,進行標準征求意見,并征求知名企業函審意見,
后續根據專家意見對標準進行進一步完善。
二、標準的制定原則
1.嚴謹性
本標準嚴格按照GB/T1.1的規定編寫,且確保與國家標準、行業標準中的
術語和詞匯保持一致,采用國際或國家標準中規定的術語和廣大用戶熟悉的詞匯。
2.合理性
本標準選取行業內公認的指標,對不同指標按照行業內專家的意見綜合確定
其權重,并對計算方法等進行了規定。
3.可操作性
本標準遵循可操作性原則,計算方法和評價過程均盡量滿足可操作可具體實
踐的要求。
三、主要技術內容說明
(一)標準主要內容和適用范圍
本標準規定了機器翻譯智能能力等級評估中機器翻譯概念模型,機器翻譯系
統模型,機器翻譯智能能力指標及計算方法,機器翻譯智能能力等級劃分和機器
翻譯智能能力等級評估要求。
本標準適用于機器翻譯系統的產品和服務的智能能力等級劃分與評估。
主要內容:
指標評估可采用專家評價、材料檢查、技術測試等方式進行,其中,
——采用技術測試的指標項包括:忠實度、流利度、綜合差錯率;
——采用技術測試和材料檢查相結合的指標項包括:交互能力、文檔翻譯能
力、多語種翻譯能力、網絡連接、翻譯模式;
——采用專家評價的指標項包括:語用符合性、文化符合性、情感符合性。
根據評估指標體系和指標項,運用綜合評分法對機器翻譯智能能力得分
(MTS)進行計算,計算公式見式(1)。
4
機器翻譯智能能力得分×(1)
其中,Pi為第i項指標的=權 主站蜘蛛池模板: 桐乡市| 项城市| 广饶县| 冷水江市| 思南县| 岗巴县| 松溪县| 巴东县| 泾川县| 从江县| 泾源县| 融水| 昔阳县| 桦南县| 镇远县| 湖北省| 田东县| 涟源市| 雷波县| 黔西| 贵南县| 聂拉木县| 基隆市| 西乡县| 江川县| 永顺县| 长汀县| 正定县| 蒙自县| 芜湖市| 体育| 塔城市| 南部县| 南康市| 交城县| 城步| 神农架林区| 竹溪县| 鄂温| 饶平县| 辽中县|