




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
中國電子工業標準化技術協會
一、工作簡況
(一)產品和行業發展情況
智能字符識別(IntelligentCharacterRecognition,ICR)是利用人工智能技術,提
供手寫字符識別、識別結果增強、端到端檢測識別等能力的OCR技術,以實現對圖像中的字
符識別并將其轉換成二進制代碼,便于機器讀取和應用。相較于傳統OCR,ICR不僅用于復雜
自然場景中印刷、手寫等各類文本字符的識別,還可以對文件中的結構化對象進行識別和編
碼,例如表格欄、非文字的圖等。并且對于識別準確率和速度方面有大幅提升。
隨著圖像處理技術不斷進步,特別是近年來人工智能理念和技術的應用,直接促進了ICR
技術及相關產品和服務的快速應用發展。以機器學習為代表的AI技術,將深度神經網絡應用
于文字對象檢測、字符切分、字符識別的一系列技術流程,為ICR提供了圖文識別的高準確
率和速度;同時,ICR作為一種從像素/柵格文本到機器易讀的數字文本轉換技術,已成為AI
系統多模態數據采集和分析的重要手段之一。
目前,市場上出現了各種各樣基于AI的ICR應用以及基于ICR的AI應用。然而,由于缺少
針對ICR的功能、性能及其試驗方法等技術要求的統一標準,相關產品和服務的技術能力和
質量水平參差不齊,一方面不僅導致了重復研發的成本加大,另一方面也對基于AI的ICR產
品和服務市場以及基于ICR的AI系統應用質量提出了挑戰,不利于產業正常發展。為解決上
述問題,目前亟需制定ICR技術要求和結果評價的國家統一標準,為規范市場準入、保障用
戶權益、提高市場整體質量,提供標準依據;為整合產學研力量、促進人工智能產業發展,
提供標準引領
(二)任務來源
2022年2月21日,中國電子工業標準化技術協會下達2022年第一季度第一批團體標準,
擬研制《人工智能智能字符識別技術規范》相關標準。本標準為自主制定標準,計劃編號
為CESA-2022-1-004,歸口單位為中國電子技術標準化研究院,由騰訊云計算(北京)有限
責任公司、華為技術有限公司牽頭組織編制。
(三)標準主要起草單位
中國電子工業標準化技術協會
本標準起草單位:中國電子技術標準化研究院、騰訊云計算(北京)有限責任公司、華
為技術有限公司、云從科技集團股份有限公司、西安深信科創信息技術有限公司、美的集團
(上海)有限公司、北京百度網訊科技有限公司、深圳市矽赫科技有限公司、北京曠視科技
有限公司、杭州海康威視數字技術股份有限公司、浙江大華技術股份有限公司、上海計算機
軟件技術開發中心、上海依圖網絡科技有限公司、上海商湯智能科技有限公司、馬上消費金
融股份有限公司、北京九章云極科技有限公司、西北工業大學、上海人工智能研究院有限公
司。
(四)標準主要起草人
本標準主要起草人及具體分工如下:馬珊珊、楊曉光、蔡亞森(標準整個流程和資料編
寫);馬萬忠、王彭、劉皓、李笑如、徐浩、劉志強、程戰戰(整體技術部分編寫);李軍、
劉志強、田富康、梅敬青(第4章);王光夫、胡蓉、毛玉婷(第5章);劉坤、陳媛媛、王
鵬(第6章);張小寶、洪鵬達、陳敏剛、馬澤宇、陳文捷(第7章)。
(五)主要工作過程
2021年12月1日,聯合發起單位、確定對該項標準進行研制,并公開征集參編單位。
2021年12月15日,第一次標準編制討論會,標準參編單位對各標準的立項材料進行編寫
討論,并對標準草案進行編寫討論。
2021年12月24日,第二次標準編制討論會,對標準草案進行編寫討論。
2022年1月12日,立項評審會,標準立項評審。
2022年2月21日,中國電子工業標準化技術協會下達2022年第一季度第一批團體標準計
劃,擬研制《人工智能智能字符識別技術規范》相關標準。
2022年3月15日,第三次標準編制討論會,起草組對標準草案的修改進行討論。
2022年4月6日,對前期的意見進行修改,形式征求意見稿。。
二、標準編制原則和確定主要內容的論據及解決的主要問題
1、編制原則
先進性原則:本標準的制定與當前人工智能大趨勢相匹配,為用戶、市場的規范化提供
基礎,為人工智能領域的發展提供標準支撐。
實用性原則:本標準制定時充分分析了眾多應用領域對人員追蹤的需求,標準制定著
力于解決用戶、廠商實際應用中的共同問題,引導用戶、廠商針對產品能力達成一致預期,
在實際項目中可直接落地應用。
中國電子工業標準化技術協會
可擴展性原則:本標準中在設計的時候,充分考慮到標準的可擴展性,可保證各廠商
在使用時兼顧規范性的同時具備可擴展能力。
2、確定主要內容的論據
主要內容:本標準規定了基于人工智能的字符識別技術框架、功能和性能要求、測試評
價方法。
適用范圍:本文件適用于智能字符識別產品和服務的設計、開發、應用和測試評價。
3、主要解決的問題
目前,硬件設備廠商、軟件廠商、云服務提供商提供了從終端設備、軟件、云SAAS服務
等ToB、ToC不同形態的智能字符識別產品或服務。早期的OCR系統,由于識別率及產品化
等多方面的因素,未能達到實際要求;同時,由于硬件設備成本高,運行速度慢,也沒有達
到實用的程度。
由于缺少針對ICR的功能、性能及其試驗方法等技術要求的統一標準,相關產品和服務
的技術能力和質量水平參差不齊,一方面不僅導致了重復研發的成本加大,另一方面也對基
于AI的ICR產品和服務市場以及基于ICR的AI系統應用質量提出了挑戰,不利于產業正常發
展。為解決上述問題,目前亟需制定ICR技術要求和結果評價的統一標準。
同時存在對ICR(智能字符識別)術語、定義描述不明晰,與OCR容易混淆、技術指標不
一致,沒有統一評測方法,行業用戶選型困難等難題。
三、主要試驗[或驗證]情況分析
無。
四、知識產權情況說明
無。
五、產業化情況、推廣應用論證和預期達到的經濟效果
該標準目前情況如下:
1)(法規符合)標準符合相應國家法律文件要求;
2)(應用面廣、用戶數量龐大)現已廣泛在金融、交通、醫療、電力、教育等行業應
用;
3)(中立/經驗豐富)CESA有豐富的技術試驗籌備、實施經驗;
4)(產業參與)國內智能字符識別的設備廠商、軟件服務商、云服務商代表都有參與。
中國電子工業標準化技術協會
六、采用國際標準和國外先進標準情況
目前國際標準化工作主要集中在:
a)傳統OCR基礎領域,一方面包括通用術語標準和應用領域的OCR和ICR術語和定義,另
一方面包括OCR的載體字符集及其編碼。
b)關聯到OCR應用的相關技術,例如JTC1/SC17卡和身份識別分委會制定的部分標準,
表明了其技術內容可應用于諸如磁條、OCR、條形碼、非接觸式機讀等,但并未針對OCR系統
或技術要求作出規范。
c)傳統OCR測試技術,針對OCR質量的測試方法、參數和分級制定了標準,而沒有對OCR
系統的技術要求和基準進行規范。
在國際標準組織中,專門針對此類標準尚屬空白。已有的OCR國際標準與本標準的區別
如下:
標準名稱標準內容,與本標準的區別
ISO1831:1980包括OCR紙張和印刷品的基本定義、測量要求、規格和建議,并處理OCR介質
的三個主要參數:紙張的光學特性;用作OCR字符的油墨圖案的光學特性和尺
光學字符識別印刷規范寸;紙上OCR字符位置的基本要求。
ISO2033:1983定義了讀取設備識別的印刷字符的編碼表示。包括字體E13B;CMC7;OCR-A;
OCR-B。為讀取設備識別的字符分配位模式。該信息然后通過不同的介質提供給
信息處理-機器可讀字符的編接收者,并且可由打印設備使用。
碼(MICR和OCR)
ISO12656:2001本國際標準規定了孔卡上編碼的類型、尺寸和位置
顯微圖像——在孔徑卡上使用符合ISO3272-3。
條形碼
本國際標準適用于OCR字符、條形碼、Hollerith和印刷的Hollerith代碼。
不適用于壓縮條形碼
ISO/IEC30116:2016-規定了測量OCR-B字符串特定屬性的方法,
信息技術—自動識別和數據采-定義了評估這些測量值和得出字符串質量的整體評估的方法,
集技術—光學字符識別(OCR)
質量測試-定義OCR-B的參考解碼算法,以及
-提供有關偏離最佳等級的可能原因的信息,以幫助用戶采取適當的糾正措施
中國電子工業標準化技術協會
七、與現行相關法律、法規、規章及相關標準的協調性
本標準與現行法律、法規、強制性國家標準,特別與信息技術相關的《網絡安全法》、
《數據安全法》、《個人信息保護法》無沖突;
《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》提出
“十四五”期間將通過一批具有前瞻性、戰略性的國家重大科技項目,帶動產業界逐步突破
前沿基礎理論和算法,研發專用芯片,構建深度學習框架等開源算法平臺,并在學習推理決
策、圖像圖形、語音視頻、自然語言識別處理等領域創新與迭代應用。推進智能醫療裝備、
智能運載工具、智能識別系統等智能產品制造。
《國家新一代人工智能標準體系建設指南》中關鍵領域技術標準建設重點:
自然語言處理標準。重點開展光學字符識別、詞于提取、詞向量化、詞性標注及描述等
語言信息提取標準,智能分詞、文本語種識別、詞法分析、句法分析、語法分析、內容相關
度分析、情感分析等文本處理標準,大規模智能語義庫、語義數據、語義接口、語義標簽、
語義理解、語義表達的框架和模型、數據格式、形式化表達等語義處理標準,自動問答,機
器翻譯的系統架構、模型、技術要求和評價等應用擴展標準研制。
計算機視覺標準。重點開展圖像傳感設備、芯片、網絡設施等視覺設施設備標準,視覺
數據庫、數據描述、數據格式、視頻接口、形狀及空間建模等數據及模型標準,圖像識別、
圖像語義處理、圖像合成鑒別等圖像識別與處理標準研制。
八、重大分歧意見的處理經過和依據
無。
九、標準性質的建議
目前,ICR技術已在金融、保險、醫療、交通、教育等諸多行業有了深入成熟的應用。
未來隨著傳統行業的數字化轉型,ICR應用范圍和場景將進一步擴展,市場規模將進一步增
大。據預測,2025年全球ICR市場規模將達到133.81億美元。在構建數據中國、數字政府過
程中發揮重要的作用,迫切需要行業標準的指引和規范。
十、貫徹標準的要求和措施建議
標準的實施可實現產業內的統一探討,形成產業共認的標準規范,推動人工智能及計算
機視覺領域相關技術的良性合作和發展,具有不可取代的支撐作用。
待團體標準正式發布后,可以通過各級組織及科研單位進一步宣傳貫徹和實施,推動各
級各類高校、科研機構、企事業單位在開發人員追蹤系統時采用本標準。
中國電子工業標準化技術協會
本標準密級為“公開”,目的是最大效能地在團體內、外推廣應用。
十一、替代或廢止現行相關標準的建議
無。
十二、其它應予說明的事項
無。
《人工智能智能字符識別技術規范》
團體標準編制工作組
2022年4月6日
中國電子工業標準化技術協會
一、工作簡況
(一)產品和行業發展情況
智能字符識別(IntelligentCharacterRecognition,ICR)是利用人工智能技術,提
供手寫字符識別、識別結果增強、端到端檢測識別等能力的OCR技術,以實現對圖像中的字
符識別并將其轉換成二進制代碼,便于機器讀取和應用。相較于傳統OCR,ICR不僅用于復雜
自然場景中印刷、手寫等各類文本字符的識別,還可以對文件中的結構化對象進行識別和編
碼,例如表格欄、非文字的圖等。并且對于識別準確率和速度方面有大幅提升。
隨著圖像處理技術不斷進步,特別是近年來人工智能理念和技術的應用,直接促進了ICR
技術及相關產品和服務的快速應用發展。以機器學習為代表的AI技術,將深度神經網絡應用
于文字對象檢測、字符切分、字符識別的一系列技術流程,為ICR提供了圖文識別的高準確
率和速度;同時,ICR作為一種從像素/柵格文本到機器易讀的數字文本轉換技術,已成為AI
系統多模態數據采集和分析的重要手段之一。
目前,市場上出現了各種各樣基于AI的ICR應用以及基于ICR的AI應用。然而,由于缺少
針對ICR的功能、性能及其試驗方法等技術要求的統一標準,相關產品和服務的技術能力和
質量水平參差不齊,一方面不僅導致了重復研發的成本加大,另一方面也對基于AI的ICR產
品和服務市場以及基于ICR的AI系統應用質量提出了挑戰,不利于產業正常發展。為解決上
述問題,目前亟需制定ICR技術要求和結果評價的國家統一標準,為規范市場準入、保障用
戶權益、提高市場整體質量,提供標準依據;為整合產學研力量、促進人工智能產業發展,
提供標準引領
(二)任務來源
2022年2月21日,中國電子工業標準化技術協會下達2022年第一季度第一批團體標準,
擬研制《人工智能智能字符識別技術規范》相關標準。本標準為自主制定標準,計劃編號
為CESA-2022-1-004,歸口單位為中國電子技術標準化研究院,由騰訊云計算(北京)有限
責任公司、華為技術有限公司牽頭組織編制。
(三)標準主要起草單位
中國電子工業標準化技術協會
本標準起草單位:中國電子技術標準化研究院、騰訊云計算(北京)有限責任公司、華
為技術有限公司、云從科技集團股份有限公司、西安深信科創信息技術有限公司、美的集團
(上海)有限公司、北京百度網訊科技有限公司、深圳市矽赫科技有限公司、北京曠視科技
有限公司、杭州海康威視數字技術股份有限公司、浙江大華技術股份有限公司、上海計算機
軟件技術開發中心、上海依圖網絡科技有限公司、上海商湯智能科技有限公司、馬上消費金
融股份有限公司、北京九章云極科技有限公司、西北工業大學、上海人工智能研究院有限公
司。
(四)標準主要起草人
本標準主要起草人及具體分工如下:馬珊珊、楊曉光、蔡亞森(標準整個流程和資料編
寫);馬萬忠、王彭、劉皓、李笑如、徐浩、劉志強、程戰戰(整體技術部分編寫);李軍、
劉志強、田富康、梅敬青(第4章);王光夫、胡蓉、毛玉婷(第5章);劉坤、陳媛媛、王
鵬(第6章);張小寶、洪鵬達、陳敏剛、馬澤宇、陳文捷(第7章)。
(五)主要工作過程
2021年12月1日,聯合發起單位、確定對該項標準進行研制,并公開征集參編單位。
2021年12月15日,第一次標準編制討論會,標準參編單位對各標準的立項材料進行編寫
討論,并對標準草案進行編寫討論。
2021年12月24日,第二次標準編制討論會,對標準草案進行編寫討論。
2022年1月12日,立項評審會,標準立項評審。
2022年2月21日,中國電子工業標準化技術協會下達2022年第一季度第一批團體標準計
劃,擬研制《人工智能智能字符識別技術規范》相關標準。
2022年3月15日,第三次標準編制討論會,起草組對標準草案的修改進行討論。
2022年4月6日,對前期的意見進行修改,形式征求意見稿。。
二、標準編制原則和確定主要內容的論據及解決的主要問題
1、編制原則
先進性原則:本標準的制定與當前人工智能大趨勢相匹配,為用戶、市場的規范化提供
基礎,為人工智能領域的發展提供標準支撐。
實用性原則:本標準制定時充分分析了眾多應用領域對人員追蹤的需求,標準制定著
力于解決用戶、廠商實際應用中的共同問題,引導用戶、廠商針對產品能力達成一致預期,
在實際項目中可直接落地應用。
中國電子工業標準化技術協會
可擴展性原則
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Leucomycin-A6-生命科學試劑-MCE
- 2025年中期美股策略觀點:溢價收斂龍頭為先
- 農業農村土地制度改革與土地流轉政策研究報告
- 量子密鑰分發在工業互聯網平臺中的數據加密效率優化報告
- 金融行業數據治理與隱私保護在金融大數據分析中的應用報告
- 文化藝術中心建筑2025年初步設計可持續發展評估報告
- 2025年農業綠色生產模式與新型農業經營主體培育策略研究報告
- 工業互聯網平臺安全多方計算在智能制造領域的應用案例分析報告
- 基于監管視角的美國次貸危機成因分析及其對我國的啟示
- 國立高雄大學東亞語文學系‘近(現)代史’第7堂明治國際關系大正
- 國開作業《公共關系學》實訓項目3:社區關系建設(六選一)-實訓項目二社區關系建設方案-參考(含答案)98
- 《歷史文化名城名鎮名村保護規劃編制要求》
- 現場工程量確認單
- 《數據科學與大數據技術導論》完整版課件(全)
- 2022年廣東省佛山市順德區承德小學小升初數學試卷
- 申請人申請仲裁送達信息確認書
- 黃亮和李燕的創業故事(鳳山書屋)
- (完整版)生物同源性荷爾蒙替代療法課件
- 福建跨學科四門主干課程作業及答案小學語文
- 燃氣輸配課程設計報告書
- DB61∕T 5006-2021 人民防空工程標識標準
評論
0/150
提交評論