




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1硅藻檢驗技術規范基于人工智能技術的自動化方法本文件規定了基于人工智能技術的法醫學硅藻檢驗自動化方法,包括方法原理、儀器設備和檢驗步本文件適用于由人工智能模型完成的法醫學尸體器官組織、體液及水樣硅藻的定性、定量及分類檢2規范性引用文件下列文件中的內容通過文中的規范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件:不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GA/T813人體組織器官中硅藻硝酸破機法檢驗GA/T1662法庭科學硅藻檢驗技術規范微波消解-真空抽濾-顯微鏡法3術語和定義下列術語和定義適用于本文件。具有硅質細胞壁的水生單細胞藻類。4縮略語下列縮略語適用于本文件。CPU:中央處理器(CentralProcessingUnit)CUDA:計算統一設備架構(CoaputeUnifiedDeviceArchitecture)DPI:每英寸點數(DotsPerInch)HOG:方向梯度直方圖(HistogranofOrientedGradient)JPG:聯合圖片組(JointPictureGroup)LBP:局部二值模式(LocalBinaryPattern)PNG:便攜式網絡圖像(PortableNetworkGraphics)TIF:標簽圖像文件格式(TagInageFileFormat)5方法原理通過數字化病理學技術將實體樣本底物轉換成高分辨率圖像數據:應用人工智能算法對數字化圖像中的硅藻區域進行自動化識別和科屬分類:根據人工智能算法統計的硅藻數量及科屬分類結果并結合人工確認,完成法醫學硅藻的定性、定量及分類檢驗工作。6儀器設備3d)獲取的圖像樣本可進行像素大小調整,使圖像大小符合人工智能模型的輸入規格,可選擇對圖像樣本像素進行預處理(如均一化和灰度化等),用于降低同一數據源中各圖像樣本之間的像素差異性,提高模型的泛化能力。數據庫圖像樣本.1在數據庫單張圖像樣本中,目標硅藻區域與實際完整硅藻面積比例應不低于30%。.2數據庫圖像樣本可根據背景及不同科屬硅藻分成多組數據集,每組數據集包含原始圖像應不少于5000張,且每張圖像樣本擁有相應分組標簽信息。.3各組數據集圖像數量應將組間數量差距保持在20%以內。7.1.2人工智能模型訓練訓練目的人工智能模型的訓練目的在于針對特定(如識別和分類)任務利用數據庫中的大量數據樣本對智能化模型進行模式特征學習。經學習后的模型可用于訓練數據以外的同類型、同分布數據的準確、客觀預測。人工智能模型的特定任務取決于數據庫的性質。其中,識別數據集主要用于訓練將硅藻與背景雜質相區分的模型架構,而分類數據集則用于訓練區分不同科屬硅藻的模型架構。訓練方法.1在基于端到端的模型訓練中,所采用的模型架構(如深度學習模型)直接從圖像樣本中提取相關特征信息用于模型內部參數的擬合和校正。.2基于分治法的模型訓練應借助額外方法先提取圖像中的特征信息,形成向量數據后才可用于模型(如一般機器學習模型)內部參數的擬合和校正。.3基于端到端的模型訓練基于端到端的模型訓練應在符合6.2規定的數字計算機上完成,具體如下。a)采用的人工智能模型算法應涉及卷積人工神經網絡、目標識別算法以及其他可用于圖像特征自動化提取的模型架構。b)應將數據庫圖像樣本按適當比例設置訓練、驗證和測試樣本集。其中:1)訓練樣本集、驗證樣本集和測試樣本集中的數據分布應保持一致;2)訓練樣本集和驗證樣本集分別用于模型的訓練和訓練過程中的模型效能監測和評估,測試樣本集則用于模型訓練完畢后的性能泛化指標評價;3)圖像樣本來自于不同個體或實體底物樣本,為防止數據泄漏,來自于同一個體或實體底物樣本中的圖像樣本應被分配到相同樣本集中。c)可對訓練樣本集中的圖像樣本進行擴增,包括圖像翻轉、圖像旋轉、隨機調整圖像對比度及亮度等。d)將擴增后的.3c)圖像樣本用于模型的迭代訓練,每次迭代獲得的模型對驗證樣本集中的圖像樣本進行預測。e)根據模型驗證樣本預測結果及其對應的真實分組標簽,計算目標損失函數值用于評估每次迭代的模型預測效能。f)當目標損失函數值隨著迭代次數增加而趨于穩定時,為防止模型過擬合的出現,可在目標損失函數值趨于穩定的迭代臨界點后10次~50次獲取相應最優模型。.4基于分治法的模型訓練基于分治法的模型訓練應在符合6.2規定的數字計算機上完成,具體如下。a)采用的人工智能模型算法應涉及一般機器學習模型(如偏最小二乘法、支持向量機、隨機森林和感知器人工神經網絡等)以及其他不能直接處理圖像矩陣數據的模型架構。b)應將數據庫圖像樣本按適當比例設置訓練、驗證和測試樣本集。其中:1)訓練樣本集、驗證樣本集和測試樣本集中的數據分布應保持一致;42)訓練樣本集和驗證樣本集用于模型的訓練和訓練過程中的模型效能監測和評估,測試樣本集則用于模型訓練完畢后的性能泛化指標評價:3)圖像樣本來自于不同個體或實體底物樣本,為防止數據泄漏,來自于同一個體或實體底物樣本中的圖像樣本應被分配到相同數據集中。c)可對訓練樣本集中的圖像樣本進行擴增,包括圖像翻轉、圖像旋轉、隨機調整圖像對比度及亮d)通過特征提取方法(如深度學習特征提取模型、HOG特征提取算法和LBP特征提取算法等)獲取圖像樣本中的特征數據并將這些特征數據整合成向量數據。每個圖像樣本的向量數據維度及特征排列次序應保持相同。e)如特征提取方法涉及深度學習模型,其內部參數可通過訓練和驗證圖像樣本并結合特定損失函數予以事先擬合和校正。f)訓練樣本的向量數據應用于人工智能模型架構的參數擬合,同時結合網格搜索方法確認模型最佳超參數組合并獲得候選模型。8)應用候選模型預測驗證樣集中圖像樣本的向量數據并計算分類準確率,準確率高于0.9時可將其確認為最優模型。對于給定的數據集,正確預測的正例樣本與被預測為正例的樣本比率,見公式(1)。TPFP——實際是負例但被預測為正例的樣本對于給定的數據集,正確預測的正例樣本與實際為正例樣本的比率,見公式(2)。FN實際是正例但被預測recall——查全率。對于給定的數據集,正確分類的樣本數占總樣本數的比率,見公式(3)。TP——實際是正例且被預測為正例的樣本數量;TN——實際是負例且被預ALL—所有樣本的數量;accuracy——準確率。模型查準率和查全率的一種加權平均,也是一種綜合評價指標,見公式(4)。5式中:recall——查全率;precision——查準率;表示預測正例排在負例前面的概率,用于評估模型的分類效能。模型的內部評價模型的內部評價應在符合6.2規定的數字計算機上完成,具體如下:a)應用最優模型對測試樣本集進行預測。如采用基于分治法的模型架構,測試樣本集應進行特征提取形成向量數據后才可輸入至人工智能模型。特征提取方法應與模型訓練時采用的特征提取方法相一致:b)應根據測試樣本集預測結果及其對應的真實分組標簽,計算準確率、查全率、查準率、F1分c)最優模型在測試樣本集預測中,其準確率、查全率、查準率、F1分數及AUC值均應大于0.9。模型的外部評價模型的外部評價應在符合6.2規定的數字計算機上完成,具體如下:a)在本地實驗室儀器設備針對不同器官、體液及水樣分別制作10份底物樣本(如組織樣本涂片),每份底物樣本中的實際硅藻數量不低于100個,科屬類別不低于5種。底物樣本中的實際硅藻數量和科屬分類由本實驗室2名及以上,日常從事硅藻檢驗工作,且具有一定分類經驗的技術人員予以確認:b)按照7.2.2的規定在本地實驗平臺將底物樣本進行數字化轉化;c)按照7.2.3和7.2.4的規定應用最優模型對數字化底物樣本進行硅藻定性、定量及科屬分類;d)人工智能模型識別正確的硅藻數量應占底物樣本實際硅藻數量的80%以上;e)人工智能模型的硅藻科屬分類平均準確率應在90%以上。7.2自動化硅藻分析的具體實施7.2.1硅藻檢驗樣本制備按照GA/T813、GA/T1662以及其他可用于肺、肝、腎、骨髓、體液及水樣等樣本的硅藻檢驗方法,所獲得的硅藻檢驗樣本可用于7.2.2的步驟。7.2.2硅藻檢驗樣本數字化轉換硅藻檢驗樣本數字化轉換應在符合6.1規定的顯微掃描或拍照系統上完成,具體步驟如下。a)將獲取的檢測底物樣本(如組織樣本涂片)放入顯微掃描或拍照系統的載物臺上。b)確定掃描區域,可設置自動聚焦選項。c)在400倍及其以上倍率的視場下獲取檢測底物樣本上掃描區域的數據圖像,數據圖像符合:1)數據圖像應大于或等于人工智能模型輸入大小規格:2數據圖像表示分辨率應不低于72DPI;3)色彩深度為本地實驗室儀器設備實際參數。7.2.3應用人工智能識別模型對數據圖像中硅藻區域定位在符合6.2規定的數字計算機上應用人工智能識別模型對數據圖像中硅藻區域定位,具體步驟如下:a)將7.2.2步驟中獲取的數據圖像進行圖像處理,采用自動切割方法形成多張子圖像。所生成的子圖像大小應與人工智能模型輸入的規格相符:b)可選擇對7.2.3a)中的子圖像進行預處理(如均一化和灰度化等),預處理方法應與c)或d)圖像樣本所使用的預處理方法相同:c)如采用基于分治法的模型架構,子圖像樣本應進行特征提取形成向量數據后才可輸入至人工智能識別模型。特征提取方法應與d)圖像樣本所使用的特征提取方法相同:d)經人工智能識別模型預測,可確認所檢測的子圖像中是否含有硅藻(完整或部分硅藻)并記錄該張子圖像在數據圖像上的坐標信息。7.2.4應用人工智能分類模型對數據圖像中硅藻分類在符合6.2規定的數字計算機上應用人工智能分類模型對數據圖像中硅藻分類,具體步驟如下:a)若子圖像含有因切割操作造成的不完整硅藻,可根據7.2.3d)中獲取的坐標信息在數據圖像上截取相同大小的子圖像,該子圖像應包含有完整硅藻:b)樣本在消化、離心和震蕩等過程中造成硅藻破壞時,如對應子圖像中包含的硅藻碎片可通過形狀或紋理予以確認,則按7.2.4a)進行處理;c)可選擇對7.2.4a)中的子圖像進行預處理(如均一化、灰度化等),預處理方法應與c)或d)圖像樣本所使用的預處理方法相同;d)如采用基于分治法的模型架構,截取的子圖像樣本應進行特征提取形成向量數據后才可輸入至人工智能分類模型。特征提取方法應與模型訓練時采用的方法相一致;e)經人工智能分類模型預測,確認截取子圖像中硅藻的形態學科屬并記錄該子圖像在數據圖像上的坐標信息。7.2.5人工確認在符合6.2規定的數字計算機上,檢驗人員對人工智能識別模型和分類模型篩選的含有硅藻的子圖像進行人工校對并獲取對應子圖像在數據圖像中的坐標信息。7.2.6結果呈現在符合6.2規定的數字計算機上結果呈現如下:a)根據人工智能模型和人工確認結果,對樣本中的硅藻進行定性分析和定量分析,并統計不同科屬硅藻的數量;b)根據含有硅藻的子圖像坐標信息,在數據圖像中截取相應大小代表性的圖像用于檢驗報告附7[1]GB/T5271.1-2000信息技術詞匯第1部分:基本術語[2]AIOSS-01—2018人工智能深度學習算法評估規范[3]JZhang,DNVieira,QChengetal.DiatomNetv1.0:anovelatestingfordrowningdiagnosisinforensicallybionedicalapplication[J].Comput[4]JZhang,YYZhou,DNoVieira,etal.Anefficientnethodforbuildingadpopulationsfordroningsiteinferenceusingadeeplearningalgorlthm[J].Int[5]YYZhou,JZhang.JHuang,etal.Digitalwbole-slideimageanalysistestinforensiecasesofdrowningusingaconvolutionalneuralnetworkalgInt,2019,302:109922.[6]BGloria,DOscar,PAnibal,etal.AutomatedDiatomClassificatioFeatureApproaches[J].ApplSci,2017.7:753[7]P.Anibal,B.Gloria,D.Osc
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家禽消毒室管理制度
- 應急局科室管理制度
- 彩票發行費管理制度
- 微信技師房管理制度
- 德克士值班管理制度
- 快遞分揀站管理制度
- 急救室專人管理制度
- 總經理聘任管理制度
- 感控辦部門管理制度
- 成品庫出貨管理制度
- 2021國開電大操作系統形考任務 實驗報告-進程管理實驗
- 中醫藥膳學全解共94張課件
- 重慶市各縣區鄉鎮行政村村莊村名居民村民委員會明細及行政區劃代碼
- 學生公寓維修改造工程施工組織設計
- 小學高段語文審題能力的培養
- 【完整版】鎖骨骨折護理查房課件
- 護理人文關懷質量評價標準
- 【北師大版】七年級上冊數學 第四章 圖形的全等 單元檢測(含答案)
- 《教育學原理》期末考試試卷試題A及答案
- 安全知識進校園宣傳課件——XX小學
- 陳倍生妙派風水秘訣筆記
評論
0/150
提交評論