LIDC中肺結(jié)節(jié)注釋信息的提取及數(shù)據(jù)庫的建立_第1頁
LIDC中肺結(jié)節(jié)注釋信息的提取及數(shù)據(jù)庫的建立_第2頁
LIDC中肺結(jié)節(jié)注釋信息的提取及數(shù)據(jù)庫的建立_第3頁
LIDC中肺結(jié)節(jié)注釋信息的提取及數(shù)據(jù)庫的建立_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、LIDC中肺結(jié)節(jié)注釋信息的提取及數(shù)據(jù)庫的建立【摘要】目的:對LID數(shù)據(jù)庫的注釋文件中有關(guān)肺結(jié)節(jié)的相關(guān)數(shù)據(jù)進(jìn)展提娶整合、匯總,并導(dǎo)入到Aess數(shù)據(jù)庫表中。方法:通過對LID數(shù)據(jù)庫XL格式的注釋文件的分析、解讀,利用VisualBasi語言編程提取數(shù)據(jù),并導(dǎo)入到Aess數(shù)據(jù)庫表中。結(jié)果:數(shù)據(jù)提取和顯示程序?qū)ID中的68個(gè)病例的相關(guān)數(shù)據(jù)如病例號、專家號、結(jié)節(jié)號、結(jié)節(jié)的各種T征象、結(jié)節(jié)的X坐標(biāo)和Y坐標(biāo)等加以提取和顯示,并保存到數(shù)據(jù)庫中。結(jié)論:將LID數(shù)據(jù)庫中包含的每個(gè)病例T圖像的XL格式注釋文件導(dǎo)入到Aess數(shù)據(jù)庫中,較之純文本格式的數(shù)據(jù)組織更加構(gòu)造化,進(jìn)而可以借助數(shù)據(jù)庫強(qiáng)有力的數(shù)據(jù)管理和查詢功能對

2、T圖像上肺結(jié)節(jié)形態(tài)、位置、T征象等進(jìn)展查詢和比擬。【關(guān)鍵詞】LID;XL文件;Aess數(shù)據(jù)庫;T圖像1引言隨著科學(xué)技術(shù)的不斷開展、更新,現(xiàn)如今醫(yī)生進(jìn)展醫(yī)學(xué)診斷的方法與形式已經(jīng)發(fā)生了宏大的轉(zhuǎn)變。與過去僅憑經(jīng)歷、慣例等不同的是,現(xiàn)今的醫(yī)學(xué)診斷更多的傾向于科學(xué)的、數(shù)字化的精細(xì)診斷形式,其中最為突出的例如就是計(jì)算機(jī)輔助診斷及計(jì)算機(jī)輔助檢測的飛速開展。T的計(jì)算機(jī)輔助肺癌診斷的研究證實(shí),AD技術(shù)可以為病變部位的探測提供有效的幫助,甚至可以在連續(xù)的T檢查中輔助確定病變部位是否穩(wěn)定或是否發(fā)生了大小的改變。為了為各種圖像處理或AD技術(shù)的互相比擬和測評提供一個(gè)參考數(shù)據(jù)庫,美國國家癌癥研究會(huì)NI于2001年4月起陸

3、續(xù)公布了肺部圖像數(shù)據(jù)庫聯(lián)盟LungIageDatabasensrtiu,LID。該影像數(shù)據(jù)庫可以通過互聯(lián)網(wǎng)訪問和下載1。目前LID包括68個(gè)病例的約10000張全肺T掃描圖像掃描層厚1.253,512512像素,總?cè)萘砍^6GB。每個(gè)病例對應(yīng)一個(gè)文件夾,包括完好的肺部T掃描圖像DI格式100300張,以及一個(gè)注釋文件XL格式。在注釋文件中給出了4名放射學(xué)專家對每張T片中出現(xiàn)的結(jié)節(jié)的定義,包括結(jié)節(jié)的主要T征象,如毛刺征Spiulatin、分葉征Lbulatin、鈣化alifiatin等以及結(jié)節(jié)的惡性度alignany。由于LID數(shù)據(jù)庫中病例的注釋文件是采用XL格式編寫的純文本文件,所有注釋內(nèi)容均

4、以標(biāo)識(shí)符加以區(qū)分,不具備數(shù)據(jù)的查找、統(tǒng)計(jì)等功能。本研究將LID數(shù)據(jù)庫所提供的原始XL注釋文件信息加以提取,建立相應(yīng)的Aess數(shù)據(jù)庫進(jìn)展存儲(chǔ),方便其他研究人員的使用。2方法與實(shí)驗(yàn)2.1XL注釋文件2.1.1XL文件XL文檔是由元素組成的,每個(gè)元素都包含一個(gè)“起始標(biāo)記如、一個(gè)“完畢標(biāo)記如,以及兩個(gè)標(biāo)記之間的信息即元素的內(nèi)容。元素可以使用屬性進(jìn)展注解,屬性包含了關(guān)于元素及其內(nèi)容的元數(shù)據(jù)。XL信息集主要用作各種XL技術(shù)使用的定義集,以正式描繪需要技術(shù)處理的XL文檔局部。XL信息集是XL文檔的樹狀層次表示。一個(gè)XL文檔的信息集包含許多信息項(xiàng),這些信息項(xiàng)是XL文檔組件的抽象表示,其中包括表示文檔、文檔的元

5、素、屬性、處理指令、注釋、字符、表示法、命名空間、未分析的實(shí)體、未擴(kuò)展的實(shí)體引用和文檔類型聲明的信息項(xiàng)。2.1.2LID提供的XL格式數(shù)據(jù)例如在每個(gè)病例的所有T圖像后面都有一個(gè)注釋文件,其中給出了4名放射學(xué)專家對每張T片中出現(xiàn)的結(jié)節(jié)的定義,包括結(jié)節(jié)的主要T征象,如毛刺征Spiulatin、分葉征Lbulatin、鈣化alifiatin等以及結(jié)節(jié)的惡性度alignany。對于大結(jié)節(jié)直徑3的結(jié)節(jié),給出了輪廓點(diǎn)的坐標(biāo),小結(jié)節(jié)直徑3的結(jié)節(jié)給出了中心點(diǎn)的坐標(biāo)。所有信息的含義定義在一對標(biāo)簽中。一個(gè)典型的XL文件片段如圖1所示。2.2存儲(chǔ)LID中肺結(jié)節(jié)數(shù)據(jù)的數(shù)據(jù)庫從每個(gè)病例的原始注釋文件中提取如表1所示的根

6、本信息,并寫入相應(yīng)數(shù)據(jù)庫表的字段中。表1存儲(chǔ)LID中肺結(jié)節(jié)數(shù)據(jù)的數(shù)據(jù)庫表的構(gòu)造注:如T圖像上某一構(gòu)造為小結(jié)節(jié)直徑小于3或非結(jié)節(jié),那么上述字段412的取值均為0。2.3提取LID中肺結(jié)節(jié)數(shù)據(jù)Step1提取患者號,以作為患者號的標(biāo)識(shí)符。Step2提取專家號。注釋中未給出放射學(xué)專家編號,但是通過對文件的大體框架的分析可以看出,每一對中包含一位專家對這個(gè)病例做出的診斷。所以通過挑選,可以將專家號分別定義為A、B、和D。Step3判別是否為結(jié)節(jié)、非結(jié)節(jié)或是另一名專家的診斷。同時(shí)搜索3個(gè)標(biāo)識(shí)符、:Step3.1假如搜索到,那么繼續(xù)搜索是否有、或標(biāo)識(shí)符;Step3.1.1假如指針?biāo)褜さ慕Y(jié)果為,那么表示此結(jié)節(jié)

7、分類為大結(jié)節(jié),繼而提取大結(jié)節(jié)的結(jié)節(jié)號、T號,并根據(jù)要求繼續(xù)提取大結(jié)節(jié)的相關(guān)征象值和所有坐標(biāo)。因?yàn)樗峁┑脑甲⑨屛募行〗Y(jié)節(jié)和非結(jié)節(jié)都只有一對坐標(biāo),指針在查找到起始坐標(biāo)的標(biāo)識(shí)符后直接提取即可。但是對于大結(jié)節(jié)來說,由于每個(gè)大結(jié)節(jié)都含有多個(gè)坐標(biāo),所以在這里只提取第一對坐標(biāo)作為起始坐標(biāo),其余的坐標(biāo)統(tǒng)一提取后存在txt格式的文件中,在最后整合的數(shù)據(jù)表中指保存文件的文件名,以做提示。Step3.1.2假如指針?biāo)褜さ慕Y(jié)果為,那么表示此結(jié)節(jié)的分類為小結(jié)節(jié),只需提取結(jié)節(jié)號、T號及X、Y坐標(biāo)即可,其余的結(jié)節(jié)征象參量標(biāo)識(shí)符對應(yīng)的值為0。Step3.1.3假如指針?biāo)阉鹘Y(jié)果為,即說明該結(jié)節(jié)數(shù)據(jù)讀取完畢,須將所有已讀信

8、息保存至實(shí)現(xiàn)定義的數(shù)組中,等所有數(shù)據(jù)讀取完以后一起輸出顯示。Step3.2假如挑選結(jié)果為,那么指針?biāo)傅臉?gòu)造為非結(jié)節(jié),根據(jù)非結(jié)節(jié)所需信息要求,挑選出數(shù)據(jù)即可。Step3.3假如挑選結(jié)果為,說明已讀取完一個(gè)專家的所有數(shù)據(jù),可以開場繼續(xù)讀下一個(gè)專家,直至整篇文檔讀取完畢。3結(jié)果3.1提取注釋文件的程序在如圖2所示的程序窗口,“文件菜單用于翻開病例數(shù)據(jù),在顯示的對話框中選擇病例文件。程序?qū)⒆詣?dòng)提取文件中肺結(jié)節(jié)的信息,并將它們顯示在一個(gè)文本框控件中。“顯示菜單用于以報(bào)表形式顯示保存到數(shù)據(jù)庫中的數(shù)據(jù),如圖3所示。3.2建立的數(shù)據(jù)庫在LID數(shù)據(jù)庫的68個(gè)病例中,4名放射學(xué)專家共標(biāo)注大結(jié)節(jié)331個(gè)累及T層數(shù)1589張、小結(jié)節(jié)920個(gè)累及T層數(shù)920張、非結(jié)節(jié)病變2370個(gè)累及T層數(shù)2370張。對每張T上的大小結(jié)節(jié)及非結(jié)節(jié)病變,用一條記錄保存其相應(yīng)信息,所以整個(gè)數(shù)據(jù)庫共68張表、4879條記錄。此外還有保存大結(jié)節(jié)輪廓點(diǎn)坐標(biāo)的文本文件1589個(gè)。4結(jié)論LID數(shù)據(jù)庫是在整合了多位放射學(xué)專家對多份病例的T掃描圖像的意見的根底上建立起來的,為肺部圖像數(shù)據(jù)的搜集制定了一個(gè)指導(dǎo)方針,為今后的科學(xué)研究打下堅(jiān)實(shí)的基矗LID數(shù)據(jù)庫的建立為早期肺癌診斷提供了強(qiáng)有力的輔助手段,靈敏的應(yīng)用LI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論