




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 156數據挖掘技術在DNA 數據分析中的應用戴銀春130022長春市口腔醫院摘 要 通過使用數據挖掘技術對已經被提取和記錄的多個基因片段進行修整、比較、分析、尋找某個(多個突變位置,并確定該突變位置與其所有者身患的疾病之間的關系。關鍵詞 數據挖掘 基因序列 生物信息學 遺傳疾病 患病家族連鎖分析do:i 10.3969/.j issn .1007-614x .2011.03.155在生物信息學的成果的理論基礎之上,通過統計的方法查找未知的生物化學功能的疾病基因的位置。這個方法預先通過患病家族連鎖分析,再推斷包含這些基因的染色體區域片段,然后檢查該區域來尋找基因1。數據挖掘在DNA 數據分析的
2、發展狀況現今所采用的是分子生物學與微電子技術相結合的核酸分析檢測技術2。DNA 芯片技術的基本原理是將c DNA 或寡核昔酸探針以105106位點/c m 2的密度結合在固相支持物(即芯片上,每個位點上的cDNA 或寡核昔酸探針的順序是已知的,將該探針與熒光標記的待測樣品DNA,RNA 或cDNA 在芯片上進行雜交,然后用激光共聚焦顯微鏡對芯片進行掃描,并配合計算機系統對雜交信號做出比較和檢測,從而迅速得出所需的信息。基因數據挖掘常用的方法: 核酸與蛋白質比較的預測分析:蛋白質序列之間或核酸序列之間的兩兩比對,通過比較兩個序列之間的相似區域和保守性位點,尋找二者可能的分子進化關系。進一步的比對
3、是將多個蛋白質或核酸同時進行比較,尋找這些有進化關系的序列之間共同的保守區域、位點和pro file ,從而探索導致它們產生共同功能的序列模式。此外,還可以把蛋白質序列與核酸序列相比來探索核酸序列可能的表達框架;把蛋白質序列與具有三維結構信息的蛋白質相比,從而獲得蛋白質折疊類型的信息。 針對核酸序列的預測方法:針對核酸序列的預測就是在核酸序列中尋找基因,找出基因的位置和功能位點的位置,以及標記已知的序列模式等過程。在此過程中,確認一段DNA 序列是一個基因需要有多個證據的支持。一般而言,在重復片段頻繁出現的區域里,基因編碼區和調控區不太可能出現;如果某段DNA 片段的假想產物與某個已知的蛋白質
4、或其他基因的產物具有較高序列相似性的話,那么這個DNA 片段就非??赡軐儆谕怙@子片段;在一段DNA 序列上出現統計上的規律性,即所謂的 密碼子偏好性 ,也是說明這段DNA 是蛋白質編碼區的有力證據;其他的證據包括與 模板 序列的模式相匹配、簡單序列模式如TATA Box 等相匹配等。案例分析疾病是由于基因的片段內的某個位置存在或發生改變而引起的,也就是發生突變。能否找出其中不同的地方,進而對其不同之處加以改變,使之成為正?;?這都需要數據挖掘技術的支持。對基因的數據挖掘,就是對這些突變位置的尋找,并且找出該位置與所有者身患的疾病之間的關系。方法的選擇:筆者在設計中選用單純的DNA 序列進行比
5、較,基因在計算機的表示和存儲時,可以使用一條很長的字符串來表示基因的某一條序列,使用文件的形式進行對基因工作者的提取成果創建一級數據庫,使用文件修整的方法進行數據的清洗,以滿足數據在二級數據庫中的一致性。同時在文件比較過程中,生成某兩個數據文件的差異狀況,保存在二級數據庫庫中,進一步的操作是對差異的位置的某個類型所占的比例。最后通過事先的對患者患病信息的統計得到的某種疾病在群中所占的比例,與其相比較,如果這兩個比例相等,則可以認為這個位置的某個類型引起疾病的發生。從醫學院得到一些基因片段文件信息和患者(所有者患病情況。系統的實現:基因片段在計算機中以文件形式存儲,用文件名標識其所有者(源體。片
6、段起始地址和長度信息和所有患者患病情況保存在本機數據庫中。在程序測試過程中,將片段復制成40份,對其中部分文件的序列進行稍作修改,對所有患者的患病狀況進行稍作修改,以創造測試環境。顯示在與基因數據挖掘軟件同在一根目錄下的序列文件的集合。其中一個文件所存儲的基因信息,見圖1。啟動統計程序界面,單擊清空數據庫中的臨時用表數據,將數據庫中有可能的雜音信息去掉。并對其中的所有文件進行統計前片段剪切,使所有片段的起始地址和長度都相同,避免發生序列移位。沒有進行片段剪切之前,瀏覽文件所存的片段信息,片段剪切完成之后,設置進行比較操作的甲、乙組的文件添加,因為本次測試只檢驗片段中的一塊區域(文件中片段的所有
7、信息,所以在起始序號那里添加為0,終止序號那里添加為175。這樣則可以保證統計文件的所有信息都被統計。單擊結果顯示按鈕,可以見到程序以表格和條形圖標方式??梢钥吹?、3、5、12、14、16、18、13、31、34、87、94、139、166位置的條形段較高。說明在這些接受統圖1 文件內序列信息 157結腸癌術前行CT 檢查的價值張巍021000內蒙古呼倫貝爾市海拉爾區 人民醫院CT 室摘 要 目的:探究結腸癌患者術前行CT 檢查的臨床價值。方法:從近3年術前行CT 檢查的結腸癌患者中選取20例進行影像學分析及分期統計。結果:按照CT 分期, 期5例、 期7例、 a 期3例、 b 期2例、 期
8、3例。結論:結腸癌患者術前行CT 檢查對臨床了解腫瘤腸管外浸潤程度及有無淋巴結轉移或肝、腎上腺等遠處轉移,從而制定適當的手術方案有著重要的價值。關鍵詞 結腸癌 術前 CT 檢查do:i 10.3969/.j issn .1007-614x .2011.03.156結腸癌是腸道常見惡性腫瘤之一,其發病率正呈逐年上升趨勢。臨床多采用手術切除治療。近年來,隨著CT 設備的完善及合理使用,腸壁軟組織塊影顯示十分清楚,與周圍結構關系一目了然,故臨床于術前均行腹、盆部CT 掃描作術前評估。筆者從近3年我院結腸癌患者行術前CT 檢查的影像資料中選取了具有代表性的20例進行分析,以探究術前行CT 掃描的必要性
9、及臨床價值,現報告如下。資料與方法一般資料:選取結腸癌患者20例中,男12例,女8例;年齡4668,平均57 6歲;均為經結腸鏡活檢病理證實后準備手術冶療者。臨床為作術前評估而行CT 掃描。方法:患者于檢查前1小時給水500m l 以使膀胱充盈。掃描前3045分鐘口服1%造影劑復方泛影葡胺400600m l 。病變部位位于降結腸及乙狀結腸的患者于檢查前1天晚上服用500m l 1%復方泛影葡胺,以使遠端結腸充盈。掃描時常規采用仰臥位,掃描范圍為膈頂至肛門。結 果20例患者中,腫瘤位于升結腸者3例,降結腸者6例,乙狀結腸者11例。CT 表現為病變腸管球形或分葉狀的軟組織腫塊,其中個別較大的腫瘤示
10、中心有低密度壞死區。乙狀結腸癌可見病變不對稱,腸壁環形增厚伴有腸腔狹窄和變形等。其他的征象還有:結腸與鄰近結構邊界消失、腫瘤向周圍脂肪和鄰近組織擴展、腸系膜淋巴結增大、腎上腺及肝轉移瘤、盆腔肌肉腫脹與腫塊間脂肪層消失、骶骨破壞及腸梗阻等。將所見影像與結腸癌CT 分期1相對照進行統計,結果: 期(腔內腫塊無腸壁增厚5例; 期(腸壁增厚>1cm ,無鄰近器官侵犯7例; a 期(局部肌肉或器官侵犯未延伸至盆壁3例; b 期(盆壁被侵犯2例; 期(發生遠處轉移3例。討 論結腸病變一向以鋇灌檢查及內鏡檢查為主要手段,但只能觀察病變范圍、形態及腸管內充盈缺損、僵硬等情況,而對于腫瘤深度、腔外情況、周
11、圍鄰近器官組織及遠處轉移等情況則無法了解,而CT 檢查則可以準確評估腸壁厚度、腫塊的壁外部分、鄰近肌肉和臟器侵犯及肝、腎上腺等遠處轉移并做出CT 分期,為臨床制定手術方案或放射治療計劃提供了可靠的依據和幫助。本文所統計的20例患者因在術前進行了CT 掃描,根據CT 表現按照CT 分期與臨床分期法,外科分別采取了根治性手術、姑息性切除術、和單純腸造口術等不同術式,使患者得到了有效的治療。這足以說明結腸癌在術前行CT 檢查是十分必要的,它對了解腫瘤腸管外浸潤程度及有無淋巴結轉移或肝轉移有著重要意義和診斷價值。但不足之處在于不能顯示早期黏膜改變及直徑<1c m 的腫瘤,也不能確定無增大的淋巴結
12、轉移,有待于在今后的工作中探索和改進。最后,根據CT 檢查的價值及特點,結合作者多年的工作體會提出一點:對于有臨床表現的患者,如鋇灌檢查和內窺鏡未發現明顯病變或可疑者行CT 做進一步檢查是十分必要的。參考文獻1 徐夏萌,陳為民,等.主編.實用CT 診斷學.濟南:山東大學出版社,2002:285.計的片段中,在上面提到的位置處存在的差異較大,與某遺傳疾病的關聯的可能性就越大。如果用戶想要在初步統計結果的基礎上,按照數據庫中所有者的疾病狀況進行詳細統計的話,單擊菜單欄的詳細統計按鈕,選擇按疾病詳細統計,則將彈出窗口。選擇弱視,輸入,則在文本框中顯示與其關聯的位置為1、3、5、12、14、16、18、13、31、34、87、94、139、166。由此,用戶可以根據本系統所給出的預測對弱視遺傳疾病與序列中的特定位置,選擇適當算法進行進一步的計算及檢驗,證明預測結果是否符合關聯理論。數據挖掘方法體系中的智能聚類的相關技術則可較好的解決類別數判定、結果驗證等問
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 休閑餐飲品牌特色小吃原料供應協議
- 綠色環保材料OEM定制加工服務協議
- 電子產品試用及品牌合作推廣合同協議
- Brand KPIs for hotels:JW Marriot in India-英文培訓課件2025.5
- 2025年公務員綜合素質能力測評考試試卷及答案
- 2025年公共英語口語能力考試試題及答案
- 2025年財經法律與合規知識考試試題及答案
- 乳癰的中醫健康宣教
- 餐飲品牌授權經營合作協議
- 跨國采購合同中的知識產權風險防范與條款設計
- 技術開發合同免稅政策
- 租賃國企用地合同范本
- 2024年江蘇省南京玄武區八下英語期末考試試題含答案
- 2024內蒙古森工集團第二批工作人員招聘【重點基礎提升】模擬試題(共500題)附帶答案詳解
- 城市更新暨老舊小區改造二期項目-初步設計說明書
- 黑龍江省高校畢業生“三支一扶”計劃招募筆試真題2021
- 職業道德與法治 第13課《學會依法維權》第二框課件《崇尚程序正義》
- 機動車駕駛員培訓理論科目一考核題庫完整版500題(含答案)
- 專業技術人員年度考核情況登記表
- 兒童眩暈的診斷與治療課件
- GB/T 33285.2-2024皮革和毛皮烷基酚及烷基酚聚氧乙烯醚的測定第2部分:間接法
評論
0/150
提交評論