惡性血液病數據庫分析系統的建立_第1頁
惡性血液病數據庫分析系統的建立_第2頁
惡性血液病數據庫分析系統的建立_第3頁
惡性血液病數據庫分析系統的建立_第4頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、惡性血液病數據庫分析系統的建立【關鍵詞】,血液月中瘤Establishment of an analysis system based on clinical database of malignant blooddiseasesAbstract AIM: To establish a database system based on the data of clinical hematological malignant blood diseases, which has the functions of fuzzy research, data analysis assisted diag

2、nosis and scientific statistic. METHODS:With the assistance of Windowsoperating system, Delphi6 was used as a simple tool to develop clients visiting port as well as for the analysis, and SQL Server 20XX as the developing and managing tool for rational database, to acplish the analysis and statistic

3、s of data after integrating the statistical systematic software into the database system. RESULTS: The electronic case files and database system of “hematological malignant diseases ” was established, which contained the plete information of the diagnosis and therapy of such patients with an aim to

4、provide any time inquire, parison with relative cases, analysis and statistic of the correlated information with graph and diagram. CONCLUSION:This hematologicalmalignant diseases database system can resolve some problems of keeping case files in paper and acplish the digitization of clinical data,

5、with the function of intellectual inquiry and authoritative database analysis, which makesit convenient for doctors to makeobjective evaluation of the diagnosis and therapy.Keywords hematologicalneoplasms;Database; data mining ;assistantdiagnoses ; statistical analyses ; SPSS;rough set【摘要】 目的:建立一個基于

6、臨床惡性血液病 (hematological malignant disease, HM/為數據源,并具有模糊查詢,數據分析輔助診斷,科學統計等功 能的數據庫系統.方法:以Windows操作系統為平臺,Delphi6作為開發數據庫 客戶訪問端和簡單分析的工具,SQL Server20XX作為關系數據庫開發和管理工 具,并將SPSS集成到數據庫系統中實現對數據分析統計功能.結果:建立HM 電子病歷和數據庫系統,較完整的記錄患者的診斷和治療信息,實現隨時查詢, 對相似病例比較分析和對相關數據進行數據挖掘及圖形或圖表統計分析的功能. 結論:集智能查詢,數據挖掘和具有權威性統計分析為一體的 HM數據庫

7、系統, 減輕了書面病例維護難的問題,實現臨床數據源數字化.有利于醫生對診療過程 的療效分析和做出客觀評價.【關鍵詞】 血液月中瘤;數據庫;數據挖掘;輔助診斷;統計分析; SPSS 軟件;粗糙集0引言血液病分類多而且數據量十分龐大,增加了診斷方面復雜性和不確定性, 為此我們應用數據挖掘技術和成熟的計算機數據庫技術,以臨床病例為數據源, 建立起具有職能查詢,對臨床案例進行數據挖掘,輔助醫生診斷,對數據進行科 學的統計分析的數據庫系統.該系統具有專家系統的特性,不僅可輔助醫生做出 初步診斷而且對數據具有強大挖掘和分析功能.使醫生能更快學到更多的臨床 知識,積累更多的臨床經驗.1材料和方法硬件和操作系

8、統環境要求數據庫服務器初步建立在個人 PC機上,PC配置 應為Intel Pentium G 或更高,內存大于128 M 硬盤剩余空間不少于 2GB.操 作系統為Win20XX£更高版本.在前期開發階段,數據庫服務器以個人 PC機為 硬件平臺.數據源模塊本數據庫以臨床病例為數據源,包括文本數據、圖像和圖形等, 可以對各檢查項目和治療方案進行詳細的記錄.同時數據庫將錄入分型標準和 檢查診斷標準,建立起知識庫.數據庫開發和維護模塊由于 SQL Server 20XX是一個功能完備的正規數據 庫管理系統1,它不僅具有一些大型數據庫具備的特性如:支持數據挖掘、標準的SQL語言、存儲過程和觸發

9、器等,而且與Windows操作系統有機集成,具 有方便易使用的圖形界面,極易安裝和學習.所以我們采用它作為本數據庫的開 發和維護工具.數據完整性:使用數據庫規則和約束機制對數據的類型進行限 制,并且以患者為中心建立多表之間的一一對應關系,從而確保數據的正確性和完整性.數據安全性:首先,備份事務日志,在由于誤操作等而引起數據損壞 情況下,可利用事務日志將數據庫恢復到以前正常狀態下 .其次,與客戶訪問程 序聯合建立用戶權限機制,對于不同用戶設置不同的權限級別,防止對數據的非 法操作.最后,建立觸發器機制,在數據錄入之前確保數據正確性和合法性.數據庫移植:由于SQL Server20XX提供了很方便

10、的附加數據庫向導,從而使我 們可以不同主機之間移植數據庫,這樣可避免重復多次輸入數據的麻煩.數據 維護:針對惡性血液病有不同的分型標準的特點,數據庫內部將根據不同標準對數據作不同的分類.同時也將一些常用的分型標準錄入到庫中如:FAB分類標準,WH標準等,這樣更利于醫生及時查閱.以上四個方面,作為客戶端接口, 數據庫開發和維護模塊基本上可以滿足用戶各種查詢需求.輔助診斷模塊惡性血液病(hematological malignant disease, HM)H一種 兇險的疾病,快速診斷、明確分型、早期治療十分重要2.惡性血液病診斷比較復雜,要結合臨床癥狀,實驗室檢查,血細胞涂片等作綜合分析,才能做

11、出 正確診斷.我們從臨床案例入手,建立起確診數據庫.在此基礎上進行數據挖 掘和人工干預的篩選,然后由計算機自動完成統計分析,從中得出具有診斷價值 的數據信息(Fig 1).例如:診斷標準值的范圍等.我們進一步將這些數字化的診斷信息和國內外的HM診斷標準相結合建立起知識規則數據庫和推理機系統 . 計算機可以以此為基礎對患者的檢查項目做出初步分析和診斷,為醫生作確定診斷打下基礎.在數據挖掘過程中,我們運用粗糙集理論.粗糙集理論的特點是不需要預 先給定某些特征或屬性的數量描述, 如統計學中的概率分布、模糊集理論中的隸 屬度或隸屬函數等,而是直接從給定問題的描述集合出發, 通過不可分辨關系和 不可分辨

12、類確定給定問題的近似域,從而找出該問題中的內在規律.HM數據庫中收錄了大量臨床案例,即問題的描述集合.我們從這些案例出發采用啟發式算 法,進行知識約簡.基本算法是:得到核(診療標準)作為屬性約簡集的基礎. 按照屬性(檢查項目)的重要程度從大到小逐個加入屬性, 直到依賴程度已經 與原始屬性集的依賴程度相等為止.對新加入的每個屬性,計算去掉后是否影 響依賴系數.如果不影響則將其刪除.實現屬性約簡.刪除同一決策表每個 實例中多余的屬性值(檢查值). 求出最小約簡.由最小約簡求出邏輯規則.整個數據約簡過程中,僅僅依靠確診數據庫和知識庫.即使在屬性不完備 的情況下,仍能夠獲取最近似解,最大程度讓數據自己

13、“說話”客觀反映事物內 在規律.血細胞形態學判別分型對 HM十分重要3.由于血細胞圖像的隨機性和相 似性,醫生要在診斷過程中做出正確的鑒別診斷需積累大量經驗.這無疑給缺乏 經驗的醫生帶來了困難.為此,我們以第四軍醫大學唐都醫院血液內科大量的血 液圖片為數據源,以圖片的特征信息如細胞類型、分型等為索引,經過系統化分 類建立起醫學圖像數據倉庫.醫生在血細胞圖像鑒別過程中,可通過智能查詢調 出與其相似的確診血細胞圖像在同一窗口中顯示出來 .方便醫生比較鑒別,找出 其中的異同從而做出正確地診斷.治療分析模塊由于單采血小板和各種凝血因子制劑的應用,HM妣于出血的病例有所減少.60%75%勺白血病或淋巴瘤

14、患者死于感染.醫院感染(NI)是HM 的主要死因.目前,國內HM醫院感染的研究都是對大量患者的院內感染資料回 顧性分析,從中找出感染原因.如果用人工對大量的院內感染資料分析處理, 不 僅低效,而且易出錯丟失有統計學價值的信息.對此,我們利用算法實現對大批 量的院內感染資料篩選,結合 SPS漱計軟件完成對數據統計學分析,提高回顧 性分析正確性,防止有價值信息丟失.對于數據篩選/分組模塊我們仍采用人工干預的方式,增加數據分析的靈活 性.篩選出的數統計分析和分組對照計算機自動完成,大大減輕了人工處理的計算量,保證了數據計算分析的正確性.統計分析模塊,集成了 SPSSB計軟件可 自動完成對大批量的數據

15、的各種分析,數據輸入到SPSSI全由計算機自動完成, 醫生只需在SPSSB計軟件界面下采取相應的統計分析方法,對數據進行科學的 處理分析. 另一方面,在患者整個治療過程中,計算機根據檢查結果對療效進 行動態跟蹤,特別是對于治療中的量化的數據作初步分析如繪出細胞數目變化的 曲線圖等,并將其與現有的療效標準比較在圖表上做出相應標識,向醫生輸出比較直觀的分析結果.從而方便醫生對治療方案療效進行判斷(Fig 2).2結果電子病例和統計分析HM電子病案,可以較為完整地記錄患者診斷和治療的 主要信息,實現了一次輸入病案、多次維護病案信息、即時調用查詢和對相關數 據統計分析的功能.系統具備靈活的病案信息查詢

16、功能,使用者可以根據自己的 需要,方便快捷地提取信息,查詢后形成的文本文件可以長期保留,任意一個保 留文件均可與專業的SPSS統計分析軟件實現無縫連接,并具有后者的所有功能 根據研究需要形成不同的統計文件并做出相應的統計分析結果,為臨床和科研工作提供數據統計功能.數據挖掘使用數據挖掘技術和粗糙集理論4,在原有數據庫基礎上使知 識約簡化,使隱含在數據庫中的知識顯現出來,建立起知識規則數據庫.本系統 在此基礎上通過推理機實現對 HM 勺初步診斷.診斷標準中的可量化部分如診斷 標準值的范圍等完全由計算機算法實現,大大提高了知識庫構建的速度.知識庫 構建過程中將融入血液內科自己制定的某些標準,增強知識

17、庫的完備性,靈活性和自我更新的功能.形態學圖譜庫建立起血液病形態學圖譜數據庫,并進行系統 化和自動化管理.方便醫生比較鑒別和臨床教學使用.可對治療過程動態跟蹤, 根據療效標準做出量化分析.輔助醫生采取正確的治療方案.3討論數據挖掘(或知識發現)就是從大量的數據中抽取以前未知并具有潛在可用的模式.數據挖掘在醫學上的應用有其自身的優勢,因為醫學上收集到的數據 一般是真實可靠、不受其他因素影響的,而且數據集的穩定性較強.這些對挖掘 結果的維護、不斷提高挖掘模式的質量都是非常有利的條件.大量而豐富的臨床 案例將是醫生獲取知識最佳的資源.惡性血液病數據庫系統的原始處理對象為 醫學信息數據庫,此對象實際上具有知識發現和數字化診斷功能,可同時運用統計軟件對患者的信息進行科學的統計分析,它包含醫生診斷使用的患者醫學影像、病理參數、化驗結果、診斷結果及相關的參數如年齡、性別、病史等 .總之,該 系統是一一套集數據挖掘,統計分析和輔助診斷于一體的HMW案處理軟件,有助于臨床信息的管理和科研水平的提高.因而要對醫學信息數據庫進行數據挖掘 和知識發現,發現其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論