基于數據挖掘的醫保詐騙篩選模型研究_第1頁
基于數據挖掘的醫保詐騙篩選模型研究_第2頁
基于數據挖掘的醫保詐騙篩選模型研究_第3頁
基于數據挖掘的醫保詐騙篩選模型研究_第4頁
基于數據挖掘的醫保詐騙篩選模型研究_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于數據挖掘的醫保詐騙篩選模型研究(江景星、向晴、何澤煬摘要:針對醫療保險領域中的詐騙行為,通過數據挖掘的方法,從大量數據中尋找規律,從而發現醫保數據中潛在的信息,篩選出詐騙人員。本文利用聚類分析得到主體變量,用模糊層次分析求得評價系數,并用熵值法確定標準值,從而篩選出騙保嫌疑人,最終用支持向量機方法檢驗模型是否合理。本文通過算例說明了該方法的應用,以期輔助醫保安全運營和風險防控,達到完善現代醫保基金運營體系的目的。關鍵詞:聚類分析 模糊層次分析法 二分法 支持向量機 一、 引言醫療保險欺詐,是指公民故意捏造事實、弄虛作假、隱瞞真實情況等造成醫療保險基金損失的行為。騙保人進行醫保欺詐時通常使用

2、的手段有:1.拿著別人的醫保卡配藥;2.在不同的醫院和醫生處重復配藥。具體表現為:1.進行單張處方藥費特別高;2.一張卡在一定時間內反復多次拿藥。二、 醫保詐騙篩選模型研究(一)模型建立1.變量處理簡單剔除無用變量后,運用聚類分析法進行降維處理。采用系統聚類法2,對變量進行分類,即將n項指標看成n類,根據指標變量的親疏程度,將親疏程度最高的兩類進行合并,然后考慮合并后的類與其他類之間的親疏程度,再進行合并。重復這一過程,直到將所有的指標合并為一類。(1計算向量間的距離:;為樣本數據矩陣的協方差陣。(2刻畫類的特征:平均距離;(3將平均距離最小的類歸為一類。(4根據需要,選取變量。2.模糊層次分

3、析法對詐騙可能性評價構建病人醫保詐騙評價指標層次結構模型,在此基礎上運用模糊層次分析及熵值法計算各指標的相對權重,然后綜合運用模糊綜合評價方法以及層次分析法的層次結構建立的評價指標體系3,對病人醫保欺詐情況做出定量的綜合評價。熵值賦權法求權重:(1建立評價系統的初始數據矩陣: (2數據標準化處理: ,表示標準化后的值。計算第項指標下第個樣品的比重:由此得到數據的比重矩陣:(3計算指標信息熵值和信息效用值:計算第項指標的信息熵值:,得到結果:其中,為波爾茲曼常數,;本文中;信息效用價值取決于該指標的信息熵與1之間的差值,越大,權重越大:,得到信息效用價值:;計算評價指標權重:利用熵值法估計指標權

4、重,本質是利用該指標信息的價值系數計算,價值系數越高,對評價的重要性就越大。第項指標的權重為:。計算得到綜合指標:綜合指標為:。3.利用二分法確定標準值醫保詐騙相對具有共性,特征明顯如下圖,故存在明顯分界點,即所求標準值。利用二分法查找特殊標準值:二分法:對所有病人評價系數按從小到大順序排列,將其從中間分割為兩個區段,必存在T,使得Number1k,k+1,high>T,令新的區間為Number2low,,K-1 將其交界處分割點作為標準點 繼續選取 。 4.比對得到可能詐騙的病人ID將綜合指標與進行比較,得到詐騙者ID號。(二)支持向量機模擬檢驗將病人騙保與非騙保看做對病人類型的分類,

5、以所得結論作為訓練樣本,每個標記為屬于兩類,對兩兩分類變量分別進行支持向量機分析4,得出分類曲線,將數據區分開,觀察不同區域病人騙保情況,如果發現兩類病人較為明顯的區分在分類線兩側,則認為模型預測數據較為準確。利用R軟件建立支持向量線性模擬檢測器,對分類結果進行檢驗,繪制圖形如下。通過上述圖像定性分析,圈點和差點基本分布在分類線兩側,檢測器找到一條支持向量檢測線很好地將兩類數據分開,區分情況與我們先前推測的結果基本符合,由此得出結論在一定誤差范圍內,一維支持向量機模型可以很好區分不同類別病人,該數學模型具有較高的準確性與科學性。三、 結果分析運用模糊層次分析法進行分析,采用熵值法,根據各項指標

6、觀測值所提供的信息的大小確定出不同指標的對應權重,購藥總花費系數<購藥頻數系數<開囑醫生數目系數,開囑醫生數目所占權重最大,可以預測大多數詐騙人員都具有開囑醫生多的特點,對于這一類病人應進行重點排查,防止詐騙行為的發生。最后得出疑似欺詐病例,其主要特點是購藥花費大、買藥次數多、開囑醫生多,可見前期變量選擇準確,可以很好反映欺詐病人特點,醫院可以從這三方面入手加強監管力度,發現潛在的醫保欺詐病人,一旦查出欺詐病人則吊銷其醫保卡號,嚴厲打擊醫保騙保行為。本文在最后依據有監督學習原理,引入支持向量機線性模擬器,判斷推測數據準確性,可以看到不同類型病人數據被支持向量所分割,分布于平面上兩塊不同類別區域,進一步驗證所得結果的合理性,該原理可以應用于各類欺詐模型的結果檢測,具有廣泛的實用價值。參考文獻:1楊浩,基于SPSS的聚類分析在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論