




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于群集行為的安然公司高管組織結構發現摘要 安然公司欺詐犯罪事件,引起了社會的廣泛關注,本文基于2000年至2002年的所有安然高管之間的郵件,利用基于通信行為的人物關系網絡構建及基于郵件內容的人物關系網絡構建兩種方式尋找安然公司高管高管組織結構,確定高管中的關鍵人物。通過群集行為的特點確定安然高管交流的信息中心和尋找犯罪嫌疑人。針對問題一,方法一是將每個人和其它人的通信總次數作為活躍度(P),通信對象個數作為廣度,將活躍度與廣度的積稱作關鍵系數,取關鍵系數最高的7個作為關鍵人物。他們是lavorato-j,delainey-d,dasovich-j,arnold-j,bass-e,taylo
2、r-m和love-p。方法二是把親密度作為標準,將每個人與其他人親密度總和作為關鍵系數,取關鍵系數最高的7個作為關鍵人物,他們是thomas-p phanis-s stepenovitch-j jones-t mckay-j martin-t gilbertsmith-d。針對問題二,通過分析方法一與方法二的利弊,決定用方法一的人物關系網絡來挖掘人物關系網絡中的群集行為。利用關鍵人物用領域規則找到群集中心是'lavorato-j''mclaughlin-e''whalley-l''delainey-d''ward-k
3、9;'kean-s''dasovich-j''lenhart-m''steffes-j''arnold-j''jones-t''tycholiz-b''bass-e''shackleton-s''keiser-k''taylor-m''giron-d''whitt-m''love-p''stclair-c''hyvl-d'針對問題三,基于方法
4、一人物關系網絡,用問題二模型,通過改變領域規則,利用犯罪嫌疑人找出其他犯罪嫌疑人,他們是編號人名職位編號人名職位編號人名職位1227Kenneth LayCEO2015Sherri Sera無59Amit無1044Jeffery SkillingCEO1133JonesN/A255Browning無73Andrew FastowCFO1598Mr.Lay無133Barnard無77AndyVice President2254WatsonN/A391Clarke無1226KennethCEO1651Niles無676Ena無1308layCEO1629Nell無1641Niamh無1447Mar
5、lin無2016Sherrie無1445Marla無1595Mr.Feygin無1440Mark Greenberg無1261Krista無1697Page無1220KenCEO/Trader1199Katie Trullinger無1221ken LayCEO1177Karen Denne無1198Katie無2014Sherri無1878Robin Sidel無1902Ronan無關鍵詞:人物關系網的建立;群集行為;關鍵人物;尋找犯罪嫌疑人一 問題重述安然公司(Enron)是一家位于美國得克薩斯州休斯敦市的能源類公司,曾是世界上最大的電力、天然氣以及電訊公司之一,公司連續六年被財富雜志評選
6、為“美國最具創新精神公司”,然而真正使安然公司在全世界聲名大噪的,卻是這個擁有上千億資產的公司2002年在幾周內破產,持續多年精心策劃、乃至制度化系統化的財務造假丑聞,以及安然事件中的高層管理者欺詐犯罪事件。安然倒閉之后,許多研究者致力于分析與處理安然郵件數據集(包含有150位安然公司高層管理者自2000年至2002年的所有郵件),試圖通過分析這個數據集挖掘出安然公司高層管理者之間的組織結構關系(通常也叫做社區結構),并進一步找出其中可能存在犯罪嫌疑人。他們采用了兩種建立人物關系的方法初步得到了兩個與之對應的人物關系網絡(用矩陣來描述,每個元素描述關系的緊密程度,取值范圍從0至1, 0代表關系
7、最不緊密,1代表關系最緊密):方法1,基于通信行為的人物關系網絡構建:人物關系的建立是基于通信行為的,這是指如果兩個人之間的通信次數越高那么二者之間的關系就越緊密;所得人物關系網絡為150乘150矩陣,這里的150是Enron高管的人數,詳細數據見第一組數據(數據中有兩個文件,name.txt為150個人的名字,adjacent.txt表示他們之間的有效通信次數);方法2:基于郵件內容的人物關系網絡構建:人物關系的建立是基于郵件內容的,這是指假設兩個人在N篇郵件內同時出現過,如果N越大,那么二者的關系就越緊密。所得人物關系網絡為2307乘2307矩陣,這里的2307個人物是郵件內出現的高頻人物
8、,詳細數據見第二組數據(數據中Namelist2.txt表示人物名字,RalationNet2.mat是matlab文件,表示這2307個人物之間的緊密程度。值得提醒的是由于基于內容分析,有些人物名字上可能有不一致,比如可能是名字全稱,也可能只用名或姓,這也需要你們自行分析)。問題:1 分別針對方法1和方法2中的人物關系網絡,找出其中的關鍵人物。2 試分析上述兩種方法所構建的人物關系網絡對組織結構關系刻畫的利弊,結合第一問得到的關鍵人物,選擇其中的一種方法(或是綜合兩種方法),挖掘人物關系網絡中的群集行為。3 若已經知道,Enron公司的三位高管是犯罪嫌疑人(Kenneth Lay:Chair
9、man;Jeffery Skilling:CEO;Andrew Fastow CFO),能否通過以上的組織結構找出可能存在的其他犯罪嫌疑人,高管職位參見附錄。二 模型假設1)假設郵件統計內容無誤,無郵件遺漏;2)假設數據一和數據二的人名記錄無誤;3)假設安然公司高管間常用通信方式是郵件。三 符號說明四 問題分析4.1 問題一的分析問題一要求分別基于通信行為和郵件內容構建的人物關系網找到人物關系中的關鍵人物,可認為是尋找在人際關系網中處于紐帶地位的人。如果能夠找到一個指標來確定各個人物的重要程度,就可以確定出關鍵人物是哪些。確定出關鍵人物之后就將關鍵人物代入人物關系網觀察他是否處于紐帶位置來確定
10、之前所確定的重要程度這個指標的合理性。4.2 問題二的分析問題二的第一小問是對方法一與方法二的評價,評價的標準應該結合實際人物關系的評判方式來評價方法一與方法二的利弊。通過文獻一1了解到群集行為的特點。根據其特點建立模型尋找群集中心。模型的關鍵有兩點,一是確定集結點,二是領域規則。集結點可以確定是關鍵人物,方法一的人物關系網絡中領域規則是將通信次數大于所有人通信次數平均值的人歸于關鍵人物,以此來找出群集中心。方法二的人物關系網絡中領域規則是將親密度大于平均親密度的人歸于關鍵人物來找出群集中心。4.3 問題三的分析問題三是通過已知三個犯罪嫌疑人,尋找其他犯罪嫌疑人。確定犯罪嫌疑人的方法有很多,根
11、據不同的情況都有不同的判別方式。可以對已知數據初步確定判別方式,以已知的嫌疑人作為集結點,判別方式為領域規則,人物關系網絡作為群集,通過問題二的模型求解群集中心,群集中心除去已知的犯罪嫌疑人,就可得到其他犯罪嫌疑人。之后對得到的犯罪嫌疑人通過判別方式,總結犯罪嫌疑人所處位置的相關指標在群集里所占的百分比大小評定這種判別方式的好壞,若好,確定犯罪嫌疑人,若不好,尋找其他判別方式,重復以上步驟直到找到判別方式最好的方案。五 模型建立與求解5.1 問題一模型的建立與求解通過參考文獻2可知人物關系網可以通過邊權矩陣描述,為了更直觀反映人物關系網,可以通過畫圖來描述。畫人物關系網的模型如下:步驟一:找到
12、人物關系網人物個數,將各個人物進行編號。步驟二:隨機產生對應人物個數的處于的隨機數,將作為第個人的位置。步驟三:將已知的邊權矩陣轉換成鄰接矩陣,若鄰接矩陣中為的兩個人為將兩點連接。步驟四:重復步驟三,直到找完所有點。畫出人物關系網。5.1.1 方法一模型的建立方法一尋找關鍵人物模型如下:步驟一:找到每個人的與其有通信人的個數記為聯系對象個數,記錄每個人的與其通信次數總和記為活躍度。步驟二:將聯系對象個數與活躍度乘積作為關鍵系數(關鍵系數越高人物越關鍵)。公式如下:步驟三:將關鍵系數最大的幾個作為關鍵人物。5.1.2 方法二模型的建立方法一尋找關鍵人物模型如下:步驟一:找到每個人的與其有通信人的
13、個數記為聯系對象個數,記錄每個人的與其親密度總和記為總親密度。步驟二:將聯系對象個數與活躍度乘積作為關鍵系數(關鍵系數越高人物越關鍵)。公式如下:步驟三:將關鍵系數最大的幾個作為關鍵人物。5.1.3 方法一與方法二求解方法一:把方法一邊權矩陣轉換成鄰接矩陣畫出的人物關系網如圖1:圖1 方法一人物關系網絡圖(橫坐標為人的編號,編號對應人名可由附件1找到)由方法一模型用office的excel處理邊權矩陣得到關鍵人物,用表2表示如下:關鍵人物及其信息表 表2關鍵人物名聯系對象個數活躍度關鍵度職位lavorato-j22241353086CEOdelainey-EOdaso
14、vich-j9218019620Employeearnold-j16102916464Vice Presidentbass-e9179316137Tradertaylor-m11121013310Employeelove-p8147711816N/A方法二:利用美國人的名字結構組成及稱呼3對方法二中的數據對照方法一人名從Namelist2.txt中找到同一名字的150人,處理方法為人為尋找。找到人的全名和簡稱如表1:150人的簡稱及對應全名 表1簡稱全名簡稱全名簡稱全名allen-pPhillip Allenholst-kKeith Holstring-rRingarnold-jJohn Ar
15、noldhorton-sAlonsorodrique-rRobin Rodriguearora-hHarry Arorahyatt-kKevin Hyattrogers-bBenjamin Rogersbadeer-rRobert Badeerhyvl-dDan J Hyvlruscitti-kKevin Ruscittibailey-sSusan Baileyjones-tJonessager-eElizabeth Sagerbass-eEric Basskaminski-vVince J Kaminskisaibi-eSabinabaughman-dDon Baughman Jr.kean
16、-sSteven J Keansalisbury-hShanna Husserbeck-sSally Beckkeavey-pHarveysanchez-mMonique Sanchezbenson-rRobert Bensonkeiser-kKeithsanders-rRichard B Sandersblair-lBlairking-jKingscholtes-dDiana Scholtesbrawner-sSandra F Brawnerkitchen-lLouise Kitchenschoolcraft-dBeverley Ashcroftbuy-rRick Buykuykendall
17、-tJudy Kudymschwieger-jJim Schwiegercampbell-lCampbelllavorato-jJackscott-sSusan Scottcarson-mCarsonlay-kKen Lay - Officesemperger-cCara Sempergercash-mMichelle Cashlenhart-mMatthew Lenhartshackleton-sShirley Crenshawcausholli-mHarry M Collinslewis-aAndrew Lewisshankman-jJeffrey A Shankmancorman-sSt
18、ewart Rosmanlinder-eEarlshapiro-rRichard Shapirocrandell-sScott Goodelllokay-mMichelle Lokayshively-hS Shivelycuilla-mMike Jillardlokey-tTamaraskilling-jJeff Skillingdasovich-jJeff Dasovichlove-pPhillip M Loveslinger-rRyan Slingerdavis-dDavislucci-pPablosmith-mMike D Smithdean-cDeanmaggi-mMike Maggi
19、solberg-gGloria Solisdelainey-dDavid W Delaineymann-kKay Mannsouth-sSteven P Southderrick-jJim Derrickmartin-tMartinstaab-tTheresa Staabdickson-sDicksonmay-lLarry Maystclair-cSinclairdonoho-lLisa Yohomccarty-dDalsteffes-jJames D Steffesdonohoe-tDonna M. Talamomcconnell-mMackstepenovitch-jStephaniedo
20、rland-cChris Dorlandmckay-bBrad Mckaystokley-cStanleyermis-fMatthew F Gockermanmckay-jKaystorey-gGene Humphreyfarmer-dFarmermclaughlin-eErrol Mclaughlinsturm-fFletcher J Sturmfischer-mMark Fischermerriss-sJeromeswerzbin-mMike Swerzbinforney-jJennifer Fornomeyers-aMatthew Meyerssymes-kKate Symesfossu
21、m-dDrew Fossummims-thurston-pPatrice L Mimstaylor-mMark Taylorgang-lMiguel L Garciamotley-mBentleytholt-jJane M Tholtgay-rGay Mayeuxneal-sScott Nealthomas-pThomasgeaccone-tGeorgeannenemec-gGerald Nemectownsend-jHendersongermany-cChris L. Germanypanus-sStephanie Panustycholiz-bBarry Tycholizgilbertsm
22、ith-dGilbertparks-jParkerward-kKim Wardgiron-dGironpereira-sSusan W Pereirawatson-kWatsongriffith-jGriffithperlingiere-dDebra Perlingiereweldon-cCharles Weldongrigsby-mMike Grigsbyphanis-sStephaniewhalley-gGreg Whalleyguzman-mMark Guzmanpimenov-vBill Donovanwhalley-lHarleyhaedicke-mMark E Haedickepl
23、atter-pIlan Caplanwhite-sStacey W Whitehain-mMary Hainpresto-kU.s. Supremewhitt-mMark Whittharris-sStephanie J Harrisquenet-jJoe Quenetwilliams-jWilliamsonhayslett-rRod Hayslettquigley-dKay Quigleywilliams-w3Bill Williams Iiiheard-mMarie Heardrapp-bRaphaelwolfe-jGreg Wolfehendrickson-sBambireitmeyer
24、-jJay Reitmeyerybarbo-pDeborahhernandez-jJudy Hernandezrichey-cCooper Richeyzipper-aAndy Zipperhodge-jJeffrey T Hodgering-aAndrea Ringzufferli-jJefferson利用程序按上表人名的親密度矩陣找出來為附件1,把附件1邊權矩陣轉換成鄰接矩陣畫出的人物關系網如圖2:圖2 方法二下的人物關系網(橫坐標為人物編號,編號對應人物可由附件1找到)由方法一模型用office的excel處理邊權矩陣得到關鍵人物,用表3表示如下:關鍵人物及其信息表 表3關鍵人物名聯系對
25、象個數總親密度關鍵度職位thomas-p1403.38916689474.4834N/Aphanis-s1343.299721574442.1627Employeestepenovitch-j1343.299721574442.1627Vice Presidentjones-t1392.81766384391.6553N/Amckay-j1153.30370807379.9264Directormartin-t1322.84824447375.9683Vice Presidentgilbertsmith-d1252.87000986358.7512Manager5.2 問題二模型建立與求解5.
26、2.1 對兩種方法利弊的評價如表4基于通信次數與通信內容的人物關系刻畫利弊比較表 表4利弊方法一通過通信次數來刻畫人物關系網,能清楚的了解到人物間交流的頻率。人物交流頻率高不一定說明人物關系緊密,也許是人物在工作上必須交流頻繁造成。方法二通過郵件內容來刻畫人物間的親密度,從親密度的大小來區分人物關系的緊密程度,可以明顯區分人物間關系的好壞。郵件內容中,兩人物名字一起出現的頻率高,不能說明兩人親密度高,并且由于人物稱呼的不同導致不同人物稱呼是否是同一個人不明了,關系網也無法明確表示。通過以上比較,本文采用人物關系網絡清晰的方法一來挖掘人物的群集行為。5.2.2 問題二模型的建立通過查閱文獻一1群
27、集行為有四個特點:(1)靈活性,表現對環境的適應性;(2)魯棒性,表現不受內外干擾(抗干擾性強,解決擾動速度快);(3)分散性,表現為單個主體的行為基礎上;(4)自組織,表現為顯著地整體性質,即涌現。結合本文問題分析,需建立一個模型尋找群集中心(在本文中,群集中心就是信息交流的中心)。模型建立步驟如下:步驟一:確定集結點集合和群集集合,分析問題確定領域規則。步驟二:從群集集合中去掉與集結點集合相同的元素,得到新的群集集合判斷,的元素間的關系是否符合領域規則,若符合,就將其加入集結點集合,若不符合找下一個,直至找完群集內的所有元素。得到新的集結點。步驟三:重復步驟二,直到所有的集結點集合與群集集
28、合不存在符合領域規則元素時結束。將最終的集結點集合作為群集中心集合。根據以上步驟得到算法流程圖如下:5.2.3 問題二第二問模型求解和結果分析 基于上述模型,基于方法一人物關系網絡,第一問中方法一所尋找的關鍵人物作為集結點集合,所有人物為群集(人物進行編號為)通信次數的矩陣()中有兩人通信次數大于117(150個人的平均通信次數)的歸于集結點作為領域規則,通過matlab程序zaoji求解,求解結果見表5:群集中心任務編號及對應人名 表5方法一63'lavorato-j'23'delainey-d'20'dasovich-j'2'arno
29、ld-j'6'bass-e'133'taylor-m'70'love-p'142'whalley-l'57'kean-s'126'steffes-j'137'tycholiz-b'80'mclaughlin-e'138'ward-k'65'lenhart-m'55'jones-t'115'shackleton-s'39'giron-d'59'keiser-k'144
30、'whitt-m'54'hyvl-d'125'stclair-c'通過上表結果顯示群集中心有21個人,計算這21個人的通信次數總和為13908占總通信次數17486的79.54%,表明這21個人的活動有79.54%的概率影響到150個人的活動,符合群集行為特點。5.3 問題三模型的建立與求解通過問題二所述組織結構理論上利用方法一的人物組織結構可以找到其他犯罪嫌疑人,但是通過名字對比發現,方法一的結構不能確定已知的三個犯罪嫌疑人位置。而方法二中可以確定已知犯罪嫌疑人的位置,可以用方法二的人物關系網來尋找群集中心。因名字確定方式不唯一,不采用人名不同
31、作為同一人的做法。5.3.1 問題三模型建立與求解將2307個人編號,將已知犯罪嫌疑人編號()作為集結點集合,將每個人的編號集合作為群集集合,將人物親密度矩陣()中大于0.25的人加入集結點集合作為領域規則,通過問題二模型建立問題三的模型。通過matlab程序zaoji2求解出群集中心,將群集中心的人作為犯罪嫌疑人,通過犯罪嫌疑人編號信息從Enron_人名_職位表中獲得人物職位以此制作出表6如下:犯罪嫌疑人名字及職位信息表 表6編號人名職位編號人名職位編號人名職位1227Kenneth LayCEO2015Sherri Sera無59Amit無1044Jeffery SkillingCEO1133JonesN/A255Browning無73Andrew Fastow無1598Mr.Lay無133Barnard無77AndyVice President2254WatsonN/A391Clarke無1226KennethCEO1651Niles無676Ena無1308layCEO1629Nell無1641Niamh無1447Marlin無2016Sherrie無1445Marla無1595Mr.Feygin無1440Mark Greenberg無
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 節能量審核管理制度
- 英語教研組管理制度
- 荊州培訓班管理制度
- 小學語文《端午粽》課件
- 財務會計管理制度模板3篇
- 從對稱美學角度分析蘋果手機的外觀設計
- 大學生戀愛調查報告
- 藍色卡通風眼保健操培訓班
- 2024-2025學年浙教版七年級下學期數學期末考試調研檢測卷(含答案)
- 幼兒園安全煤氣開關不亂動教案
- GB/T 45700-2025物業管理術語
- 綜合辦公室 試題及答案
- 2025超市水果的采購合同
- 安全生產管理制度范本
- 農行現金機具管理制度
- 浙江省寧波市鄞州區2025年八年級下學期期末數學試題及參考答案
- 重慶市主城區七校2023-2024學年高一下學期期末考試英語試題(含答案)
- 2022-2023學年廣東廣州天河區初一下學期期末數學試卷(清華附中灣區學校)(標準版)
- 2025中考英語作文熱點話題預測與范文
- 法治素養考試試題及答案
- 2024-2025人教版一年級下冊數學期末考試卷附答案 (三套)
評論
0/150
提交評論