2012美賽論文翻譯_第1頁
2012美賽論文翻譯_第2頁
2012美賽論文翻譯_第3頁
2012美賽論文翻譯_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、逮捕罪犯模型你的組織,ICM正在對一項密謀的犯罪行動進行調查。調查人員非常清楚一 些參與密謀的人,希望能夠確定其他成員和他們的領導之后進行逮捕。罪犯和犯 罪嫌疑人都在一家大的公司的一個綜合辦公室里工作。這家公司成長很快并以自 己的名字命名在研發一種軟件并面向銀行和信用卡公司銷售。ICM最近發現了這個公司82名員工一小部分的信息,相信可以幫助他們找到最有可能的未知合伙人 和領導。因為信息業務是面向所有的員工,因此很有可能一些(可能一大部分) 指定的溝通員并不涉及此次的密謀。實際上,調查人員很清楚有一部分的人并不涉及此案。建模的目標就是確定這個綜合辦公室里誰最有可能是罪犯。列一個有先后次序的列表有

2、助于ICM實施監督,并進一步審問。明確的劃分共犯和非共犯 也能幫助區分每組的人員。當然如果指出密謀的領導者對D/公司也會有幫助。在給出這次案件數據之前,你的主管給了你一份她幾年前在別的城市工作的 這種情況的方案(調查EZ)。盡管她對自己調查EZ勺案子很滿意,但她說那只是 個小的簡單的例子,并會對你理解你的任務有所幫助。她給的數據如下:她認為有十個人是共犯:Anne#, Bob, Carol, Dave*, Elie n, Fred,George*, Harry, I nez, and Jaye#.(*表示這其中共犯可能性大的,#表示非共犯可能性大的)。28個信息的年表她基于自己的分析都做了相應

3、的標號:文檔收集自網絡,僅用于個人學習Anne to Bob:你今天為什么遲到? ( 1) Bob to Carol:那個死Anne總是監督我。我沒遲到(1) Carol to Dave:Anne 和Bob又在爭論著Bob的磨嘰。(1) Dave to Elle n:我今天早上要見你。你什么時候來?把預算文檔帶來。(2)Dave to Fred:我今天什么時候都能去見你。告訴我什么時候合適。我需要帶預 算文檔么? ( 2)Dave to George:我待會兒去見你要談好多事情。我希望其他人的也準備好了。把這些弄好了很重要。(3) Harry to George:你壓力太大了。到底怎么了 ?我

4、們的預算會沒問題的。(2) (4) Inez to George:我今天特累。你過得怎么樣? ( 5) I也很累Jaye to Inez:沒什 么進展。想去吃午餐么? ( 5)Inez to Jaye:幸好很安靜。我很累。今天不去吃午飯了,對不起! (5)George to Dave:該談談了現在! ( 3) Jaye to Anne:你今天去吃午飯么?(5)Dave to George:不行。我在正要去見Fred的路上呢。(3) George to Dave:去完那兒到這兒來。(3)Anne to Carol:誰該監督Bob?他總是游手好閑。(1)Carol to Anne: 別管他。他和G

5、eorge and Dave 一起工作的很好。(1)George to Dave:這很重要。該死的Fred。Ellen那邊怎么樣了?( 3)沒準可以 推出 E是Ellen to George: 你跟 Dave談了么? ( 3)George to Ellen: 還沒呢。你呢?( 3)Bob to Anne:我沒遲到。就像你知道的我午飯時間都在干活。(1)Bob to Dave:告訴他們我沒遲到。你了解我的。(1)只有D了解BElie n to Carol:找Anne并確定好下周預算會議的程序,還要幫我把George冷靜下來。(2)Harry to Dave:你沒發現今天George又壓力特大么?

6、 ( 4)Daveto George:死Harry認為你壓力太大了。別讓他擔心否則他又該絮叨了。( 4) George to Harry:就是總是加班再加上家里出了些問題。我會沒事的。( 4) H 不是Elie n to Harry: 如果我錯過了今天的會,有事么? Fred會在的而且他比我 更了解預算。(2)Harry to Fred:我認為明年的預算對許多人都施加了壓力。也許我們今天需要花點時間給他們減減壓了。( 2)( 4)Fred to Harry:我認為我們的預算很健康。我看不到任何有壓力的東西。(2)信息量結束。文檔收集自網絡,僅用于個人學習你的主管指出她只破解信息中五個不同的主題

7、:1)Bob很磨嘰,2)預算,3)重要的位置問題但是假設是密謀的一部分,4)George的壓力,5)午飯和其他的社會問題。在信息的編碼中可以看到,有些信息根據內容有兩個主題。你主管分析她的情況時用的是一個顯示溝通聯系和信息種類的網絡的方法。 下面的圖表是一個信息網絡的模型以及結果中的信息種類的編碼都標注在網絡 圖里。文檔收集自網絡,僅用于個人學習(1)(1/ (1)(1F George你的主管指出已知的共犯 George and Dave,和Elien and Carol是通過分析 得出的,以及后來Bob自己為了減刑承認犯罪了,但是對于Carol的指控后來撤消 了。你的主管也十分確定Inez也

8、涉及此案,但是始終無法對她立案。你的主觀的 建議是你們組一定要明確犯罪雙方這樣像Inez人就不會逃跑了,也不會有人像 Carol 一樣被誤判,同時ICM需要有信譽這樣就不會有人像Bob-樣有機會減刑。文檔收集自網絡,僅用于個人學習你的主管為當前的案例整理了一個網絡式的數據庫,以同樣的格式,但是范圍更大些。調查人員提示說這個密謀是有關挪用公司基金以及用互聯網詐騙盜取 那些與公司有業務往來的那些人的信用卡的錢。主管給你看的EZ小例子只有10個人(節點),27條線(信息),5個話題,1個密謀話題,2個已知共犯和2個已 知的非共犯。到目前為止,新的情況(case)有83個節點,400連接(其中一些涉及

9、超過 1個主題),消息流量已超過21000字, 15個主題(其中3個已被視為是可疑的), 7個已知的同謀者,和8個已知的非同謀。這些數據在所附的電子表格文件中: names.xls , Topics.xls , Messages.xls 。names.xls 包含關鍵節點序號的 辦公室人員名字。topics.xls包含15個主題號碼的代碼,也就是一個主題的簡短 說明。由于安全和隱私問題,你的小組不會有直接傳達的所有信息流量。messages.xls提供傳播消息的鏈接節點(links of the nodes )和消息中包 含的主題代碼。文檔收集自網絡,僅用于個人學習幾個消息包含了三個話題。為了

10、幫忙顯現(visualize可視化)消息流量, 圖2提供了人和消息鏈接(the people and message links )的網絡模型。在這 種情況下,這些消息的話題沒有被表示出來因為在圖1中表示了。這些話題的編號在文件Messages.xls中給出了,而且在文件Topics.xls 中描述了。文檔收集自網絡, 僅用于個人學習Beth$ElsieDwightStephanie*PriscillaAs尹;. Crystal Jerome存Francis 嚴niChr|t GerryDayi Loujs工arlerJ1an-已湎塚尿,Ellrn加Marian.f X,2 UDonaldSh

11、elley 心J /Neal戸加Faut Christina “ fti JjretcTnDougiiiKristineJuhaSandy p垃豎工 .沖腫Zm atrick SeeniarenFantiCole AndrqparkDarol5一廣尸MaiC017 o o*Lars. cLaoBariol p GannaCh. J 伽uanSheng要求1:到目前為止,已經知道 Jean, Alex, Elsie, Paul, Ulf, Yao,和Harvey是同謀。也知道,Darle ne, Tran, Jia, Elli n, Gard, Chris, Paige,和 Este 不是同謀。

12、三個有嫌疑的消息主題(suspicious messagetopics )是7、11和13.更 多關于消息主題的細節在文件Topics.xls中。按照屬于同謀的可能性大小建立模 型和算法,把83個節點(人)區分優先次序,并解釋你的模型和指標。Jerome,Delores,和Gretchen是公司的高級管理人員。如果了解到他們其中任何一個人 涉及到陰謀,將是非常有益的。文檔收集自網絡,僅用于個人學習要求2:如果有新信息確定了 topic 1與犯罪相關,而且 Chris是其中一個同謀者,那 么這個優先清單會怎樣變化? 文檔收集自網絡,僅用于個人學習要求3:獲得和理解與這個消息流量(message

13、traffic )類似的文本信息的一個強 大的技術叫做語義網絡分析;作為一個在人工智能和計算語言學的方法,它提供了有關的知識(消息)或語言推理的結構和步驟。另一種在自然語言處理過程中 的計算語言學能力是 文本分析。就我們的罪犯逮捕方案來講,解釋清楚對消息流 量的內容和背景的語義分析和文本分析(如果你能獲得原始信息)怎樣才能使你 的團隊來開發更好的模型并進行辦公室人員的分類。你對文件Topics.xls中的對話主題描述,是否用了這些capabilities(語義網絡分析、文本分析)來提高你的模型了么?文檔收集自網絡,僅用于個人學習要求4:您的完整報告將最終送到DA,所以它必須詳細而清楚地說明你的

14、假設和方 法,但不能超過20頁。你可以以單獨的文件形式在附件中提交你的程序,而這是不計算在你的頁面限制內的,但提交這些程序并不是必需的。你的supervisor希望ICM成為世界上最好的解決白領階層高科技犯罪的組織,希望你們的方法有 助于解決世界各地的重要案件,尤其是那些消息流量(message traffic )數據非常龐大的案件(成千上萬的人與數以萬計的消息,并可能包括以百萬計的單詞量)。她特別要求你的報告要包括“更深入的進行消息內容的網絡、語義和文本 分析怎樣對你的模型和建議有幫助”這一討論。作為給她報告的一部分,解釋 你已經使用的網絡模型技術以及他們為什么以及怎樣能夠在任何類型的網絡數 據庫中被用來識別(確定)、區分優先次序和分類類似的節點,而不只是限于有 關犯罪陰謀和消息數據。例如,當你有表明感染機率的節點并已確定了一些感 染節點的各種圖像或化學數據時,你的方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論