




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、通話數據分析摘要本論文主要是根據題目給出的大量的通信記錄數據通過Matlab、Excel、Lindo等工具進行整理分析,從整理的結果中找到需要建立的數學模型。本文中整理出了大量的圖表來說明要表達的問題。問題一主要是通過數據的分析,發現所有主叫者的總通話時間呈現對稱分布,聯系人數主要集中于2到4人之間,為此我們根據這兩組數據進行組合來進行對用戶分類。其中總通話時間是小于2100認為較短,大于4900認為較長,位于兩者之間認為中等。聯系人數是小于等于4人認為較少,大于4人認為較多。為此本該將用戶分為六類,但是我們發現其中一組的用戶數為零。所以最終將用戶分為五類:總通話時間較短,聯系人數較少的一組有
2、27個用戶;總通話時間中等,聯系人數較少的一組有161個用戶;總通話時間較長,聯系人數較少的一組有51個用戶;總通話時間中等,聯系人數較多的一組有53個用戶;總通話時間較長,聯系人數較多的一組有8個用戶。另外總通話時間較短,聯系人數較多的一組有零個用戶。問題二主要是根據第一問的用戶分類結果利用層次分析法對推出的新業務進行分析。利用層次分析法可求出每一項業務與每一類用戶的相關度。選擇相關度最大的一類用戶作為本項業務的首推人群。解題過程中是以親情號這一業務為例,利用層次分析法選擇首推人群。然后又結合著基站數據對模型進行了一些改進。關鍵詞 通話數據 聯系人數 通話時間 層次分析法 Matlab Li
3、ndo 覆蓋率問題重述1.1 問題背景通信技術的不斷發展拉近了人與人之間的距離。電話作為主要的通信工具之一悄無聲息地將我們聯系在一起,形成一個巨大的社交網絡。這個巨大的社交網絡對當前的通信設備和業務提出了更高的要求。如何利用現有的通話記錄數據進行概括分析,以便作出合理的決策,進而改善通信設施、拓展新的通信業務,依然是很多通信公司所面臨的一個難題。1.2 問題提出附件給出了一家通信公司公布的2009年6月份某地300個用戶10天內的通話記錄,試完成以下問題。(1)請根據這些通話記錄信息建立數學模型以對用戶分類。(2)如果需要推出一款新的通信業務,如何合理選擇部分用戶作為首選推廣人群。說明你的理由
4、,并撰寫一份不超過兩頁的給公司經理的建議。(3)該地現有的通信設施(如基站等)建設情況是否合理。如需改進,請給出合理的建議。2 問題分析附件中給出了大量的通信記錄的數據,我們必須首先對這些數據進行整理分析,從中找出各組數據之間存在的直接或間接的關系,進而解決下面的問題。2.1 問題(1)分析該問題要求通過對通話記錄信息來建立數學模型對用戶分類,而附件中給出了主叫者、被叫者、通話時長、主叫者所屬基站等數據。通過粗略分析應該從主叫者聯系的人數或通話次數以及每個主叫者總的通話時間來進行對用戶分類。用這兩方面的限制條件來對用戶綜合分類。2.2 問題(2)分析這一問是針對上面的第一問來提出的。問題要求是
5、需要推出一款新的通信業務,如何合理選擇部分用戶作為首選推廣人群。那么這一人群應該是根據這一業務的適合人群以及用戶數量的多少來確定。應該考慮到這一業務的推廣空間是否足夠大,用戶是否足夠多。2.3 問題(3)分析該問是考慮現有的通信設施是否合理。題中給出的關于基站的數據應該作為主要的研究對象。必須考慮基站的使用人數以及使用的總時間,從基站的使用狀況以及承受能力等方面考慮。如果不合理,在進行改進的時候也應該從這方面入手,盡量使每個基站使用均衡,避免個別基站使用過少而個別基站使用過多的情況發生??梢詫κ褂幂^少的并且靠近的基站進行合并,在使用較多的基站附近再增加新的基站來減輕原有基站的工作壓力。3 基本
6、假設為了對問題的求解進行一定的簡化,不過多的考慮更多的無關緊要的因素,減少不可預知的因素(比如人口的變動、通話不均衡)的影響,我們在本問題的求解中作出如下假設:(1)假設此地300個用戶保持不變,即這300個用戶不會移出本地,也不會增加新的用戶。(2)假設這300個人10天內的通話記錄信息能反映該地區平時通話狀況的總體情況。(3)此地用戶打電話的話費標準一樣。(4)每個基站的使用總時長沒有超過最大的承受能力。(5)每個基站的覆蓋范圍大體上是半徑為8Km的圓形區域。(6)每個基站的實際使用量與其周圍的用戶數量近似呈正比關系。(7)假設不考慮近距離間的基站的相互干擾。4 符號說明為了在問題的求解中
7、便于敘述,使用了一些符號,在這里對一些符號進行說明:thcs:每個主叫者在10天內打電話的次數;b:每個主叫者在10天內聯系的人數;thsj:每個主叫者在10天內打電話的總的時間;A:打電話的時長較短、聯系人數較少的用戶群;B:打電話的時長中等、聯系人數較少的用戶群;C:打電話的時長較長、聯系人數較少的用戶群;D:打電話的時長中等、聯系人數較多的用戶群;E:打電話的時長較長、聯系人數較多的用戶群;5 模型的建立與求解5.1 問題(1)的求解利用Matlab對給出的數據進行匯總分析,分別求出了每個主叫者在這10天之內打電話的次數、聯系的被叫者數(即聯系的人數)、打電話的總的時間。另外還統計了每組
8、聯系人數所對應的主叫者的數量以及所對應的主叫者編號。圖一表示的是聯系的人數與每組所對應的主叫者數量之間的關系。其中橫坐標表示的是聯系的人數,縱坐標表示的是每一組聯系的人數所對應的主叫者的數量。 圖一 聯系人數與主叫者數量間的關系此圖表說明在這300個主叫者中,大部分都是聯系二至四個人,一共有230人,真正聯系人數很多的主叫者所占的比重很小。將打電話的總的時間進行分段,分為(0,1000)、(1000,2000)、(2000,3000)、(3000,4000)、(4000,5000)、(5000,6000)、(6000,7000)共七個區段,然后統計出每個區段內的主叫者的數量。作出的圖表如圖二所
9、示,其中橫坐標表示各個區段,縱坐標表示主叫者數量。 圖二 各時間段內主叫者數量統計圖由圖二可以看出打電話的總時間位于(2000,5000)時間段內的人數為223人,所占的比重很大。下面的圖三表示的是每個主叫者通話的次數(thcs)與總的通話時間(thsj)之間的關系。其中橫坐標為thcs,縱坐標為thsj。圖三 通話次數與通話總時間之間的關系由上圖看出每個主叫者隨著通話次數的增加,其總的通話時間也隨著增加,兩者近似呈線性關系。圖四是每個主叫者聯系人數與總的通話時間之間的關系圖。其中橫軸為聯系人數(b),縱軸為總的通話時間(thsj)。圖四 主叫者聯系人數與總的通話時間的關系圖該圖上反映的情況與
10、圖一、圖二反映的情況有一定的相似性。從橫軸來看,聯系的人數多集中于2、3、4。從縱軸來看,打電話的總時間呈現對稱分布,并且多集中于2000至4000之間。另外在圖的右下角有一片空白區域,即表示在聯系人數較多時,打電話的總時間很短的主叫者不存在。因此,我們綜合考慮以上各圖表所反映出來的信息,主要從每個主叫者在十天內的總通話時間與此主叫者聯系人的個數對用戶進行分類。分類的基本思想是每個主叫者總通話時間的多少與此主叫者聯系人多少的組合。為了得到“時間長短”的量化指標,我們設相應的評語集為很長,較長,中等,較短,很短,一般的認為“較長”所對應的數值為0.7,“較短”所對應的數值為0.3。我們統計出來的
11、主叫者的總的通話時間的最大值為6980,這樣根據這一數值就可確定總的通話時間小于2100的就認為較短,大于4900的就認為較長,介于2100到4900之間的就認為通話時間為中等。為了得到“人數多少”的量化指標,我們取0.3為分界值。統計數據中聯系人數最多的為14人,所以確定小于等于4人為聯系人數較少,大于4人為聯系人數較多。根據總通話時間的長短和聯系人數的多少來進行分類,初步分為六類,分別是:通話時間較短,聯系人數較少;通話時間中等,聯系人數較少;通話時間較長,聯系人數較少;通話時間較短,聯系人數較多;通話時間中等,聯系人數較多;通話時間較長,聯系人數較多。利用Matlab根據這兩個條件進行求
12、解后發現,通話時間較短并且聯系人數較多這一類的主叫者的數量為零。這樣一共將所有的主叫者分為了五類。具體的分類結果見表一。其中的A、B、C、D、E見符號說明。表一 用戶分類結果類別ABCDE主叫者33 62 69 7891 105 109 112 113 141 145 148 175 179 185 189 202 205 208 211 243 248 250 275 276 280 300 16 22 25 28 31 36 45 46 48 50 57 60 63 64 65 68 74 77 79 81 83 84 85 86 89 94 95 96 98 99 100 101 102
13、 106 107 110 114 115 116 117 118 123 126 129 130 131 132 133 134 135 136 138 139 140 142 143 146 147 150 151 152 153 154 155 156 157 163 164 165 166 168 169 171 173 174 177 181 182 183 184 186 188 190 191 192 195 196 197 198 199 201 204 206 207 210 212 213 214 215 216 218 219 220 221 222 223 224 225
14、 226 227 229 231 232 233 234 235 237 238 239 240 241 242 244 245 247 251 252 253 254 256 257 260 261 262 264 265 266 267 268 269 270 271 272 273 274 278 279 281 283 285 288 289 290 291 292 293 294 295 296 298 299 29 39 43 58 59 67 72 73 76 82 88 104 108 111 119 121 122 124 125 127 128 144 149 159 16
15、0 161 167 176 178 180 187 193 194 203 209 217 228 230 236 246 249 255 258 259 263 277 282 284 286 287 297 1 2 3 4 5 6 8 10 11 12 13 14 17 18 19 21 23 24 26 27 30 32 34 35 37 38 40 41 42 44 49 51 52 54 55 56 61 70 71 75 80 87 90 92 93 97 103 120 137 158 162 172 200 7 9 15 20 47 53 66 170人數27 161 5153
16、85.2 問題(2)的求解 問題求解表二 用戶分類與推廣業務間的關系表用戶分類類相關度兩大類業務I(與人有關的業務)II(與通話時間有關的業務)A173B75C77D15E17例如四項業務與I和II的相關度分別如下: 1,情侶派:(9,1) 2, 親情號:(9,1) 3,十元包100分鐘長途:(3,7) 4, 長話派,3元/月的功能費。每分鐘話費減少。(5,9)利用層次分析法可求的每一項業務與每一類用戶的相關度。選擇相關度最大的一類用戶作為本項業務的首推人群即可!現在以親情號為例,利用層次分析法選擇首推人群。圖五 用戶群與推出業務間的層次分析圖第二層對第一層的對比矩陣M為M=,特征值v=2,歸
17、一化的特征向量W=(0.7,0.3)第三層對第二層的對比矩陣N1和N2為N1=,特征值g=5,歸一化的特征向量f=(0.30435,0.30435,0.30435,0.04346,0.04346) N2=特征值i=5,歸一化的特征向量h=(0.3348,0.1395,0.1931,0.1395,0.1931)最終相關向量為Z=(f,g)W=*=由此可得第一類與目標業務相關度最大,應該作為首推人群。其他相關業務與此類似。只是與準則層的相關系數不同,可以用相同方法求得首推人群。5.2.1 模型改進模型改進后將使用戶的分類拓寬,及再添加一個準則主叫者所使用的基站,這樣可以使問題更加全面。如此再考慮推
18、廣的新業務時,包含了“小區內通話優惠”等業務。 此時再利用層次分析法決策時,準則層需再加一項“偏重于與主叫者所在區域有關的業務”。有附件給的圖可主觀的將此地區劃分為四個區域,在具體討論即可。 由圖六可知:大約1/3的人使用一個基站的概率在80%以上,此部分人可定為固定用戶,當開通“小區優惠業務”時,應作為首推人群,當然在第一問用戶分類時就要將此部分人劃為一類了。圖六 固定用戶所占比例5.3 問題(3)的求解6 模型評價與改進針對問題一我們只考慮了每個主叫者的通話總時間與聯系人數之間的關系,進而對用戶進行了分類。只是簡單的對用戶分為了五類,而沒有考慮到利用基站的數據對用戶進行分類。這樣使問題進行
19、了簡單化。如果第一問再根據基站的數據進行分析分類,將會使問題解決得更加完美一些。問題二利用層次分析法對推出的新業務進行分析,然后又對模型進行了一些改進。主要是和問題一相似,又把基站的因素考慮進來,然后使模型更加完善。7 參考文獻1 韓中庚,數學建模方法及其應用,北京:高等教育出版社,2005年6月。2 吳建國,數學建模案例精選,北京:中國水利水電出版社,2005年5月。 附錄:1、x=importdata(D:workzhujiaozhe.mat); %導入主叫者的數據y=importdata(D:workshijian.mat); %導入通話時間z=importdata(D:workbeij
20、iaozhe.mat); %導入被叫者的數據thcs=zeros(1,300); %設定通話次數矩陣thsj=zeros(1,300); %通話時間矩陣for j=1:6221 for i=1:300 if (x(j)=i) thcs(i)=thcs(i)+1; thsj(i)=thsj(i)+y(j); end endendthcsthsjc=zeros(300,300); %每個主角用戶打電話次數統計for s=1:6221 if (c(x(s),z(s)=0) c(x(s),z(s)=1; endendb=zeros(1,300);for t=1:300 for r=1:300 b(t)
21、=b(t)+c(t,r); endendb nihe=zeros(14,1); %每一組打電話次數中主角用戶數統計for w=1:14 for i=1:300 if (b(i)=w) nihe(w)=nihe(w)+1; end endendnihesubplot(2,1,1);bar(1:14,nihe)d=zeros(1,7); %打電話的時間分別位于0至1000,1000至2000。之間的用戶數的統計for j=1:7 for i=1:300 if (thsj(i)(j-1)*1000) & (thsj(i)=j*1000) d(j)=d(j)+1; end endenddu=1000:
22、1000:7000;subplot(2,1,2);bar(u,d)ab1=; %對用戶按時間2100、4900,人數4分組,分六組ab2=;ab3=;ab4=;ab5=;ab6=;h=1;f=1;m=1;n=1;p=1;q=1;for i=1:300 if (thsj(i)=2100) if (b(i)=4900) if (b(i)=4) ab3(m)=i; m=m+1; else ab6(n)=i; n=n+1; end else if (b(i) M=1,7/3;3/7,1M = 1.0000 2.3333 0.4286 1.0000 w,v=eig(M)w = 0.9191 -0.919
23、1 0.3939 0.3939v = 2 0 0 0 N1=1,1,1,7,7;1,1,1,7,7;1,1,1,7,7;1/7,1/7,1/7,1,1;1/7,1/7,1/7,1,1N1 = 1.0000 1.0000 1.0000 7.0000 7.0000 1.0000 1.0000 1.0000 7.0000 7.0000 1.0000 1.0000 1.0000 7.0000 7.0000 0.1429 0.1429 0.1429 1.0000 1.0000 0.1429 0.1429 0.1429 1.0000 1.0000 f,g=eig(N1)f = -0.9417 -0.573
24、5 0.1824 -0.8482 -0.9417 0.2354 -0.5735 0.8204 0.0296 0.2354 0.2354 -0.5735 0.5196 0.5281 0.2354 0.0336 -0.0819 -0.1087 0.0207 0.0336 0.0336 -0.0819 -0.1087 0.0207 0.0336g = 0 0 0 0 0 0 5.0000 0 0 0 0 0 0.0000 0 0 0 0 0 -0.0000 0 0 0 0 0 0 N2=1,3/5,3/7,3/5,3/7;5/3,1,5/7,1,5/7;7/3,7/5,1,7/5,1;5/3,1,5
25、/7,1,5/7;7/3,7/5,1,7/5,1N2 = 1.0000 0.6000 0.4286 0.6000 0.4286 1.6667 1.0000 0.7143 1.0000 0.7143 2.3333 1.4000 1.0000 1.4000 1.0000 1.6667 1.0000 0.7143 1.0000 0.7143 2.3333 1.4000 1.0000 1.4000 1.0000 h,i=eig(N2)h = -0.7022 0.2394 0.7022 -0.6016 -0.6016 0.2926 0.3990 -0.2926 0.4669 + 0.3511i 0.46
26、69 - 0.3511i 0.4096 0.5587 -0.4096 0.0901 - 0.0085i 0.0901 + 0.0085i 0.2926 0.3990 -0.2926 0.4070 - 0.3389i 0.4070 + 0.3389i 0.4096 0.5587 -0.4096 0.0901 - 0.0085i 0.0901 + 0.0085ii = 0 0 0 0 0 0 5.0000 0 0 0 0 0 0.0000 0 0 0 0 0 0.0000 + 0.0000i 0 0 0 0 0 0.0000 - 0.0000i4、問題二模型該進數據主叫者使用基站數使用最多次的基站
27、所使用的次數使用次數最多的基站的序號每個主叫者總的使用基站次數使用最多次的基站使用次數與總的使用基站次數的比值1123112312111111113291120.7542915150.652111140.78571428663811160.5721711310.548387097821211220.545454545922425320.75102131180.722222222112101180.55555555612120112011321313210.6190476191421110210.523809524152187280.6428571431612211221173923150.61
28、831220200.61912112112013113112121511260.5769230772221024170.5882352942321911200.95242111190.57894736825117111712621011190.526315789272158250.628121222112922025320.625302918130.692307692312101130.7692307693221011150.666666667332611100.63421315170.7647058823521515200.753612511251372922160.562538121121
29575757576402724140.54121411190.7368421054221113180.6111111114321915280.6785714294421121150.7333333334521327250.52462241250.964721611310.51612903248119111914931111210.5238095245021215240.55131016240.416666667522618120.55321811300.65422111230.9130434785521327260.55621822190.947368421572101
30、5200.55822223380.5789473685931715360.472222222602820120.6666666676121411160.875622724110.6363636366322311240.9583333336421311160.81256521411200.7661351135167131163116821011180.55555555669341760.6666666677021420230.60869565271119111917221717300.56666666773131213117422011260.7692307697521617270.592592
31、59376128112817731411240.5833333337821016130.769230769792911110.8181818188021611260.6153846158121410240.5833333338222113350.6833121230.521739138421111130.846153846852201220.90909090986364120.58731211230.5217391388130113018911611161902151210.714285714911101101921181181931181118194376120.58333333395210
32、27190.526315789963126160.75971152215198361130.4615384629921211170.705882353100121121110121019130.76923076910221613180.88888888910321118210.52380952410422426360.6666666671051911911062824150.5333333331072819160.510831511310.483870968109111111111102717130.53846153811113011301112251880.625113271120.5833
33、333331142131210.619047619115115171511162171260.653846154117117111711182151260.57692307711921520280.53571428612021111160.687512121811260.69230769212221624300.53333333312321125180.611111111124127127112521811280.6428571431262168220.7272727271272153280.535714286128130113011291181118113031311230.56521739
34、113121822210.85714285713221822200.913321413270.5185185191343927140.64285714313521211150.81362910150.613721611250.6413831111170.6470588241392924170.52941176514021011130.769230769141251160.8333333331421131113114321511240.62514432116320.65625145251180.6251461241241147120112011482711110.6363636361492222
35、1330.66666666715021016200.51513126200.615231011160.625153291170.5294117651541171317115521411200.71562721140.5157118118115821022130.76923076915922011300.66666666716022522270.9259259261612231350.65714285716212512511632722110.6363636361642151230.6521739131651221122116622011260.76923076916722315320.7187
36、516831225260.46153846216921311230.56521739117022523340.73529411817121127180.61111111117221111210.52380952417331115220.51742211230.9130434781751919117622518360.69444444417731422260.53846153817831411260.5384615381791212118021710250.6818131215190.63157894718231511240.6251831181181184292170.529411765185
37、251390.55555555618621322230.565217391187128128118822211230.95652173918915115119021411260.5384615381911282228119221811200.919321422260.53846153819431719290.58620689719521115200.551961151115119721311140.9285714291982116180.61111111119931014190.52631578920021911230.82608695720131411220.6363636362021112
38、211120321422280.520421213180.6666666672051111111120622021210.9523809522072131230.565217391208261790.66666666720922011270.74074074121021027140.7142857142112915110.81818181821231611240.66666666721321125200.5521411911191215121112112161181118121731522280.53571428621812112112193821160.522021524230.65217391322121520170.88235294122221010170.5882352942232151200
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新解讀《CB-T 804-1999航海磁羅經系列》新解讀
- 采購框架協議范本
- 2024年血橙提取物化妝品資金籌措計劃書代可行性研究報告
- Brand KPIs for health insurance:Seguros Monterrey New York Life in Mexico-英文培訓課件2025.4
- 廣西壯族自治區河池市2022-2023學年高二下學期化學期末考試試題(含答案)
- 商丘物業公司管理制度
- 各項教育常規管理制度
- 初中英語八年級下冊統編教案 uunit8
- 介紹搶購活動方案
- 從事營利活動方案
- 2024-2030年中國風電運維行業發展現狀規劃分析報告
- 2025年中考語文專題復習:寫作技巧 課件
- 護理漏執行醫囑不良事件
- 2024年重慶市九龍坡區某中學小升初數學試卷(含答案)
- 醫院培訓課件:《醫療廢物分類及管理》
- 2023年天津中考歷史試卷
- 改革開放簡史(北方工業大學)知到智慧樹章節答案
- 公司安全事故隱患內部舉報、報告獎勵制度
- 電梯維修質量控制制度
- 急診科臨床診療指南-技術操作規范更新版
- 水擊獲獎課件
評論
0/150
提交評論