網站點擊次數的正態分析方法介紹_第1頁
網站點擊次數的正態分析方法介紹_第2頁
網站點擊次數的正態分析方法介紹_第3頁
網站點擊次數的正態分析方法介紹_第4頁
網站點擊次數的正態分析方法介紹_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、論網站點點擊次數數的正態態分析方方法奚回 (單位位略 陜西 西安 71100668)李興波 (保保定金融融高等專專科學校校 河河北 保保定 07110000)(特別說說明:本本文是作作者為了了學習實實證分析析方法而而刻意研研究的一一個問題題,實用用意義可可能不大大,練筆筆而已,敬請各各位專家家批評指指正。)摘要:現現行的網網站點擊擊次數分分析方法法有明顯顯的缺陷陷,其根根源在于于沒有對對點擊次次數作隨隨機變量量考察。本文作作了這種種考察,并驗證證了它服服從正態態分布。正態分分布的參參數可以以幫助網網站分析析其發展展狀況、與同業業比較、制定科科學的管管理目標標、考核核員工等等多種分分析目的的。這

2、種種以正態態分布為為基礎的的分析方方法,本本文暫稱稱為網站站點擊次次數的正正態分析析方法。關鍵詞:點擊次次數;分分析方法法;正態態分布;參數一、網站站點擊次次數現行行分析指指標的缺缺陷和本本文問題題的提出出隨著我國國經濟社社會的發發展,計計算機網網絡的應應用已越越來越普普及,并并發揮著著越來越越重要的的媒介作作用,因因此,如如何管理理網絡也也變得越越來越重重要。對一個網網站來講講,點擊擊次數(本文的的分析方方法,也也適用于于其他類類似于點點擊次數數的現象象,如“某論壇壇某天發發表的文文章數”)的高高低直接接影響著著其經營營目標的的實現程程度,所所以各網網站總是是極盡所所能地提提高其點點擊次數數

3、,并引引入了一一些與點點擊次數數有關的的分析指指標,如如最高點點擊次數數、點擊擊次數的的不同期期比較、點擊次次數的時時間序列列變化、一定期期間點擊擊次數的的平均值值等11。同時,對于點點擊次數數及其他他網絡流流量信息息重要性性的關注注也催生生了商業業性分析析軟件的的應用,如ITTSUNN網站流流量統計計分析系系統22。雖然這這些指標標(含分分析軟件件所用指指標)能能夠在一一定程度度上反映映網站的的管理狀狀況,但但是就對對于點擊擊次數的的分析程程度來講講,仍存存在著明明顯的缺缺陷。主主要表現現在:1、網站站的訪問問者主要要是網站站無法控控制的客客戶,所所以點擊擊次數是是隨機變變量,上上下變動動頻

4、繁,這使現現行分析析指標的的直接根根據點擊擊次數繪繪制的時時間序列列圖波動動劇烈、趨勢弱弱。雖然然我們可可以作回回歸分析析來反映映總體趨趨勢,但但回歸直直線和曲曲線的代代表性都都很差,如圖11所示回回歸直線線的R22僅為00.07713,回歸曲曲線的RR2僅為00.1。而且回回歸線也也不能提提供更為為詳細的的變動信信息。圖1是根根據“晉城在在線”網站220055年7月月1日至至12月月31日日的點擊擊次數繪繪制的時時間序列列圖和回回歸線圖圖,它說說明了此此缺陷的的存在:2、最高高點擊次次數是極極端值,價值有有限。3、各網網站客觀觀上需要要能夠在在同業間間相互比比較的標標準指標標。4、考察察點擊

5、次次數出現現在某個個區間的的概率(或頻率率)有助助于網站站制定科科學的管管理目標標和考核核標準。但現行行的分析析方法沒沒有涉及及此分析析角度。5、點擊擊次數存存在“周周期期性”,即點點擊次數數以一周周為一個個周期上上下波動動。圖2是晉晉城在線線兩周的的點擊次次數時間間序列圖圖,它直直觀地說說明了其其點擊次次數存在在周周期期性:點擊次數數存在周周周期性性的原因因,可能能是因為為大部分分用戶訪訪問網站站的時間間受其工工作時間間的周周周期性的的影響。這種周周周期性性會影響響現行考考核分析析指標結結果的正正確性或或正確程程度。下下面以晉晉城在線線20005年111月和和10月月的點擊擊次數對對比分析析

6、為例,來說明明這種影影響的顯顯著及剔剔除這種種影響的的方法:該網站111、110月的的點擊次次數分別別為95558115099和98802445577次,則則: 1、不考考慮周周周期性的的影響。則111月的日日均點擊擊次數為為318860550次,10月月為311620082次次。比較較可知,11月月的業績績高于110月,因為111月的的日均點點擊次數數上升了了239968次次。但這這只是假假象。2、考慮慮周周期期性的影影響。注注意到,除4個個整周外外,100月余周周一、六六、日33天,111月余余周二、三2天天。我們們已知晉晉城在線線的點擊擊次數明明顯地存存在周周周期性,周六、日在低低點,周

7、周二、三三在高點點,所以以10月月的點擊擊次數合合計明顯顯受低點點影響,而111月則受受高點影影響。要要剔除這這種影響響,方法法是:忽忽略非整整周數據據中的周周周期性性數據,而保留留其中的的非周周周期性數數據(避避免將非非整周數數據中的的非周周周期性數數據也一一同忽略略掉了),然后后將保留留的數據據并入44周數據據中按44周計算算日均點點擊次數數。其中中,某天天(例如如周六)的點擊擊次數周周周期性性數據,就是各各周該天天點擊次次數的期期望值(平均值值)。這這時,111月的的日均點點擊次數數為311681104次次,100月為3316225299次。比比較可知知,111月的業業績比110月僅僅微

8、弱上上升,因因為111月的日日均點擊擊次數比比10月月僅上升升了55575次次。比較而言言,本文文認為第第二種方方法是科科學的方方法。 上述方法法的對比比,說明明了點擊擊次數周周周期性性對于分分析結果果正確性性或正確確程度影影響的顯顯著,而而要理解解并剔除除這種影影響,則則需要對對點擊次次數作隨隨機變量量考察。鑒于以上上對網站站點擊次次數現行行分析指指標缺陷陷的分析析,注意意到:網網站“某一天天的點擊擊次數”是隨機機變量,它服從從正態分分布(后后有實證證檢驗),這使使得利用用正態分分布的參參數(,2)對它它進行科科學考察察成為可可能。所所以,本本文就擬擬從正態態分布的的角度,對網站站點擊次次數

9、分析析方法進進行研究究,以期期能改善善現行指指標的分分析效果果,或提提出更有有效的指指標。本文研究究所用網網站點擊擊次數數數據是“晉城在在線”網站提提供的公公開的“晉城在在線網站站全頻道道點擊次次數月報報表”(20005.7-112)3。在此,對該網網站支持持科學研研究的實實際行動動表示感感謝。另外,在在本文寫寫作過程程中,筆筆者曾查查閱了相相當數量量的文獻獻資料,但未發發現一個個與本文文研究思思路和內內容類似似或有關關的文章章,這使使筆者的的參考與與借鑒無無從進行行,所以以文內的的不足可可能在所所難免,謹期能能拋磚引引玉。二、對“晉城在在線”點擊次次數服從從正態分分布的實實證檢驗驗表面上看看

10、,點擊擊次數是是離散型型數據,但因為為它取值值范圍廣廣泛(00至幾百百萬),所以應應該把它它看作連連續型變變量進行行考察。經筆者者檢驗分分析,證證明晉城城在線的的點擊次次數服從從正態分分布。表表一是根根據晉城城在線220055年7-12月月每天的的點擊次次數樣本本數據計計算的正正態分布布的分布布函數(注意不不是密度度函數)頻率概概率對比比表(其其中為實際際點擊次次數除以以10萬萬后的四四舍五入入): 表1:晉城在在線點擊擊次數分分布函數數頻率概概率對比比表k頻率pk%概率pk%k頻率pk%概率pk%200.5443477826610.0112611348813359.778266087756.

11、99003344114211.0886955652220.0444677931153470.1108669566567.44644462335241.6330433478830.8118466753383577.1173991300477.00211113667252.1773911304431.2773833005543687.5584.77441156442263.8004344782263.0887899573353790.7760886955790.11133329448276.522173391336.199739919333896.1195665211793.88297726778

12、289.78826008699610.337822912283997.228266087796.007022562272911.9956552177415.115466916624097.8826008699697.112388894423020.6652117399124.441444741184198.9913004344898.882555008833130.4434778266134.224299609994299.4456552177499.339300410093247.8826008699645.559299579924310099.77948851227根據該表表可繪制制分布函

13、函數(注注意不是是密度函函數)的的頻率概概率對比比圖(圖圖3)如如下:從圖3直直觀可知知,晉城城在線點點擊次數數的分布布與參數數為(332.99,3.5522)的正正態分布布有較好好的擬合合。另外,還還可以用用2檢驗對對這一問問題(HH0:晉城城在線點點擊次數數服從參參數為(32.9,33.5222)的正正態分布布)進行行更準確確的檢驗驗。檢驗驗結果為為:根據據樣本數數據計算算,得2=400.03343。查2表,得得顯著性性水平為為0.0005、自由度度為211的臨界界值為441.4401。因為2=400.0334341.4011,所以以H0通過了了檢驗,即晉城城在線的的點擊次次數服從從參數為

14、為(322.9,3.5522)的正正態分布布。44三、利用用正態分分布參數數對晉城城在線發發展狀況況和內部部考核的的分析(一)、對網站站發展趨趨勢的分分析網站管理理者首先先應正確確理解其其網站的的整體發發展趨勢勢,但如如前所述述,圖11的分析析不能很很好地提提供這方方面的信信息。所所以,客客觀上需需要一種種更好的的指標來來反映點點擊次數數的發展展趨勢。正態分分布的參參數是其隨隨機變量量的期望望值,其其含義為為均值,可以作作為點擊擊次數的的代表。在本例例中,=322.9;而標準準差為3.52,遠小于于,所以以,的變化化可以很很好地反反映點擊擊次數的的發展趨趨勢。下下圖(圖圖4)是是晉城在在線點擊

15、擊次數的的變化曲曲線圖:從該圖可可以得到到以下信信息:1、整體體上,晉晉城在線線點擊次次數呈穩穩定下降降趨勢,但最近近有回升升的跡象象。2、在約約第255至655日間,點擊次次數快速速上升,并維持持在較高高的水平平。此后后,點擊擊次數卻卻一再穩穩定下降降。在約約85日日附近情情況有所所改善,但沒能能逆轉。最后110日左左右,點點擊次數數有回升升的跡象象,但幅幅度不大大。上述趨勢勢至少給給網站提提出了兩兩個研究究命題:1、判斷斷點擊次次數下降降的性質質,分析析原因。從性質質上,可可以初步步推斷下下降是系系統性的的。這說說明晉城城在線整整體服務務質量與與市場需需求有一一定的距距離。2、對系系統性下

16、下降之外外的變動動進行分分析,即即對點擊擊次數的的3個上上漲期作作細致的的調查分分析,為為采取逆逆轉措施施提供思思路。需要說明明的是:查看圖圖5時應應忽略起起初的幾幾個值或或部分值值,因為為此時數數據量太太少;圖圖五反映映的變化化有遲滯滯現象,實際情情況的發發生要比比圖5反反映的早早幾日;根據多多個需要要,制作作多個數數據量的的圖五更更有利于于分析。(二)對對同業間間相互比比較的分分析由于能能夠作為為點擊次次數的代代表,可以反反映這種種代表性性的強弱弱,所以以它們可可以用作作同業間間相互比比較的標標準指標標(數據據時期要要相同)。同樣樣,可以以計算多多個進行比比較,也也可以使使用連續續的變化曲

17、曲線圖(圖5)進行更更詳細的的比較。由于沒沒有其他他網站的的數據,所以本本文不作作同業比比較的實實例分析析。(三)對對網站制制定科學學管理目目標的分分析管理目標標分長遠遠目標和和近期目目標。1、對晉晉城在線線長遠目目標的分分析從圖5可可以判斷斷其點擊擊次數的的下降是是系統性性的,在在外部環環境和內內部管理理沒有發發生顯著著改善以以前這種種趨勢不不會改變變。外部部環境是是客觀存存在,所所以應從從內部管管理著手手來延緩緩或逆轉轉這種趨趨勢。這這就是該該網站在在可預見見的未來來的長遠遠目標。為了達達此目標標,晉城城在線應應對其網網站服務務質量進進行細致致的考察察,因為為其點擊擊次數的的穩步下下降與網

18、網絡發展展的總趨趨勢(按按幾何級級數增長長5)相反反。2、對晉晉城在線線近期目目標的分分析。從近期(如一個個月)來來講,則則應以近近幾期(如近33個月)的數據據計算的的為依據據。具體體目標應應確定為為比略大的的某個區區域,如如+/100,+/5,表述述為(+1)。具體體略大指指大多少少,視管管理力度度的大小小決定。(四)對對網站內內部考核核指標的的改善科學剔除除點擊次次數周周周期性影影響,可可以使剩剩余的點點擊次數數數據與與員工的的工作努努力程度度的相關關性進一一步提高高,使日日均點擊擊次數能能更好地地反映員員工的業業績。這這個舉例例前面有有,不再再重復。另外,一一個經營營期結束束后,實實際的點點擊次數數往往與與目標不不一致,這時就就要分析析其差異異性質(有利差差異還是是不利差差異)、大小、原因。服從正正態分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論