




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、修正調研數據 擴展使用限度(下)2010年07月02日|用戶研究如何加權一一單變量比例加權為了比較初級買家與高級買家之間對某一產品的體驗差異,采用非等比隨機 抽樣,事先增加了高級買家的抽中比例。虛超數據abcdefgbuystrPopulationSample NSample %任四s)PS B)Weighted SampJeNWeight Sample初皺買家76%500069%0.891.1256167B%中煎翼家20%100014%0.691.44144020%高皺買家瀛120017%8境 |1121442%T血1100%7200100%1.0*1.0*7200100%當需要推及總體買家
2、對這一產品的體驗情況時,需要對數據進行加權,結果 如下:響ghted Mean上表第d列(S/P)是用各級別買家在調研樣本中占的比例除以其在總體中 占的比例,其值越接近1,說明該級別買家在調研樣本中的比重越合適;反之, 其值越背離1,其在調研樣本中的比重越不合適。若恰巧各組的這一比值均接近1,可以近似等同總體分布,而不對調研樣本 進行加權。本例顯然需要對調研樣本進行加權。首先要確定加權的起點在哪里?這里有三種選擇:1)以S/P的最小值(本例0.69)為起點,將其他組的S/P值都降低到這個 水平,因此叫做Scale-downweighting (“水落石出”法)。其結果是將原調 研樣本縮小S/P
3、最小值倍(本例0.69,原調研樣本7200人,每組權重為0.69/d 列相應值,加權后減至4968),放水過多,不合適2 )以S/P的最大值(如本例的8.33 )為起點,將其他組的S/P值都提高到這個水平,這種策略叫做Scale-upweighting (“水高船漲”法)。其結果也 就是將原來的調研樣本放大S/P最大值倍(本例8.33倍,原調研樣本7200人, 每組權重為8.33/d列相應值,加權后會增至59976人),可見水分太大,不可 取。3)以S/P的加權平均值為起點,將大于1的S/P值調低至1而將小于1的 S/P值調高至1,因此叫做Zero-sumweighting(”有增有減但總數不
4、變法)。 加權后的樣本數與原調研樣本相同、還是7200(見表第f列)。可見這種方法 相比之下最合理,學術界和調查業界通常都用它來加權。比例1加權具體操作分為四步:1)計算總體有關參數(如上表第甘列怠體瑕別分布P )如梁沒有這種春救則 無法加牡T*變道的方法是:在總怵中用雀岸殖機抽樣抽取一定數量的樣本,有條件 就多抽取一盟,用這個大樣本的參教代替總體參教)計算調研樣本相應的統計量(如表中匚列,調研樣本虢別分布5 )計算與P之比(表中d列S/P值)的倒數I即e列的P/5 ),這就是岫ghting factor ( “極重“或 枳數“)4)羿樣本海一個,將其皺別分組的值,乘以枳魏場景B的M權處理方式
5、同理比例加權需要注意的幾個問題:1)加權只能調整樣本各組之間的相對比例、并不會產生任何新的信息。2 )-個重要細節是如果S/P值中有小于0.(也即P/S值或權數大于2汩勺, 則不能靠過分灌水來解決問題。這時的對策有三個:增加那些采樣不足的(under-sampled)組別的case數量(上策)用S/P值最小值(Scale-down的策略)來加權(最保守、浪賽資源、 但不犯I類錯誤)前兩者的結合,即增加部分case數然后按新的最小S/P值來加權3)如果那些采樣不足的(under-sampled)組case數量太少(一般不能 少于30),需要按2)同樣的原則來處理。對于2)和3)中提到的情況,另外
6、一種變通的方法就是重新劃分組,此法 省時省力。4)經過加權的樣本,能夠推算總體的常規統計量,但計算誤差時則不能用 加權樣本直接計算。5)為了便于解釋,上述例子只涉及一個變量(買家級別)的加權。實際上, 研究買家除了級別,注冊時長、月成交量/額等也很重要。所以需要用多個變量 同時加權(weightedbyseveralvariablessimultaneously )。(本小節以上內容參考了香港城市大學祝建華博士KLOG文章如何對樣 本進行加權? HYPERLINK /post.2695611.html%e5%9c%a8%e6%ad%a4%e8%a1%a8%e7%a4%ba%e6%84%9f%e
7、8%b0%a2 /post.2695611.html在此表示感謝, 愿祝老師健康、筆耕不輟!)總結一句話:在隨機抽樣的前提下,比例加權的本質就是將調研樣本分布修 正為等比隨機抽樣分布。如何加權單變量推及量加權為什么用推及加權:1)上小節提到的獲取總體參數的變通方法:在總體中用簡單隨機抽樣抽取定數量的樣本,能夠獲得一個較大的樣本,用來推及總體依然帶有少許誤差。用加權處理的調研樣本推及這個大樣本群體的行為和態度更為恰當,有時候需要 直觀的知道這個大樣本群體中每種劃分的組內有多少人。比例加權的運算方法有些麻煩;而推及量加權的運算方法簡便。推及加權的依據:1)加權的前提與比例加權相同:修正非等比隨機抽
8、樣NPPS和等比隨機抽樣PPS2)兩種方法等價:比例加權:Pn%/Sn%推及量加權:Pn/Sn=(Pn%*P)/(Sn%*S) = (Pn%/Sn%)*P/S 由于每一組 case相對于比例加權都擴大了 P/S倍,即每一個樣本都擴大了 P/S倍。絕大部 分研究結果都以比例呈現,而計算比例的時候,每一個樣本擴大的P/S倍沒有 影響,因此推及量加權適用。推及量加枳具缽操作分為四步:1)計算總體有關參數(如總體每個級的個住數量P),如果沒有這種毒教 則無活加枳“一種變道的方法是:在總體中用簡單隨機抽樣抽取一定數量的樣本,有條件 就多抽取一些,用這個大樣本的善數代替總體眷數)計聳調研樣本相應的湍也(如
9、樣本每個圾割的85E數吊)計真p與s之比r就是weighting factor (權重或枳數”)4)對樣本年一個昂脂,將其鍛別分粗的值,瓣以權規推及量加權需要注意的事項與比例加權相似,此不贅述。如何加權多變推及加權加權的步驟和方法相同單變量加權時,以買家級別組為例,需要分別統計三組的總體比例(量)和調研樣本的比例(量)多變量加權時,各個變量進行交叉,如三組級別、三組注冊時長、三組月成交量,即組合出27組,分別統計這27組的總體比例(量)和調研樣本的比例(量)總結一句話:多變量加權實際上就是單變量加權的復雜版。如何加權一一實際操作通過EXCEL和SPSS對數據進行加權:1)通過SPSS計算總體中大樣本的有關參數和調研樣本相應的統計量2)將結果放入EXCEL進行整理,注意單變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 通力電梯t1試題及答案
- 教師資格證考試試題
- 疫苗的面試題及答案
- 大數據在2025年信息系統中的應用試題及答案
- 公共政策實施中的隱性成本與效益分析試題及答案
- 職業規劃中的軟件設計師考試及試題及答案建議
- 網絡工程師考試趨勢分析試題及答案
- 西方政治制度2025年發展試題及答案
- 剖析西方政治制度的變遷軌跡試題及答案
- 網絡技術與服務模型試題及答案
- 危重患者護理課件(完整版)
- 臨床試驗流程培訓
- 《常德津市牛肉粉》課件
- 智聯招聘國企行測
- 宜賓學院《操作系統原理》2022-2023學年第一學期期末試卷
- 中考語文真題專題復習 名著導讀(第03期)(解析版)
- 【MOOC】工業設計面面觀-鄭州大學 中國大學慕課MOOC答案
- 術中獲得性壓力性損傷預防專家共識2023
- 2023年高考真題-物理(福建卷) 含答案
- 微專業合作建設協議
- 第五單元 探索1 互聯網安全風險及其產生原因教學設計-2023-2024學年蘇科版(2023)初中信息科技七年級下冊
評論
0/150
提交評論