




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Good is good, but better carries it.精益求精,善益求善。chap5比估計與回歸估計-Chap5比估計與回歸估計教學要求:重難點:引語:(請學生回顧)前面介紹過的目標量有四個類型:總體均值、總體總量、總體比例、兩個指標的總數或均值的比值,在簡單隨機抽樣和分層抽樣中討論的目標都是前三類,且它們本質上是一類,相互之間可類推。本章討論第四類目標量比值的估計,這是第一個問題。比如服裝消費支出占總支出的比值,在校兒童對全體兒童的比重。其次前面所用的估計量是簡單估計,它只涉及所估計的指標本身。如果有另一個與關系密切(比例關系或線性回歸關系)的指標可作為輔助變量,來構造另一
2、類估計量,即比估計量或回歸估計量,來提高估計精度,這是第二問題。如調查每月每戶平均消費,消費通常與每戶人口數密切相關,可用每戶人口數作為輔助變量,先估計每月每戶平均消費與每戶人口數的比值,然后利用已知的每戶平均人口,就可得到每月每戶平均消費的估計值。由于這兩個問題之間存在密切的內在關系,因此放在這一章節一起討論。5.1比估計基本概念考慮到有兩個指標量和,不妨將總體記為SKIPIF10,對應樣本為SKIPIF10,如果要估計的是總體比值SKIPIF10,則總體比值可用樣本的比值SKIPIF10進行估計,該估計量稱為比值估計量當調查指標僅為,為輔助變量時,在SKIPIF10或SKIPIF10已知時
3、,SKIPIF10和可用SKIPIF10SKIPIF10分別進行估計,稱為比(比率)估計量這三者通稱為比估計量,它們之間只相差一個常數,相互之間可推導,研究時只選擇一個即可性質我們知道簡單估計量是無偏估計,其均值誤差等于其方差但對于比估計量卻不具有無偏性,而是漸近無偏其均值誤差與方差有差異,但偏倚不大可證:對于簡單隨機抽樣,當n很大時,SKIPIF10SKIPIF10簡要證明:SKIPIF10當n很大時,SKIPIF10,代入上式分母中,有SKIPIF10所以,當n很大時SKIPIF10此時SKIPIF10對每個總體單元,令SKIPIF10,對每個樣本單元有SKIPIF10,則其總體均值和樣本
4、均值分別為SKIPIF10SKIPIF10因而SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10所以,當n很大時SKIPIF10此方差的估計量可采用SKIPIF10或SKIPIF10說明:這兩個方差估計量很難比較誰優誰劣,對不同總體有不同結論。類推可得:對于簡單隨機抽樣,當n很大時,SKIPIF10,SKIPIF10,SKIPIF10SKIPIF10,SKIPIF10,SKIPIF10【例1】(馮例5.3)交通運輸統計中有三個重要的指標,即運量、周轉量與平均運距,其中平均運距是總周轉量除以運量所得的商。為估計公路載貨汽車的平均運距,在總體中用簡單隨機抽樣抽取32輛
5、貨車,記錄每輛車在一個月內的運量xi(單位噸)與周轉量yi(單位噸公里),如P130表5.3所示,試估計平均運距R并給它的90%的置信區間。解:SKIPIF10,SKIPIF10,SKIPIF10,SKIPIF10故平均運距的估計值為SKIPIF10為求方差估計值,令f1,SKIPIF10SKIPIF10R的90%的置信區間為SKIPIF10比估計與簡單估計的比較簡單估計法以樣本均值SKIPIF10估計總體均值SKIPIF10,比估計以SKIPIF10估計SKIPIF10,兩者的估計方差為SKIPIF10SKIPIF10SKIPIF10由于樣本方差SKIPIF10和樣本協方差SKIPIF10是
6、總體方差SKIPIF10和總體協方差SKIPIF10的無偏估計,所以SKIPIF10的一個近似估計是SKIPIF10SKIPIF10SKIPIF10即SKIPIF10其中SKIPIF10SKIPIF10是指標與的總體相關系數比估計優于簡單估計的條件是SKIPIF10SKIPIF10SKIPIF10(*)其中:SKIPIF10,SKIPIF10分別是總體Xi和Yi的變異系數.*式說明在估計SKIPIF10時,如果有與指標相關系數較大的輔助指標,而且的變異系數SKIPIF10比較小,則用比估計法的有利的即的變異系數與的變異系數相當,當相關系數大于時,比估計比簡單估計更優5.回歸估計有效運用比估計的
7、一個前提是與輔助變量X基本上成(正)比例關系,即Yi對Xi的回歸直線通過原點。若Yi對Xi的回歸直線不通過原點,為了進一步提高精度,則應使用回歸估計。對于簡單隨機抽樣,總體均值SKIPIF10和總量的(線性)回歸估計量定義為:SKIPIF10SKIPIF10其中SKIPIF10是樣本均值,可以是:(1)事先設定的常數;(2)從樣本中計算得到的某一特定統計量,如樣本回歸系數。下面例舉幾種回歸估計的特殊情況。(1)當SKIPIF10時的回歸估計量稱為差估計量(differenceestimator):SKIPIF10(2)當SKIPIF10時,SKIPIF10即為簡單估計量。(3)當SKIPIF1
8、0時,則SKIPIF10即比估計量。我們知道簡單估計是無偏估計,而比估計是漸近無偏的,也就是說為設定常數與為某一統計量對回歸估計在性質上有很大的不同,下面分別進行討論。為設定常數令是設定常數,易證回歸估計量SKIPIF10是SKIPIF10的無偏估計。求它的方差時,SKIPIF10可視為SKIPIF10的樣本均值,所以可用簡單估計量的方差公式:SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10由于樣本方差SKIPIF10和樣本協方差SKIPIF10是總體方差SKIPIF10和總體協方差SKIPIF10的無偏估計,因此SKIPIF10的一個無偏估計是SKIPIF10
9、的不同取值會影響SKIPIF10值,若取值合理,SKIPIF10就小,否則就大。若要SKIPIF10最小,則SKIPIF10最小。對求導,則SKIPIF10,即為對的總體回歸系數SKIPIF10時,SKIPIF10取得最小值SKIPIF10為樣本回歸系數對的總體回歸系數一般是未知的,自然人們常用其樣本回歸系數b,SKIPIF10估計,此時總體均值的回歸估計為SKIPIF10可以證明,當n大時,以SKIPIF10估計SKIPIF10是近似無偏的;其均方誤差近似為理論上的最小值,即SKIPIF10此式中的SKIPIF10可用以下樣本殘差方差進行估計:SKIPIF10SKIPIF10SKIPIF10
10、SKIPIF10SKIPIF10所以SKIPIF10的一個近似估計式為SKIPIF10回歸估計與簡單估計和比估計的比較將回歸估計(為樣本回歸系數b時)與比估計及簡單估計的方差作大樣本比較。(1)當樣本量n大時,回歸估計SKIPIF10的方差為SKIPIF10而簡單估計SKIPIF10的方差SKIPIF10而SKIPIF10,故有SKIPIF10也就是說,在大樣本下,回歸估計優于簡單估計,除非SKIPIF10,兩者效果才一樣。(2)對于比估計SKIPIF10,我們知道當n大時,它的方差近似為SKIPIF10回歸估計量優于比估計量的條件為:SKIPIF10SKIPIF10SKIPIF10SKIPI
11、F10SKIPIF10注:上述結論是在大樣本時得到的,當n不太大時,還要考慮到回歸估計及比估計的偏倚。實際上,小樣本時,回歸估計的偏倚有可能比比估計的大,因此就總的均方誤差而言,并不是總是回歸估計最小。結論:()小樣本時,比估計可能比回歸估計更優()大樣本時,除非B=R,否則回歸估計優于比估計。經驗作法(孫教材):當輔助變量的變異系數與指標的變異系數之比SKIPIF10在之間時,而兩者相關系數SKIPIF10時,采用回歸估計比采用簡單估計或比估計有較高的精度【例2】某系統共有N=687個單位,為預計當年全系統的工資總量,用簡單隨機抽樣抽取一個n=26個單位的樣本,下表是這些單位當年擊傷一年工資
12、總額數。已知上一年全系統工資總額為70523.16萬元。試采用比估計和回歸估計法(取樣本回歸系數b)估計當年全系統的工資總額及估計的近似標準差。解:SKIPIF10SKIPIF10SKIPIF10,SKIPIF10,SKIPIF10方法:比估計SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10作為比較,的簡單估計量為SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10比估計的設計效應SKIPIF10方法:回歸估計法樣本回歸系數SKIPIF10SKIPIF10SKIPIF10為求方差估計,先求樣本殘差方差SKIPIF10S
13、KIPIF10SKIPIF10SKIPIF10回歸估計法的設計效應SKIPIF10可見,回歸估計法與比估計的設計效應非常接近(因為B與R的估計值非常相近),精度都比簡單估計高5.3分層比估計回顧:在分層抽樣一章中講過定理:總體均值SKIPIF10的估計用各層均值SKIPIF10的估計SKIPIF10加權平均得到,即SKIPIF10。和該定理的推論:對分層簡單隨機樣本,若各層均值采用簡單估計,則總體均值SKIPIF10分層簡單估計為SKIPIF10前節比估計的思想是用樣本的比值估計總體比值,即SKIPIF10,總體均值SKIPIF10的比估計是SKIPIF10若將比估計的思想和技術用于分層隨機樣
14、本,有兩種可行的方法:一種是先對每一層使用比估計,然后進行加權平均,得到整個總體的估計量的比估計,這種方法稱為分別比估計;另一種是對兩個指標和各自都作分層簡單估計(即推論的作法),然后用它們構造比估計,這種方法稱為聯合比估計(或組合比估計)。、分別比估計(separateratioestimator)對分層簡單隨機樣本,若各層均值采用比估計,則總體均值SKIPIF10的分別比估計定義為SKIPIF10由于當每一層的樣本量SKIPIF10都比較大時,各層的比估計SKIPIF10是近似無偏的,所以SKIPIF10也是近似無偏的。且其均方誤差近似為SKIPIF10SKIPIF10該方差的一個近似無偏
15、估計為SKIPIF10、聯合比估計(combinedratioestimator)對分層簡單隨機樣本,先求兩個指標和的總體均值SKIPIF10的分層簡單估計:SKIPIF10SKIPIF10則總體均值SKIPIF10的聯合比估計定義為SKIPIF10其中SKIPIF10當總樣本量n比較大時,SKIPIF10是近似無偏的,且其均方誤差近似為SKIPIF10SKIPIF10SKIPIF10的一個近似估計為SKIPIF10注意:這個式中的是總體比而不是分別比估計相應公式中的層i.,其它一樣。3.兩種比估計的比較(適用場合):先比較兩者的方差:SKIPIF10SKIPIF10SKIPIF10注意式中S
16、KIPIF10在比估計適用的場合都比較小,如當與關系是通過原點的一條直線時(完全正相關),SKIPIF10。由此可得結論:()當每層的SKIPIF10時,兩種比估計效果一樣。()每一層的樣本量SKIPIF10都比較大,每層的與相關系數SKIPIF10較大,且SKIPIF10相差較大時,分別比估計優于聯合比估計。()分別比估計要求每一層的樣本量SKIPIF10都比較大,因此僅當層數較多,而各層樣本量不夠大時,才采用聯合比估計。5.分層回歸估計與比估計情形一樣,對于分層隨機樣本,也有兩種形式的回歸估計,一種是先對每一層使用回歸估計,然后進行加權平均,得到整個總體的估計量的回歸估計,這種方法稱為分別
17、回歸估計;另一種是對兩個指標和各自都作分層簡單估計,然后用它們構造回歸估計,這種方法稱為聯合回歸估計(或組合回歸估計)。分別回歸估計(separateregressionestimator)對分層隨機樣本,總體均值SKIPIF10的分別回歸估計定義為SKIPIF10()當h為事先取定的值時,該估計量為無偏估計量,且其方差為SKIPIF10SKIPIF10該方差是SKIPIF10的多元函數,可證當h取SKIPIF10時,SKIPIF10達最小值SKIPIF10SKIPIF10()當h不能事先取定時,通常取為從樣本中計算得到的SKIPIF10SKIPIF10此時當各層的樣本量nh很大時,以SKIP
18、IF10估計SKIPIF10是近似無偏的;其方差近似為理論上的最小值,即SKIPIF10SKIPIF10它的一個近似估計為SKIPIF10式中樣本殘差方差SKIPIF10SKIPIF10SKIPIF10SKIPIF10.聯合回歸估計(combinedregressionestimator)對分層隨機樣本,先求兩個指標的總體均值SKIPIF10的分層簡單估計:SKIPIF10SKIPIF10則總體均值SKIPIF10的聯合回歸估計定義為SKIPIF10()當事先取定時,該估計量為無偏估計量,且其方差為SKIPIF10SKIPIF10該方差是的一元函數,可證當取SKIPIF10時,SKIPIF10
19、達最小值SKIPIF10()當不能事先取定時,通常取為從樣本中計算得到的bSKIPIF10此時當總樣本量n很大時,以SKIPIF10估計SKIPIF10是近似無偏的;其方差近似為理論上的最小值,即SKIPIF10它的一個近似估計為SKIPIF103.兩種回歸估計的比較(適用場合):分別回歸估計的最小方差為SKIPIF10SKIPIF10SKIPIF10SKIPIF10.聯合回歸估計的最小方差SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10式中SKIPIF10注:上式中SKIPIF10只需SKIPIF10代入SKIPIF10得SKIPIF10恒成立由此可知:()當
20、每層的SKIPIF10時,兩種回歸估計效果一樣。()每一層的樣本量SKIPIF10都比較大,每層的與相關系數SKIPIF10較大,且SKIPIF10相差較大時,分別回歸估計優于聯合回歸估計。()分別回歸估計要求每一層的樣本量SKIPIF10都比較大,因此僅當層數較多,而各層樣本量不夠大時,才采用聯合回歸估計。【例】HYPERLINKP145例5.7.xls(馮例.)已知某市年年底中央直屬單位()專業技術人員總數人,市屬單位()專業技術人員總數人,欲通過抽樣調查,估計年年底全市專業技術人員的總數抽樣按中直單位與市直單位分層隨機抽取,前者抽n1=15個單位,后者抽n2=個單位,數據如下表。中直單位
21、(i=1)市直單位(i=2)jxijyijjxijyij121522418794210821110212313236757143596243823934141751801895657702663267768388756617208227881282884245998101938421021722810148165112158220113904291231833412971041345746113103107142342481428429015465472151251251667471417357385182182341981986820146162對上述數據按分別比估計、聯合比估計、分別回歸估
22、計、聯合回歸估計四種方法對年年底全市專業技術人員的總數作出估計,并給出各估計量的精度。解:先將樣本數據計算得到的中間結果列如下表:中直單位(h=1)市直單位(h=2)Nh152035Wh0.0990462220.9009537780.0592592590.049185668Xh75650315612391262560.3703704257.0130293550.6666667249.6532.0666667233.6298594.23816136678154296.56842290611.166757708.410531.0349580251
23、.068493151bh1.0271567031.06283715998.0326205433.25450918()分別比估計SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10()聯合比估計SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10(3)分別回歸估計SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10(4)聯合回歸估計SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10SKIPIF10與分層簡單估計進行比較:SKIPIF10
24、SKIPIF10SKIPIF10SKIPIF10SKIPIF10估計方法估計值SKIPIF10估計值的標準差SKIPIF10分別比估計415521607聯合比估計4154331675分別回歸估計415331160聯合回歸估計415381672分層簡單估計380848.869814.635.5各種估計量的比較與選擇(小結)比估計與簡單估計的比較:在有輔助變量時,若的變異系數與的變異系數相當,且相關系數大于時,比估計比簡單估計更優回歸估計與簡單估計的比較:在大樣本下,除非相關系數SKIPIF10,否則回歸估計優于簡單估計比估計與回歸估計的比較:在大樣本下,除非與的總體回歸系數B=R,否則回歸估計優于比估計小樣本時,考慮總的偏差,比估計可能比回歸估計更優分別估計與聯合估計的比較:對分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 系統集成項目管理理解與試題及答案
- 初級社會工作者考試歷史背景知識試題及答案
- 2025年私人住宅簡易租賃合同
- 2024年高考語文二輪復習專題05散文閱讀之結構手法練含解析
- 2025年計算機二級考試策略分析試題及答案
- 2024-2025學年高中地理第五章環境管理5.3中國環境法規體系習題含解析湘教版選修6
- MS Office高效操作技巧試題及答案
- 美發和客人合同協議書
- 分式加減 測試題及答案
- 學習攻略軟件評測師考試試題及答案
- 天堂旅行團讀書分享
- 23秋國家開放大學《視覺設計基礎》形考任務1-5參考答案
- 急性胰腺炎護理常規課件
- 2023淄博中考英語試題及答案
- 民兵訓練基地管理制度
- 高考前最后一課-數學
- 第五章-第四種檢查器的使用
- 班組精細化管理學習體會
- 八段錦操作評分標準
- 海康威視在線測評筆試題
- 2023年08月甘肅定西西源國家糧食儲備庫有限公司公開招聘5人筆試歷年難易錯點考題薈萃附帶答案詳解
評論
0/150
提交評論