抽樣技術(shù)報告_第1頁
抽樣技術(shù)報告_第2頁
抽樣技術(shù)報告_第3頁
抽樣技術(shù)報告_第4頁
抽樣技術(shù)報告_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 中國地質(zhì)大學(xué)(武漢)經(jīng)濟(jì)管理學(xué)院 課 題:簡單估計量和聯(lián)合回歸估計量精度的比較 專 業(yè):統(tǒng)計學(xué) 班級序號:088111 學(xué)生姓名:黃佳 容蓮子 劉青 指導(dǎo)老師:余國合老師 簡單估計量和聯(lián)合回歸估計量精度的比較 摘 要 分層抽樣技術(shù)在實際中應(yīng)用非常廣泛,有時分層抽樣會與其他抽樣方法如簡單隨機(jī)抽樣等方法結(jié)合反復(fù)使用。當(dāng)總體單位之間差異較大時,運用簡單隨機(jī)抽樣進(jìn)行估計往往會產(chǎn)生較大的誤差。但如果對總體單位進(jìn)行分類,從每個子總體中抽取少量樣本單位,就能很好的代表子總體的特征,從而提高對整個總體估計的精度。本文使用抽樣分層技術(shù),簡單估計量和聯(lián)合回歸估計,通過2001年世界碳強(qiáng)度的相關(guān)數(shù)據(jù)對2002年世

2、界碳強(qiáng)度做出估計。結(jié)果表明分層抽樣中的聯(lián)合回歸估計對世界碳強(qiáng)度的估計精度較高。 關(guān)鍵詞: 分層抽樣 簡單估計量 聯(lián)合回歸估計 The precision comparison between the simple estimator and the united regression estimator Abstract Stratified sampling method is widely applied in the actual. Sometimes ,compared with other sampling methods such as simple random sampling

3、 method can also be used. When there are big difference between each units of the population. Useing the simple random sampling to estimate tends to have large error. But if we want to classify the population,we need to extract a small amount of samples from each sub-population unit.Thus can master

4、the characteristics of the population. So we can improve the accuracy of the overall estimator. This article use the stratification sampling technology, simple estimator and the united regression estimator.We estimate the 2002 worlds carbon intensity by the 2001 world carbon intensity . The result s

5、hows that the united regression estimator of a stratified sampling can get good precision . Key Words:Stratified sampling;simple estimator;the united regression estimator 序 言 碳強(qiáng)度是指單位GDP的二氧化碳排放量。碳強(qiáng)度高低不表明效率高低。一般情況下,碳強(qiáng)度指標(biāo)是隨著技術(shù)進(jìn)步和經(jīng)濟(jì)增長而下降的。計算公式=二氧化碳排放總量/GDP。碳排放強(qiáng)度取決于:1,化石能源的碳排放系數(shù);2,化石能源的結(jié)構(gòu);3,化石能源在能源消費總量中的

6、比例;4,能源強(qiáng)度。碳排放需求主要與經(jīng)濟(jì)發(fā)展規(guī)模和發(fā)展水平直接相關(guān),規(guī)模越大,水平越高,則需求越大,反之則低。但達(dá)到一定水平,碳排放需求則趨于平穩(wěn)和不斷下降。排放需求線即過去某一時點的排放總量。此為京都議定書目標(biāo)模式,以1990年或附近某一年的排放總量作為排放需求的基準(zhǔn)線?;跉v史和當(dāng)前排放而線性外推到某一時點或時段的排放總量。1997年,京都議定書規(guī)定,到2010年,所有發(fā)達(dá)國家的二氧化碳等種溫室氣體的排放量,要比1990年減少5.2%。第一承諾期是2008年到2012年。京都議定書下談判主要解決減排目標(biāo),即確定京都議定書第2期,發(fā)達(dá)國家如何減排,發(fā)展中國家如何參與。至于中國代表團(tuán)的具體分工

7、。中國、印度、南非等發(fā)展中國家堅持發(fā)達(dá)國家應(yīng)到2020年在其1990年的基礎(chǔ)上減排40%;而歐盟提出的中期減排方案是20%;日本在鳩山由紀(jì)夫上臺后的最新立場為25%;美國在奧巴馬上臺后的最新立場約為4%。在研究2001年世界碳強(qiáng)度的情況下,本文將使用分層抽樣方法對2002年世界碳強(qiáng)度進(jìn)行預(yù)測并且評估抽樣方法。本文以下安排的結(jié)構(gòu)為:第一部分對抽樣方法進(jìn)行介紹;第二部分對世界碳強(qiáng)度的抽樣進(jìn)行實證研究;第三部分對兩種方法進(jìn)行比較得出結(jié)論。 一.抽樣方法介紹 (一)樣本容量的確定 表一 2002年世界各國碳強(qiáng)度數(shù)值0.060.420.661.162.750.100.420.661.193.060.13

8、0.430.671.213.090.140.430.671.243.290.150.440.671.263.520.150.440.681.263.730.170.450.681.283.790.180.460.691.283.920.190.460.691.373.990.210.460.711.424.080.220.460.721.444.310.240.480.741.484.380.240.490.741.504.880.240.490.751.566.390.250.500.771.566.420.250.510.791.606.610.260.510.811.616.920.26

9、0.520.811.618.480.270.530.811.698.670.280.530.831.72 10.140.300.530.841.78 11.990.310.540.851.880.320.540.881.910.340.550.891.920.340.560.901.940.350.560.911.940.350.570.911.950.360.580.942.070.360.590.962.250.360.590.972.250.360.590.972.260.380.610.982.350.380.610.982.380.390.610.992.440.390.621.02

10、2.520.390.621.032.520.400.631.032.540.410.631.072.540.410.641.082.620.420.661.102.74 圖一 總體分布折線圖 由圖一的折線圖可以看出,可將總體大致可以分為三層,第一層從185,第二層從86149,第三層從150181。 總體的方差為:S2=3.253778571,總體的均值E(Y)=1.4。經(jīng)多次試驗,我們?nèi)∽儺愊禂?shù)為CV(E(y)=0.2,然后利用公式:=3.253778571/(0.2)2*(1.4)2=41.50227769 接著我們再利用公式:=33.76105782 我們?nèi)0=34,這樣就確定了樣本量

11、。 (二)各層樣本量的分配分層抽樣中,解決層樣本容量的配置問題,既是實施分層抽樣調(diào)查的前提,也是保證抽樣精度和效率的關(guān)鍵因素。樣本容量的分配可以看作是連續(xù)給一層減少同時給另一層增加一個樣本單元使得層估計的樣本和總體相應(yīng)樣本的方差減少的一種方法。在對層進(jìn)行劃分時,通常考慮使層內(nèi)單位的標(biāo)志值相近,層間單位差異盡可能大,達(dá)到提高抽樣估計精度的目的。分層抽樣中樣本量的分配有比例分配、最優(yōu)分配和尼曼分配三種。比例分配即按層的層權(quán)進(jìn)行分配,即,該種方法可以體現(xiàn)公平原則;最優(yōu)分配是指在總費用給定的條件下,使得估計量方差達(dá)到最小,或是在給定估計量方差的條件下,使總費用最??;尼曼分配時最優(yōu)分配的特例,是每層抽樣

12、費用都相同的情況下,得到的層樣本量,公式為。尼曼分配適合層間變化較大的樣本。 本題按比例分配對總的樣本量進(jìn)行分配,n1=(34/181)*85=15.96685083,我們?nèi)1=16;n2=(34/181)*63=11.83425414,我們?nèi)2=12,n3=(34/181)*31=5.82320442,我們?nèi)3=6。這樣每一層的樣本量也確定了。 (三)樣本的抽取 確定每層樣本量之后,就使用產(chǎn)生隨機(jī)數(shù)的方法進(jìn)行抽取樣本的過程。本文使用的方法是在SPSS中產(chǎn)生隨機(jī)數(shù)來抽取各層的樣本。 由上面確定總的樣本數(shù)為34個。第一層樣數(shù)是從1-85個數(shù)之間隨機(jī)第三層樣本數(shù)是在150-181個數(shù)之間隨機(jī)

13、抽取6個。我們用SPSS完成樣本的選取,具體步驟如下: (1)首先點“數(shù)據(jù)”里面的“選擇個案”,出來窗口如下: (2)再點“隨機(jī)個案樣本”,出來窗口如下: 由于第一層是在1-85個數(shù)之間抽取16個數(shù),所以上面選擇“精確”按鈕,第二層和第三層的樣本的選取同第一層樣本的選取一樣的步驟。這樣我們就完成了樣本的抽取。 二.抽樣方法的實證 (一)簡單估計量 步驟: (1)計算出所抽樣本的每層的層權(quán)Wh,如下: W1=16/34=0.470588235 W2=12/34=0.352941176 W3=6/34=0.176470588 (2)計算每層樣本的均值E(yh) ,結(jié)果如下: 0.06 第一層均值:

14、0.3418750.150.190.210.220.240.280.30.360.360.380.430.530.560.590.610.69 第二層均值:1.30250.710.810.881.031.071.261.441.611.941.942.252.52 第三層均值:3.9116666672.622.754.314.886.39 由上表可知: E(y1)=0.341875 E( y2)=1.3025 E(y3)=3.911666667 (3)利用簡單估計量的公式計算出總體均值的估計,如下: =1.310882353 (4)計算估計量的精度,如下: 樣本離差離差平方和1-0.28187

15、50.0794535162-0.1918750.0368160163-0.1518750.0230660164-0.1318750.0173910165-0.1218750.0148535166-0.1018750.0103785167-0.0618750.0038285168-0.0418750.00175351690.0181250.000328516100.0181250.000328516110.0381250.001453516120.0881250.007766016130.1881250.035391016140.2181250.047578516150.2481250.0615

16、66016160.2681250.07189101617-0.61250.3751562518-0.59250.3510562519-0.49250.2425562520-0.42250.1785062521-0.27250.0742562522-0.23250.0540562523-0.04250.00180625240.13750.01890625250.30750.09455625260.63750.40640625270.63750.40640625280.94750.8977562529-1.39166671.93673620430-1.29166671.66840286431-1.

17、16166671.349469522320.39833330.158669418330.96833330.93766938342.47833336.142135946 將上面表格中的數(shù)值匯總得:第一層離差平和0.41384375第一層方差0.025865234第二層離差平和3.101425第二層方差0.258452083第三層離差平和12.19308333第三層方差2.032180556 綜上可以得到: = =0.101208565 所以用簡單估計得到的精度為:=0.318132936 (二)聯(lián)合回歸估計 (1)調(diào)查變量y與輔助變量x的樣本分層表:樣本x樣本y 第一層 第二層第三層 第一層 第

18、二層 第三層0.060.712.720.060.692.520.160.791.840.150.712.620.190.892.840.190.812.750.210.864.310.210.884.310.231.064.880.221.034.880.221.076.390.241.076.390.271.250.281.260.291.440.31.440.371.640.361.610.321.830.361.940.411.920.381.940.422.190.432.250.520.530.620.560.610.590.590.61 根據(jù)上表并由和可以得到:樣本()樣本量()抽

19、樣比()層權(quán)()均值()均值()第一層160.1882352940.470588235 0.3431250.341875第二層120.18750.352941176 1.3041666671.3025第三層60.1875 0.176470588 3.833.9116667 (2)求輔助變量樣本x的第一、二、三層的離差和離差平方得:第一層第二層x的離差x的離差平方x的離差x的離差平方-0.2831250.080159766 -0.5941666670.353034028-0.1831250.033534766 -0.5141666670.264367361-0.1531250.023447266

20、 -0.4141666670.171534028-0.1331250.017722266 -0.4441666670.197284028-0.1131250.012797266 -0.2441666670.059617361-0.1231250.015159766 -0.2341666670.054834028-0.0731250.005347266 -0.0541666670.002934028-0.0531250.002822266 0.1358333330.0184506940.0268750.000722266 0.3358333330.112784028-0.0231250.0005

21、34766 0.5258333330.2765006940.0668750.004472266 0.6158333330.3792506940.0768750.005909766 0.8858333330.7847006940.1768750.0312847660.2768750.0766597660.2668750.0712222660.2468750.060947266第三層x的離差x的離差平方-1.111.2321-1.993.9601-0.990.9801 0.480.2304 1.051.1025 2.566.5536 并由上表可以得到:樣本x離差平方和方差()第一層0.442743

22、750.027671484第二層2.6752916670.222940972第三層14.05882.343133333 (3)求調(diào)查變量樣本y的第一、二、三層的離差和離差平方可得:第一層第二層y的離差y的離差平方y(tǒng)的離差y的離差平方-0.2818750.079453516-0.61250.37515625-0.1918750.036816016-0.59250.35105625-0.1518750.023066016-0.49250.24255625-0.1318750.017391016-0.42250.17850625-0.1218750.014853516-0.27250.0742562

23、5-0.1018750.010378516-0.23250.05405625-0.0618750.003828516-0.04250.00180625-0.0418750.001753516 0.13750.01890625 0.0181250.000328516 0.30750.09455625 0.0181250.000328516 0.63750.40640625 0.0381250.001453516 0.63750.40640625 0.0881250.007766016 0.94750.89775625 0.1881250.035391016 0.2181250.047578516

24、 0.2481250.061566016 0.2681250.071891016第三層y的離差y的離差平方-1.39166671.936736204-1.29166671.668402864-1.16166671.349469522 0.39833330.158669418 0.96833330.93766938 2.47833336.142135946 并由上表可以得到:樣本y離差平方和方差()第一層0.413843750.025865234第二層3.1014250.258452083第三層12.193083332.032180556 (4)求調(diào)查變量樣本y和輔助變量樣本x第一、二、三層的對

25、應(yīng)離差積可以得到:x與y的對應(yīng)離差積 第一層第二層第三層0.0798058590.3639270841.5447500370.0351371090.304643752.5704167330.0232558590.2039770831.1500500330.0175558590.1876604170.1911999840.0137871090.0665354171.0167499650.0125433590.054443756.3445332480.0045246090.0023020830.0022246090.0186770830.0004871090.10326875-0.00041914

26、10.335218750.0025496090.392593750.0067746090.8393270830.0332746090.0603933590.0662183590.066193359 并由上表可以得到:樣本x與y離差積之和協(xié)方差()第一層0.424306250.026519141第二層2.8725750.23938125第三層12.81772.136283333 綜上可以得到:=0.938157279;=0.000414913 所以用聯(lián)合回歸估計得到的抽樣標(biāo)準(zhǔn)誤為:=0.020369425 四.結(jié)論 通過對兩種方法的比較,其簡單估計量分配抽樣的精度為0.318132936,聯(lián)合回歸估計量的精度為0.020369425。直觀可以看出該題用聯(lián)合回歸估計方法更好。就該題而言首先我們對數(shù)據(jù)進(jìn)行排序,使得相近的數(shù)據(jù)為一組得以滿足層內(nèi)單位具有相同性質(zhì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論