抽樣技術與應用課程作業_第1頁
抽樣技術與應用課程作業_第2頁
抽樣技術與應用課程作業_第3頁
抽樣技術與應用課程作業_第4頁
抽樣技術與應用課程作業_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上首都經濟貿易大學 抽樣技術與應用作業文檔2013年授課對象:統計學(經濟分析)學生授課教師:教師:李鋒 郵箱:lifeng20523 單位:統計學院(參考答案可能存在疏漏,歡迎指正。)平時成績以100分計,占總評成績的30%第一部分:考勤及課堂表現(約40%)第二部分作業(約60%) 不用抄題,寫題號即可,作業要求:寫公式、數據代入公式及結果。一、簡單隨機抽樣:1、設總體N=5,其指標值為3,5,6,7,9 1)計算總體方差和; 2)從中抽取n=2的隨機樣本,直接用公式計算不放回抽樣的方差V(); 3)列出不放回抽樣的所有可能的樣本并計算。驗證E()=; 4)按不放回

2、抽樣的所有可能的樣本,計算其方差V()。并與公式計算的結果進行比較。5)對不放回抽樣的所有的可能樣本計算樣本方差。并驗證E()=。2、如何使用一棵普通的正方體(正六面體)骰子進行入樣概率為1/2,1/3,1/4,1/5的隨機抽樣?3、從一疊單據中用簡單隨機抽樣方法抽取了250張發現其中有50張單據出現錯誤。(1)以95的置信度估計這批單據中有錯誤的比例。(2)若已知這批單據共1000張,你的結論有何變化?(3)若要求估計的絕對誤差不超過1,則至少應抽取多少張單據作樣本?二、分層隨機抽樣1、一公司希望估計某一個月內由于事故引起的工時損失。因工人、技術人員及行政管理人員的事故率不同,因而采用分層抽

3、樣。已知下列資料:(1)若總樣本量n =30,試用奈曼分配確定各層的樣本量。(2)若實際調查了18 個工人,10 個技術人員,2 個行政人員,其損失的工時數如下:工人技術人員行政管理人員8,24,0,0,16,32,6,0,16,9,5,8,18,2,0,7,4,4,4,5,0,3,2,1,8,24,8,121,8試估計總的工時損失數并給出它的置信度為95的置信區間。2、 某林業局欲估計植樹面積,該局共管轄240 個林場,按面積大小分為4 層,用等比例抽取40 個林場,取得下列資料(單位:公頃)試估計該林業局轄區總的植樹面積及95的置信區間。樣本數據計算如下: 層總量層均值層方差第一層第二層第

4、三層第四層91821963065236265.57183340.56472.4938.429054.1816794.2872376.3合計8541-3、在估計比例問題時:(1) 假設P0.5, W1W20.5,則P1與P2為何值時可以使按比例分配的分層抽樣精度可以得益20(即deff=)。(2)若P =4,其中W1=0.05,P1=45;W20.2,P25;W30.75,P31。則采用按比例分配的分層抽樣比簡單隨機抽樣精度得益(1-deff)有多大?三、整群抽樣1、 汽車運輸公司抽樣檢查在使用的車輛中不安全輪胎的比例,在175輛車中抽中了25輛,其不安全輪胎數如下: 不安全輪胎數 汽車數 0

5、1 2 3 4 5 8 7 2 3 要求估計該運輸公司的汽車中不安全輪胎的比例及其估計的標準誤。四、系統抽樣1、 在一條街上13戶的戶口冊中將所有的居民列成下表:M男性成人,F女性成人,m男孩,f女孩。 住 戶 1 2 3 4 5 6 7 8 9 10 11 12 13 M F f m f M F f m f M F m f M F M F m m f M F f m M F f f M F m f m M F m M F m f M F f m M F f M F 為估計下列各項指際: a) 男性所占的比例; b) 孩子所占的比例; c) 具有某種職業的住戶中人員的比例(第1,2,3,12,

6、13這幾戶是具有某種職業的住戶)。現從每5人中抽1人,取得一系統樣本,又按20的比倒抽取一個簡單隨機樣本,請比較這兩種樣本的方差。(系統樣本的排列方法是每戶自上至下依次排列)。 專心-專注-專業2、下表是28個樣本村的產量數據,它是按產量由低到高順序排列后的280個村按種植面積大小成比例的概率抽選的系統樣本。 樣本村 平均畝產 樣本村 平均畝產 1 2 3 4 5 6 7 8 9 10 11 12 13 14 370 379 389 396 397 400 404 410 418 433 445 453 460 462 15 16 17 18 19 20 21 22 23 24 25 26 2

7、7 28 467 501 503 514 515 541 542 543 562 570 586 601 653 658 1) 用簡單隨機抽樣的公式計算均值的抽樣方差; v12) 用合并層的方法計算均值的抽樣方差;v2 3) 用連續差的方法計算均值的抽樣方差; v34) 你認為根據上述資料用哪一種方法計算比較接近實際。 樣本數據如下: S2=6928.88五、比估計和回歸估計1、 某縣共有123 個村,欲估計全縣當年的小麥總產量,按簡單隨機抽樣抽取13 個村,取得資料如下:樣本村上年產量(百斤)當年產量(百斤)123456789101112135507201500102062098092812

8、001350175067072915306107801600103060010509771440157022109808651710(1)若已知上年的小麥總產量為(百斤),采用比估計法估計當年的小麥總產量,并求置信度為95的置信區間。(2)采用差估計估計平均每村的小麥產量和小麥總產量,并估計其方差。(3)采用用樣本回歸系數的回歸估計法估計平均每村的小麥產量和小麥總產量,并估計其方差。(4)比較差估計、回歸估計與比估計的效率。去年小麥產量為x,今年為y,樣本數據計算如下:均值指標總和方差(協方差)平方和(乘積和)去年小麥產量x今年小麥產量yxy1042.081186.311354715422.7

9、4.0641.9981附錄一:參考答案一、簡單隨機抽樣1、 (1)2=4,S2=5;(2)不放回1.5(用計算式);(3)不放回E()=6;(4)不放回1.5(用定義式);(5)不放回E(s2)=S2=5;2、(略)3、(1) 該批單據中有錯誤的比例估計為20%,95%置信度的近似置信區間為14.83%,25.17% (2) 若單據共有1000張,該批單據中有錯誤的比例估計為20%,95%置信度的近似置信區間為 15.50%,24.50% (3) 若要求估計的絕對誤差不超過1%,應至少抽取6147張單據作為樣本。二、分層抽樣1、(1) n1=18, n2=10 n3=2(2)該公司總的工時損失

10、數估計為1903.9,95%置信度的近似置信區間為1457.0,2350.82、該林業局總的植樹面積估計為51246公頃,95%置信度的近似置信區間為42728.2,59763.8;由于比例分配時樣本量四舍五入,而且有些層的樣本量較小、各層均值方差之間差異大,用比例分配公式和用分層通用公式計算結果之間差異較大,答案用比例分配公式3、 (1)p1=0.7236,p2=0.27648或p1=0.2764,p2=0.7236(2)精度得益為0.237三、整群抽樣1、 估計該運輸公司的汽車中不安全輪胎的比例為40%,估計的標準誤為5.8248%四、系統抽樣1、(1)男性所占比例估計為48%,系統抽樣估計量的方差為2.56%,簡單隨機抽樣估計量的方差為2.04%,簡單隨機抽樣精度高;(2)孩子所占比例估計為48%,系統抽樣估計量的方差為5.76%,簡單隨機抽樣估計量的方差為2.04%,簡單隨機抽樣精度高;(3)男性所占比例估計為38%,系統抽樣估計量的方差為0.16%,簡單隨機抽樣估計量的方差為1.923%,系統抽樣精度高;2、 (1)v1=222.71(2)v2=3.141(3)v3=3.846 (4)略五、比估計和回歸估計1、(1) 今年的小麥總產量估計為.7809百斤,95%的置信區間近似為.4783百斤,.6791百斤

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論