統計技術應用課件第七章 抽樣調查_第1頁
統計技術應用課件第七章 抽樣調查_第2頁
統計技術應用課件第七章 抽樣調查_第3頁
統計技術應用課件第七章 抽樣調查_第4頁
統計技術應用課件第七章 抽樣調查_第5頁
已閱讀5頁,還剩199頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章抽樣調查學習目標(一)知識目標1.了解抽樣調查的特點與應用范圍;2.了解抽樣調查的基本概念;3.了解抽樣誤差的概念;4.了解抽樣推斷的理論基礎;5.了解抽樣誤差的概念;6.了解抽樣平均誤差的意義及其影響因素;7.了解抽樣極限誤差、可信度和概率度;8.了解總體參數的點估計和區間估計;9.了解抽樣組織方式。(二)技能目標1.能夠計算抽樣平均誤差;2.能夠掌握區間估計的總體平均數的估計和總體成數的估計方法;3.能夠根據置信度的要求,估計總體指標出現的可能范圍。引導案例2012年2月,針對以螺旋藻為原料的保健食品存在重金屬超標隱患,國家食品藥品監督管理局組織中國食品藥品檢定研究院、北京市藥品檢驗所等7家檢驗機構對市場上部分以螺旋藻為原料保健食品開展了鉛、砷、汞重金屬專項監測。根據市場產品抽樣和媒體報道情況,國家食品藥品監督管理局于2月29日布置對可疑產品開展專項監督檢查。2012年3月30日,國家食品藥品監督管理局公布以螺旋藻為原料保健食品重金屬專項監督檢查結果。結果顯示,3個產品為假冒保健食品;1個產品的某批次產品鉛、砷超過限量標準;其他9個產品鉛含量在本次監督檢查中結果均未超過國家限量標準。對于假冒和超過限量標準的產品,國家食品藥品監督管理局責成相關食品藥品監督管理部門依法嚴肅處理,要求加強螺旋藻為原料的保健食品監督檢查,保障消費者食用安全。問題:從抽樣調查的結果來看,可以估計以螺旋藻為原料的保健食品的合格率是多少?第一節抽樣調查的一般問題統計工作的目的是獲得和研究關于總體的數量特征,采用的基本方法是大量觀察法,對總體的精確數量認識需要對總體進行全面調查,當總體較大或總體的外延不是很明確時,采用全面調查的方法既不靈活也造成很大浪費,例如在對玻璃器皿做耐溫檢測時常常會把產品破壞,為了進行全面的統計而把產品全部破壞顯然是不可取的。因此,人們更多的是采用抽樣調查的方法,根據部分總體單位構成的小總體的統計指標推測全及總體(即大總體)的統計指標。如要判斷一張照片是1200萬像素還是200萬像素,用肉眼是不容易看出來的。放到電腦上來將照片的某部分放大,當放大到一定倍數時,若很快出現馬賽克可以判斷是200萬像素,若還是很精細可以判斷是1200萬像素的。抽樣調查的思想方法與此相同,在總體中按隨機的原則抽取一部分(拿來放大的那部分照片)作為樣本,樣本的數量特征(照片的像素)與總體的數量特征(照片的像素)就有相近之處,可以用樣本的數量特征來說明總體的數量特征。一、抽樣調查的特點與應用范圍抽樣調查又稱抽樣推斷或抽樣估計,是根據隨機的原則在總體中抽取一部分總體單位進行調查登記,進而利用這部分總體單位的數據(小總體的指標)對總體的有關數量特征在一定概率保證下作出推斷的一種統計方法。(一)抽樣調查的特點1.只抽取總體中一部分單位進行調查,是專門組織的一次性非全面調查。2.抽取部分單位要遵循隨機原則,使樣本單位均有被抽中的機會。這個特點是與其它非全面調查如重點調查、典型調查的主要區別之一。重點調查和典型調查的調查單位的選取受到調查者主觀意識的影響,抽樣調查的調查單位選取不受調查者主觀意志的影響。當抽取足夠多的單位時,樣本就能夠反映出總體的數量特征。遵守隨機原則還能計算抽樣誤差,并把它控制在一定范圍之內。3.以樣本指標的數值去推斷和估計總體指標的數值。因此,抽樣調查又叫抽樣推斷。例如對幾只燈泡進行壽命試驗來判斷整批燈泡的壽命。這個特點是抽樣調查與其他非全面調查的又一區別。重點調查和典型調查都是非全面調查,但是其結果不能作為總體指標的代表;抽樣調查之所以能夠去推斷和估計總體指標的數值,隨機原則起到了關鍵的作用。抽樣調查和全面調查的目的一致,都是為了達到對總體數量的認識,但是達到目的的手段和途徑完全不同。抽樣調查是通過科學的推斷達到目的,可以節省時間、人力、物力和財力。4.抽樣調查產生的誤差,可以計算并可采取措施控制在一定范圍之內,從而使抽樣調查具有一定的可靠性。典型調查和重點調查也能用部分調查單位的指標數值去估計總體指標數值,但是這種估計不能計算誤差,也不能說明估計的準確程度和可靠程度。(二)抽樣調查的應用范圍抽樣調查適用的范圍很廣泛,在許多場合都可以運用抽樣調查方法取得大量社會經濟現象的數量方面的統計資料,特別是在某些特殊場合不可能用全面調查時必須采用抽樣調查。1.用于單位數特別多或無限多的總體。如工農業產品連續性生產過程中的成品率調查,大氣中某些污染情況調查等。2.對于產品造成破壞或損傷的檢驗調查方法。如電燈泡、茶葉、煙草等產品進行質量檢驗都是有破壞性的,不可能進行全面調查,只能使用抽樣調查。3.用于不必要進行全面調查的現象。如水庫中的魚數、森林中的木材積蓄量、居民購買力調查等。如果進行全面調查,要消耗很大的人力物力,成本太高。4.時間緊迫、經費有限時可采用抽樣調查。抽樣調查的調查單位比全面調查要少得多,因而既能節約人力、費用和時間,又能比較快地得到調查結果。例如,農產品產量全面調查的統計數字要等收割完畢以后一段時間才能得到,而抽樣調查的統計數字在收獲的同時就可以得到,一般能比全面調查早得到兩個月左右,這對于農產品的生產經營是很有利的。5.對普查數據校驗時可采用抽樣調查。在全面調查后,對某些數據進行修正,可采用抽樣復查。人口普查之后,每年組織1%的人口抽樣復查,對人口普查資料進行核查和修正。如我國第五次人口普查時使用長表和短表兩種調查表,短表調查項目少,人人都要登記,長表在短表的基礎上增加了很多項目,只供全國一小部分人口登記。這實際上就是在普查的同時進行抽樣調查。6.檢驗新產品或新技術的使用效果時可采用抽樣調查。利用抽樣推斷的方法,可以對于某種總體的假設進行檢驗和比對判斷,來判斷這種假設的真偽,以決定取舍。例如,新教學法的采用、新技術的利用、新醫療方法的使用等是否收到明顯效果,須對未知的或不完全知道的總體作出一些假設,然后利用抽樣調查的方法,根據實驗材料對所作的假設進行檢驗,從而作出判斷。二、抽樣調查的基本概念(一)全及總體和抽樣總體1.總體總體也稱全及(統計)總體,指所要研究對象的全體,它是由所研究范圍內具有某種共同性質的全體單位所組成的集合體。總體按各單位標志性質不同,可分為變量總體和屬性總體兩類。若被研究的標志是數量標志,則稱這個總體為變量總體。抽樣調查可以研究變量總體的各種指標,如均值和標準差。屬性總體又稱品質標志總體,抽樣推斷中僅研究品質標志中的特例交替標志,交替標志作為總體的指標,表現為成數,如合格率、滿意度等。全及總體的單位數一般用來表示,總體的單位數通常都是很大的。弄清楚了全及總體,不僅可以明確抽樣推斷所要研究對象的范圍,而且也便于確定抽樣框(樣本框)。對于某一具體問題來說,作為抽樣推斷對象的總體是唯一確定的。2.樣本樣本又稱樣本總體,是全及總體中部分總體單位構成的小總體,它是從全及總體中抽取出來的一部分單位所組成的集合體。(1)樣本的容量樣本的容量一般用表示,是指一個樣本中所包含的單位數。一般來說,樣本單位數超過30的樣本稱為大樣本,不超過30的稱為小樣本。社會經濟現象的抽樣調查多取大樣本,而自然實驗觀察多取小樣本。(2)樣本個數樣本個數又稱為樣本可能數目,用來表示,它是指從一個總體中可能抽取的樣本的總數量。如果樣本個數是1,那么樣本總體就是全及總體;當樣本個數大于1時,抽取的樣本有多種組合。但在實際工作中,只能抽取一個樣本進行統計推斷,而不可能獲得全部可能的樣本,所以并不常用。(二)全及指標和抽樣指標1.全及指標全及指標也叫總體指標或總體參數,它是根據全及總體各單位標志值或標志屬性計算的、反映總體某種屬性的綜合指標。由于全及總體是唯一確定的,根據全及總體計算的全及指標也是唯一確定的,所以稱為參數。不同性質的總體需要計算不同的全及指標。對于總體中的數量標志,常用的總體參數有總體平均數、總體標準差和總體方差,有以下公式:總體平均數:總體方差:總體標準差:對于交替標志屬性總體,由于各單位標志不能用數量來表示,只能用兩種標志表現文字來加以描述,所以應計算結構相對指標,稱為總體成數。總體成數常以大寫英文字母來表示總體中具有某種性質的單位數在總體全部單位數中所占的比重,以表示總體中不具有某種性質的單位數在總體中所占的比重。設總體個單位中,有個單位具有某種性質,個單位不具有某種性質,,則總體成數為:交替標志在總體中的方差為:成數是交替標志作為總體中的變量的平均數。2.樣本統計量(抽樣樣本指標)根據樣本各單位標志值計算的、反映樣本屬性的指標稱為樣本統計量。和全及指標相對應的有樣本均值、抽樣成數統計量、樣本標準差統計量和樣本方差統計量等。和用小寫英文字母表示,以便和全及指標相區別。假設有一樣本,其各單位的取值分別為,,…,,則有以下公式:樣本均值統計量:樣本方差統計量:修正樣本方差統計量:樣本的指標稱為統計量,是由于樣本的個數不唯一,取到不同的樣本,樣本統計量的數值會不同,可以把統計量看作是隨機抽取樣本構成的總體上的一個隨機變量,作為隨機變量的統計量是參數估計的基礎,可用統計量的數值作為總體參數的估計值,基于此這里給出了修正的樣本方差統計量。在屬性總體中,一個樣本容量為的一個樣本,設個單位中有單位具有某種屬性,個單位不具有某種屬性,,為樣本中具有某種屬性的單位數所占的比重,表示不具有某種屬性的單位數所占的比重,則抽樣(樣本)成數統計量為:樣本交替標志標準差統計量為:統計量是所有樣本構成的總體上的(隨機)變量。(三)抽樣方法在總體中取出總體單位的順序不同,構成了不同的抽樣方法。抽樣方法可分為重復抽樣和不重復抽樣。抽樣方法的不同會影響所有樣本所構成的總體的總體單位數(即會影響統計量的定義域),進而會影響抽樣誤差。1.重復抽樣重復抽樣也稱為回置抽樣,與抽取總體單位的順序無關。是從總體個單位中隨機抽取一個容量為的樣本,每次隨機抽取一個總體單位,記錄該單位有關標志表現后,把它放回到全及總體中參加下一次抽選,照此下去直到抽選第個樣本單位。每次抽取總體單位是在完全相同的條件下進行的,每個總體單位被選中的機會完全相等。從總體個單位中,用重復抽樣的方法,隨機抽取個單位構成一個樣本,則共可抽取個樣本,即樣本所構成的總體單位數為。【例7-1】總體有A、B、C、D四個單位,要從中以重復抽樣的方法抽取2個單位構成樣本。先從4個單位中抽取1個,共有4種抽取方法,結果登記后再放回。然后再從相同的4個單位中抽取1個,也有4種抽取方法。這樣取2個單位構成一個樣本,其全部可能抽取的樣本數目為個,它們是:AA,AB,AC,AD,BA,BB,BC,BD,CA,CB,CC,CD,DA,DB,DC,DD。因此重復抽樣具有以下特點:每取一個樣本可以看作是一次隨機試驗,每次的試驗結果是獨立的,每次試驗是在相同條件下進行的,每個單位在每次試驗中被選中的概率是相同的。2.不重復抽樣不重復抽樣又稱為無回置抽樣。抽取的總體單位跟順序有關,是指從全及總體抽取樣本時,隨機抽取一個樣本單位,記錄該單位有關標志表現后,這個樣本單位不再放回全及總體參加下一次抽選。然后從總體剩下的個單位中隨機抽取第二個樣本單位,記錄它的有關標志表現后,該單位也不放回全及總體中去,再從總體剩下的個單位中抽取第三個樣本單位,照此下去直到抽選出第個樣本單位。在不重復抽樣中,其樣本可能的數目為即樣本構成的總體中的總體單位數為【例7-2】從A、B、C、D這4個球中抽2個球,采用不重復抽樣的方法,共有12種可能:AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。概率理論已經證明在不重復抽樣中,每次抽取一個樣本,每個總體單位被抽中的概率是一致的。三、抽樣推斷的理論基礎社會現象和自然現象可以分為兩大類,一類現象是發生的結果可以確定,稱之為必然現象。如在標準大氣壓下將水加熱到100℃水就會沸騰,企業的成本會隨著產出的增加在不斷地增加。另一類現象是發生的結果無法確定,稱之為隨機現象。如明天的天氣情況,擲一枚均勻硬幣出現的結果具有不確定性等。社會經濟現象大多具有這種不確定性,概率論就是描述這種隨機現象數量特征的數學學科;在概率論中,將變量稱為隨機變量,與其他數學學科不同的是,概率統計中關注的是隨機變量取一定數值(范圍)的可能性(概率),稱之為隨機變量的分布。(一)隨機變量及其分布規律抽樣推斷是在概率論的基礎上進行的,概率論是研究隨機現象數量規律的的數學方法。描述隨機現象的函數稱為隨機變量,隨機變量取值在一定范圍內的概率,即隨機變量的概率分布具有重要的意義。統計實踐表明,大多數的變量分布服從鐘形分布,規則的鐘形分布在概率中稱為正態分布,正態分布的分布函數具有很規則的特征。隨機變量具有兩個重要參數(即統計總體的指標):一個叫數學期望,記為,即的平均數(總體的平均指標);另一個是方差,記為,即變量的方差(總體標準差的平方)。對于服從正態分布的隨機變量,也記為。正態分布的數學規律如下:分布函數:數學期望:方差:標準正態分布是數學期望為零,方差為1()的正態分布。一個服從正態分布的隨機變量,可以經過變換轉化為服從標準正態分布的隨機變量,即標準正態分布具有很好的概率特征,如果已知一個變量服從標準的正態分布,那么這個變量取值在一定范圍內的概率就是已知的,即:(二)大數定理與中心極限定理1.大數定理大數定理又稱大數法則。大數定理:獨立同分布的隨機變量,,…,,…設它們的平均數為,方差為。則對任意的正數,有:,,…

該定理說明,當n充分大時,獨立同分布的一系列隨機變量,其平均數與它們共同的期望值之間的偏差,可以有很大的把握被控制在任意給定的范圍之內。由于從總體中抽出的樣本是獨立且與總體同分布的,因此,當樣本容量n

充分大時,樣本平均值與總體平均值之間的誤差可以有很大的把握被控制在任意給定的要求之內,這就是人們用樣本平均估計總體平均的理論根據。由于成數指標是一個特殊的平均數,大數定理對成數指標自然也成立:設m是n次試驗中事件A發生的次數,p是事件A發生的概率,則對于任意小的正數,有即當n充分大時,事件A發生的頻率接近(依概率收斂于)事件A發生的概率,反映了頻率在大量重復試驗過程中的穩定性。該定理稱為貝努里大數定理,它提供了用頻率代替概率的理論根據。2.中心極限定理在客觀實際中,總體的分布各種各樣,不一定會服從正態分布。但由中心極限定理可知,只要總體滿足一定的條件,隨機變量的平均數(是總體的均值統計量)會近似于服從正態分布。(1)中心極限定理隨機變量,,…,相互獨立,且服從同一分布,該分布存在有限的期望和方差:,,(i=1,2,…)。當趨于無窮大時,個隨機變量的算術平均數近似服從正態分布,即:中心極限定理的含義是許多微小的隨機因素作用的結果,會以一種正態分布的形式反映出來。從上述定理可以得出結論,無論總體服從何種分布,只要它的期望值和方差存在,就可以通過增大樣本容量的方式,保證樣本平均數近似正態分布。也就是說,大樣本的平均數近似服從正態分布。(2)迪摩佛—拉普拉斯定理交替標志的分布稱為兩點分布,可以用投擲硬幣來模擬。在次投擲硬幣的實驗中,正面出現的次數的分布稱為二項分布,記為,總體中交替標志的均值即為總體的成數。迪摩佛—拉普拉斯定理是中心極限定理的特例,當總體較大時,樣本成數p近似服從正態分布

為總體的成數。迪摩佛—拉普拉斯定理為總體成數的抽樣推斷提供了理論依據。第二節抽樣誤差一、抽樣誤差的概念用抽樣樣本指標來估計全及指標是否可行,關鍵問題在于抽樣誤差。抽樣誤差是指由于隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起抽樣樣本指標和全及指標之間的絕對離差。如抽樣平均數與總體平均數的絕對離差、抽樣成數與總體成數的離差等。如某班50位同學中有30位男同學和20位女同學,現隨機抽取5個同學為樣本,由于隨機的原因未必都能抽到3個男同學和2個女同學,使得利用樣本計算的性別比例指標不能代表該班同學的性別比例指標,原因是樣本指標和總體指標之間存在絕對離差。二、統計調查誤差種類按產生的原因分,統計調查誤差可分為登記性誤差和代表性誤差。1.登記性誤差登記性誤差是指統計調查時,由于主觀原因在登記、匯總、計算、過錄中所產生的誤差。登記性誤差不論全面調查或非全面調查都可能產生。2.代表性誤差代表性誤差是由于樣本結構與總體結構不同,樣本不能完全代表總體而產生的樣本指標與總體指標之間的誤差。代表性誤差又可分為系統性誤差和隨機誤差兩種。系統性誤差又稱偏差,它是由于抽樣調查沒有遵循隨機原則而產生的誤差,即違反抽樣調查的隨機原則,有意地抽取較好或較差的單位進行調查,這種系統性原因造成的樣本不足所產生的誤差稱為系統性誤差,不能控制。隨機誤差又稱偶然的代表性誤差,它是指沒有登記性誤差的前提下,又遵循了隨機原則所產生的誤差。因為即使遵守了隨機原則,但由于偶然抽取的樣本結構與總體的結構發生偏差,就會出現或大或小的偶然的代表性誤差。隨機誤差是抽樣調查固有的誤差,可以控制。通常所說的抽樣誤差指的是隨機誤差。抽樣誤差包括抽樣實際誤差和抽樣平均誤差兩種。抽樣實際誤差是指某一樣本指標與被它估計的總體指標之間數值的差異,如、。對于確定的全及總體來說,總體指標數值是確定的值,由于樣本是按隨機原則抽選的,從同一總體抽取樣本容量相同的樣本可以有多種不同的抽取放法,每個樣本都有自己的樣本指標,因此抽樣實際誤差是一個隨機變量。作為抽樣實際誤差的隨機變量在總體(樣本構成的)中的標準差稱為抽樣平均誤差,其統計意義是所有樣本的抽樣實際誤差的平均值。三、抽樣平均誤差的意義上面已經講過,抽樣誤差是一個隨機變量,它的數值隨著可能抽取的樣本的不同而或大或小,為了總體衡量樣本代表性的高低,就需要計算抽樣誤差的一般水平。抽樣平均誤差就是反映抽樣誤差一般水平的指標。抽樣平均誤差是所有樣本與總體參數離差的平均數,即指樣本統計量在由樣本所構成的總體上的標準差。具體一個樣本抽樣的實際抽樣誤差是無法知道的(總體的參數未知),而抽樣平均誤差是可以計算的,這要借助概率的理論。設用表示抽樣平均數的平均誤差,表示抽樣成數的平均誤差,表示樣本可能數目,則:

注意以上公式中求和是對所有樣本求和的。【例7-3】總體為2、3、4,從總體中按重復抽樣抽出兩個單位組成樣本。求抽樣平均誤差就是求所有可能樣本平均數的標準差。在此;即為抽樣平均誤差。四、影響抽樣平均誤差的因素按照上面抽樣平均誤差的公式,也是不可算的,因為總體的參數未知;為了計算和控制抽樣平均誤差,需要分析影響抽樣平均誤差的因素。1.全及總體標志的變動程度()在其他條件不變的情況下,全及總體標志變異程度越大(即變量在總體內的起伏程度越大),抽樣平均誤差越大;反之,全及總體標志變異程度越小,抽樣平均誤差越小。2.樣本容量()多少在其他條件不變的情況下,樣本容量越大,抽樣平均誤差越小;反之,樣本容量越小,抽樣平均誤差越小。因為樣本容量越大越能反映總體、接近總體,誤差就越小;反之,誤差就越大。當樣本容量與總體單位數相等時,就不存在抽樣誤差了。3.抽樣組織方式不同的調查組織方式,如簡單隨機抽樣、類型抽樣、多階段抽樣等,所產生的抽樣誤差一般是不同的。因為不同的抽樣方式抽出的樣本對于總體的代表性高低也不相同,因而抽樣誤差也就不一樣。一般來說,簡單隨機抽樣的抽樣誤差最大,類型抽樣、多階段抽樣的抽樣誤差就要明顯地小一些。在統計實踐中,為了有效降低抽樣誤差、提高抽樣推斷的可靠性,一方面應該根據被研究總體的性質和特點,選擇不同抽樣方式進行抽樣;另一方面,還要努力尋求多種抽樣方式相結合的復合型抽樣組織方式。⒋抽樣方法無論是隨機抽樣還是非隨機抽樣,都有重復抽樣和不重復抽樣兩種方法。在其他條件相同時,不重復抽樣的抽樣誤差一般小于重復抽樣的誤差,這是因為不重復抽樣避免了從總體單位中的重復選擇,因而更能反映總體結構,故抽樣誤差會較小些。五、抽樣平均誤差的計算1.樣本平均數的抽樣平均誤差上述的抽樣平均誤差公式是不可算的,原因不知道總體的參數;但是抽樣平均誤差作為所有樣本所構成的總體上的一個變量,抽樣平均誤差成為總體上的隨機變量的標準差;利用相關的概率與數理統計知識,可以得到下面的公式。(1)重復抽樣下抽樣平均誤差的計算如果全及總體變量的均值為標準差為;在重復抽樣條件下,樣本的均值統計量的均值為標準差為;從而可以得出一個計算抽樣平均誤差的轉化公式。即:為樣本單位數;在總體標準差未知,且樣本單位數較大時,可以用樣本修正標準差代替【例7-4】設有4個工人,其每月產量分別為70、90、130、150。這一總體的平均工資和工資標準差為:現在用重復抽樣的方法,從4人產量中抽取2人構成樣本,并求樣本的平均產量,用以代表4人總體的平均產量水平。所有可能的樣本以及各樣本的平均產量列表如下:樣本平均數的平均數(件)抽樣平均誤差(件)現在直接按重復抽樣誤差公式計算抽樣平均誤差。(件)所得結果與由定義計算的抽樣平均誤差完全相同。以上計算過程中可以呈現出幾個基本關系:①樣本平均數的平均數等于總體平均數。因而抽樣平均誤差的實質就是抽樣平均數的標準差,所以也稱為抽樣標準誤差。②抽樣平均數的標準差(即抽樣平均誤差)比總體標準差小得多,僅為總體標準差的。③可以通過選擇樣本單位數來控制抽樣平均誤差。例如將樣本單位數擴大為原來的4倍,則平均誤差就縮小一半;如果抽樣平均誤差允許增加一倍,則樣本單位數只需要原來的四分之一。(2)不重復抽樣下抽樣平均誤差的計算在不重復抽樣的條件下,抽樣平均數的平均誤差不但和總體變異程度、樣本容量有關,而且還要考慮總體單位數多少:在一般情況下,總體單位數很大,抽樣比例很小,則接近于1,因此,與的數值接近。在實際工作中,在沒有掌握總體單位數的情況下或者總體單位數很大時,一般均用重復抽樣平均誤差公式來計算不重復抽樣的平均誤差。【例7-5】仍以4個工人為例,月產量分別為70、90、130、150件。現用不重復抽樣方法,隨機抽取2個工人,并求其平均產量,所有可能的樣本以及各樣本的平均產量列表如下:樣本平均數的平均數(件)抽樣平均誤差根據已經計算的總體平均數=110,總體標準差件,也可以按不重復抽樣誤差公式計算。

(件)兩者計算結果完全相同。由此可見,在不重復抽樣的條件下,抽樣平均數的平均數仍然等于總體平均數,而它的抽樣平均誤差18.26件比重復抽樣的平均誤差22.36件小。在計算抽樣平均誤差時,通常得不到總體標準差的數值,要用樣本標準差s來代替總體標準差。【例7-6】隨機抽選某校學生100人,調查他們的體重。得到他們的平均體重為58公斤,標準差為10公斤。問抽樣推斷的平均誤差是多少?解:已知:,,,則

即:當根據樣本學生的平均體重估計全部學生的平均體重時,抽樣平均誤差為1公斤。【例7-7】某廠生產一種新型燈泡共2000只,隨機抽出400只作耐用時間試驗,測試結果平均使用壽命為4800小時,樣本標準差為300小時,求抽樣推斷的平均誤差?解:已知:,,,(小時)(小時)

計算結果表明:根據部分產品推斷全部產品的平均使用壽命時,采用不重復抽樣比重復抽樣的平均誤差要小。2.抽樣成數的抽樣平均誤差成數作為交替標志的均值,抽樣成數的抽樣平均誤差是樣本均值抽樣平均誤差的特例;只需要將全及成數的標準差平方代替公式中的全及平均數的標準差的平方,就可以得到抽樣成數的平均誤差公式。交替標志的標準差總體標準差樣本標準差抽樣成數的平均誤差重復抽樣:不重復抽樣:【例7-8】某燈泡廠對10000個產品進行使用壽命檢驗,隨機抽取2%樣本進行測試,得資料如下:按照質量規定,電燈泡使用壽命在1000小時以上者為合格品,按以上資料計算抽樣平均誤差。電燈泡的平均使用時間(小時)電燈泡合格率電燈泡平均使用時間標準差

(小時)燈泡使用時間抽樣平均誤差:重復抽樣的平均誤差(小時)在不重復抽樣下抽樣平均誤差(小時)燈泡合格率的抽樣平均誤差:重復抽樣下抽樣平均誤差不重復抽樣下抽樣平均誤差抽樣平均誤差計算公式顯示可以通過調整樣本容量來控制抽樣平均誤差。【例7-9】假定抽樣單位數增加2倍、0.5倍時,抽樣平均誤差怎樣變化?抽樣單位數增加2倍,即為原來的3倍即:當樣本單位數增加2倍時,抽樣平均誤差為原來的0.577倍。抽樣單位數增加0.5倍,即為原來的1.5倍。即:當樣本單位數增加0.5倍時,抽樣平均誤差為原來的0.8165倍。六、抽樣極限誤差1.抽樣極限誤差的概念用抽樣指標來估計總體指標,要達到毫無誤差一般來說是不可能的,所以在估計總體指標的同時,必須考慮估計誤差的大小,給出最大允許誤差。最大允許誤差盡量要小一些,誤差超過了一定的限度,樣本資料就毫無價值了。如對糧食單位面積產量進行抽樣調查,如果所抽的糧食每公頃產量的誤差超過500千克,可以斷定這種樣本資料的價值是不大的。因為一般糧食平均每公頃產量為7500千克,而誤差達到500千克,則誤差為6.7%。通常糧食增產達到5%的幅度就是好收成,現在抽樣誤差已經超過了這個數目,這種統計數字就失去意義了。在進行抽樣估計時,應該根據所研究對象的差異程度和分析的需要確定可允許的誤差范圍,在這個范圍內的估計數字都是有效的。把這種可允許的最大誤差范圍稱為極限誤差,它等于樣本指標可允許變動的上限或下限與總體指標之差的絕對值。根據概率理論,在已知誤差(是個隨機變量)的概率分布的前提下,可以計算出以一定的可靠程度保證抽樣誤差不超過某一給定的范圍。故統計上又把抽樣極限誤差范圍稱為置信區間。設與分別表示抽樣平均數與抽樣成數的抽樣極限誤差,則有:2.總體范圍的估計若有了抽樣極限誤差,則總體平均數和總體成數的可能范圍可以用下式估計:抽樣平均數的范圍:≤≤抽樣成數的極限誤差:≤≤

如要估計某鎮糧食畝產量和總產量水平,從8000畝糧食作物中,用不重復抽樣抽取400畝,求得平均畝產為700公斤。如果確定抽樣誤差為5公斤,這就要求某鎮糧食畝產在7005公斤,即在695至705公斤之間,而糧食總產量在8000(7005)公斤,即556萬公斤至564萬公斤之間。【例7-10】要估計一批產品的合格率,從1000件產品中抽取200件,其中有10件不合格品,如果確定抽樣極限誤差的范圍為2%,試估計產品合格率的范圍。樣本成數:p=190/200=95%總體成數下限=95%-2%=93%總體成數上限=95+2%=97%即該產品合格率在93%-97%之間。七、可信度和概率度抽樣估計不是百分百的確定性估計,而是在一定概率保證度下的判斷和估計;抽樣平均誤差是表明抽樣估計的準確度;而抽樣最大允許誤差范圍即抽樣極限誤差是表明抽樣估計準確度的允許范圍,這個允許范圍是在一定的可靠(概率)范圍內的,在允許范圍內,還要求確定其估計的可靠(概率)程度,即可信度。抽樣估計的可信度就是表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。基于可信度的概率估計要求,抽樣極限誤差通常需要以抽樣平均誤差或為標準單位來衡量。把極限誤差或分別除以或得相對數,表示誤差范圍為抽樣平均誤差的倍。是測量估計可靠程度的一個參數,稱為概率度。

對于抽樣平均數:因此,抽樣平均數的抽樣極限誤差為:

對于抽樣成數:因此,抽樣成數的抽樣極限誤差為:這個公式的意義在于,在一定條件下,概率度越大,則抽樣誤差范圍越大,樣本可能落在誤差范圍內的概率越大,從而抽樣估計的可信度也就越高;反之,越小,則越小,可能樣本落在誤差范圍內的概率越小,從而抽樣估計的可信度也就越低。而估計區間又與抽樣極限誤差有關,在一定的抽樣方式下,抽樣極限誤差又是由概率度決定的。因而可靠程度與之間有正比關系。從理論上已經證明,在樣本單位數足夠多≥的條件下,抽樣平均數是服從正態分布的,它以總體的均值為中心,以抽樣平均誤差為標準差;而標準化了的樣本均值統計量服從標準的正態分布;這個統計量的最大取值范圍即為樣本均值統計量的概率度,而其取值的概率可以完全由標準正態分布的分布表來決定。在統計實踐中,總體的方差往往是未知的,用方差統計量(公式7-9)的值替代總體的方差,此時標準化了的樣本均值統計量服從分布。在統計實踐中,總體的方差往往是未知的,用方差統計量(公式7-9)的值替代總體的方差,此時標準化了的樣本均值統計量服從分布。第三節總體指標的推斷一、總體參數估計總體參數估計就是指通過對樣本各單位的實際觀察取得樣本數據,計算樣本統計量的取值作為被估計參數的估計值。總體參數估計有點估計和區間估計兩種。(一)總體參數的點估計1.點估計的概念點估計又稱定值估計,它是利用樣本計算出的統計量直接作為總體參數的估計量。如用樣本平均數的實際值作為總體平均數的估計量;用樣本成數的實際值作為總體成數的估計值。例如,根據某地區樣本資料計算糧食平均每公頃產量9000千克,優質糧食作物的比重為80%,則可以用這些數值作為全地區糧食單位面積(每公頃)產量水平和優質品率的估計值。如用樣本均值統計量作為總體參數的估計(樣本的一階原點矩),用修正的樣本方差統計量作為總體參數的估計(樣本的二階中心矩)等。參數點估計中關鍵是如何構造點估計(統計)量,構造點估計量的方法有多種,如矩估計法、最大似然估計法和貝葉斯法等。2.估計量的評選標準估計總體參數,不一定只能用一個統計量,也可以用其他統計量。如估計總體平均數,可以用樣本平均數,也可以用樣本中位數、眾數等等。應當以哪一種統計量作為總體參數的估計量才是最優的,這就有了評價統計量的優良估計標準問題。作為優良估計應該符合以下三個標準:(1)無偏性無偏性是指樣本統計量的期望值(平均數)等于被估計的總體參數。也就是說,雖然每一次抽樣,所計算的統計量和總體參數的真值可能有誤差,誤差可正可負、可大可小;但在多次反復的估計中,所有樣本統計量取值的平均數應該等于總體參數本身。即樣本統計量的估計,平均來說是沒有偏差的。樣本平均數的期望值等于總體平均數,樣本成數的期望值等于總體成數。這說明以樣本平均數作為總體平均數的估計量,以樣本成數作為總體成數的估計量,是符合無偏性原則的。但是樣本的標準差統計量就不符合這一標準,修正后的方差統計量才是一個無偏統計量了。(2)一致性一致性是指當樣本的單位數充分大時,樣本統計量也充分靠近總體參數。就是說隨著樣本單位數的無限增加,樣本統計量和被估計的總體參數之差的絕對值小于任意小的數,(總體均值的一致性可由大數定理提供理論保證)實際上是幾乎肯定的。從抽樣誤差的影響中可以看出,在其他因素不變的情況下,樣本均值的抽樣誤差與樣本單位數的平方根成反比變化,樣本單位數愈多則誤差就愈小,當樣本單位數接近于總體單位數時,抽樣誤差也就接近于零。也就是說樣本均值統計量作為總體參數的估計量是符合一致性原則的。(3)有效性有效性是指作為優良估計量的方差應該比其他估計量的方差小。例如用樣本平均數或用總體某一變量值來估計總體平均數,雖然兩者都是無偏的,而且在每一次估計中,兩種估計量和總體平均數都可能有離差,但是樣本平均數更靠近于總體平均數的周圍,平均來說其離差比較小。所以對比說來,樣本平均數是更為有效的估計量。不是所有估計量都符合以上標準。可以說完全符合以上標準的估計量要比不符合或不完全符合以上標準的估計量更為優良。例如在正態分布的情況下,總體平均數和中位數是重合在一起的,樣本平均數是總體中位數的無偏估計量和一致估計量,而且樣本平均數比樣本中位數作為總體中位數的估計量也是更有效的,因為樣本平均數的方差比樣本中位數的方差更小。在正態分布的情況下,樣本中位數是總體平均數的無偏估計量和一致估計量。但對比樣本平均數卻不是更有效和充分的估計量,因為它的方差比樣本平均數的方差大,當然樣本中位數也不是總體中位數的有效估計量。總體參數點估計的方法簡便、易行。但這種估計沒有表明抽樣估計的誤差,也沒有指出誤差在一定范圍內的概率保證程度有多大。要研究這些問題,就需要采用區間估計的方法。(二)總體參數的區間估計總體參數的區間估計不是直接給出總體參數的估計值,而是利用實際樣本資料,構造出一個置信區間,用這個區間來表明總體參數可能存在的范圍,同時給出這個估計相應的概率保證程度(置信度)。用公式表示為:≤≤≤≤式中,和分別是總體平均數區間的上限與下限;和分別為總體成數的上限與下限。

,分別表示被估計總體參數在區間和內的概率為,即:≤≤≤≤稱和為置信區間。置信區間就是聯系一定概率保證程度確定的區間,表達了區間估計的精確性。為置信度或概率,表示區間估計的可靠程度。例如=0.95,說明有95%的可能總體參數包括在估計區間內。而不包括在這個區間的概率為

=5%,叫顯著性水平。由上可見,科學的區間估計方法要具備三個基本要素:第一,要有合適的統計量作為估計量。第二,要有合理的允許誤差范圍,即抽樣極限誤差,指樣本統計量與被估計總體參數離差的絕對值可允許變動的上限和下限。第三,要有可靠的概率保證程度,即估計的置信度,它涉及估計的可靠性問題;置信度與概率度是對應關系。對于總體的的均值,根據大數定理和中心極限定理,在大樣本的情況下,樣本均值服從正態分布,中心化后為標準正態分布;當總體方差未知時,用修正的方差統計量替代總體方差;隨機變量服從自由度為的分布。(三)區間估計的兩種方法1.給定抽樣誤差范圍,估計概率保證程度根據給定的抽樣誤差范圍

,估計其概率保證程度()的具體步驟是:第一步,抽取樣本,根據樣本單位標志值計算樣本指標,如計算樣本平均數或樣本成數,作為總體指標的相應估計值。并計算樣本標準差以推算抽樣平均誤差。第二步,根據給定的抽樣極限誤差范圍,估計出總體指標(平均數或成數)的下限和上限。第三步,根據給定的抽樣極限誤差除以抽樣平均誤差,求出概率度值,再根據值和大小樣本數查概率分布表,求出相應的概率保證程度();對大樣本,查《正態分布概率表》;在方差未知的前提下,樣本容量不大時查《分布臨界值表》。并對總體參數作區間估計。這種估計方法分為總體平均數的估計和總體成數的估計兩種形式。(1)總體平均數的估計【例7-11】某城市進行居民家計調查,隨機抽取400個居民戶,調查得年平均每戶文化用品消費支出為900元,標準差為200元。要求抽樣極限誤差不超過20元,試對該市居民年平均每戶文化用品消費支出情況做出估計。第一步,抽取樣本,計算樣本平均數和標準差,并計算抽樣平均誤差。元,元(元)在這里,樣本是容量為400,是個大樣本;總體標準差是用樣本標準差來代替的;以下例子相同。第二步,根據給定的誤差范圍,計算該市居民戶年均文化用品消費的范圍。下限==900-20=880(元)上限==900+20=920(元)第三步,計算概率度,并查《正態分布概率表》表,查出置信度。可以有95.45%的概率保證程度,估計該市居民戶年均文化用品消費支出在880-920元之間。(2)總體成數的估計【例7-12】對某市居民戶獨立擁有廚衛設施情況進行調查,隨機抽取900居民戶,其中有675戶居民擁有獨立的廚衛設施。要求抽樣極限誤差范圍不超過2.73%,試對該市居民戶獨立擁有廚衛設施的比重進行估計。第一步,抽取樣本,n=900是個大樣本,計算樣本成數和標準差,并推算抽樣平均誤差。第二步,根據給定的誤差范圍,計算總體成數的上下限。下限==75%-2.73%=72.27%上限==75%+2.73%=77.73%第三步,計算概率度,并查《正態分布概率表》表,查出置信度。可以有95%的概率保證程度,估計該市居民戶擁有獨立廚衛設施的比重在72.27%-77.73%之間。2.根據置信度的要求,估計總體指標出現的可能范圍根據置信度的要求,估計總體指標出現的可能范圍的具體步驟是:第一步,抽取樣本,根據樣本單位標志值計算樣本指標,如計算樣本平均數或樣本成數,作為總體指標的相應估計值。并計算樣本標準差用以推算抽樣平均誤差。第二步,根據給定的置信度的要求,大樣本查《正態分布概率表》,求得概率度值;小樣本查《分布臨界值表》,求出概率度值。第三步,根據概率度和抽樣平均誤差來推算抽樣極限誤差的可能范圍,并據以計算被估計總體指標的上下限,對總體參數作區間估計。(1)總體平均數的估計【例7-13】某外貿公司出口一種茶葉,規定每包規格不低于150克,現在用不重復抽樣的方法抽取其中1%進行檢驗。測得結果如表7-5所示,要求以99.73%的概率估計這批茶葉平均每包的重量范圍。以便確定平均重量是否達到規格要求。表7-5某外貿公司出口茶葉抽樣資料每包重量(克)組中值包數148-149148.510149-150149.520150-151150.550151-152151.520合計——100第一步,根據樣本資料計算樣本平均數和標準差,并推算抽樣平均誤差。(克)(克)

(克)第二步,根據給定的置信度=0.9973,查表得概率度=3。第三步,根據概率度和抽樣平均誤差計算抽樣極限誤差,并估計總體平均數的上下限,判斷其是否達到規格要求。(克)下限==150.3-0.26=150.04(克)上限==150.3+0.26=150.56(克)可以用99.73%的概率保證該批茶葉平均每包重量在150.4-150.56克之間,表明這批茶葉平均每包重量達到了規格要求。【例7-14】為研究堅持長跑對體重的影響,采集到10名堅持長跑者前后體重變化的數據:5,0,0,0,8,1,1,4,0,1(單位千克);若以90%的概率保證度,則堅持長跑前后體重變化的置信區間是多少?根據統計資料,知人群體重變化服從正態分布;第一步,根據樣本資料計算樣本平均數和標準差,并推算抽樣平均誤差。

(千克)(千克)(千克)第二步,根據給定的置信度=0.90,查《分布臨界值表》得概率度=1.833。第三步,根據概率度和抽樣平均誤差計算抽樣極限誤差,并估計總體平均數的上下限,判斷其是否達到規格要求。(千克)下限==2-1.59=0.41(千克)上限==2+1.59=3.59(千克)可以用90%的概率保證長期堅持鍛煉人群重量變化在0.41-3.59千克之間。(2)總體成數的估計表7-5某外貿公司出口茶葉抽樣資料每包重量(克)組中值包數148-149148.510149-150149.520150-151150.550151-152151.520合計——100要求用同樣的概率,保證這批茶葉包裝合格率范圍。第一步,根據樣本資料計算樣本合格率和標準差,并推算抽樣平均誤差。第二步,根據給定的置信度=0.9973,查表得概率度=3。第三步,根據概率度和抽樣平均誤差計算抽樣極限誤差,并估計總體合格率的上下限。下限==0.7-0.137=0.563上限==0.7+0.137=0.837可以用99.73%的概率,保證該批茶葉包裝的合格率在56.3%-83.7%之間。(四)總體總量指標的估計在對總體平均數和總體比例進行區間估計的基礎上,還可以進一步對相應的總量指標,即總體標志總量和具有某一特征的總體單位數的區間做出估計。其方法是用總體單位數N分別乘以置信區間的上限和下限,得出要估計的總量指標的區間。

【例7-15】某企業生產某種產品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調查他們的當日產量。樣本人均產量為35件,產量的樣本標準差為4.5件,試以95.45%的置信度估計平均日產量的抽樣極限誤差、置信區間和當日該企業總產量的置信區間。

解:件,=4.5件,=100人,屬于大樣本。故(件)又知,則,該企業總體人均日產量在95.45%置信度下的置信區間為:

35-0.86≤≤35+0.86,即在34.14至35.86件之間。

該企業日總產量在95.45%置信度下的置信區間為:

,即在34140至35860件之間。

【例7-16】某廠對7月份生產的2000只產品質量進行抽樣檢驗,采取重復抽樣抽取樣品200只,樣品優質品率為85%,試計算當把握程度為90%時優質品率的區間范圍以及優質品的總產量區間范圍。

解:已知=2000只,=200只,=0.85,=0.90,

總體優質品率在置信度90%下的置信區間為

85%-4.15%≤≤85%+4.15%

即總體優質品率的置信區間在[80.85%,89.15%]之間。總體優質品總產量在90%置信度下的置信區間為,即總體優質品總產量的置信區間之間。二、抽樣組織方式(一)簡單隨機抽樣的組織方式1簡單隨機抽樣的組織方式簡單隨機抽樣的組織形式除了抽樣框的名單外,不需要利用任何其他信息,所以也稱為稱純隨機抽樣。這種方法的優點是使用起來簡單易行,它適用于總體單位數不是太多的總體。采用簡單隨機抽樣,在進行抽樣調查之前應該先確定總體范圍,并對總體進行編號,然后用抽簽的方式或根據《隨機數字表》來抽選必要的單位數。簡單隨機抽樣最符合隨機原則。簡單抽樣有幾種不同的抽樣方法。(1)抽簽法。先給每個單位編上序號,將號碼寫在紙片上,摻和均勻后從中抽選,抽到哪個單位就是哪個單位,直到抽夠預先規定的數量為止。這種方法看起來簡單易行,總體單位數目不多時也可以使用。(2)隨機數字法。首先要將全及總體中所有的單位加以編號,根據編號的位數確定選用隨機數碼表中若干欄數字。然后從任意一欄、任意一行的數字開始數,可以向任何方向數過去,碰上屬于編號范圍內的數字號碼就定下來作為樣本單位。如果是不重復抽樣,則碰上重復的數字時不要它,直到抽夠預定的數量為止。2.樣本容量的確定組織抽樣調查的一項重要工作就是確定合適的樣本容量。在設計的時候,通常是先根據研究問題的性質確定允許的誤差范圍和必要的概率保證程度(或概率度),并根據總體的標準差通過抽樣平均誤差的公式來計算必要的樣本單位數n。簡單隨機抽樣在實踐上受到許多限制。例如當總體很大時,要首先對每一個單位加以編號就有很大困難,對于無限總體,對其進行編號甚至是不可能的。但這種抽樣方式從理論上說最符合隨機原則,它的抽樣誤差容易得到理論上的論證。因此可以作為發展其他更復雜的抽樣設計的基礎,同時也是衡量其他抽樣方式抽樣效果的比較標準。(二)類型抽樣的組織方式類型抽樣是將統計分組法和簡單隨機抽樣結合起來的一種抽樣方式。通過分組,可以把總體分成幾個在組內性質比較接近的類型,使得各組內標志差異縮小,各組間有較大差異,保證了樣本單位能夠均勻地分布在總體各部分,從而提高了樣本的代表性。實踐和數理統計都已證明,類型抽樣能比簡單隨機抽樣取得更好的效果。例如,對居民的家計調查,可以按國民經濟部門分組來抽選樣本單位;對農作物的單位面積產量調查,可以按不同的地理條件分組來抽選樣本單位;對某種產品質量進行調查,可以按企業規模分組來抽選樣本單位等等。這樣都能保證樣本有較充分的代表性。將總體分成若干組后,樣本單位數在各組之間的分配主要有三種方法:一是按調查者主觀意志任意確定各組應抽選單位數,這種分配方法稱為隨意分配。二是按各組的標志變異程度來確定各組應抽的單位數。對于標志變異大的組宜多抽一些單位進行調查,而標志變異小的組宜少抽一些單位進行調查。各組的抽選比例與對應的總體中各組單位數所占的比例是不相等的,這種分配方法稱為最佳分配。三是按統一的比例確定各組應抽選的單位數,這種分配方法稱為比例分配。(三)等距抽樣的組織方式由于排隊所依據的標志不同,有兩種等距抽樣方法。第一,無關標志排隊法。即是指排列的標志和單位標志值的大小無關或不起主要的影響作用。例如,調查職工收入水平時,按職工姓氏筆劃排隊進行抽樣。顯然職工收入水平與姓氏筆劃之間沒有必然的聯系。第二,有關標志排隊法。所謂有關標志是指作為排列順序的標志和單位標志值的大小有密切的關系。例如,職工家計調查,按職工平均工資排隊抽取調查戶等。按有關標志排隊實質上是運用類型抽樣的一些特點,有利于提高樣本的代表性。(四)整群抽樣的組織方式整群抽樣的優點在于組織工作簡單,搜集資料方便容易,調查費用較少。例如,對某工業產品的質量檢驗,不便于在流水作業線上一件一件地抽選檢查,則可以每隔若干小時抽取一批產品進行檢驗,這樣就方便多了。但是,正因為以群為單位進行抽選,抽選單位比較集中,顯著地影響了在總體中各單位分布的均勻性,與其他抽樣方式比較,抽樣誤差比較大,即使要得到同簡單隨機抽樣相同的精確度,整群抽樣都要調查相對較多的樣本單位。一般地,在缺乏總體抽樣框的情況下,宜采用整群抽樣方式。(五)多階段抽樣的組織方式如我國農產品產量調查就是采用多階段抽樣調查,第一階段從省抽縣,第二階段從中選縣抽鄉,第三階段從中選鄉抽村,再從中選的村中抽地塊,最后從中選的地塊中抽具體的樣本單位,并以樣本單位測得的實際資料來推算平均畝產和總產。又如我國職工家計調查,第一階段先抽調查城市,第二階段從中選城市的各部分中抽選調查單位,第三階段再從單位中抽選職工,確定具體的調查戶,調查各戶每月實際的生活費收支情況。在實際工作中,當總體單位很多、分布廣泛,又幾乎不可能從總體中直接抽取總體單位時,常采用多階段抽樣。其優點是:第一,便于組織抽樣。它可以按現有的行政區劃或地理區域分各階段的抽樣單元,從而簡化抽樣框的編制。第二,可以獲得各階段單元的調查資料,根據最初級資料可進行逐級抽樣推斷,得到各級的調查資料。如農產品產量調查,可根據樣本推斷地塊資料,根據地塊資料可推斷村的資料,然后依次推斷鄉、鄉推縣等。第三,多階段抽樣的方式比較靈活,各階段抽樣的組織方式應以前述四種為依據進行選擇。一般在初級階段抽樣時多用分層抽樣和等距抽樣,在次級階段抽樣時多用等距抽樣和簡單隨機抽樣。同時,還可以根據各階段的不同特點,采用不同的抽樣比。如方差大的階段,抽樣比大一些,方差小的階段,抽樣比小一些。而且多階段抽樣在簡化抽樣工作的同時,又因抽樣單位的分布較廣,而具有較強的代表性。本章小結抽樣調查又稱抽樣推斷或抽樣估計,是根據隨機的原則在總體中抽取一部分總體單位進行調查登記,進而利用這部分總體單位的數據對總體的有關數量特征在一定概率保證下作出推斷的一種統計方法。抽樣調查適用的范圍很廣泛。抽樣方法有:重復抽樣和不重復抽樣。抽樣推斷的理論基礎有:隨機變量及其分布規律和大數定理與中心極限定理。用抽樣樣本指標來估計全及指標是否可行,關鍵問題在于抽樣誤差。影響抽樣平均誤差的因素主要有:全及總體標志的變動程度、樣本容量多少、抽樣組織方式、抽樣方法。在進行抽樣估計時,應該根據所研究對象的差異程度和分析的需要確定可允許的誤差范圍,在這個范圍內的估計數字都是有效的,這種可允許的最大誤差范圍稱為極限誤差。抽樣估計的可信度就是表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。總體參數估計就是指通過對樣本各單位的實際觀察取得樣本數據,計算樣本統計量的取值作為被估計參數的估計值。總體參數估計有點估計和區間估計兩種。抽樣的組織方式有:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣和多階段抽樣。本章實訓模塊一:知識理解一、簡答題1、抽樣調查的特點是什么?2、什么是抽樣誤差,什么是抽樣平均誤差?3、什么叫抽樣分布,它和總體分布的關系是怎樣的?4、什么是簡單隨機抽樣?有什么特點?5、什么是分層抽樣?什么是整群抽樣?二、判斷題(正確的畫“√”,錯誤的畫“×”)1.連續生產的電子管廠,每隔一小時抽取5分鐘的產品進行產品質量檢驗,這是運用類型抽樣方式。()

2.在進行農產量調查時,如果有意識地都從田邊地頭抽取樣本,有可能使推算的農產量產生系統誤差。()

3.分層抽樣是將總體先分為若干群,然后成群地隨機抽取樣本單位。()

二、判斷題(正確的畫“√”,錯誤的畫“×”)4.抽樣極限誤差是指樣本指標與總體指標之間離差的可能范圍。()

5.在重復抽樣條件下,推斷總體成數的必要抽樣單位數目的公式為。()6.在一定抽樣平均誤差的條件下,要提高推斷的可靠性,必須縮小極限誤差。()二、判斷題(正確的畫“√”,錯誤的畫“×”)7.在其他條件不變的情況下,提高抽樣估計的可靠程度,其精確程度也將隨之提高。()8.在抽樣推斷中,抽樣誤差雖然不可避免但可以控制。()9.對10000只燈泡進行耐用性能測試,根據以往資料,耐用時間標準差為51.91小時,若采用重復抽樣方法,概率保證68.27%,平均耐用時數的誤差范圍不超過9小時。在這種條件下應抽取34只燈泡進行耐用性能測試。()二、判斷題(正確的畫“√”,錯誤的畫“×”)10.點估計可以給出估計的可靠程度。()11.從100個住戶中隨機抽取了10戶,調查其月消費支出額。經計算得到10戶的平均月消費支出額為3500元,標準差為300元。假定總體服從正態分布,則總體平均月消費支出額95%的置信區間為:。()二、判斷題(正確的畫“√”,錯誤的畫“×”)12.樣本容量過大,統計量的標準誤差也會增大,對總體參數的估計會不準確。()13.在參數估計中,無偏性是衡量一個估計量是否理想的唯一準則。()14.在對總體均值作區間估計時,若給定的顯著性水平較小,則估計的結果將有較低的精確度和較高的可信程度。()15.在抽樣推斷中,作為推斷對象的總體和作為觀察對象的樣本都是確定的、唯一的。()三、單項選擇題(只有一個正確答案)1.為了了解某工廠職工家庭收支情況,按該廠職工名冊依次每50人抽取1人,對其家庭進行調查屬于()。A.簡單隨機抽樣B.等距抽樣C.類型抽樣D.整群抽樣2.抽樣平均誤差反映了樣本指標與總體指標之間的()。A.實際誤差B.調查誤差C.可能誤差范圍D.平均誤差三、單項選擇題(只有一個正確答案)3.某地區職工樣本的平均工資450元,抽樣平均誤差5元,該地區全部職工平均工資落在440~460元之間的估計置信度為()。A.2B.0.9545C.3D.0.99734.根據城市電話網100次通話情況調查,得知每次通話平均持續時間為4分鐘,標準差為2分鐘,在概率保證為95.45%的要求下,估計該市每次通話時間為()。A.3.9~4.1分鐘之間B.3.8~4.2分鐘之間

C.3.7~4.3分鐘之間D.3.6~4.4分鐘之間三、單項選擇題(只有一個正確答案)5.進行重復隨機抽樣,為使抽樣誤差減少75%,抽樣單位數必須是原來的()。A.倍B.倍

C.4倍D.16倍6.將總體各單位按某一標志排隊,然后按相等的間隔來抽取樣本單位的方法為()。

A.簡單隨機抽樣

B.類型抽樣C.等距抽樣

D.整群抽樣三、單項選擇題(只有一個正確答案)7.在同樣隋況下,不重復抽樣的抽樣平均誤差與重復抽樣的抽樣平均誤差相比,()。

A.后者小于前者

B.前者小于后者

C.兩者相等

D.兩者有時相等,有時不等8.將統計分組與隨機抽樣相結合,借以降低總體方差對抽樣誤差的影響,從而提高樣本代表性,這種抽樣組織方式屬于()。

A.簡單隨機抽樣

B.分層抽樣C.等距抽樣

D.整群抽樣三、單項選擇題(只有一個正確答案)9.聯系一定的概率作參數區間估計時,概率表明的是要求估計的()。

A.精確度

B.可靠程度C.準確性

D.有效性10.根據抽樣調查資料,某企業工人生產定額平均完成105%,抽樣平均誤差為1%,概率為0.9545時(t=2),可以確定生產定額平均完成百分比為()。

A.大于107%

B.不大于103%和不小于107%

C.在103%和107%之間

D.小于103%三、單項選擇題(只有一個正確答案)13.有一批燈泡共1000箱,每箱200個,現隨機抽取20箱并檢查這些箱中的全部燈泡,這種抽樣方式屬于()。

A.純隨機抽樣B.類型抽樣C.整群抽樣D.等距抽樣14.某地有2萬畝稻田,根據上年資料得知其中畝產的標準差為50公斤,若以95.45%的概率推斷平均畝產量,要求極限誤差不超過10公斤,應抽選()畝地作為樣本進行抽樣調查。

A.100B.250C.500D.1000三、單項選擇題(只有一個正確答案)15.對甲乙兩個工廠工人平均工資進行純隨機不重復抽樣調查,調查的工人數一樣,兩工廠工資方差相同,但甲廠工人總數比乙廠工人總數多一倍,則抽樣平均誤差()。

A.甲廠比乙廠大B.乙廠比甲廠大C.兩個工廠一樣大D.無法確定16.當可靠度大于0.6827時,抽樣極限誤差()。

A.大于抽樣平均誤差B.小于抽樣平均誤差

C.等于抽樣平均誤差D.與抽樣平均誤差的大小關系依樣本容量而定三、單項選擇題(只有一個正確答案)17.對某行業職工收入情況進行抽樣調查,得知其中80%的職工收入在800元以下,抽樣平均誤差為2%,當概率為95.45%時,該行業職工收入在800元以下所占比重是()。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論