統計基礎第七章_第1頁
統計基礎第七章_第2頁
統計基礎第七章_第3頁
統計基礎第七章_第4頁
統計基礎第七章_第5頁
已閱讀5頁,還剩80頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計基礎第七章課件3/9/20231第一頁,共八十五頁,2022年,8月28日第七章

抽樣調查抽樣調查的一般問題抽樣誤差和抽樣估計抽樣調查的組織方式樣本容量的確定和對總量指標的推算假設檢驗的意義和假設命題假設檢驗的方法3/9/20232第二頁,共八十五頁,2022年,8月28日第一節

抽樣調查的一般問題

抽樣調查的概念和特點

抽樣調查的作用抽樣調查的幾個基本概念抽樣調查的理論基礎抽樣方法3/9/20233第三頁,共八十五頁,2022年,8月28日一、抽樣調查的概念和特點概念

抽樣調查是按照隨機原則從調查對象(即總體)中抽取部分單位進行調查,用調查所得指標數值對調查對象相應指標數值作出具有一定可靠性的估計和判斷的一種統計調查方法。所謂隨機原則也稱為機會均等原則。

特點抽樣調查是一種非全面調查;抽樣調查遵循隨機原則;抽樣調查是用部分單位的指標數值去推斷和估計總體的指標數值;

抽樣調查會產生抽樣誤差,但抽樣誤差是可以計算和控制的。

3/9/20234第四頁,共八十五頁,2022年,8月28日二、抽樣調查的作用對有些現象,不可能進行全面調查,但為了測算全面資料,必須采用抽樣調查的方法;

從理論上講,有些現象可以進行全面調查,但實際上沒有必要或很難辦到,也要采用抽樣調查;

利用抽樣調查,可以檢驗全面調查資料的準確性,并能修正全面調查資料的差錯;

抽樣調查可用于工業生產過程的質量控制;

利用抽樣調查原理,可以對某些總體的假設進行檢驗,來判斷這種假設的真偽,以決定行動的取舍。

3/9/20235第五頁,共八十五頁,2022年,8月28日三、抽樣調查的幾個基本概念全及總體和抽樣總體

全及指標和抽樣指標

3/9/20236第六頁,共八十五頁,2022年,8月28日(一)全及總體和抽樣總體全及總體全及總體,簡稱總體,是所要認識的研究對象全體。它是由所研究范圍內具有某種共同性質的全體單位所組成的集合體。一般用大寫字母N代表全及總體單位數。抽樣總體抽樣總體,簡稱樣本或子樣,是從全及總體中隨機抽取出來,作為代表這一總體的那部分單位組成的集合體。抽樣總體的單位數總是有限的,相對來說它的數目比較小。一般用小寫字母n代表抽樣總體單位數。組成樣本的每個單位稱為樣本單位。3/9/20237第七頁,共八十五頁,2022年,8月28日(二)全及指標和抽樣指標全及指標抽樣指標3/9/20238第八頁,共八十五頁,2022年,8月28日1.全及指標3/9/20239第九頁,共八十五頁,2022年,8月28日2、抽樣指標3/9/202310第十頁,共八十五頁,2022年,8月28日四、抽樣調查的理論基礎抽樣調查是建立在概率論大數定律基礎上的。它說明如果被研究的總體是由大量的相互獨立的隨機因素所構成,而且每個因素對總體的影響都相對的小。那么對這些大量因素加以綜合平均的結果,因素的個別影響將相互抵消,而呈現出共同作用的影響,使總體具有穩定的性質。這種規律性可通俗地從下面幾個方面加以描述。

只有在掌握足夠多的單位數目的情況時,大量現象的規律性及大量過程的傾向性才能充分顯示出來;

現象的總體規律性,通常是以平均數的形式表現出來;

當所研究的現象總體包含的單位越多,平均數也就越能夠正確地反映出這些現象的規律性;

各單位的共同傾向決定著平均數的水平。

3/9/202311第十一頁,共八十五頁,2022年,8月28日五、抽樣方法重置抽樣

重置抽樣,也稱重復抽樣,是指從全及總體抽取樣本時,隨機抽取一個樣本單位,記錄該單位有關標志值后,把它放回到全及總體中去,再從全及總體中繼續抽取第二個樣本單位,記錄它的有關標志值后,也把它放回全及總體中去,照此下去直到抽選第n個樣本單位為止。在重置抽樣方法下,全及總體單位數在抽選過程中始終未減少,每個單位中選的機會在每次抽選中都是均等的,同一個單位有可能不止一次被抽中。不重置抽樣

不重置抽樣,也稱不重復抽樣,是從全及總體抽取第一個樣本單位,記錄該單位有關標志值,這個樣本單位不再放回全及總體參加下一次抽選。然后,從N-1個單位中隨機抽選第二個樣本單位,記錄了該單位有關標志值后,該單位也不放回全及總體中去,從總體N-2個單位中抽選第三個樣本單位,照此下去直到抽選第n個樣本單位。在不重置抽樣方法下,總體單位數在抽選過程中是逐漸在減少。每抽一次,總體中就會少一個單位,各單位被抽中的可能性前后不斷變化,但每個單位只可能被抽中一次。3/9/202312第十二頁,共八十五頁,2022年,8月28日第二節

抽樣誤差和抽樣估計抽樣誤差的概念

抽樣平均誤差的概念及計算

抽樣估計案例

3/9/202313第十三頁,共八十五頁,2022年,8月28日一、抽樣誤差的概念抽樣誤差的一般概念

統計調查誤差的種類

影響抽樣誤差的因素

3/9/202314第十四頁,共八十五頁,2022年,8月28日(一)抽樣誤差的一般概念

抽樣誤差是指樣本指標與被它估計的總體相應指標的差數。具體指樣本平均數與總體平均數的差,樣本成數與總體成數的差。

3/9/202315第十五頁,共八十五頁,2022年,8月28日(二)統計調查誤差的種類登記性誤差是指統計調查時,由于主客觀原因在登記、匯總、計算、過錄中產生的差錯。登記性誤差不論全面調查或非全面調查都可能產生。代表性誤差是抽樣調查可能產生的誤差。代表性誤差又可分為系統性誤差和隨機誤差。抽樣誤差就是這種隨機誤差。3/9/202316第十六頁,共八十五頁,2022年,8月28日(三)影響抽樣誤差的因素抽取樣本單位數目的多少

總體單位之間標志值的差異程度

抽樣調查的組織形式抽樣方法

3/9/202317第十七頁,共八十五頁,2022年,8月28日二、抽樣平均誤差的概念及計算抽樣平均誤差的概念

抽樣平均誤差的計算

3/9/202318第十八頁,共八十五頁,2022年,8月28日(一)抽樣平均誤差的概念抽樣誤差隨著樣本的不同而變化,是一個隨機變量。抽樣平均誤差是所有抽樣誤差的平均水平。確切地說,則是所有樣本指標(樣本平均數和樣本成數)的標準差。公式如下:

3/9/202319第十九頁,共八十五頁,2022年,8月28日(二)抽樣平均誤差的計算重置抽樣的抽樣平均誤差

不重置抽樣的抽樣平均誤差

3/9/202320第二十頁,共八十五頁,2022年,8月28日1.重置抽樣的抽樣平均誤差

抽樣平均數的平均誤差抽樣成數的平均誤差

3/9/202321第二十一頁,共八十五頁,2022年,8月28日2.不重置抽樣的抽樣平均誤差

抽樣平均數的平均誤差抽樣成數的平均誤差

3/9/202322第二十二頁,共八十五頁,2022年,8月28日在其他條件不變的情況下,不重置抽樣的抽樣誤差要小于重置抽樣的抽樣誤差。

總體標準差的替代方法:用樣本標準差代替;

用過去同類的全面調查或抽樣調查的經驗數據代替;

在正式抽樣調查之前,先組織試驗性抽樣,用試驗樣本資料代替。

3/9/202323第二十三頁,共八十五頁,2022年,8月28日三、抽樣估計

抽樣估計的特點

抽樣估計的優良標準

抽樣估計方法

3/9/202324第二十四頁,共八十五頁,2022年,8月28日(一)抽樣估計的特點抽樣估計在邏輯上運用歸納推理,而不是演繹推理;抽樣估計在方法上運用不確定的概率估計法,而不是運用確定的數學分析法;抽樣估計存在抽樣誤差,抽樣誤差總是和抽樣估計的可靠程度聯系在一起。

3/9/202325第二十五頁,共八十五頁,2022年,8月28日(二)抽樣估計的優良標準

無偏性就是以抽樣指標估計總體指標要求抽樣指標值的平均數等于被估計的總體指標值本身;

一致性就是隨著n的無限增大,樣本指標與未知的總量指標之間的絕對離差任意小的可能性趨于實際必然性;

有效性就是用樣本指標估計總體指標時,作為估計量的方差比其他估計量的方差小。

3/9/202326第二十六頁,共八十五頁,2022年,8月28日(三)抽樣估計方法點估計

區間估計

3/9/202327第二十七頁,共八十五頁,2022年,8月28日1.點估計點估計又稱定值估計。它是用實際樣本指標數值代替總體指標數值,即總體平均數的點估計值就是樣本平均數,總體成數的點估計值就是樣本成數。3/9/202328第二十八頁,共八十五頁,2022年,8月28日2.區間估計根據樣本指標和抽樣平均誤差,可以確定總體指標所在的范圍;區間估計所表明的是一個可能范圍,不是一個絕對可靠的范圍;要提高推斷的可靠程度即提高概率,必須擴大誤差范圍。

3/9/202329第二十九頁,共八十五頁,2022年,8月28日區間估計的步驟:

計算樣本平均數或成數;

計算或確定方差;

計算抽樣平均數或成數的平均誤差;

計算平均數或成數的極限誤差;

確定總體平均數或成數的置信區間。

3/9/202330第三十頁,共八十五頁,2022年,8月28日例如,對某天生產的2000件電子元件的耐用時間進行全面檢

測,又抽取5%進行抽樣復測,資料如下表。根據規定耐用時

間在3000小時以下為不合格。根據以上資料按重置抽樣法計

算該電子元件平均耐用時間的抽樣平均誤差和合格率的抽樣

平均誤差,并以95.45%的把握估計該電子元件平均耐用時間

和合格率的區間范圍。

耐用時間(小時)全面檢測(支)抽樣復測(支)3000以下3000-40004000-50005000以上506009903602305018合計20001003/9/202331第三十一頁,共八十五頁,2022年,8月28日解:3/9/202332第三十二頁,共八十五頁,2022年,8月28日3/9/202333第三十三頁,共八十五頁,2022年,8月28日第三節

抽樣調查的組織方式抽樣調查的程序

簡單隨機抽樣

類型抽樣

等距抽樣

整群抽樣

多階段抽樣

案例

3/9/202334第三十四頁,共八十五頁,2022年,8月28日一、抽樣調查的程序立項

搜集總體的有關資料,編制抽樣框

設計抽樣調查方案

組織調查,搜集樣本單位的數據,對樣本進行準確性和代表性檢查進行數據處理推斷總體,并予以論證提供抽樣調查結果及對結果的可靠性作出說明

3/9/202335第三十五頁,共八十五頁,2022年,8月28日二、簡單隨機抽樣簡單隨機抽樣又稱純隨機抽樣,它是從總體全部單位中直接按隨機原則抽取樣本單位,使每個總體單位都有同等機會被抽中。簡單隨機抽樣最常采取的具體方法是隨機數字表法。隨機數字表是包含許多隨機數字的表格,它是從0到9的十個數碼隨機組合的數字表格。簡單隨機抽樣從理論上說最符合隨機原則,是其他抽樣方式的基礎,也是衡量其他抽樣方式抽樣效果的標準。但是在統計實踐中受到很大限制:一是當總體很大時,編號工作就很困難,對于連續生產的企業產品編號也不可能;二是當總體各單位標志值之間差異很大時,采用這種抽樣方式并不能保證樣本的代表性。3/9/202336第三十六頁,共八十五頁,2022年,8月28日三、類型抽樣類型抽樣又稱分層抽樣。它首先把全及總體按某一標志分成若干個類型組,使各組組內標志值比較接近,然后分別在各組組內按隨機原則抽取樣本單位。可見類型抽樣的特點在于,它把分組法和貫徹隨機原則結合起來,這樣,一方面提高了樣本的代表性;另一方面降低了影響抽樣平均誤差的總體方式。

3/9/202337第三十七頁,共八十五頁,2022年,8月28日類型抽樣具體分為兩種方法:

等比例類型抽樣

不等比例類型抽樣

3/9/202338第三十八頁,共八十五頁,2022年,8月28日(一)抽樣平均數的平均誤差重置抽樣不重置抽樣3/9/202339第三十九頁,共八十五頁,2022年,8月28日總體各組數量標志平均組內方差未知,

可用樣本各組數量標志平均組內方差代

替。其公式如下:

3/9/202340第四十頁,共八十五頁,2022年,8月28日(二)抽樣成數的平均誤差

1.重置抽樣2.不重置抽樣3/9/202341第四十一頁,共八十五頁,2022年,8月28日總體各組數量標志平均組內方差未知,

可用樣本各組數量標志平均組內方差代

替。其公式如下:3/9/202342第四十二頁,共八十五頁,2022年,8月28日例如,某廠有甲乙兩個車間都生產保溫瓶膽,乙車間技術先進,產量是甲車間的2倍,為了調查該廠保溫瓶膽的保溫時間,按兩車間產量比例共抽查60支瓶膽,取得如下表的資料,試以95%的可靠程度推斷該廠生產的全部瓶膽的平均保溫時間的可能范圍。

車間車間代碼平均保溫時間(小時)保溫時間的標準差(小時)甲乙1225281.20.83/9/202343第四十三頁,共八十五頁,2022年,8月28日解:3/9/202344第四十四頁,共八十五頁,2022年,8月28日四、等距抽樣等距抽樣又稱機械抽樣,它首先把總體各單位按一定順序排隊,然后,按此順序等間隔地抽取樣本單位進行調查。等距抽樣要計算抽取間隔,間隔d等于總體單位數N除以樣本容量n。無關標志排隊

有關標志排隊

3/9/202345第四十五頁,共八十五頁,2022年,8月28日樣本單位抽選方法

隨機起點等距抽樣半距起點等距抽樣對稱等距抽樣。3/9/202346第四十六頁,共八十五頁,2022年,8月28日等距抽樣誤差的算法按無關標志排隊的等距抽樣一般可以按不重置抽樣的抽樣誤差公式來代替。按有關標志排隊的等距抽樣可用類型抽樣的公式計算抽樣誤差。3/9/202347第四十七頁,共八十五頁,2022年,8月28日五、整群抽樣整群抽樣先將全及總體分成若干群(組),然后按照隨機原則從中抽取若干群(組),被抽中群(組)的所有單位都要進行調查。

特點:(1)直接抽取的是“群”,因此總體和樣本是“群”組成的。(2)影響抽樣誤差的方差是群間方差,群內方差不影響抽樣誤差。(3)是不重置抽樣,抽樣平均誤差應該用不重置抽樣公式計算。3/9/202348第四十八頁,共八十五頁,2022年,8月28日(一)抽樣平均數平均誤差

3/9/202349第四十九頁,共八十五頁,2022年,8月28日其中:3/9/202350第五十頁,共八十五頁,2022年,8月28日(二)抽樣成數平均誤差3/9/202351第五十一頁,共八十五頁,2022年,8月28日其中:3/9/202352第五十二頁,共八十五頁,2022年,8月28日六、多階段抽樣多階段抽樣就是把抽取樣本單位的過程分為兩個或更多個階段進行。先從總體中抽選若干大的樣本單位也叫第一階段單位。照此類推,直到最后抽出最終樣本單位。

3/9/202353第五十三頁,共八十五頁,2022年,8月28日(一)重置抽樣的抽樣平均誤差1.抽樣平均數

2.抽樣成數

3/9/202354第五十四頁,共八十五頁,2022年,8月28日(二)不重置抽樣的抽樣平均誤差1.抽樣平均數2.抽樣成數3/9/202355第五十五頁,共八十五頁,2022年,8月28日第四節

樣本容量的確定和

對總量指標的推算必要樣本容量的確定

總體總量指標的推算案例3/9/202356第五十六頁,共八十五頁,2022年,8月28日一、必要樣本容量的確定確定必要樣本容量的必要性影響必要樣本容量的因素

必要樣本容量的計算

計算必要樣本容量應注意的問題

3/9/202357第五十七頁,共八十五頁,2022年,8月28日(一)確定必要樣本容量的必要性樣本容量的大小直接影響到抽樣調查結果的精確程度和代表性,同時,也決定著調查費用的高低。

3/9/202358第五十八頁,共八十五頁,2022年,8月28日(二)影響必要樣本容量的因素

總體各單位標志變異程度

允許極限誤差的大小抽樣方法

抽樣方式

推斷的可靠程度大小

3/9/202359第五十九頁,共八十五頁,2022年,8月28日(三)必要樣本容量的計算重置抽樣的必要樣本容量

不重置抽樣的必要樣本容量

3/9/202360第六十頁,共八十五頁,2022年,8月28日1.重置抽樣的必要樣本容量(1)平均數的必要樣本容量(2)成數的必要樣本容量3/9/202361第六十一頁,共八十五頁,2022年,8月28日2.不重置抽樣的必要樣本容量(1)平均數的必要樣本容量(2)成數的必要樣本容量3/9/202362第六十二頁,共八十五頁,2022年,8月28日(四)計算必要樣本容量應注意的問題上面公式計算的樣本容量是最低的,也是最必要的樣本容量

在實際計算時往往用有關資料代替

為了同時滿足兩個推斷的要求,一般在兩個樣本容量中選擇較大的一個

如果帶小數,一般不采取四舍五入,而是用比這個數大的鄰近整數代替

3/9/202363第六十三頁,共八十五頁,2022年,8月28日二、總體總量指標的推算直接換算法修正系數法修正以后全面調查數=全面調查數×(1+差錯比率)

3/9/202364第六十四頁,共八十五頁,2022年,8月28日第五節

假設檢驗的意和假設命題假設檢驗的涵義及目的

顯著性水平

假設的命題3/9/202365第六十五頁,共八十五頁,2022年,8月28日一、假設檢驗的涵義及目的涵義假設檢驗,就是事先對總體參數或總體分布形式作出一個假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定應接受或否定原假設。目的在于判斷原假設的總體和現在實際的總體是否發生了顯著差異。3/9/202366第六十六頁,共八十五頁,2022年,8月28日二、顯著性水平假設檢驗時事先確定一個可允許的作為判斷界限的小概率標準就叫顯著性水平。顯著性水平并不是一個固定不變的數字;它與實際生活、工作中的顯著性是不一樣的。設定顯著性水平的目的是為了判別或比較兩個總體之間是否存在差異,如果兩個總體間的差異超過了總體內在的變異性,那么就認為具有統計上的顯著性。

3/9/202367第六十七頁,共八十五頁,2022年,8月28日三、假設的命題原假設H0

備擇假設H13/9/202368第六十八頁,共八十五頁,2022年,8月28日第六節

假設檢驗的方法假設檢驗的程序

假設檢驗的類型

總體平均數和總體成數的假設檢驗

案例

3/9/202369第六十九頁,共八十五頁,2022年,8月28日一、假設檢驗的程序建立關于總體的假設

選擇檢查的顯著性水平α

確定檢驗統計量及其分布

抽取樣本,計算檢驗統計量的值

按規定的顯著性水平α查表求臨界值(即概率度)t

用實際取得的檢驗統計量的值與臨界值進行比較,判斷原假設是否成立

3/9/202370第七十頁,共八十五頁,2022年,8月28日(一)建立關于總體的假設根據已知的信息,在經過周密考慮之后提出原假設H0

和備擇假設H1。其中原假設是檢驗中要予以拒絕或接受的假設,如果原假設被拒絕了就等于接受了備擇假設,備擇假設也稱為原假設的對立事件。3/9/202371第七十一頁,共八十五頁,2022年,8月28日(二)選擇檢查的顯著性水平α

在原假設成立的條件下,由被檢驗統計量的分布求出相應的臨界值,該臨界值即為原假設的拒絕域和接受域的分界線。3/9/202372第七十二頁,共八十五頁,2022年,8月28日(三)確定檢驗統計量及其分布總體平均數的檢驗總體成數的檢驗3/9/202373第七十三頁,共八十五頁,2022年,8月28日1.總體平均數的檢驗Ζ檢驗法T

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論