統計學(第二版) 費宇第8章抽樣調查理論與方法_第1頁
統計學(第二版) 費宇第8章抽樣調查理論與方法_第2頁
統計學(第二版) 費宇第8章抽樣調查理論與方法_第3頁
統計學(第二版) 費宇第8章抽樣調查理論與方法_第4頁
統計學(第二版) 費宇第8章抽樣調查理論與方法_第5頁
已閱讀5頁,還剩63頁未讀 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2023/1/5《統計學》第8章抽樣調查理論與方法8-1統計學主編:費宇、石磊第二版2023/1/5《統計學》第8章抽樣調查理論與方法8-2第8章抽樣調查理論與方法8.1抽樣調查的意義8.2抽樣調查的基本概念8.3抽樣誤差8.4樣本容量的確定2023/1/5《統計學》第8章抽樣調查理論與方法8-38.1抽樣調查的意義8.1.1抽樣調查的概念8.1.2抽樣調查的作用8.1.3抽樣調查的應用領域2023/1/5《統計學》第8章抽樣調查理論與方法8-48.1.1

抽樣調查的概念統計調查:是獲取數據資料的一種重要手段,它又分為全面調查與非全面調查兩類。●全面調查:普查●非全面調查:又稱為抽樣調查,它是指從研究對象的全體(總體)中抽取一部分單元作為樣本進行觀察,并根據觀察結果來推斷全體,以此達到對全體目標量的了解。這是廣義的抽樣調查的概念。例:調查北京市民對出租車行業的滿意度調查2023/1/5《統計學》第8章抽樣調查理論與方法8-5抽樣調查的分類

依據樣本抽取的同,抽樣可以分為非概率抽樣和概率抽樣兩類。

2023/1/5《統計學》第8章抽樣調查理論與方法8-6非概率抽樣(non-probabilitysampling)

與概率抽樣相對的一種抽樣。又稱非隨機抽樣,是指抽樣時不遵循隨機原則,而是按照研究人員的主觀經驗或其他條件來抽取樣本的一種抽樣方法。問題:

(1)其效果好壞依賴于抽樣者的主觀判斷能力和經驗

(2)無法計算和控制抽樣誤差。無法用樣本的量化數據來推斷總體。

2023/1/5《統計學》第8章抽樣調查理論與方法8-7便利抽樣是根據調查者的方便與否來抽取樣本的一種非概率抽樣方法。典型的形式是“攔截式”調查。調查過程中由調查員依據方便的原則,自行確定入抽樣本的單位調查員在街頭、公園、商店等公共場所進行攔截調查廠家在出售產品柜臺前對路過顧客進行的調查優點:容易實施,調查的成本低缺點:樣本單位的確定帶有偶然性,樣本無法代表有明確定義的總體,調查結果無法根據樣本信息對總體進行數量特征的推斷,樣本不適合描述性研究和因果關系研究

2023/1/5《統計學》第8章抽樣調查理論與方法8-8判斷抽樣是一種憑研究人員的主觀意愿、經驗和知識,從總體中選擇具有典型意義和代表性的樣本點構成樣本作為調查客體的一種非概率抽樣方法。

一般選擇“平均型”、“眾數型”、“特殊型”單元作為樣本樣本量小及樣本不易分門別類挑選時有其較大的優越性由于其估計精度嚴重依賴于研究者對調查對象的了解程度、判斷水平和對結果的解釋情況,所以,一般不輕易地用于對總體進行數量方面的判斷2023/1/5《統計學》第8章抽樣調查理論與方法8-9配額抽樣先將總體中的所有單元按一定的標志分為若干(組),然后在每個類(組)中按照事先規定的比例或數量(即配額)用便利抽樣或判斷抽樣方法選取樣本點分類依據通常就是總體單元的某些屬性、特征,如受調查者的年齡、性別、社會階層等方法簡單易行,可以保證總體的各個類別都能包括在所抽樣本之中,使得樣本的結構和總體的結構類似2023/1/5《統計學》第8章抽樣調查理論與方法8-10配額抽樣獨立控制配額抽樣:根據調查總體的不同特性,對具有某個特性的調查樣本分別規定單獨分配數額

●優點:方法簡單易行,調查人員選擇余地較大

●缺點:調查人員可能圖一時方便,選擇樣本過于偏向某一組別,從而影響樣本的代表性交叉控制配額抽樣:是根據調查對象的各個特性的樣本數額交叉分配●由于各個特性都同時得到了控制,從而克服了獨立控制配額抽樣的缺點,提高了樣本的代表性。2023/1/5《統計學》第8章抽樣調查理論與方法8-11滾雪球抽樣是以“滾雪球”的方式抽取樣本,即通過一些“種子”樣本點以獲取更多樣本點的信息,樣本量逐漸擴大優點:便于有針對性找到被調查者,調查的成本也比較低缺點:要求樣本單元之間必須有一定的聯系并且愿意保持和提供這種關系

2023/1/5《統計學》第8章抽樣調查理論與方法8-12概率抽樣

(probabilitysampling)又稱隨機抽樣,是指依據隨機原則,按照某種事先設計的程序,從總體中抽取部分單元的抽樣方法特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會(概率)被抽中“隨機”不等于“隨便”“隨機”不等于“等概率”用樣本指標數值去推斷總體的指標數值抽樣調查會產生抽樣誤差,這個誤差可以計算,并且可以加以控制2023/1/5《統計學》第8章抽樣調查理論與方法8-13概率抽樣

(probabilitysampling)概率抽樣被視為狹義的抽樣調查,在實踐中被廣泛加以采用,通常所謂的抽樣調查,均指概率抽樣調查。概率抽樣有多種形式:簡單隨機抽樣、分層抽樣、系統抽樣、整群抽樣等。2023/1/5《統計學》第8章抽樣調查理論與方法8-14

簡單隨機抽樣

(simplerandomsampling)從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n的樣本都有相同的機會(概率)被抽中抽取元素的具體方法有重復抽樣和不重復抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統計量對目標量進行估計比較方便局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施調查增加了困難沒有利用其他輔助信息以提高估計的效率2023/1/5《統計學》第8章抽樣調查理論與方法8-15簡單隨機抽樣簡單隨機抽選有各種不同的具體做法,如:

1.抽簽法

2.使用統計軟件直接抽取法

3.隨機數法簡單隨機抽樣抽取單元的方法:1.重復抽樣樣本數2.不重復抽樣樣本數。。2023/1/5《統計學》第8章抽樣調查理論與方法8-16

分層抽樣

(stratifiedsampling)將抽樣單位按某種特征或某種規則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本例如,在居民生活水平調查中,先按職業分類,然后每種職業分別隨機抽取部分居民進行調查。實質上是分組法與隨機原則的結合總體N樣本n等比例抽取不等比例抽取優最抽取······2023/1/5《統計學》第8章抽樣調查理論與方法8-17分層抽樣優點1.既可以對總體參數進行估計,也可以對各層的目標量進行估計2.保證樣本的結構與總體的結構比較相近,從而提高估計的精度3.組織實施調查靈活方便4.分層樣本分別取自各層,在總體中的分布更為均勻,不會出現不平衡的情況2023/1/5《統計學》第8章抽樣調查理論與方法8-18兩種類型:1.等比例分配法(類型比例抽樣)2.不等比例分配法(類型適宜抽樣)實際工作中比較常用的是等比例分配法

分層抽樣2023/1/5《統計學》第8章抽樣調查理論與方法8-19

系統抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規定的范圍內隨機地抽取一個單位作為初始單位,然后按事先規定好的規則確定其他樣本單位先從數字1到k之間隨機抽取一個數字r作為初始單位,以后依次取r+k,r+2k…等單位優點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難2023/1/5《統計學》第8章抽樣調查理論與方法8-20排列次序用的標志有兩種:1.無關標志排隊:選擇標志與抽樣調查所研究內容無關2.有關標志排隊:選擇標志與抽樣調查所研究的內容有關研究工人的平均收入水平時,按工號排隊。例研究工人的生活水平,按工人月工資額高低排隊。例2023/1/5《統計學》第8章抽樣調查理論與方法8-21根據樣本抽選的方法不同,可分為:隨機起點等距抽樣半距起點等距抽樣對稱起點等距抽樣······(總體單位按某一標志排序)······(總體單位按某一標志排序)······(總體單位按某一標志排序)2023/1/5《統計學》第8章抽樣調查理論與方法8-22按無關標志排隊的等距抽樣,可按簡單隨機抽樣來計算;按有關標志排隊的等距抽樣,可按分層抽樣來計算。等距抽樣的抽樣平均誤差等距抽樣的抽樣平均誤差估計比較復雜。一般按以下方法近似計算。2023/1/5《統計學》第8章抽樣調查理論與方法8-23整群抽樣

(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調查特點抽樣時只需群的抽樣框,可簡化工作量調查的地點相對集中,節省調查費用,方便調查的實施缺點是估計的精度較差2023/1/5《統計學》第8章抽樣調查理論與方法8-24例:總體群數R=16樣本群數r=4ABCDEFGHIJKLMNOPIHPD樣本容量簡單、方便,能節省人力、物力、財力和時間,但其樣本代表性可能較差2023/1/5《統計學》第8章抽樣調查理論與方法8-258.1.2抽樣調查的作用實際工作不可能進行全面調查,而又需要了解其全面情況的現象對雖然可以進行全面調查,但調查時范圍大、單位數目多,又缺乏原始記錄作依據的現象對普查資料的質量進行檢查和修正抽樣調查方法可以用于工業生產過程中的質量控制

2023/1/5《統計學》第8章抽樣調查理論與方法8-268.1.3抽樣調查的應用領域社會經濟現象的調查

如:農產量、城市居民家計、農村經濟、小型工業企業生產情況、小型商業企業交易情況調查

社會性的民意調查市場調查人口調查衛生調查資源環境調查2023/1/5《統計學》第8章抽樣調查理論與方法8-278.2抽樣調查的基本概念

8.2.1總體與樣本8.2.2總體參數與統計量8.2.3抽樣單元與抽樣框8.2.4抽樣方法與樣本可能數目8.2.5精度與費用2023/1/5《統計學》第8章抽樣調查理論與方法8-288.2.1總體與樣本總體:研究對象的全體,或者說是希望從中獲取信息的總體,它是由研究對象中所有性質相同的個體(individual)所組成

1)總體的限定是人為的

2)在一項調查中,總體是唯一的,樣本不是唯一的

3)總體中包含的單元數稱為總體容量,記為個體:構成總體的基本單元

2023/1/5《統計學》第8章抽樣調查理論與方法8-29統計總體的種類指總體中所包含的單位數目是有限的總體指總體中所包含的單位數目是無限的總體有限總體無限總體對有限總體可以進行全面調查,也可以進行非全面調查;

對無限總體只能采取非全面調查

2023/1/5《統計學》第8章抽樣調查理論與方法8-30樣本:是總體的一部分,從總體中按一定程序抽取的那部分抽樣單元或個體組成。

1)樣本也是一個集合,每個被抽中的進入樣本的單元稱為入樣單元,

2)樣本包含的單元數稱為樣樣本容量,記為n3)樣本量對總體容量之比稱為抽樣比,記為f=n/N(一般是一個很小的數)

4)大樣本;小樣本2023/1/5《統計學》第8章抽樣調查理論與方法8-318.2.2總體參數與統計量總體參數:是根據總體中各單位的變量值計算出來的用于反映總體的數量特征的指標調查的目標量都是由總體的某些指標來表示的總體參數表現為一系列唯一的常數,但往往卻是未知的,需要去推斷和估計2023/1/5《統計學》第8章抽樣調查理論與方法8-32統計量:是根據樣本的n個單元的變量值計算出來一個量,也叫估計量(estimator),1)樣本指標是隨機變量

2)往往構成了用于估計總體參數的估計量。2023/1/5《統計學》第8章抽樣調查理論與方法8-33#常見的總體參數包括:總體均值(平均數)(populationmean)總體總值(總和)(populationtotal)總體比例(proportion)總體方差(populationvariance)標準差(populationstandarddeviation)2023/1/5《統計學》第8章抽樣調查理論與方法8-348.2.3抽樣單元與抽樣框總體是由個體組成的,可以是有限的,也可以是無限的,當從抽樣角度而言,總將總體看成是有限的。將總體劃分為互不重迭而又窮盡的有限多個部分,將這樣的每個部分稱為抽樣單元(samplingunit)。

1)每個抽樣單元都由或多或少的個體組成,當然也可以是一個個體。

2023/1/5《統計學》第8章抽樣調查理論與方法8-352)抽樣單元可大可小,可以分級。分別稱為一級抽樣單元(psu)、二級抽樣單元(ssu),…,基本抽樣單元(最小一級抽樣單元)。

3)抽樣單元可以是人為劃分的,也可以是自然形成的。2023/1/5《統計學》第8章抽樣調查理論與方法8-36包含所有抽樣單元的名單或者清冊,稱為抽樣框。

1)抽樣框的形式是多樣的

2)抽樣框中的單元原則上既不應有重復,也不應有遺漏抽樣框的種類:名錄框、區域框、自然框2023/1/5《統計學》第8章抽樣調查理論與方法8-378.2.4抽樣方法與樣本可能數目從總體中抽取樣本方式的不同,構成了不同的抽樣方法

1)放回抽樣/回置抽樣、不放回抽樣

2)等概率抽樣、不等概率抽樣對樣本開展調查,獲得樣本數據,形成樣本指標,構造適當的統計量作為總體指標的估計是抽樣調查的必要工作2023/1/5《統計學》第8章抽樣調查理論與方法8-38重復抽樣:指每次從總體中抽取一個單元進行觀察后,再把這個單元重新放回總體,使之繼續參加下次抽選(回置抽樣或重置抽樣)。不重復抽樣:指每次從總體中抽取一個單元進行觀察后,不再把這個單元重新放回總體,這個總體單元不再繼續參加下次抽選(不回置抽樣或不重置抽樣)。2023/1/5《統計學》第8章抽樣調查理論與方法8-39考慮順序的重復抽樣不考慮順序的重復抽樣考慮順序的不重復抽樣不考慮順序的不重復抽樣2023/1/5《統計學》第8章抽樣調查理論與方法8-408.2.5精度與費用

抽樣調查的精度→誤差的大小→抽樣誤差的大小→(可用估計量,大樣本)方差或標準差大小抽樣調查中,精度的估計主要就是估計量的方差估計影響方差的最重要的因素是樣本量,樣本量又與費用有關影響精度和費用的另一因素是抽樣方法和估計方法對于一個具體的抽樣設計,應盡量做到在固定費用的限制下使精度最高,或在要求達到的精度的約束下使調查費用最省,稱這樣的設計為最優設計2023/1/5《統計學》第8章抽樣調查理論與方法8-41#對精度的討論基于兩個方向:對于某類抽樣方案,構造合適的估計量并討論這一估計量的方差估計對于既定的抽樣方案,依據給定的精度要求(誤差限要求)討論方案的細節(如樣本量的確定問題)2023/1/5《統計學》第8章抽樣調查理論與方法8-428.3抽樣誤差

8.3.1抽樣調查中誤差的來源8.3.2抽樣平均誤差、方差與偏差8.3.3抽樣平均誤差的計算8.3.4抽樣極限誤差與置信度2023/1/5《統計學》第8章抽樣調查理論與方法8-438.3.1抽樣調查中的誤差來源凡調查就一定有誤差,不可能完全避免。抽樣調查中誤差可分為非抽樣誤差及抽樣誤差兩大類。#非抽樣誤差(non-samplingerror):指不是由于抽樣引起的,在全面普查中也存在。包括:

1)調查誤差:調查所得數據與樣本單元的真值不一致所造成的誤差。原因包括測量誤差、失真回答等。

2)不完整的抽樣框誤差:抽樣框的重復和遺漏。

3)不回答誤差(無相應誤差):抽中的樣本單元找不到或者拒絕回答問題或缺失所需要的信息

4)填寫錄入誤差2023/1/5《統計學》第8章抽樣調查理論與方法8-44#抽樣誤差(samplingerror):指由于抽樣所造成的誤差(用樣本估計總體而產生的誤差)。其根源在于樣本的隨機性,使得樣本指標值和總體真實值之間存在差異

1)只要是抽樣調查,這個誤差不可避免

2)能夠計量和控制,可用各種量值表示

3)通常樣本量愈大,則抽樣誤差愈小(抽樣誤差與樣本量的平方根成反比)2023/1/5《統計學》第8章抽樣調查理論與方法8-458.3.2抽樣平均誤差、方差和偏差2023/1/5《統計學》第8章抽樣調查理論與方法8-46均方誤差可以分解:其中:稱為的(抽樣)方差

稱為的偏差(Bias)

特別地,對于無偏估計量,滿足:因此:即:對于無偏估計量,其方差可以表征抽樣平均誤差程度2023/1/5《統計學》第8章抽樣調查理論與方法8-47均方誤差的平方根稱為抽樣平均誤差,方差的平方根稱為標準差(standarddeviation)。

抽樣平均誤差、標準差和偏差三者之間的關系:2023/1/5《統計學》第8章抽樣調查理論與方法8-488.3.3抽樣平均誤差的計算本章主要討論簡單隨機抽樣條件下,以及估計量是無偏估計量的抽樣平均誤差的計算(一)樣本平均數的抽樣平均誤差1.重復抽樣2023/1/5《統計學》第8章抽樣調查理論與方法8-49

某燈泡廠從一天所生產的產品10,000個中抽取100個檢查其壽命,得平均壽命為2000小時(一般為重復抽樣),根據以往資料:σ=20小時,根據以往資料,產品質量不太穩定,若σ=200小時,例2023/1/5《統計學》第8章抽樣調查理論與方法8-502.不重復抽樣:2023/1/5《統計學》第8章抽樣調查理論與方法8-51(二)樣本比例的抽樣平均誤差

已證明得:比例的平均數就是比例本身比例的方差是

2023/1/5《統計學》第8章抽樣調查理論與方法8-52

某玻璃器皿廠某日生產15000只印花玻璃杯,現按重復抽樣方式從中抽取150只進行質量檢驗,結果有147只合格,其余3只為不合格品,試求這批印花玻璃杯合格率(成數)的抽樣平均誤差。例2023/1/5《統計學》第8章抽樣調查理論與方法8-53得取總體方差的途徑有:

1.用過去全面調查或抽樣調查的資料,若同時有幾個方差的資料,應選用數值較大的那個;2.用樣本標準差代替全及標準差;3.在大規模調查前,先搞個小規模的試驗性的調查來確定總體方差;4.用估計的方法。2023/1/5《統計學》第8章抽樣調查理論與方法8-548.3.4抽樣極限誤差和置信度實際問題中,估計量的精度通常采用抽樣極限誤差來表示或要求抽樣極限誤差:是根據概率理論,以一定的可靠程度保證抽樣誤差不超過某一給定的范圍,也稱作抽樣允許誤差。常用△表示。。意義:在一定的置信度下,估計值與真實值的差異不超過上式表明,樣本平均數(比例)是以總體平均數(比例)為中心,在相應的區間內變動。2023/1/5《統計學》第8章抽樣調查理論與方法8-55置信度:極限誤差是在某種概率意義下的最大誤差范圍,這里的概率稱為置信度一般用表示。抽樣極限誤差與抽樣平均誤差之間的關系,與估計量的分布有關有:#誤差限與置信度是成對出現的,置信度越大,則相應的誤差限就越大。#因此,實際問題中,只給出誤差限不給出置信度或者相反,都是沒有意義的。

2023/1/5《統計學》第8章抽樣調查理論與方法8-568.4樣本容量的確定

8.4.1影響樣本容量確定的主要因素8.4.2確定抽樣單元數的方法2023/1/5《統計學》第8章抽樣調查理論與方法8-57

8.4.1影響樣本容量確定的主要因素

總體被研究標志的變異程度調查者對推斷精確度的要求抽樣調查的方式和方法人力、物力和財力的允許條件2023/1/5《統計學》第8章抽樣調查理論與方法8-588.4.2確定抽樣單元數的方法

簡單隨機抽樣

重復抽樣

不重復抽樣

2023/1/5《統計學》第8章抽樣調查理論與方法8-59建筑工地打土方工人4000人,需測定平均每人工作量,要求誤差范圍不超過0.2M3,并需有99.73%保證程度。根據過去資料σ=1.5,求樣本容量應是多少?例12023/1/5《統計學》第8章抽樣調查理論與方法8-60

某金筆廠月產10000支金筆,以前多次抽樣調查一等品率為90%,現在要求誤差范圍在2%之內,可靠程度達95.45%,問必須抽取多少單位數?例22023/1/5《統計學》第8章抽樣調查理論與方法8-61本章小結

本章介紹了抽樣調查的分類、作用和應用領域以及抽樣調查中涉及的基本概念和基本方法。主要分析了抽樣調查中誤差的來源和不同概率抽樣誤差的計算方法以及樣本容量的確定問題。

抽樣調查分為非概率抽樣和概率抽樣。非概率抽樣有便利抽樣、判斷抽樣、配額抽樣和雪球抽樣四種方法。概率抽樣又稱為隨機抽樣,有簡單隨機抽樣、分層抽樣、系統抽樣和整群抽樣等抽樣方法,這些抽樣方法各有優缺點,在實踐中被廣泛采用。2023/1/5《統計學》第8章抽樣調查理論與方法8-62

抽樣調查中涉及的基本概念有總體與樣本、總體參數與統計量、抽樣單元與抽樣框、抽樣方法與樣本可能數目、精度與費用。2023/1/5《統計學》第8章抽樣調查理論與方法8-63

抽樣誤差是由于用樣本估計總體而產生的誤差,它直接關系到抽樣的精度。如果抽樣誤差大,抽樣推斷的精度就會低,所以要合理地控制抽樣誤差。而正確反映抽樣誤差的指標是抽樣平均誤差。至于如何合理地控制抽樣誤差,要以一定的抽樣概率(置信度)作保證,才能使誤差不超過某一給定的范圍,這個給定的范圍叫做抽樣極限誤差。如果置信度越大,相應的極限誤差就越大,抽樣推斷的精度就越低。極

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論