




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
企業(yè)抽樣調(diào)查1
企業(yè)抽樣調(diào)查1主要內(nèi)容抽樣調(diào)查基本知識(shí)服務(wù)業(yè)抽樣調(diào)查概況企業(yè)抽樣調(diào)查實(shí)例2主要內(nèi)容抽樣調(diào)查基本知識(shí)2
抽樣調(diào)查基本知識(shí)
3
抽樣調(diào)查基本知識(shí)
3主要內(nèi)容抽樣調(diào)查的基本概念抽樣調(diào)查的基本理論基本抽樣方法抽樣方法的選擇對(duì)抽樣調(diào)查的基本認(rèn)識(shí)4主要內(nèi)容抽樣調(diào)查的基本概念4一、抽樣調(diào)查的基本概念
抽樣調(diào)查概率抽樣與非概率抽樣總體與樣本
目標(biāo)總體與抽樣總體
抽樣框
調(diào)查單位與抽樣單位
誤差
誤差限與置信度
抽樣效率與設(shè)計(jì)效果
5一、抽樣調(diào)查的基本概念抽樣調(diào)查5抽樣調(diào)查統(tǒng)計(jì)調(diào)查分為全面調(diào)查與非全面調(diào)查兩類(lèi)。抽樣調(diào)查是非全面調(diào)查中的一種重要方法,它是從所研究對(duì)象的全體(總體)中抽取一部分(樣本)進(jìn)行調(diào)查,獲取數(shù)據(jù),并以此對(duì)總體目標(biāo)量作出推斷(估計(jì))。這是廣義的抽樣調(diào)查概念。根據(jù)樣本抽取方法的不同,抽樣可分為概率抽樣和非概率抽樣。6抽樣調(diào)查統(tǒng)計(jì)調(diào)查分為全面調(diào)查與非全面調(diào)查兩類(lèi)。抽樣調(diào)查是非全概率抽樣概率抽樣(probabilitysampling)也稱隨機(jī)抽樣。概率抽樣是嚴(yán)格地按照給定的概率來(lái)抽取樣本的。特點(diǎn):按一定的概率以隨機(jī)原則抽取樣本。隨機(jī)不等與隨便。隨機(jī)有嚴(yán)格的科學(xué)定義,可用概率來(lái)描述,而隨便帶有人為或主觀因素,它不是一個(gè)科學(xué)的概念。7概率抽樣概率抽樣(probabilitysampling)概率抽樣(續(xù))每個(gè)單位被抽中的概率是已知的,或可計(jì)算出來(lái)。當(dāng)用樣本對(duì)總體目標(biāo)量估計(jì)時(shí),要考慮到該樣本抽中的概率,也就是說(shuō),估計(jì)量不僅與樣本觀測(cè)值有關(guān),也與被抽中的概率有關(guān)。通常所提到的抽樣調(diào)查實(shí)際上指的就是概率抽樣。國(guó)際交流:企業(yè)抽樣調(diào)查包括本行業(yè)所有規(guī)模的企業(yè)。8概率抽樣(續(xù))每個(gè)單位被抽中的概率是已知的,或可計(jì)算出來(lái)。8非概率抽樣非概率抽樣(non-probabilitysampling)是相對(duì)于概率抽樣而言,并無(wú)嚴(yán)格的定義,不是按隨機(jī)原則來(lái)抽選的。這種抽樣效果的好壞在很大程度上依賴于抽樣者的主觀判斷能力和經(jīng)驗(yàn),而且不能計(jì)算抽樣誤差,不能從概率意義上控制誤差并以此來(lái)保證推斷的準(zhǔn)確性。此外,即使經(jīng)驗(yàn)可能已表明某種非概率方法過(guò)去曾有較好效果,但這并不能保證該方法一直如此。不過(guò)盡管有其理論上的弱點(diǎn),各種形式的非概率抽樣仍在實(shí)踐中廣泛采用,主要原因是節(jié)省費(fèi)用和方便。
9非概率抽樣非概率抽樣(non-probabilitysam非概率抽樣(續(xù)1)通常我國(guó)的典型調(diào)查和重點(diǎn)調(diào)查,西方國(guó)家稱為的有目的抽樣或判斷抽樣等都屬于非概率抽樣。如果調(diào)查的目的是用樣本數(shù)據(jù)推斷總體的目標(biāo)量,并以一定的把握程度保證總體目標(biāo)量落在目的范圍,這時(shí)非概率抽樣是不合適的。10非概率抽樣(續(xù)1)通常我國(guó)的典型調(diào)查和重點(diǎn)調(diào)查,西方國(guó)家稱為總體和樣本總體(population):總體就是全部被研究的單位,也稱研究總體。按研究的總體不同,總體單位可以是人、戶或企業(yè)。在服務(wù)業(yè)抽樣調(diào)查中,總體就是這些行業(yè)的企業(yè)和個(gè)體戶。樣本(sample):是總體的一部分,從總體中按一定程序抽得的那部分個(gè)體或抽樣單位。樣本量n對(duì)總體總單位數(shù)N的比稱為抽樣比(samplingfraction):
11總體和樣本總體(population):總體就是全部被研究的目標(biāo)總體與抽樣總體目標(biāo)總體(targetpopulation):是真正作為研究對(duì)象的全體。如要研究山西省居民服務(wù)業(yè)的情況,目標(biāo)總體就是所有從事居民服務(wù)業(yè)的企業(yè)和個(gè)體戶。抽樣總體(samplingpopulation):是用作抽樣的總體,也就是抽樣框。二者應(yīng)一致,實(shí)際難做到。如目標(biāo)總體是2006年所有從事居民服務(wù)業(yè)的企業(yè)和個(gè)體戶,但很難做到對(duì)在調(diào)查時(shí)(2007年1月)已消亡的單位的調(diào)查,盡管在調(diào)查時(shí)消亡,但可能在2006年全年?duì)I業(yè)。先定義目標(biāo)總體,再根據(jù)條件進(jìn)行修訂得到抽樣總體。12目標(biāo)總體與抽樣總體目標(biāo)總體(targetpopulatio總體參數(shù)與樣本統(tǒng)計(jì)量無(wú)論對(duì)總體還是樣本,統(tǒng)計(jì)中通常使用平均數(shù)和標(biāo)準(zhǔn)差等這樣一些數(shù)量關(guān)系進(jìn)行描述,它們被用于描述總體特征時(shí),稱為總體參數(shù),用于描述樣本特征時(shí),稱為樣本統(tǒng)計(jì)量。如:居民服務(wù)業(yè)抽取800家企業(yè),調(diào)查結(jié)果計(jì)算出企業(yè)平均營(yíng)業(yè)收入400萬(wàn)元(樣本統(tǒng)計(jì)量),總體平均營(yíng)業(yè)收入(總體參數(shù))未知。抽樣目的是樣本(樣本統(tǒng)計(jì)量)推斷總體(總體參數(shù))。如用800家的平均營(yíng)業(yè)收入作為總體平均營(yíng)業(yè)收入的估計(jì)值。13總體參數(shù)與樣本統(tǒng)計(jì)量無(wú)論對(duì)總體還是樣本,統(tǒng)計(jì)中通常使用平均數(shù)抽樣框抽樣框(samplingframe):抽樣框是指包含所有抽樣單位的名單或名冊(cè)。由于抽樣方法不同,可有目錄框和區(qū)域框,分級(jí)抽樣框。名單中的每個(gè)單位都有可識(shí)別的基本信息;名單的范圍應(yīng)是完整的,不重不漏。現(xiàn)實(shí)中使用的抽樣框并不十分完備,一方面,要改進(jìn)和完善,如更新和維護(hù);另一方面調(diào)查的設(shè)計(jì)者要認(rèn)真分析抽樣框的狀況,以評(píng)價(jià)框的不完整對(duì)調(diào)查結(jié)果產(chǎn)生的影響,并盡可能采取一些補(bǔ)救的辦法。14抽樣框抽樣框(samplingframe):抽樣框是指包調(diào)查單位與抽樣單位調(diào)查單位(surveyunit):抽樣調(diào)查要通過(guò)對(duì)樣本單位的觀察或調(diào)查來(lái)取得有關(guān)數(shù)據(jù)或記錄有關(guān)特征,這些單位稱為調(diào)查單位。如企業(yè)和個(gè)體戶。抽樣單位(samplingunit):抽樣單位是指將總體劃分成不重疊的有限多個(gè)部分的每個(gè)部分。區(qū)域、企業(yè)和個(gè)體戶。15調(diào)查單位與抽樣單位調(diào)查單位(surveyunit):抽樣調(diào)誤差抽樣誤差(samplingerror):是由于用樣本估計(jì)總體而產(chǎn)生的誤差,也叫代表性誤差。非抽樣誤差(non—samplingerror):是指除抽樣誤差以外的,由于各種原因而引起的誤差,在各種方式的調(diào)查中都存在。16誤差抽樣誤差(samplingerror):是由于用樣本抽樣框誤差遺漏單位與新增單位;重復(fù);輔助信息是否準(zhǔn)確。17抽樣框誤差遺漏單位與新增單位;17無(wú)回答誤差單位無(wú)回答;項(xiàng)目無(wú)回答;部分無(wú)回答。18無(wú)回答誤差單位無(wú)回答;18設(shè)計(jì)誤差問(wèn)卷設(shè)計(jì)引起的誤差;抽樣設(shè)計(jì)(選用的方法、分層合理性)及抽選過(guò)程(隨機(jī))引起的誤差。19設(shè)計(jì)誤差問(wèn)卷設(shè)計(jì)引起的誤差;19調(diào)查員引起的誤差調(diào)查員的責(zé)任心和態(tài)度;調(diào)查員水平。20調(diào)查員引起的誤差調(diào)查員的責(zé)任心和態(tài)度;20被調(diào)查者引起的誤差無(wú)意識(shí)回答誤差;有意識(shí)回答誤差。21被調(diào)查者引起的誤差無(wú)意識(shí)回答誤差;21處理誤差編碼;編輯錄入;加權(quán);做表。22處理誤差編碼;22點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì):抽樣調(diào)查用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值,稱點(diǎn)估計(jì)。如用樣本計(jì)算得到的企業(yè)平均營(yíng)業(yè)收入作為總體企業(yè)的平均營(yíng)業(yè)收入的估計(jì)值,就是點(diǎn)估計(jì)。區(qū)間估計(jì):是對(duì)總體參數(shù)可能落入的一個(gè)數(shù)值范圍作出的估計(jì),估計(jì)值的取值范圍稱“置信區(qū)間”,與置信區(qū)間估計(jì)相聯(lián)系的概率稱“置信度”,表示置信區(qū)間估計(jì)包含了總體參數(shù)的可靠程度有多大。23點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì):抽樣調(diào)查用樣本統(tǒng)計(jì)量直接作為總體參數(shù)抽樣效率與設(shè)計(jì)效果抽樣效率(samplingefficiency):是指兩個(gè)抽樣方案的抽樣方差之比;當(dāng)某個(gè)估計(jì)量的方差比另一估計(jì)量的方差小時(shí),則稱方差小的估計(jì)量效率比較高。設(shè)計(jì)效果(designeffect,,簡(jiǎn)寫(xiě)為Deff):就是把一個(gè)設(shè)計(jì)方案的方差與簡(jiǎn)單隨機(jī)抽樣的方差進(jìn)行比較。Deff小于1時(shí),表示設(shè)計(jì)方案的效率高于簡(jiǎn)單隨機(jī)抽樣,反之,效率低于簡(jiǎn)單隨機(jī)抽樣。24抽樣效率與設(shè)計(jì)效果抽樣效率(samplingefficie三種性質(zhì)的分布總體分布(populationdistribution):是指研究對(duì)象這一總體的各個(gè)單位標(biāo)志值的分布狀況。樣本分布(sampledistribution):樣本單位標(biāo)志值的的分布,就稱為樣本分布。隨著樣本的增多,樣本分布逐漸接近總體分布。抽樣分布:是指樣本估計(jì)量的分布。如采用同樣的抽樣方法和同等的樣本量,在居民服務(wù)業(yè)企業(yè)中抽取多套樣本,每套樣本都能計(jì)算出一個(gè)估計(jì)量,所有可能的估計(jì)量形成的分布就是抽樣分布。25三種性質(zhì)的分布總體分布(populationdistrib永久隨機(jī)數(shù)隨機(jī)數(shù)就是按隨機(jī)方法而生成的數(shù)碼。即0,1,2……9這十個(gè)數(shù)字出現(xiàn)的機(jī)會(huì)是等概率的,但排列的順序是隨機(jī)的。永久隨機(jī)數(shù)(PermanentRandomNumbers)則是指長(zhǎng)久使用、不改變的隨機(jī)數(shù)。比如一個(gè)企業(yè)一旦被賦予了一個(gè)隨機(jī)數(shù),則在以后的調(diào)查中都使用這個(gè)隨機(jī)數(shù),它類(lèi)似企業(yè)法人代碼,具有唯一和終身性。對(duì)于樣本輪換和不同調(diào)查中共享樣本非常有用。首先對(duì)每個(gè)單位賦予一個(gè)隨機(jī)數(shù),然后按隨機(jī)數(shù)大小順序排隊(duì),抽取所需要的樣本量。26永久隨機(jī)數(shù)隨機(jī)數(shù)就是按隨機(jī)方法而生成的數(shù)碼。即0,1,2……概率概率是指用來(lái)測(cè)定樣本被抽中可能性大小的一個(gè)非負(fù)的數(shù)值。27概率概率是指用來(lái)測(cè)定樣本被抽中可能性大小的一個(gè)非負(fù)的數(shù)值。權(quán)數(shù)在概率抽樣中,每個(gè)樣本單位都代表調(diào)查總體中的一些未被抽中單位,通常,將一個(gè)樣本單位所代表的總體單位的數(shù)量即樣本單位抽中概率的倒數(shù)稱為這個(gè)樣本單位的設(shè)計(jì)權(quán)數(shù)或基礎(chǔ)權(quán)數(shù)。
28權(quán)數(shù)在概率抽樣中,每個(gè)樣本單位都代表調(diào)查總體中的一些未被抽中權(quán)數(shù)(續(xù)1)100個(gè)企業(yè)中抽10個(gè)企業(yè),每個(gè)企業(yè)被抽中的概率就是10/100=1/10,權(quán)數(shù)就是100/10=10,即一個(gè)樣本企業(yè)代表了總體中的10個(gè)企業(yè)。分層抽樣中,要在層內(nèi)計(jì)算權(quán)數(shù)。如企業(yè)分成大、中、小3層。29權(quán)數(shù)(續(xù)1)100個(gè)企業(yè)中抽10個(gè)企業(yè),每個(gè)企業(yè)被抽中的概率分層抽樣基礎(chǔ)權(quán)數(shù)計(jì)算方法企業(yè)按規(guī)模分層總體中企業(yè)單位數(shù)樣本企業(yè)個(gè)數(shù)抽中概率基礎(chǔ)權(quán)數(shù)大型200200200/200=11中型3000300300/3000=1/1010小型7000350350/7000=1/2020合計(jì)10200850850/10200=1/121230分層抽樣基礎(chǔ)權(quán)數(shù)計(jì)算方法企業(yè)按規(guī)模分層總體中企業(yè)單位數(shù)樣本權(quán)數(shù)(續(xù)2)最終權(quán)數(shù)與基礎(chǔ)權(quán)數(shù)之間的關(guān)系最終權(quán)數(shù)等于基礎(chǔ)權(quán)數(shù):如果一項(xiàng)抽樣調(diào)查不存在無(wú)回答或涵蓋不全等情況,基礎(chǔ)權(quán)數(shù)等于最終權(quán)數(shù),可以直接用于估計(jì)。最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整:存在無(wú)回答情況(無(wú)回答多與少);范圍涵蓋不全;企業(yè)分開(kāi);企業(yè)重復(fù)。31權(quán)數(shù)(續(xù)2)最終權(quán)數(shù)與基礎(chǔ)權(quán)數(shù)之間的關(guān)系31權(quán)數(shù)(續(xù)3)不同的抽樣方法,權(quán)數(shù)是不一樣的,即推算方法是不一樣的。目錄抽樣:基礎(chǔ)權(quán)數(shù)=N/n,最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整(無(wú)回答、范圍涵蓋不全)。二階段目錄抽樣:基礎(chǔ)權(quán)數(shù)等于兩個(gè)階段權(quán)數(shù)之積。最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整(無(wú)回答、范圍涵蓋不全),在兩個(gè)階段分別調(diào)整。如服務(wù)業(yè)個(gè)體抽樣,第一階段抽居/村委會(huì),基礎(chǔ)權(quán)數(shù)等于層內(nèi)居/村委會(huì)個(gè)數(shù)÷樣本居/村委會(huì)個(gè)數(shù);32權(quán)數(shù)(續(xù)3)不同的抽樣方法,權(quán)數(shù)是不一樣的,即推算方法是不一權(quán)數(shù)(續(xù)4)第二階段抽部分個(gè)體戶,基礎(chǔ)權(quán)數(shù)等于樣本居/村委會(huì)中個(gè)體戶總數(shù)÷抽取的個(gè)體戶數(shù)。為了避免權(quán)數(shù)調(diào)整,調(diào)查中可規(guī)定:PSU和個(gè)體戶不允許無(wú)回答;合并和分開(kāi)的PSU,維持原狀;對(duì)樣本PSUs維護(hù)個(gè)體戶數(shù)。fgtybn37.xls33權(quán)數(shù)(續(xù)4)第二階段抽部分個(gè)體戶,基礎(chǔ)權(quán)數(shù)等于樣本居/村委會(huì)權(quán)數(shù)(續(xù)5)整群抽樣:與目錄抽樣方法類(lèi)似,只不過(guò)是將一個(gè)群當(dāng)作一個(gè)樣本單位對(duì)待。基礎(chǔ)權(quán)數(shù)=N/n,最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整(無(wú)回答、范圍涵蓋不全)。為了避免權(quán)數(shù)調(diào)整,調(diào)查中可規(guī)定:PSU和個(gè)體戶不允許無(wú)回答;合并和分開(kāi)的PSU,維持原狀;對(duì)樣本PSUs維護(hù)個(gè)體戶數(shù)。34權(quán)數(shù)(續(xù)5)整群抽樣:與目錄抽樣方法類(lèi)似,只不過(guò)是將一個(gè)群當(dāng)總量估計(jì)方法各種抽樣方法都有自己的總量估計(jì)計(jì)算方法,一些復(fù)雜抽樣的總量估計(jì)計(jì)算公式比較復(fù)雜,但利用權(quán)數(shù),各種抽樣方法總量估計(jì)計(jì)算公式可統(tǒng)一、簡(jiǎn)單地表述為樣本權(quán)數(shù)與指標(biāo)值乘積的關(guān)系。
為回答單位的最終權(quán)數(shù),是樣本單位的指標(biāo)值。35總量估計(jì)方法各種抽樣方法都有自己的總量估計(jì)計(jì)算方法,一些復(fù)雜二、抽樣調(diào)查的基本理論兩個(gè)極限定理估計(jì)量的優(yōu)良性
不用懷疑要遵守抽樣原則36二、抽樣調(diào)查的基本理論兩個(gè)極限定理36
兩個(gè)極限定理
大數(shù)定理:隨機(jī)事件的規(guī)律總是在對(duì)大量隨機(jī)現(xiàn)象的觀察中才能顯現(xiàn)出來(lái),隨著觀察次數(shù)的增大,隨機(jī)影響將相互抵消,而使規(guī)律性有穩(wěn)定的性質(zhì)。中心極限定理:由于正態(tài)分布在數(shù)理統(tǒng)計(jì)中具有特別重要的地位,因此關(guān)于尋找在什么條件下將趨于正態(tài)分布,這類(lèi)定理統(tǒng)稱為中心極限定理。37
兩個(gè)極限定理
大數(shù)定理:隨機(jī)事件的規(guī)律總是在對(duì)大量隨機(jī)現(xiàn)估計(jì)量的優(yōu)良性無(wú)偏性:,的平均值(期望值),滿足這個(gè)關(guān)系的稱為是無(wú)偏的。相合性:當(dāng)時(shí),以為極限,滿足這個(gè)性質(zhì)的估計(jì)量稱為是相合的。有效性(方差小):方差小的估計(jì)量比方差大的估計(jì)量有效。。可用性:若趨于零的速度比均方誤差的平方根趨于零的速度更快,則稱是可用的。
38估計(jì)量的優(yōu)良性無(wú)偏性:,的平均值(期望值)三、基本抽樣方法
簡(jiǎn)單隨機(jī)抽樣(simplerandomsampling)等距(系統(tǒng))抽樣(systematicsampling)分層抽樣(stratifiedsampling)二階與多階抽樣(two—stageormulti—stagesampling整群抽樣(clustersampling))不等概率抽樣(samplingwithunequalprobabilities)
二重抽樣(doublesampling)或雙相抽樣(twophasesampling)39三、基本抽樣方法簡(jiǎn)單隨機(jī)抽樣(simplerandom簡(jiǎn)單隨機(jī)抽樣方法:1到N編號(hào),抽取n個(gè),每一個(gè)樣本都有同樣的機(jī)會(huì)被抽中。條件:必須有包含全部單位的抽樣框。優(yōu)點(diǎn):簡(jiǎn)單方便,不需要輔助信息。缺點(diǎn):若樣本分散,不好組織或調(diào)查成本高;N大時(shí)抽樣框不容易編制。企業(yè)調(diào)查中,通常有某些用于分層的輔助信息,很少直接采用簡(jiǎn)單隨機(jī)抽樣,通常只是用于其他方法的某些過(guò)程,如分層抽樣中層內(nèi)樣本的抽取。40簡(jiǎn)單隨機(jī)抽樣方法:1到N編號(hào),抽取n個(gè),每一個(gè)樣本都有同樣的等距(系統(tǒng))抽樣方法:先將總體單位按某種順序排隊(duì),隨機(jī)確定一個(gè)起點(diǎn)抽取第一個(gè)樣本單位,然后每隔(=N/n)個(gè)單位抽取其余單位。如果抽樣間距不是整數(shù),可四舍五入。條件:總體單位的一個(gè)確定的排列。優(yōu)點(diǎn):實(shí)施簡(jiǎn)單。缺點(diǎn):精度估計(jì)比較困難
。通常采用簡(jiǎn)單隨機(jī)抽樣的方差公式替代。如企業(yè)調(diào)查中按某規(guī)模大小排隊(duì),有利于提高精度,在某種程度上獲得比例分層的效益,但此時(shí)采用簡(jiǎn)單隨機(jī)抽樣的方差公式可能偏于保守,高估了抽樣誤差。41等距(系統(tǒng))抽樣方法:先將總體單位按某種順序排隊(duì),隨機(jī)確定一分層抽樣方法:將總體分成若干獨(dú)立層,各層內(nèi)的樣本量是獨(dú)立抽取的,通常采用簡(jiǎn)單隨機(jī)或等距抽樣,不同層的樣本量可以不同,抽選樣本的方法可以不同。條件:總體中每個(gè)單位都能夠分入其中一個(gè)層,需要有相應(yīng)的輔助信息—分層依據(jù)。優(yōu)點(diǎn):組織實(shí)施方便,樣本散布均勻,精度較高。一是將單位差異較小的單位放在同一層,減少層內(nèi)方差;二是在總樣本量不變的情況下,控制各層中的樣本量,方差大層多分配樣本,減少抽樣誤差。企業(yè)調(diào)查中,分布呈現(xiàn)偏態(tài),分層效果非常明顯。
42分層抽樣方法:將總體分成若干獨(dú)立層,各層內(nèi)的樣本量是獨(dú)立抽取二階與多階抽樣方法:先將總體劃分為若干個(gè)群,隨機(jī)抽取一部分,然后在每個(gè)抽中的群中隨機(jī)抽取要調(diào)查的單位。這是二階抽樣,可以在群內(nèi)進(jìn)一步分群,每個(gè)群內(nèi)進(jìn)行二階段抽樣,形成三階或多階抽樣。前提條件:沒(méi)有企業(yè)名錄;調(diào)查組織機(jī)構(gòu)出于組織管理和成本方面的考慮,如相對(duì)于樣本量小但很分散,愿意選擇數(shù)量大但相對(duì)集中的樣本。優(yōu)點(diǎn):樣本相對(duì)集中,不需要包含所有單位的抽樣框。缺點(diǎn):抽樣時(shí)較為麻煩,而且從樣本對(duì)總體的估計(jì)比較復(fù)雜。效率低。43二階與多階抽樣方法:先將總體劃分為若干個(gè)群,隨機(jī)抽取一部分,整群抽樣是二階段抽樣的一種特殊情況,方法:先將總體劃分為若干個(gè)群,隨機(jī)抽取一部分,然后在每個(gè)抽中的群中抽取所有的單位。條件:必須有全部群?jiǎn)挝坏拿洝?yōu)點(diǎn):不要求有每個(gè)二級(jí)單位的抽樣框;便于實(shí)施
。缺點(diǎn):精度較差,效率不高。
44整群抽樣是二階段抽樣的一種特殊情況,方法:先將總體劃分為若干不等概率抽樣方法:抽選的概率與群的大小成比例。大單位被抽到的概率大,小單位抽到的概率小。PPS,目錄抽樣中,按每個(gè)單位規(guī)模(營(yíng)業(yè)收入、從業(yè)人數(shù))占總體規(guī)模的比重成比例的概率抽取樣本。條件:必須有全部群?jiǎn)挝灰?guī)模的輔助信息,且規(guī)模指標(biāo)與估計(jì)指標(biāo)相關(guān)程度高。優(yōu)點(diǎn):群?jiǎn)挝淮笮〔幌嗟葧r(shí),精度較高,數(shù)據(jù)處理也不復(fù)雜。45不等概率抽樣方法:抽選的概率與群的大小成比例。大單位被抽到的二重抽樣方法:抽樣時(shí)分兩次抽取樣本。先從總體中抽取一個(gè)較大樣本,稱第一重樣本,對(duì)一重樣本進(jìn)行調(diào)查搜集某些信息,然后從中抽取一部分樣本—第二重樣本,對(duì)抽中的第二重樣本再次進(jìn)行調(diào)查,進(jìn)一步搜集有關(guān)信息。前提條件:抽樣框缺乏輔助信息,需要對(duì)總體進(jìn)行分層。優(yōu)點(diǎn):提高抽樣效率。缺點(diǎn):在抽取一重樣本時(shí)需要增加一定的費(fèi)用,只有當(dāng)利用這些信息進(jìn)行分層抽樣,所提高的精度的得益大于所增加的費(fèi)用時(shí),采用二重抽樣才是合算的。46二重抽樣方法:抽樣時(shí)分兩次抽取樣本。先從總體中抽取一個(gè)較大樣二重抽樣與兩階段抽樣兩階段抽樣是先從總體中抽取一定規(guī)模的樣本(初級(jí)抽樣單位PSUs),并不對(duì)初級(jí)抽樣單位中的所有二級(jí)單位都調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單位進(jìn)行調(diào)查;二重抽樣則不同,要對(duì)第一重樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行分層或估計(jì)。兩階段抽樣中二級(jí)抽樣單位與一級(jí)抽樣單位是不同的,如一級(jí)抽樣單位是居委會(huì),二級(jí)抽樣單位是個(gè)體戶;而二重抽樣兩次的抽樣單位是相同的。47二重抽樣與兩階段抽樣兩階段抽樣是先從總體中抽取一定規(guī)模的樣本四、抽樣方法的選擇確定抽樣方法的原則有效原則:在樣本量一定的前提下,誤差要小;或在一定精度前提下,樣本量要少。如分層抽樣,效率高。經(jīng)濟(jì)原則:費(fèi)用要低。精度與費(fèi)用是評(píng)價(jià)抽樣設(shè)計(jì)優(yōu)劣的準(zhǔn)則。最優(yōu)的抽樣設(shè)計(jì):在費(fèi)用一定的前提下,達(dá)到精度最高;或在滿足精度的要求下,調(diào)查費(fèi)用最少。易操作原則:容易組織實(shí)施。適應(yīng)抽樣框的原則:充分利用抽樣框及已有的信息實(shí)際中,原則不能同時(shí)兼顧,權(quán)衡利弊,選擇抽樣方法。48四、抽樣方法的選擇確定抽樣方法的原則48抽樣方法的選擇(續(xù)1)企業(yè)抽樣方法的選擇目錄抽樣經(jīng)濟(jì)普查建立了名錄庫(kù),每年兩次的維護(hù)更新制度;目錄抽樣設(shè)計(jì)簡(jiǎn)單,進(jìn)行分層后,效率高—樣本量確定的前提下,分層提高精度;或在精度確定的前提下,分層能減少樣本量;缺點(diǎn):以省為總體進(jìn)行抽樣,樣本分布分散。49抽樣方法的選擇(續(xù)1)企業(yè)抽樣方法的選擇49抽樣方法的選擇(續(xù)2)世界先進(jìn)國(guó)家對(duì)產(chǎn)業(yè)活動(dòng)單位調(diào)查,基本都采用目錄抽樣,具備及時(shí)更新維護(hù)的名錄庫(kù)。為減輕小企業(yè)回答負(fù)擔(dān),采用稅務(wù)數(shù)據(jù)替代的方法。如加拿大Royce-Maranda界限方法,分層后每個(gè)單元格單位收入5%-10%以下的單位不發(fā)表調(diào)查,采用稅務(wù)數(shù)據(jù)。借鑒經(jīng)驗(yàn),權(quán)衡利弊,企業(yè)選擇目錄抽樣。注意:選擇目錄抽樣方法,就要發(fā)揮其方法的優(yōu)勢(shì)時(shí),接受其弊端—樣本分散。(把樣本集中到有調(diào)查隊(duì)的縣或地市)。50抽樣方法的選擇(續(xù)2)世界先進(jìn)國(guó)家對(duì)產(chǎn)業(yè)活動(dòng)單位調(diào)查,基本都抽樣方法的選擇(續(xù)3)個(gè)體抽樣方法的選擇二階段整群抽樣(第一階段):以省為總體,第一階段抽取縣區(qū),第二階段抽取樣本縣區(qū)內(nèi)的村/居委會(huì),對(duì)抽中村/居委會(huì)中的個(gè)體戶全部進(jìn)行調(diào)查。個(gè)體戶無(wú)名錄;建立個(gè)體戶名錄難度大;個(gè)體戶變動(dòng)頻繁。51抽樣方法的選擇(續(xù)3)個(gè)體抽樣方法的選擇51抽樣方法的選擇(續(xù)4)二階段抽樣(目前):首先在由村/居委會(huì)構(gòu)成的一階段抽樣框中抽取村/居委會(huì),在抽中的村/居委會(huì)中(利用經(jīng)濟(jì)普查時(shí)清查的所有在調(diào)查范圍內(nèi)的個(gè)體戶的名單,維護(hù)后采用簡(jiǎn)單隨機(jī)方式從中)抽取個(gè)體戶樣本進(jìn)行調(diào)查。對(duì)于個(gè)體戶數(shù)多的的群(居/村委會(huì))采用二階段抽樣。解決調(diào)查量大的問(wèn)題。通過(guò)一階段整群,將大群劃小,也能解決調(diào)查量大的問(wèn)題。省里更愿意使用二階段抽樣。52抽樣方法的選擇(續(xù)4)二階段抽樣(目前):首先在由村/居委會(huì)五、對(duì)抽樣調(diào)查的基本認(rèn)識(shí)關(guān)于對(duì)抽樣調(diào)查準(zhǔn)確性的認(rèn)識(shí)準(zhǔn)確(accuracy):客觀的真值
精確(precision):大量計(jì)量結(jié)果的均值,多次調(diào)查結(jié)果的擺動(dòng)愈小就愈精確。關(guān)于樣本對(duì)總體代表性問(wèn)題的認(rèn)識(shí)
只要抽樣是概率抽樣,抽得的樣本對(duì)總體的代表性都是有保證的。53五、對(duì)抽樣調(diào)查的基本認(rèn)識(shí)關(guān)于對(duì)抽樣調(diào)查準(zhǔn)確性的認(rèn)識(shí)53對(duì)抽樣調(diào)查的基本認(rèn)識(shí)(續(xù))關(guān)于概率抽樣局限性的認(rèn)識(shí)
“抽樣調(diào)查不能滿足分級(jí)管理需要的認(rèn)識(shí)”通過(guò)擴(kuò)大各級(jí)樣本量來(lái)滿足;可行性問(wèn)題。54對(duì)抽樣調(diào)查的基本認(rèn)識(shí)(續(xù))關(guān)于概率抽樣局限性的認(rèn)識(shí)54
服務(wù)業(yè)抽樣調(diào)查概況
55
服務(wù)業(yè)抽樣調(diào)查概況
55主要內(nèi)容企業(yè)抽樣設(shè)計(jì)個(gè)體抽樣設(shè)計(jì)56主要內(nèi)容企業(yè)抽樣設(shè)計(jì)56抽樣設(shè)計(jì)調(diào)查范圍和總體行業(yè)范圍:裝卸搬運(yùn)和其他運(yùn)輸服務(wù)業(yè)、倉(cāng)儲(chǔ)業(yè)、計(jì)算機(jī)服務(wù)業(yè)、軟件業(yè)、租賃業(yè)、商務(wù)服務(wù)業(yè)、科技交流和推廣服務(wù)業(yè)、居民服務(wù)業(yè)、其他服務(wù)業(yè)、社會(huì)福利業(yè)、體育和娛樂(lè)業(yè)12個(gè)行業(yè)大類(lèi)。調(diào)查對(duì)象:法人企業(yè)和個(gè)體戶。調(diào)查總體劃分為企業(yè)子總體和個(gè)體子總體。57抽樣設(shè)計(jì)調(diào)查范圍和總體57抽樣設(shè)計(jì)(續(xù)1)目標(biāo)總體:2007年1至11月正常營(yíng)業(yè)的法人企業(yè)和個(gè)體戶。在調(diào)查期(2007年12月)正常營(yíng)業(yè)的法人企業(yè)和個(gè)體戶。抽樣總體:2006年?duì)I業(yè)、停業(yè)和籌建的法人企業(yè);2004年經(jīng)濟(jì)普查時(shí)的所有居/村委會(huì)。58抽樣設(shè)計(jì)(續(xù)1)目標(biāo)總體:2007年1至11月正常營(yíng)業(yè)的法人抽樣設(shè)計(jì)(續(xù)2)估計(jì)精度要求:以省12個(gè)服務(wù)員行業(yè)為總體控制抽樣精度,在95%的概率保證程度下,營(yíng)業(yè)收入的cv控制在5%以內(nèi)。59抽樣設(shè)計(jì)(續(xù)2)估計(jì)精度要求:59抽樣設(shè)計(jì)(續(xù)3)基本抽樣方法企業(yè):目錄抽樣,直接從企業(yè)名錄庫(kù)中抽取樣本企業(yè)。個(gè)體二階段抽樣第一階段抽取樣本村/居委會(huì);第二階段在樣本村/居委會(huì)中抽取個(gè)體戶。個(gè)體一階段整群抽樣,直接抽取樣本村/居委會(huì),對(duì)抽中的樣本村/居委會(huì)中的個(gè)體戶全部進(jìn)行調(diào)查。60抽樣設(shè)計(jì)(續(xù)3)基本抽樣方法60抽樣設(shè)計(jì)(續(xù)4)調(diào)查目標(biāo)估計(jì)全省(市)總體總量指標(biāo);估計(jì)全省(市)企業(yè)子總體和個(gè)體子總體總量指標(biāo)。61抽樣設(shè)計(jì)(續(xù)4)調(diào)查目標(biāo)61企業(yè)抽樣設(shè)計(jì)搜集整理抽樣框抽樣框使用普查中心維護(hù)后的名錄庫(kù)。由總隊(duì)到省統(tǒng)計(jì)局普查中心去搜集。然后整理為國(guó)家要求的格式。樣本量類(lèi)似調(diào)查的經(jīng)驗(yàn);相關(guān)測(cè)算;人力、物力、時(shí)間和精度等因素。62企業(yè)抽樣設(shè)計(jì)搜集整理抽樣框62企業(yè)抽樣設(shè)計(jì)(續(xù)1)2006年1至11月調(diào)查為例,國(guó)家首先確定14000個(gè)企業(yè)樣本;行業(yè):按每個(gè)行業(yè)大類(lèi)的差異大小分配樣本;地區(qū):參考收入比重(某省營(yíng)業(yè)收入/全國(guó)營(yíng)業(yè)收入)確定各省樣本量;迭代方法:將樣本量分配到各省的各行業(yè)。63企業(yè)抽樣設(shè)計(jì)(續(xù)1)2006年1至11月調(diào)查為例,國(guó)家首先確企業(yè)抽樣設(shè)計(jì)(續(xù)2)分層和分配樣本量(省級(jí))按行業(yè)大類(lèi)分層;在行業(yè)大類(lèi)中劃分必調(diào)查層和抽樣調(diào)查層。國(guó)家標(biāo)準(zhǔn)必調(diào)查層界限.xls抽樣層按營(yíng)業(yè)收入分層(累積平方根2-4層)分配樣本(大企業(yè)層抽樣比高)按行業(yè)小類(lèi)進(jìn)一步分層在行業(yè)小類(lèi)內(nèi)等比例分配樣本64企業(yè)抽樣設(shè)計(jì)(續(xù)2)分層和分配樣本量(省級(jí))64企業(yè)抽樣設(shè)計(jì)(續(xù)3)抽取樣本采用永久隨機(jī)數(shù)技術(shù)樣本抽取方法.xls65企業(yè)抽樣設(shè)計(jì)(續(xù)3)抽取樣本65利用隨機(jī)數(shù)在層內(nèi)抽取5個(gè)樣本66利用隨機(jī)數(shù)在層內(nèi)抽取5個(gè)樣本66企業(yè)抽樣設(shè)計(jì)(續(xù)4)區(qū)分有效和無(wú)效樣本有效樣本:調(diào)查時(shí)點(diǎn)仍然屬于服務(wù)業(yè)抽樣調(diào)查統(tǒng)計(jì)范圍的樣本單位;無(wú)效樣本:調(diào)查時(shí)點(diǎn)已經(jīng)不屬于服務(wù)業(yè)抽樣調(diào)查統(tǒng)計(jì)范圍的樣本單位。未完成報(bào)表的樣本企業(yè)原因說(shuō)明.doc
67企業(yè)抽樣設(shè)計(jì)(續(xù)4)區(qū)分有效和無(wú)效樣本67企業(yè)抽樣設(shè)計(jì)(續(xù)5)加權(quán)基礎(chǔ)權(quán)數(shù):一個(gè)樣本單位所代表總體單位的數(shù)量,樣本單位抽中概率的倒數(shù)。無(wú)回答加權(quán)調(diào)整:基礎(chǔ)權(quán)數(shù)乘以無(wú)回答加權(quán)調(diào)整因子。總量和方差估計(jì):stata軟件68企業(yè)抽樣設(shè)計(jì)(續(xù)5)加權(quán)68企業(yè)抽樣設(shè)計(jì)(續(xù)6)新增企業(yè)的處理
由于抽樣框中資料的時(shí)點(diǎn)與調(diào)查時(shí)點(diǎn)存在差異,在調(diào)查時(shí)會(huì)遇到新增企業(yè)問(wèn)題。新增企業(yè)指企業(yè)沒(méi)有列入抽樣框,但在調(diào)查時(shí)已經(jīng)產(chǎn)生,如新建企業(yè)或由其他行業(yè)改行而來(lái)的企業(yè)。從普查中心搜集相關(guān)信息,計(jì)算企業(yè)個(gè)數(shù)凈增速,調(diào)整非必調(diào)查層。69企業(yè)抽樣設(shè)計(jì)(續(xù)6)新增企業(yè)的處理69個(gè)體抽樣設(shè)計(jì)二階段抽樣整理抽樣框一階段抽樣框:2005年試點(diǎn)調(diào)查時(shí)在經(jīng)濟(jì)普查基礎(chǔ)上整理的居/村名錄(個(gè)體戶數(shù)或收入信息)。二階段抽樣框:抽中居/村內(nèi)個(gè)體戶名單70個(gè)體抽樣設(shè)計(jì)二階段抽樣70個(gè)體抽樣設(shè)計(jì)(續(xù)1)確定一階段樣本量一階段抽樣框分層與分配樣本分層:按收入或戶數(shù)。分配樣本:規(guī)模大層抽樣比要高。抽取一階段整群樣本:隨機(jī)數(shù)確定二階段樣本量:所承受的工作量抽取二階段樣本71個(gè)體抽樣設(shè)計(jì)(續(xù)1)確定一階段樣本量71個(gè)體抽樣設(shè)計(jì)(續(xù)6)加權(quán)和估計(jì)加權(quán):基礎(chǔ)權(quán)數(shù)等于一階段權(quán)數(shù)和二階段權(quán)數(shù)之積。估計(jì):Stata軟件。72個(gè)體抽樣設(shè)計(jì)(續(xù)6)加權(quán)和估計(jì)72企業(yè)抽樣調(diào)查實(shí)例73企業(yè)抽樣調(diào)查實(shí)例73確定調(diào)查總體調(diào)查范圍和總體(以一個(gè)省為例)行業(yè)范圍:租賃和商務(wù)服務(wù)業(yè)、居民服務(wù)和其他服務(wù)業(yè)目標(biāo)總體:2005年正常營(yíng)業(yè)的法人企業(yè)和個(gè)體戶。在調(diào)查期(2006年3月)正常營(yíng)業(yè)的法人企業(yè)和個(gè)體戶。抽樣總體:2004年?duì)I業(yè)、停產(chǎn)和籌建的法人企業(yè);2004年所有的居/村委會(huì),無(wú)論是否有個(gè)體戶。74確定調(diào)查總體調(diào)查范圍和總體(以一個(gè)省為例)74估計(jì)精度要求按行業(yè)門(mén)類(lèi)營(yíng)業(yè)收入控制精度在95%概率保證程度下,租賃和商務(wù)服務(wù)業(yè)營(yíng)業(yè)收入的最大相對(duì)誤差控制在10%以內(nèi)在95%概率保證程度下,居民服務(wù)和其他服務(wù)業(yè)營(yíng)業(yè)收入的最大相對(duì)誤差控制在10%以內(nèi)75估計(jì)精度要求按行業(yè)門(mén)類(lèi)營(yíng)業(yè)收入控制精度75
整理抽樣框
按行業(yè)范圍整理:按抽樣總體整理:營(yíng)業(yè)狀態(tài)中包括當(dāng)年關(guān)閉和破產(chǎn)的企業(yè),要剔除檢查是否有重復(fù)、一對(duì)多或多對(duì)一的情況,要進(jìn)行處理新增企業(yè)要單獨(dú)考慮:使用2004年經(jīng)濟(jì)普查庫(kù),不能反映2005年新增企業(yè)部分76
整理抽樣框
按行業(yè)范圍整理:76
確定樣本量
經(jīng)驗(yàn):租賃和商務(wù)服務(wù)1000→800居民服務(wù)業(yè)和其他服務(wù)560→500測(cè)算:樣本量測(cè)算bj.xls承受的工作量非單一指標(biāo)77
確定樣本量
經(jīng)驗(yàn):租賃和商務(wù)服務(wù)1000→80077
分層與分配樣本量
確定必調(diào)查層(經(jīng)驗(yàn))北京切割點(diǎn)bj.xls按營(yíng)業(yè)收入分層(累積平方根)分配樣本(大企業(yè)層抽樣比高,層間抽樣比相差不要太大)分層結(jié)果bj.xls78
分層與分配樣本量
確定必調(diào)查層(經(jīng)驗(yàn))北京切割點(diǎn)bj.xl
分層與分配樣本量
按行業(yè)進(jìn)一步分層(觀察小類(lèi)分布)等比例分配樣本分層結(jié)果bj.xls按營(yíng)業(yè)收入再分層(如果必要)等比例分配樣本分層結(jié)果bj.xls79
分層與分配樣本量
按行業(yè)進(jìn)一步分層(觀察小類(lèi)分布)79抽取樣本
永久隨機(jī)數(shù)技術(shù)永久隨機(jī)數(shù)(PRN)概念與作用產(chǎn)生方法產(chǎn)生隨機(jī)數(shù).xls檢驗(yàn)分布的合理性隨機(jī)數(shù)分布bj.xls抽取樣本方法80抽取樣本永久隨機(jī)數(shù)技術(shù)80加權(quán)方法權(quán)數(shù):一個(gè)樣本單位代表的總體單位數(shù)量,樣本單位抽中概率的倒數(shù)→設(shè)計(jì)權(quán)數(shù)分層結(jié)果bj.xls加權(quán)調(diào)整(無(wú)回答)—有效樣本:數(shù)據(jù)收集期內(nèi)屬于調(diào)查范圍—有效無(wú)回答樣本加權(quán)調(diào)整:設(shè)計(jì)權(quán)數(shù)×有效樣本數(shù)/回答樣本個(gè)數(shù)—無(wú)效樣本:數(shù)據(jù)收集期內(nèi)不屬于調(diào)查范圍無(wú)效有效樣本分布bj.xls無(wú)效樣本參加方差計(jì)算81加權(quán)方法81企業(yè)總量與方差估計(jì)總量估計(jì)方差估計(jì):Stata軟件泰勒級(jí)數(shù)法—估計(jì)結(jié)果調(diào)查結(jié)果bj.xls82企業(yè)總量與方差估計(jì)總量估計(jì)82
新增企業(yè)的處理
搜集新增企業(yè)名單(法人代碼和企業(yè)名稱);與抽樣框核對(duì),確定實(shí)際新增企業(yè)單位數(shù);假定:限下新增企業(yè)單位數(shù)分布與抽樣框中的企業(yè)單位數(shù)分布一致;調(diào)整權(quán)數(shù):7374與8283分別調(diào)整權(quán)數(shù)權(quán)數(shù)乘以企業(yè)發(fā)展速度估計(jì)結(jié)果推算匯總4bj.xls83
新增企業(yè)的處理
搜集新增企業(yè)名單(法人代碼和企業(yè)名稱);謝謝!84謝謝!84
企業(yè)抽樣調(diào)查85
企業(yè)抽樣調(diào)查1主要內(nèi)容抽樣調(diào)查基本知識(shí)服務(wù)業(yè)抽樣調(diào)查概況企業(yè)抽樣調(diào)查實(shí)例86主要內(nèi)容抽樣調(diào)查基本知識(shí)2
抽樣調(diào)查基本知識(shí)
87
抽樣調(diào)查基本知識(shí)
3主要內(nèi)容抽樣調(diào)查的基本概念抽樣調(diào)查的基本理論基本抽樣方法抽樣方法的選擇對(duì)抽樣調(diào)查的基本認(rèn)識(shí)88主要內(nèi)容抽樣調(diào)查的基本概念4一、抽樣調(diào)查的基本概念
抽樣調(diào)查概率抽樣與非概率抽樣總體與樣本
目標(biāo)總體與抽樣總體
抽樣框
調(diào)查單位與抽樣單位
誤差
誤差限與置信度
抽樣效率與設(shè)計(jì)效果
89一、抽樣調(diào)查的基本概念抽樣調(diào)查5抽樣調(diào)查統(tǒng)計(jì)調(diào)查分為全面調(diào)查與非全面調(diào)查兩類(lèi)。抽樣調(diào)查是非全面調(diào)查中的一種重要方法,它是從所研究對(duì)象的全體(總體)中抽取一部分(樣本)進(jìn)行調(diào)查,獲取數(shù)據(jù),并以此對(duì)總體目標(biāo)量作出推斷(估計(jì))。這是廣義的抽樣調(diào)查概念。根據(jù)樣本抽取方法的不同,抽樣可分為概率抽樣和非概率抽樣。90抽樣調(diào)查統(tǒng)計(jì)調(diào)查分為全面調(diào)查與非全面調(diào)查兩類(lèi)。抽樣調(diào)查是非全概率抽樣概率抽樣(probabilitysampling)也稱隨機(jī)抽樣。概率抽樣是嚴(yán)格地按照給定的概率來(lái)抽取樣本的。特點(diǎn):按一定的概率以隨機(jī)原則抽取樣本。隨機(jī)不等與隨便。隨機(jī)有嚴(yán)格的科學(xué)定義,可用概率來(lái)描述,而隨便帶有人為或主觀因素,它不是一個(gè)科學(xué)的概念。91概率抽樣概率抽樣(probabilitysampling)概率抽樣(續(xù))每個(gè)單位被抽中的概率是已知的,或可計(jì)算出來(lái)。當(dāng)用樣本對(duì)總體目標(biāo)量估計(jì)時(shí),要考慮到該樣本抽中的概率,也就是說(shuō),估計(jì)量不僅與樣本觀測(cè)值有關(guān),也與被抽中的概率有關(guān)。通常所提到的抽樣調(diào)查實(shí)際上指的就是概率抽樣。國(guó)際交流:企業(yè)抽樣調(diào)查包括本行業(yè)所有規(guī)模的企業(yè)。92概率抽樣(續(xù))每個(gè)單位被抽中的概率是已知的,或可計(jì)算出來(lái)。8非概率抽樣非概率抽樣(non-probabilitysampling)是相對(duì)于概率抽樣而言,并無(wú)嚴(yán)格的定義,不是按隨機(jī)原則來(lái)抽選的。這種抽樣效果的好壞在很大程度上依賴于抽樣者的主觀判斷能力和經(jīng)驗(yàn),而且不能計(jì)算抽樣誤差,不能從概率意義上控制誤差并以此來(lái)保證推斷的準(zhǔn)確性。此外,即使經(jīng)驗(yàn)可能已表明某種非概率方法過(guò)去曾有較好效果,但這并不能保證該方法一直如此。不過(guò)盡管有其理論上的弱點(diǎn),各種形式的非概率抽樣仍在實(shí)踐中廣泛采用,主要原因是節(jié)省費(fèi)用和方便。
93非概率抽樣非概率抽樣(non-probabilitysam非概率抽樣(續(xù)1)通常我國(guó)的典型調(diào)查和重點(diǎn)調(diào)查,西方國(guó)家稱為的有目的抽樣或判斷抽樣等都屬于非概率抽樣。如果調(diào)查的目的是用樣本數(shù)據(jù)推斷總體的目標(biāo)量,并以一定的把握程度保證總體目標(biāo)量落在目的范圍,這時(shí)非概率抽樣是不合適的。94非概率抽樣(續(xù)1)通常我國(guó)的典型調(diào)查和重點(diǎn)調(diào)查,西方國(guó)家稱為總體和樣本總體(population):總體就是全部被研究的單位,也稱研究總體。按研究的總體不同,總體單位可以是人、戶或企業(yè)。在服務(wù)業(yè)抽樣調(diào)查中,總體就是這些行業(yè)的企業(yè)和個(gè)體戶。樣本(sample):是總體的一部分,從總體中按一定程序抽得的那部分個(gè)體或抽樣單位。樣本量n對(duì)總體總單位數(shù)N的比稱為抽樣比(samplingfraction):
95總體和樣本總體(population):總體就是全部被研究的目標(biāo)總體與抽樣總體目標(biāo)總體(targetpopulation):是真正作為研究對(duì)象的全體。如要研究山西省居民服務(wù)業(yè)的情況,目標(biāo)總體就是所有從事居民服務(wù)業(yè)的企業(yè)和個(gè)體戶。抽樣總體(samplingpopulation):是用作抽樣的總體,也就是抽樣框。二者應(yīng)一致,實(shí)際難做到。如目標(biāo)總體是2006年所有從事居民服務(wù)業(yè)的企業(yè)和個(gè)體戶,但很難做到對(duì)在調(diào)查時(shí)(2007年1月)已消亡的單位的調(diào)查,盡管在調(diào)查時(shí)消亡,但可能在2006年全年?duì)I業(yè)。先定義目標(biāo)總體,再根據(jù)條件進(jìn)行修訂得到抽樣總體。96目標(biāo)總體與抽樣總體目標(biāo)總體(targetpopulatio總體參數(shù)與樣本統(tǒng)計(jì)量無(wú)論對(duì)總體還是樣本,統(tǒng)計(jì)中通常使用平均數(shù)和標(biāo)準(zhǔn)差等這樣一些數(shù)量關(guān)系進(jìn)行描述,它們被用于描述總體特征時(shí),稱為總體參數(shù),用于描述樣本特征時(shí),稱為樣本統(tǒng)計(jì)量。如:居民服務(wù)業(yè)抽取800家企業(yè),調(diào)查結(jié)果計(jì)算出企業(yè)平均營(yíng)業(yè)收入400萬(wàn)元(樣本統(tǒng)計(jì)量),總體平均營(yíng)業(yè)收入(總體參數(shù))未知。抽樣目的是樣本(樣本統(tǒng)計(jì)量)推斷總體(總體參數(shù))。如用800家的平均營(yíng)業(yè)收入作為總體平均營(yíng)業(yè)收入的估計(jì)值。97總體參數(shù)與樣本統(tǒng)計(jì)量無(wú)論對(duì)總體還是樣本,統(tǒng)計(jì)中通常使用平均數(shù)抽樣框抽樣框(samplingframe):抽樣框是指包含所有抽樣單位的名單或名冊(cè)。由于抽樣方法不同,可有目錄框和區(qū)域框,分級(jí)抽樣框。名單中的每個(gè)單位都有可識(shí)別的基本信息;名單的范圍應(yīng)是完整的,不重不漏。現(xiàn)實(shí)中使用的抽樣框并不十分完備,一方面,要改進(jìn)和完善,如更新和維護(hù);另一方面調(diào)查的設(shè)計(jì)者要認(rèn)真分析抽樣框的狀況,以評(píng)價(jià)框的不完整對(duì)調(diào)查結(jié)果產(chǎn)生的影響,并盡可能采取一些補(bǔ)救的辦法。98抽樣框抽樣框(samplingframe):抽樣框是指包調(diào)查單位與抽樣單位調(diào)查單位(surveyunit):抽樣調(diào)查要通過(guò)對(duì)樣本單位的觀察或調(diào)查來(lái)取得有關(guān)數(shù)據(jù)或記錄有關(guān)特征,這些單位稱為調(diào)查單位。如企業(yè)和個(gè)體戶。抽樣單位(samplingunit):抽樣單位是指將總體劃分成不重疊的有限多個(gè)部分的每個(gè)部分。區(qū)域、企業(yè)和個(gè)體戶。99調(diào)查單位與抽樣單位調(diào)查單位(surveyunit):抽樣調(diào)誤差抽樣誤差(samplingerror):是由于用樣本估計(jì)總體而產(chǎn)生的誤差,也叫代表性誤差。非抽樣誤差(non—samplingerror):是指除抽樣誤差以外的,由于各種原因而引起的誤差,在各種方式的調(diào)查中都存在。100誤差抽樣誤差(samplingerror):是由于用樣本抽樣框誤差遺漏單位與新增單位;重復(fù);輔助信息是否準(zhǔn)確。101抽樣框誤差遺漏單位與新增單位;17無(wú)回答誤差單位無(wú)回答;項(xiàng)目無(wú)回答;部分無(wú)回答。102無(wú)回答誤差單位無(wú)回答;18設(shè)計(jì)誤差問(wèn)卷設(shè)計(jì)引起的誤差;抽樣設(shè)計(jì)(選用的方法、分層合理性)及抽選過(guò)程(隨機(jī))引起的誤差。103設(shè)計(jì)誤差問(wèn)卷設(shè)計(jì)引起的誤差;19調(diào)查員引起的誤差調(diào)查員的責(zé)任心和態(tài)度;調(diào)查員水平。104調(diào)查員引起的誤差調(diào)查員的責(zé)任心和態(tài)度;20被調(diào)查者引起的誤差無(wú)意識(shí)回答誤差;有意識(shí)回答誤差。105被調(diào)查者引起的誤差無(wú)意識(shí)回答誤差;21處理誤差編碼;編輯錄入;加權(quán);做表。106處理誤差編碼;22點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì):抽樣調(diào)查用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值,稱點(diǎn)估計(jì)。如用樣本計(jì)算得到的企業(yè)平均營(yíng)業(yè)收入作為總體企業(yè)的平均營(yíng)業(yè)收入的估計(jì)值,就是點(diǎn)估計(jì)。區(qū)間估計(jì):是對(duì)總體參數(shù)可能落入的一個(gè)數(shù)值范圍作出的估計(jì),估計(jì)值的取值范圍稱“置信區(qū)間”,與置信區(qū)間估計(jì)相聯(lián)系的概率稱“置信度”,表示置信區(qū)間估計(jì)包含了總體參數(shù)的可靠程度有多大。107點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì):抽樣調(diào)查用樣本統(tǒng)計(jì)量直接作為總體參數(shù)抽樣效率與設(shè)計(jì)效果抽樣效率(samplingefficiency):是指兩個(gè)抽樣方案的抽樣方差之比;當(dāng)某個(gè)估計(jì)量的方差比另一估計(jì)量的方差小時(shí),則稱方差小的估計(jì)量效率比較高。設(shè)計(jì)效果(designeffect,,簡(jiǎn)寫(xiě)為Deff):就是把一個(gè)設(shè)計(jì)方案的方差與簡(jiǎn)單隨機(jī)抽樣的方差進(jìn)行比較。Deff小于1時(shí),表示設(shè)計(jì)方案的效率高于簡(jiǎn)單隨機(jī)抽樣,反之,效率低于簡(jiǎn)單隨機(jī)抽樣。108抽樣效率與設(shè)計(jì)效果抽樣效率(samplingefficie三種性質(zhì)的分布總體分布(populationdistribution):是指研究對(duì)象這一總體的各個(gè)單位標(biāo)志值的分布狀況。樣本分布(sampledistribution):樣本單位標(biāo)志值的的分布,就稱為樣本分布。隨著樣本的增多,樣本分布逐漸接近總體分布。抽樣分布:是指樣本估計(jì)量的分布。如采用同樣的抽樣方法和同等的樣本量,在居民服務(wù)業(yè)企業(yè)中抽取多套樣本,每套樣本都能計(jì)算出一個(gè)估計(jì)量,所有可能的估計(jì)量形成的分布就是抽樣分布。109三種性質(zhì)的分布總體分布(populationdistrib永久隨機(jī)數(shù)隨機(jī)數(shù)就是按隨機(jī)方法而生成的數(shù)碼。即0,1,2……9這十個(gè)數(shù)字出現(xiàn)的機(jī)會(huì)是等概率的,但排列的順序是隨機(jī)的。永久隨機(jī)數(shù)(PermanentRandomNumbers)則是指長(zhǎng)久使用、不改變的隨機(jī)數(shù)。比如一個(gè)企業(yè)一旦被賦予了一個(gè)隨機(jī)數(shù),則在以后的調(diào)查中都使用這個(gè)隨機(jī)數(shù),它類(lèi)似企業(yè)法人代碼,具有唯一和終身性。對(duì)于樣本輪換和不同調(diào)查中共享樣本非常有用。首先對(duì)每個(gè)單位賦予一個(gè)隨機(jī)數(shù),然后按隨機(jī)數(shù)大小順序排隊(duì),抽取所需要的樣本量。110永久隨機(jī)數(shù)隨機(jī)數(shù)就是按隨機(jī)方法而生成的數(shù)碼。即0,1,2……概率概率是指用來(lái)測(cè)定樣本被抽中可能性大小的一個(gè)非負(fù)的數(shù)值。111概率概率是指用來(lái)測(cè)定樣本被抽中可能性大小的一個(gè)非負(fù)的數(shù)值。權(quán)數(shù)在概率抽樣中,每個(gè)樣本單位都代表調(diào)查總體中的一些未被抽中單位,通常,將一個(gè)樣本單位所代表的總體單位的數(shù)量即樣本單位抽中概率的倒數(shù)稱為這個(gè)樣本單位的設(shè)計(jì)權(quán)數(shù)或基礎(chǔ)權(quán)數(shù)。
112權(quán)數(shù)在概率抽樣中,每個(gè)樣本單位都代表調(diào)查總體中的一些未被抽中權(quán)數(shù)(續(xù)1)100個(gè)企業(yè)中抽10個(gè)企業(yè),每個(gè)企業(yè)被抽中的概率就是10/100=1/10,權(quán)數(shù)就是100/10=10,即一個(gè)樣本企業(yè)代表了總體中的10個(gè)企業(yè)。分層抽樣中,要在層內(nèi)計(jì)算權(quán)數(shù)。如企業(yè)分成大、中、小3層。113權(quán)數(shù)(續(xù)1)100個(gè)企業(yè)中抽10個(gè)企業(yè),每個(gè)企業(yè)被抽中的概率分層抽樣基礎(chǔ)權(quán)數(shù)計(jì)算方法企業(yè)按規(guī)模分層總體中企業(yè)單位數(shù)樣本企業(yè)個(gè)數(shù)抽中概率基礎(chǔ)權(quán)數(shù)大型200200200/200=11中型3000300300/3000=1/1010小型7000350350/7000=1/2020合計(jì)10200850850/10200=1/1212114分層抽樣基礎(chǔ)權(quán)數(shù)計(jì)算方法企業(yè)按規(guī)模分層總體中企業(yè)單位數(shù)樣本權(quán)數(shù)(續(xù)2)最終權(quán)數(shù)與基礎(chǔ)權(quán)數(shù)之間的關(guān)系最終權(quán)數(shù)等于基礎(chǔ)權(quán)數(shù):如果一項(xiàng)抽樣調(diào)查不存在無(wú)回答或涵蓋不全等情況,基礎(chǔ)權(quán)數(shù)等于最終權(quán)數(shù),可以直接用于估計(jì)。最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整:存在無(wú)回答情況(無(wú)回答多與少);范圍涵蓋不全;企業(yè)分開(kāi);企業(yè)重復(fù)。115權(quán)數(shù)(續(xù)2)最終權(quán)數(shù)與基礎(chǔ)權(quán)數(shù)之間的關(guān)系31權(quán)數(shù)(續(xù)3)不同的抽樣方法,權(quán)數(shù)是不一樣的,即推算方法是不一樣的。目錄抽樣:基礎(chǔ)權(quán)數(shù)=N/n,最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整(無(wú)回答、范圍涵蓋不全)。二階段目錄抽樣:基礎(chǔ)權(quán)數(shù)等于兩個(gè)階段權(quán)數(shù)之積。最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整(無(wú)回答、范圍涵蓋不全),在兩個(gè)階段分別調(diào)整。如服務(wù)業(yè)個(gè)體抽樣,第一階段抽居/村委會(huì),基礎(chǔ)權(quán)數(shù)等于層內(nèi)居/村委會(huì)個(gè)數(shù)÷樣本居/村委會(huì)個(gè)數(shù);116權(quán)數(shù)(續(xù)3)不同的抽樣方法,權(quán)數(shù)是不一樣的,即推算方法是不一權(quán)數(shù)(續(xù)4)第二階段抽部分個(gè)體戶,基礎(chǔ)權(quán)數(shù)等于樣本居/村委會(huì)中個(gè)體戶總數(shù)÷抽取的個(gè)體戶數(shù)。為了避免權(quán)數(shù)調(diào)整,調(diào)查中可規(guī)定:PSU和個(gè)體戶不允許無(wú)回答;合并和分開(kāi)的PSU,維持原狀;對(duì)樣本PSUs維護(hù)個(gè)體戶數(shù)。fgtybn37.xls117權(quán)數(shù)(續(xù)4)第二階段抽部分個(gè)體戶,基礎(chǔ)權(quán)數(shù)等于樣本居/村委會(huì)權(quán)數(shù)(續(xù)5)整群抽樣:與目錄抽樣方法類(lèi)似,只不過(guò)是將一個(gè)群當(dāng)作一個(gè)樣本單位對(duì)待。基礎(chǔ)權(quán)數(shù)=N/n,最終權(quán)數(shù)在基礎(chǔ)權(quán)數(shù)基礎(chǔ)上進(jìn)行調(diào)整(無(wú)回答、范圍涵蓋不全)。為了避免權(quán)數(shù)調(diào)整,調(diào)查中可規(guī)定:PSU和個(gè)體戶不允許無(wú)回答;合并和分開(kāi)的PSU,維持原狀;對(duì)樣本PSUs維護(hù)個(gè)體戶數(shù)。118權(quán)數(shù)(續(xù)5)整群抽樣:與目錄抽樣方法類(lèi)似,只不過(guò)是將一個(gè)群當(dāng)總量估計(jì)方法各種抽樣方法都有自己的總量估計(jì)計(jì)算方法,一些復(fù)雜抽樣的總量估計(jì)計(jì)算公式比較復(fù)雜,但利用權(quán)數(shù),各種抽樣方法總量估計(jì)計(jì)算公式可統(tǒng)一、簡(jiǎn)單地表述為樣本權(quán)數(shù)與指標(biāo)值乘積的關(guān)系。
為回答單位的最終權(quán)數(shù),是樣本單位的指標(biāo)值。119總量估計(jì)方法各種抽樣方法都有自己的總量估計(jì)計(jì)算方法,一些復(fù)雜二、抽樣調(diào)查的基本理論兩個(gè)極限定理估計(jì)量的優(yōu)良性
不用懷疑要遵守抽樣原則120二、抽樣調(diào)查的基本理論兩個(gè)極限定理36
兩個(gè)極限定理
大數(shù)定理:隨機(jī)事件的規(guī)律總是在對(duì)大量隨機(jī)現(xiàn)象的觀察中才能顯現(xiàn)出來(lái),隨著觀察次數(shù)的增大,隨機(jī)影響將相互抵消,而使規(guī)律性有穩(wěn)定的性質(zhì)。中心極限定理:由于正態(tài)分布在數(shù)理統(tǒng)計(jì)中具有特別重要的地位,因此關(guān)于尋找在什么條件下將趨于正態(tài)分布,這類(lèi)定理統(tǒng)稱為中心極限定理。121
兩個(gè)極限定理
大數(shù)定理:隨機(jī)事件的規(guī)律總是在對(duì)大量隨機(jī)現(xiàn)估計(jì)量的優(yōu)良性無(wú)偏性:,的平均值(期望值),滿足這個(gè)關(guān)系的稱為是無(wú)偏的。相合性:當(dāng)時(shí),以為極限,滿足這個(gè)性質(zhì)的估計(jì)量稱為是相合的。有效性(方差小):方差小的估計(jì)量比方差大的估計(jì)量有效。。可用性:若趨于零的速度比均方誤差的平方根趨于零的速度更快,則稱是可用的。
122估計(jì)量的優(yōu)良性無(wú)偏性:,的平均值(期望值)三、基本抽樣方法
簡(jiǎn)單隨機(jī)抽樣(simplerandomsampling)等距(系統(tǒng))抽樣(systematicsampling)分層抽樣(stratifiedsampling)二階與多階抽樣(two—stageormulti—stagesampling整群抽樣(clustersampling))不等概率抽樣(samplingwithunequalprobabilities)
二重抽樣(doublesampling)或雙相抽樣(twophasesampling)123三、基本抽樣方法簡(jiǎn)單隨機(jī)抽樣(simplerandom簡(jiǎn)單隨機(jī)抽樣方法:1到N編號(hào),抽取n個(gè),每一個(gè)樣本都有同樣的機(jī)會(huì)被抽中。條件:必須有包含全部單位的抽樣框。優(yōu)點(diǎn):簡(jiǎn)單方便,不需要輔助信息。缺點(diǎn):若樣本分散,不好組織或調(diào)查成本高;N大時(shí)抽樣框不容易編制。企業(yè)調(diào)查中,通常有某些用于分層的輔助信息,很少直接采用簡(jiǎn)單隨機(jī)抽樣,通常只是用于其他方法的某些過(guò)程,如分層抽樣中層內(nèi)樣本的抽取。124簡(jiǎn)單隨機(jī)抽樣方法:1到N編號(hào),抽取n個(gè),每一個(gè)樣本都有同樣的等距(系統(tǒng))抽樣方法:先將總體單位按某種順序排隊(duì),隨機(jī)確定一個(gè)起點(diǎn)抽取第一個(gè)樣本單位,然后每隔(=N/n)個(gè)單位抽取其余單位。如果抽樣間距不是整數(shù),可四舍五入。條件:總體單位的一個(gè)確定的排列。優(yōu)點(diǎn):實(shí)施簡(jiǎn)單。缺點(diǎn):精度估計(jì)比較困難
。通常采用簡(jiǎn)單隨機(jī)抽樣的方差公式替代。如企業(yè)調(diào)查中按某規(guī)模大小排隊(duì),有利于提高精度,在某種程度上獲得比例分層的效益,但此時(shí)采用簡(jiǎn)單隨機(jī)抽樣的方差公式可能偏于保守,高估了抽樣誤差。125等距(系統(tǒng))抽樣方法:先將總體單位按某種順序排隊(duì),隨機(jī)確定一分層抽樣方法:將總體分成若干獨(dú)立層,各層內(nèi)的樣本量是獨(dú)立抽取的,通常采用簡(jiǎn)單隨機(jī)或等距抽樣,不同層的樣本量可以不同,抽選樣本的方法可以不同。條件:總體中每個(gè)單位都能夠分入其中一個(gè)層,需要有相應(yīng)的輔助信息—分層依據(jù)。優(yōu)點(diǎn):組織實(shí)施方便,樣本散布均勻,精度較高。一是將單位差異較小的單位放在同一層,減少層內(nèi)方差;二是在總樣本量不變的情況下,控制各層中的樣本量,方差大層多分配樣本,減少抽樣誤差。企業(yè)調(diào)查中,分布呈現(xiàn)偏態(tài),分層效果非常明顯。
126分層抽樣方法:將總體分成若干獨(dú)立層,各層內(nèi)的樣本量是獨(dú)立抽取二階與多階抽樣方法:先將總體劃分為若干個(gè)群,隨機(jī)抽取一部分,然后在每個(gè)抽中的群中隨機(jī)抽取要調(diào)查的單位。這是二階抽樣,可以在群內(nèi)進(jìn)一步分群,每個(gè)群內(nèi)進(jìn)行二階段抽樣,形成三階或多階抽樣。前提條件:沒(méi)有企業(yè)名錄;調(diào)查組織機(jī)構(gòu)出于組織管理和成本方面的考慮,如相對(duì)于樣本量小但很分散,愿意選擇數(shù)量大但相對(duì)集中的樣本。優(yōu)點(diǎn):樣本相對(duì)集中,不需要包含所有單位的抽樣框。缺點(diǎn):抽樣時(shí)較為麻煩,而且從樣本對(duì)總體的估計(jì)比較復(fù)雜。效率低。127二階與多階抽樣方法:先將總體劃分為若干個(gè)群,隨機(jī)抽取一部分,整群抽樣是二階段抽樣的一種特殊情況,方法:先將總體劃分為若干個(gè)群,隨機(jī)抽取一部分,然后在每個(gè)抽中的群中抽取所有的單位。條件:必須有全部群?jiǎn)挝坏拿洝?yōu)點(diǎn):不要求有每個(gè)二級(jí)單位的抽樣框;便于實(shí)施
。缺點(diǎn):精度較差,效率不高。
128整群抽樣是二階段抽樣的一種特殊情況,方法:先將總體劃分為若干不等概率抽樣方法:抽選的概率與群的大小成比例。大單位被抽到的概率大,小單位抽到的概率小。PPS,目錄抽樣中,按每個(gè)單位規(guī)模(營(yíng)業(yè)收入、從業(yè)人數(shù))占總體規(guī)模的比重成比例的概率抽取樣本。條件:必須有全部群?jiǎn)挝灰?guī)模的輔助信息,且規(guī)模指標(biāo)與估計(jì)指標(biāo)相關(guān)程度高。優(yōu)點(diǎn):群?jiǎn)挝淮笮〔幌嗟葧r(shí),精度較高,數(shù)據(jù)處理也不復(fù)雜。129不等概率抽樣方法:抽選的概率與群的大小成比例。大單位被抽到的二重抽樣方法:抽樣時(shí)分兩次抽取樣本。先從總體中抽取一個(gè)較大樣本,稱第一重樣本,對(duì)一重樣本進(jìn)行調(diào)查搜集某些信息,然后從中抽取一部分樣本—第二重樣本,對(duì)抽中的第二重樣本再次進(jìn)行調(diào)查,進(jìn)一步搜集有關(guān)信息。前提條件:抽樣框缺乏輔助信息,需要對(duì)總體進(jìn)行分層。優(yōu)點(diǎn):提高抽樣效率。缺點(diǎn):在抽取一重樣本時(shí)需要增加一定的費(fèi)用,只有當(dāng)利用這些信息進(jìn)行分層抽樣,所提高的精度的得益大于所增加的費(fèi)用時(shí),采用二重抽樣才是合算的。130二重抽樣方法:抽樣時(shí)分兩次抽取樣本。先從總體中抽取一個(gè)較大樣二重抽樣與兩階段抽樣兩階段抽樣是先從總體中抽取一定規(guī)模的樣本(初級(jí)抽樣單位PSUs),并不對(duì)初級(jí)抽樣單位中的所有二級(jí)單位都調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單位進(jìn)行調(diào)查;二重抽樣則不同,要對(duì)第一重樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行分層或估計(jì)。兩階段抽樣中二級(jí)抽樣單位與一級(jí)抽樣單位是不同的,如一級(jí)抽樣單位是居委會(huì),二級(jí)抽樣單位是個(gè)體戶;而二重抽樣兩次的抽樣單位是相同的。131二重抽樣與兩階段抽樣兩階段抽樣是先從總體中抽取一定規(guī)模的樣本四、抽樣方法的選擇確定抽樣方法的原則有效原則:在樣本量一定的前提下,誤差要小;或在一定精度前提下,樣本量要少。如分層抽樣,效率高。經(jīng)濟(jì)原則:費(fèi)用要低。精度與費(fèi)用是評(píng)價(jià)抽樣設(shè)計(jì)優(yōu)劣的準(zhǔn)則。最優(yōu)的抽樣設(shè)計(jì):在費(fèi)用一定的前提下,達(dá)到精度最高;或在滿足精度的要求下,調(diào)查費(fèi)用最少。易操作原則:容易組織實(shí)施。適應(yīng)抽樣框的原則:充分利用抽樣框及已有的信息實(shí)際中,原則不能同時(shí)兼顧,權(quán)衡利弊,選擇抽樣方法。132四、抽樣方法的選擇確定抽樣方法的原則48抽樣方法的選擇(續(xù)1)企業(yè)抽樣方法的選擇目錄抽樣經(jīng)濟(jì)普查建立了名錄庫(kù),每年兩次的維護(hù)更新制度;目錄抽樣設(shè)計(jì)簡(jiǎn)單,進(jìn)行分層后,效率高—樣本量確定的前提下,分層提高精度;或在精度確定的前提下,分層能減少樣本量;缺點(diǎn):以省為總體進(jìn)行抽樣,樣本分布分散。133抽樣方法的選擇(續(xù)1)企業(yè)抽樣方法的選擇49抽樣方法的選擇(續(xù)2)世界先進(jìn)國(guó)家對(duì)產(chǎn)業(yè)活動(dòng)單位調(diào)查,基本都采用目錄抽樣,具備及時(shí)更新維護(hù)的名錄庫(kù)。為減輕小企業(yè)回答負(fù)擔(dān),采用稅務(wù)數(shù)據(jù)替代的方法。如加拿大Royce-Maranda界限方法,分層后每個(gè)單元格單位收入5%-10%以下的單位不發(fā)表調(diào)查,采用稅務(wù)數(shù)據(jù)。借鑒經(jīng)驗(yàn),權(quán)衡利弊,企業(yè)選擇目錄抽樣。注意:選擇目錄抽樣方法,就要發(fā)揮其方法的優(yōu)勢(shì)時(shí),接受其弊端—樣本分散。(把樣本集中到有調(diào)查隊(duì)的縣或地市)。134抽樣方法的選擇(續(xù)2)世界先進(jìn)國(guó)家對(duì)產(chǎn)業(yè)活動(dòng)單位調(diào)查,基本都抽樣方法的選擇(續(xù)3)個(gè)體抽樣方法的選擇二階段整群抽樣(第一階段):以省為總體,第一階段抽取縣區(qū),第二階段抽取樣本縣區(qū)內(nèi)的村/居委會(huì),對(duì)抽中村/居委會(huì)中的個(gè)體戶全部進(jìn)行調(diào)查。個(gè)體戶無(wú)名錄;建立個(gè)體戶名錄難度大;個(gè)體戶變動(dòng)頻繁。135抽樣方法的選擇(續(xù)3)個(gè)體抽樣方法的選擇51抽樣方法的選擇(續(xù)4)二階段抽樣(目前):首先在由村/居委會(huì)構(gòu)成的一階段抽樣框中抽取村/居委會(huì),在抽中的村/居委會(huì)中(利用經(jīng)濟(jì)普查時(shí)清查的所有在調(diào)查范圍內(nèi)的個(gè)體戶的名單,維護(hù)后采用簡(jiǎn)單隨機(jī)方式從中)抽取個(gè)體戶樣本進(jìn)行調(diào)查。對(duì)于個(gè)體戶數(shù)多的的群(居/村委會(huì))采用二階段抽樣。解決調(diào)查量大的問(wèn)題。通過(guò)一階段整群,將大群劃小,也能解決調(diào)查量大的問(wèn)題。省里更愿意使用二階段抽樣。136抽樣方法的選擇(續(xù)4)二階段抽樣(目前):首先在由村/居委會(huì)五、對(duì)抽樣調(diào)查的基本認(rèn)識(shí)關(guān)于對(duì)抽樣調(diào)查準(zhǔn)確性的認(rèn)識(shí)準(zhǔn)確(accuracy):客觀的真值
精確(precision):大量計(jì)量結(jié)果的均值,多次調(diào)查結(jié)果的擺動(dòng)愈小就愈精確。關(guān)于樣本對(duì)總體代表性問(wèn)題的認(rèn)識(shí)
只要抽樣是概率抽樣,抽得的樣本對(duì)總體的代表性都是有保證的。137五、對(duì)抽樣調(diào)查的基本認(rèn)識(shí)關(guān)于對(duì)抽樣調(diào)查準(zhǔn)確性的認(rèn)識(shí)53對(duì)抽樣調(diào)查的基本認(rèn)識(shí)(續(xù))關(guān)于概率抽樣局限性的認(rèn)識(shí)
“抽樣調(diào)查不能滿足分級(jí)管理需要的認(rèn)識(shí)”通過(guò)擴(kuò)大各級(jí)樣本量來(lái)滿足;可行性問(wèn)題。138對(duì)抽樣調(diào)查的基本認(rèn)識(shí)(續(xù))關(guān)于概率抽樣局限性的認(rèn)識(shí)54
服務(wù)業(yè)抽樣調(diào)查概況
139
服務(wù)業(yè)抽樣調(diào)查概況
55主要內(nèi)容企業(yè)抽樣設(shè)計(jì)個(gè)體抽樣設(shè)計(jì)140主要內(nèi)容企業(yè)抽樣設(shè)計(jì)56抽樣設(shè)計(jì)調(diào)查范圍和總體行業(yè)范圍:裝卸搬運(yùn)和其他運(yùn)輸服務(wù)業(yè)、倉(cāng)儲(chǔ)業(yè)、計(jì)算機(jī)服務(wù)業(yè)、軟件業(yè)、租賃業(yè)、商務(wù)服務(wù)業(yè)、科技交流和推廣服務(wù)業(yè)、居民服務(wù)業(yè)、其他服務(wù)業(yè)、社會(huì)福利業(yè)、體育和娛樂(lè)業(yè)12個(gè)行業(yè)大類(lèi)。調(diào)查對(duì)象:法人企業(yè)和個(gè)體戶。調(diào)查總體劃分為企業(yè)子總體和個(gè)體子總體。141抽樣設(shè)計(jì)調(diào)查范圍和總體57抽樣設(shè)計(jì)(續(xù)1)目標(biāo)總體:2007年1至11月正常營(yíng)業(yè)的法人企業(yè)和個(gè)體戶。在調(diào)查期(2007年12月)正常營(yíng)業(yè)的法人企業(yè)和個(gè)體戶。抽樣總體:2006年?duì)I業(yè)、停業(yè)和籌建的法人企業(yè);2004年經(jīng)濟(jì)普查時(shí)的所有居/村委會(huì)。142抽樣設(shè)計(jì)(續(xù)1)目標(biāo)總體:2007年1至11月正常營(yíng)業(yè)的法人抽樣設(shè)計(jì)(續(xù)2)估計(jì)精度要求:以省12個(gè)服務(wù)員行業(yè)為總體控制抽樣精度,在95%的概率保證程度下,營(yíng)業(yè)收入的cv控制在5%以內(nèi)。143抽樣設(shè)計(jì)(續(xù)2)估計(jì)精度要求:59抽樣設(shè)計(jì)(續(xù)3)基本抽樣方法企業(yè):目錄抽樣,直接從企業(yè)名錄庫(kù)中抽取樣本企業(yè)。個(gè)體二階段抽樣第一階段抽取樣本村/居委會(huì);第二階段在樣本村/居委會(huì)中抽取個(gè)體戶。個(gè)體一階段整群抽樣,直接抽取樣本村/居委會(huì),對(duì)抽中的樣本村/居委會(huì)中的個(gè)體戶全部進(jìn)行調(diào)查。144抽樣設(shè)計(jì)(續(xù)3)基本抽樣方法60抽樣設(shè)計(jì)(續(xù)4)調(diào)查目標(biāo)估計(jì)全省(市)總體總量指標(biāo);估計(jì)全省(市)企業(yè)子總體和個(gè)體子總體總量指標(biāo)。145抽樣設(shè)計(jì)(續(xù)4)調(diào)查目標(biāo)61企業(yè)抽樣設(shè)計(jì)搜集整理抽樣框抽樣框使用普查中心維護(hù)后的名錄庫(kù)。由總隊(duì)到省統(tǒng)計(jì)局普查中心去搜集。然后整理為國(guó)家要求的格式。樣本量類(lèi)似調(diào)查的經(jīng)驗(yàn);相關(guān)測(cè)算;人力、物力、時(shí)間和精度等因素。146企業(yè)抽樣設(shè)計(jì)搜集整理抽樣框62企業(yè)抽樣設(shè)計(jì)(續(xù)1)2006年1至11月調(diào)查為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 計(jì)算機(jī)二級(jí)MySQL數(shù)據(jù)庫(kù)體系結(jié)構(gòu)試題及答案
- 邏輯推理技巧在財(cái)務(wù)成本管理中的應(yīng)用試題及答案
- 法律專業(yè)基礎(chǔ)試題及答案
- 針對(duì)2025年MySQL試題及答案的準(zhǔn)備
- 法律援助類(lèi)面試題及答案
- 法律文言文試題及答案
- MySQL考試高頻考點(diǎn)與試題及答案剖析
- 法律考試題庫(kù)及答案信訪
- C++編程技術(shù)的前瞻性研究與實(shí)踐探索試題及答案
- 2025年計(jì)算機(jī)二級(jí)MySQL索引失效分析試題及答案
- 班級(jí)管理交流-班主任工作經(jīng)驗(yàn)交流課件(共28張ppt)
- 人造草坪足球場(chǎng)施工方案
- 六年級(jí)下冊(cè)道德與法治課件戰(zhàn)爭(zhēng)帶來(lái)的傷害人教部編版市公開(kāi)課一等獎(jiǎng)省課獲獎(jiǎng)?wù)n件
- 模電直流穩(wěn)壓電源
- 標(biāo)識(shí)標(biāo)牌投標(biāo)服務(wù)方案
- 病原學(xué)標(biāo)本采集與送檢規(guī)范
- 黑河學(xué)院輔導(dǎo)員考試題庫(kù)
- 抖音運(yùn)營(yíng)工作計(jì)劃模版(3篇)
- 新高考人教版高中化學(xué)必修一全套課件
- 做一名幸福教師專題培訓(xùn)課件
- GHS化學(xué)品(含危險(xiǎn)品)標(biāo)簽標(biāo)志與象形符號(hào)
評(píng)論
0/150
提交評(píng)論