抽樣的邏輯課件_第1頁
抽樣的邏輯課件_第2頁
抽樣的邏輯課件_第3頁
抽樣的邏輯課件_第4頁
抽樣的邏輯課件_第5頁
已閱讀5頁,還剩24頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三講

抽樣的邏輯講解:李素梅

總體與抽樣框

概率抽樣的應用提綱概率抽樣的實際操作抽樣:從總體中選出具有代表性樣本的過程。以便通過對樣本的研究,取得能說明總體的足夠可靠的資料,準確地推斷總體的情況,從而認識總體的特征或規律性。從樣本的特征推斷總體的特征統計值參數值本樣總體抽樣知識回顧抽樣原則:樣本具有代表性,即所選取的樣本能再現總體的結構。

總體

研究總體

抽樣框

樣本推論的對象

抽樣的對象

抽樣的名單

抽到的對象回顧幾個概念吧影響樣本代表性的因素樣本容量

抽樣方法

抽樣框、總體是否一致等

抽樣框與總體的關系:經過正確抽樣所得的樣本信息,只適合于描述構成抽樣框的要素組成的總體,是否能擴展需要分析。例:對紐約以及新澤西48個社區中68個藥房藥物的銷售情況進行25年的調查(方法:“調查鄰近藥房的方式”)----能推斷整個美國藥房銷售的情況嗎?或是否能推論紐約和新澤西的藥房的情況?總體與抽樣框理想的抽樣框:所有的抽樣單位必須覆蓋總體,抽樣框要求每個總體單位都應該對應著一個抽樣單位,抽樣單位必須相互獨立,互不重疊。如以北京的所有街道的名單為一階抽樣中的抽樣框,其必須覆蓋北京所有的街道。最理想的抽樣框隨機抽取成員組織如學校等成員總體與抽樣框抽樣框表現形式----例:電話號碼簿、郵政編碼簿、車主名單、納稅人名單、領有營業執照的人員名單;大學、學術期刊、報紙、工會等名單當你用電話簿或名冊作為抽樣框時,有沒有注意它是否包含了總體所有單位呢?抽樣框誤差來源于:

1.不能覆蓋總體單位;2.包含了非總體單位;3.復合聯接;

4.抽樣框老化。總體與抽樣框非概率抽樣方法就近法、目標式抽樣、配額抽樣、滾雪球抽樣確定合適的樣本量執行抽樣設計界定總體

決定抽樣框確定抽樣步驟抽樣的設計概率抽樣方法

簡單隨機抽樣、分層抽樣、系統抽樣、整群抽樣、多階段抽樣概率抽樣(ProbabilitySampling)

概率抽樣系統抽樣簡單隨機抽樣分層抽樣整群抽樣多階段抽樣概率抽樣:按照概率論和數理統計的原理,根據隨機原則從調查研究的總體中抽選樣本,使每個要素以已知非零的機會進入樣本的方法。特點:1、按隨機原則抽選樣本;2、總體中每一個單位被抽中的概率已知非零,樣本具有代表性;3、可以估計可能出現的誤差并加以控制。

簡單隨機抽樣(SimpleRandomSampling)總體各單元不經過任何排隊或分類,從總體N個單位中任意抽取n個單位作為樣本,使每個可能的樣本被抽中的概率相等的一種抽樣方式,是其他概率抽樣方法的基礎。 方法:拋硬幣、擲骰子、抽簽、查隨機數表等。隨機數表法例:(例:K=100,n=10)1.給每個要素編碼;2.從隨機表中隨機選取10個數字:確定所選擇的隨機數的位數;隨意從隨機數表中任何一區的任何一個數目開始,依次向各個方向順序連續選取數字。評價:概率抽樣的理想類型,沒有偏見,簡單易行。但當總體所含個體數目太多時,費時、費力,費用高;而且在總體異質性很高時,誤差較大。因此,名冊齊全的話,一般會用系統抽樣法而不是簡單隨機抽樣法。黑人白人機會均等

步驟:(1)將總體的所有單位按一定順序排列起來。(2)計算抽樣間距:k=總體大小(N)/樣本大小(n)。(3)隨機確定一個起點a(1≤a≤k)

作為第一個樣本單位。(4)每隔k個單位抽取1個,即由a,a+k,a+2k….a+(n-1)k組成容量為n的樣本。2.系統抽樣(SystematicSampling

)亦稱等距抽樣或機械抽樣,系統化地選擇完整名單中每第K個要素組成樣本的概率抽樣方法。1

2

34

5

67

89

103132333435

363738394021

2223

2425

26

27

28

29

30

11121314151617181920N=40n=8k=5

我的fans多得不得了呢.優點比簡單隨機抽樣方便簡單樣本在總體中的分布比較均勻局限性是以總體單位的無規律排列為前提的,如果總體的排列出現規律性,特別是周期性時,就可能會使抽樣出現系統偏差。

如果在一棟公寓樓里選選擇公寓樣本,如上圖樣本間距是8,那么所選樣本的每個要素可能全是西北角上房間,這樣樣本就可能會缺乏代表性.

如果有周期性,可以采取在每個間隔內隨機抽取等方法解決。3.分層抽樣(StratifiedSampling)

先將總體按照一種或幾種特征將總體的N個單位分成互不交叉、互不重復的若干個組(層);然后從每層中獨立、隨機地抽取一個子樣本,將子樣本合在一起,即為總體的樣本。腌菜缸廠家想了解各類腌菜的長度,于是….變量的選擇:1.研究涉及到的主要變量或相關的變量;2.保證各層內部同質性強的變量;3.有明顯分層區分的變量;如:某廠職工購買書籍的情況—”文化程度”;

某高校宿舍使用電腦情況-“本科生、研究生”等常用指標:行政區劃、地理位置、海拔高度、行業、經濟發達程度、企業規模、家庭收入水平、性別、年齡、民族等分層應遵循原則:盡可能層內樣本的變異小,層間變異大。

優點:1.樣本同質性高,樣本分布均勻,樣本結構與總體結構接近;2.也可對各子層的參數進行推斷;3.組織實施比較方便。

應用上最為普遍。尤其是總體數目較大,內部結構復雜時常能取得比較好的效果;

注意:要求調查者對總體及各層有一定的了解,否則無法作出科學的分類。

步驟:

1.變量的選擇。可按一種或幾種特征對總體進行分層。如調查某年高考生的語文成績,可根據科目分類,如文科、理科、藝術、體育、外語等層次來進行簡單隨機抽樣;男性白人、女性白人、男性黑人、女性黑人;2.確定在各層中抽取樣本單位的數量。可采取等比例和不等比例抽取兩種不同的方法。a.等比例抽樣要求各層之間的抽樣比例相等。方法1:先分成不同的層,然后采取系統抽樣或者隨機抽樣按照比例抽取。6040樣本n=100占總體之60%占總體之40%女生N2=400總體(N=1000)男生N1=600 方法2.分類,再把不同類別的要素放到一個連續性的列表中,然后再對整個列表進行隨機開始的系統抽樣。(誤差將會在1-2個以內,如果在此步采取簡單隨機抽樣將會使分層的效應被抵消)b.不等比例抽樣,加權即各層之間的抽樣比例不等:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行比較研究。如果要用樣本資料推斷總體時,則需要先對各層的數據資料進行加權處理,調整樣本中各層的比例,使數據恢復到總體中各層實際的比例結構。例:N=120n=60

各層人數不等比例樣本樣本概率值加權重本科生60201/33

碩士生40201/22

博士生20201

1

基本上一個樣本成員的權重,應該是其獲選為樣本概率值的倒數。加權:由于各種誤差因素的存在,常導致樣本的人口統計數據有別于普查數據。為了減小這種誤差,在數據處理時,我們要算出各個樣本的權值,使樣本結構與普查數據一致,這種數據處理方法就是加權。4.整群抽樣(ClusterSampling)

整群抽樣又稱聚類抽樣,一種以群而非個體為抽樣單位的抽樣方式。先將總體劃分為若干能代表總體的子群體,從中隨機抽取一些子群體,抽取的群里所有要素共同組成樣本的方法。例:對北京市小學生的視力狀況進行抽樣調查,以學校作為群,抽出部分學校,再對抽中的所有學校的學生統一調查。

群的劃分標準:按行政或地域形成的群體,如學校、企業或街道等。自行劃分群時原則:盡可能群間差異小,群內差異大,讓每個群更具有代表性。優點:1.轉換抽樣單位,編制抽樣框得以簡化;2.群通常由那些地理位置鄰近,或隸屬于同一系統的單元構成,調查方便;可了解每個子群的情況(如省-市,亦可了解市的情況);局限性:當樣本集中于少數群時,引起抽樣誤差大于其他方法。對抽取的群的所有人進行調查總體被分為若干子群體圖1:分層抽樣圖2:整群抽樣5.多階段抽樣(MultiStageSampling)亦稱多級抽樣,在上述整群抽樣中,當子群或子群內部個體數目較多,彼此間的差異不太大時,常常采用更加經濟的方法,即不將樣本子群中的所有個體作為樣本,而是從中再抽取樣本,因最終樣本的獲得經過兩次抽樣,我們稱其為二階段抽樣。同樣可進行三階段、四階段等多階段抽樣。

如:我們若要調查北京市小學生的視力狀況,可采用三階段抽樣的方法:先以學校為抽樣單位,抽出若干所小學,然后再以班級為抽樣單位抽出若干班級,最后以學生個人為單位從抽中的班級中抽取最終樣本。多階段抽樣例:在一項某市居民對香皂顏色喜好的調查中,設計者打算采用入戶調查的方式,為節省差旅費,希望樣本能夠集中,因此準備采用整群抽樣。方案設計者手頭有份該市街道名單。以街道作為群,工作量太大,以居委會為群,編制抽樣框來不及,因此,他決定…………三階段抽樣所有街道名單抽取部分街道,并建立其所有居委會名單抽取部分居委會對所有家庭調查二級整群抽樣抽除部分家庭最后一階抽群最后一階抽要素多階段抽樣多級整群抽樣抽取部分居委會抽取100個居委會,每個居委會抽取2個人?抽10個居委會,每個抽取20個人?按照增加樣本容量的原則通過同質性解決自然群如居委會群內差異較小,需要大量的群才能充分代表所有群之間的差異盡量多地選擇群,而減少每個群中要素的數量上例:N=200建議:在多階段抽樣中,增加開頭階段的樣本數,同時適當地減少最后階段的樣本數。多階段抽樣中如何處理樣本量的平衡問題?優點:效率較高局限性:每一階段都會有誤差。適用范圍:跨地區的研究,不可能或不方便編制一個完整的名單形成目標總體時;或者是在總體層次比較多或層次內單位數目比較多時,更加經濟實用。輔助方法:對于群體規模不等的多階段抽樣,通常使用概率比例抽樣,即pps抽樣。就是根據每一群的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論