




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第23章概率抽樣方法
第23章概率抽樣方法
1學習目標掌握簡單隨機抽樣及SAS程序;掌握系統(機械、等距)抽樣及SAS程序;掌握分層抽樣及SAS程序;掌握整群抽樣及SAS程序。學習目標掌握簡單隨機抽樣及SAS程序;2概述抽樣調查可以分為兩類,即概率抽樣和非概率抽樣。概率抽樣是按照隨機原則進行抽樣,不加主觀因素,組成總體的每個單位都有被抽中的概率(非零概率),可以避免樣本出現偏差,樣本對總體有很強的代表性。非概率抽樣是按主觀意向進行的抽樣(非隨機的),組成總體的很大部分單位沒有被抽中的機會(零概率),使調查很容易出現傾向性偏差。概述抽樣調查可以分為兩類,即概率抽樣和非概率抽樣。概率抽樣是3概述現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查是指概率抽樣,其定義為:抽樣調查,又稱抽樣推斷,是一種重要的、科學的非全面調查方法。它根據調查的目的和任務要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標志的數據來推斷總體。概述現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查4概述概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。概率抽樣之所以能夠保證樣本對總體的代表性,其原理就在于它能夠很好的按總體內在結構中所蘊含的各種隨機事件的概率來構成樣本,使樣本成為總體的縮影。概述概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。5概述抽樣調查按抽樣的組織形式劃分,有以下幾種主要方法:簡單隨機抽樣:按照等概率的原則,直接從含有N個元素的總體中抽取n個元素組成的樣本(N>n)。系統抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。概述抽樣調查按抽樣的組織形式劃分,有以下幾種主要方法:6概述K(抽樣距離)=N(總體規模)/n(樣本規模)前提條件:總體中個體的排列對于研究的變量來說,應是隨機的,即不存在某種與研究變量相關的規則分布。可以在調查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環性規律,且這種循環和抽樣距離重合。概述K(抽樣距離)=N(總體規模)/n(樣本規模)7概述分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構成總體的樣本。分層抽樣是把異質性較強的總體分成一個個同質性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。概述分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或8概述分層標準為:以調查所要分析和研究的主要變量或相關的變量作為分層的標準。以保證各層內部同質性強、各層之間異質性強、突出總體內在結構的變量作為分層變量。以那些有明顯分層區分的變量作為分層變量。概述分層標準為:9概述分層的比例問題:按比例分層抽樣:根據各種類型或層次中的單位數目占總體單位數目的比重來抽取子樣本的方法。不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數據資料進行加權處理,調整樣本中各層的比例,使數據恢復到總體中各層實際的比例結構。概述分層的比例問題:10概述整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內的所有元素構成調查的樣本。對小群體的抽取可采用簡單隨機抽樣、系統抽樣和分層抽樣的方法。優點:簡便易行、節省費用,特別是在總體抽樣框難以確定的情況下非常適合。缺點:樣本分布比較集中、代表性相對較差。一般來說,類別相對較多、每一類中個體相對較少的做法效果較好。概述整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。它是11概述多階抽樣(分段抽樣):按照元素的隸屬關系后層次關系,把抽樣過程分為幾個階段進行。適用于總體規模特別大,或者總體分布的范圍特別廣時。二重抽樣(又稱兩相抽樣):就是先抽取一個容量比較大的初始樣本,用初始樣本估計總體的某些參數或某些必要的信息作為分層的比例或再次抽樣的標志,然后將抽出的初始大樣本作為“總體”,從中抽取容量合適的樣本進行比較詳細的調查。特點是,適合用于對總體信息了解比較少的調查。概述多階抽樣(分段抽樣):按照元素的隸屬關系后層次關系,把抽12概述比率抽樣(PPS抽樣):就是將總體按一種準確的標準劃分出容量不等的具有相同標志的單位在總體中不同比率分配的樣本量進行的抽樣。特點是總體中含量大的部分被抽中的概率也大,可以提高樣本的代表性。概述比率抽樣(PPS抽樣):就是將總體按一種準確的標準劃分出13概述在抽樣調查的實際工作中,經常是要將幾種抽樣方法結合起來應用。比如,城市居民的收支調查,是將二重抽樣、多階段抽樣、分層抽樣、機械抽樣等多種方法結合起來使用。
在現實的商業性的市場調查中也有非概率抽樣的應用。如,配額抽樣、隨意抽樣、志愿者抽樣、判斷抽樣、修正的概率抽樣和滾雪球抽樣等等,由于這些抽樣方法容易出現偏差,所以只在對共性特別強的群體的商業性調查中應用。概述在抽樣調查的實際工作中,經常是要將幾種抽樣方法結合起來應14簡單隨機抽樣及SAS程序SAS系統中利用SURVEYSELECT過程步進行簡單隨機抽樣。SURVEYSELECT過程的語法格式如下:PROCSURVEYSELECTDATA=OUT=METHOD=SAMPSIZE=SAMPRATE=REP=SEED=NOPRINT;IDvariable;RUN;簡單隨機抽樣及SAS程序SAS系統中利用SURVEYSEL15簡單隨機抽樣及SAS程序DATA語句指定要分析的數據集名及一些選項;OUT選擇項指定輸出結果的SAS數據集名,用來保存抽樣輸出的結果;METHOD選擇項指定抽樣方法,其中SRS(simplerandomsampling)為簡單隨機抽樣,SYS(systemrandomsampling)為系統隨機抽樣,等等;SAMPSIZE選擇項指定需要抽樣的樣本量;簡單隨機抽樣及SAS程序DATA語句指定要分析的數據集名及一16簡單隨機抽樣及SAS程序REP選擇項指定可以重復抽樣的次數;SAMPRATE選擇項指定抽樣的比例;SEED選擇項指定產生隨機隨機數字的初始數,缺省是0或負值;NOPRINT選擇項指定不對輸出結果進行打印;ID語句指定數據集中需要包含的變量指標。簡單隨機抽樣及SAS程序REP選擇項指定可以重復抽樣的次數;17系統(機械、等距)抽樣及SAS程序把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。在SURVEYSELECT過程步中,只需要將METHOD選擇項設定為SYS(systematicrandomsampling)即可,通過CONTROL語句設定某個變量作為抽樣距離參考變量,即抽樣之前按照CONTROL變量對原始樣本進行排序,然后按照規定的樣本量確定抽樣距離,隨機選取第一個樣本并進行系統抽樣。系統(機械、等距)抽樣及SAS程序把總體的單位進行排序,再18整群抽樣及SAS程序整群抽樣抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內的所有元素構成調查的樣本。把“成群的個體”當作個體來看待,那么整群抽樣與簡單隨機抽樣的原理就是一樣的。整群抽樣及SAS程序整群抽樣抽樣的單位不是單個的個體,而是19多階抽樣及SAS程序是將總體分成若干小的群體,但并不在每一小的群體中抽取一個樣本,而是將這些小群體稱為第一性抽樣單元,將它們看作個體進行抽樣,然后,再對抽中的第一性抽樣單元中的個體抽樣,這樣的抽樣當然可以不止二階而是多階的,先抽第一性樣單元,再在第一性樣單元鐘抽第二性樣單元,再在第二性樣單元中抽第三性樣單元,如此直至最基層的個體。多階抽樣及SAS程序是將總體分成若干小的群體,但并不在每一20多階抽樣及SAS程序當總體中個體數量太大,或其他技術上的原因,無法直接對個體編號時,可以采用多階抽樣,先按第一性單元編號,抽取若干個,再在抽得的第一性單元內編號,抽取下一級單元。多階抽樣會使現場觀測的樣本單元比較集中,有利于節省調查費用。多階抽樣的SAS程序也是以簡單隨機抽樣和系統性抽樣為基礎的,只是每一次抽樣過程編寫一個SAS程序而已,即需要編寫多個SAS程序以進行多次抽樣。多階抽樣及SAS程序當總體中個體數量太大,或其他技術上的原因21本章小節現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查是指概率抽樣,其定義為:抽樣調查,又稱抽樣推斷,是一種重要的、科學的非全面調查方法。它根據調查的目的和任務要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標志的數據來推斷總體。本章小節現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽22本章小節概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。概率抽樣之所以能夠保證樣本對總體的代表性,其原理就在于它能夠很好的按總體內在結構中所蘊含的各種隨機事件的概率來構成樣本,使樣本成為總體的縮影。本章小節概率抽樣的原則,就是總體中的每一個樣本被選中的概率23本章小節簡單隨機抽樣:按照等概率的原則,直接從含有N個元素的總體中抽取n個元素組成的樣本(N>n);系統抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取;分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構成總體的樣本;本章小節簡單隨機抽樣:按照等概率的原則,直接從含有N個元素24本章小節整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內的所有元素構成調查的樣本。對小群體的抽取可采用簡單隨機抽樣、系統抽樣和分層抽樣的方法;多階抽樣(分段抽樣):按照元素的隸屬關系后層次關系,把抽樣過程分為幾個階段進行。適用于總體規模特別大,或者總體分布的范圍特別廣時。本章小節整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。25第23章概率抽樣方法課件26第23章概率抽樣方法
第23章概率抽樣方法
27學習目標掌握簡單隨機抽樣及SAS程序;掌握系統(機械、等距)抽樣及SAS程序;掌握分層抽樣及SAS程序;掌握整群抽樣及SAS程序。學習目標掌握簡單隨機抽樣及SAS程序;28概述抽樣調查可以分為兩類,即概率抽樣和非概率抽樣。概率抽樣是按照隨機原則進行抽樣,不加主觀因素,組成總體的每個單位都有被抽中的概率(非零概率),可以避免樣本出現偏差,樣本對總體有很強的代表性。非概率抽樣是按主觀意向進行的抽樣(非隨機的),組成總體的很大部分單位沒有被抽中的機會(零概率),使調查很容易出現傾向性偏差。概述抽樣調查可以分為兩類,即概率抽樣和非概率抽樣。概率抽樣是29概述現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查是指概率抽樣,其定義為:抽樣調查,又稱抽樣推斷,是一種重要的、科學的非全面調查方法。它根據調查的目的和任務要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標志的數據來推斷總體。概述現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查30概述概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。概率抽樣之所以能夠保證樣本對總體的代表性,其原理就在于它能夠很好的按總體內在結構中所蘊含的各種隨機事件的概率來構成樣本,使樣本成為總體的縮影。概述概率抽樣的原則,就是總體中的每一個樣本被選中的概率相等。31概述抽樣調查按抽樣的組織形式劃分,有以下幾種主要方法:簡單隨機抽樣:按照等概率的原則,直接從含有N個元素的總體中抽取n個元素組成的樣本(N>n)。系統抽樣(等距抽樣或機械抽樣):把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。概述抽樣調查按抽樣的組織形式劃分,有以下幾種主要方法:32概述K(抽樣距離)=N(總體規模)/n(樣本規模)前提條件:總體中個體的排列對于研究的變量來說,應是隨機的,即不存在某種與研究變量相關的規則分布。可以在調查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環性規律,且這種循環和抽樣距離重合。概述K(抽樣距離)=N(總體規模)/n(樣本規模)33概述分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構成總體的樣本。分層抽樣是把異質性較強的總體分成一個個同質性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。概述分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或34概述分層標準為:以調查所要分析和研究的主要變量或相關的變量作為分層的標準。以保證各層內部同質性強、各層之間異質性強、突出總體內在結構的變量作為分層變量。以那些有明顯分層區分的變量作為分層變量。概述分層標準為:35概述分層的比例問題:按比例分層抽樣:根據各種類型或層次中的單位數目占總體單位數目的比重來抽取子樣本的方法。不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數據資料進行加權處理,調整樣本中各層的比例,使數據恢復到總體中各層實際的比例結構。概述分層的比例問題:36概述整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內的所有元素構成調查的樣本。對小群體的抽取可采用簡單隨機抽樣、系統抽樣和分層抽樣的方法。優點:簡便易行、節省費用,特別是在總體抽樣框難以確定的情況下非常適合。缺點:樣本分布比較集中、代表性相對較差。一般來說,類別相對較多、每一類中個體相對較少的做法效果較好。概述整群抽樣:抽樣的單位不是單個的個體,而是成群的個體。它是37概述多階抽樣(分段抽樣):按照元素的隸屬關系后層次關系,把抽樣過程分為幾個階段進行。適用于總體規模特別大,或者總體分布的范圍特別廣時。二重抽樣(又稱兩相抽樣):就是先抽取一個容量比較大的初始樣本,用初始樣本估計總體的某些參數或某些必要的信息作為分層的比例或再次抽樣的標志,然后將抽出的初始大樣本作為“總體”,從中抽取容量合適的樣本進行比較詳細的調查。特點是,適合用于對總體信息了解比較少的調查。概述多階抽樣(分段抽樣):按照元素的隸屬關系后層次關系,把抽38概述比率抽樣(PPS抽樣):就是將總體按一種準確的標準劃分出容量不等的具有相同標志的單位在總體中不同比率分配的樣本量進行的抽樣。特點是總體中含量大的部分被抽中的概率也大,可以提高樣本的代表性。概述比率抽樣(PPS抽樣):就是將總體按一種準確的標準劃分出39概述在抽樣調查的實際工作中,經常是要將幾種抽樣方法結合起來應用。比如,城市居民的收支調查,是將二重抽樣、多階段抽樣、分層抽樣、機械抽樣等多種方法結合起來使用。
在現實的商業性的市場調查中也有非概率抽樣的應用。如,配額抽樣、隨意抽樣、志愿者抽樣、判斷抽樣、修正的概率抽樣和滾雪球抽樣等等,由于這些抽樣方法容易出現偏差,所以只在對共性特別強的群體的商業性調查中應用。概述在抽樣調查的實際工作中,經常是要將幾種抽樣方法結合起來應40簡單隨機抽樣及SAS程序SAS系統中利用SURVEYSELECT過程步進行簡單隨機抽樣。SURVEYSELECT過程的語法格式如下:PROCSURVEYSELECTDATA=OUT=METHOD=SAMPSIZE=SAMPRATE=REP=SEED=NOPRINT;IDvariable;RUN;簡單隨機抽樣及SAS程序SAS系統中利用SURVEYSEL41簡單隨機抽樣及SAS程序DATA語句指定要分析的數據集名及一些選項;OUT選擇項指定輸出結果的SAS數據集名,用來保存抽樣輸出的結果;METHOD選擇項指定抽樣方法,其中SRS(simplerandomsampling)為簡單隨機抽樣,SYS(systemrandomsampling)為系統隨機抽樣,等等;SAMPSIZE選擇項指定需要抽樣的樣本量;簡單隨機抽樣及SAS程序DATA語句指定要分析的數據集名及一42簡單隨機抽樣及SAS程序REP選擇項指定可以重復抽樣的次數;SAMPRATE選擇項指定抽樣的比例;SEED選擇項指定產生隨機隨機數字的初始數,缺省是0或負值;NOPRINT選擇項指定不對輸出結果進行打印;ID語句指定數據集中需要包含的變量指標。簡單隨機抽樣及SAS程序REP選擇項指定可以重復抽樣的次數;43系統(機械、等距)抽樣及SAS程序把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。在SURVEYSELECT過程步中,只需要將METHOD選擇項設定為SYS(systematicrandomsampling)即可,通過CONTROL語句設定某個變量作為抽樣距離參考變量,即抽樣之前按照CONTROL變量對原始樣本進行排序,然后按照規定的樣本量確定抽樣距離,隨機選取第一個樣本并進行系統抽樣。系統(機械、等距)抽樣及SAS程序把總體的單位進行排序,再44整群抽樣及SAS程序整群抽樣抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內的所有元素構成調查的樣本。把“成群的個體”當作個體來看待,那么整群抽樣與簡單隨機抽樣的原理就是一樣的。整群抽樣及SAS程序整群抽樣抽樣的單位不是單個的個體,而是45多階抽樣及SAS程序是將總體分成若干小的群體,但并不在每一小的群體中抽取一個樣本,而是將這些小群體稱為第一性抽樣單元,將它們看作個體進行抽樣,然后,再對抽中的第一性抽樣單元中的個體抽樣,這樣的抽樣當然可以不止二階而是多階的,先抽第一性樣單元,再在第一性樣單元鐘抽第二性樣單元,再在第二性樣單元中抽第三性樣單元,如此直至最基層的個體。多階抽樣及SAS程序是將總體分成若干小的群體,但并不在每一46多階抽樣及SAS程序當總體中個體數量太大,或其他技術上的原因,無法直接對個體編號時,可以采用多階抽樣,先按第一性單元編號,抽取若干個,再在抽得的第一性單元內編號,抽取下一級單元。多階抽樣會使現場觀測的樣本單元比較集中,有利于節省調查費用。多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 裝修售后協議書合同書范例二零二五年
- 2025網絡安全工程師聘用合同
- 2025年合同解除中的損害賠償問題研究
- 2025級瀝青混凝土生產加工合同
- 游戲業未來探索
- 2025年二手車銷售代理合同范本
- 2025網絡安全維護合同范文參考
- 英語口語精通之路
- 2025版最簡化租房合同范本
- 引領技術未來
- 2024年吉林省高職高專單招考試數學卷試題真題(含答案)
- (一模)2025年廣東省高三高考模擬測試 (一) 歷史試卷(含官方答案及詳解)
- 龍門吊安裝、拆卸工程安全監理實施細則
- 中醫康復理療師職業道德試題及答案引導
- (3月省質檢)福建省2025屆高三畢業班適應性練習卷語文試卷(含答案)
- TSSITS 2006-2024 面向特定場景低速自動駕駛產品準入及運營規范
- 2025年正式的勞動合同模板
- 水泥機械傷害的預防措施
- 2023九年級數學下冊 第二十八章 銳角三角函數28.2 解直角三角形及其應用28.2.2 應用舉例第2課時 方向角和坡角問題說課稿 (新版)新人教版
- 智能投顧發展態勢-深度研究
- YY/T 1938-2024醫用透明質酸鈉敷料
評論
0/150
提交評論