參數估計社會統計學課件_第1頁
參數估計社會統計學課件_第2頁
參數估計社會統計學課件_第3頁
參數估計社會統計學課件_第4頁
參數估計社會統計學課件_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第九章參數估計

(Parameter’sestimation)

參數估計,通俗地說,就是根據抽樣結果來合理地、科學地估計總體的參數很可能是什么?或者在什么范圍。

點估計:根據樣本數據算出一個單一的估計值,用來估計總體的參數值。

區間估計:計算抽樣平均誤差,指出估計的可信程度,進而在點估計的基礎上,確定總體參數的所在范圍或區間。第九章參數估計

(Parameter’sest第一節點估計(Pointestimation)

點估計:點值估計,是以一個最適當的樣本統計值來代表總體參數值。估計量如果具有無偏性、一致性和有效性,就可以認為這種統計量是總體參數的合理估計或最佳估計。第一節點估計(Pointestimation)一、求點估計值的標準

無偏性:要求統計量抽樣分布的均值恰好等于被估計的參數之值。比如,中心極限定理告訴我們,樣本均值抽樣分布的均值恰好等于總體均值,因此用樣本均值估計總體均值就滿足這個標準。

有效性:要求估計值的抽樣分布有較小的分散性,即選擇抽樣分布的標準差較小的統計量作為估計量。

一致性:要求統計量隨著樣本容量n的增大以更大的概率接近被估計參數。一、求點估計值的標準

在統計學中,常常用符號“”來表示無偏估計量。數學上可以證明,對于隨機樣本而言,才是總體方差的無偏估計量,它稱為修正樣本方差。

二、點估計值的計算1.總體均值的點估計2.總體方差的點估計值在統計學中,常常用符號“”來[例]研究者要調查某社區居民家庭收入分布的差異情況,現隨機抽查了10戶,得到樣本方差為=200(元2)。試以此資料估計總體家庭收入分布的差異情況。

[解]因為樣本容量較小,宜用修正樣本方差作為總體方差點估計量。即

===222.2[例]研究者要調查某社區居民家庭收入分第二節區間估計(Intervalestimation)一、有關區間估計的幾個概念1.置信區間:區間估計是求所謂置信區間的方法。置信區間就是我們為了增加參數被估計到的信心而在點估計兩邊設置的估計區間。2.顯著性水平:用置信區間來估計的不可靠程度。區間估計的任務是,在點估計值的兩側設置一個區間,使得總體參數被估計到的概率大大增加。可靠性和精確性(即信度和效度)在區間估計中是相互矛盾的兩個方面。

第二節區間估計(Intervalestimation)3.置信度(水平):用置信區間估計的可靠性(把握度)4.抽樣平均誤差與概率度Z抽樣平均誤差:樣本均值抽樣分布的標準差。反映在參數周圍抽樣平均值的平均變異程度。越大,樣本均值越分散。概率度:Z在參數估計中被稱為概率度,其大小由

決定.3.置信度(水平):用置信區間估計的可靠性顯著性水平、置信水平、概率度之間的關系:=0.10時,=0.90,Zα/2=1.65=0.05時,=0.95,Zα/2=1.96=0.01時,=0.99,Zα/2=2.58顯著性水平、置信水平、概率度二、區間估計的做法從點估計值開始,向兩側展開一定倍數的抽樣平均誤差,并估計總體參數很可能就包含在這個區間之內。二、區間估計的做法對參數的區間估計的步驟:1.首先從總體抽取一個樣本,根據收集的樣本資料求出它的均值。2.根據合乎實際的置信水平查表求得概率度3.根據總體標準差和樣本容量求出抽樣平均誤差4.以均值為基準,向兩側展開倍抽樣平均誤差的區間。抽樣極限誤差(更普遍地可以寫成抽樣估計的允許誤差

)抽樣估計的精度對參數的區間估計的步驟:三、大樣本,總體均值的區間估計(根據總體方差是否知道,估計分兩種情況)1.已知2.未知,用代替三、大樣本,總體均值的區間估計[例]設某工廠婦女從事家務勞動服從正態分布[,0.662],根據36人的隨機抽樣調查,樣本每天平均從事家務勞動的時間為2.65小時,求的置信區間(置信度=0.95)。[解]按題意,此為大樣本,且總體方差已知,又=36,=2.65,=0.66,=0.95。查表得=1.96,代入公式有=2.65±1.96=2.65±0.22因此,有95%的把握,該廠婦女的平均從事家務勞動的時間在2.87~2.43小時之間。[例]設某工廠婦女從事家務勞動服從正從來自在“白領犯罪與罪犯生涯:一些初步研究結果”的一項研究報告的數據表明,白領犯罪可能是年紀較大者,并且顯示比街頭罪犯有較低的犯罪率。給出數據為:白領犯罪發作平均年齡為54歲,=100,標準差被估計為7.5歲。建立真實平均年齡的90%置信區間。從來自在“白領犯罪與罪犯生涯:一些初步[例]從某校隨機地抽取100名男學生,測得平均身高為170厘米,標準差為7.5厘米,試求該校學生平均身高95%的置信區間。[解]按題意,此為大樣本,且總體方差未知,又=100,=170,=7.5,=0.95.查表得=1.96,代入公式有=170±1.96=170±1.47因此,有95%的把握,該校學生的平均身高在168.5~171.5厘米之間。[例]從某校隨機地抽取100名男學生,測得1.小樣本,且為正態總體,總體均值的區間估計(用分布)第三節其他類型的置信區間

第三節其他類型的置信區間[例]在一個正態總體中抽取一個容量為25的樣本,其均值為52,標準差為12,求置信水平為95%的總體均值的置信區間。

[解]根據題意,總體方差未知,且為小樣本,故用分布統計量。由95%置信水平查分布表得概率度=(24)=2.064代入公式得=52±2.064=52±5.06因此,置信水平95%的總體均值的置信區間是從46.94到57.06。[例]在一個正態總體中抽取一個容2.大樣本總體成數的估計從總體的均值估計過渡到總體的成數估計,其方法和思路完全相同,只要用代替,用代替

若總體成數未知,允許誤差取或

2.大樣本總體成數的估計[例]假若從某社區抽取一個由200個家庭組成的樣本,發現其中有36%的家庭由丈夫在家庭開支上作決定的次數超過半數。試問家庭開支的半數以上由丈夫決定的家庭的置信區間是多少?(置信水平99%)[解法一][解法二][例]假若從某社區抽取一個由200個家庭組成三、總體方差的區間估計由第八章分布的性質,我們知道有因此,對于給定的置信水平,總體方差的區間估計為

三、總體方差的區間估計

[例]

研究者調查某社區居民家庭收入情況,現隨機抽查了10戶,得到樣本方差為S=200(元2),試以90%的置信水平估計居民總體家庭收入之方差的置信區間。[解]根據題意,查分布表得==3.325

==16.919代入公式有

≤≤所以該社區居民收入之方差90%置信水平的置信區間為118.2~601.5(元2)。[例]研究者調查某社區居民家庭收入情況,第四節抽樣平均誤差1.簡單隨機抽樣回置抽樣不回置抽樣校正因子主要用于總體不夠大時。第四節抽樣平均誤差1.簡單隨機抽樣抽樣設計效果指標deffDeff<1,說明該抽樣方式誤差小于簡單隨機抽樣抽樣設計效果指標deff2.分層抽樣層內方差的平均(層間方差不進入):回置抽樣:不回置抽樣2.分層抽樣3.整群抽樣總體可看作是以群為單位的簡單隨機抽樣。群間方差(群內方差不進入):整群抽樣平均誤差:3.整群抽樣第五節樣本容量的確定回置:不回置:第五節樣本容量的確定回置:設某市家庭月戶均收入服從正態分布,標準差為160元,現要對該市家庭之月平均收入加以估計,(1)若置信水平為95%,平均收入的最大誤差在10元以內,問樣本容量為多少?(2)若置信水平為90%,平均收入的最大誤差在10元以內,問樣本容量為多少?(3)若置信水平為99%,平均收入的最大誤差在10元以內,問樣本容量為多少?(4)若置信水平為95%,平均收入的最大誤差在20元以內,問樣本容量為多少?(5)改變最大誤差,對樣本大小有什么影響?(6)改變置信水平,對樣本大小有什么影響?

(983,697,1704,246)設某市家庭月戶均收入服從正態分布,標準差為練習1、根據居民100戶抽樣家計調查,居民用于食品費用占總收入的比例平均為45%,比例的標準差為20%。求食品費用占居民總收入比例的區間估計(置信度為95%)。2、根據某大學100名學生的抽樣調查,每月平均用于購買書籍的費用為4.5元,標準差為5元,求大學生每月用于購買書籍費用的區間估計(置信度為95%)。3、某工廠根據200名青年職工的抽樣調查,其中60%參加各種形式的業余學習。求青年職工參加業余學習比例的區間估計(置信度為95%)。(0.41,0.49)(3.52,5.48)(0.54,0.66)練習1、根據居民100戶抽樣家計調查,居民用4、從7225名社區居民中以不回置法抽取500成人的調查顯示,51%的回答者認為“父母在必要時應該打小孩”。盡管大部分兒童成長專家說,打是不恰當的。請指出在置信水平為99%時成人總體參數的估計的最大誤差。5、進行電話調查來估計有個人電腦的住戶的比例。被調查的350戶中,75戶有個人電腦。(1)給出有個人電腦的總體比例的點估計;(2)給出95%的置信度時估計的最大誤差。4、從7225名社區居民中以不回置法抽取5第九章參數估計

(Parameter’sestimation)

參數估計,通俗地說,就是根據抽樣結果來合理地、科學地估計總體的參數很可能是什么?或者在什么范圍。

點估計:根據樣本數據算出一個單一的估計值,用來估計總體的參數值。

區間估計:計算抽樣平均誤差,指出估計的可信程度,進而在點估計的基礎上,確定總體參數的所在范圍或區間。第九章參數估計

(Parameter’sest第一節點估計(Pointestimation)

點估計:點值估計,是以一個最適當的樣本統計值來代表總體參數值。估計量如果具有無偏性、一致性和有效性,就可以認為這種統計量是總體參數的合理估計或最佳估計。第一節點估計(Pointestimation)一、求點估計值的標準

無偏性:要求統計量抽樣分布的均值恰好等于被估計的參數之值。比如,中心極限定理告訴我們,樣本均值抽樣分布的均值恰好等于總體均值,因此用樣本均值估計總體均值就滿足這個標準。

有效性:要求估計值的抽樣分布有較小的分散性,即選擇抽樣分布的標準差較小的統計量作為估計量。

一致性:要求統計量隨著樣本容量n的增大以更大的概率接近被估計參數。一、求點估計值的標準

在統計學中,常常用符號“”來表示無偏估計量。數學上可以證明,對于隨機樣本而言,才是總體方差的無偏估計量,它稱為修正樣本方差。

二、點估計值的計算1.總體均值的點估計2.總體方差的點估計值在統計學中,常常用符號“”來[例]研究者要調查某社區居民家庭收入分布的差異情況,現隨機抽查了10戶,得到樣本方差為=200(元2)。試以此資料估計總體家庭收入分布的差異情況。

[解]因為樣本容量較小,宜用修正樣本方差作為總體方差點估計量。即

===222.2[例]研究者要調查某社區居民家庭收入分第二節區間估計(Intervalestimation)一、有關區間估計的幾個概念1.置信區間:區間估計是求所謂置信區間的方法。置信區間就是我們為了增加參數被估計到的信心而在點估計兩邊設置的估計區間。2.顯著性水平:用置信區間來估計的不可靠程度。區間估計的任務是,在點估計值的兩側設置一個區間,使得總體參數被估計到的概率大大增加。可靠性和精確性(即信度和效度)在區間估計中是相互矛盾的兩個方面。

第二節區間估計(Intervalestimation)3.置信度(水平):用置信區間估計的可靠性(把握度)4.抽樣平均誤差與概率度Z抽樣平均誤差:樣本均值抽樣分布的標準差。反映在參數周圍抽樣平均值的平均變異程度。越大,樣本均值越分散。概率度:Z在參數估計中被稱為概率度,其大小由

決定.3.置信度(水平):用置信區間估計的可靠性顯著性水平、置信水平、概率度之間的關系:=0.10時,=0.90,Zα/2=1.65=0.05時,=0.95,Zα/2=1.96=0.01時,=0.99,Zα/2=2.58顯著性水平、置信水平、概率度二、區間估計的做法從點估計值開始,向兩側展開一定倍數的抽樣平均誤差,并估計總體參數很可能就包含在這個區間之內。二、區間估計的做法對參數的區間估計的步驟:1.首先從總體抽取一個樣本,根據收集的樣本資料求出它的均值。2.根據合乎實際的置信水平查表求得概率度3.根據總體標準差和樣本容量求出抽樣平均誤差4.以均值為基準,向兩側展開倍抽樣平均誤差的區間。抽樣極限誤差(更普遍地可以寫成抽樣估計的允許誤差

)抽樣估計的精度對參數的區間估計的步驟:三、大樣本,總體均值的區間估計(根據總體方差是否知道,估計分兩種情況)1.已知2.未知,用代替三、大樣本,總體均值的區間估計[例]設某工廠婦女從事家務勞動服從正態分布[,0.662],根據36人的隨機抽樣調查,樣本每天平均從事家務勞動的時間為2.65小時,求的置信區間(置信度=0.95)。[解]按題意,此為大樣本,且總體方差已知,又=36,=2.65,=0.66,=0.95。查表得=1.96,代入公式有=2.65±1.96=2.65±0.22因此,有95%的把握,該廠婦女的平均從事家務勞動的時間在2.87~2.43小時之間。[例]設某工廠婦女從事家務勞動服從正從來自在“白領犯罪與罪犯生涯:一些初步研究結果”的一項研究報告的數據表明,白領犯罪可能是年紀較大者,并且顯示比街頭罪犯有較低的犯罪率。給出數據為:白領犯罪發作平均年齡為54歲,=100,標準差被估計為7.5歲。建立真實平均年齡的90%置信區間。從來自在“白領犯罪與罪犯生涯:一些初步[例]從某校隨機地抽取100名男學生,測得平均身高為170厘米,標準差為7.5厘米,試求該校學生平均身高95%的置信區間。[解]按題意,此為大樣本,且總體方差未知,又=100,=170,=7.5,=0.95.查表得=1.96,代入公式有=170±1.96=170±1.47因此,有95%的把握,該校學生的平均身高在168.5~171.5厘米之間。[例]從某校隨機地抽取100名男學生,測得1.小樣本,且為正態總體,總體均值的區間估計(用分布)第三節其他類型的置信區間

第三節其他類型的置信區間[例]在一個正態總體中抽取一個容量為25的樣本,其均值為52,標準差為12,求置信水平為95%的總體均值的置信區間。

[解]根據題意,總體方差未知,且為小樣本,故用分布統計量。由95%置信水平查分布表得概率度=(24)=2.064代入公式得=52±2.064=52±5.06因此,置信水平95%的總體均值的置信區間是從46.94到57.06。[例]在一個正態總體中抽取一個容2.大樣本總體成數的估計從總體的均值估計過渡到總體的成數估計,其方法和思路完全相同,只要用代替,用代替

若總體成數未知,允許誤差取或

2.大樣本總體成數的估計[例]假若從某社區抽取一個由200個家庭組成的樣本,發現其中有36%的家庭由丈夫在家庭開支上作決定的次數超過半數。試問家庭開支的半數以上由丈夫決定的家庭的置信區間是多少?(置信水平99%)[解法一][解法二][例]假若從某社區抽取一個由200個家庭組成三、總體方差的區間估計由第八章分布的性質,我們知道有因此,對于給定的置信水平,總體方差的區間估計為

三、總體方差的區間估計

[例]

研究者調查某社區居民家庭收入情況,現隨機抽查了10戶,得到樣本方差為S=200(元2),試以90%的置信水平估計居民總體家庭收入之方差的置信區間。[解]根據題意,查分布表得==3.325

==16.919代入公式有

≤≤所以該社區居民收入之方差90%置信水平的置信區間為118.2~601.5(元2)。[例]研究者調查某社區居民家庭收入情況,第四節抽樣平均誤差1.簡單隨機抽樣回置抽樣不回置抽樣校正因子主要用于總體不夠大時。第四節抽樣平均誤差1.簡單隨機抽樣抽樣設計效果指標deffDeff<1,說明該抽樣方式誤差小于簡單隨機抽樣抽樣設計效果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論