




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
管理統計學畢德春遼東學院信息技術學院管理統計學畢德春遼東學院信息技術學院1第6章
抽樣與抽樣分布第6章抽樣與抽樣分布2第1節抽樣方法第1節抽樣方法3第6章第1節
抽樣方法關于抽樣的基礎概念1總體(population)所研究的全部個體(數據)的集合,其中的每一個元素稱為個體,總體中所包含的元素數量多少稱為總體容量,用N表示。有限總體有限總體的范圍能夠明確確定,且元素的數目是有限的1無限總體無限總體所包括的元素是無限的,不可數的2第6章第1節抽樣方法關于抽樣的基礎概念1總體(popula第6章第1節
抽樣方法關于抽樣的基礎概念1什么才是好的抽樣?有足夠的代表性符合統計學基本原理具有充分的可操作性有效率的實施/執行中的偏差越小越好第6章第1節抽樣方法關于抽樣的基礎概念1什么才是好的抽樣?5從理論上講,樣本數越大,抽樣誤差越小,結果的代表性越好。但是,同時考慮費用和時間因素,大樣本量不一定是最有效率的辦法。在隨機抽樣條件下,不同樣本規模的抽樣誤差如下:
第6章第1節
抽樣方法關于抽樣的基礎概念1樣本量的選取置信度樣本量80%90%95%99%1505.23%6.72%8.00%10.52%2004.53%5.82%6.93%9.11%2504.05%5.20%6.20%8.15%3003.70%4.75%5.66%7.44%5002.87%3.68%4.38%5.76%從理論上講,樣本數越大,抽樣誤差越小,結果的代表性越好。但是6樣本(sample)從總體中抽取的一部分元素的集合,構成樣本的元素數目稱為樣本容量,用n表示。第6章第1節
抽樣方法關于抽樣的基礎概念1=<30小樣本>30大樣本樣本(sample)從總體中抽取的一部分元素的集合,構成樣本7參數(parameter)描述總體特征的概括性數字度量,是研究者想要了解的總體的某種特征值,所關心的參數主要有總體均值()、標準差()、總體比例()等,總體參數通常用希臘字母表示。第6章第1節
抽樣方法關于抽樣的基礎概念1πμσ總體均值標準差總體比例參數(parameter)描述總體特征的概括性數字度量,是研8統計量(statistic)用來描述樣本特征的概括性數字度量,它是根據樣本數據計算出來的一些量,是樣本的函數,所關心的樣本統計量有樣本均值(x)、樣本標準差(s)、樣本比例(p)等,樣本統計量通常用小寫英文字母表示。第6章第1節
抽樣方法關于抽樣的基礎概念1pxs樣本均值樣本標準差樣本比例統計量(statistic)用來描述樣本特征的概括性數字度量9總體參數樣本統計量第6章第1節
抽樣方法關于抽樣的基礎概念1抽樣推斷的過程總體參數樣本統計量第6章第1節抽樣方法關于抽樣的基礎概念110抽樣方法概率抽樣非概率抽樣多階段抽樣整群抽樣系統抽樣自愿抽樣配額抽樣簡單隨機抽樣分層抽樣方便抽樣判斷抽樣滾雪球抽樣抽樣第6章第1節
抽樣方法關于抽樣的方法2抽樣方法概率抽樣非概率抽樣多階段抽樣整群抽樣系統抽樣自愿抽樣11第6章第1節
抽樣方法關于抽樣的方法2概率抽樣非概率抽樣概率抽樣也稱隨機抽樣,是按照隨機原則抽選樣本的抽樣方式,抽樣時每個樣本單位被選中的概率是已知。不滿足概率抽樣要求的抽樣都被歸為非概率抽樣。非概率抽樣單個單位被選中的概率是不可知的第6章第1節抽樣方法關于抽樣的方法2概率抽樣非概率抽樣概率12簡單隨機抽樣(SimpleRandomSampling)也稱純隨機抽樣。直接從總體單位中抽選樣本單位,每個個體被選入樣本的概率都相等。可分為有放回和無放回兩種方式。是最基本的抽樣方法,許多抽樣方法都是在它的基礎上發展起來的。其數學性質簡單,理論也最為成熟。第6章第1節
抽樣方法關于抽樣的方法2簡單隨機抽樣(SimpleRandomSampli13整群抽樣(ClusterSampling)先將總體分為R個群(即次級單位或子總體),每個群包含若干總體單位。按某種方式從中隨機抽取r個群,然后對抽中的群的所有單位都進行調查的抽樣方式。總體分成4個群隨機選擇2個群構成樣本第6章第1節
抽樣方法關于抽樣的方法2整群抽樣(ClusterSampling)先將總體分為14多階段抽樣先從總體中隨機地抽取若干初級單位,再從初級單位中抽取若干二級單位,……如此下去直至抽取所要調查的基本單位的抽樣方法。例:[統計年鑒2004指出]2003年人口變動情況抽樣調查是以全國為總體,各省、自治區、直轄市為次總體,采用分層、等距、整群抽樣方法,在全國31個省、自治區、直轄市抽取了990個縣(市、區)、3734個鄉(鎮、街道)、6544個調查小區的126萬人。第6章第1節
抽樣方法關于抽樣的方法2多階段抽樣先從總體中隨機地抽取若干初級單位,再從初級單位中抽15分層抽樣(StratifiedSampling)也稱分類抽樣或類型抽樣。即先將總體所有單位按某種標志劃分為若干層,然后從各層中隨機抽取一定數目的單位構成樣本,根據各層樣本匯總對總體指標作出估計的一種抽樣方式。男生女生樣本第6章第1節
抽樣方法關于抽樣的方法2分層抽樣(StratifiedSampling)也稱分類16例:一個單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關指標,從中抽取100名職工作為樣本,應該怎樣抽取?第6章第1節
抽樣方法關于抽樣的方法2分析:這總體具有某些特征,它可以分成幾個不同的部分:不到35歲;35~49歲;50歲以上,把每一部分稱為一個層,因此該總體可以分為3個層。由于抽取的樣本為100,所以必須確定每一層的比例,在每一個層中實行簡單隨機抽樣。例:一個單位的職工有500人,其中不到35歲的有125人,317解:抽取人數與職工總數的比是100:500=1:5,則各年齡段(層)的職工人數依次是125:280:95=25:56:19,然后分別在各年齡段(層)運用簡單隨機抽樣方法抽取。答:在分層抽樣時,不到35歲、35~49歲、50歲以上的三個年齡段分別抽取25人、56人和19人。第6章第1節
抽樣方法關于抽樣的方法2解:抽取人數與職工總數的比是100:500=1:5,則各年齡1819系統抽樣也稱等距抽樣(SystematicSampling)將總體N個單位按某種順序排列,按規則確定一個隨機起點,再每隔一定間隔逐個抽取樣本單位的抽樣方法。直線等距抽樣:將總體分成n個組,每組有k=N/n個單位。在第一組隨機選擇一個單位,之后每隔k個選擇一個。N=64n=8k=8第一組第6章第1節
抽樣方法關于抽樣的方法219系統抽樣也稱等距抽樣(SystematicSampl例:一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐滿了聽眾。會后為聽取意見留下了座位號為20的30名聽眾進行座談。這里選用了哪種抽取樣本的方法?寫出抽取過程。第6章第1節
抽樣方法關于抽樣的方法2由于每排的座位有40個,各排每個號碼被抽取的概率都是,第1排被抽取前,其他各排中各號碼被抽取哪率也是,也就是說被抽取的概率是,每排的抽樣也是簡單隨機抽樣,因此這種抽樣的方法是系統抽樣。例:一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐20方便抽樣(Conveniencesampling)純粹以方便基本著眼的抽樣方法,事先不預定樣本,碰到即問或被調查者主動回答問題。又稱便利抽樣、偶遇抽樣。例:在街頭的攔截式訪問。登在報刊、網上的問卷。第6章第1節
抽樣方法關于抽樣的方法2方便抽樣(Conveniencesampling)純粹以方21判斷抽樣(JudgmentSampling)調查者根據主觀經驗和判斷從總體中選取有代表性的單位構成樣本。精度取決于抽樣者的經驗。不能獲得估計值的精度。適用于總體單位極不相同而樣本容量又很小的情況第6章第1節
抽樣方法關于抽樣的方法2判斷抽樣(JudgmentSampling)調查者根據主22配額抽樣(Quotasampling)是非隨機抽樣方法中最常用的一種抽樣方法。分為兩個步驟:根據研究人員認為較重要的一些變量把總體單位分類,指定每一類中的定額;然后在每一類中使用方便抽樣或判斷抽樣的方法抽選指定數量的樣本單位。問題:與分層抽樣的區別?第6章第1節
抽樣方法關于抽樣的方法2配額抽樣(Quotasampling)是非隨機抽樣方法中23雪球抽樣也譯為滾雪球抽樣(SnowballSampling)其原理是先找到最初的樣本單位,然后根據他們提供的信息去獲得新的樣本單位;這種過程不斷繼續,直到完成規定的樣本容量為止。主要用于對稀少群體的調查。例:某研究部門在調查保姆問題時,先訪問了7名保姆,然后再請她們提供其他保姆名單,逐步擴大到近百人。第6章第1節
抽樣方法關于抽樣的方法2雪球抽樣也譯為滾雪球抽樣(SnowballSampli24在下列問題中,各采用什么抽樣方法抽取樣本較合適?從20臺電腦中抽取4臺進行質量檢測;從2004名同學中,抽取一個容量為20的樣本某中學有180名教工,其中業務人員136名,管理人員20名,后勤人員24名,從中抽取一個容量為15的樣本。簡單抽樣系統抽樣分層抽樣第6章第1節
抽樣方法關于抽樣的方法2在下列問題中,各采用什么抽樣方法抽取樣本較合適?從20臺電腦25抽樣調查中的誤差抽樣誤差非抽樣誤差計量誤差抽樣框誤差無回答誤差第6章第1節
抽樣方法抽樣調查中的誤差3抽樣調查中的誤差抽樣誤差非抽樣誤差計量誤差抽樣框誤差無回答誤26誤差是指估計值與真實值之間的差異。抽樣誤差(Samplingerror):由于抽選樣本的隨機性造成的誤差,也稱為代表性誤差。樣本只是總體的一部分,它對總體的代表性存在局限性,從而會造成誤差。在抽樣調查中,抽樣誤差就不可避免。在概率抽樣中抽樣誤差是能夠計量且可以得到控制的。影響抽樣誤差的主要因素包括:總體內部的差異程度;樣本容量的大小;抽樣的方式方法等。第6章第1節
抽樣方法抽樣調查中的誤差3誤差是指估計值與真實值之間的差異。第6章第1節抽樣方法抽樣27非抽樣誤差(Nonsamplingerror)除抽樣誤差以外的所有誤差。通常認為是由于調查程序執行中的錯誤與不足引起的。主要包括抽樣框誤差、無回答誤差和計量誤差。國內也稱為“工作誤差”或“調查誤差”。
第6章第1節
抽樣方法抽樣調查中的誤差3非抽樣誤差(Nonsamplingerror)除抽樣誤差以28在抽樣調查中可以把總體分成若干個互不重疊又窮盡的有限個部分,每個部分稱為一個抽樣單位(Samplingunit)。抽樣單位可以是一個總體單位,也可以包含多個個體。抽樣單位的名單稱為抽樣框(SamplingFrame)。抽樣框應盡可能與目標總體相一致。例如名單抽樣框、區域抽樣框、時間表抽樣框。
第6章第1節
抽樣方法抽樣調查中的誤差3在抽樣調查中可以把總體分成若干個互不重疊又窮盡的有限個部分,29大學學生花名冊、城市黃頁里的電話列表、工商企業名錄、街道派出所里居民戶籍冊、意向購房人信息冊……。例:要從10000名職工中抽出200名組成一個樣本,抽樣框是什么?10000名職工的名冊第6章第1節
抽樣方法抽樣調查中的誤差3大學學生花名冊、城市黃頁里的電話列表、工商企業名錄、街道派出30抽樣框誤差(samplingframeerror,CoverageError)當目標總體與抽樣框所涵蓋的元素不一致時,就會產生抽樣誤差。抽樣框誤差包括:丟失目標總體單位、包含非目標總體單位,復合連接等。第6章第1節
抽樣方法抽樣調查中的誤差3抽樣框誤差(samplingframeerror,C31案例:《文學摘要》民意測驗1936年美國總統選舉F.D.Roosevelt(羅斯福)任美國總統的第一任期屆滿(民主黨)A.Landon(蘭登)Kansas州州長(共和黨)經濟背景:國家正努力從大蕭條中恢復,失業人數高達九百萬人。TheliteraryDigest《文學摘要》進行民意測驗,將問卷郵寄給一千萬人,他們的名字和地址摘自電話簿或俱樂部會員名冊。其中240萬人寄回答案(回收率24%)。預測結果:Roosevelt43%,Landon57%競選結果:
Roosevelt62%,Landon38%主要原因:選擇偏倚——將一類人排除在外(當時四個家庭中,只有一家安裝電話)不回答偏倚——低收入和高收入的人傾向不回答抽樣總體目標總體第6章第1節
抽樣方法抽樣調查中的誤差3案例:《文學摘要》民意測驗1936年美國總統選舉抽樣總體321936年美國總統競選(Gallup的預測)樣本容量3000人,在《摘要》公布其預測結果之前,僅以一個百分位數的誤差預言了《摘要》的預測結果。方法:從《摘要》要用的名單中隨機選取3000人,并給他們每人寄去一張明信片,詢問他們打算怎樣投票。大樣本并不能防止偏倚:當抽樣框不正確時,抽取一個大的樣本并無幫助,它只不過是在較大的規模下,去重復基本錯誤。利用一個約5萬人的樣本,正確地預測了Roosevelt的勝利。
Roosevelt的百分數蓋洛普預言《摘要》的預測結果44《摘要》預測的選舉結果43
Roosevelt的百分數蓋洛普預測的選舉結果56選舉結果62第6章第1節
抽樣方法抽樣調查中的誤差31936年美國總統競選(Gallup的預測)樣本容量300033無回答誤差(NonresponseError)因缺失部分指定樣本單位的數據或調查問卷中的部分數據項而引起的誤差都稱為無回答誤差。樣本個體拒絕訪問樣本個體無法接受訪問樣本個體拒絕回答部分問題第6章第1節
抽樣方法抽樣調查中的誤差3無回答誤差(NonresponseError)因缺失部分34計量誤差(MeasurementError)是指調查中獲得的數據與調查項目真實值之間不一致而產生的誤差,也稱為登記性誤差。測量工具不準確調查員的工作失誤(如計量錯誤、計算錯誤、記錄錯誤等)被調查者沒有提供真實情況第6章第1節
抽樣方法抽樣調查中的誤差3計量誤差(MeasurementError)是指調查中35第2節樣本均值的分布與中心極限定理第2節樣本均值的分布與中心極限定理36總體分布(populationdistribution)總體中各元素的觀察值所形成的分布。分布通常是未知的可以假定它服從某種分布總體第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1總體分布(populationdistribution)總37樣本分布(sampledistribution)一個樣本中各觀察值的分布,也稱經驗分布,是指當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。樣本第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1樣本分布(sampledistribution)一個樣本中38抽樣分布(SamplingDistribtuion)按照簡單隨機抽樣方法,從個數為N的總體中抽取容量為n的樣本,兩種抽法:放回抽樣:樣本個數為不放回抽樣:樣本個數為每一個可能的樣本都有一個對應的均值和標準差,那么所有樣本均值的分布就是樣本均值的抽樣分布,所有樣本的標準差的分布就是樣本標準差的抽樣分布。第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1抽樣分布(SamplingDistribtuion)按照簡39總體計算樣本統計量如:樣本均值、比例、方差樣本抽樣分布的形成過程第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1總體計算樣本統計量樣本抽樣分布的形成過程第6章第2節樣本均40樣本均值的抽樣分布在重復選取容量為n的樣本時,由樣本均值所有可能取值形成的相對頻數分布一種理論概率分布推斷總體均值的理論基礎 第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1樣本均值的抽樣分布在重復選取容量為n的樣本時,由樣本均值所有41例:設一個總體,含有4個元素(個體),即總體單位數N=4。4個個體分別為X1=1、X2=2、X3=3、X4=4。總體的均值、方差及分布如下均值和方差總體分布14230.1.2.3第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1例:設一個總體,含有4個元素(個體),即總體單位數N=4。442例:現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1例:現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共43計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.5344式中:M為樣本數目,比較及結論:
樣本均值的均值(數學期望)等于總體均值樣本均值的方差等于總體方差的1/n第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1式中:M為樣本數目,比較及結論:第6章第2節樣本均值的分45抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的分布與總體分布的比較第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1抽樣分布=2.5σ2=1.25總體分布14246例:設一個總體(比如擲骰子),含有6個元素(個體),即總體單位數N=6。6個個體分別為x1=1,x2=2,x3=3,x4=4,x5=5,x6=6。現從總體中抽取n=2的簡單隨機樣本,試比較總體分布和樣本均值分布。第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1例:設一個總體(比如擲骰子),含有6個元素(個體),即總體47解:總體的均值、方差及分布如下:第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1均值和方差解:總體的均值、方差及分布如下:第6章第2節樣本均值的分布48現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,有62=36個樣本。所有樣本的結果為:
第二觀察值第一觀察值1234561(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,有6249計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布
第二觀察值第一觀察值123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.5636個樣本的均值第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布第二觀50=3.5σ2=2.9=3.5σ2=1.45樣本均值的抽樣分布與總體分布的比較第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1=3.5=3.5樣本均值的抽樣分布與總體分布51=50σ2
=10X總體分布n=2抽樣分布Xn=4當總體服從正態分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態分布,X的數學期望為μ,方差為σ2/n。即X~N(μ,σ2/n)σ2
=5σ2
=2.5第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1=50σ2=10X總體分布n=2抽樣分布Xn=52當樣本容量足夠大時(n>30),樣本均值的抽樣分布逐漸趨于正態分布中心極限定理(centrallimittheorem)設從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態分布一個任意分布的總體X第6章第2節
樣本均值的分布與中心極限定理中心極限定理2當樣本容量足夠大時(n>30),樣本均值的抽樣分布逐漸趨53極限定理:簡單講,凡是采用極限的方法(例如,觀察次數n趨于無限)所得出的一系列定理統稱極限定理。極限定理分為兩類:大數定理(Lawoflargenumbers)中心極限定理(Centrallimittheorem)
第6章第2節
樣本均值的分布與中心極限定理中心極限定理2極限定理:簡單講,凡是采用極限的方法(例如,觀察次數n趨于無54中心極限定理(centrallimittheorem)說明,任何變量,不管其原有分布如何,如果把它們n個加在一起,只要n足夠大,其和的分布必然接近正態分布,均值的分布也接近正態分布。
第6章第2節
樣本均值的分布與中心極限定理中心極限定理2中心極限定理(centrallimittheorem)說55x的分布趨于正態分布的過程第6章第2節
樣本均值的分布與中心極限定理中心極限定理2x的分布趨于正態分布的過程第6章第2節樣本均值的分布與56為什么社會經濟生活、自然界存在許多隨機變量的分布都服從正態分布?請結合中心極限定理來解釋。第6章第2節
樣本均值的分布與中心極限定理中心極限定理2為什么社會經濟生活、自然界存在許多隨機變量的分布都服從正態分57如果一個現實的量是由大量獨立偶然的因素的影響疊加而得,且其中每一個偶然因素的影響又是均勻地微小的話,可以斷定這個量將近似地服從正態分布。這就解釋了為什么在自然、社會、經濟領域里大量存在服從正態分布的隨機變量。例如,身高、體重、智商、婚齡等等,因為影響它們的因素都是大量的。
第6章第2節
樣本均值的分布與中心極限定理中心極限定理2如果一個現實的量是由大量獨立偶然的因素的影響疊加而得,且其中58抽樣分布與總體分布的關系從正態總體中抽取的全部可能樣本,無論樣本容量有多大,樣本平均數的抽樣分布必定遵從于正態分布;如果是從非正態總體中抽樣,只要n≥30,樣本均值的抽樣分布必定趨近于正態分布;第6章第2節
樣本均值的分布與中心極限定理中心極限定理2抽樣分布與總體分布的關系從正態總體中抽取的全部可能樣本,無論59對稱鐘形分布中的3σ法則3σ法則——關于鐘形分布的一個近似的或經驗的法則:變量值落在[-3σ,+3σ]范圍以外的情況極為少見。因此通常將落在區間[-3σ,+3σ]之外的數據稱為異常數據或稱為離群點。x99.73%68.27%95.45%第6章第2節
樣本均值的分布與中心極限定理中心極限定理2對稱鐘形分布中的3σ法則3σ法則——關于鐘形分布的一個近似60正態分布非正態分布大樣本小樣本大樣本小樣本總體分布正態分布正態分布正態分布第6章第2節
樣本均值的分布與中心極限定理中心極限定理2正態分布非正態分布大樣本小樣本大樣本小樣本總體分布正態分布正61例:每到臨近重大節日,為了滿足巨大的市場需要,副食品加工廠提高了對于食品的生產規模,而此時工廠的質量管理人員,對工廠生產的副食品進行質量檢驗,檢驗的指標中主要是某個硝酸鹽的NO(<45mg/kg)指標是否超標,一個生產商聲明自己的食品中NO的含量為43mg/kg,標準差為8mg。假設質量監督機構決定抽取40個樣本來檢測含量,來進行核實。假設如下:(1)建設這個生產商所言是真實的,嘗試描述這40個樣本的平均NO含量的抽樣分布;(2)假設這個生產商的包裝說明是真實的,則質監部門抽取的樣本硝酸鹽含量等于45mg的概率是多少?第6章第2節
樣本均值的分布與中心極限定理中心極限定理2例:每到臨近重大節日,為了滿足巨大的市場需要,副食品加工廠提62解:(1)盡管我們沒有總體分布信息,但是根據中心極限定理推斷:對著這40個樣本來說,平均的NO含量的抽樣分布是近似正態分布的。因此這批樣本的均值與總體的均值是相同的。根據生產商的聲明,平均含量為43mg,方差為5mg,則樣本方差為:如果我們假設此聲明是真實的,則這40個樣本平均壽命的抽樣分布如下圖所示:第6章第2節
樣本均值的分布與中心極限定理中心極限定理2解:(1)盡管我們沒有總體分布信息,但是根據中心極限定理推斷63(2)假設生產商聲稱的是真實的,則對于其40個樣本來說,硝酸鹽含量大于等于45mg/kg的概率P(x>=45)計算公式如下:可以算出來z(2.53)=0.9943,即根據生產商的聲明,硝酸鹽含量高于45mg的概率為1-0.9943=0.0057,因此根據這個結果.該食品在此次抽樣中出現硝酸鹽含量超標的可能性為極小概率事件,如果此次樣本抽查出其中一個出現超標(1/40=0.025),則有理由認為該廠生產的食品不合格。第6章第2節
樣本均值的分布與中心極限定理中心極限定理2(2)假設生產商聲稱的是真實的,則對于其40個樣本來說,硝酸64例:在一次研究某一企業職工收入情況的調查中,準備從該企業隨機抽取100個職工個人的收入狀況數據構成樣本,以此推斷該企業職工平均月收入。若該企業職工平均月收入的總體均值為2000元,總體標準差為為250元,試計算樣本均值不小于1950元的概率。第6章第2節
樣本均值的分布與中心極限定理中心極限定理2例:在一次研究某一企業職工收入情況的調查中,準備從該企業隨機65解:根據中心極限定理,在樣本容量充分大時,樣本均值漸進地趨于數學期望為總體均值,方差為總體方差的n分之一的正態分布,有本例的樣本均值漸進地趨于數學期望為2000元,標準差為25的正態分布,即。代入正態分布概率計算公式,得
即樣本均值不小于1950元的概率為97.7%。(查表)第6章第2節
樣本均值的分布與中心極限定理中心極限定理2解:根據中心極限定理,在樣本容量充分大時,樣本均值漸進地趨于66σx=均值的標準誤
σ=個體標準差n=均值的樣本容量樣本均值的標準差小于總體標準差,且隨著樣本容量的增加減小,這也正是抽樣平均誤差的度量。第6章第2節
樣本均值的分布與中心極限定理中心極限定理2σx=均值的標準誤σ=個體標準差n=均值的樣本容量67樣本均值的數學期望樣本均值的方差重復抽樣不重復抽樣樣本均值的抽樣分布(數學期望與方差)第6章第2節
樣本均值的分布與中心極限定理中心極限定理2樣本均值的數學期望樣本均值的抽樣分布(數學期望與方差)第6章68樣本方差的分布:在重復選取容量為的樣本時,由樣本方差的所有可能取值形成的相對頻數分布。對于來自正態總體的簡單隨機樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3樣本方差的分布:在重復選取容量為的樣本時,由樣本方差的所有可69設總體服從正態分布N~(μ,σ2),X1,X2,…,Xn為來自該正態總體的樣本,則樣本方差s2的分布為將2(n–1)稱為自由度為(n-1)的卡方分布第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3設總體服從正態分布N~(μ,σ2),X1,X2,…,70兩個總體都為正態分布,即,兩個樣本均值之差的抽樣分布服從正態分布,其分布的數學期望為兩個總體均值之差方差為各自的方差之和 兩個樣本均值之差的抽樣分布第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3兩個總體都為正態分布,即71
m1s1總體1s2
m2總體2抽取簡單隨機樣樣本容量n1計算x1抽取簡單隨機樣樣本容量n2計算x2計算每一對樣本的x1-x2所有可能樣本的x1-x2m1-m2抽樣分布第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3m1s1總體1s2m2總體2抽取簡單隨機樣72兩個總體都為正態分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個總體中分別抽取容量為n1和n2的獨立樣本兩個樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)的F分布,即兩個樣本方差比的抽樣分布第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3兩個總體都為正態分布,即X1~N(μ1,σ12),X2~N73c2-分布(2-distribution)由阿貝(Abbe)
于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)
分別于1875年和1900年推導出來。設X1,X2,┈,Xn是來自總體N(0,1)的樣本,則稱隨機變量X1,X2,┈,Xn
2=
X12+X22+,┈+Xn2服從自由度為n的2分布,記為2∽
2(n)第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3c2-分布(2-distribution)第6章第2節樣74分布的變量值始終為正;分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱;期望為:E(2)=n,方差為:D(2)=2n(n為自由度);可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布。c2-分布(性質和特點)第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3分布的變量值始終為正;分布的形狀取決于其自由度n的大小,通7576c2n=1n=4n=10n=20第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3不同自由度的c2-分布76c2n=1n=4n=10n=20第6章第2節樣本均值t-分布(t-distribution)提出者是WilliamGosset,也被稱為學生分布(student’st)t-分布是類似正態分布的一種對稱分布,通常要比正態分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數。隨著自由度的增大,分布也逐漸趨于正態分布xt分布與標準正態分布的比較t分布標準正態分布t不同自由度的t分布標準正態分布t(df=13)t(df=5)z第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3t-分布(t-distribution)提出者是Willi77
設X1,X2,…,Xn是來自正態總體N~(μ,σ2)的一個樣本,稱為統計量,它服從自由度為(n-1)的t分布Xt分布與正態分布的比較正態分布t分布t不同自由度的t分布標準正態分布t(df=13)t(df=5)Z第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3設X1,X2,…,Xn是來自正態總體N~(μ,σ2)的一78F-分布(F
distribution)為紀念統計學家費希爾(R.A.Fisher)
以其姓氏的第一個字母來命名;設若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3F-分布(Fdistribution)為紀念統計學家費希爾79F(1,10)(5,10)(10,10)第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3不同自由度的F分布F(1,10)(5,10)(10,10)第6章第2節樣本均80
選擇容量為n的簡單隨機樣本計算樣本方差S2計算卡方值2=(n-1)S2/σ2計算出所有的
2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體卡方(c2)分布第6章第2節
樣本均值的分布與中心極限定理常用統計量的分布3選擇容量為n的計算卡方值計算出所有的不同容量樣本的抽樣分81THANKS
FORYOURATTENTIONTHANKS82管理統計學畢德春遼東學院信息技術學院管理統計學畢德春遼東學院信息技術學院83第6章
抽樣與抽樣分布第6章抽樣與抽樣分布84第1節抽樣方法第1節抽樣方法85第6章第1節
抽樣方法關于抽樣的基礎概念1總體(population)所研究的全部個體(數據)的集合,其中的每一個元素稱為個體,總體中所包含的元素數量多少稱為總體容量,用N表示。有限總體有限總體的范圍能夠明確確定,且元素的數目是有限的1無限總體無限總體所包括的元素是無限的,不可數的2第6章第1節抽樣方法關于抽樣的基礎概念1總體(popula第6章第1節
抽樣方法關于抽樣的基礎概念1什么才是好的抽樣?有足夠的代表性符合統計學基本原理具有充分的可操作性有效率的實施/執行中的偏差越小越好第6章第1節抽樣方法關于抽樣的基礎概念1什么才是好的抽樣?87從理論上講,樣本數越大,抽樣誤差越小,結果的代表性越好。但是,同時考慮費用和時間因素,大樣本量不一定是最有效率的辦法。在隨機抽樣條件下,不同樣本規模的抽樣誤差如下:
第6章第1節
抽樣方法關于抽樣的基礎概念1樣本量的選取置信度樣本量80%90%95%99%1505.23%6.72%8.00%10.52%2004.53%5.82%6.93%9.11%2504.05%5.20%6.20%8.15%3003.70%4.75%5.66%7.44%5002.87%3.68%4.38%5.76%從理論上講,樣本數越大,抽樣誤差越小,結果的代表性越好。但是88樣本(sample)從總體中抽取的一部分元素的集合,構成樣本的元素數目稱為樣本容量,用n表示。第6章第1節
抽樣方法關于抽樣的基礎概念1=<30小樣本>30大樣本樣本(sample)從總體中抽取的一部分元素的集合,構成樣本89參數(parameter)描述總體特征的概括性數字度量,是研究者想要了解的總體的某種特征值,所關心的參數主要有總體均值()、標準差()、總體比例()等,總體參數通常用希臘字母表示。第6章第1節
抽樣方法關于抽樣的基礎概念1πμσ總體均值標準差總體比例參數(parameter)描述總體特征的概括性數字度量,是研90統計量(statistic)用來描述樣本特征的概括性數字度量,它是根據樣本數據計算出來的一些量,是樣本的函數,所關心的樣本統計量有樣本均值(x)、樣本標準差(s)、樣本比例(p)等,樣本統計量通常用小寫英文字母表示。第6章第1節
抽樣方法關于抽樣的基礎概念1pxs樣本均值樣本標準差樣本比例統計量(statistic)用來描述樣本特征的概括性數字度量91總體參數樣本統計量第6章第1節
抽樣方法關于抽樣的基礎概念1抽樣推斷的過程總體參數樣本統計量第6章第1節抽樣方法關于抽樣的基礎概念192抽樣方法概率抽樣非概率抽樣多階段抽樣整群抽樣系統抽樣自愿抽樣配額抽樣簡單隨機抽樣分層抽樣方便抽樣判斷抽樣滾雪球抽樣抽樣第6章第1節
抽樣方法關于抽樣的方法2抽樣方法概率抽樣非概率抽樣多階段抽樣整群抽樣系統抽樣自愿抽樣93第6章第1節
抽樣方法關于抽樣的方法2概率抽樣非概率抽樣概率抽樣也稱隨機抽樣,是按照隨機原則抽選樣本的抽樣方式,抽樣時每個樣本單位被選中的概率是已知。不滿足概率抽樣要求的抽樣都被歸為非概率抽樣。非概率抽樣單個單位被選中的概率是不可知的第6章第1節抽樣方法關于抽樣的方法2概率抽樣非概率抽樣概率94簡單隨機抽樣(SimpleRandomSampling)也稱純隨機抽樣。直接從總體單位中抽選樣本單位,每個個體被選入樣本的概率都相等。可分為有放回和無放回兩種方式。是最基本的抽樣方法,許多抽樣方法都是在它的基礎上發展起來的。其數學性質簡單,理論也最為成熟。第6章第1節
抽樣方法關于抽樣的方法2簡單隨機抽樣(SimpleRandomSampli95整群抽樣(ClusterSampling)先將總體分為R個群(即次級單位或子總體),每個群包含若干總體單位。按某種方式從中隨機抽取r個群,然后對抽中的群的所有單位都進行調查的抽樣方式。總體分成4個群隨機選擇2個群構成樣本第6章第1節
抽樣方法關于抽樣的方法2整群抽樣(ClusterSampling)先將總體分為96多階段抽樣先從總體中隨機地抽取若干初級單位,再從初級單位中抽取若干二級單位,……如此下去直至抽取所要調查的基本單位的抽樣方法。例:[統計年鑒2004指出]2003年人口變動情況抽樣調查是以全國為總體,各省、自治區、直轄市為次總體,采用分層、等距、整群抽樣方法,在全國31個省、自治區、直轄市抽取了990個縣(市、區)、3734個鄉(鎮、街道)、6544個調查小區的126萬人。第6章第1節
抽樣方法關于抽樣的方法2多階段抽樣先從總體中隨機地抽取若干初級單位,再從初級單位中抽97分層抽樣(StratifiedSampling)也稱分類抽樣或類型抽樣。即先將總體所有單位按某種標志劃分為若干層,然后從各層中隨機抽取一定數目的單位構成樣本,根據各層樣本匯總對總體指標作出估計的一種抽樣方式。男生女生樣本第6章第1節
抽樣方法關于抽樣的方法2分層抽樣(StratifiedSampling)也稱分類98例:一個單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關指標,從中抽取100名職工作為樣本,應該怎樣抽取?第6章第1節
抽樣方法關于抽樣的方法2分析:這總體具有某些特征,它可以分成幾個不同的部分:不到35歲;35~49歲;50歲以上,把每一部分稱為一個層,因此該總體可以分為3個層。由于抽取的樣本為100,所以必須確定每一層的比例,在每一個層中實行簡單隨機抽樣。例:一個單位的職工有500人,其中不到35歲的有125人,399解:抽取人數與職工總數的比是100:500=1:5,則各年齡段(層)的職工人數依次是125:280:95=25:56:19,然后分別在各年齡段(層)運用簡單隨機抽樣方法抽取。答:在分層抽樣時,不到35歲、35~49歲、50歲以上的三個年齡段分別抽取25人、56人和19人。第6章第1節
抽樣方法關于抽樣的方法2解:抽取人數與職工總數的比是100:500=1:5,則各年齡100101系統抽樣也稱等距抽樣(SystematicSampling)將總體N個單位按某種順序排列,按規則確定一個隨機起點,再每隔一定間隔逐個抽取樣本單位的抽樣方法。直線等距抽樣:將總體分成n個組,每組有k=N/n個單位。在第一組隨機選擇一個單位,之后每隔k個選擇一個。N=64n=8k=8第一組第6章第1節
抽樣方法關于抽樣的方法219系統抽樣也稱等距抽樣(SystematicSampl例:一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐滿了聽眾。會后為聽取意見留下了座位號為20的30名聽眾進行座談。這里選用了哪種抽取樣本的方法?寫出抽取過程。第6章第1節
抽樣方法關于抽樣的方法2由于每排的座位有40個,各排每個號碼被抽取的概率都是,第1排被抽取前,其他各排中各號碼被抽取哪率也是,也就是說被抽取的概率是,每排的抽樣也是簡單隨機抽樣,因此這種抽樣的方法是系統抽樣。例:一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐102方便抽樣(Conveniencesampling)純粹以方便基本著眼的抽樣方法,事先不預定樣本,碰到即問或被調查者主動回答問題。又稱便利抽樣、偶遇抽樣。例:在街頭的攔截式訪問。登在報刊、網上的問卷。第6章第1節
抽樣方法關于抽樣的方法2方便抽樣(Conveniencesampling)純粹以方103判斷抽樣(JudgmentSampling)調查者根據主觀經驗和判斷從總體中選取有代表性的單位構成樣本。精度取決于抽樣者的經驗。不能獲得估計值的精度。適用于總體單位極不相同而樣本容量又很小的情況第6章第1節
抽樣方法關于抽樣的方法2判斷抽樣(JudgmentSampling)調查者根據主104配額抽樣(Quotasampling)是非隨機抽樣方法中最常用的一種抽樣方法。分為兩個步驟:根據研究人員認為較重要的一些變量把總體單位分類,指定每一類中的定額;然后在每一類中使用方便抽樣或判斷抽樣的方法抽選指定數量的樣本單位。問題:與分層抽樣的區別?第6章第1節
抽樣方法關于抽樣的方法2配額抽樣(Quotasampling)是非隨機抽樣方法中105雪球抽樣也譯為滾雪球抽樣(SnowballSampling)其原理是先找到最初的樣本單位,然后根據他們提供的信息去獲得新的樣本單位;這種過程不斷繼續,直到完成規定的樣本容量為止。主要用于對稀少群體的調查。例:某研究部門在調查保姆問題時,先訪問了7名保姆,然后再請她們提供其他保姆名單,逐步擴大到近百人。第6章第1節
抽樣方法關于抽樣的方法2雪球抽樣也譯為滾雪球抽樣(SnowballSampli106在下列問題中,各采用什么抽樣方法抽取樣本較合適?從20臺電腦中抽取4臺進行質量檢測;從2004名同學中,抽取一個容量為20的樣本某中學有180名教工,其中業務人員136名,管理人員20名,后勤人員24名,從中抽取一個容量為15的樣本。簡單抽樣系統抽樣分層抽樣第6章第1節
抽樣方法關于抽樣的方法2在下列問題中,各采用什么抽樣方法抽取樣本較合適?從20臺電腦107抽樣調查中的誤差抽樣誤差非抽樣誤差計量誤差抽樣框誤差無回答誤差第6章第1節
抽樣方法抽樣調查中的誤差3抽樣調查中的誤差抽樣誤差非抽樣誤差計量誤差抽樣框誤差無回答誤108誤差是指估計值與真實值之間的差異。抽樣誤差(Samplingerror):由于抽選樣本的隨機性造成的誤差,也稱為代表性誤差。樣本只是總體的一部分,它對總體的代表性存在局限性,從而會造成誤差。在抽樣調查中,抽樣誤差就不可避免。在概率抽樣中抽樣誤差是能夠計量且可以得到控制的。影響抽樣誤差的主要因素包括:總體內部的差異程度;樣本容量的大小;抽樣的方式方法等。第6章第1節
抽樣方法抽樣調查中的誤差3誤差是指估計值與真實值之間的差異。第6章第1節抽樣方法抽樣109非抽樣誤差(Nonsamplingerror)除抽樣誤差以外的所有誤差。通常認為是由于調查程序執行中的錯誤與不足引起的。主要包括抽樣框誤差、無回答誤差和計量誤差。國內也稱為“工作誤差”或“調查誤差”。
第6章第1節
抽樣方法抽樣調查中的誤差3非抽樣誤差(Nonsamplingerror)除抽樣誤差以110在抽樣調查中可以把總體分成若干個互不重疊又窮盡的有限個部分,每個部分稱為一個抽樣單位(Samplingunit)。抽樣單位可以是一個總體單位,也可以包含多個個體。抽樣單位的名單稱為抽樣框(SamplingFrame)。抽樣框應盡可能與目標總體相一致。例如名單抽樣框、區域抽樣框、時間表抽樣框。
第6章第1節
抽樣方法抽樣調查中的誤差3在抽樣調查中可以把總體分成若干個互不重疊又窮盡的有限個部分,111大學學生花名冊、城市黃頁里的電話列表、工商企業名錄、街道派出所里居民戶籍冊、意向購房人信息冊……。例:要從10000名職工中抽出200名組成一個樣本,抽樣框是什么?10000名職工的名冊第6章第1節
抽樣方法抽樣調查中的誤差3大學學生花名冊、城市黃頁里的電話列表、工商企業名錄、街道派出112抽樣框誤差(samplingframeerror,CoverageError)當目標總體與抽樣框所涵蓋的元素不一致時,就會產生抽樣誤差。抽樣框誤差包括:丟失目標總體單位、包含非目標總體單位,復合連接等。第6章第1節
抽樣方法抽樣調查中的誤差3抽樣框誤差(samplingframeerror,C113案例:《文學摘要》民意測驗1936年美國總統選舉F.D.Roosevelt(羅斯福)任美國總統的第一任期屆滿(民主黨)A.Landon(蘭登)Kansas州州長(共和黨)經濟背景:國家正努力從大蕭條中恢復,失業人數高達九百萬人。TheliteraryDigest《文學摘要》進行民意測驗,將問卷郵寄給一千萬人,他們的名字和地址摘自電話簿或俱樂部會員名冊。其中240萬人寄回答案(回收率24%)。預測結果:Roosevelt43%,Landon57%競選結果:
Roosevelt62%,Landon38%主要原因:選擇偏倚——將一類人排除在外(當時四個家庭中,只有一家安裝電話)不回答偏倚——低收入和高收入的人傾向不回答抽樣總體目標總體第6章第1節
抽樣方法抽樣調查中的誤差3案例:《文學摘要》民意測驗1936年美國總統選舉抽樣總體1141936年美國總統競選(Gallup的預測)樣本容量3000人,在《摘要》公布其預測結果之前,僅以一個百分位數的誤差預言了《摘要》的預測結果。方法:從《摘要》要用的名單中隨機選取3000人,并給他們每人寄去一張明信片,詢問他們打算怎樣投票。大樣本并不能防止偏倚:當抽樣框不正確時,抽取一個大的樣本并無幫助,它只不過是在較大的規模下,去重復基本錯誤。利用一個約5萬人的樣本,正確地預測了Roosevelt的勝利。
Roosevelt的百分數蓋洛普預言《摘要》的預測結果44《摘要》預測的選舉結果43
Roosevelt的百分數蓋洛普預測的選舉結果56選舉結果62第6章第1節
抽樣方法抽樣調查中的誤差31936年美國總統競選(Gallup的預測)樣本容量3000115無回答誤差(NonresponseError)因缺失部分指定樣本單位的數據或調查問卷中的部分數據項而引起的誤差都稱為無回答誤差。樣本個體拒絕訪問樣本個體無法接受訪問樣本個體拒絕回答部分問題第6章第1節
抽樣方法抽樣調查中的誤差3無回答誤差(NonresponseError)因缺失部分116計量誤差(MeasurementError)是指調查中獲得的數據與調查項目真實值之間不一致而產生的誤差,也稱為登記性誤差。測量工具不準確調查員的工作失誤(如計量錯誤、計算錯誤、記錄錯誤等)被調查者沒有提供真實情況第6章第1節
抽樣方法抽樣調查中的誤差3計量誤差(MeasurementError)是指調查中117第2節樣本均值的分布與中心極限定理第2節樣本均值的分布與中心極限定理118總體分布(populationdistribution)總體中各元素的觀察值所形成的分布。分布通常是未知的可以假定它服從某種分布總體第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1總體分布(populationdistribution)總119樣本分布(sampledistribution)一個樣本中各觀察值的分布,也稱經驗分布,是指當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。樣本第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1樣本分布(sampledistribution)一個樣本中120抽樣分布(SamplingDistribtuion)按照簡單隨機抽樣方法,從個數為N的總體中抽取容量為n的樣本,兩種抽法:放回抽樣:樣本個數為不放回抽樣:樣本個數為每一個可能的樣本都有一個對應的均值和標準差,那么所有樣本均值的分布就是樣本均值的抽樣分布,所有樣本的標準差的分布就是樣本標準差的抽樣分布。第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1抽樣分布(SamplingDistribtuion)按照簡121總體計算樣本統計量如:樣本均值、比例、方差樣本抽樣分布的形成過程第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1總體計算樣本統計量樣本抽樣分布的形成過程第6章第2節樣本均122樣本均值的抽樣分布在重復選取容量為n的樣本時,由樣本均值所有可能取值形成的相對頻數分布一種理論概率分布推斷總體均值的理論基礎 第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1樣本均值的抽樣分布在重復選取容量為n的樣本時,由樣本均值所有123例:設一個總體,含有4個元素(個體),即總體單位數N=4。4個個體分別為X1=1、X2=2、X3=3、X4=4。總體的均值、方差及分布如下均值和方差總體分布14230.1.2.3第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1例:設一個總體,含有4個元素(個體),即總體單位數N=4。4124例:現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1例:現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共125計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53126式中:M為樣本數目,比較及結論:
樣本均值的均值(數學期望)等于總體均值樣本均值的方差等于總體方差的1/n第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1式中:M為樣本數目,比較及結論:第6章第2節樣本均值的分127抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的分布與總體分布的比較第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1抽樣分布=2.5σ2=1.25總體分布142128例:設一個總體(比如擲骰子),含有6個元素(個體),即總體單位數N=6。6個個體分別為x1=1,x2=2,x3=3,x4=4,x5=5,x6=6。現從總體中抽取n=2的簡單隨機樣本,試比較總體分布和樣本均值分布。第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1例:設一個總體(比如擲骰子),含有6個元素(個體),即總體129解:總體的均值、方差及分布如下:第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1均值和方差解:總體的均值、方差及分布如下:第6章第2節樣本均值的分布130現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,有62=36個樣本。所有樣本的結果為:
第二觀察值第一觀察值1234561(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,有62131計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布
第二觀察值第一觀察值123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.5636個樣本的均值第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布第二觀132=3.5σ2=2.9=3.5σ2=1.45樣本均值的抽樣分布與總體分布的比較第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1=3.5=3.5樣本均值的抽樣分布與總體分布133=50σ2
=10X總體分布n=2抽樣分布Xn=4當總體服從正態分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態分布,X的數學期望為μ,方差為σ2/n。即X~N(μ,σ2/n)σ2
=5σ2
=2.5第6章第2節
樣本均值的分布與中心極限定理樣本均值的分布1=50σ2=10X總體分布n=2抽樣分布Xn=134當樣本容量足夠大時(n>30),樣本均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省兩高項目管理辦法
- 南寧ppp項目管理辦法
- 深圳+質量獎+管理辦法
- 化妝品品牌營銷管理辦法
- 集團戰略投資管理辦法
- 南昌市規劃驗線管理辦法
- 銀行管理業務管理辦法
- 上海+代理建設管理辦法
- 云南省學校學籍管理辦法
- 金融理財廣告管理辦法
- 2023年遂寧市船山區選調教師考試真題
- CJJT259-2016 城鎮燃氣自動化系統技術規范
- 合伙人散伙分家協議書范文
- 《樹立正確的“三觀”》班會課件
- 園林綠化移樹合同
- 醫療機構保潔人員培訓
- 企業員工健康促進計劃的設計與實施
- 助理工程師答辯演示
- 成人失禁相關性皮炎的預防與護理-護理團標
- 裝載機的基礎知識-裝載機的結構及儀表
- 現代低壓電器技術 課件 2. 常見低壓電器
評論
0/150
提交評論