




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第十二講抽樣分布與參數(shù)估計復(fù)習(xí):正態(tài)分布
在測驗記分方面的應(yīng)用1.以標(biāo)準(zhǔn)分?jǐn)?shù)表示考試成績
比較學(xué)生的考試成績時,使用原始分?jǐn)?shù)有其不合理之處:⑴.原始分制度沒有提示考生成績在考生團體成績中的位置。⑵.由于各科命題難度不同,導(dǎo)致各科原始分之間不能直接比較,造成分?jǐn)?shù)解釋上的困難。⑶.各科原始分相加不合理。采用標(biāo)準(zhǔn)分?jǐn)?shù),有如下特點:⑴.標(biāo)準(zhǔn)分的大小,既表明考生水平的高低,也表明該生在考生團體中的位置的高低。⑵.各科標(biāo)準(zhǔn)分都表示考生各科在同一團體中的位置,可根據(jù)標(biāo)準(zhǔn)分大小直接比較考生的各科成績水平。⑶.各科標(biāo)準(zhǔn)分的參照點(平均分為500分)和單位(1個標(biāo)準(zhǔn)差為100分)都一樣,具有可加性,克服了原始分的缺陷。例題:下表是兩名高考學(xué)生的成績,試分析哪一位考生的成績更好?科目原始成績?nèi)w考生Z分?jǐn)?shù)甲乙平均分標(biāo)準(zhǔn)差甲乙語文858970101.51.9政治70626551-0.6外語6872698-0.1250.375數(shù)學(xué)53405060.5-1.67理化7287758-0.3751.5Σ3483502.51.505目前我國一些省在高考中采用標(biāo)準(zhǔn)分?jǐn)?shù)表示考生的成績,為了使分?jǐn)?shù)更適合一般習(xí)慣,對標(biāo)準(zhǔn)分?jǐn)?shù)進一步做轉(zhuǎn)換:2.確定等級評定的人數(shù)如要將某種能力的分?jǐn)?shù)分成等距的幾個等級,在確定各等級人數(shù)時,可將正態(tài)分布基線上Z=-3至Z=+3之間6個標(biāo)準(zhǔn)差的距離分成相等的幾份,然后查表求出各段Z值之間的面積,再乘以總?cè)藬?shù),即為各等級人數(shù)。3.品質(zhì)評定數(shù)量化在心理與教育研究中,常常遇到等級評定的結(jié)果。但是不同評定者的評定結(jié)果往往不一致,無法綜合他們的評定結(jié)果,而且等級分?jǐn)?shù)不是等距數(shù)據(jù),不同事物的評定結(jié)果不能直接比較。將品質(zhì)評定的結(jié)果轉(zhuǎn)化為數(shù)量結(jié)果,就可解決這些問題。一、抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布抽樣分布:某一種統(tǒng)計量的概率分布1.抽樣分布的概念抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計量的概率分布。抽樣分布是一個理論的概率分布,是統(tǒng)計推斷的依據(jù)。2.平均數(shù)抽樣分布的幾個定理
⑴.從總體中隨機抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。⑵.容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差(即平均數(shù)的標(biāo)準(zhǔn)誤),等于總體標(biāo)準(zhǔn)差除以n的平方根。(8.1)(8.2)⑶.從正態(tài)總體中,隨機抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。⑷.雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。二.標(biāo)準(zhǔn)誤某種統(tǒng)計量在抽樣分布上的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤用來衡量抽樣誤差。標(biāo)準(zhǔn)誤越小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計量推斷總體參數(shù)的可靠度越大。因此,標(biāo)準(zhǔn)誤是統(tǒng)計推斷可靠性的指標(biāo)。平均數(shù)標(biāo)準(zhǔn)誤的計算1.總體正態(tài),σ已知(不管樣本容量大小),或總體非正態(tài),σ已知,大樣本平均數(shù)的標(biāo)準(zhǔn)誤為:平均數(shù)標(biāo)準(zhǔn)誤的計算2.總體正態(tài),σ未知(不管樣本容量大小),或總體非正態(tài),σ未知,大樣本平均數(shù)標(biāo)準(zhǔn)誤的估計值為(8.3)三.平均數(shù)離差統(tǒng)計量的分布由樣本的平均數(shù)對總體平均數(shù)進行估計,首先要了解平均數(shù)離差統(tǒng)計量的分布,才能根據(jù)一定的概率,由樣本的平均數(shù)對總體的平均數(shù)做出估計。1.總體正態(tài),σ已知(不管樣本容量大小),
或總體非正態(tài),σ已知,大樣本平均數(shù)離差的的抽樣分布呈正態(tài)分布(8.4)2.總體正態(tài),σ未知(不管樣本容量大小),
或總體非正態(tài),σ未知,大樣本平均數(shù)離差的的抽樣分布呈t分布(8.5)t分布的特點⑴.形狀與正態(tài)分布曲線相似⑵.t分布曲線隨自由度不同而有一簇曲線⑶.自由度的計算:自由度是指能夠獨立變化的數(shù)據(jù)個數(shù)。⑷.查t分布表時,需根據(jù)自由度及相應(yīng)的顯著性水平,并要注意是單側(cè)數(shù)據(jù)還是雙側(cè)。3.總體σ未知,大樣本時的近似處理樣本容量增大后,平均數(shù)的抽樣分布接近于正態(tài)分布,可用正態(tài)分布近似處理:(8.6)四.總體參數(shù)估計(一)總體參數(shù)估計原理根據(jù)樣本統(tǒng)計量對相應(yīng)總體參數(shù)所作的估計叫作總體參數(shù)估計。總體參數(shù)估計分為點估計和區(qū)間估計。由樣本的標(biāo)準(zhǔn)差估計總體的標(biāo)準(zhǔn)差即為點估計;而由樣本的平均數(shù)估計總體平均數(shù)的取值范圍則為區(qū)間估計。1.良好的點估計量應(yīng)具備的條件無偏性
如果一切可能個樣本統(tǒng)計量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計量就是總體參數(shù)的無偏估計量。有效性
當(dāng)總體參數(shù)不止有一種無偏估計量時,某一種估計量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。
良好的點估計量應(yīng)具備的條件一致性當(dāng)樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,這種估計是總體參數(shù)一致性估計量。充分性一個容量為n的樣本統(tǒng)計量,應(yīng)能充分地反映全部n個數(shù)據(jù)所反映的總體的信息。2.區(qū)間估計以樣本統(tǒng)計量的抽樣分布(概率分布)為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。對總體參數(shù)值進行區(qū)間估計,就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限。⑴要知道與所要估計的參數(shù)相對應(yīng)的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的理論分布;⑵要求出該種統(tǒng)計量的標(biāo)準(zhǔn)誤;⑶要確定在多大的可靠度上對總體參數(shù)作估計,再通過某種理論概率分布表,找出與某種可靠度相對應(yīng)的該分布橫軸上記分的臨界值,才能計算出總體參數(shù)的置信區(qū)間的上下限。置信區(qū)間置信度,即置信概率,是作出某種推斷時正確的可能性(概率)。置信區(qū)間,也稱置信間距(confidenceinterval,CI)是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平對總體平均數(shù)進行區(qū)間估計時,置信概率表示做出正確推斷的可能性,但這種估計還是會有犯錯誤的可能。顯著性水平(significancelevel)就是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用符號α表示。
P=1-α3.平均數(shù)區(qū)間估計的基本原理通過樣本的平均數(shù)估計總體的平均數(shù),首先假定該樣本是隨機取自一個正態(tài)分布的母總體(或非正態(tài)總體中的n>30的樣本),而計算出來的實際平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個。根據(jù)樣本平均數(shù)的分布理論,可以對總體平均數(shù)進行估計,并以概率說明其正確的可能性。(二)總體平均數(shù)的區(qū)間估計1.總體平均數(shù)區(qū)間估計的基本步驟①.根據(jù)樣本的數(shù)據(jù),計算樣本的平均數(shù)和標(biāo)準(zhǔn)差;②.計算平均數(shù)抽樣分布的標(biāo)準(zhǔn)誤;③.確定置信概率或顯著性水平;④.根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計表;⑤.計算置信區(qū)間;⑥.解釋總體平均數(shù)的置信區(qū)間。2.平均數(shù)區(qū)間估計的計算①總體正態(tài),σ已知(不管樣本容量大小),或總體非正態(tài),σ已知,大樣本平均數(shù)離差的的抽樣分布呈正態(tài),平均數(shù)的置信區(qū)間為:(9.1)例題1:某小學(xué)10歲全體女童身高歷年來標(biāo)準(zhǔn)差為6.25厘米,現(xiàn)從該校隨機抽27名10歲女童,測得平均身高為134.2厘米,試估計該校10歲全體女童平均身高的95%和99%置信區(qū)間。解:10歲女童的身高假定是從正態(tài)總體中抽出的隨機樣本,并已知總體標(biāo)準(zhǔn)差為σ=6.25。無論樣本容量大小,一切樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù)呈正態(tài)分布。于是可用正態(tài)分布來估計該校10歲女童身高總體平均數(shù)95%和99%的置信區(qū)間。其標(biāo)準(zhǔn)誤為當(dāng)P=0.95時,Z=±1.96因此,該校10歲女童平均身高95%的置信區(qū)間為:當(dāng)P=0.99時,Z=±2.58因此,該校10歲女童平均身高99%的置信區(qū)間為:②總體正態(tài),σ未知(不管樣本容量大小),
或總體非正態(tài),σ未知,大樣本平均數(shù)離差的抽樣分布為t分布,平均數(shù)的置信區(qū)間為:(9.2)例題2:從某小學(xué)三年級隨機抽取12名學(xué)生,其閱讀能力得分為28,32,36,22,34,30,33,25,31,33,29,26。試估計該校三年級學(xué)生閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。解:12名學(xué)生閱讀能力的得分假定是從正態(tài)總體中抽出的隨機樣本,而總體標(biāo)準(zhǔn)差σ未知,樣本的容量較小(n=12<30),在此條件下,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量服從呈t分布。于是需用t分布來估計該校三年級學(xué)生閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。由原始數(shù)據(jù)計算出樣本統(tǒng)計量為當(dāng)P=0.95時,因此,該校三年級學(xué)生閱讀能力得分95%的置信區(qū)間為:當(dāng)P=0.99時,因此,該校三年級學(xué)生閱讀能力得分99%的置信區(qū)間為:③總體正態(tài),σ未知,大樣本
平均數(shù)的抽樣分布接近于正態(tài)分布,用正態(tài)分布代替t分布近似處理:(9.3)例題3:從某年高考中隨機抽取102份作文試卷,算得平均分?jǐn)?shù)為26,標(biāo)準(zhǔn)差為1.5,試估計全部考生作文成績95%和99%的置信區(qū)間。解:學(xué)生高考分?jǐn)?shù)假定是從正態(tài)總體中抽出的隨機樣本,而總體的標(biāo)準(zhǔn)差σ未知,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量呈t分布。但是由于樣本容量較大(n=120>30),t分布接近于正態(tài)分布,因此可用正態(tài)分布近似處理。其標(biāo)準(zhǔn)誤為當(dāng)P=0.95時,Z=±1.96因此,該年全部考生作文成績95%的置信區(qū)間為:當(dāng)P=0.99時,Z=±2.58因此,該年全部考生作文成績99%的置信區(qū)間為:④總體非正態(tài),小樣本
不能進行參數(shù)估計,即不能根據(jù)樣本分布對總體平均數(shù)進行估計。五、假設(shè)檢驗的基本原理利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗。1.假設(shè)假設(shè)檢驗一般有兩互相對立的假設(shè)。H0:零假設(shè),或稱原假設(shè)、虛無假設(shè)(nullhypothesis)、解消假設(shè);是要檢驗的對象之間沒有差異的假設(shè)。H1:備擇假設(shè)(alternativehypothesis),或稱研究假設(shè)、對立假設(shè);是與零假設(shè)相對立的假設(shè),即存在差異的假設(shè)。進行假設(shè)檢驗時,一般是從零假設(shè)出發(fā),以樣本與總體無差異的條件計算統(tǒng)計量的值,并分析計算結(jié)果在抽樣分布上的概率,根據(jù)相應(yīng)的概率判斷應(yīng)接受零假設(shè)、拒絕研究假設(shè)還是拒絕零假設(shè)、接受研究假設(shè)。2.小概率事件樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時就認(rèn)為小概率事件發(fā)生了。把出現(xiàn)概率很小的隨機事件稱為小概率事件。當(dāng)概率足夠小時,可以作為從實際可能性上,把零假設(shè)加以否定的理由。因為根據(jù)這個原理認(rèn)為:在隨機抽樣的條件下,一次實驗竟然抽到與總體參數(shù)值有這么大差異的樣本,可能性是極小的,實際中是罕見的,幾乎是不可能的。3.顯著性水平統(tǒng)計學(xué)中把拒絕零假設(shè)的概率稱為顯著性水平,用α表示。顯著性水平也是進行統(tǒng)計推斷時,可能犯錯誤的概率。常用的顯著性水平有兩個:α=0.05和α=0.01。在抽樣分布曲線上,顯著性水平既可以放在曲線的一端(單側(cè)檢驗),也可以分在曲線的兩端(雙側(cè)檢驗)。圖9-1正態(tài)抽樣分布上α=0.05的三種不同位置αα4.假設(shè)檢驗中的兩類錯誤及其控制對于總體參數(shù)的假設(shè)檢驗,有可能犯兩種類型的錯誤,即α錯誤和β錯誤。表9-1假設(shè)檢驗中的兩類錯誤H0為真H0為假拒絕H0α錯誤正確接受H0正確β錯誤為了將兩種錯誤同時控制在相對最小的程度,研究者往往通過選擇適當(dāng)?shù)娘@著性水平而對α錯誤進行控制,如α=0.05或α=0.01。對β錯誤,則一方面使樣本容量增大,另一方面采用合理的檢驗形式(即單側(cè)檢驗或雙側(cè)檢驗)來使β誤差得到控制。在確定檢驗形式時,凡是檢驗是否與假設(shè)的總體一致的假設(shè)檢驗,α被分散在概率分布曲線的兩端,因此稱為雙側(cè)檢驗。雙側(cè)檢驗的假設(shè)形式為:H0:μ=μ0,H
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生英語匯報課件下載
- 2025年黑龍江省龍東地區(qū)中考化學(xué)真題【含答案、解析】
- 43 選擇性必修1 第七單元 第35講 免疫調(diào)節(jié)
- 麋鹿的教學(xué)課件
- 餐飲業(yè)服務(wù)員試用期合同范本
- 風(fēng)險投資企業(yè)財務(wù)估值與盡職調(diào)查合同
- 單雙腳跳教學(xué)課件
- 養(yǎng)老金融信用數(shù)據(jù)質(zhì)量評估與改進措施研究考核試卷
- 財務(wù)分析在網(wǎng)絡(luò)安全投資中的應(yīng)用考核試卷
- 紡織品產(chǎn)業(yè)綠色轉(zhuǎn)型路徑研究考核試卷
- 2024年國開電大 高級財務(wù)會計 形考任務(wù)4答案
- 道路工程石材檢測報告及石材單軸抗壓強度檢測原始記錄
- 2024年廣東省惠州一中學(xué)英語七下期末達標(biāo)檢測試題含答案
- 2019大學(xué)學(xué)術(shù)規(guī)范測試題庫500題(含標(biāo)準(zhǔn)答案)
- AQ 1071-2009 煤礦用非金屬瓦斯輸送管材安全技術(shù)要求(正式版)
- 上海延安初級中學(xué)新初一均衡分班語文試卷含答案
- 化工生產(chǎn)仿真綜合實訓(xùn)報告
- 中華民族共同體概論課件專家版8第八講 共奉中國與中華民族聚力發(fā)展
- 24春國家開放大學(xué)《農(nóng)業(yè)推廣》形考任務(wù)1-5參考答案
- 經(jīng)食道超聲心動圖課件
- 2023年南京信息職業(yè)技術(shù)學(xué)院招聘考試真題
評論
0/150
提交評論