

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第六章數理統計的基本概念一、教學要求1理解總體、個體、簡單隨機樣本和統計量的概念,掌握樣本均值、樣本方差及樣本矩的計算。2. 了解丁分布、t分布和F分布的定義和性質,了解分位數的概念并會查表計算。3. 掌握正態總體的某些常用統計量的分布。4.了解最大次序統計量和最小次序統計量的分布。本章重點:統計量的概念及其分布。二、主要內容1. 總體與個體我們把研究對象的全體稱為總體(或母體),把組成總體的每個成員稱為個體。在實際問題中,通常研究對象的某個或某幾個數值指標,因而常把總體的數值指標稱為總體。設x為總體的某個數值指標,常稱這個總體為總體X。X的分布函數稱為總體分布函數。當X為離散型隨機變量時,稱
2、X的概率函數為總體概率函數。當X為連續型隨機變量時,稱X的密度函數為總體密度函數。當X服從正態分布時,稱總體X為正態總體。正態總體有以下三種類型:(1)二未知,但已知;未知,但工已知;(3)二和"均未知。2. 簡單隨機樣本數理統計方法實質上是由局部來推斷整體的方法,即通過一些個體的特征來推斷總體的特征。要作統計推斷,首先要依照一定的規則抽取n個個體,然后對這些個體進行測試或觀察得到一組數據,這一過程稱為抽樣。由于抽樣前無法知道得到的數據值,因而站在抽樣前的立場上,設有可能得到的值為J"'-,n維隨機向量(:J-)稱為樣本。n稱為樣本容量。(f'入)稱為樣本觀
3、測值。如果樣本(H-)滿足(1)二相互獨立;(2)'服從相同的分布,即總體分布;則稱-L>)為簡單隨機樣本。簡稱樣本。設總體X的概率函數(密度函數)為,貝U樣本(一-二)的聯合概率函數(聯合密度函數為)精品文檔3. 統計量完全由樣本確定的量,是樣本的函數。即:設1.-.是來自總體X的一個樣本,是一個n元函數,如果E中不含任何總體的未知參數,則稱為一個統計量,經過抽樣后得到一組樣本觀測值,則稱-.為統計量觀測值或統計量值。4. 常用統計量(1)樣本均值:(2)樣本方差:樣本標準差:(3)它們的觀察值分別為:1”牙二£丙2=If匡對'逹i-LnU這些觀察值仍分別稱為
4、樣本均值、樣本方差和樣本標準差。(4)樣本(k階)原點矩1nAkXk,k1,2,Lnii(5)樣本(k階)中心矩Bkni(Xi1kX),k2,3,L其中樣本二階中心矩Bkn-(XiX)2,又稱為未修正樣本方差。nii(6)順序統計量將樣本中的各個分量由小到大的重排成X(i)X(2)LX(n)則稱X(i),X(2)丄X(n)為樣本順序統計量,X(n)X(i)為樣本的極差。(7)樣本相關系數:n_(XiX)(yiy)i1rxySxSyn_(XiX)(yiy),1n(XiX)2,nii1n(yy)2niix,y分別為數據Xi,yi的樣本均值,SX,Sy分別為樣本a標準差。其中:5、直方圖與箱線圖(1
5、)直方圖先將所有采集的數據進行整理,得到順序統計量,找出其中的最小值x(i),最大值X(n),即所有的數據都落在區間X(i),X(n)上,現取區間X(i)k,X(n)k(其中k可取0.5,1.5等),該區間能覆蓋區間X,X(n),將區間Xk,X(n)k等分為m個小區間(先取一個區間,其下限比最小的數據稍小,其上限比最大的數據稍大,然后將這一區間等分為m個小區間,通常n較大時m取10:20,當n50時則m取5:6。若m取得過大,則會出現某些區間內頻數為零,分點通常取比數據精度高一位,以避免數據落在分點上),小區間的長度記為,(X(1)k)(x(n)k)11,m在每個小區間內的數據的頻數稱為組距,
6、小區間的端點稱為組限,數出數據落fi,算出頻率上(i1,2丄1),然后自左至右依次在各個小區間上做以1,2,L1)為高的小矩形,這樣的圖形就稱其為頻率n直方圖。顯然這種小矩形的面積就等于數據落在該小區間的頻率上(i1,2丄丨),n直方圖的外廓曲線接近于總體X的概率密度曲線。(2)p分位數定義設有容量為n的樣本觀察值X1,X2,L,Xn,樣本p(0p1)分為數記為Xp,它具有以下性質:(1)至少有np個觀察值小于或等于Xp;(2)至少有n(1p)個觀察值大于或等于Xp樣本p分位數可按以下法則求得:將X1,X2,L,Xn按從小到大的順序排成X(1)X(2)LX(n)10,若np不是整數,則只有一個
7、數據滿足定義中的兩點要求,這一數據位于大于np的最小整數處,即為位于np1處的數。20,若叩是整數,則Xnp,Xnp1都符合性質要求,故Xp取Xnp,Xnp1的平均值。X(np1)np不是整綜上可得:Xp12X(np)X(np1)np是整n1-*(T)n奇特別的:X0.5med12x(-)X(nJ)22n偶0.25分位數又稱為第一四分位數,又記為Q1;0.75分位數又稱為第三四分位數,又記為Q3(3)箱線圖:數據集的箱線圖是由箱子和直線組成的圖形,它是在基于以下5個數據的圖形概括:最小值Min,Q1,M,Q3,最大值Max,做法如下:(1)畫一水平數軸,在軸上標記最小值Min,Q1,M,Q3,
8、最大值Max,在數軸上方畫一個上下側平行于數軸的矩形箱子,箱子的左右兩側分別位于Q1,Q3的上方,在M點的上方畫一條垂直線段,線段位于箱子的內部;(2)自箱子的左側中點引一條水平線直至最小值上方;在同一水平高度自箱子右側引一條水平線直至最大值上方。箱線圖完成。在數據集中某一個觀察值不尋常的大于或小于該數集中的其他數據,稱為疑似異常值。第一四分位數Qi與第三四分位數Q3之間的距離:IQRQ3Qi稱為四分位數間距,若數據小于Q11.5IQR或大于Q31.5IQR,就認為他是疑似異常值。將上述箱線圖的做法修改如下:(1')同(1)(2')計算IQRQ3Qi,若一個數據小于Qi1.5I
9、QR或大于Q31.5IQR,則認為它是一個異常值,并以表示;(3')自箱子的左側中點引一條水平線直至數據中除去疑似異常值之后的最小值上方,再自箱子的右側中點引一條水平線直至數據中除去疑似異常值之后的最大值上方;這樣做出的箱線圖稱為修正箱線圖。6關于分布(1)(Gamn)函數它具有以下運算性質:(1)();(n)(n特別地:(1)11(2)廠(2)01x2exdx令、工txt2,dx2tdt(1)x012edx1-op0t令1t:e2dtI2(e12d00errdr所以廠(2)設隨機變量X服從分布,()0xiexdx,(s0)1)!,nN;t2t2t2g2tdt20edtedtt22st
10、2dt)(eds)(edt)I-即:X:(,),其密度函數為:f(x)1x()0x1ex0qita0,0定理:設隨機變量X,Y都服從分布且相互獨立,即:X:(,)其密度函數分別為:fx(x)0,01x1ex0qitafY(y)yy1ey0qita0,0,)x)表示則ZX丫服從參數為,的分布,即:XY:(7、經驗分布函數設X1,X2,LXn是總體F的一個樣本,用S(x),(X1,X2,LXn中不大于X的隨機變量的個數,定義經驗分布函數為:1Fn(X)-S(X),(X)n例題1:設總體F有一個樣本值1,2,3,則經驗分布函數為:0,x1,1x2,2x3F3(x)1,x3例題2:設總體F有一個樣本值
11、1,1,2,則經驗分布函數為:0,x1F3(x)23,1x21,x2格里汶科定理:(1933年)對于任意一實數x,當n時,Fn(x)以概率1收斂于分布函數F(x)PlimsupnXFn(x)F(x)018.三個重要分布(1M分布設J為獨立標準正態變量,稱隨機變量_''的分布為自由度為n的廠分布,記為;其密度函數為:f(x)1丄1丄Xx2e2x2n2(:0"X性質:(1)若2:2(n),則E(2)n,D(因為Xi:N(0,1)所以:E(Xi)0,D(Xi)1E(X2)D(Xi)1n22E()E(Xi)ni1002)2n又D(Xi2)E(X4)(E(Xi2)2E(X4)1
12、312,(i1,2,Ln)其中:4E(Xi)t2t4geTdtt2(t3gde乏)t2t3gde23t2t2tge2d()2t2e乏dt3t2t3gdeTt2t2e至dtt2tde至t2b)edt2et2至dt3(2) 2分布的可加性設2:2(nJf:2(n2),并且相互獨立,則有:22212:(山n2)(3) 2分布的分位點對于給定的正數(01),稱滿足條件22P(n)2(n)f(x)dx的點2(n)為2(n)分布的上分位點。(2)t分布設隨機變量X與丫獨立,<',則稱的分布為自由度n的t分布,記為't分布又稱為學生氏分布,其密度函數為:h(t)$"d.耳*n
13、(n2)nt分布的分位點:對于給定的正數(01),稱滿足條件P(tt(n)t(n)h(t)dt的點t(n)為t(n)分布的上分位點。其中:t1(n)t(n)(3) F分布設隨機變量U與V相互獨立,丿,則稱的分布為自由度的F分布,記為'"。密度函數為:nn1(-)2y2m(y)(2)(-)1nmny2m0由定義知:若-小JIrr1則:F(m,n)FF分布的分位點對于給定的正數(01),稱稱滿足:P(FF(n,m)卩“側的點為F分布的上分位點,且有19扌由樣分布(1)有限總體的抽樣分布定理1、設總體中個體總數(也稱總體大小)為N,樣本容量為n(nN)且總體有有限均值,方差2,則(
14、i)E(X)(ii)當抽樣是有放回時當抽樣是無放回時(X)其中(X)即為X的標準差。(2)單正態總體的抽樣分布設總體X(不管服從什么分布,只要均值和方差存在)的均值為,方差為2X1,X2丄Xn是來自X的一個樣本,X,S2分別是樣本均值和樣本方差,則有:E(X),D(X)E(S2)(XiX)212E(Xi)2nE(X)(n1i1n(2i1nXi2一2nX)2)而n1E(S2)定理2、設X1,X2,LXn是來自正態總體X:222n()nN(,2)的一個樣本,X是樣本均值,則有:(i)X:N(2)(ii)Xn石N(0,1)2)的一個樣本,X,s2分定理3、設X1,X2,LXn是來自正態總體X:N(別
15、是樣本均值和樣本方差,則有:(i)雪s2An(XiX)2:2(ni)ii(ii)X與S2相互獨立。定理4、設Xi,X2丄Xn是來自正態總體X:N(,2)的一個樣本,X,S2分別是樣本均值和樣本方差,則有:(i)(L_S2An(Xi)2:2(n)iiX(ii)T:t(ni)注:Xni22:N(o,i),廠S2:2(ni)Jnni&一八0:t(ni)(3) 雙正態總體的抽樣分布定理5、設Xi,X2丄Xni與丫1,丫2丄丫匕分別是來自正態N(i2)和N(2,I)的本,且這兩個樣本相互獨立nii-Xi,Yniiin2iYin2ii別是這兩個樣本的樣本均S2nix)2,s2n2丄(YiY)2分別是這兩個樣本的樣本方差。則n2iii有:(i)S2S2.i222'F(niIm1);(2)(XY)(i2):t(mm2)in2其中:sW22(nii)3仇2sfS)6y<wnin22證明:(1)(n嚴;:2(m1),(n21)S;-2(n21)(2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 以微粒為核心的科學探究課程教案
- 母愛的味道記母親的一件小事作文(15篇)
- 一件勇敢的事記敘文5篇
- 農業生產技術推廣應用情況表
- 我們的節日歡樂元旦記事作文(9篇)
- 個性化印刷品銷售合同
- 農業科技研究與成果轉化協議
- 詩歌與散文欣賞:高一語文教學專題
- 技術支持資源表-支持服務體系詳細介紹
- 2025年藝術設計專業入學考試試卷解答
- 蘭州大學《中國經濟史》2023-2024學年第二學期期末試卷
- 牙科手術安全核查流程與標準
- 風力發電項目居間合同
- 間歇性胃管插管護理
- 小學科學新教科版一年級下冊全冊教案(共13課)(2025春詳細版)
- 自發性氣胸PBL護理教學查房
- 2025年金華國企義烏市建投集團招聘筆試參考題庫含答案解析
- 道路白改黑施工方案及工藝
- 【MOOC】《中國哲學》(北京師范大學) 章節作業中國大學慕課答案
- 醫院常見消毒劑的使用
- 國開電大《流通概論》形考任務
評論
0/150
提交評論