《醫藥數理統計方法》各章內容提要_第1頁
《醫藥數理統計方法》各章內容提要_第2頁
《醫藥數理統計方法》各章內容提要_第3頁
《醫藥數理統計方法》各章內容提要_第4頁
《醫藥數理統計方法》各章內容提要_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGE數據的描述和整理數據的分類數據類型定性數據(品質數據)定量數據定類數據(計數數據)定序數據(等級數據)數值數據(計量數據)表現形式類別(無序)類別(有序)數值(+-×÷)對應變量定類變量定序變量數值變量(離散變量、連續變量)主要統計方法計算各組頻數,進行列聯表分析、2檢驗等非參數方法計算各種統計量,進行參數估計和檢驗、回歸分析、方差分析等參數方法常用統計圖形條形圖,圓形圖(餅圖)直方圖,折線圖,散點圖,莖葉圖,箱形圖常用統計量1、描述集中趨勢的統計量名稱公式(原始數據)公式(分組數據)意義均值反映數據取值的平均水平,是描述數據分布集中趨勢的最主要測度值,中位數Me中位數所在組:累積頻數超過n/2的那個最低組是典型的位置平均數,不受極端值的影響眾數Mo數據中出現次數最多的觀察值眾數所在組:頻數最大的組測度定性數據集中趨勢,對于定量數據意義不大2、描述離散程度的統計量名稱公式(原始數據)公式(分組數據)意義極差RR=最大值-最小值R≈最高組上限值-最低組下限值反映離散程度的最簡單測度值,不能反映中間數據的離散性總體方差2反映每個總體數據偏離其總體均值的平均程度,是離散程度的最重要測度值,其中標準差具有與觀察值數據相同的量綱總體標準差樣本方差S2反映每個樣本數據偏離其樣本均值的平均程度,是離散程度的最重要測度值,其中標準差具有與觀察值數據相同的量綱樣本標準差S變異系數CVCV=反映數據偏離其均值的相對偏差,是無量綱的相對變異性測度樣本標準誤反映樣本均值偏離總體均值的平均程度,在用樣本均值估計總體均值時測度偏差3、描述分布形狀的統計量名稱公式(原始數據)公式(分組數據)意義偏度Sk反映數據分布的非對稱性Sk=0時為對稱;Sk>0時為正偏或右偏;Sk<0時為負偏或左偏峰度Ku(原始數據)(分組數據)反映數據分布的平峰或尖峰程度Ku=0時為標準正態;Ku>0時為尖峰分布;Ku<0時為扁平分布*在分組數據公式中,mi,fi分別為各組的組中值和觀察值出現的頻數。第二章隨機事件與概率(一)基本概念概念符號概率論的定義集合論的含義隨機試驗(試驗)E具有以下特征的觀測或試驗:1.試驗在相同的條件下可重復地進行2.試驗的所有結果事先已知,且不止一個3.每次試驗恰好出現其中之一,但試驗前無法預知到底出現哪一個結果。樣本空間試驗所有可能結果組成的集合,即所有基本事件的全體全集基本事件(樣本點)試驗的每個不可再分的可能結果,即樣本空間的元素元素隨機事件(事件)A試驗中可能發生也可能不發生的結果,是由基本事件組成的樣本空間的子集子集必然事件在試驗中一定發生的事件全集不可能事件在試驗中一定不發生的事件,不含任何基本事件空集(二)事件間的關系關系符號概率論的定義集合論的含義包含AB事件A的發生必然導致事件B的發生A是B的子集相等A=BAB而且BAA與B相等和(并)A+B(A∪B)事件A與B中至少有一個事件發生A與B的并積(交)AB(A∩B)事件A與B同時發生A與B的交差A-B事件A發生同時B不發生A與B的差互不相容AB=事件A與B不可能同時發生A與B不相交對立事件A不發生A的補集(余集)(三)事件的運算規律運算律公式交換律A+B=B+A,AB=BA結合律(A+B)+C=A+(B+C),(AB)C=A(BC)分配律(A+B)C=AC+BC,A+(BC)=(A+B)(A+C)差積轉換律對立律A=,A+=Ω德·摩根對偶律,(四)概率的定義類型定義公式古典概率P(A)=統計概率P(A)=p(≈)公理化定義(基本性質)對樣本空間中任意事件A對應的一個實數P(A),滿足公理1(非負性):0≤P(A)≤1公理2(規范性):P()=1,P()=0公理3(可加性):若A1,A2,…,An,…,兩兩互不相容,P(A1+A2+…+An+…)=P(A1)+P(A2)+…+P(An)+…則稱P(A)為隨機事件A的概率。(五)概率的計算公式名稱計算公式加法公式P(A+B)=P(A)+P(B)-P(AB)若A、B互不相容(AB=):P(A+B)=P(A)+P(B)對立事件公式P(A)=1-P();P()=1-P(A)事件之差公式P(A-B)=P(A)-P(AB)若BA,P(A-B)=P(A)-P(B)條件概率公式,(P(A)>0)乘法公式若P(A)>0,P(AB)=P(A)P(B|A)若P(B)>0,P(AB)=P(B)P(A|B)當P(A1A2…An-1P(A1A2…An)=P(A1)P(A2|A1)P(A3|A1A2)…P(An|A1A2…A獨立事件公式A、B相互獨立:P(AB)=P(A)P(B)A1,A2,…,An相互獨立:P(A1A2…An)=P(A1)P(A2)…P(An全概率公式若A1,A2,…,An為完備事件組*,對事件B逆概率公式(貝葉斯公式)若A1,A2,…,An為完備事件組*,P(B)>0*完備事件組{A1,A2,…,An}1.A1,A2,…,An互不相容且P(Ai)>0(i=1,2,…,n);2.A1+A2+…+An=第三章隨機變量及其分布(一)隨機變量及常用分布1.離散型隨機變量及常用分布名稱定義性質或背景備注分布律P{X=xk}=pk,k=1,2,…或Xx1x2…xk…Pp1p2…pk…1.pk≥0,k=1,2,…2.0-1分布P{X=1}=p,P{X=0}=q,或X01Pqp二項分布n=1的特例:B(1,p)(一重貝努里試驗)EX=pD(X)=pq二項分布B(n,p)P{X=k}=,k=0,1,…,nX為n重貝努里試驗中A事件發生的次數EX=npD(X)=npq泊松分布P()P{X=k}=,k=0,1,2,…,>0是常數二項分布泊松近似公式(≈np)(n很大,p較小)EX=D(X)=超幾何分布P{X=k}=k=1,2,…,min(M,n)無放回產品抽樣試驗當N→+∞時,時,EX=2.連續型隨機變量及常用分布名稱定義性質或背景備注密度函數f(x)對任意a<b有P{a<X≤b}=1.f(x)≥02.3.對任意常數a,有P{X=a}=0等價定義:對X的分布函數有F(x)=,﹣∞<x<+∞正態分布N(,2)f(x)=﹣∞<x<+∞P{a<X≤b}=E(X)=D(X)=2標準正態分布N(0,1)(x)=﹣∞<x<+∞1.(﹣x)=1-(x)2.(x)可查表計算其中(x)是分布函數E(X)=0D(X)=1指數分布E()常用作“壽命”分布>0為常數E(X)=1/D(X)=1/2均勻分布U[a,b]直線上幾何概率模型的分布描述E(X)=(a+b)/2D(X)=(b-a)2/12對數正態分布LN()f(x)=若X服從對數正態分布LN(),則lnX~N()韋布爾分布W(m,,)f(x)=m=1且=0時為指數分布;m=3.5時近似于正態分布分布函數為F(x)=,(x>)3.隨機變量的分布函數類型定義性質備注通用定義F(x)=P{X≤x},﹣∞<x<+∞0≤F(x)≤1;F(﹣∞)=0,F(+∞)=13.F(x)對x單調不減4.F(x)為右連續P{a<X≤b}=F(b)-F(a)離散型XF(x)=,﹣∞<x<+∞連續型XF(x)=,﹣∞<x<+∞f(x)=F(x)P{a<X≤b}=(二)隨機變量的數字特征類型定義性質備注數學期望E(X)離散型E(X)=1.E(C)=C(C為常數)2.E(CX)=C·E(X)3.E(X±Y)=E(X)±E(Y)4.若X、Y相互獨立,則E(X·Y)=E(X)·E(Y)描述隨機變量所有可能取值的平均水平連續型E(X)=方差D(X)D(X)=E[(X-E(X))2]1.D(C)=0(C為常數)2.D(CX)=C2·D(X)3.若X、Y相互獨立,則D(X±Y)=D(X)+D(Y)4.D(X)=E(X2)-(EX)2描述隨機變量取值相對于均值的平均離散程度標準差(X)協方差cov(X,Y)Cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)·E(Y)1.Cov(aX,bY)=abCov(X,Y)2.Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)3.X與Y獨立Cov(X,Y)=04.D(X±Y)=D(X)+D(Y)±2Cov(X,Y)描述X與Y的偏差的關聯程度相關系數XY1.|XY|≤1;2.|XY|=1存在常數a、b使得P{Y=aX+b}=1;3.X與Y獨立X與Y不相關,反之不一定成立。描述X與Y間線性相關程度;XY=0,稱X與Y不相關;(三)隨機變量函數的分布類型X的分布函數Y=g(X)的分布數學期望公式離散型XX的分布律P{X=xk}=pk,k=1,2,…Y的分布律為P{Y=g(xk)}=pk,k=1,2,…。若有某些g(xi)相等,則對其作適當的并項,即對應概率相加連續型XX的密度為fX(x)分布函數法:FY(y)=P{Y≤y}=P{g(X)≤y}Y=g(X)的密度:fY(y)=F′Y(y)定理公式法:若y=g(x)在fX(x)非零區間上嚴格單調,h(y)是y=g(x)的反函數(四)二維隨機向量及分布1.二維離散型隨機向量名稱定義性質或試驗背景備注聯合分布律1.pij≥0,i,j=1,2,…,2.聯合分布律的列表結構(概率分布表)X的邊緣分布隨機變量X的分布律由聯合分布律“行值相加”Y的邊緣分布隨機變量Y的分布律由聯合分布律“列值相加”獨立性X與Y相互獨立X、Y的邊緣分布完全確定其聯合分布律按定義驗證獨立性,實用中由試驗獨立性得2.二維連續型隨機向量名稱定義性質或試驗背景備注聯合密度f(x,y)對平面上的區域D1.f(x,y)≥02.X的邊緣密度隨機變量X的密度fX(x)=FX(x)Y的邊緣密度隨機變量Y的密度fY(y)=FY(y)獨立性X與Y相互獨立X、Y的邊緣分布完全確定其聯合分布律按定義驗證獨立性;實用中由試驗獨立性得二維正態分布(X,Y)~N(μ1,μ2,)X~N(,)Y~N(,)X與Y相互獨立=0;是X與Y的相關系數3.二維隨機向量的分布函數名稱定義性質或試驗背景備注聯合分布函數定義F(x,y)=P{X≤x,Y≤y}﹣∞<x,y<+∞1.0≤F(x,y)≤1;2.F(-∞,y)=0,F(x,-∞)=0,F(-∞,-∞)=0,F(+∞,+∞)=1;3.F(x,y)對x,y均為右連續;4.F(x,y)對x和y單調不減;F(x,y)可以描述任意類型(X,Y)的分布離散型(X,Y)﹣∞<x,y<+∞連續型(X,Y)﹣∞<x,y<+∞X的邊緣分布函數FX(x)為X的分布函數由F(x,y)可確定FX(x)與FY(y),反之未必Y的邊緣分布函數FY(y)為Y的分布函數(五)大數定律和中心極限定理名稱條件結論備注契貝曉夫不等式X的E(X)、D(X)均存在有限對任意>0,有或在已知X的均值和方差時,估計X與其均值E(X)的偏差大(小)于的概率切比雪夫大數定律設{Xk}為相互獨立且服從同一分布的隨機變量序列,又E(Xk)=,D(Xk)=2(k=1,2,…)均存在有限對任意>0,有即當n足夠大時,將依概率收斂于其均值μ貝努里大數定律設n~B(n,p);(或n為n重貝努里試驗中事件A發生的次數,P(A)=p)對任意ε>0,有。即A發生的頻率以嚴格數學形式描述“頻率的穩定性”。在試驗次數很大時,用事件A的頻率作為其概率的近似值勒維-林德貝格中心極限定理(獨立同分布中心極限定理)設{Xk}為相互獨立且服從同一分布的隨機變量序列,又E(Xk)=,D(Xk)=2(k=1,2,…)均存在有限令,則即n很大時,Yn~N(0,1)(近似)n足夠大時,近似服從N(n,n2)德莫佛-拉普拉斯中心極限定理(貝努里情形中心極限定理)設n~B(n,p);(或n為n重貝努里試驗中事件A發生的次數,P(A)=p)令,則即n很大時,Yn~N(0,1)(近似),或n~N(np,npq)(近似)當n很大(n>30)時,有第四章抽樣分布內容提要(一)數理統計的基本概念名稱定義特性意義總體X研究對象的全體X將總體理解為服從某一分布的隨機變量X利用隨機變量X的性質來研究總體樣本X1,X2,…,Xn滿足:1.(獨立性)相互獨立;2.(代表性)與總體X同分布。樣本具有二重性:(1)隨機變量X1,X2,…,Xn(理論分析)(2)觀察值x1,x2,…,,xn(數值計算)樣本是從總體中隨機抽取部分個體組成,用于推斷總體有關統計特征統計量(X1,X2,…,Xn)樣本X1,X2,…,Xn的不含任何未知參數的函數泛指時為隨機變量,特指時為相應數值對樣本所含信息進行加工提煉,用于估計推斷總體參數(二)常用統計量名稱定義應用意義樣本均值用于分析總體均值E(X),且有刻畫了樣本的位置(集中)特征,反映樣本觀察值的平均水平。樣本方差S2用于分析總體方差D(X),且有E(S2)=D(X)刻畫了樣本的離散特征,反映樣本觀察值偏離樣本均值的分散程度。樣本標準差SS與Xi的度量單位一致刻畫樣本觀察值偏離樣本均值的絕對偏差,且與取值數據的量綱一致。變異系數CV反映樣本的相對離散程度的無量綱統計量刻畫樣本觀察值偏離樣本均值的相對偏差,可用于比較不同均值樣本相對變異程度標準誤反映樣本均值的變異程度用來衡量以樣本均值來推斷估計總體均值時的平均誤差(三)統計三大常用分布名稱定義性質2分布2(n)設X1,X2,…,Xn相互獨立,均服從N(0,1),則~2(n)其中n為2分布的自由度1.X~2(n),則E(X)=n,D(X)=2n2.X~2(n1),Y~2(n2)且X與Y獨立,則X+Y~2(n1+n2)t分布t(n)設X~N(0,1),Y~2(n),且X與Y相互獨立,則~t(n)其中n為2分布的自由度1.t1-(n)=﹣t(n)2.當n→∞時,t(n)的極限分布就是N(0,1)F分布F(n1,n2)設X1~2(n1),X2~2(n2),且X1與X2獨立,則~F(n1,n2)其中n1,n2為2分布的自由度1.設T~t(n),則T2~F(1,n)2.設F~F(n1,n2),則1/F~F(n2,n1)3.(四)正態總體的抽樣分布總體類型抽樣分布說明單個正態總體樣本均值的抽樣分布作為正態變量的線性組合仍服從正態分布的標準化變量服從標準正態分布將中的換成S,相應分布由N(0,1)修正為t(n-1)樣本方差S2相關抽樣分布S2與還是相互獨立的兩個正態總體樣本方差之比的抽樣分布用于兩個總體方差的統計推斷樣本均值之差的抽樣分布當時用于兩個總體均值的統計推斷其中第五章參數估計內容提要(一)總體參數的點估計法點估計法基本思想計算步驟矩估計法用樣本矩估計相應的總體矩,從而得到總體未知參數的估計值設未知參數為θ1,θ21.由總體X的分布計算E(X),E(X2)2.解方程組得θ1,θ2的矩估計最大似然估計法根據樣本來選擇參數,使得該樣本出現的可能性最大設未知參數為θ1.寫出似然函數2.選擇,使L()最大。即解似然方程或3.解之得即為θ的最大似然估計(二)估計量的判別標準判別標準定義備注無偏性樣本均值是總體均值的無偏一致估計量;樣本方差是總體方差的無偏一致估計量;樣本率p是總體率P的無偏一致估計量。有效性設均為的無偏估計量,若,則稱比有效一致性對任意給定的,有,即依概率收斂于(三)總體參數的區間估計總體分布參數條件置信區間正態分布均值已知未知未知大樣本(n30)方差未知二項分布總體率大樣本(n30)小樣本(n<30)查附表8泊松分布參數大樣本(n30)小樣本(n<30)查附表9第六章假設檢驗內容提要(一)假設檢驗的基本思想與步驟名目內容基本思想概率性質的反證法推斷依據小概率原理:小概率事件在一次試驗中幾乎不可能發生兩類錯誤第一類錯誤(棄真);第二類錯誤(取偽)基本步驟1.建立檢驗假設:原假設H0和備擇假設H1;2.確定檢驗統計量及其分布,并根據樣本值計算檢驗統計量的值;3.根據顯著性水平,確定檢驗臨界值,即得拒絕域;4.統計判斷:若統計量的值落在拒絕域內,則拒絕原假設H0;否則,就接受原假設H0。分類參數假設檢驗;非參數假設檢驗(二)正態總體的參數假設檢驗1.單個正態總體均值的假設檢驗條件檢驗假設統計量臨界值拒絕域2已知H0:=0H1:≠0u/2|u|≥u/2H1:>0(或H1:<0)uu≥u(或u≤-u)2未知H0:=0H1:≠0t/2|t|≥t/2H1:>0(或H1:<0)tt≥t(或t≤-t)2未知大樣本(n>30)H0:=0H1:≠0u/2|u|≥u/2H1:>0(或H1:<0)uu≥u(或u≤-u)2.配對比較總體均值的假設檢驗條件檢驗假設統計量臨界值拒絕域配對總體(d為差值)H0:=0H1:≠0t/2|t|≥t/2H1:>0(或H1:<0)tt≥t(或t≤-t)3.正態總體方差的假設檢驗條件檢驗假設統計量臨界值拒絕域單個總體H0:2=02H1:2≠022=,或H1:2>02(或H1:2<02)(或)(或)兩個總體H0:12=22H1:12≠22()F/2H1:12>22F4.兩個正態總體的均值比較檢驗條件檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論