1基本概念與基本知識ppt課件_第1頁
1基本概念與基本知識ppt課件_第2頁
1基本概念與基本知識ppt課件_第3頁
1基本概念與基本知識ppt課件_第4頁
1基本概念與基本知識ppt課件_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、醫學統計與計算醫學統計與計算授課對象:授課對象: 研討生各專業研討生各專業 運用教材:運用教材:SPSS 參考教材:參考教材: 總學時數:總學時數: 54 54 學時學時( (實際實際:33:33學時學時 實驗實驗:21:21學時學時) )貴陽中醫學院數學微機教研室貴陽中醫學院數學微機教研室 范薪生范薪生序序 言言是醫學統計方法結合計算機是醫學統計方法結合計算機運用,在醫藥科研中處置數據、分析數據著重適運用,在醫藥科研中處置數據、分析數據著重適用性的課程。主要是針對我院醫學、藥學各專業用性的課程。主要是針對我院醫學、藥學各專業的碩士研討生已學過數理、或醫學統計和計算的碩士研討生已學過數理、或醫

2、學統計和計算機的醫藥學各專業的學生,開設的一門以實際機的醫藥學各專業的學生,開設的一門以實際為主、以提高科研才干為目的的素質課程。為主、以提高科研才干為目的的素質課程。本課程主要引見本課程主要引見EXCEL中的統計分析工具,和中的統計分析工具,和SPSS統計軟件中常用的分析方法。為今后的進統計軟件中常用的分析方法。為今后的進一步學習打好根底,為開展教學實驗、畢業實習、一步學習打好根底,為開展教學實驗、畢業實習、科研提供根本技藝,更為學生畢業后在用人單位科研提供根本技藝,更為學生畢業后在用人單位大顯身手培育良好根本素質。大顯身手培育良好根本素質。本課程主要講授的內容本課程主要講授的內容第一部分第

3、一部分 根本醫學統計方法根本醫學統計方法 根本概念與根本知識根本概念與根本知識 總體參數的區間估計總體參數的區間估計 假設檢驗的根本方法假設檢驗的根本方法第二部分第二部分 統計分析工具的運用統計分析工具的運用 EXCEL EXCEL中的數據分析工具中的數據分析工具 SPSS SPSS統計軟件的運用統計軟件的運用實驗教學的內容實驗教學的內容實驗實驗1 1: EXCEL EXCEL中的中的T T檢驗檢驗( (均數比較均數比較) )實驗實驗2 2: EXCEL EXCEL中的方差分析中的方差分析實驗實驗3 3: EXCEL EXCEL中計數資料分析的計算中計數資料分析的計算實驗實驗4 4: EXCE

4、L EXCEL中秩和檢驗的計算中秩和檢驗的計算實驗實驗5 5: EXCEL EXCEL中的回歸分析中的回歸分析一、一、EXCELEXCEL中的數據分析工具中的數據分析工具實驗實驗1 1: Descriptive Statistics( Descriptive Statistics(描畫統計描畫統計) )實驗實驗2 2: Compare Means( Compare Means(均數比較均數比較) )實驗實驗3 3: General Linear Model ( General Linear Model (方差分析方差分析) )實驗實驗4 4: Crosstabs( Crosstabs(列聯表的

5、獨立性檢驗列聯表的獨立性檢驗) )實驗實驗5 5: Nonparametric Tests( Nonparametric Tests(非參數檢驗非參數檢驗) )實驗實驗6 6: Regression( Regression(回歸分析回歸分析) )二、二、SPSSSPSS統計軟件中的分析工具統計軟件中的分析工具教學內容目錄教學內容目錄第第1 1章章 根本概念與根本知識根本概念與根本知識第第2 2章章 計量資料的分析方法與計算計量資料的分析方法與計算第第3 3章章 分類資料的分析方法與計算分類資料的分析方法與計算第第4 4章章 秩和檢驗的分析方法與計算秩和檢驗的分析方法與計算第第5 5章章 回歸分

6、析方法與計算回歸分析方法與計算第第6 6章章 醫學統計方法的運用醫學統計方法的運用第第1 1章章 根本概念與根本知識根本概念與根本知識1.1 1.1 事件及事件的概率事件及事件的概率1.2 1.2 總體與樣本總體與樣本1.3 1.3 總體參數的估計總體參數的估計1.1 1.1 事件及其事件的概率事件及其事件的概率l 事件的根本概念與運算事件的根本概念與運算 l 概率與統計概率定義概率與統計概率定義l 互斥事件與對立事件的概率互斥事件與對立事件的概率本節的重點本節的重點1.1-1 1.1-1 事件的概念與運算事件的概念與運算 一、一、 隨機實驗隨機實驗(2) (2) 隨機實驗的特征:隨機實驗的特

7、征: 在一樣條件下,實驗可反復進展;在一樣條件下,實驗可反復進展; 至少有兩種不同的結果,且各種結果是預至少有兩種不同的結果,且各種結果是預先可以明確的;先可以明確的; 每次實驗至少有一個結果出現,且出現哪每次實驗至少有一個結果出現,且出現哪個結果帶有偶爾個結果帶有偶爾( (隨機隨機) )性。性。1. 1. 統計學研討的對象:隨機景象統計學研討的對象:隨機景象2. 2. 隨機實驗及其特征隨機實驗及其特征 (1) (1) 隨機實驗:對隨機景象的察看。隨機實驗:對隨機景象的察看。參看前例參看前例例如例如1. 1. 在平面上投擲一個硬幣,察看其在平面上投擲一個硬幣,察看其出現的結果正面、反面。出現的

8、結果正面、反面。2. 2. 用某藥治療某病患者,察看其治用某藥治療某病患者,察看其治療的結果療的結果( (無效、有效、痊愈無效、有效、痊愈) )。3. 3. 袋中有袋中有5 5個球,從中抽出個球,從中抽出1 1球。在球。在不同條件下,察看抽到紅球、白球不同條件下,察看抽到紅球、白球的結果。的結果。 2 2個白球和個白球和3 3個紅球個紅球 ; 5 5個球都是紅球個球都是紅球 ;前往 5 5個球都是白球個球都是白球 。在一定條件下,一次實驗中:在一定條件下,一次實驗中: 隨機事件:能夠出現、能夠不出現的結果隨機事件:能夠出現、能夠不出現的結果,用大寫的,用大寫的A A、B B等表示。等表示。 必

9、然事件:一定出現的結果,記為必然事件:一定出現的結果,記為 ( (讀音:讀音:omegaoumiga)omegaoumiga)。 不能夠事件:一定不出現的結果,記為不能夠事件:一定不出現的結果,記為(讀音:讀音:omicronoumaikran)omicronoumaikran)。二、二、 事件的概念事件的概念1.1-1 1.1-1 事件的概念與運算事件的概念與運算 三、三、 事件的并與交運算事件的并與交運算(1) (1) 兩個事件兩個事件 A A 與與 B B 的并事件的并事件( (記為記為 A+B) A+B):A+B =AA+B =A與與B B中至少有一個發生中至少有一個發生 1. 1.

10、事件的并運算事件的并運算( (并事件并事件) ):= A1= A1、A2A2、AnAn中至少有一個發中至少有一個發生生 1niiA(2) n(2) n個事件個事件 A1 A1、A2A2、An An 的并事件的并事件 :1niiA注:希臘字母注:希臘字母 ( (讀音讀音sigmasigma)sigmasigma)的數學含義的數學含義 = A1 + A2 + + An = A1 + A2 + + An n n個事件的并事件個事件的并事件 = 12 + 31 + + 28 = 12 + 31 + + 28 n n個數的和個數的和1niix1niiA(1) (1) 兩個事件兩個事件 A A 與與 B

11、B 的交事件的交事件( (記為記為 A B) A B)A B = A A B = A 與與 B B 同時發生同時發生 2. 2. 事件的交運算事件的交運算( (交事件交事件) ): = A1 = A1、A2A2、AnAn同時發同時發生生 1niiA注:希臘字母注:希臘字母 ( (讀音讀音 pi pai ) pi pai )的數學含義的數學含義 = A1 A2 An = A1 A2 An n n個事件的交事件個事件的交事件 = 23 = 23 35 35 42 42 n n個數的乘積個數的乘積1niiA1niix(2) n(2) n個事件個事件 A1 A1、A2A2、An An 的交事件的交事件

12、 :1niiA例題例題 四個秀才同時進京考四個秀才同時進京考進士進士1. 1. 能夠出現的結果能夠出現的結果: : A0= A0=四人一個都不中四人一個都不中 A1= A1=只需一個考中只需一個考中 A2= A2=只需一半考中只需一半考中 A3= A3=只需一個考不中只需一個考不中 A4= A4=四人一同考中四人一同考中 2. 2. 事件滿足的關系事件滿足的關系: :恣意兩個事件不能夠同恣意兩個事件不能夠同時發生;時發生;在一次察看中,五個事在一次察看中,五個事件至少有一個事件一件至少有一個事件一定會發生。即定會發生。即A0+A1+A2+A3+A4+A5 A0+A1+A2+A3+A4+A5 一

13、定會發生。一定會發生。四、互斥事件及對立事件四、互斥事件及對立事件 假設事件假設事件 A A、B B 滿足下面兩個條件滿足下面兩個條件:事件的互斥事件的互斥( (互不相容互不相容) )性性(1) (1) 假設兩事件假設兩事件 A A 和和 B B 滿足:滿足: A B = A B = 稱事件稱事件 A A 與與 B B 為互斥事件為互斥事件( (或互不相容事件或互不相容事件) )。(2) (2) 多個事件的兩兩互斥性:多個事件的兩兩互斥性:假設假設 A1 A1、A2A2、An An 中恣意兩事件中恣意兩事件 Ai Ai、Aj Aj 滿足滿足Ai Aj = ( i j )Ai Aj = ( i

14、j )稱稱 A1 A1、A2A2、AnAn滿足兩兩互斥性。滿足兩兩互斥性。(1) A B = (2) A + B =(1) A B = (2) A + B =稱稱 A A 與與 B B 為對立事件,記為對立事件,記 A A 的對立事件為的對立事件為 。A例例1-1 1-1 對甲、乙、丙三人進展某項檢對甲、乙、丙三人進展某項檢查,令查,令A=A=甲正常甲正常 、B=B=乙正常乙正常 、C=C=丙正常丙正常 。 判別事件與事件能否為對立事件。判別事件與事件能否為對立事件。 用用 A A、B B、C C 表示以下各個事件:表示以下各個事件: 只需甲正常;只需甲正常; 只需甲乙正常;只需甲乙正常; 三

15、人都正常;三人都正常; 至少兩人不正常;至少兩人不正常; 至多一人正常;至多一人正常; 至少一人不正常。至少一人不正常。 只需甲正常只需甲正常=CBACBACBACBACBA CBA CBCABA 由于由于()() O () ()ABC A+B+CABCA+B+C所以事件與事件為對立事件。所以事件與事件為對立事件。 只需甲乙正常只需甲乙正常=CAB 三人都正常三人都正常=ABC 至少二人不正常至少二人不正常= 至多一人正常至多一人正常= 至少一人不正常至少一人不正常= 判別事件與事件能否為對立事件判別事件與事件能否為對立事件解解 1. 1.用用 A A、B B、C C 表示以下各個事件表示以下

16、各個事件 至少甲乙不正常至少甲乙不正常 或或 至少甲丙不正常至少甲丙不正常 或或 至少乙丙不正常至少乙丙不正常 三人不正常三人不正常 或或 只需甲正常只需甲正常 或或 只需乙正常只需乙正常 或或 只需丙正常只需丙正常 至少甲不正常至少甲不正常 或或 至少乙不正常至少乙不正常 或或 至少丙不正常至少丙不正常 1.1-2 1.1-2 概率的定義與運算概率的定義與運算一、概率與頻率一、概率與頻率1. 1. 概率:一次實驗中,描畫隨機事件發生能概率:一次實驗中,描畫隨機事件發生能夠性大小的數量夠性大小的數量( (用用 P(A) P(A) 表示事件表示事件 A A 的的概率概率) )。 2. 2. 頻率

17、:在頻率:在 n n 次一樣的實驗中,事件次一樣的實驗中,事件 A A 出現的次數出現的次數 mA mA與實驗次數與實驗次數 n n 的比值的比值 mA/n mA/n。(1) (1) 其中事件其中事件 A A 出現的次數出現的次數 mA mA,叫頻數,叫頻數;(2) (2) 頻率頻率 mA/n mA/n記為記為 ,即,即 。 ( )nfA( )AnmfAn試驗者試驗者拋幣次數拋幣次數n n正面向上正面向上 次次 數數 頻率頻率 De Morgan208410610.5181Bufen404020480.5069費費 勒勒1000049790.4979Pearson24000120190.500

18、5羅曼諾夫斯基羅曼諾夫斯基80640396990.4923)( Afn錢錢擲擲拋拋幣幣 實實 驗驗例如例如 用某藥治療某疾病用某藥治療某疾病400400例,有例,有260260例痊愈例痊愈。那么該藥的痊愈率那么該藥的痊愈率 。1.1.定義定義 在在 n n 次一樣的實驗中,隨著次一樣的實驗中,隨著 n n 的增大,事件的增大,事件 A A 的頻率的頻率 那么稱此常數那么稱此常數 a a 為事件為事件 A A 的概率,即的概率,即 。二、統計定義及其運用二、統計定義及其運用.)()(nmAfAPAn( )P Aa穩定在某個常數穩定在某個常數 a a 附近擺動。附近擺動。2.2.統計定義的運用:當

19、實驗次數統計定義的運用:當實驗次數 n n 足夠大足夠大時,時,(65%P260痊愈)400)(Afn3. 3. 概率的根本性質概率的根本性質1)(P0A(1)(1)(2) P() = 1(2) P() = 1,P() = 0P() = 0。三、并事件的概率三、并事件的概率( (加法定理加法定理) )1. 1. 互斥事件的加法定理互斥事件的加法定理(1) (1) 假設事件假設事件A A、B B互斥互斥( (即即 AB =), AB =),那那么么P(A+B) = P(A) + P(B) P(A+B) = P(A) + P(B) 。(2) (2) 假設假設n n個事件個事件A1A1、A2A2、A

20、nAn兩兩互兩兩互斥,那么斥,那么2. 2. 對立事件的概率:對立事件的概率:( )1( )P AP A 1211()()()()()nniiniiPAP AP AP AP A( (對立事件滿足對立事件滿足 ) ) AAA A ( (多個事件的并事件多個事件的并事件 ) )121niniAAAA例例1-2 1-2 同時投擲兩顆色子,事件同時投擲兩顆色子,事件Ai=Ai=擲出擲出i i點點 。知知解解 P(B)=P(A2+A3)=P(A2)+P(A3)=1/36+2/36P(B)=P(A2+A3)=P(A2)+P(A3)=1/36+2/36=1/12=1/12由于由于 B B、D D 滿足滿足

21、B D = B D =,B + D =B + D =,為對立事,為對立事件。件。P(D)=1P(D)=1P(B)=1P(B)=11/12=11/121/12=11/12事件事件B=B=擲出小于擲出小于4 4的點的點 、事件、事件C=C=擲出大于擲出大于9 9的點的點 ,事件事件D=D=擲出大于擲出大于3 3的點的點 ,求,求P(B)P(B)、P(C)P(C)、P(D)P(D)。P(C)=P(A10+A11+A12)=P(A10)+P(A11)+P(A12)P(C)=P(A10+A11+A12)=P(A10)+P(A11)+P(A12) =3/36+2/36+1/36=1/6 =3/36+2/3

22、6+1/36=1/6(1)/36(28)()(13)/36(812)iiiP Aii 1. 1. 事件的獨立性事件的獨立性(1) (1) 定義定義 假設事件假設事件 A A 的發生與否對事件的發生與否對事件 B B 不產生任何影響,稱事件不產生任何影響,稱事件 A A 與事件與事件 B B 獨立。獨立。(2) (2) 假設事件假設事件 A A 與與 B B 獨立,下面各事件獨立,下面各事件間也獨立:間也獨立:四、事件的獨立性及其運用四、事件的獨立性及其運用ABABAB與與與 2. 2. 事件事件 A A 與與 B B 獨立的充分必要條件獨立的充分必要條件P(B|A) = P(B)P(B|A)

23、= P(B)。(1) P(B|A)= P(1) P(B|A)= P(在在 A A 發生的條件下發生的條件下 B B 發生發生) ),稱稱 P(B|A) P(B|A) 為事件為事件 B B 的條件概率;的條件概率;(2) (2) 相對地稱相對地稱 P(B) P(B) 為為 無條件概率。無條件概率。例例1-3 1-3 為研討某方劑對風熱外感證的療為研討某方劑對風熱外感證的療效,隨機選取效,隨機選取400400名患者,有的服藥、有名患者,有的服藥、有的不服藥,一段時間后得治療結果如表的不服藥,一段時間后得治療結果如表,試判別此方劑對風熱外感證能否有效,試判別此方劑對風熱外感證能否有效。治療結果治療結

24、果(A)(A)治療方法(治療方法(B B)合合 計計B B1 1( (服藥)服藥)B B2 2( (不服藥不服藥) )A A1 1(有效)(有效)127127190190317317A A2 2(無效)(無效)333350508383合合 計計160160240240400400解解 無條件概率無條件概率 P(A1) = 317/400 P(A1) = 317/400 79.3%79.3% 條件概率條件概率 P(A1|B1)= 127/160 P(A1|B1)= 127/160 79.4%79.4%由于由于 P(A1) 79.3% P(A1|B1) P(A1) 79.3% P(A1|B1) 7

25、9.4% 79.4% ,治療結果與治療方法獨立,此方劑無效。治療結果與治療方法獨立,此方劑無效。 1. 1. 對甲、乙、丙三人同時進展對甲、乙、丙三人同時進展 X X 光檢查,令光檢查,令A=A=甲正常甲正常 、B=B=乙正常乙正常 、C=C=丙正常丙正常 。用用A A、B B、C C表示以下各個事件:表示以下各個事件: 只需甲不正常;只需甲不正常; 只需一人正常;只需一人正常; 只需兩人正常;只需兩人正常; 至少一人不正常至少一人不正常。課堂練習課堂練習1 20211 2021年年6 6月月1111日日2. 2. 經調查經調查950950個非聾耳人中有個非聾耳人中有7676人色盲,人色盲,5

26、050個聾耳人中有個聾耳人中有4 4人色盲。試分析,聾耳與色人色盲。試分析,聾耳與色盲能否有關。盲能否有關。課堂練習課堂練習1 1答案答案 ; ; ; 。ABCABCABCABCBCACBACABABC2. 2. 令令 A = A = 聾耳聾耳 、B = B = 色盲色盲 。色盲的條件概率色盲的條件概率 P(B|A) = 4/50 = 8 P(B|A) = 4/50 = 8 % %色盲的無條件概率色盲的無條件概率 P(B) = (76+4)/(950+50) = 8 %P(B) = (76+4)/(950+50) = 8 %因因 P(B|A) = P(B), P(B|A) = P(B), 所以

27、色盲與聾耳無關所以色盲與聾耳無關。1.2 1.2 總體與樣本總體與樣本1.2-1 1.2-1 總體的分布與數字特征總體的分布與數字特征 概率函數、概率密度函數和分布函數概率函數、概率密度函數和分布函數 總體均數、總體方差及規范差總體均數、總體方差及規范差1.2-2 1.2-2 樣本與樣本的描畫統計量樣本與樣本的描畫統計量 簡單隨機樣本簡單隨機樣本樣本樣本 樣本均數、樣本方差及規范差樣本均數、樣本方差及規范差1.2-3 1.2-3 幾個重要的幾個重要的( (抽樣抽樣) )概率分布概率分布一、一、 總體與個體總體與個體 1. 1. 隨機變量及其分類隨機變量及其分類 隨機變量:用一個變量的不同取值表

28、示隨隨機變量:用一個變量的不同取值表示隨機實驗中能夠出現的各個根身手件得到的變機實驗中能夠出現的各個根身手件得到的變量,通常用大寫的英文字母量,通常用大寫的英文字母 X X、Y Y、Z Z 等表等表示。示。 隨機變量的分類:隨機變量的分類: 1) 1) 離散型隨機變量:變量取值為有限多個離散型隨機變量:變量取值為有限多個或可列或可列( (取值可依次從小到大陳列取值可依次從小到大陳列) )個的變量個的變量。2) 2) 延續型隨機變量:變量取值充溢一個區延續型隨機變量:變量取值充溢一個區間的隨機變量。間的隨機變量。例如例如1.2-1 1.2-1 總體的分布與數字特征總體的分布與數字特征3. 3.

29、總體與個體概念總體與個體概念(1) (1) 個體:滿足隨機實驗條件的每一個對象。個體:滿足隨機實驗條件的每一個對象。(2) (2) 總體:滿足隨機實驗條件的全體對象,用總體:滿足隨機實驗條件的全體對象,用察看目的察看目的( (隨機變量隨機變量)X )X 或或 Y Y 等表示。等表示。2. 2. 根身手件根身手件( (滿足下面兩條的事件滿足下面兩條的事件) ):(1) (1) 每次隨機實驗至少有一個事件發生每次隨機實驗至少有一個事件發生;(2) (2) 每次隨機實驗只需一個事件發生。每次隨機實驗只需一個事件發生。例如例如 在臨床中,研討某藥治療高血壓病的效果。在臨床中,研討某藥治療高血壓病的效果

30、。 1. 1. 每一個高血壓患者,即為研討的個體;每一個高血壓患者,即為研討的個體; 2. 2. 全體高血壓患者,即為研討的總體;全體高血壓患者,即為研討的總體; 3. 3. 可用舒張壓的降壓值可用舒張壓的降壓值 X X 來表示。來表示。(2) (2) 概率函數的性質:概率函數的性質:1) 1) 函數值在函數值在 0 0 到到 1 1 之間,即之間,即 0 pi 1 0 pi 1;假設用假設用X=iX=i來表示來表示 擲出擲出i i點點 ,那么可表,那么可表示成示成例如例如 同時投擲兩顆色子,用同時投擲兩顆色子,用 Ai Ai 表表示示 擲出擲出i i點點 ,那么,那么(1) (1) 定義定義

31、 假設離散型變量假設離散型變量 X X 的一切能夠取值為的一切能夠取值為,x1x1,x2x2,xixi,xnxn 稱稱 pi = P( X = xi ) (i=1,2,n) pi = P( X = xi ) (i=1,2,n)。 為變量為變量 X X 的的 概率函數。概率函數。 (1)/3628()(13)/36812iiiP Aii 二、總體的概率分布二、總體的概率分布1. 1. 離散型變量的概率函數及性質離散型變量的概率函數及性質(1)/3628()(13)/36 812iiP Xiii 11niip2) 2) 一切函數值的和等于一切函數值的和等于 1 1,即,即 。2. 2. 延續型變量

32、的概率密度函數延續型變量的概率密度函數(1) (1) 概率密度函數定義及其幾何意義概率密度函數定義及其幾何意義1) 1) 定義定義 假設定義在區域假設定義在區域( (,)上的非上的非負函數負函數f(x)f(x),對恣意的區間,對恣意的區間 a, b a, b 都有都有 ()( )baP aXbf x dx2) 2) 定積分定積分 的幾何意義:的幾何意義:( )baf x dx為曲線為曲線y=f(x)y=f(x)在區間在區間 a, b a, b 上上, ,與與 x x 軸所夾曲邊梯形的面積。軸所夾曲邊梯形的面積。 稱變量稱變量 X X 為延續型隨機變量為延續型隨機變量; ; 稱函數稱函數f(x)

33、f(x)為為 X X 的概率密度函數。的概率密度函數。 其中其中 是函數曲線在是函數曲線在aa,bb上與上與 x x 軸圍成的面積。軸圍成的面積。 ( )baf x dx( )yf xab( )baf x dx()P aXb(2) (2) 延續型隨機變量的特點延續型隨機變量的特點1) 1) 在恣意點在恣意點 x x 處的概率值為處的概率值為 0 0,即,即 P(X = x) = 0 P(X = x) = 0;2) P( a X b ) = P( a 2) P( a X b ) = P( a X X b b ) )。 P( x X x ) = 0P( x X x ) = 0;(3) (3) 概率

34、密度函數概率密度函數f(x)f(x)的性質的性質1) 1) 非負性:非負性: f(x) 0 f(x) 0;2) 2) 曲線曲線y=f(x)y=f(x)與與 x x 軸所夾軸所夾 平面圖形的面積值恒為平面圖形的面積值恒為 1 1。 即廣義積分即廣義積分 。( )1f x dx( )y f x( )f x dxx(1) (1) 分布函數的定義分布函數的定義定義定義 對恣意實數對恣意實數 x ( x (,),令,令F(x) = P ( X x )F(x) = P ( X x ) 稱稱 F(x) F(x)為變量為變量 X X 的的 分布函數。分布函數。 注:注:X x X x 表示事件表示事件XX取值

35、不超越取值不超越xx (2) (2) 分布函數的性質:分布函數的性質:1) 0 F(x) 1 1) 0 F(x) 1 ;2) F(2) F() = 0 ) = 0 、 F( F() = 1 ) = 1 ;3) 3) 假設假設 a b a b,那么,那么 P(a X b)= P(a X b)= F(b)F(b) F(a) F(a)。3. 3. 隨機變量的分布函數隨機變量的分布函數P(X2)+P(X=3)= 1 + 0 = P(X2)+P(X=3)= 1 + 0 = 1 1 P(X=0)+P(X=1)+P(X=2)= 1P(X=0)+P(X=1)+P(X=2)= 1例例1-4 1-4 用用 X X

36、 的取值的取值 0 0、1 1、2 2分別表示某藥分別表示某藥治療某疾病的治療某疾病的“無效、無效、“有效和有效和“痊愈痊愈。知。知解解F(0)= P(X0)= P(X=0) = 0.3F(0)= P(X0)= P(X=0) = 0.3F(1)= P(X1)=F(1)= P(X1)=F(2)= P(X2)=F(2)= P(X2)=F(3)= P(X3)=F(3)= P(X3)=P(0X3)= F(3)- F(0)= 1- 0.3 = 0.7P(0X3)= F(3)- F(0)= 1- 0.3 = 0.7P(X=0)+P(X=1)= 0.8P(X=0)+P(X=1)= 0.8P(X=0+X=1)

37、P(X=0+X=1)P(X=0+X=1+X=2)P(X=0+X=1+X=2)P(X2+X=3)P(X2+X=3)求求 F(0) F(0)、F(1)F(1)、F(2)F(2)、F(3)F(3)、P(0X3)P(0X3)。變量變量 x x i i0 01 12 2概率概率 p p i i0.30.30.50.50.20.2(1) (1) 總體均數總體均數:全部個體數值目的的平均:全部個體數值目的的平均值,是以總體分布有關的值,是以總體分布有關的 常數值;常數值;三、總體的數字特征三、總體的數字特征1. 1. 統計學中幾個重要的數字特征統計學中幾個重要的數字特征2. 2. 總體均數、總體方差的意義總

38、體均數、總體方差的意義(1) (1) 均數描畫變量均數描畫變量 X X 取值的平均程度;取值的平均程度;(2) (2) 方差描畫變量方差描畫變量 X X 取值的差別取值的差別( (變異性變異性) )。(2) (2) 總體方差總體方差22:全部個體數值目的與:全部個體數值目的與的的差的平方和的平均值,是確定的差的平方和的平均值,是確定的 常數值;常數值;(3) (3) 總體規范差總體規范差:總體方差的算術平方根。:總體方差的算術平方根。(4) (4) 總體率總體率p p:察看結果事件:察看結果事件A A的概率的概率P(A)P(A)。一、簡單隨機樣本一、簡單隨機樣本( (簡稱簡稱 樣本樣本) )2

39、. 2. 統計學中對樣本的要求:統計學中對樣本的要求: (1) (1) 隨機抽樣隨機抽樣隨機性;隨機性; (2) (2) 樣本中個體間相互獨立樣本中個體間相互獨立獨立性。獨立性。1. 1. 定義定義 稱從總體稱從總體 X X 中抽取的部份個體中抽取的部份個體X1X1,X2X2,XiXi,Xn Xn 為樣本為樣本( (用察看目的用察看目的 Xi Xi 來表示來表示) )。 (1) (1) 樣本容量:樣本中所含個體的個數樣本容量:樣本中所含個體的個數 n n。 (2) (2) 樣本值:樣本中個體的詳細數值目的值樣本值:樣本中個體的詳細數值目的值: : 12,inxxxx1.2-2 1.2-2 樣本

40、與樣本的描畫統計量樣本與樣本的描畫統計量2.2.分類分類( (或計數或計數) )資料:資料:按察看結果的不同分類計數按察看結果的不同分類計數( (個體的個數個體的個數) )所所得到的數據資料。得到的數據資料。 (1) (1) 兩分類資料:只需兩個分類結果的兩分類資料:只需兩個分類結果的資料。資料。 (2) (2) 多分類資料:多于兩個分類結果的多分類資料:多于兩個分類結果的資料。資料。 1) 1) 等級資料:分類結果有順序、等級;等級資料:分類結果有順序、等級; 2) 2) 非等級資料:分類結果無順序、等級非等級資料:分類結果無順序、等級。1. 1. 計量計量( (或定量或定量) )資料:資料

41、: 用定量的方法測得每個個體的數值目的值,用定量的方法測得每個個體的數值目的值,所得的數據資料。所得的數據資料。例如例如二、樣本資料的分類二、樣本資料的分類三、三、 重要的樣本特征統計量重要的樣本特征統計量1. 1. 統計量的概念和特點統計量的概念和特點讀音i:ta (2) (2) 統計量的特點:統計量的特點: 1) 1) 統計量是由樣本構成的隨機變量;統計量是由樣本構成的隨機變量; 2) 2) 樣本值確定后,統計量有確定的值。樣本值確定后,統計量有確定的值。),(21nXXXf不含任何未知參數,稱不含任何未知參數,稱 為統計量。為統計量。(1)(1)定義定義 假設由樣本假設由樣本 X1,X2

42、,Xn X1,X2,Xn 構成的構成的變量變量 ,設設 X1,X2,Xn X1,X2,Xn 是容量為是容量為 n n 的一個樣的一個樣本本12111()niniXXXXXnn(1) (1) 稱統計量稱統計量 為樣本均數。為樣本均數。X 2. 2. 計量資料重要特征的統計量計量資料重要特征的統計量(2) (2) 記記 、 ,稱,稱niiXXSS12)(SSnS112 SS SS為離均差平方和,簡稱離差平方和;為離均差平方和,簡稱離差平方和; S2 S2 為樣本方差;為樣本方差; S S 為樣本規范差,為樣本規范差, 。2SS 3. 3. 兩分類計數資料特征的重要統計量兩分類計數資料特征的重要統計

43、量 在在 n n 次一樣的實驗中,次一樣的實驗中,X X 為事件為事件A A出現的次出現的次數。數。 (1)(1)樣本率樣本率( (事件事件A A的頻率的頻率) : ) : 。p nXp/ 4. 4. 樣本均數、樣本率的抽樣誤差樣本均數、樣本率的抽樣誤差 (1)(1)樣本均數的規范誤樣本均數的規范誤 : 。xSnSSx/(2)(2)樣本率的規范誤樣本率的規范誤 : 。pSnppSp/ ) 1 ( 5. 5. 樣本均數、樣本方差的意義樣本均數、樣本方差的意義(1) (1) 樣本均數:又叫算術均數,描畫樣本中個樣本均數:又叫算術均數,描畫樣本中個體目的值的平均程度和取值的集中趨勢;體目的值的平均程

44、度和取值的集中趨勢;(2) (2) 離差平方和離差平方和 SS SS、方差、方差 S2 S2 和規范差和規范差 S S:描畫樣本中個體目的值的偏向程度描畫樣本中個體目的值的偏向程度( (變異性變異性) )。2. 2. 伯努利定理伯努利定理 在在 n n 次一樣的伯努利實驗次一樣的伯努利實驗中,用變量中,用變量 X X 事表示件事表示件 A A 出現的次數,出現的次數,那么變量那么變量 X X 服從參數為服從參數為 n n 和和 p p 的二項的二項分布分布 B( n,p ) B( n,p )。即。即稱稱 X X 服從參數服從參數 n n,p ( 0 p 1 )p ( 0 p 30% 15/30

45、 = 50% 30%,判別驗方是有效的。,判別驗方是有效的。假設確實無效,那么判別錯誤的假設確實無效,那么判別錯誤的( (顯著性顯著性) )概率概率 P P :P = P(X15)= 1P = P(X15)= 1P(X14) = 0.01694P(X14) = 0.01694由于判別錯誤的概率很小,可以為判別正確。由于判別錯誤的概率很小,可以為判別正確。“=BINOMDIST(14,30,0.3,1)“=BINOMDIST(14,30,0.3,1) 0.98306 0.98306 曲線曲線y=f(x)y=f(x)關于直線關于直線 x= x=對稱,且對稱,且f()f()最大。最大。 的值越大,曲

46、線的外形越矮胖。的值越大,曲線的外形越矮胖。(1) (1) 正態分布:假設變量正態分布:假設變量 X X 的概率密度函的概率密度函數為數為a 稱變量稱變量 X X 服從參數為服從參數為和和(0)(0)的正的正態分布,記為態分布,記為 X XN(N(,2 )2 )。正態分布及其密度函數的幾何特點正態分布及其密度函數的幾何特點2a 曲線曲線y=f(x)y=f(x)關于直線關于直線 x= x=對稱,且對稱,且f()f()最大;最大; 的值越大,曲線的外形越矮胖。的值越大,曲線的外形越矮胖。2121( )()2xfxex 二、正態分布二、正態分布N(,2)N(,2) (2) (2) 密度函數密度函數f

47、(x)f(x)的幾何特點的幾何特點0正態總體的均數和方差正態總體的均數和方差假設總體假設總體 X X 服從正態分布服從正態分布 ,那,那么么2( ,)N (1) (1) 總體的均數就是參數總體的均數就是參數 ;(2) (2) 總體的規范差就是參數總體的規范差就是參數 。?0.025(1.96 ) 1(1.96 )PXPX 例例1-6 1-6 隨機變量隨機變量 X XN(,2)N(,2),知,知 P( X +1.96)= 0.025 P( X +1.96)= 0.025 (1) (1) 求求 F( F(1.96)1.96)和和 F(+1.96) F(+1.96);(2) (2) 求求 P(|X

48、P(|X|1.96)|1.96)。解解 (1) (1)(1.96 )F(1.96 )0.025P X(1.96 )P X(1.96 )F1(1.96 ) 0.975P X 2 2(| 1.96 )P X(1.961.96 )(1.96 )(1.96 )0.975 0.025 0.950PXFF 01.961.9695%0.0253. 3. 規范正態分布規范正態分布N(0N(0,1)1)(2) (2) 概率密度函數:概率密度函數: ; 密度函數特點:密度函數特點: ;(3) (3) 分布函數:分布函數: 。2121( )2uue( )u0( )( )uux dx(1) (1) 變量記為變量記為

49、u( u(或或z)z),即,即u uN(0N(0,1)1)。()( )uuu( )ux dx( )u010.5uu1. 1. 卡方分布卡方分布(3) (3) 密度函數的幾何特點密度函數的幾何特點 1) 1) 偏態的峰狀曲線;偏態的峰狀曲線; 2) 2) 在在n-2n-2處獲得最大值。處獲得最大值。定義定義 設設 n n 個相互獨立變量個相互獨立變量 X1 X1、X2X2、Xn Xn , 均服從規范正態分布均服從規范正態分布 N(0,1) N(0,1)。(1) (1) 稱變量稱變量22服從自在度為服從自在度為 n n 的卡方分布,的卡方分布,222212nXXX(2) (2) 自在度自在度 n

50、n ,用,用 df( df(或或f) f) 表示表示。2n 2n02n 三、其它幾個重要的抽樣分布三、其它幾個重要的抽樣分布22( ) n記為記為2. t 2. t 分布的定義和幾何特點分布的定義和幾何特點(2) t(2) t分布密度函數的幾何特點分布密度函數的幾何特點: : 1) 1) 關于縱軸對稱的峰狀曲線關于縱軸對稱的峰狀曲線; 2) 2) 當當nn時,時,f(t)(t)f(t)(t)。(3) (3) 函數函數f(t)f(t)為偶函數,即為偶函數,即f(-t) = f(t)f(-t) = f(t)。 (1) t (1) t 分布分布( (又叫學生分布又叫學生分布) ) 設兩獨立的變量設兩

51、獨立的變量 U UN(0,1)N(0,1)、V V2(n) 2(n) 。tUV n1) 1) 稱變量稱變量 t t 的分布為的分布為 t t 分布,記為分布,記為 t tt(n)t(n)。2) 2) 其中參數其中參數 n n 為自在度,用為自在度,用 df df 表示表示。( )f t03. F3. F分布的定義和幾何特點分布的定義和幾何特點(2) (2) 密度函數的幾何特點密度函數的幾何特點 1) 1) 偏態的峰狀曲線;偏態的峰狀曲線; 2) 2) 在在x=1x=1附近獲得最大值附近獲得最大值。(1) F(1) F方分布的定義方分布的定義 設兩個相互獨立的變量設兩個相互獨立的變量 , , 。

52、2212()()UnVn12UnFVn1) 1) 稱變量稱變量 F F 的分布為的分布為 F F分布,記為分布,記為F FF(n1,n2)F(n1,n2)。2) 2) 其中參數其中參數 n1 n1、n2n2為第一、第二自在度。為第一、第二自在度。10(3) (3) 性質:性質:1/F1/FF(n2,n1)F(n2,n1)。語法語法 FDIST(x ,df1 FDIST(x ,df1,df2)df2);運用:計算概率運用:計算概率 P( X x) P( X x)。四、四、ExcelExcel中常用的概率分布函數中常用的概率分布函數1. 1. 規范正態分布的分布函數規范正態分布的分布函數2. 2.

53、 卡方分布的分布函數卡方分布的分布函數語法語法 NORMSDIST( x ) NORMSDIST( x );運用:運用:“=NORMSDIST( x )=NORMSDIST( x ),計算概率,計算概率 P( X x) P( X x)。 3. t 3. t 分布的分布函數分布的分布函數4. F4. F分布的分布函數分布的分布函數Excel語法語法 CHIDIST(x ,df) CHIDIST(x ,df);運用:計算概率;運用:計算概率 P( X x) P( X x)。語法語法 TDIST(x ,df,tails) TDIST(x ,df,tails);運用:計算概率運用:計算概率 P( X

54、x) P( X x)、P(|X| x)P(|X| x)。tails=1(tails=1(單單) )、2(2(雙雙) )變量取值變量取值deg_freedom deg_freedom 自在度自在度變量取值變量取值df1df1、df2 df2 第第1 1、2 2自在度自在度課堂練習課堂練習2 20212 2021年年6 6月月1111日日 知用某民間驗方治療某疾病的痊愈率知用某民間驗方治療某疾病的痊愈率p =0.3p =0.3,用,用 X X 表示治療表示治療 20 20 人中的痊愈人數。人中的痊愈人數。 求變量求變量 X X 的概率函數的概率函數 P(X = k) P(X = k); 求以下各事

55、件的概率:求以下各事件的概率: 有兩人痊愈的概率有兩人痊愈的概率 P(X=2) P(X=2); 不少于不少于6 6人痊愈的概率人痊愈的概率 P(X6) P(X6); 不多于不多于3 3人痊愈的概率人痊愈的概率 P(X3) P(X3)。 提示:伯努利定理、二項分布的概率函數。提示:伯努利定理、二項分布的概率函數。1.3 1.3 總體參數的區間估計總體參數的區間估計l 總體均數、方差的好估計量總體均數、方差的好估計量 l 總體率的好估計量總體率的好估計量l 正態總體均數的區間估計正態總體均數的區間估計本節的重點本節的重點l 總體率的區間估計總體率的區間估計(1)(1)無偏性:無偏性: 與與 無系統

56、無系統( (本質上的本質上的) )偏向;偏向;一、總體參數的點估計一、總體參數的點估計 定義:定義: 設設 是總體的未知參數,用樣本是總體的未知參數,用樣本 X1 X1、X2X2、Xn Xn 構成的統計量構成的統計量 來描畫總體參數來描畫總體參數 , (1) (1) 稱稱 為總體參數為總體參數 的點估計量;的點估計量; (2) (2) 稱估計量的值為估計值,仍記稱估計量的值為估計值,仍記 。2.2.點估計量的評價規范點估計量的評價規范(2)(2)有效性:無偏估計量中偏向最小的估計量。有效性:無偏估計量中偏向最小的估計量。3.3.總體均數、方差和總體率的好估計量總體均數、方差和總體率的好估計量(

57、1) (1) , (2) (2) ,(3) (3) 。X22S/pm n( )f x0 x(2) (2) 雙側界值和單側界值雙側界值和單側界值 假設變量假設變量 X X 的密度函數的密度函數f(x)f(x)為偶函數為偶函數: 1) 1) 稱滿足稱滿足 P(|X| x/2 ) = P(|X| x/2 ) = 的的 x/2 x/2 為變量為變量 X X 的的雙側界值;雙側界值; 2) 2) 稱稱 x x 為變量為變量 X X 的單側界值。的單側界值。( )f x0 x1. 1. 界值界值( (又叫臨界值又叫臨界值) ) (1) (1) 界值的定義界值的定義 對恣意常數對恣意常數(01),(050)(n50)的區間估計近似法的區間估計近似法4. 4. 總體率的區間估計總體率的區間估計)(2pSupnppSp/ ) 1 ( 樣本率樣本率 : p nmp ),(22ppSupSup 其中其中 是規范正態分布的雙側界值。是規范正態分布的雙側界值。2u其中其中 n n 是實驗次數,是實驗次數,m m 是事件是事件 A A 出現的次出現的次數。數。(*(1)/n)0.5pp 的計算:的計算: pS(3)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論