用樣本頻率分布估計總體分布_第1頁
用樣本頻率分布估計總體分布_第2頁
用樣本頻率分布估計總體分布_第3頁
用樣本頻率分布估計總體分布_第4頁
用樣本頻率分布估計總體分布_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、用樣本的頻率分用樣本的頻率分布估計總體分布布估計總體分布復習舊知識復習舊知識1.隨機抽樣包括哪幾種?隨機抽樣包括哪幾種?2.簡單隨機抽樣又包括幾種方法,適用于什么樣簡單隨機抽樣又包括幾種方法,適用于什么樣的個體,一般步驟,優點和缺點?的個體,一般步驟,優點和缺點?3.系統抽樣適用于什么樣的個體,一般步驟,系統抽樣適用于什么樣的個體,一般步驟,優點和缺點?優點和缺點?4.分層抽樣適用于什么樣的個體,一般步驟,分層抽樣適用于什么樣的個體,一般步驟,優點和缺點?優點和缺點?復習舊知識復習舊知識1,拋擲硬幣的大量重復試驗的頻率分布表: 0.501 1 0.498 9樣本容量為72 088什么叫頻率分布

2、條形圖?頻數?頻率?0.10.20.30.40.50.60.701試驗結果頻率“正面向上”記為0“反面向上”記為135 96436 124反面向上反面向上正面向上正面向上頻率頻率頻數頻數實驗結果實驗結果注意點:各直方長條的寬度要相同, 寬窄與頻率無關;相鄰長條之間的間隔要適當;頻率試驗結果01正面向上 反面向上0.5條形圖的高度就是頻率; 當試驗次數無限增大時,兩種試驗結果的頻率就成為相應的概率:0.5反面向上(記為反面向上(記為1)0.5正面向上(記為正面向上(記為0)概率概率試驗結果試驗結果 排除了抽樣造成的誤差,精確地反映了總體取值的概率分布規律這種總體取值的概率分布規律稱為總體分布 l

3、1.頻率分布與總體分布的關系:頻率分布與總體分布的關系:l通過樣本的頻數分布、頻率分布可以估計總體的概通過樣本的頻數分布、頻率分布可以估計總體的概率分布率分布.l研究總體概率分布往往可以研究其樣本的頻數分布、研究總體概率分布往往可以研究其樣本的頻數分布、頻率分布頻率分布.l2.總體分布:總體取值的概率分布規律總體分布:總體取值的概率分布規律 l在實踐中,往往是從總體中抽取一個樣本,用樣本的在實踐中,往往是從總體中抽取一個樣本,用樣本的頻率分布去估計總體分布頻率分布去估計總體分布 一般地,樣本容量越大,這種一般地,樣本容量越大,這種估計就越精確估計就越精確 練 習1.在100名學生中,每人參加一

4、個運動隊,其中參加田徑 隊的有13人,參加體操隊的有10 人,參加足球隊的 有24人,參加籃球隊的有27人,參加排球隊的有15人, 參加乒乓球隊的有11人.(1)列出學生參加各運動隊的頻率分布表;(2)畫出表示頻率分布的條形圖. 試驗結果試驗結果 頻頻 數數頻率頻率參加田徑隊參加田徑隊(1)130.13參加體操隊參加體操隊(2)100.10參加足球隊參加足球隊(3)240.24參加籃球隊參加籃球隊(4)270.27參加排球隊參加排球隊(5)150.15參加乒乓球隊參加乒乓球隊(6)110.11解:頻率分布表如下:頻率分布條形圖如下頻率分布條形圖如下:152346頻率結果 例例 某市政府為了節約

5、生活用水,計劃在本市試某市政府為了節約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水行居民生活用水定額管理,即確定一個居民月用水量標準量標準a ,a ,用水量不超過用水量不超過a a的部分按平價收費,超過的部分按平價收費,超過a a的部分按議價收費。的部分按議價收費。 如果希望大部分居民的日常生活不受影響,那如果希望大部分居民的日常生活不受影響,那 么標準么標準a a定為多少比較合理呢定為多少比較合理呢? 為了較合理地確定這個標準,你認為需要做為了較合理地確定這個標準,你認為需要做 哪些工作?哪些工作? 思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息

6、? 通過抽樣,我們獲得了通過抽樣,我們獲得了100100位居民某年的月平均用水量位居民某年的月平均用水量( (單位:單位:t) t) ,如下表:,如下表: 1.1.求極差(即一組數據中最大值與最小值的差)求極差(即一組數據中最大值與最小值的差) 2.2.決定組距與組數決定組距與組數組數組數= = 4.3 4.3 - - 0.2 = 4.10.2 = 4.14.14.10.50.5 = 8.2 = 8.2組距組距極差極差=3.3.將數據分組將數據分組0 0,0.50.5 ) ),0.50.5,1 1 ) ),4 4,4.54.5 組數:將數據分組,當數據在100個以內時, 按數據多少常分5-12

7、組。組距:指每個小組的兩個端點的距離, 4.4.列頻率分布表列頻率分布表100100位居民月平均用水量的頻率分布表位居民月平均用水量的頻率分布表注意:這里出來了條形圖中條形的寬度。頻率不僅與條形的高度有關,而且與它的寬度有關。為了使選擇不同寬度的總體分布相同,我們用另一種圖形表示,即直方圖用面積表示概率。頻率頻率/組距組距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.畫頻率分布直方圖畫頻率分布直方圖小長方形的面積小長方形的面積組距組距頻率頻率=組距組距頻率頻率= =注意:這里的縱坐標不是頻率,而是頻率/

8、組距;某個區間上的概率用這個區間的面積表示;直方圖直方圖思考:所有小長方形的面積之和等于?思考:所有小長方形的面積之和等于?探究:探究: 同樣一組數據,如果組距不同,橫軸、縱軸的單位同樣一組數據,如果組距不同,橫軸、縱軸的單位不同,得到的圖的形狀也會不同。不同的形狀給人以不不同,得到的圖的形狀也會不同。不同的形狀給人以不同的印象,這種印象有時會影響我們對總體的判斷。分同的印象,這種印象有時會影響我們對總體的判斷。分別以別以1 1和和0.10.1為組距重新作圖,然后談談你對圖的印象。為組距重新作圖,然后談談你對圖的印象。 一一、求求極差極差,即數據中最大值與最小值的差即數據中最大值與最小值的差二

9、、決定二、決定組距組距與組數與組數 :組距:組距=極差極差/組數組數三、分組三、分組,通常對組內數值所在區間,通常對組內數值所在區間,取取左閉右開左閉右開區間區間 , 最后一組取閉區間最后一組取閉區間四、登記四、登記頻數頻數,計算計算頻率頻率,列出列出頻率分布表頻率分布表畫一組數據的頻率分布直方圖畫一組數據的頻率分布直方圖, ,可以按以下的可以按以下的步驟進行步驟進行: :五、畫出五、畫出頻率分布直方圖頻率分布直方圖(縱軸表示(縱軸表示頻率組距頻率組距)頻率分布直方圖如下頻率分布直方圖如下:月均用水量月均用水量/t頻率頻率組距組距0.100.200.300.400.500.511.5 22.5

10、33.544.5連接頻率分布直方圖連接頻率分布直方圖中各小長方形上端的中各小長方形上端的中點中點,得到得到頻率分布折頻率分布折線圖線圖利用樣本頻分布對總體分布進行相應估計利用樣本頻分布對總體分布進行相應估計(3)當樣本容量無限增大,組距無限縮小,)當樣本容量無限增大,組距無限縮小,那么頻率分布直方圖就會無限接近于一條光滑那么頻率分布直方圖就會無限接近于一條光滑曲線曲線總體密度曲線總體密度曲線。(2)樣本容量越大,這種估計越精確。)樣本容量越大,這種估計越精確。(1)上例的樣本容量為)上例的樣本容量為100,如果增至,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增其頻率分布直方圖的

11、情況會有什么變化?假如增至至10000呢?呢?2.2 總體分布的估計總體分布的估計頻率頻率組距組距月均用水量月均用水量 (mm)ab 當樣本容量無限增大,分組的組距無限縮小,那么頻率分當樣本容量無限增大,分組的組距無限縮小,那么頻率分布直方圖就會無限接近一條光滑曲線布直方圖就會無限接近一條光滑曲線總體密度曲線總體密度曲線總體在區間總體在區間 內取值的概率內取值的概率),(baS總體密度曲線總體密度曲線頻率頻率組距組距月均用月均用水量水量/tab (圖中陰影部分的面積,表示總體在(圖中陰影部分的面積,表示總體在某個區間某個區間 (a, b) 內取值的百分比)。內取值的百分比)。 用樣本分布直方圖

12、去估計相應的總體分布時,用樣本分布直方圖去估計相應的總體分布時,一般樣本容量越大,一般樣本容量越大,頻率分布直方圖頻率分布直方圖就會無限接就會無限接近近總體密度曲線總體密度曲線,就越精確地反映了總體的分布,就越精確地反映了總體的分布規律,即越精確地反映了總體在各個范圍內取值規律,即越精確地反映了總體在各個范圍內取值百分比。百分比。 總體密度曲線反映了總體在各個范圍內取值的總體密度曲線反映了總體在各個范圍內取值的百分比百分比,精確地反映了總體的分布規律。是研究總精確地反映了總體的分布規律。是研究總體分布的工具體分布的工具.總體密度曲線總體密度曲線 (1) 離散型:當總體中的個體所取的不同數值較少

13、時, 其隨機變量是離散型的. 試驗結果頻 數 頻頻 率率 頻率頻率 試驗結果試驗結果01 條形圖條形圖40.60.小結: (2) 連續型:當總體中的個體所取的數值較多,甚至 無限時,其隨機變量是連續型的. 分 組 頻 數 頻 率 產品尺寸產品尺寸25.295 25.355 頻率分布直方圖頻率分布直方圖累積頻率頻率分布表組距頻率l離散型隨機變量離散型隨機變量,指變量的取值是有限個指變量的取值是有限個,或或者無限可列個者無限可列個.有限個有限個,比如你身邊有比如你身邊有10個朋個朋友友,那么你要得到他們的身高那么你要得到他們的身高,他們身高作為他們身高作為一個變量的時候只能有一個變量的時候只能有1

14、0個取值個取值,這十個值這十個值就是離散的就是離散的,你可以把它們一一寫出來你可以把它們一一寫出來;對于對于無限可列個無限可列個,比如有個隨機變量比如有個隨機變量x,x可以取得可以取得值是自然數值是自然數,也就是說也就是說x可以取到可以取到1,2,3,.,n,.,雖然有無窮多雖然有無窮多,但是你可以把它們按照某種但是你可以把它們按照某種規律列出來規律列出來,或者說或者說,存在這樣的兩個存在這樣的兩個x取值取值,按照某種規律排定之后按照某種規律排定之后,它們之間不允許再它們之間不允許再存在存在x其它取值其它取值,那么那么x也是離散的也是離散的.如果如果x的的取值是實數的話取值是實數的話,那么就是

15、不可列的那么就是不可列的,x就變就變成了連續性變量成了連續性變量. 3、頻率分布條形圖和頻率分布直方圖兩者是不同的概念,雖然它們的橫坐標表示的內容是相同的,但是頻率分布條形圖的縱軸(矩形的高)表示頻率;頻率分布直方圖的縱軸(矩形的高)表示頻率與組距的比值,其相應組距上的頻率等于該組距上的面積。頻率頻率/組距組距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 如果當地政府希望如果當地政府希望85%85%以上的居民每月的用水量不超出以上的居民每月的用水量不超出標準標準, ,根據頻率分布表和頻率分布直方圖根據頻率分布表

16、和頻率分布直方圖, ,你能對制定你能對制定月用水量提出建議嗎月用水量提出建議嗎? ?你認為你認為3 3噸這個標準一定能夠保證噸這個標準一定能夠保證85%85%以上的居民用水以上的居民用水量不超過標準嗎量不超過標準嗎? ?例題例題.一個容量為一個容量為100的樣本的樣本,數據的分組和各組的數據的分組和各組的相關信息如下表相關信息如下表,試完成表中每一行的兩個空格試完成表中每一行的兩個空格.分組 頻數 頻率 頻率累計12,15) 615,18) 0.0818,21) 0.3021,24) 2124,27) 0.6927,30) 1630,33) 0.1033,36 1.00合計合計 100 1.0

17、00.060.0680.140.16160.210.510.18180.160.85100.950.055例1、對某電子元件進行壽命追蹤調查,情況如下: 壽命壽命個數個數1002002003003004004005005006002030804030(1)列出頻率分布表;(2)畫出頻率分布直方圖;(3)估計電子元件壽命在100h400h以內的概率;(4)估計電子元件壽命在400h以上的概率;應用舉例:應用舉例: (1)列出頻率分布表; 100200200300300400400500500600壽命壽命合計合計頻率頻率頻數頻數累積頻率累積頻率20308040302000.100.150.400

18、.200.1510.100.250.650.851100200300400500600)壽命(h頻率/組距0.65. 0:40010065. 0:4001003的概率為元件壽命在,所以我們估計電子為的電子元件出現的頻率出,壽命在)由頻率分布表可以看(hhh.:h.:h3504003501502004004以以上上的的概概率率為為估估計計電電子子元元件件壽壽命命在在,故故我我們們元元件件出出現現的的頻頻率率為為以以上上的的電電子子命命在在由由頻頻率率分分布布表表可可知知,壽壽)(. .莖葉圖莖葉圖情境:情境:某賽季甲、乙兩名籃球運動員每場比賽得某賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下

19、:分的原始記錄如下:(1)甲運動員得分:甲運動員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運動員得分乙運動員得分: 49,24,12,31,50,31,44,36,15,37,25,36,39l問題:如何有條理地列出這些數據,分析該運動如何有條理地列出這些數據,分析該運動員的整體水平及發揮的穩定程度?員的整體水平及發揮的穩定程度? 莖葉圖莖葉圖甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 36 83 8 9 1 一般地:當數據是一位和兩位有效數字時,用中一般地:當數據是一位和兩位有效數字時,用中間的數字表示十位數,即第一個有效數字,

20、兩邊的數間的數字表示十位數,即第一個有效數字,兩邊的數字表示個位數,即第二個有效數字,它的中間部分像字表示個位數,即第二個有效數字,它的中間部分像植物的莖,兩邊部分像植物莖上長出來的葉子,因此植物的莖,兩邊部分像植物莖上長出來的葉子,因此通常把這樣的圖叫做莖葉圖。莖按從小到大的順序從通常把這樣的圖叫做莖葉圖。莖按從小到大的順序從上向下列出,共莖的葉一般按從大到?。ɑ驈男〉酱螅┥舷蛳铝谐?,共莖的葉一般按從大到小(或從小到大)的順序同行列出。的順序同行列出。1莖葉圖的概念:2莖葉圖的特征:)用莖葉圖表示數據有兩個優點:一是從統計圖)用莖葉圖表示數據有兩個優點:一是從統計圖上沒有原始數據信息的損失,

21、所有數據信息都可以上沒有原始數據信息的損失,所有數據信息都可以從莖葉圖中得到;二是莖葉圖中的數據可以隨時記從莖葉圖中得到;二是莖葉圖中的數據可以隨時記錄,隨時添加,方便記錄與表示;錄,隨時添加,方便記錄與表示;()莖葉圖只便于表示兩位(或一位)有效數字()莖葉圖只便于表示兩位(或一位)有效數字的數據,對位數多的數據不太容易操作;而且莖葉的數據,對位數多的數據不太容易操作;而且莖葉圖只方便記錄兩組的數據,兩個以上的數據雖然能圖只方便記錄兩組的數據,兩個以上的數據雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰;夠記錄,但是沒有表示兩個記錄那么直觀,清晰;()莖葉圖對重復出現的數據要重復記錄,不能

22、()莖葉圖對重復出現的數據要重復記錄,不能遺漏遺漏制作莖葉圖的方法是制作莖葉圖的方法是:將所有兩位數的十位數字:將所有兩位數的十位數字作為作為“莖莖”,個位數字作為,個位數字作為“葉葉”,莖相同者共,莖相同者共用一個莖,莖按從小到大的順序從上向下列出,用一個莖,莖按從小到大的順序從上向下列出,共莖的葉一般按從大到?。ɑ驈男〉酱螅┑捻樞蚬睬o的葉一般按從大到?。ɑ驈男〉酱螅┑捻樞蛲辛谐鐾辛谐? .莖葉圖的制作方法莖葉圖的制作方法注意注意:在制作莖葉圖時,重復出現的數據要重復在制作莖葉圖時,重復出現的數據要重復記錄,不能遺漏,特別是記錄,不能遺漏,特別是“葉葉”部分;同一數據部分;同一數據出現幾

23、次,就要在圖中體現幾次出現幾次,就要在圖中體現幾次. .用莖葉圖表示數據有兩個突出的優點:用莖葉圖表示數據有兩個突出的優點:一一. .是所有的信息都可以從這個莖葉圖是所有的信息都可以從這個莖葉圖 上得到;上得到;二二. .是莖葉圖便于記錄和表示是莖葉圖便于記錄和表示. .用莖葉圖表示數據有一個突出的缺點:用莖葉圖表示數據有一個突出的缺點:莖葉圖莖葉圖的缺點的缺點是其分析只是粗略的,對差異是其分析只是粗略的,對差異不大的兩組數據不易分析;表示三位數以上不大的兩組數據不易分析;表示三位數以上的數據時不夠方便的數據時不夠方便. .1、求極差、求極差(即一組數據中最大值與最小值的差即一組數據中最大值與

24、最小值的差) 知道這組數據的變動范圍知道這組數據的變動范圍4.3-0.2=4.12、決定組距與組數(將數據分組)、決定組距與組數(將數據分組)3、 將數據分組將數據分組(8.2取整取整,分為分為9組組)小結小結:一一.畫頻率分布直方圖的步驟畫頻率分布直方圖的步驟4、列出、列出頻率分布表頻率分布表.(填寫頻率填寫頻率/組距一欄組距一欄)5、畫出、畫出頻率分布直方圖頻率分布直方圖。組距組距:指每個小組的兩個端點的距離,組距指每個小組的兩個端點的距離,組距組數組數:將數據分組,當數據在將數據分組,當數據在100個以內時,個以內時, 按數據多少常分按數據多少常分5-12組。組。4.18.20.5極差組

25、數=組距(注意注意)縱坐標為縱坐標為:頻率組距二二.總體密度曲線1.當樣本容量無限增大,組距無限縮小,那么頻率分布當樣本容量無限增大,組距無限縮小,那么頻率分布直方圖就會無限接近于一條光滑曲線直方圖就會無限接近于一條光滑曲線總體密度總體密度曲線曲線。2.用樣本分布直方圖去估計相應的總體分布時,一般樣用樣本分布直方圖去估計相應的總體分布時,一般樣本容量越大,本容量越大,頻率分布直方圖頻率分布直方圖就會無限接近就會無限接近總體密度總體密度曲線曲線,就越精確地反映了總體的分布規律,即越精確,就越精確地反映了總體的分布規律,即越精確地反映了總體在各個范圍內取值百分比。地反映了總體在各個范圍內取值百分比。三三.莖葉圖l莖葉圖,類似直方圖,但又與直方圖不同,它的思路莖葉圖,類似直方圖,但又與直方圖不同,它的思路是將數組的數按位數進行比較,將數大小基本不變或是將數組的數按位數進行比較,將數大小基本不變或變化不大的位作為一個主桿(莖),將變化大的位的變化不大的位作為一個主桿(莖),將變化大的位的數作為分枝(葉),列在主桿的后面,這樣就可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論