




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
問題提出1.隨機抽樣有哪幾種基本的抽樣方法?2.隨機抽樣是收集數據的方法,如何通過樣本數據所包含的信息,估計總體的基本特征,即用樣本估計總體,是我們需要進一步學習的內容.簡單隨機抽樣、系統抽樣、分層抽樣.
3.高一某班有50名學生,在數學必修②結業(yè)考試后隨機抽取10名,其考試成績如下:
82,75,61,93,62,
55,70,68,85,78.
如果要求我們根據上述抽樣數據,估計該班對數學模塊②的總體學習水平,就需要有相應的數學方法作為理論指導,本節(jié)課我們將學習用樣本的頻率分布估計總體分布.第一頁第二頁,共37頁。頻數:頻率:樣本的頻率分布:總體分布:【復習回顧】各組內數據的個數。每組數據的個數除以全體數據個數的商。樣本的頻率分布規(guī)律總體取值的概率分布規(guī)律。第二頁第三頁,共37頁。2000年全國主要城市中缺水情況排在前10位的城市探究:我國是世界上嚴重缺水的國家之一,城市缺水問題較為突出。知識探究(一):頻率分布表
第三頁第四頁,共37頁。
某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a,用水量不超過a的部分按平價收費,超過a的部分按議價收費。①如果希望大部分居民的日常生活不受影響,那
么標準a定為多少比較合理呢?②為了較合理地確定這個標準,你認為需要做哪些工作?第四頁第五頁,共37頁。
思考:由上表,大家可以得到什么信息?
通過抽樣,我們獲得了100位居民某年的月平均用水量(單位:t),如下表:根據這些數據你能得出用水量其他信息嗎?第五頁第六頁,共37頁。1、樣本數據的變化范圍是什么?2、樣本數據中的最大值和最小值的差稱為極差.如果將上述100個數據按組距為0.5進行分組,那么這些數據共分為多少組?
0.2~4.3(4.3-0.2)÷0.5=8.23、以組距為0.5進行分組,上述100個數據共分為9組,各組數據的取值范圍可以如何設定?4、如何統計上述100個數據在各組中的頻數?如何計算樣本數據在各組中的頻率?你能將這些數據用表格反映出來嗎?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].【思考】第六頁第七頁,共37頁。【頻率分布表】100位居民月平均用水量的頻率分布表第七頁第八頁,共37頁。1、上表稱為樣本數據的頻率分布表,由此可以推測該市全體居民月均用水量分布的大致情況,給市政府確定居民月用水量標準提供參考依據,這里體現了一種什么統計思想?
用樣本的頻率分布估計總體分布.2、如果市政府希望85%左右的居民每月的用水量不超過標準,根據上述頻率分布表,你對制定居民月用水量標準(即a的取值)有何建議?88%的居民月用水量在3t以下,可建議取a=3.3、在實際中,取a=3t一定能保證85%以上的居民用水不超標嗎?哪些環(huán)節(jié)可能會導致結論出現偏差?
分組時,組距的大小可能會導致結論出現偏差,實踐中,對統計結論是需要進行評價的.【思考】第八頁第九頁,共37頁。4、一般地,列出一組樣本數據的頻率分布表可以分哪幾個步驟進行?第一步,求極差.(極差=樣本數據中最大值與最小值的差)第二步,確定組距與組數.(設k=極差÷組距,若k為整數,則組數=k,否則,組數=[k]+1)第三步,確定分點,將數據分組.第四步,統計頻數,計算頻率,制成表格.
(頻數=樣本數據落在各小組內的個數,頻率=頻數÷樣本容量)第九頁第十頁,共37頁。請大家思考直方圖有那些優(yōu)點和缺點?小長方形的面積總和=?頻率/組距月平均用水量/t0.500.400.300.200.100
0.511.522.533.544.5
小長方形的面積=?月均用水量最多的在哪個區(qū)間?知識探究(二):頻率分布直方圖
為了直觀反映樣本數據在各組中的分布情況,我們將上述頻率分布表中的有關信息用下面的圖形表示:
頻率分布直方圖非常直觀地表明了樣本數據的分布情況,使我們能夠看到頻率分布表中看不太清楚的數據模式,但原始數據不能在圖中表示出來.第十頁第十一頁,共37頁。
你能根據頻率分布直方圖指出居民月均用水量的一些數據特點嗎?頻率/組距月平均用水量/t0.500.400.300.200.100
0.511.522.533.544.5
(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.第十一頁第十二頁,共37頁。【思考】
樣本數據的頻率分布直方圖是根據頻率分布表畫出來的,一般地,頻率分布直方圖的作圖步驟如何?
第一步,畫平面直角坐標系.第二步,在橫軸上均勻標出各組分點,在縱軸上標出單位長度.第三步,以組距為寬,各組的頻率與組距的商為高,分別畫出各組對應的小長方形.第十二頁第十三頁,共37頁。探究:
同樣一組數據,如果組距不同,橫軸、縱軸的單位不同,得到的圖的形狀也會不同。不同的形狀給人以不同的印象,這種印象有時會影響我們對總體的判斷。分別以1和0.1為組距重新作圖,然后談談你對圖的印象。
第十三頁第十四頁,共37頁。
將直方圖各塊頂端中點連線你會發(fā)現什么呢?:年齡0.060.050.040.030.020.01273237424752576267頻率組距O思考:若組距取得越小,則頻率折線的光滑程度會怎樣?越光滑頻率分布折線圖第十四頁第十五頁,共37頁。
如果樣本容量足夠大,分組的組距取得足夠小,則頻率折線圖將趨于一條光滑的曲線:年齡0.060.050.040.030.020.01273237424752576267頻率組距O總體密度曲線第十五頁第十六頁,共37頁。
例2
甲乙兩籃球運動員在上賽季每場比賽的得分如下,試比較兩位運動員的水平。甲:12,15,24,25,31,31,36,36,37,
39,44,49,50;乙:8,13,14,16,23,26,28,33,38,
39,51.解決這個實際問題還用頻率分布表或者頻率分布直方圖來做嗎?知識探究(三):頻率分布莖葉圖
此時可以考慮:頻率分布莖葉圖第十六頁第十七頁,共37頁。
一般地,當數據是兩位有效數字時,用中間的數字表示十位數,即第一個有效數字,兩邊的數字表示個位數,即第二個有效數字,它的中間部分像植物的莖,兩邊部分像植物莖上的葉子,因此通常將此圖成為莖葉圖012345834636838915254976611940甲乙通過此圖即可看出甲運動員的得分大致對稱,發(fā)揮比較穩(wěn)定!第十七頁第十八頁,共37頁。第一步,將每個數據分為莖(十位數)和葉(個位數);第二步,將最小的莖和最大的莖之間的數按大小次序排成一列,寫在中間;第三步,將各個數據的葉按大小次序寫在其莖右(左)側.
一般地,列出一組樣本數據的頻率分布莖葉圖可以分哪幾個步驟進行?第十八頁第十九頁,共37頁。1.已知樣本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么頻率為0.2范圍的是
()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5
分組
頻數
頻率
頻數累計5.5~7.520.127.5~9.560.389.5~11.580.41611.5~13.540.220
合計201.0D第十九頁第二十頁,共37頁。2.一個容量為100的樣本,數據的分組和各組的相關信息如下表,試完成表中每一行的兩個空格.分組
頻數
頻率
頻率累計[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合計1001.000.0680.140.16160.210.440.25250.160.850.100.950.0550.06第二十頁第二十一頁,共37頁。3.已知一個樣本,填寫下面的頻率分布表
7.06.66.87.07.27.47.07.37.57.4
7.37.17.06.96.77.17.27.06.97.1分組頻數累計頻數頻率6.55~6.75
6.75~6.95
6.95~7.15
7.15~7.35
7.35~7.55合計2384320251317200.100.150.200.400.151.00第二十一頁第二十二頁,共37頁。0.081500.88第二十二頁第二十三頁,共37頁。(2011·湖北高考)有一個容量為200的樣本,其頻率分布直方圖如圖所示,根據樣本的頻率分布直方圖估計,樣本數據落在區(qū)間[10,12)內的頻數為()(A)18(B)36(C)54(D)72實戰(zhàn)演練B第二十三頁第二十四頁,共37頁。例題1.有一個容量為50的樣本數據的分組的頻數如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出樣本的頻率分布表;(2)畫出頻率分布直方圖;(3)根據頻率分布直方圖估計,數據落在[15.5,24.5)的百分比是多少?第二十四頁第二十五頁,共37頁。解:組距為3
分組頻數頻率頻率/組距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第二十五頁第二十六頁,共37頁。頻率分布直方圖如下:頻率組距0.0100.0200.0300.0400.05012.515.50.0600.070第二十六頁第二十七頁,共37頁。例2、為了了解一大片經濟林的生長情況,隨機測量其中的100株的底部周長,得到如下數據表(長度單位:cm):135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108
(1)編制頻率分布表;(2)繪制頻率分布直方圖;(3)估計該片經濟林中底部周長小于100cm的樹木約占多少,周長不小于120cm的樹木約占多少。第二十七頁第二十八頁,共37頁。解:(1)從表中可以看出:這組數據的最大值為135,最小值為80,故極差為55,可將其分為11組,組距為5。從第1組[80,85)開始,將各組的頻數、頻率和頻率/組距填入表中第二十八頁第二十九頁,共37頁。第二十九頁第三十頁,共37頁。80859095135110115120125130100105第三十頁第三十一頁,共37頁。課堂練習:1、為檢測某種產品的質量,抽取了一個容量為30的樣本,檢測結果為一級品5件,二級品8件,三級品13件,次品4件.
(1)列出樣本的頻率分布表;
(2)根據上述結果,估計此種產品為二級品或三級品的概率約是多少.
解:(1)樣本的頻率分布表為:
0.134次品0.4313三級品0.278二級品0.175一級品頻率頻數產品(2)此種產品為二級品或三級品的概率約為0.27+0.43=0.7.第三十一頁第三十二頁,共37頁。2.有一個容量為50的樣本,數據的分組及其頻數如下所示,請將其制成頻率直方圖.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年四川省德陽市中考歷史真題
- 校園流浪動物救助活動策劃與志愿者團隊建設研究論文
- 小學課間活動對課堂紀律影響的調查研究論文
- 英語社日常管理制度
- 萊蕪鋼城區(qū)中考二模語文試題(含答案)
- 設備維修合同 (一)
- 自動控制原理復習題
- 表格式課時教案二年級數學上冊人教版
- 自動控制理論實驗教學大綱
- 河北省廊坊市永清縣2024-2025學年八年級下學期6月期末英語試題(含答案無聽力原文及音頻)
- 華萊士加盟合同范本
- 內蒙古呼和浩特市2024-2025學年九年級上學期期末歷史試題(含答案)
- 《銷售技巧及話術》課件
- 2025年新高考全國Ⅰ卷英語模擬試卷(含答案)
- 遼寧省沈陽市皇姑區(qū)2023年小升初語文試卷(學生版+解析)
- 鐵路技術規(guī)章:018鐵路軍事運輸管理辦法
- 廣東開放大學Java程序設計基礎(專)單元測試1-7答案
- 大部分分校:地域文化形考任務三-國開(CQ)-國開期末復習資料
- 2022-2023學年天津市濱海新區(qū)高二(下)期末地理試卷
- 《中國近現代史綱要》題庫及參考答案
- 五年級滬教版數學下學期應用題專項針對練習
評論
0/150
提交評論