第04講 用樣本估計總體(主干知識復習)(教師版)-2023年新高二暑期數學銜接(新人教版)_第1頁
第04講 用樣本估計總體(主干知識復習)(教師版)-2023年新高二暑期數學銜接(新人教版)_第2頁
第04講 用樣本估計總體(主干知識復習)(教師版)-2023年新高二暑期數學銜接(新人教版)_第3頁
第04講 用樣本估計總體(主干知識復習)(教師版)-2023年新高二暑期數學銜接(新人教版)_第4頁
第04講 用樣本估計總體(主干知識復習)(教師版)-2023年新高二暑期數學銜接(新人教版)_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第04講用樣本估計總體【學習目標】1.能根據實際問題的特點,選擇恰當的統計圖表對數據進行可視化描述,體會合理使用統計圖表的重要性.2.結合實例,能用樣本估計總體的集中趨勢參數(平均數、中位數、眾數),3.結合實例,理解集中趨勢參數的統計含義,能用樣本估計總體的離散程度參數(標準差、方差、極差),4.結合實例,理解離散程度參數的統計含義,5.能用樣本估計總體的取值規律,能用樣本估計百分位數,理解百分位數的統計含義【基礎知識】一、頻率分布直方圖1.制作頻率分布直方圖的步驟第一步:求極差,決定組數和組距,組距=eq\f(極差,組數);第二步:分組,通常對組內數值所在區間取左閉右開區間,最后一組取閉區間;第三步:登記頻數,計算頻率,列出頻率分布表;第四步:畫頻率分布直方圖。2.解決頻率分布直方圖問題時要抓住3個要點(1)直方圖中各小長方形的面積之和為1.(2)直方圖中縱軸表示eq\f(頻率,組距),故每組樣本的頻率為組距×eq\f(頻率,組距),即矩形的面積.(3)直方圖中每組樣本的頻數為頻率×總體數.二、樣本的數字特征1.眾數:在一組數據中,出現次數最多的數據叫做這組數據的眾數.2.中位數:將一組數據按大小依次排列,把處在中間位置的一個數據(或中間兩個數據的平均數)叫做這組數據的中位數3.平均數:樣本數據的算術平均數,即.4.百分位數:求總體百分位數的估計,首先要從小到大排列數據,然后計算出i=n×p%,當i不是整數要取整,當i是整數,則百分位數為第i項與第(i+1)項數據的平均數.5.方差與標準差(1)標準差是樣本數據到平均數的一種平均距離.(2)方差:(是樣本數據,是樣本容量,是樣本平均數).(3)標準差:.6.平均數、方差公式的推廣若數據x1,x2,…,xn的平均數為eq\o(x,\s\up6(-)),方差為s2,則數據mx1+a,mx2+a,…,mxn+a的平均數為meq\o(x,\s\up6(-))+a,方差為m2s2.7.平均數和方差是重要的數字特征,是對總體的一種簡明的闡述.平均數描述總體的平均水平,方差反映了數據偏離于平均數的程度,它們從整體和全局上刻畫了總體特征,是生產實際中用于方案取舍的重要的理論依據,一般先比較平均數,若平均數相同,再用方差來決定.8.用頻率分布直方圖估計眾數、中位數、平均數的方法(1)眾數為頻率分布直方圖中最高矩形底邊中點橫坐標;(2)中位數為平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點的橫坐標;(3)平均數等于每個小矩形面積與小矩形底邊中點橫坐標之積的和。三、統計圖1.統計圖是利用點、線、面、體等繪制成幾何圖形,以表示各種數量間的關系及其變動情況的工具.其中有條形統計圖、扇形統計圖、折線統計圖、象形圖等.其特點是:形象具體、簡明生動、通俗易懂、一目了然.其主要用途有:表示現象間的對比關系;揭露總體結構;檢查計劃的執行情況;揭示現象間的依存關系,反映總體單位的分配情況;說明現象在空間上的分布情況.一般采用直角坐標系.橫坐標用來表示事物的組別或自變量x,縱坐標常用來表示事物出現的次數或因變量y;或采用角度坐標(如圓形圖)、地理坐標(如地形圖)等.2.莖葉圖的畫法步驟第一步:將每個數據分為莖(高位)和葉(低位)兩部分;第二步:將最小莖與最大莖之間的數按大小次序排成一列;第三步:將各個數據的葉依次寫在其莖的兩側.3.折線圖折線圖是用直線段將各數據點連接起來而組成的圖形,以折線方式顯示數據的變化趨勢.折線圖可以顯示隨時間(根據常用比例設置)而變化的連續數據,因此非常適用于顯示在相等時間間隔下數據的趨勢.在折線圖中,類別數據沿水平軸均勻分布,所有值數據沿垂直軸均勻分布.另外,在折線圖中,數據是遞增還是遞減、增減的速率、增減的規律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出來.所以,折線圖常用來分析數據隨時間的變化趨勢,也可用來分析多組數據隨時間變化的相互作用和相互影響.例如可用來分析某類商品或是某幾類相關的商品隨時間變化的銷售情況,從而進一步預測未來的銷售情況.在折線圖中,一般x軸用來表示時間的推移,并且間隔相同;而y軸代表不同時刻的數據的大小.四、頻率分布折線圖和總體密度曲線1.頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.2.總體密度曲線:隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率折線圖會越來越接近于一條光滑曲線,統計中稱這條光滑曲線為總體密度曲線.【考點剖析】考點一:頻率分布直方圖例1.(2022學年河北省邢臺市卓越聯盟高一下學期第三次月考)為了解學生在“弘揚傳統文化,品讀經典文學”月的閱讀情況,現從全校學生中隨機抽取了部分學生,并統計了他們的閱讀時間(閱讀時間),分組整理數據得到如圖所示的頻率分布直方圖.則圖中a的值為(

)A.0.028 B.0.029 C.0.280 D.0.290【答案】A【解析】由得.故選A考點二:折線圖例2.(2022學年山東省濱州市陽信縣高一下學期期中)走路是“最簡單、最優良的鍛煉方式”,它不僅可以幫助減肥,還可以增強心肺功能、血管彈性、肌肉力量等.下圖為甲、乙兩名同學在同一星期內日步數的折線統計圖,則下列結論中不正確的是(

)A.這一星期內甲的日步數的中位數為11600 B.這一星期內甲的日步數的平均值大于乙C.這一星期內甲的日步數的方差大于乙 D.這一星期內乙的日步數的30%分位數是7030【答案】D【解析】對于A:甲的步數:16000,7965,12700,2435,16800,9500,11600.從小到大排列為:2435,7965,9500,11600,12700,16000,16800.中位數是11600.故A正確;對于B:,.所以.故B正確;對于C:所以.故C正確;甲的步數從小到大排列為:5340,7030,10060,11600,12300,12970,14200,,故這一星期內乙的日步數為分位數是10060,故D錯誤.故選D.考點三:其他統計圖表例3.(多選)(2020-2021學年湖南師范大學附屬中學高一下學期期末)中興?華為事件暴露了我國計算機行業中芯片?軟件兩大短板,為防止“卡脖子”事件的再發生,科技專業人才就成了決勝的關鍵.為了解我國在芯片?軟件方面的潛力,某調查機構對我國若干大型科技公司進行調查統計,得到了這兩個行業從業者的年齡分布的餅形圖和“90后”從事這兩個行業的崗位分布雷達圖,則下列說法中正確的是(

)A.芯片、軟件行業從業者中,"90后”占總人數的比例超過60%B.芯片、軟件行業中從事技術、設計崗位的"90后”人數超過總人數的25%C.芯片、軟件行業從事技術崗位的人中,“90后”比“80后”多D.芯片、軟件行業中,“90后”從事市場崗位的人數比“80前”的總人數多【答案】BD【解析】對于A,由餅形圖知,芯片、軟件行業從業者中,"90后”占總人數的比例為55%,沒超過60%,A不正確;對于B,由雷達圖和餅形圖知,芯片、軟件行業中從事技術、設計崗位的"90后”人數占總人數的,B正確;對于C,芯片、軟件行業從事技術崗位的人中,“90后”占總人數的,而“80后”占總人數的40%,從事技術崗位的人數比例不知,無法確定兩者間的大小關系,C不正確;對于D,芯片、軟件行業中,從事市場崗位的“90后”人數占總人數的,而“80前”總數占總人數的5%,D正確.故選BD考點四:眾數與中位數例4.(多選)(2022學年吉林省長春市第二實驗中學高一下學期期中)某人射箭10次,射中的環數依次為:8,7,8,9,7,6,9,8,10,8關于這組數據,下列說法正確的是(

)A.這組數據的眾數是8 B.這組數據的平均數是8C.這組數據的中位數是8 D.這組數據的方差是【答案】ABCD【解析】數據從小到大排列為:,所以眾數為,A選項正確;中位數為,C選項正確;平均數為,所以B選項正確;方差為,所以D選項正確.故選ABCD考點五:百分位數例5.(2022學年山西省太原市第五中學校高一下學期5月階段性檢測)互不相等的5個正整數從小到大排序為1,,,,,若它們的和為18,且其分位數是分位數的2倍,則的值為_________.【答案】【解析】因為,所以這組數據的分位數為,同理可知這組數據的分位數為,據題意有,若,則這5個數為1,3,,6,,由,,,知,不滿足題意,所以,則這5個數為1,2,,4,,由,,知,由,知.考點六:平均數與方差例6.已知某省二、三、四線城市數量之比為1∶3∶6,2019年8月份調查得知該省所有城市房產均價為1.2萬元/平方米,方差為20,二、三、四線城市的房產均價分別為2.4萬元/平方米,1.8萬元/平方米,0.8萬元/平方米,三、四線城市房價的方差分別為10,8,則二線城市房價的方差為________.【答案】【解析】設二線城市的房價的方差為,由題意可知解得,即二線城市房價的方差為.考點七:用樣本估計總體例7.(2022學年福建省德化一中、永安一中、漳平一中三校協作高一5月聯考)2021年根據移動通信協會監測,某校全體教師通訊費用(單位:元)如圖所示,數據分組依次為[20,40),[40,60),[60,80),[80,100].(1)若該校有200名教師,采用分層抽樣的方法從這200名教師中抽取容量為20的樣本,求每組應抽取的樣本量;(2)估計該校教師話費的80%分位數;(3)估計該校教師通訊費用的眾數和平均數.【解析】(1)采用分層抽樣的方法從這200名該校教師中抽取容量為20的樣本,即費用(單位:元)在[20,40)中抽取2位教師在[40,60)中抽取4位教師.在[60,80)中抽取8位教師在[80,100]中抽取6位教師.(2)該校教師話費在80元以下的頻率為:,該校教師話費在[80,100]的頻率為0.3,因此,該校教師話費的80%分位數在[80,100]內,由.可以估計該校教師話費的80%分位數為.(3)該校教師通訊費用的眾數為70;平均數為:考點八:平均數與方差的實際應用例8.為了比較兩種治療失眠癥的藥(分別稱為A藥,B藥)的療效,隨機地選取20位患者服用A藥,20位患者服用B藥,這40位患者在服用一段時間后,記錄他們日平均增加的睡眠時間(單位:h).試驗的觀測結果如下:服用A藥的20位患者日平均增加的睡眠時間:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B藥的20位患者日平均增加的睡眠時間:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5分別計算兩組數據的平均數,從計算結果看,估計哪種藥的療效更好?【解析】設A藥觀測數據的平均數為,B藥觀測數據的平均數為.由觀測結果可得=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上計算結果可得>,因此可以估計A藥的療效更好【真題演練】1.(多選)(2021新高考全國卷Ⅰ卷)有一組樣本數據,,,,由這組數據得到新樣本數據,,,,其中,2,,,為非零常數,則A.兩組樣本數據的樣本平均數相同 B.兩組樣本數據的樣本中位數相同 C.兩組樣本數據的樣本標準差相同 D.兩組樣本數據的樣本極差相同【答案】CD【解析】對于,兩組數據的平均數的差為,故錯誤;對于,兩組樣本數據的樣本中位數的差是,故錯誤;對于,標準差,兩組樣本數據的樣本標準差相同,故正確;對于,,2,,,為非零常數,的極差為,的極差為,兩組樣本數據的樣本極差相同,故正確.故選.2.(2021新高考全國卷Ⅱ)下列統計量中,能度量樣本的離散程度的是()A.樣本的標準差 B.樣本的中位數C.樣本的極差 D.樣本的平均數【答案】AC【解析】由標準差的定義可知,標準差考查的是數據的離散程度;由中位數的定義可知,中位數考查的是數據的集中趨勢;由極差的定義可知,極差考查的是數據的離散程度;由平均數的定義可知,平均數考查的是數據的集中趨勢;故選AC3.(2021高考全國卷Ⅱ)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中不正確的是A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為 B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為 C.估計該地農戶家庭年收入的平均值不超過6.5萬元 D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間【答案】C【解析】對于,該地農戶家庭年收入低于4.5萬元的農戶比率為,故選項正確;對于,該地農戶家庭年收入不低于10.5萬元的農戶比率為,故選項正確;對于,估計該地農戶家庭年收入的平均值為萬元,故選項錯誤;對于,家庭年收入介于4.5萬元至8.5萬元之間的頻率為,故估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間,故選項正確.故選.4.(2018高考全國卷Ⅰ)某地區經過一一年的新農村建設,農村的經濟收入增加了一倍,實現翻番.為更好地了解該地區農村的經濟收入變化情況,統計了該地區新農村建設前后農村的經濟收入構成比例,得到如下餅圖:則下面結論中不正確的是 ()A.新農村建設后,種植收入減少 B.新農村建設后,其他收入增加了一倍以C.新農村建設后,養殖收入增加了一倍D.新農村建設后,養殖收入與第三產業收入的總和超過了經濟收入的一半【答案】A【解析】設建設前經濟收入為,建設后經濟收入為.A項,種植收入37×﹣60%=14%>0,故建設后,種植收入增加,故A項錯誤.B項,建設后,其他收入為5%×2=10%,建設前,其他收入為4%,故10%÷4%=2.5>2,故B項正確.C項,建設后,養殖收入為30%×2=60%,建設前,養殖收入為30%,故60%÷30%=2,故C項正確.D項,建設后,養殖收入與第三產業收入總和為(30%+28%)×2=58%×2a,經濟收入為2,故(58%×2a)÷2a=58%>50%,故D項正確,因為是選擇不正確的一項.故選A.5.(2021高考全國卷Ⅰ)某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指標有無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如下:舊設備9.810.310.010.29.99.810.010.110.29.7新設備10.110.410.110.010.110.310.610.510.410.5舊設備和新設備生產產品的該項指標的樣本平均數分別記為和,樣本方差分別記為和.(1)求,,,;(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高(如果,則認為新設備生產產品的該項指標的均值較舊設備有顯著提高,否則不認為有顯著提高).【解析】(1)由題中的數據可得,,,;;(2),,所以,故新設備生產產品的該項指標的均值較舊設備有顯著提高.6.(2019高考全國卷Ⅲ)為了解甲、乙兩種離子在小鼠體內的殘留程度,進行如下試驗:將200只小鼠隨機分成兩組,每組100只,其中組小鼠給服甲離子溶液,組小鼠給服乙離子溶液.每只小鼠給服的溶液體積相同、摩爾濃度相同.經過一段時間后用某種科學方法測算出殘留在小鼠體內離子的百分比.根據試驗數據分別得到如下直方圖:記為事件:“乙離子殘留在體內的百分比不低于”,根據直方圖得到的估計值為.(1)求乙離子殘留百分比直方圖中的值;(2)分別估計甲、乙離子殘留百分比的平均值(同一組中的數據用該組區間的中點值為代表).【解析】(1)由已知得,故,.(2)甲離子殘留百分比的平均值的估計值為.乙離子殘留百分比的平均值的估計值為.【過關檢測】1.(2022學年河南省豫西部分名校高一下學期月考)某實驗圍種植甲、乙兩種水稻,面積相等的兩塊稻田(種植環境相同)連續5次的產量如下:甲/kg260250210250280乙/kg220260230250290則下列說法錯誤的是(

)A.甲種水稻產量的眾數為250B.乙種水稻產量的極差為70C.甲種水稻產量的平均數大于乙種水稻產量的平均數D.甲種水稻產量的方差小于乙種水稻產量的方差【答案】C【解析】根據給定數表知,甲種水稻產量的眾數為250,乙種水稻產量的極差為,A,B都正確;甲種水稻產量平均數為,乙種水稻產量平均數為,C錯誤;甲種水稻產量方差為,乙種水稻產量方差為,D正確.故選C2.(2022學年山東省淄博市博山區、沂源縣聯考高一6月份月考)排球社的同學為訓練動作組織了墊排球比賽,以下為排球社50位同學的墊球個數所做的頻率分布直方圖,所有同學墊球數都在5——40之間,估計墊球數的樣本數據的75%分位數是(

)A.25 B.26 C.27 D.28【答案】D【解析】由已知,根據頻率分布直方圖可得:墊球數在的人數為,占總數的;墊球數在的人數為,占總數的;墊球數在的人數為,占總數的;墊球數在的人數為,占總數的;墊球數在的人數為,占總數的;墊球數在的人數為,占總數的;墊球數在的人數為,占總數的;因為分位數位于內,由,所以估計墊球數的樣本數據的75%分位數是.故選D.3.(2022學年河北省邢臺市卓越聯盟高一下學期第三次月考)已知某7個數的平均數為4,方差為2,現加入一個新數據4,此時這8個數的平均數為,方差為,則(

)A., B.,C., D.,【答案】D【解析】設7個數為,則,,所以,所以,則這個數的平均數為,方差為.故選D.4.(2022學年山西省高一下學期第三次月考)有一組樣本數據,由這組數據得到的另一組數據,,…,,滿足(c為非零常數),則下列結論一定成立的是(

)A.兩組數據的樣本平均數不同 B.兩組數據的中位數相同C.兩組數據的樣本方差相同 D.兩組數據的樣本標準差不同【答案】C【解析】設的平均數是,,,…,的平均數是,由題意,如果,則,否則,A不正確;同理如果的中位數是,則兩者中位數相同,否則不相同,B不正確;設的方差是,,,…,的差是,則,又,,所以,,2,…,n,所以,從而,所以方差相同,標準差也相同,C正確,D不正確,故選C.5.(多選)(2022學年山東省濟南市第一中學高一5月月考)根據關于世界人口變化情況的三幅統計圖(如圖所示),有下列四個結論:①從折線統計圖能看出世界人口的變化情況;②2050年非洲人口將達到大約15億;③2050年亞洲人口比其他各洲人口的總和還要多;④從1957年到2050年各洲中北美洲人口增長速度最慢.其中所有正確結論的編號是(

)A.① B.② C.③ D.④【答案】AC【解析】①從折線統計圖能看出世界人口的變化情況,故①正確;②從條形統計圖中可得到:2050年非洲人口大約將達到18億,故②錯;③從扇形統計圖中能夠明顯的得到結論:2050年亞洲人口比其他各洲人口的總和還要多,故③正確;④由上述三幅統計圖并不能得出從1957年到2050年中哪個洲人口增長速度最慢,故④錯誤.因此正確的命題有①③.故選AC.6.(多選)(2022學年三湘名校教育聯盟高一下學期5月聯考)在發生某公共衛生事件期間,有專業機構認為該事件在一段時間沒有發生大規模群體感染的標準為“連續天,每天新增疑似病例不超過人”,過去天,甲、乙、丙、丁四地新增疑似病例數據信息如下:甲地:中位數為,極差為;乙地:平均數為,眾數為;丙地:平均數為,中位數為;丁地:平均數為,方差為,甲、乙、丙、丁四地中,一定沒有發生大規模群體感染的是(

)A.甲地 B.乙地 C.丙地 D.丁地【答案】ACD【解析】甲地的中位數為,極差為,所以,最大值不大于,故A符合;若乙地過去天每天新增疑似病例人數分別為、、、、、、、、、,則滿足平均數為,眾數為,但不滿足每天新增疑似病例不超過人,故B不符合;假設丙地至少有一天新增疑似病例人數超過人,由中位數為可得平均數的最小值為,與題意矛盾,故C符合;假設至少有一天新增疑似病例超過人,則方差的最小值為,與題意矛盾,故D符合.故選ACD.7.(2022學年廣東省廣州市八十六中高一下學期期中)若樣本數據的方差為8,則數據的方差為________.【答案】32【解析】若樣本數據的方差為8,則數據的方差為8.(2022學年湖南師范大學附屬中學高一下學期期中)棉花的纖維長度是棉花質量的重要指標.在一批棉花中隨機抽測了60根棉花的纖維長度(單位:mm),按從小到大排序結果如下:2528335052585

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論