高考總復習核按鈕 數學 綜合教案 第九章 統計(教用)_第1頁
高考總復習核按鈕 數學 綜合教案 第九章 統計(教用)_第2頁
高考總復習核按鈕 數學 綜合教案 第九章 統計(教用)_第3頁
高考總復習核按鈕 數學 綜合教案 第九章 統計(教用)_第4頁
高考總復習核按鈕 數學 綜合教案 第九章 統計(教用)_第5頁
已閱讀5頁,還剩70頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

/第九章統計9.1隨機抽樣與統計圖表課程標準有的放矢1.知道獲取數據的基本途徑,包括:統計報表和年鑒、社會調查、試驗設計、普查和抽樣、互聯網等.2.了解總體、樣本、樣本量的概念,了解數據的隨機性.3.通過實例,了解簡單隨機抽樣的含義及其解決問題的過程,掌握兩種簡單隨機抽樣方法:抽簽法和隨機數法.會計算樣本均值和樣本方差,了解樣本與總體的關系.4.通過實例,了解分層隨機抽樣的特點和適用范圍,了解分層隨機抽樣的必要性,掌握各層樣本量比例分配的方法.結合具體實例,掌握分層隨機抽樣的樣本均值和樣本方差.5.在簡單的實際情境中,能根據實際問題的特點,設計恰當的抽樣方法解決問題.6.能根據實際問題的特點,選擇恰當的統計圖表對數據進行可視化描述,體會合理使用統計圖表的重要性.必備知識溫故知新【教材梳理】1.總體、個體、樣本調查對象的全體(或調查對象的某些指標的全體)稱為總體,組成總體的每一個調查對象(或每一個調查對象的相應指標)稱為個體.根據一定目的,從總體中抽取一部分個體進行調查,并以此為依據對總體的情況作出估計和推斷的調查方法,稱為抽樣調查.在抽樣調查中,從總體中抽取的那部分個體稱為樣本,樣本中包含的個體數稱為樣本容量,簡稱樣本量.2.簡單隨機抽樣(1)特點:逐個抽取,且每個個體被抽取的概率相等.本章主要研究不放回簡單隨機抽樣.(2)常用方法:抽簽法和隨機數法.(3)適用范圍:個體性質相似,無明顯層次,且個體數量較少,尤其是樣本容量較少.3.分層隨機抽樣(1)定義:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.(2)適用范圍:總體可以分層,且層與層之間有明顯區別,而層內個體差異較小.(3)平均數的計算:各層抽樣比乘各層平均數的和.4.統計圖表(1)常見的統計圖表有條形圖、扇形圖、折線圖、頻率分布表、頻率分布直方圖等.(2)頻率分布直方圖.①畫頻率分布直方圖的五個步驟:求極差、決定組距與組數、將數據分組、列頻率分布表、畫頻率分布直方圖.②頻率分布直方圖的特點:各個小長方形的面積表示相應各組的頻率;各小長方形的面積的總和等于1.常用結論1.簡單隨機抽樣及按比例分配的分層隨機抽樣中,每一個個體入樣的概率都是相同的.2.按比例分配的分層(兩層)隨機抽樣中,若第一、二層的樣本容量分別為m,n,平均數分別為x,y,則樣本平均數為mx自主評價牛刀小試1.判斷下列命題是否正確,正確的在括號內畫“√”,錯誤的畫“×”.(1)調查一款新能源汽車的最大續航里程,宜采用全面調查.()(2)從高三年級1000名學生中隨機抽取50名學生的身高數據進行統計分析,抽取的50名學生是一個樣本.()(3)簡單隨機抽樣每個個體被抽到的機會不一樣,與先后有關.()(4)在分層隨機抽樣中,每個個體被抽到的可能性與層數及分層有關.()(5)在頻率分布直方圖中,縱軸表示頻率.()【答案】(1)×(2)√(3)×(4)×(5)×2.某校有男生700名、女生400名.為了解男、女學生在空間想象能力方面是否存在顯著差異,擬從全體學生中抽取110名學生進行調查.宜采用的抽樣方法是()A.抽簽法 B.隨機數法C.分層隨機抽樣法 D.以上抽樣方法均可【答案】C【解】最適合采用的是分層隨機抽樣法.故選C.3.(教材題改編)某城市收集并整理了該市2024年1月份至10月份每月最低氣溫與最高氣溫(單位:℃)的數據,繪制了如圖所示的折線圖.已知該市每月的最低氣溫與當月的最高氣溫兩個變量具有較好的線性關系,則下列選項錯誤的是()A.每月的最低氣溫與當月的最高氣溫兩個變量正相關B.10月份的最高氣溫不低于5月份的最高氣溫C.月溫差(最高氣溫減最低氣溫)的最大值出現在1月份D.最低氣溫低于0℃【答案】D【解】由題圖,可得當最低氣溫較高時,最高氣溫也較高,故A正確.10月份的最高氣溫不低于20℃,而5月份的最高氣溫低于20℃,故B正確.從各月的溫差看,1月份的溫差最大,故C正確.最低氣溫低于0℃的月份是1,2,4三個月份,故D錯誤.故選4.某校為了解高一年級學生的體育健康標準測試(簡稱“體測”)成績的分布情況,從該年級學生的體測成績(規定滿分為100分)中,隨機抽取了80名學生的成績,并進行分組:[50,60),[60,70),[70,80),[80【答案】0.020【解】由題意,得10×(0.01+a+核心考點精準突破考點一隨機抽樣例1(1)【多選題】某學生社團有男生32名、女生24名,從中隨機抽取一個容量為7的樣本.某次抽樣結果為抽到3名男生和4名女生,則()A.這次抽樣可能采用的是抽簽法B.這次抽樣不可能采用隨機數法C.這次抽樣不可能是按性別比例分配的分層隨機抽樣D.這次抽樣中,每名男生被抽到的概率一定小于每名女生被抽到的概率(2)【多選題】某學校高三年級共有900人,其中男生500人.現采用按性別比例分配的分層隨機抽樣的方法,從中抽取了容量為90的樣本.經計算,得男生樣本身高(單位:cm)的平均數為170,女生樣本身高的平均數為161.下列說法正確的是()A.男、女生被抽到的人數分別為50,40B.女生甲被抽到的概率為4C.估計該校高三年級學生身高的平均數為166D.若用簡單隨機抽樣方法從900人中抽取9人,則這9人的身高均值比上述90人的身高均值更接近總體平均值【點撥】①當總體由差異明顯的幾部分組成時,多用分層隨機抽樣.②不論哪種抽樣方法,每個個體入樣的概率都是相同的.③在比例分配分層隨機抽樣中,若第一、二層的樣本容量分別為m,n,平均數分別為x,y,則樣本平均數為mx【答案】(1)AC(2)AC【解析】(1)【解】總體中個體數不多,此次抽樣可能采用的是抽簽法或隨機數法,故A正確,B錯誤.若按性別比例分配,則抽得的男、女生應分別為4人、3人,故C正確.在隨機抽樣中,每名男生被抽到的概率和每名女生被抽到的概率均相等,故D錯誤.故選AC.(2)【解】由題意,得抽樣比例為90900=110,故男生被抽到的人數為110×500=50;女生被抽到的人數為90?50=40,故A正確.女生甲被抽到的概率為40900?500=110,故B錯誤.樣本均值為50變式1.(1)總體由編號為1,2,3,?,89,90的90個個體組成,現用隨機數法選取30個個體.利用僅顯示1~8 44 2 17 8 95 57 4 55 6 88 831 47 7 21 76 33 50 63(2)【多選題】已知某地區有小學生120000人,初中生75000人,高中生55000人.當地教育部門為了解本地區中小學生的近視率,按小學生、初中生、高中生進行分層隨機抽樣,抽取一個容量為2000的樣本,得到小學生、初中生、高中生的近視率分別為30%,70%,A.從高中生中抽取了460人B.每名學生被抽到的概率為1C.估計該地區中小學生總體的平均近視率為60D.估計高中學生的近視人數約為44000【答案】(1)57(2)BD【解析】(1)【解】按序舍掉重復的8和超過編號范圍的95,可知,前5個個體編號為8,44,2,17,57.故填57.(2)【解】學生總人數為120000+75000+55000=250000.高中生抽取2000×55000250000=440(人),故A錯誤.每名學生被抽到的概率為2000250000=1125,故B正確.估計該地區中小學生總體的平均近視率為120000250000×0.3考點二統計圖表例2【多選題】某保險公司為客戶定制了5個險種:甲,一年期短險;乙,兩全保險;丙,理財類保險;丁,定期壽險;戊,重大疾病保險.各種保險按相關約定進行參保與理賠.該保險公司對5個險種的參保客戶進行抽樣調查,得出如下三個統計圖,則()圖3A.18?B.30周歲以上的參保人群約占參保總人群的20C.54周歲以上的參保人數最少D.丁險種更受參保人青睞【解】由題圖1,得54周歲及以上的參保人數比例為1?30%?33%?20%=17%,占比最少.其余年齡段的參保人數均比18?29周歲人群參保人數多.由題圖2,得20%×對于B,由題圖1,得30周歲以上的參保人群約占參保總人群的80%,故B錯誤對于D,由題圖3,得丁險種參保人群約占參保總人群的55%,所以最受青睞,故D正確.故選ACD【答案】ACD【點撥】扇形圖常被用來描述各類數據占總數的比例,折線圖常被用來描述數據隨時間的變化趨勢,條形圖和直方圖常被用來描述不同類別或分組數據的頻數和頻率.統計圖表,除了上述教材中出現過的外,莖葉圖、雷達圖、等高條形圖等也在高考中出現過.變式2.(1)【多選題】如圖是2018—A.2018?2022年的國內生產總值逐年遞增,B.2018?C.2018?2022D.2018?2022年的國內生產總值的極差為(2)【多選題】人均消費支出是社會需求的主體,是拉動經濟增長的直接因素,是體現居民生活水平和質量的重要指標.2022年一季度和2023年一季度我國居民人均消費支出分別為6393元和6738元.圖1、圖2分別為2022年一季度和2023年一季度居民人均消費支出構成分布圖,則()A.2022年一季度和2023年一季度居民食品煙酒人均消費支出均超過人均總消費支出的30B.2023年一季度居民食品煙酒、衣著、居住各項人均消費支出占比較上年同期均有所降低C.2023年一季度居民人均交通通信支出低于上年同期人均交通通信支出D.2023年一季度居民人均消費支出比上年同期增長約5.4【答案】(1)ACD(2)AD【解析】(1)【解】顯然A正確,B錯誤.對于C,2018?2022年的國內生產總值增長速度的平均數為6.7%+6.0%+2.2%+8.4%+3.0%5=5.26%,故C正確.對于D,2018(2)【解】對于A,2022年一季度和2023年一季度居民食品煙酒人均消費支出分別占人均總消費支出的32.6%,31.6%,故A正確.對于B,2022年一季度居民居住人均消費支出占人均總消費支出的22.5%,2023年一季度居民居住人均消費支出占人均總消費支出的23.2%,故B錯誤.對于C,2022年一季度居民人均交通通信支出為6393×12.4%≈793(元),2023年一季度居民人均交通通信支出為6738×12.2%≈822(元),故C錯誤.對于D,考點三頻率分布直方圖例3某家庭記錄了未使用節水龍頭50天的日用水量(單位:m3未使用節水龍頭50天的日用水量頻數分布表日用水量[0[0.1[0.2[0.3[0.4[0.5[0.6頻數13249265使用了節水龍頭50天的日用水量頻數分布表日用水量[0[0.1[0.2[0.3[0.4[0.5頻數151310165(1)在下圖中作出使用了節水龍頭50天的日用水量數據的頻率分布直方圖.(2)估計該家庭使用節水龍頭后,日用水量小于0.35m(3)估計該家庭使用節水龍頭后,一年大約能節省多少水?(一年按365天計算,同一組中的數據用這組數據所在區間的中點值代替)【解】(1)頻率分布直方圖如圖所示.(2)根據以上數據,該家庭使用節水龍頭后,50天的日用水量小于0.35m3的頻率為故該家庭使用節水龍頭后,日用水量小于0.35m3(3)該家庭未使用節水龍頭50天的日用水量的平均數為x1該家庭使用了節水龍頭后,50天日用水量的平均數為x2估計該家庭使用節水龍頭后,一年大約能節省水(0.48【點撥】①在頻率分布直方圖中,每個小矩形的面積就是相應的頻率或概率,所有小矩形的面積之和為1.②在頻率分布直方圖中,縱軸上的數據是各組的頻率除以組距,而不是頻率,不要和條形圖混淆.變式3.(1)某校抽取100名學生測身高(單位:cm),其中身高最大值為186,最小值為154.根據身高數據繪制頻率分布直方圖,組距為5,且第一組下限為153.5,則組數為____.(2)【多選題】某研究性學習小組為了解某校2000名學生參加2024年暑期社會實踐的情況,隨機抽取了一個容量為N的樣本,對學生某一天社會實踐的時間(單位:min)進行統計,得到樣本的頻率分布直方圖如圖所示.已知樣本中位于區間[60A.aB.NC.估計該樣本數據的平均數為74D.估計全校社會實踐時間在60min【答案】(1)7(2)ABC【解析】(1)【解】極差為186?154=32,組距為5,且第一組下限為153.5,32(2)【解】由(0.01+2a+0.045+0.005)×10=1,得a=0.020,故A正確.因為樣本中位于區間[60,70)的有20人,所以20N=0.2,即N=100,故B正確.平均數為0.1×55+0.2×65+課時作業知能提升【鞏固強化】1.為了解高一學生的身體發育情況,打算在高一年級10個班中隨機抽取2個班,在這2個班的所有學生中按男、女生比例抽取樣本.恰當的抽樣方法是()A.先用抽簽法,再用隨機數法B.先用分層隨機抽樣法,再用隨機數法C.兩次抽取均用分層隨機抽樣法D.先用抽簽法,再用分層隨機抽樣法【答案】D【解】先從高一年級10個(少數)班級中抽取2個,宜用抽簽法.再從差異較大的男、女生中按比例抽取學生,適合使用分層隨機抽樣法.故選D.2.某單位老年、中年、青年員工分別有80人、100人、120人.現采用按比例分配的分層隨機抽樣的方法,從該單位上述員工中抽取30人調查專項附加扣除的享受情況,則應從青年員工中抽取()A.8人 B.10人 C.12人 D.18人【答案】C【解】由題意,可得抽取的30人中,青年員工有12080+100+120×303.某校采用分層隨機抽樣方法,從高一、高二、高三學生中分別抽取90名、100名、120名,對餐廳服務進行評價,得到高一年級的好評率為90%,高二年級的好評率為93%,高三年級的好評率為A.91% B.92% C.93%【答案】C【解】該校學生對餐廳服務的好評率為90故選C.4.《黃帝內經》中十二時辰養生法認為子時的睡眠對一天至關重要(子時是指23點到次日凌晨1點).相關數據表明,入睡時間越晚,沉睡時間越少,睡眠指數也就越低.根據某次的抽樣數據,對早睡群體和晚睡群體的睡眠指數統計如圖所示,則()A.睡眠指數在區間[60B.早睡人群睡眠指數主要集中在區間[80C.早睡人群睡眠指數的極差比晚睡人群睡眠指數的極差小D.晚睡人群睡眠指數主要集中在區間[60【答案】B【解】因為沒有給出樣本量,所以不能從占比來判斷人數,故A錯誤.早睡人群睡眠指數主要集中在區間[80,90)內,晚睡人群睡眠指數主要集中在區間[50,60)內,早睡人群睡眠指數的極差和晚睡人群睡眠指數的極差的大小無法確定,故C錯誤.故選B.5.從某中學隨機選取100名學生,將他們的身高數據(單位:cm)繪制成頻率分布直方圖.若要從身高在[150,160),[160A.7人 B.8人 C.9人 D.10人【答案】B【解】由頻率分布直方圖的性質,得a=0.025,所以身高在[150,160由題意,知從身高在[170,180]內的學生中選取32×456.[2023年上海春季高考卷]如圖為2018—2021年2018—A.從2018年開始,2021年的進出口總額增長率最大B.從2018年開始,進出口總額逐年增大C.從2018年開始,進口總額逐年增大D.從2018年開始,2020年的進出口總額增長率最小【答案】C【解】顯然A,B正確.2020年相對于2019的進口總額減少,故C錯誤.2021年的進出口總額增長率最大,而2020年相對于2019年的增量比2019年相對于2018年的增量小,且計算增長率時前者的分母更大,故2020年的增長率一定最小,故D正確.故選C.7.[2021年全國甲卷改]【多選題】為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中正確的是()A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10C.估計該地農戶家庭年收入的平均值不超過6.5萬元D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間【答案】ABD【解】該地農戶家庭年收入低于4.5萬元的農戶的比率估計值為0.02+0.04=0.06=6該地農戶家庭年收入不低于10.5萬元的農戶比率估計值為0.04+0.02×3=0.10該地農戶家庭年收入介于4.5萬元至8.5萬元之間的比例估計值為0.10+0.14+0.20×2由對稱性(以7.5為對稱軸),并進行割補,可知平均值超過7(大致在7.5附近),故C錯誤.直接計算亦可.故選ABD.8.某校高二年級為選拔參加數學競賽的學生組織了一次考試,最后選出13名男生和7名女生,這20名學生的考試成績如莖葉圖所示(單位:分).學校規定:成績不低于130分的人到A班培訓,低于130分的人到B班培訓.若用比例分配的分層隨機抽樣的方法從到A班的人和到B班的人中共選取5人,則5人中到A班的有____人.【答案】2【解】由題意,結合題圖,知這20名學生有8人到A班培訓,12人到B班培訓.所以5人中到A班的有820×5=9.為了解某中學女生的視力情況,對該校女生的視力進行了一次測量,所得數據整理后列出了頻率分布表如下:組別[0.85[0.95[1.05[1.15[1.25[1.35合計頻數1420158mM頻率0.020.080.400.300.16nN(1)求表中m,n,M,N的值;(2)將下列頻率分布直方圖補充完整;(3)利用組中值計算女生視力的平均值.【解】(1)由頻率分布表,得1M=0.02所以m=所以n=250(2)[1.05,1.15)對應矩形的高為0.40.1(3)女生視力的平均值為0.02×【綜合運用】10.為了解某校初中學生的近視情況,按年級用比例分配的分層隨機抽樣的方法抽取100名學生進行視力檢測.已知初一、初二、初三年級分別有800名、600名、600名學生,則不同的抽樣結果共有()A.C80040(C600C.(C80030)2【答案】A【解】按年級用比例分配的分層隨機抽樣的方法抽取初一學生40名,初二、初三學生各30名.根據分步乘法計數原理,可知不同的抽樣結果共有C80040(C60030)11.某養豬場定購了一批仔豬,從中隨機抽查了100頭仔豬的體重(單位:斤).經數據處理,得到如圖所示的頻率分布直方圖,其中體重最輕的14頭仔豬的體重的頻數分布表如下所示.為了將這批仔豬分欄喂養,需計算頻率分布直方圖中的一些數據,其中a+體重22242627282931頻數1123322A.0.144 B.0.152 C.0.76 D.0.076【答案】B【解】由題意,得c+d=14?2100×15=12.【多選題】某校為更好地支持學生的個性化發展,開設了學科拓展類、創新素質類、興趣愛好類三種類型的校本課程,每位學生從中選擇一門課程學習.現對該校4000名學生的選課情況進行了統計,如圖1,并按類型用比例分配的分層隨機抽樣的方法從中抽取2%A.抽取的樣本容量為4000B.該校學生中對興趣愛好類課程滿意的約有700人C.若抽取的學生中對創新素質類課程滿意的有24人,則aD.該校學生中選擇學科拓展類課程的有1000人【答案】BD【解】對于A,抽取的樣本容量為4000×2%=80,故對于B,該校學生中對興趣愛好類課程滿意的約有4000×35%×50%=700(人對于C,80×40%×a%=24,解得a對于D,由圖1,知該校學生中選擇學科拓展類課程的頻率為1?35%?40%=25%,則4000×25%=1000(13.某班按座位將學生分為兩組,第一組18人,第二組27人.現按組采用比例分配的分層隨機抽樣的方法抽取5人,再從這5人中安排兩人去打掃衛生,則這兩人來自同一組的概率為______.【答案】25【解】第一組抽取5×1818+27=2(人),第二組抽取這兩人來自同一組包含的基本事件個數m=C22+C3214.某公司招聘銷售員,提供了兩種日工資結算方案.方案一:每日底薪120元,每銷售一單提成2元.方案二:每日底薪200元,銷售的前50單沒有提成,從第51單開始,每完成一單提成4元.該公司記錄了銷售員的每日人均業務量,現隨機抽取一個季度的數據,將樣本數據分為[25,35),[35,45),[45(1)求頻率分布直方圖中a的值.(2)若僅從人均日收入的角度考慮,請你利用所學的統計學知識為新聘銷售員做出日工資方案的選擇,并說明理由.(同組中的每個數據用該組區間的中點值代替)(3)假設該銷售員選擇了你在(2)中所選的方案,已知公司現有銷售員400人,他希望自己的收入在公司中處于前40名,求他每日的平均業務量至少應達多少單?【解】(1)由題圖,得(0.005×3(2)每日人均業務量的平均值為(30方案一中人均日收入為120+方案二中人均日收入為200+(62?(3)因為40÷400=0.1由題圖,得前5組的頻率和為(0.005前6組的頻率和為0.8+設該銷售員每日的平均業務量為x.因為0.8<0.9<0.95,所以(x?75)×【拓廣探索】15.某單位員工按年齡分為老、中、青三組,其人數之比為1:6:【答案】70【解】從老年職工組中抽取20×110設老年職工組共有n人,則甲、乙二人均被抽到的概率為C22Cn2=1所以該單位共有員工72×20=9.2用樣本估計總體課程標準有的放矢1.結合實例,能用樣本估計總體的集中趨勢參數(平均數、中位數、眾數),理解集中趨勢參數的統計含義.2.結合實例,能用樣本估計總體的離散程度參數(標準差、方差、極差),理解離散程度參數的統計含義.3.結合實例,能用樣本估計總體的取值規律.4.結合實例,能用樣本估計百分位數,理解百分位數的統計含義.必備知識溫故知新【教材梳理】1.百分位數(1)第p百分位數的定義:一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100(2)計算一組n個數據的第p百分位數的步驟:第1步,按從小到大排列原始數據;第2步,計算i=n×p%;第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i2.眾數、中位數與平均數(1)眾數:一組數據中重復出現次數最多的數據.(2)中位數:把一組數據按從小到大(或從大到小)的順序排列,處在中間位置的數(或中間兩個數的平均值)叫做這組數據的中位數.(3)平均數:如果n個數x1,x2,?,xn,那么x=一般地,對數值型數據集中趨勢的描述,可以用平均數、中位數;而對分類型數據集中趨勢的描述,可以用眾數.3.方差與標準差(1)方差、標準差的定義:一組數據x1,x2,?,xn,用x表示這組數據的平均數,則這組數據的方差為1n∑ni=1((2)總體方差和總體標準差:如果總體中所有個體的變量值分別為Y1,Y2,?,YN,總體平均數為Y,則總體方差S2=1N∑Ni=1(Yi?Y)2;如果總體的常用結論1.頻率分布直方圖中,最高的小長方形底邊中點的橫坐標即是眾數;中位數左邊和右邊的小長方形的面積和是相等的;平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以對應小長方形底邊中點的橫坐標之和.2.若數據x1,x2,?,xn的平均數為x,方差為s2,則數據mx1+a,mx自主評價牛刀小試1.判斷下列命題是否正確,正確的在括號內畫“√”,錯誤的畫“×”.(1)一組數據的平均數,不太受極端值的影響,因而平均數總是接近中位數.()(2)若樣本量n=(3)一組數據的眾數可以是一個或幾個,中位數也具有相同的結論.()(4)在頻率分布直方圖中,最高的小長方形底邊中點的橫坐標是眾數.()(5)如果一組數據中的每個數都減去同一個非零常數,那么這組數據的平均數改變,方差不變.()【答案】(1)×(2)×(3)×(4)√(5)√2.在某次聯考的閱卷工作中,質檢老師隨機抽取了10份試卷,對某題的閱卷評分進行了復查,得分記錄分別為13,17,11,9,12,15,10,8,10,7,則這組樣本數據的()A.極差為11分 B.眾數為10.5分C.平均數為11分 D.中位數為10.5分【答案】D【解】將得分從小到大排列為7,8,9,10,10,11,12,13,15,17,故A,B錯誤,D正確.平均數為13+17+11+9+12+153.[2021年新課標Ⅱ卷]【多選題】下列統計量中,能度量樣本x1,x2,?,A.樣本x1,x2,?,xn的標準差 B.樣本x1,x2C.樣本x1,x2,?,xn的極差 D.樣本x1,x2【答案】AC【解】標準差和極差符合要求.故選AC.4.(教材題改編)一個容量為20的樣本,其數據按從小到大的順序排列為1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,則該組數據的第75百分位數為__.【答案】14.5【解】因為75%×20=15,所以第75核心考點精準突破考點一總體百分位數的估計例1(1)“雙減”政策實施后,學生的課外閱讀增多.某班50名學生到圖書館借書數量統計如下:借書數量/本5678910頻數/人58131194則這50名學生的借書數量的上四分位數是()A.8 B.8.5 C.9 D.10(2)某大型聯考有16000名學生參加,已知所有學生成績的第60百分位數是515分,則成績不低于515分至少有()A.6000人 B.6240人 C.6300人 D.6400人【點撥】第p百分位數的計算步驟(在頻率分布直方圖中):先確定第p百分位數所在的區間[a,b),再確定小于a和不小于b的數據所占的百分比fa%,【答案】(1)C(2)D【解析】(1)【解】由50×75%=37.5,得上四分位數為借書數量從小到大排序后的第38個數.又5+8+(2)【解】成績不低于515分的至少有16000×(1?60%)=6400(變式1.(1)某果園種植了100棵蘋果樹,從中隨機抽取的12棵果樹的產量(單位:kg)分別為:242536272832202629302633據此預計,該果園的總產量為____kg,第75百分位數為kg.(2)某省全省聯考后,教育部門在該省高三學生中隨機抽取了1000名學生,對他們的化學成績進行統計,得到如圖所示的頻率分布直方圖,則估計該省學生此次化學成績的第75百分位數為()A.79.5分 B.82.5分 C.81分 D.82分【答案】(1)2800;31(2)B【解析】(1)【解】x=112×(24+25+36+27+28+32+20+26(2)【解】由題圖,知分數在[40,80)內的頻率為(0.005+0.015+0.020+0.030)×10=0.7,在[40,90考點二總體集中趨勢的估計例2【多選題】某大學共有15000名學生,為了解學生書籍閱讀量的情況,該校從全校學生中隨機抽取1000名,統計他們2024年閱讀的書籍數量,由此估計該校學生本年度閱讀書籍數量的情況.下列估計正確的是(注:同一組數據用該組區間的中點值作為代表)()A.估計該校學生2024年閱讀的書籍數量的眾數為6B.估計該校學生2024年閱讀的書籍數量的中位數為6.6C.估計該校學生2024年閱讀的書籍數量的平均數為6.76D.估計該校學生2024年閱讀的書籍數量的第60百分位數為7.6【解】由題圖,知眾數在[4,8]內,所以眾數是6,故A正確.中位數x∈[4,8],所以0.06×4+0.1×(x?4第60百分位數約為4+0.6?0.240.1×4×4=【答案】ABD【點撥】①頻率分布直方圖中求中位數,一般先確定中位數所在的區間,再利用“0.5?較低累積頻率=(x?區間左端點值)×區間縱坐標”,求得變式2.(1)某班學生A,B在高三8次月考的化學成績用莖葉圖表示如圖,其中學生A成績的平均數與學生B成績的眾數相等,則m=____(2)(教材題改編)平均數和中位數都描述了數據的集中趨勢,它們的大小關系和數據分布的形態有關.下面四個頻率分布直方圖中,最能說明平均數大于中位數的是()A. B.C. D.【答案】(1)5(2)A【解析】(1)【解】由題意,得73+79+82+(2)【解】對于B,D,直方圖形狀對稱,所以平均數和中位數相等.A中圖形在右邊拖“邊尾”,C中圖形在左邊“拖尾”,故A正確.故選A.考點三總體離散程度的估計例3某果園試種了A,B兩個品種的桃樹各10棵,并在桃樹成熟掛果后統計了這20棵桃樹的產量(單位:kg)如下表.記A,B兩個品種各10棵產量的平均數分別為x和y,方差分別為s12和A/kg60504060708070305090B/kg40605080805060208070(1)分別求這兩個品種產量的極差和中位數.(2)求x,y,s12,(3)果園要大面積種植這兩種桃樹中的一種,依據以上計算結果分析選種哪個品種更合適?并說明理由.【解】(1)這10棵A品種桃樹的產量從小到大分別為30,40,50,50,60,60,70,70,80,90.所以極差為90?30=這10棵B品種桃樹的產量從小到大分別為20,40,50,50,60,60,70,80,80,80.所以極差為80?20=(2)x=y=s1s2(3)由(1),知這兩個品種產量的極差和中位數都相等.由(2),知x>y,所以A品種桃樹平均產量高,波動小,所以應選種A品種桃樹.【點撥】①標準差(方差)反映了數據的離散與集中、波動與穩定的程度.標準差(方差)越大,數據的離散程度越大;標準差(方差)越小,數據的離散程度越小.②方差公式可變形為s2變式3.[2023年全國乙卷]某廠為比較甲、乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為xi,y試驗序號i12345678910伸縮率x545533551522575544541568596548伸縮率y536527543530560533522550576536記zi=xi?yi(i=1,2(1)求z,s2(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果z≥【解】(1)zi=xi?故s2(2)由(1),知z=11,2s課時作業知能提升【鞏固強化】1.一組觀察值4,3,5,6出現的次數分別為3,2,4,2,則樣本平均數約為()A.4.55 B.4.6 C.12.5 D.1.64【答案】A【解】樣本平均數為4×3+3×2.數據7,3,6,5,10,14,9,8,12的第60百分位數為()A.14 B.9.5 C.9 D.8【答案】C【解】數據從小到大依次排列為:3,5,6,7,8,9,10,12,14,共9個數據.因為9×60%=5.4,所以第60百分位數為第6個數據,即為9.3.已知數據x1,x2,?,x20的極差為4,方差為2,則數據3x1+5A.4,2 B.4,18 C.12,2 D.12,18【答案】D【解】新數據的極差是原數據極差的3倍,所以新數據的極差為4×新數據的方差是原數據方差的32倍,所以新數據的方差為2×32=4.學校準備從41名喜愛數學的學生中,選拔出20名學生組成“強化訓練班”,為此進行了一次選拔考試,考試后這些學生的成績各不相同.小軍已經知道了自己的成績,為了判斷自己能否進入“強化訓練班”,他需要知道這41名學生成績的()A.方差 B.中位數 C.眾數 D.平均數【答案】B【解】把這41名學生的成績按從大到小的順序排列,取成績靠前的20名學生入選,即成績在中間的數之前的20名學生入選.當這41個成績按從大到小的順序排列時,中間的數即中位數.若小軍的成績大于中位數,則可以判斷他能進入“強化訓練班”;否則,不能.故選B.5.平均數和中位數都描述了數據的集中趨勢,它們的大小關系和數據分布的形態有關.在下圖兩種分布形態中,a,b,c,d分別對應平均數和中位數之一,則可能的對應關系是()A.a為中位數,b為平均數,c為平均數,d為中位數B.a為平均數,b為中位數,c為平均數,d為中位數C.a為中位數,b為平均數,c為中位數,d為平均數D.a為平均數,b為中位數,c為中位數,d為平均數【答案】A【解】在頻率分布直方圖中,中位數兩側小矩形的面積相等,平均數是每組數據的中間值乘頻率再相加之和,結合兩個頻率分布直方圖,得a為中位數,b為平均數,c為平均數,d為中位數.故選A.6.已知數據x1,x2,x3,?,x10,且滿足x1A.平均數 B.中位數 C.極差 D.方差【答案】A【解】原數據的極差為x10?x1,新數據的極差為原數據和新數據的中位數均為x5+x去掉x1,x10后,數據波動性變小,可能變大的是平均數,比如1,3,4,5,6,7,8,9,11,12,原數據的平均數為6.6,去掉1和12后,新數據的平均數為538>6.6.故選7.【多選題】在某市初三年級舉行的一次體育統考中,共有500人參加考試.為了解考生的成績情況,抽查了n位考生的成績,根據所得數據作出如圖所示的頻率分布直方圖.若樣本中成績在區間[50A.nB.估計該市考生成績的眾數為72C.估計該市考生成績的第70百分位數為75D.估計該市考生成績的平均數為70.6【答案】AD【解】由頻率分布直方圖,可知x=110?(0.004+0.01+0.03由頻率分布直方圖,可知樣本的眾數為75,則估計該市考生成績的眾數為75,故B錯誤.樣本中考生成績的第70百分位數為70+10×0.70?0.460.86?0.46=樣本中考生成績的平均數為55×0.16+65×0.3+75×0.4+85×8.有一種花的植株高度的頻率分布直方圖如圖所示,則這種花的植株高度的眾數約為cm,中位數約為__cm.(精確到0.1)【答案】45;45.8【解】由頻率分布直方圖,知頻率最大的區間為[40,50)因為10×(0.005+0.010)=0.15<0.5設中位數為x,則0.15+(解得x≈45.89.某市計劃調整居民生活用水收費方案,擬確定一個合理的月用水量標準x(單位:t).一位居民的月用水量不超過x的部分按平價收費,超出x的部分按議價收費.為了解居民用水情況,通過隨機抽樣,獲得了某年200位居民每人的月均用水量(單位:t).將數據按[0,1),[1,2),(1)求直方圖中a,b的值,并由頻率分布直方圖估計該市居民月均用水量的平均數(每組數據用該組區間中點值作為代表).(2)設該市有40萬居民,估計全市居民中月均用水量不低于2t(3)若該市政府希望使85%的居民每月的用水量不超過標準xt,估計【解】(1)由頻率分布直方圖,可得0.04+0.08+a+0.20+0.26+該市居民月均用水量的平均數估計為x=(2)由頻率分布直方圖,可得樣本中月均用水量不超過2t的頻率為0.04所以全市40萬居民中月均用水量不低于2t的人數約為40(3)由頻率分布直方圖,知月均用水量不超過6t的頻率為1?0.02?0.04?0.06=0.88,月均用水量不超過5t的頻率為0.88?0.15=0.73【綜合運用】10.[2024年新課標Ⅱ卷]某農業研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產量(單位:kg)并整理得下表.畝產量[900[950[1000頻數61218畝產量[1050[1100[1150頻數302410根據表中數據,下列結論中正確的是()A.100塊稻田畝產量的中位數小于1050B.100塊稻田中畝產量低于1100kg的稻田所占比例超過C.100塊稻田畝產量的極差介于200kg至300D.100塊稻田畝產量的平均值介于900kg至1000【答案】C【解】顯然A,B錯誤.對于C,稻田畝產量的極差最大為1200?900=300(kg),最小為1150?對于D,平均值估計為1100×(6×925+12×975+18×1025+30×1075+24×1125+10×1175)=1067(或第1組和第611.已知P:x1,x2,x3,?,x8的平均數與中位數相等,Q:x1,x2,A.充分不必要條件 B.必要不充分條件C.充要條件 D.既不充分也不必要條件【答案】B【解】由x1,x2,x3,?,x8是等差數列,得平均數為x1+x2+x3+?+若數據是1,1,1,3,3,5,5,5,則平均數和中位數相等,但x1,x2,x3,?,x8不是等差數列.所以P不是Q的充分條件.綜上,P是Q的必要不充分條件.12.【多選題】某高校組織全體學生參加一主題知識測試,隨機抽取了200名學生的成績(單位:分)進行統計.按成績分成[50,60),[60根據圖中數據,下列結論正確的是()A.這200名學生成績的極差介于35至45之間B.這200名學生成績的平均數小于中位數C.從200名學生中隨機抽取一名,其成績不低于70分的概率估計為0.7D.從該校學生中隨機抽取兩名,在這兩名學生成績都不低于70分的條件下,恰有一名學生成績在[70,【答案】BCD【解】對于A,因為100?50=50,90?60=30,所以這200名學生成績的極差介于30至題圖左“拖尾”,故B正確.對于C,因為這200名學生中成績不低于70分的學生所占比例為1?10×(0.01+0.02對于D,記“從該校學生中隨機抽取兩名,這兩名學生成績都不低于70分”為事件A,“這兩名學生中恰有一名學生成績在[70,80)內由C,可知P(A)=0.72=0.49,P(AB)=C2113.[2023年上海卷]現有某地一年四個季度的GDP(億元),第一季度GDP為232億元,第四季度GDP為241億元,四個季度的GDP逐季度增長,且中位數與平均數相同,則該地這一年的GDP為__億元.【答案】946【解】設第二季度GDP為x億元,第三季度GDP為y億元,則232<因為中位數與平均數相同,所以x+y2=232+x+y+2414,14.某電子產品制造企業為了提升生產效率,對現有的一條電子產品生產線進行技術升級改造.為了分析改造的效果,該企業質檢人員從該條生產線所生產的電子產品中隨機抽取了1000件,檢測產品的某項質量指標值.根據檢測數據得到下表(單位:件).質量指標值[25[35[45[55[65[75[85產品/件6010016030020010080(1)估計這組樣本的質量指標值的平均數x和方差s2(2)設[x]表示不大于x的最大整數,{x}表示不小于x的最小整數,s精確到個位,an=5?{x?ns5}【解】(1)x=s2(2)由s2=241a1=5該抽樣數據落在[45,75]又a2b2該抽樣數據落在[30,90]所以不能判定生產線的技術改造成功.【拓廣探索】15.從2,3,4,5,6,7,8,9中隨機取一個數,這個數比m大的概率為14.若m為上述數據中的第x百分位數,則xA.50 B.60 C.70 D.80【答案】C【解】由題意,知7≤m<8.又m是百分位數,所以m由百分位數的定義,知8×解得62.5<x≤75.僅C符合題意.專題突破22基本數字特征研究核心考點精準突破考點一基本數字特征例1(1)【多選題】有一組樣本數據x1,x2,?,xn,其平均數、中位數、標準差、極差分別記為a1,b1,c1,d1.由這組數據得到新樣本數據y1,y2,?,yn,其中A.a2=2C.c2=4(2)已知一組正數x1,x2,x3,x4,x5的方差為s2=15∑5A.4 B.5 C.6 D.7【點撥】①一組數據x1,x2,?,xn變為kx1+b,kx2+b【答案】(1)AD(2)B【解析】(1)【解】由yi=2xi+2026,得a2=2a1+2026,b2=2b1+(2)【解】由s2=15∑5i=1xi2?x2,可得變式1.(1)[2021年新課標Ⅰ卷]【多選題】有一組樣本數據x1,x2,?,xn,由這組數據得到新樣本數據y1,y2,?,yA.兩組樣本數據的平均數相同 B.兩組樣本數據的中位數相同C.兩組樣本數據的標準差相同 D.兩組樣本數據的極差相同(2)若一組數據a1,a2,?,a10的平均數為3,方差為11,則a12【答案】(1)CD(2)200【解析】(1)【解】對于A,E(y)=E(x+c)=E(x)+c,且c≠0,故平均數不相同,故A錯誤.對于B,若第一組中位數為xi,則第二組中位數為yi(2)【解】110[a12考點二分層樣本的均值與方差例2【多選題】某市提出“保證中小學生每天一小時校園體育活動”的倡議.在某次調研中,甲、乙兩所學校學生一周的運動時間統計如下表.學校人數平均運動時間方差甲校2000103乙校300082記這兩個學校學生一周運動的總平均時間為x,方差為s2A.x=8.7 B.x=8.8 C.【解】x=20005000×10+3000【答案】BC【點撥】①一般地,如果已知第一組數據的個數是m,平均數和方差分別為x和sx2,第二組數據的個數是n,平均數和方差分別為y和sy2,那么總樣本平均數z=mm變式2.據統計某市學生的男、女生人數比為2:3,為了調查該市學生每天睡眠時長(單位:h)的情況,按照男、女生人數比用分層隨機抽樣的方法抽取樣本.根據樣本數據計算得男生每天睡眠時長的平均數為7.3,方差為2,女生每天睡眠時長的平均數為6.8,方差為【解】由題意,知x1=7.3,s12因為該市學生的男、女生人數比為2:3,所以設男、女生人數分別為2a,估計該市學生每天睡眠時長的平均數為7.3×方差為2a2a考點三變動樣本的數字特征例3【多選題】已知互不相同的20個樣本數據,若去掉其中最大和最小的數據,設剩下的18個樣本數據的方差為s12,平均數為x1;去掉的兩個數據的方差為s22,平均數為x2;原樣本數據的方差為A.剩下的18個樣本數據與原樣本數據的中位數不變B.xC.剩下18個數據的22%分位數大于原樣本數據的22D.10【解】設20個樣本數據從小到大排列分別為x1,x2,x3,?,x20,則剩下的18個樣本數據為x2,x中位數不變,故A正確.對于B,x1=118(x2+x3+?+x19),對于C,因為18×22%=3.96,20×22%=4.4,所以剩下的18個數據與原樣本數據的22%對于D,因為x=x1=x2,所以s12=118(x22+x3【答案】ABD【點撥】①刪掉樣本數據(不全相等)中與平均值相等的數據后,極差不變,標準差變大,中位數不確定.②刪掉樣本數據(不全相等)中的最小值和最大值后,中位數不變,平均數不確定,極差、標準差變小或不變.變式3.(1)[2023年新課標Ⅰ卷]【多選題】有一組樣本數據x1,x2,?,x6,其中xA.x2,x3,x4,x5的平均數等于x1,xB.x2,x3,x4,x5的中位數等于x1,xC.x2,x3,x4,x5的標準差不小于x1,xD.x2,x3,x4,x5的極差不大于x1,x(2)已知某8個數據的平均數為5,方差為3,現又加入一個新數據5,此時這9個數的平均數為x,方差為s2A.x=5,s2>3 B.x=5,s2<3【答案】(1)BD(2)B【解析】(1)【解】取x1=1,x2=x3=x4=x5=2,x6=9,則x2,x3,x4,x5的平均數等于2,標準差為0;x1,x2,?,x6的平均數等于3,標準差為663,故A,C均錯誤.將x1,x2,?,x6按從小到大的順序進行排列,易知x2,x3,x4,x5的中位數與x1,x2,x3,?,(2)【解】x=5,s2=1考點四實際應用中的推斷問題例4某環保局對轄區內甲、乙兩個地區的環境治理情況進行檢查督導.若連續10天,每天空氣質量指數(單位:μg/甲地區:平均數為80,方差為40.乙地區:平均數為50,眾數為40.據此推斷甲、乙兩地的環境治理達標情況.【解】設每天的空氣質量指數為xi(i=1對于甲地區,由110∑10i=1對于乙地區,若有8天的空氣質量指數為40,有1天的空氣質量指數為150,有1天的空氣質量指數為30,滿足題意,但此時乙地區的環境治理不達標.若有8天的空氣質量指數為40,有2天的空氣質量指數為90,滿足題意,此時乙地區的環境治理達標.所以乙地區的環境治理是否達標無法判斷.綜上,甲地區的環境治理達標,乙地區無法判斷.【點撥】統計推斷關鍵在于利用基本統計知識進行邏輯推理,常用技巧有特值法、極限法等,重在考查數據分析核心素養.變式4.在例4的條件下,若又有丙、丁地區連續10天檢查所得數據特征如下,試推斷丙、丁兩地的環境治理達標情況.丙地區:中位數為50,極差為60.丁地區:極差為10,80%【解】對于丙地區,若第1天的空氣質量指數為110,另外9天的空氣質量指數為50,滿足題意,但此時丙地區的環境治理不達標.若丙地區10天的數據為90,50,50,50,50,50,50,40,40,30,滿足題意,此時丙地區的環境治理達標.所以丙地區的環境治理是否達標無法判斷.對于丁地區,若最大值超過100,則根據極差為10,知最小值超過90,這與80%綜上,丙地區無法判斷,丁地區的環境治理達標.課時作業知能提升1.演講比賽共有9位評委分別給出某選手的原始評分(不全相等),評定該選手的成績時,從9個原始評分中去掉1個最高分、1個最低分,得到7個有效評分.7個有效評分與9個原始評分相比,一定不變的數字特征是()A.中位數 B.平均數 C.方差 D.極差【答案】A【解】平均數可能變化,方差與極差必定變化,不變的只有中位數.故選A.2.已知數據x1,x2,?,xn的平均數、中位數、方差分別為a1,b1,c1(其中a1≠b1),數據1?3x1,A.5 B.6 C.7 D.8【答案】B【解】由題意,知a2=1?3a1,b2=13.為了解某班學生的數學成績,利用分層隨機抽樣抽取了一個10人的樣本,數據統計如下表.可估計全班學生數學的平均分和方差分別為()性別學生數平均分方差男生6804女生4752A.77.5,9.2 B.77.5,11 C.78,9.2 D.78,11【答案】C【解】可估計全班學生數學的平均分為80×35+75×254.已知一組正數x1,x2,x3,x4的方差為s2=14(A.3 B.4 C.5 D.6【答案】D【解】設正數x1,x2,x3,x則方差s2=14[(x1?m)2+(x5.四名同學各擲骰子5次,分別記錄每次骰子出現的點數.根據如下各項的統計結果,可以判斷出一定沒有出現點數6的是()A.平均數為2,方差為2.4 B.中位數為3,方差為1.6C.中位數為3,眾數為2 D.平均數為3,中位數為2【答案】A【解】對于A,若5次結果中有6,則方差s2>1所以當平均數為2,方差為2.4時,一定不會出現點數6,故A正確.對于B,當點數為3,3,3,5,6時,中位數為3,平均數為4,則方差s2=15[(3對于C,當點數為2,2,3,5,6時,中位數為3,眾數為2,故C錯誤.對于D,當點數為1,1,2,5,6時,中位數為2,平均數為3,故D錯誤.故選A.6.【多選題】已知一組數據x1,x2,?,x11A.中位數不變 B.平均數不變 C.方差變大 D.方差變小【答案】ABC【解】對于A,原數據的中位數為x6,去掉x6后的中位數為12(x5+x對于B,原數據的平均數為x=111(x1對于C,D,原數據的方差為s2去掉x6后的方差為s02=110[(x1?x6)2+(x27.已知一組數據共10個數(10個數不全相等),方差為s12,增加一個數后得到一組新數據,新數據的平均數不變,方差為s22,則s12s22=____【答案】1110【解】設這10個數據為x1,x2,x3,?,x10,平均值為m設第11個數據為y.由題意,知111(∑10i=1xi+y)=m,所以y=8.[2024年上海春季高考卷改編]將136箱水果分為一級果和二級果,其中一級果102箱,二級果34箱.(1)隨機抽取兩箱水果,求恰好抽到一級果和二級果各一箱的概率.(2)按水果級別采用分層隨機抽樣抽取8箱水果,求一級果和二級果各抽取多少箱.(3)抽取若干箱水果,其中一級果共120個,單果質量的平均數為301g,方差為598;二級果48個,單果質量的平均數為245【解】(1)設事件A為“恰好抽到一級果和二級果各一箱”.樣本空間的樣本點的個數n=C1362=136×135(2)因為102:34=3:(3)設一級果的平均質量為x,方差為sx2,二級果的平均質量為y,方差為sy2,總體樣本的平均質量為z,方差為s2,則x=301所以z=s2估計這136箱水果中單果的平均質量為1021369.3成對數據的統計分析課程標準有的放矢1.結合實例,了解樣本相關系數的統計含義,了解樣本相關系數與標準化數據向量夾角的關系.2.結合實例,會通過相關系數比較多組成對數據的相關性.3.結合具體實例,了解一元線性回歸模型的含義,了解模型參數的統計意義,了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,會使用相關的統計軟件.4.針對實際問題,會用一元線性回歸模型進行預測.5.通過實例,理解2×6.通過實例,了解2×必備知識溫故知新【教材梳理】1.成對數據的統計相關性(1)變量的相關關系.①相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.②分類:正相關與負相關.③線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,我們稱這兩個變量線性相關.如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.(2)樣本相關系數.①樣本相關系數r的計算公式.r=②r令x′=(x′其中x′i=xi則r=1nx′?y③樣本相關系數r的性質:當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.當|r|越接近1時,成對樣本數據的線性相關程度2.一元線性回歸模型及其應用(1)一元線性回歸模型參數的最小二乘估計.設滿足一元線性回歸模型的兩個變量的n對樣本數據為(x1,y1),(x2,y2),我們把y=bx+a.稱為Y關于x的經驗回歸方程,這種求經驗回歸方程的方法叫做最小二乘法,求得的b,a叫做(2)回歸分析.①殘差:對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的y稱為預測值,觀測值減去預測值稱為殘差.②刻畫回歸效果的方式:一是殘差圖法,殘差點比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適,帶狀區域的寬度越窄,說明模型擬合精度越高;二是殘差平方和法,∑ni=1(yi?yi)2稱為殘差平方和,殘差平方和越小,模型的擬合效果越好;三是用決定系數3.列聯表與獨立性檢驗(1)2×2列聯表:一般地,假設兩個分類變量X和Y,它們的取值為{0XY合計Y=Y=X=aba+X=cdc+合計a+b+n=a(2)獨立性檢驗.①χχ2=n②獨立性檢驗.H0:P(Y當χ2≥xα時,我們就推斷H0不成立,即認為X當χ2<xα時,我們沒有充分證據推斷H0這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ常用結論1.經驗回歸直線過點(x2.計算b時,也常用公式b=自主評價牛刀小試1.判斷下列命題是否正確,正確的在括號內畫“√”,錯誤的畫“×”.(1)散點圖無法判斷兩個變量是否相關.()(2)兩個變量的樣本相關系數越小,它們的相關性越弱.()(3)經驗回歸直線y=bx+a至少經過點(x1,y(4)在一元線性回歸模型中,決定系數R2(5)χ2【答案】(1)×(2)×(3)×(4)√(5)×2.[2024年天津卷]下列圖中,線性相關系數最大的是()A. B.C. D.【答案】A【解】A中,散點分布比較集中,且大體接近某一條直線,線性回歸模型擬合效果比較好,呈現明顯的正相關,|r|值相比于其他選項中更接近1.故選A3.(教材題改編)在利用χ2獨立性檢驗來判斷兩個分類變量X與YA.χ2越大,“X與YB.χ2越小,“X與YC.χ2越接近于0,“X與YD.χ2越大,“X與Y【答案】B【解】根據獨立性檢驗的思想,知χ2越小,變量有關系的可信程度越小,故B正確.故選B4.【多選題】已知變量x,y之間的經驗回歸方程為y=0.7x+1.05,且變量x2345y2.53m4.5A.m=4 B.變量x,C.可預測當x=10時,y約為9.05 D.當x【答案】AB【解】由題意,知x=2+3+4+54=3.5,則y=0.7×3.5+1.05=3.5.又y=2.5+3+m+4.54=10核心考點精準突破考點一成對數據的統計相關性例1(1)(教材題改編)對兩組數據x,y和v,u分別進行回歸分析,得到散點圖如圖所示.求得經驗回歸方程分別是y=b1x+a1A.b1b2>0 B.?1(2)[2020年全國Ⅱ卷]某沙漠經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到成對樣本數據(xi,yi)(i=1∑20i=1yi=①求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘地塊數);②求成對樣本數據(xi,③根據現有統計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:樣本相關系數r=2≈【點撥】①除了樣本相關系數外,散點圖也可以判斷兩個變量的相關關系.點分布在從左下角到右上角的區域時,兩個變量呈現正相關;點分布在從左上角到右下角的區域時,兩個變量呈負相關.②經驗回歸方程中,一般當b>0時,兩變量正相關;當【答案】(1)D(2)①【解】由已知,得樣區內這種野生動物數量的平均數y=120②成對樣本數據(xi,y③分層隨機抽樣:根據植物覆蓋面積的大小對地塊分層,再對200個地塊進行分層抽樣.理由如下:由②,知各樣區的這種野生動物的數量與植物覆蓋面積有很強的正相關性,由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動物的數量差異也很大,采用分層抽樣的方法較好地保持了樣本結構與總體結構的一致性,提高了樣本的代表性,從而可以獲得該地區這種野生動物數量更準確的估計.【解析】(1)【解】由散點圖,可知x與y負相關,v與u正相關,則b1<0,b2>0,0<r2<1,故A,B錯誤.圖形中點(x,y)比(v,u)更加集中在一條直線附近,則|r1變式1.(1)[2024年上海卷]已知沿海地區氣溫和海水表層溫度相關,且相關系數為正數,對此描述正確的是()A.沿海地區氣溫高,海水表層溫度就高B.沿海地區氣溫高,海水表層溫度就低C.隨著沿海地區氣溫由低到高,海水表層溫度呈上升趨勢D.隨著沿海地區氣溫由低到高,海水表層溫度呈下降趨勢(2)[2022年全國乙卷]某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m樣本號i12345678910總和根部橫截面積x0.040.060.040.080.080.050.050.070.070.060.6材積量y0.250.400.220.540.510.340.360.460.420.403.9并計算,得∑10i=1x①估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量.②求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01).③現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186m利用以上數據給出該林區這種樹木的總材積量的估計值.附:樣本相關系數r=∑n【答案】(1)C(2)①【解】設這種樹木平均一棵的根部橫截面積為x,平均一棵的材積量為y.根據題中數據,得x=y=②由題意,知r==0.2474=0.0134③設總根部橫截面積和為X,總材積量為Y,則XY=x故該林區這種樹木的總材積量的估計值為1209m【解析】(1)【解】因為沿海地區氣溫和海水表層溫度相關,且樣本相關系數為正數,所以隨著沿海地區氣溫由低到高,海水表層溫度呈上升趨勢.故選C.考點二回歸模型及其應用命題角度1經驗回歸方程及其應用例2(1)某中學的數學課堂教改采用了“探究題型-強化訓練-檢測效果”的模式,并記錄了某學生的探究題型時間t(單位:h)與檢測效果y的數據如表所示.探究題型時間t1234567檢測效果y2.93.33.64.44.85.25.9①據統計表明,y與t之間具有線性相關關系,請用樣本相關系數r加以說明(若|r|≥0.75,則認為y②建立y關于t的經驗回歸方程,并預測該學生探究題型8h附:經驗回歸直線y=bx+a樣本相關系數r=y=4.3,∑7i=(2)某科技公司對近十年來高科技研發投入情況分析調研,其研發投入y(單位:億元)的統計圖如圖1所示,其中年份代碼x=1,2,圖1現用兩種模型A:y=bx+圖2yt∑10∑10∑10∑10752.2582.54.512028.67表中ti=x①根據圖2,比較模型A,B的擬合效果,應選擇哪個模型?并說明理由.②根據①中所選模型,求y關于x的經驗回歸方程及該公司2030年高科技研發投入y的預報值(回歸系數精確到0.01).附:b=∑n【點撥】①線性經驗回歸方程的重要應用是進行估計.②求線性經驗回歸方程的步驟:第一步,列表;第二步,計算x,y,∑ni=1xiyi,∑ni=【答案】(1)①【解】因為t=∑7所以r=1428×7.08≈0.99②由題意,設y=b=又a=所以y關于t的經驗回歸方程為y=當t=8時,y=(2)①【解】應選擇模型B.理由如下.由于模型B的殘差點比較均勻地落在水平的帶狀區域中,且帶狀區域的寬度比模型A的帶狀區域寬度窄,所以模型B的擬合精度更高,經驗回歸方程的預報精度相應越高,故選模型B比較合適.②根據模型B,令t=x,則研發投入y與t可用線性回歸模型來擬合,設則d=28.674.5則y關于t的經驗回歸方程為y=所以y關于x的經驗回歸方程為y=2030年,即x=16時,所以該公司2030年高科技研發投入y的預報值為86.15億元.變式2.(1)下表提供了某廠進行技術改造后生產產品過程中的產能x(單位:t)與相應的生產能耗y(單位:t標準煤)的幾組對應數據.x/t3456y/t3.5455.5①繪制散點圖,并根據散點圖分析x,y的相關程度.②求y關于x的經驗回歸方程y=③已知該廠技術改造前100t產品的生產能耗為90t標準煤,試根據②中求出的經驗回歸方程,預測該廠技術改造后,100t附:b=∑n(2)某市開展“安全隨我行”活動,交警部門在某個交通路口增設電子抓拍眼,并記錄了某月該路口連續10天騎電動自行車未佩戴頭盔的人數y(人)與天數x(天)的情況.對統計得到的樣本數據(xx?y?Y∑10∑10∑105.58.71.930138579.75表中Yi=lny①依據散點圖,推斷y=bx+a與y=②依據①的結果和上表中的數據,求y關于x的經驗回歸方程.【答案】(1)①【解】繪制散點圖如下,可知x,y的相關程度較高.②依題意,得x?=4.5,y?=4.5,∑4i=1x③當x=100時,y=71.35,即改造后預測100t所以預測該廠改造后,100t產品的生產能耗比技術改造前降低了18.65(2)①【解】依據散點圖,可以推斷y=ebx+a更適合作為y②由Yi=lny依題意,得b=a=所以Y=?0.3x+3.55,即y關于命題角度2決定系數與殘差例3某種農作物可以生長在灘涂和鹽堿地,將海水稀釋后對其進行灌溉.某實驗基地為了研究海水濃度x(%)對畝產量y海水濃度x34567畝產量y0.570.530.440.360.30殘差e?0.010.02mn0繪制散點圖發現,可以用一元線性回歸模型擬合y與x的相關關系,用最小二乘法計算得y關于x的經驗回歸方程為y=?(1)求a,m,n的值;(2)計算決定系數R2(精確到0.01附:殘差ei=y其中∑5【答案】(1)【解】因為x=y=15×(0.57所以經驗回歸方程為y=?所以y3m=y4n=(2)∑5所以決定系數R2【點撥】用決定系數R2來刻畫擬合效果,R變式3.(1)【多選題】在實際應用中,用經驗回歸方程y=bx+a中的yA.隨機誤差e的方差σ2越小,用bx+aB.決定系數R2C.殘差平方和∑nD.對于n個成對樣本數據(x1,y1),(x2,y(2)【多選題】某種產品的廣告支出費用x(單位:萬元)與銷售量y(單位:萬件)之間的對應數據如下表所示.廣告支出費用x2.22.64.05.35.9銷售量y3.85.47.011.612.2根據表中的數據,可得經驗回歸方程y=2.27x+A.第三個樣本點對應的殘差eB.在該回歸模型對應的殘差圖中,殘差點比較均勻地分布在傾斜的帶狀區域中C.該模型擬合效果較好D.用該經驗回歸方程可以很準確地預測廣告費用為20萬元時的銷售量【答案】(1)BCD(2)AC【解析】(1)【解】隨機誤差e的方差σ?2越小,用bx+a預報真實值y的精度越高,故A錯誤.R2越接近1,一元線性回歸模型的擬合效果越好,故B正確.殘差平方和∑ni=1(yi?yi(2)【解】由題意,得x=2.2+2.6+4.0+5.3+5.95=4,y=3.8+5.4+7.0+11.6+12.25考點三獨立性檢驗例4[2023年全國甲卷]一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).試驗結果如下:對照組的小白鼠體重的增加量從小到大排序為15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.527.5 30.1 32.6 34.3 34.8 35.6 35.6 35.836.237.3 40.543.2試驗組的小白鼠體重的增加量從小到大排序為7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.018.8 19.2 19.8 20.2 21.6 22.8 23.6 23.925.128.2 32.336.5(1)計算試驗組的樣本平均數;(2)①求40只小白鼠體重的增加量的中位數m,再分別統計兩樣本中小于m與不小于m的數據的個數,完成如下列聯表;組別體重增加量<m≥m對照組試驗組②由①中的列聯表,根據小概率值α=附:χ2α0.1000.0500.010xa2.7063.8416.635【答案】(1)【解】試驗組樣本平均數為120(2)①依題意,可知這40只小白鼠體重的中位數是將兩組數據合在一起,從小到大排后第20位與第21位數據的平均數,所以m=組別體重增加量<m≥m對照組614試驗組146②零假設為H0:小白鼠在高濃度臭氧環境中與在正常環境中體重的增加量沒有差異.χ2=40×(6【點撥】①獨立性檢驗的一般步驟:第一步,假設兩個分類變量X與Y沒有關系;第二步,計算出χ2的值;第三步,把χ變式4.[2024年全國甲卷]某工廠進行生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間生產的產品中隨機抽取150件進行檢驗,數據如下:車間產品總計優級品合格品不合格品甲車間2624050

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論