




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
專題10統計
考情概覽
命題解讀考向考查統計
1.高考對統計的考查,重點是以下考點2022?新高考n卷,19(1)
(1)分層隨機抽樣頻率分布直方圖、頻數分布表2023?新高考n卷,19(1)
(2)統計圖表2024?新高考n卷,4
(3)會用統計圖表對總體進行估計,獨立性檢驗2022?新高考I卷,20(1)
會求n個數據的第p百分位數.
(4)能用數字特征估計總體集中趨勢
和總體離散程度.
(5)了解樣本相關系數的統計含義.數據的數字特征2023?新高考I卷,9
(6)理解一元線性回歸模型和2x2列
聯表,會運用這些方法解決簡單的實際
問題.
2024年真題研析
命題分析
2024年高考新高考I卷未考查統計相關內容,n卷中考查了頻數分布表中數據的數字特征的求法。統計
的考查應關注:相關性、頻率分布直方圖、樣本的數字特征、獨立性檢驗、回歸分析等。這些考驗的是學
生讀取數據、分析數據、處理數據的能力。預計2025年高考還是主要考查頻率分布直方圖和數據的數字特
征,可以多留意方差的計算方法!
試題精講
一、單選題
1.(2024新高考n卷—4)某農業研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的
畝產量(均在[900,1200)之間,單位:kg)并部分整理下表
畝產量[900,950)[950,1000)[1000,1050)[1100,1150)[1150,1200)
頻數612182410
據表中數據,結論中正確的是()
A.100塊稻田畝產量的中位數小于1050kg
B.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產量的極差介于200kg至300kg之間
D.100塊稻田畝產量的平均值介于900kg至1000kg之間
近年真題精選
一、多選題
1.(2023新高考I卷-9)有一組樣本數據看,無2,…,%,其中X1是最小值,%是最大值,則()
A.無2,%,%4,尤5的平均數等于西,龍2,「無6的平均數
B.々,當多,Z的中位數等于玉,々,…,乙的中位數
C.X2,X3,JC4,X5的標準差不小于再,馬,…,Z的標準差
D.尤2,工3戶4,匕的極差不大于占,工2,…,無6的極差
二、解答題
1.(2022新高考I卷20)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為
良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該
疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:
不夠良好良好
病例組4060
對照組1090
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?
附片=______〃(〃—姐之______,
(a+b)(c+d)(a+c)(Z?+d)
P(K2>k0.0500.0100.001
k3.8416.63510.828
2.(2022新高考n卷?19)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下
的樣本數據的頻率分布直方圖:
(1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);
3.(2023新高考n卷-19)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差
利用該指標制定一個檢測標準,需要確定臨界值C,將該指標大于C的人判定為陽性,小于或等于C的人判
定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為"(c);誤診率是將未患病者判定為陽
性的概率,記為式C).假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.
(1)當漏診率P(c)=0.5%時,求臨界值c和誤診率q(c);
必備知識速記
一、分層隨機抽樣
1、分層隨機抽樣的概念
一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總
體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為
分層隨機抽樣,每一個子總體稱為層.
2、分層隨機抽樣的平均數計算
在分層隨機抽樣中,以層數是2為例,如果第1層和第2層包含的個體數分別為拉和N,抽取的樣本量分
別為根和〃,第1層和第2層的樣本平均數分別為口y,樣本平均數位右,則
—―N_772—77————
3=------x+------V=——x+------y.我們可以采用樣本平均數①估計總體平均數W
M+NM+Nm+nm+n
二、樣本的數字特征
1、眾數、中位數、平均數
(1)眾數:一組數據中出現次數最多的數叫眾數,眾數反應一組數據的多數水平.
(2)中位數:將一組數據按大小順序依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均
數)叫做這組數據的中位數,中位數反應一組數據的中間水平.
(3)平均數:"個樣本數據占,…戶”的平均數為最=%%…,反應一組數據的平均水平,公式變
形:="X.
1=1
2、標準差和方差
(1)標準差:標準差是樣本數據到平均數的一種平均距離,一般用s表示.假設樣本數據是否,々,…,當,
2
表示這組數據的平均數,則標準差S=、匕(&<)2+每一井+…+(Xn-x)].
Vn
(2)方差:方差就是標準差的平方,即Y=」(X「X)2+(X2-X)2+-+(X“-X)2].顯然,在刻畫樣本數據
n
的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.
(3)數據特征
標準差、方差描述了一組數據圍繞平均數波動程度的大小.標準差、方差越大,則數據的離散程度越大;
標準差、方差越小,數據的離散程度越小.反之亦可由離散程度的大小推算標準差、方差的大小.
三、頻率分布直方圖
1、頻率、頻數、樣本容量的計算方法
頻率
①而X組距=頻率?
頻數頻數
②"+…裊=頻率,寸=樣本容量,樣本容量X頻率=頻數.
樣本容量頻率
③頻率分布直方圖中各個小方形的面積總和等于1.
2、頻率分布直方圖中數字特征的計算
(1)最高的小長方形底邊中點的橫坐標即是眾數.
(2)中位數左邊和右邊的小長方形的面積和是相等的.設中位數為x,利用x左(右)側矩形面積之和等
于0.5,即可求出x.
(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中
點的橫坐標之和,即有(=國口+國回+…+X”0”,其中當為每個小長方形底邊的中點,已為每個小長方形
的面積.
四、百分位數
1、定義
一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少
有(100-0%的數據大于或等于這個值.
2、計算一組〃個數據的的第2百分位數的步驟
(1)按從小到大排列原始數據.
(2)計算i=〃x〃%.
(3)若,不是整數而大于z?的比鄰整數則第p百分位數為第,項數據;若,是整數,則第p百分位數為
第i項與第i+1項數據的平均數.
3、四分位數
我們之前學過的中位數,相當于是第50百分位數.在實際應用中,除了中位數外,常用的分位數還有第25
百分位數,第75百分位數.這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.
五、變量間的相關關系
1、變量之間的相關關系
當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關系叫相關關系.由于相關
關系的不確定性,在尋找變量之間相關關系的過程中,統計發揮著非常重要的作用.我們可以通過收集大
量的數據,在對數據進行統計分析的基礎上,發現其中的規律,對它們的關系作出判斷.
注意:相關關系與函數關系是不同的,相關關系是一種非確定的關系,函數關系是一種確定的關系,而且
函數關系是一種因果關系,但相關關系不一定是因果關系,也可能是伴隨關系.
2、散點圖
將樣本中的n個數據點(士,%)(,=1,2,…,〃)描在平面直角坐標系中,所得圖形叫做散點圖.根據散點圖中點
的分布可以直觀地判斷兩個變量之間的關系.
(1)如果散點圖中的點散布在從左下角到右上角的區域內,對于兩個變量的這種相關關系,我們將它稱為
正相關,如圖(1)所示;
(2)如果散點圖中的點散布在從左上角到右下角的區域內,對于兩個變量的這種相關關系,我們將它稱為
負相關,如圖(2)所示.
⑴⑵
3、相關系數
若相應于變量x的取值玉,變量歹的觀測值為乂(14話〃),則變量x與歹的相關系數
“__〃___
Z(玉一X)(B-y)ZXiyi-nxy
r=下皂-----------------F==皂=F----------,通常用r來衡量x與y之間的線性關系的強弱,r
(匕-力(%_y)2、位X2,--nx2l^y\-ny
Vz=lz=lVi=lVi=l
的范圍為-1V"1.
(1)當r>0時,表示兩個變量正相關;當r<0時,表示兩個變量負相關.
(2)同越接近1,表示兩個變量的線性相關性越強;卜|越接近0,表示兩個變量間幾乎不存在線性相關關
系.當川=1時,所有數據點都在一條直線上.
(3)通常當上|>0.75時,認為兩個變量具有很強的線性相關關系.
六、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數關系的兩個變量之間的關系(相關關系)的方法.
對于一組具有線性相關關系的數據(xi,yj),(必,>2),…,y?),其回歸方程了=A+a的求法
為
〃__“__
E(%-x)(y,-y)Z〃孫
2=^---------------——=三-----—
£(x,-x)2^X,2-nx"
i=li=l
a=y-bx
_1n_1n__
其中,%=—y%,.,y=—,(%,了)稱為樣本點的中心.
n,=in,=1
2,殘差分析
對于預報變量y,通過觀測得到的數據稱為觀測值%,通過回歸方程得到的i稱為預測值,觀測值減去預
測值等于殘差,g稱為相應于點(8%)的殘差,即有。=%-%一殘差是隨機誤差的估計結果,通過對殘差
的分析可以判斷模型刻畫數據的效果以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分
析.
(1)殘差圖
通過殘差分析,殘差點(與自)比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適,其中這樣的帶
狀區域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和。=-%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;反
Z=1
之,不合適.
(3)相關指數
(?.-%)2
用相關指數來刻畫回歸的效果,其計算公式是:R2=l-V.
£(凹-歹)2
1=1
爐越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
七、非線性回歸
解答非線性擬合問題,要先根據散點圖選擇合適的函數類型,設出回歸方程,通過換元將陌生的非線性回
歸方程化歸轉化為我們熟悉的線性回歸方程.
求出樣本數據換元后的值,然后根據線性回歸方程的計算方法計算變換后的線性回歸方程系數,還原后即
可求出非線性回歸方程,再利用回歸方程進行預報預測,注意計算要細心,避免計算錯誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對象,明確哪個是解釋變量,哪個是預報變量;
(2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系(是否存在非線性關系);
(3)由經驗確定非線性回歸方程的類型(如我們觀察到數據呈非線性關系,一般選用反比例函數、二次函
數、指數函數、對數函數、塞函數模型等);
(4)通過換元,將非線性回歸方程模型轉化為線性回歸方程模型;
(5)按照公式計算線性回歸方程中的參數(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結果后分析殘差圖是否有異常.若存在異常,則檢查數據是否有誤,或模型是否合適等.
八、獨立性檢驗
1、分類變量和列聯表
(1)分類變量:
變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯表:
①定義:列出的兩個分類變量的頻數表稱為列聯表.
②2x2列聯表.
一般地,假設有兩個分類變量X和匕它們的取值分別為{%,%}和{必,%},其樣本頻數列聯表(稱為
2x2列聯表)為
必>2總計
再aba+b
%Cdc+d
總計a+cb+dn=a+b+c+d
從2x2列表中,依據,二與,的值可直觀得出結論:兩個變量是否有關系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示列聯
表數據的頻率特征.
(2)觀察等高條形圖發現4與,相差很大,就判斷兩個分類變量之間有關系.
a+bc+d
3、獨立性檢驗
計算隨機變量/=-----"(ad-bcf-------利用力2的取值推斷分類變量》和y是否獨立的方法稱為*獨
(Q+b)(c+d)(a+c)(b+d)
立性檢驗.
a0.100.050.0100.0050.001
Xa2.7063.8416.6357.87910.828
【統計常用結論】
均數、方差的性質:如果數據……,%的平均數為嚏,方差為$2,那么
①一組新數據x,+b,x2+b,……xn+b的平均數為x+b,方差是G.
②一組新數據辦],辦2'...的平均數為4X,方差是42s2.
③一組新數據%+b,ax2+b,...,axn+b的平均數為ax+b,方差是a2s2.
常見的非線性回歸模型
(1)指數函數型歹=0優(Q>0且QWl,C>0)
兩邊取自然對數,lny=ln(ca"),即Iny=Inc+xlna,
令1"',原方程變為j/=lnc+x」nQ,然后按線性回歸模型求出Ina,Inc.
(2)對數函數型y=blnx+Q
令,原方程變為y'=6/+a,然后按線性回歸模型求出b,a.
x=lnx
(3)幕函數型歹="'
兩邊取常用對數,lgy=lg(ax〃),即Igy=〃lgx+lgq,
令,原方程變為了=謁+Iga,然后按線性回歸模型求出”,Iga.
[x=lgx、
(4)二次函數型y=6x2+。
令,原方程變為了=及'+。,然后按線性回歸模型求出6,a.
[x=x
(5)反比例函數型y=a+2型
X
yf=y
令,1,原方程變為V=b£+。,然后按線性回歸模型求出6,
X=—
、X
名校模擬探源
一、單選題
1.(2024?河南?三模)已知某學校高三年級甲、乙、丙三個班級人數分別為40,30,50,學校計劃采用按
比例分配的分層隨機抽樣的方法在三個班級中評選優秀學生,已知乙班分配到的優秀學生名單為6人,則
高三年級三個班優秀學生總人數為()
A.16B.30C.24D.18
2.(2024?山東?二模)某校高三共有200人參加體育測試,根據規則,82分以上的考生成績等級為A,則
3.(2024?浙江紹興?三模)有一組樣本數據:2,3,3,3,4,4,5,5,6,6.則關于該組數據的下列數
字特征中,數值最大的為()
A.第75百分位數B.平均數C.極差D.眾數
4.(2024?山西?三模)某次趣味運動會,設置了教師足球射門比賽:教師射門,學生守門.已知參與射門比賽
的教師有60名,進球數的平均值和方差分別是3和13,其中男教師進球數的平均值和方差分別是4和8,
女教師進球數的平均值為2,則女教師進球數的方差為()
A.15B.16C.17D.18
5.(2024?四川涼山?三模)樣本數據西,々,…,x”的平均數元=4,方差s?=l,則樣本數據2%+1,2x2+l,
…,2x“+l的平均數,方差分別為()
A.9,4B.9,2C.4,1D.2,1
6.2024?四川成都?三模)“數九”從每年冬至”當天開始計算,每九天為一個單位,冬至后的第81天,“數
九”結束,天氣就變得溫暖起來.如圖,以溫江國家基準氣候站為代表記錄了2023—2024年從“一九”
至IJ“九九”成都市的“平均氣溫”和“多年平均氣溫”(單位:℃),下列說法正確的是()
數九寒天氣溫對比
^平均氣溫匚二1多年平均氣溫單位:℃
一九二九三九四九五九六九七九八九九九
A.“四九”以后成都市“平均氣溫”一直上升
B.“四九”成都市“平均氣溫”較“多年平均氣溫”低0.1”℃
C.“一九”到“五九”成都市“平均氣溫”的方差小于“多年平均氣溫”的方差
D.“一九”到“九九”成都市“平均氣溫”的極差小于“多年平均氣溫”的極差
7.(2024?陜西?三模)2024年1月九省聯考的數學試卷出現新結構,其中多選題計分標準如下:①本題共
3小題,每小題6分,滿分18分;②每道小題的四個選項中有兩個或三個正確選項,全部選對得6分,有
選錯的得。分;③部分選對得部分分(若某小題正確選項為兩個,漏選一個正確選項得3分;若某小題正
確選項為三個,漏選一個正確選項得4分,漏選兩個正確選項得2分).已知在某次新結構數學試題的考
試中,小明同學三個多選題中第一小題確定得滿分,第二小題隨機地選了兩個選項,第三小題隨機地選了
一個選項,則小明同學多選題所有可能總得分(相同總分只記錄一次)的中位數為()
A.9B.10C.11D.12
8.(2024?浙江?三模)在對某校高三學生體質健康狀況某個項目的調查中,采用樣本量比例分配的分層隨
機抽樣,如果不知道樣本數據,只知道抽取了男生80人,女生120人,其方差分別為15,10,由此估計樣
本的方差不可能為()
A.11B.13C.15D.17
9.(2024?安徽安慶?三模)已知一組數據%,Z,的平均數為"另一組數據M,的平均數為
歹⑸R刃.若數據再,Z,…,%必匕的平均數為牙=加+(1-。)》,其中g<a<l,則加,"的大小關系
為()
A.m<nB.m>nC.m=nD.犯〃的大小關系不確定
10.(2024?陜西榆林?三模)在一次數學模考中,從甲、乙兩個班各自抽出10個人的成績,甲班的十個人成
績分別為石、々、…、石。,乙班的十個人成績分別為必,%,…,必。.假設這兩組數據中位數相同、方差也相同,則把
這20個數據合并后()
A.中位數一定不變,方差可能變大
B.中位數可能改變,方差可能變大
C.中位數一定不變,方差可能變小
D.中位數可能改變,方差可能變小
二、多選題
11.(2024?全國?三模)在某次數學測試中,甲、乙兩個班的成績情況如下表:
班級人數平均分方差
甲45881
乙45902
記這兩個班的數學成績的總平均分為,總方差為則()
A.x=88B.x=89C.?=8.6D.$2=2.5
12.(2024?廣東廣州?三模)在某次學科期末檢測后,從全部考生中選取100名考生的成績(百分制,均為
整數)分成[50,60),[60,70),[70,80),[80,90),[90,100)五組后,得到如下圖的頻率分布直方圖,則
B.低于70分的考生人數約為40人
C.考生成績的平均分約為73分D.估計考生成績第80百分位數為83分
13.(2024?河北?三模)根據中國報告大廳對2023年3月?10月全國太陽能發電量進行監測統計,太陽能
發電量(單位:億千瓦時)月度數據統計如下表:
月份3456
發電量/億千瓦時242.94230.87240.59259.33
月份78910
發電量/億千瓦時258.9269.19246.06244.31
關于2023年3月?10月全國太陽能發電量,下列四種說法正確的是()
A.中位數是259.115B.極差是38.32
C.第85百分位數是259.33D.第25百分位數是240.59
14.(2024?廣東汕頭?三模)下圖是樣本甲與樣本乙的頻率分布直方圖,下列說法判斷正確的是()
A.樣本乙的極差一定大于樣本甲的極差
B.樣本乙的眾數一定大于樣本甲的眾數
C.樣本乙的方差一定小于樣本甲的方差
D.樣本甲的中位數一定小于樣本乙的中位數
15.(2024?黑龍江?三模)在某市初三年級舉行的一次體育考試中(滿分100分),所有考生成績均在[50,100]
內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,甲、乙兩班考生的成績占比如圖所示,則
下列說法錯誤的是()
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
[50,60)[60,70)[70,80)[80,90)[90,100]
甲班成績占比乙班成績占比
A.成績在[70,80)的考生中,甲班人數多于乙班人數
B.甲班成績在[80,90)內人數最多
C.乙班成績在[70,80)內人數最多
D.甲班成績的極差比乙班成績的極差小
三、解答題
16.(2024?青海海南?二模)某青少年跳水隊共有100人,在強化訓練前、后,教練組對他們進行了成績測
試,分別得到如圖1所示的強化訓練前的頻率分布直方圖,如圖2所示的強化訓練后的頻率分布直方圖.
頻率頻率
圖2
(1)根據表中數據,估計強化訓練后的平均成績(同一組中的數據用該組區間的中點值作代表).
⑵我們規定得分80分以上(含80分)的為“優秀”,低于80分的為“非優秀”.
優秀人數非優秀人數合計
強化訓練前
強化訓練后
合計
將上面的表格補充完整,并回答能否有99.5%的把握認為跳水運動員是否優秀與強化訓練有關.
?n(ad-be)2,,
Bff:K2=---------------------------------,n=a+b+c+d.
(a+6)(c+d)(a+c)(6+d)
2
p(K>k0)0.050.0100.0050.001
3.8416.6357.87910.828
17.(2024?陜西?模擬預測)某公司新研發了一款智能燈,此燈有拍照搜題功能,學生遇到疑難問題,通過
拍照搜題后,會在顯示屏上顯示該題的解答過程以及該題考查的知識點與相應的解題方法該產品投入市場
三個月后,公司對部分用戶做了調研:抽取了200位使用者,每人填寫一份評分表(滿分為100分),現
從200份評分表中,隨機抽取40份(其中男、女使用者的評分表各20份)
作為樣本,經統計得到如下的數據:
女生使用者評分:67,71,72,75,80,83,83,83,84,84,85,86,88,90,90,91,92,92,92,
92
男生使用者評分:67,68,69,69,70,72,72,73,74,75,76,76,77,78,79,82,84,84,89,
92
記該樣本的中位數為“,按評分情況將使用.都對該智能燈的態度分為兩種類型:評分不小于”的稱為"滿
意型”,其余的都稱為“不滿意型”.
⑴求”的值,填寫如下2x2列聯表
女生評分男生評分合計
“滿意型”人數
“不滿意型”人數
合計
(2)能否有99%的把握認為滿意與性別有關?
參考公式與數據:K2=(a+?(,d)(a/c)伍+d)
P(K2>Q0.10.050.0250.01
2.7063.8415.0246.635
18.(2024?河南鄭州?三模)按照《中華人民共和國環境保護法》的規定,每年生態環境部都會會同國家發
展改革委等部門共同編制《中國生態環境狀況公報》,并向社會公開發布.下表是2017-2021年五年《中國
生態環境狀況公報》中酸雨區面積約占國土面積的百分比(%%):
年份2017年2018年2019年2020年2021年
年份代碼七12345
X-6.45.55.04.83.8
(1)求2017—2021年年份代碼若與%的樣本相關系數(精確到0.01);
(2)請用樣本相關系數說明該組數據中V與x之間的關系可用一元線性回歸模型進行描述,并求出了關于x的
經驗回歸方程;
(3)預測2024年的酸雨區面積占國土面積的百分比.
(回歸直線的斜率和截距的最小二乘法估計公式分別為:
,可包-刃/55
2
b=-^-i---------------,a=y-bx,\工毛乂=70.6,^^=133.69
Z=1
J^7364?
附:樣本相關系數,r=
方(%-元)藝(乂一刃2
z=li=\
19.(2024?陜西渭南?三模)某市為提高市民對文明城市創建的認識,舉辦了“創建文明城市”知識競賽,從
所有答卷中隨機抽取100份作為樣本,將100個樣本數據按[30,40),[40,50),[50,60),[60,70),
[70,80),[80,90]分成6組,并整理得到如下頻率分布直方圖.
(1)請通過頻率分布直方圖估計這100份樣本數據的平均值(同一組中的數據用該組區間的中點值作代表)
和中位數;
(2)該市決定表彰知識競賽成績排名前30%的市民,某市民知識競賽的成績是78,請估計該市民能否得到表
彰.
20.(2024?江西九江?三模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪胎胎面磨損.某實驗室
通過實驗測得轎車行駛里程與某品牌輪胎凹槽深度的數據,如下表所示:
行駛里程X/萬km0.00.41.01.62.42.83.44.4
輪胎凹槽深度〃/mm8.07.87.26.25.64.84.44.0
其也=79.68,£(尤,-可2=16.24岳(%-寸應%-盯”1656
z=lz=lVz=lVi=l
(1)求該品牌輪胎凹槽深度〃與行駛里程X的相關系數/,并判斷二者之間是否具有很強的線性相關性;(結
果保留兩位有效數字)
(2)根據我國國家標準規定:轎車輪胎凹槽安全深度為1.6mm(當凹槽深度低于1.6mm時剎車距離增大,駕
駛風險增加,必須更換新輪胎).某人在保養汽車時將小轎車的輪胎全部更換成了該品牌的新輪胎,請問在
正常行駛情況下,更換新輪胎后繼續行駛約多少公里需對輪胎再次更換?
附:變量X與歹的樣本相關系數廠=/回〃-/-可--;臥對于一H組數據(七,必),(X2,%)’........................................................,
(%,%),其線性回歸方程夕的斜率和截距的最小二乘估計分別為:
八-于)(%-刃.
g二旦。-----------,a^y-bx
t(巧-亍『
Z=1
21.(2024?內蒙古?三模)現統計了甲12次投籃訓練的投籃次數和乙8次投籃訓練的投籃次數,得到如下
數據:
甲777377818581778593737781
乙7181737371738573
已知甲12次投籃次數的平均數80,乙8次投籃次數的平均數京=75.
(1)求這20次投籃次數的中位數加,估計甲每次訓練投籃次數超過機的概率;
(2)求這20次投籃次數的平均數嚏與方差$2.
22.(2024?甘肅張掖?模擬預測)近年來,馬拉松比賽受到廣大體育愛好者的喜愛.某地體育局在五一長假期
間舉辦比賽,志愿者的服務工作是成功舉辦的重要保障.現抽取了200名候選者的面試成績,并分成六組:
第一組[40,50),第二組[50,60),第三組[60,70),第四組[70,80),第五組[80,90),第六組[90,100),繪制
成如圖所示的頻率分布直方圖.
男生女生合計
被錄取20
未被錄取
合計
⑴求加;
(2)估計候選者面試成績的平均數(同一組中的數據用該組區間的中點值為代表);
(3)在抽出的200名候選者的面試成績中,若規定分數不低于80分的候選者為被錄取的志愿者,已知這200
名候選者中男生與女生人數相同,男生中有20人被錄取,請補充2x2列聯表,并判斷是否有99%的把握認
為“候選者是否被錄取與性別有關”.
“2______"(ad-6cA_______,
附:K-:~r~,\,~7\,其中〃=a+6+c+d.
(a+6)(c+d)(a+c)(b+d)
2
p(K>k0)0.050.0100.0050.001
k03.8416.6357.87910.828
專題10統計
考情概覽
命題解讀考向考查統計
1.高考對統計的考查,重點是以下考點2022?新高考n卷,19(1)
(1)分層隨機抽樣頻率分布直方圖、頻數分布表2023?新高考n卷,19(1)
(2)統計圖表2024?新高考n卷,4
(3)會用統計圖表對總體進行估計,獨立性檢驗2022?新高考I卷,20(1)
會求n個數據的第p百分位數.
(4)能用數字特征估計總體集中趨勢
和總體離散程度.
(5)了解樣本相關系數的統計含義.數據的數字特征2023?新高考I卷,9
(6)理解一元線性回歸模型和2x2列
聯表,會運用這些方法解決簡單的實際
問題.
2024年真題研析
命題分析
2024年高考新高考I卷未考查統計相關內容,n卷中考查了頻數分布表中數據的數字特征的求法。統計
的考查應關注:相關性、頻率分布直方圖、樣本的數字特征、獨立性檢驗、回歸分析等。這些考驗的是學
生讀取數據、分析數據、處理數據的能力。預計2025年高考還是主要考查頻率分布直方圖和數據的數字特
征,可以多留意方差的計算方法!
試題精講
一、單選題
1.(2024新高考n卷—4)某農業研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的
畝產量(均在[900,1200)之間,單位:kg)并部分整理下表
畝產量[900,950)[950,1000)[1000,1050)[1100,1150)[1150,1200)
頻數612182410
據表中數據,結論中正確的是()
A.100塊稻田畝產量的中位數小于1050kg
B.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產量的極差介于200kg至300kg之間
D.100塊稻田畝產量的平均值介于900kg至1000kg之間
【答案】C
【分析】計算出前三段頻數即可判斷A;計算出低于1100kg的頻數,再計算比例即可判斷B;根據極差計
算方法即可判斷C;根據平均值計算公式即可判斷D.
【詳解】對于A,根據頻數分布表可知,6+12+18=36<50,
所以畝產量的中位數不小于1050kg,故A錯誤;
對于B,畝產量不低于1100kg的頻數為24+10=34,
所以低于1100kg的稻田占比1為00-3愣466%,故B錯誤;
對于C,稻田畝產量的極差最大為1200-900=300,最小為1150-950=200,故C正確;
對于D,由頻數分布表可得,畝產量在[1050,1100)的頻數為100-(6+12+18+24+10)=30,
所以平均值為焉x(6x925+12x975+18x1025+30x1075+24x1125+10x1175)=1067,故D錯誤.
故選;C.
近年真題精選
一、多選題
1.(2023新高考I卷勺)有一組樣本數據再廣2,…其中占是最小值,%是最大值,則()
A.x2,x3,x4,x5的平均數等于%,Z,…多的平均數
B.工2,無3,七,%的中位數等于尤1,工2,…,%的中位數
C.x2,x3,x4,x5的標準差不小于再,馬,…區的標準差
D.工2,9,匕,匕的極差不大于國也,…,迎的極差
【答案】BD
【分析】根據題意結合平均數、中位數、標準差以及極差的概念逐項分析判斷.
【詳解】對于選項A:設工2用,無4,%的平均數為加,無,1%,…,%的平均數為",
貝0龍]+X?++X4++%6*2+X3+X4+尤52(X[+工6)一+X2++)
〃一"’―64-12
因為沒有確定2(%+乙),x5+x2+x3+X4的大小關系,所以無法判斷孫力的大小,
例如:1,2,3,4,5,6,可得加=〃=3.5;
例如1,1,1,1,1,7,可得冽=1,〃=2;
例如1,2,2,2,2,2,可得加=2,〃=?;故A錯誤;
對于選項B:不妨設再<x2<x3<x4<x5<x6,
可知為2戶3,期,%的中位數等于國,…,X6的中位數均為玉產,故B正確;
對于選項C:因為X1是最小值,苫6是最大值,
則工2,W,匕,毛的波動性不大于玉,3,…,Z的波動性,即X2,x3,x4,x5的標準差不大于國,3,…,X6的標準差,
例如:2,4,6,8,10,12,貝!I平均數”=^(2+4+6+8+10+12)=7,
6
標準差S|=^1[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=,
4,6,8,10,貝1|平均數機=;(4+6+8+10)=7,
標準差S2二^1[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=,
顯然?1>右,即電>S2;故C錯誤;
3
對于選項D:不妨設玉Ax24%WXs4%,
則%-占2%-馬,當且僅當國=Z65=%時,等號成立,故D正確;
故選:BD.
二、解答題
1.(2022新高考I卷20)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為
良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該
疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:
不夠良好良好
病例組4060
對照組1090
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?
n(ad-bcf
附片=
(a+b)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
【答案】⑴答案見解析
【分析】(1)由所給數據結合公式求出K2的值,將其與臨界值比較大小,由此確定是否有99%的把握認為
患該疾病群體與未患該疾病群體的衛生習慣有差異;(2)⑴根據定義結合條件概率公式即可完成證明;(ii)
根據(i)結合已知數據求心
n(ad-be)2200(40x90-60x10)^_
【詳解】(1)由已知小24
(a+b)(c+d)(a+c)(b+d)50x150x100x100'
XP(A:2>6.635)=0.01,24>6,635,
所以有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異.
2.(2022新高考II卷?19)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下
的樣本數據的頻率分布直方圖:
(1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);
【答案】⑴47.9歲;
【分析】(1)根據平均值等于各矩形的面積乘以對應區間的中點值的和即可求出;
【詳解】(1)平均年齡元=(5X0.001+15X0.002+25X0.012+35X0Q17+45X(1023
+55x0.020+65x0.017+75x0.006+85x0.002)x10=47.9(歲).
3.(2023新高考n卷?19)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差
異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:
利用該指標制定一個檢測標準,需要確定臨界值C,將該指標大于C的人判定為陽性,小于或等于C的人判
定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為"(c);誤診率是將未患病者判定為陽
性的概率,記為4(c).假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.
(1)當漏診率p(c)=0.5%時,求臨界值c和誤診率
【答案】(l)c=97.5,#)=3.5%;
【分析】(1)根據題意由第一個圖可先求出c,再根據第二個圖求出c297.5的矩形面積即可解出;
【詳解】(1)依題可知,左邊圖形第一個小矩形的面積為5x0.002>0.5%,所以95<c<100,
所以(c-95)x0.002=0.5%,解得:c=97.5,
q(c)=0.01x(100-97.5)+5x0,002=0.035=3.5%.
必備知識速記
一、分層隨機抽樣
1、分層隨機抽樣的概念
一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總
體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為
分層隨機抽樣,每一個子總體稱為層.
2、分層隨機抽樣的平均數計算
在分層隨機抽樣中,以層數是2為例,如果第1層和第2層包含的個體數分別為M和N,抽取的樣本量分
別為機和〃,第1層和第2層的樣本平均數分別為口y,樣本平均數位右,則
—_N—YYI—H———
@=------X+-------v=-----X+-----工我們可以采用樣本平均數Q估計總體平均數少
M+NM+Nm+nm+n
二、樣本的數字特征
1、眾數、中位數、平均數
(1)眾數:一組數據中出現次數最多的數叫眾數,眾數反應一組數據的多數水平.
(2)中位數:將一組數據按大小順序依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均
數)叫做這組數據的中位數,中位數反應一組數據的中間水平.
(3)平均數:"個樣本數據占x”的平均數為1%%…^,反應一組數據的平均水平,公式變
n
形:="X.
i=l
2、標準差和方差
(1)標準差:標準差是樣本數據到平均數的一種平均距離,一般用S表示.假設樣本數據是4%,…,當,嚏
表示這組數據的平均數,則標準差5=、,(再4)2+&F+…+(%-初.
Vn
1___
(2)方差:方差就是標準差的平方,即s2=—[(X]-x)2+(%-x)2+-+(x,-x)2].顯然,在刻畫樣本數據
n
的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.
(3)數據特征
標準差、方差描述了一組數據圍繞平均數波動程度的大小.標準差、方差越大,則數據的離散程度越大;
標準差、方差越小,數據的離散程度越小.反之亦可由離散程度的大小推算標準差、方差的大小.
三、頻率分布直方圖
1、頻率、頻數、樣本容量的計算方法
②母+…裊=頻率,而葺=樣本容量,樣本容量X頻率=頻數.
樣本容量頻率
③頻率分布直方圖中各個小方形的面積總和等于1.
2、頻率分布直方圖中數字特征的計算
(1)最高的小長方形底邊中點的橫坐標即是眾數.
(2)中位數左邊和右邊的小長方形的面積和是相等的.設中位數為x,利用x左(右)側矩形面積之和等
于0.5,即可求出x.
(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中
點的橫坐標之和,即有(=再月+%月+…+XM“,其中斗為每個小長方形底邊的中點,%為每個小長方形
的面積.
四、百分位數
1、定義
一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少
有(100-0%的數據大于或等于這個值.
2、計算一組〃個數據的的第?百分位數的步驟
(1)按從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025開學第一課專題觀后感
- 彭水2025年上半年公招擬錄用公務員人民警察公示
- 肩關節鏡圍手術期護理
- 小班健康:小嘴巴咬人行為解析與引導
- 電飯鍋產品培訓
- 有限空間作業安全管理
- 胸外科術后并發疼痛護理
- 學生營養健康日
- 劉天鵬健康講座
- 小班健康活動《心情娃娃》教案設計
- 打架傷人和解協議書范本
- 2025至2030全球及中國浮式液化天然氣行業產業運行態勢及投資規劃深度研究報告
- 2025年湖北省中考生物、地理合卷試卷真題(含答案)
- 藥品陳列養護管理制度
- 智慧校園建設“十五五”發展規劃
- 招商人員筆試題目及答案
- 2025至2030年中國智能炒菜機(炒菜機器人)行業市場現狀調查及前景戰略研判報告
- 路面銑刨工入場安全教育試卷(含答案)
- 物理●湖北卷丨2024年湖北省普通高中學業水平選擇性考試物理試卷及答案
- 2024大華網絡攝像機使用說明書全集
- T/CNFAGS 15-2024綠色合成氨分級標準(試行)
評論
0/150
提交評論