2025年新高考數(shù)學(xué)復(fù)習(xí)突破講義:統(tǒng)計(jì)案例和回歸方程(含解析)_第1頁(yè)
2025年新高考數(shù)學(xué)復(fù)習(xí)突破講義:統(tǒng)計(jì)案例和回歸方程(含解析)_第2頁(yè)
2025年新高考數(shù)學(xué)復(fù)習(xí)突破講義:統(tǒng)計(jì)案例和回歸方程(含解析)_第3頁(yè)
2025年新高考數(shù)學(xué)復(fù)習(xí)突破講義:統(tǒng)計(jì)案例和回歸方程(含解析)_第4頁(yè)
2025年新高考數(shù)學(xué)復(fù)習(xí)突破講義:統(tǒng)計(jì)案例和回歸方程(含解析)_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

專題28統(tǒng)計(jì)案例和回歸方程

【考點(diǎn)預(yù)測(cè)】

知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過(guò)程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過(guò)收

集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點(diǎn)圖

將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(x,,%)(,=1,2,…,?)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖

中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.

(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它

稱為正相關(guān),如圖(1)所示;

(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它

稱為負(fù)相關(guān),如圖(2)所示.

(1)(2)

3、相關(guān)系數(shù)

若相應(yīng)于變量l的取值玉,變量丁的觀測(cè)值為%(IV〃),則變量x與〉的相關(guān)系數(shù)

〃__n_

E(%-x)(%-y)2-nxy

r=IJ,I丁,通常用廠來(lái)衡量x與夕之間的線性關(guān)系的強(qiáng)弱,r

的范圍為-1VrVI.

(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).

(2)N越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);卜|越接近0,表示兩個(gè)變量間幾乎不存在線性相

關(guān)關(guān)系.當(dāng)網(wǎng)=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.

(3)通常當(dāng)上|>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.

知識(shí)點(diǎn)二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(XI,力),(X2,/),…,(X",%),其回歸方程i=+Z的求法為

n__n___

八E(西--y)ExJ-nxy

b=—----------------=號(hào)---------

t(七一^^x^-nx2

Z=1Z=1

a=y-bx

_i?_i?__

其中,x=-tXi,y=-tJyi,(X,y)稱為樣本點(diǎn)的中心.

,i

n=ni=i

2、殘差分析

對(duì)于預(yù)報(bào)變量y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值%,通過(guò)回歸方程得到的S稱為預(yù)測(cè)值,觀測(cè)值減

去預(yù)測(cè)值等于殘差,自稱為相應(yīng)于點(diǎn)(4X)的殘差,即有?=殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)

殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差

分析.

(1)殘差圖

通過(guò)殘差分析,殘差點(diǎn)(%?)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,其中這

樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精確度越高;反之,不合適.

(2)通過(guò)殘差平方和。=『分析,如果殘差平方和越小,則說(shuō)明選用的模型的擬合效果越好;

;=1

反之,不合適.

(3)相關(guān)指數(shù)

£(%-%)2

用相關(guān)指數(shù)來(lái)刻畫回歸的效果,其計(jì)算公式是:心=1-4~—?

Z(z-y)2

Z=1

發(fā)越接近于1,說(shuō)明殘差的平方和越小,也表示回歸的效果越好.

知識(shí)點(diǎn)三、獨(dú)立性檢驗(yàn)

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.

②2x2列聯(lián)表.

一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{xl,x2}和{jl,y2),其樣本頻數(shù)列聯(lián)表(稱

為2x2列聯(lián)表)為

%總計(jì)

aba+b

Cdc+d

總計(jì)a+cb+da+b+c+d

從2x2列表中,依據(jù)二與二的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示

列聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn),與'相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.

a+bc+d

3、獨(dú)立性檢驗(yàn)

(1)定義:利用獨(dú)立性假設(shè)、隨.機(jī)變量犬2來(lái)確定是否有一定把握認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法

稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).

(2)公式:K2=-----"竺二巴--------,其中力=°+b+c+d為樣本容量.

(a+b)(c+d)(a+c)(b+d)

(3)獨(dú)立性檢驗(yàn)的具體步驟如下:

①計(jì)算隨機(jī)變量K?的觀測(cè)值左,查下表確定臨界值勺:

2

P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001

ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果42虧,就推斷“x與y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過(guò)"K?2幻);否則,就認(rèn)為在犯

錯(cuò)誤的概率不超過(guò)p(K2N/)的前提下不能推斷“X與y有關(guān)系”.

(2)兩個(gè)分類變量x和y是否有關(guān)系的判斷標(biāo)準(zhǔn):

統(tǒng)計(jì)學(xué)研究表明:

當(dāng)片43.841時(shí),認(rèn)為X與y無(wú)關(guān);

當(dāng)片>3.841時(shí),有95%的把握說(shuō)X與y有關(guān);

當(dāng)片>6.635時(shí),有99%的把握說(shuō)X與丫有關(guān);

當(dāng)片>10.828時(shí),有99.9%的把握說(shuō)X與Y有關(guān).

【典型例題】

例1.(山東省棗莊市2024屆高三學(xué)期3月模擬考試數(shù)學(xué)試題)某兒童醫(yī)院用甲、乙兩種療法治療小兒消化

不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到兩種療法治療數(shù)據(jù)的列聯(lián)表:

療效

療法合計(jì)

未治愈治愈

甲155267

乙66369

合計(jì)21115136

經(jīng)計(jì)算得到力2x4.881,根據(jù)八概率值a=0.005的獨(dú)立性檢驗(yàn)(已知/獨(dú)立性檢驗(yàn)中無(wú)。儂=7.879),則可

以認(rèn)為()

A.兩種療法的效果存在差異

B.兩種療法的效果存在差異,這種判斷犯錯(cuò)誤的概率不超過(guò)0.005

C.兩種療法的效果沒有差異

D.兩種療法的效果沒有差異,這種判斷犯錯(cuò)誤的概率不超過(guò)①005

【答案】C

【解析】零假設(shè)為X。:療法與療效獨(dú)立,即兩種療法效果沒有差異.

2

根據(jù)列聯(lián)表中的數(shù)據(jù),Z-4.881<7,879=%,005,根據(jù)小概率值a=0.005的獨(dú)立性檢驗(yàn),

沒有充分證據(jù)推斷以。不成立,

因此可以認(rèn)為“°成立,

即認(rèn)為兩種療法效果沒有差異.

故選:C.

例2.(四川省成都市2024屆高三學(xué)期第二次診斷性檢測(cè)文科數(shù)學(xué)試題)對(duì)變量x,y有觀測(cè)數(shù)據(jù)(%,%乂ieN*),

得散點(diǎn)圖1;對(duì)變量",v有觀測(cè)數(shù)據(jù)(%,vJ(ieN*),得散點(diǎn)圖2/表示變量xj之間的線性相關(guān)系數(shù),馬表

示變量w#之間的線性相關(guān)系數(shù),則下列說(shuō)法正確的是()

A.變量x與〉呈現(xiàn)正相關(guān),且聞<聞B.變量x與〉呈現(xiàn)負(fù)相關(guān),且間>|目

C.變量x與了呈現(xiàn)正相關(guān),且間>聞D.變量x與了呈現(xiàn)負(fù)相關(guān),且同<問(wèn)

【答案】C

【解析】由題意可知,變量的散點(diǎn)圖中,了隨X的增大而增大,所以變量X與了呈現(xiàn)正相關(guān);

再分別觀察兩個(gè)散點(diǎn)圖,圖1比圖2點(diǎn)更加集中,相關(guān)性更好,所以線性相關(guān)系數(shù)間>目.

故選:C.

例3.(FHsxl225yli36)如圖,去掉點(diǎn)。(3,10)后,下列說(shuō)法錯(cuò)誤的是()

"y.£(10,12)

?0(3,10)

?C(4,5)

?B(2,4)

"(1,3)

-0x

A.相關(guān)系數(shù)廠變大

B.殘差平方和變大

C.決定系數(shù)R2變大

D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)

【答案】B

【解析】去掉。(3,10)后,其他數(shù)據(jù)都在一條直線附近,變量x與變量夕的相關(guān)性變強(qiáng),模型擬合效果變

好,故殘差平方和變小.

例4.(湖南省2024年普通高等學(xué)校招生全國(guó)統(tǒng)一考試考前演練二數(shù)學(xué)試題)某騎行愛好者在專業(yè)人士指導(dǎo)

下對(duì)近段時(shí)間騎行鍛煉情況進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)每次騎行期間的身體綜合指標(biāo)評(píng)分x與騎行用時(shí)V(單位:

小時(shí))如下表:

身體綜合指標(biāo)評(píng)分(X)12345

用時(shí)(了/小時(shí))9.58.87.876.1

由上表數(shù)據(jù)得到的正確結(jié)論是()

555

參考數(shù)據(jù):一可、10,'(%一刃、7.06,£億一可同一刃=-8.4,V70^X8.402.

1=1J=1Z=1

-初入-7)

參考公式:相關(guān)系數(shù):=IL.

也(%一)*(%-刃2

VZ=1Z=1

A.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)y正相關(guān)

B.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)了的相關(guān)程度較弱

C.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)了的相關(guān)程度較強(qiáng)

D.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)了的關(guān)系不適合用線性回歸模型擬合

【答案】C

5

'(%-可(K-7)

-8.4

【解析】因?yàn)橄嚓P(guān)系數(shù),=i=l

557V10x7.06

Z=1Z=1

即相關(guān)系數(shù)近似為-1/與X負(fù)相關(guān),且相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合了與X的關(guān)系.

所以選項(xiàng)ABD錯(cuò)誤,C正確.

故選:C.

例5.(四川省成都市第七中學(xué)2024屆高三學(xué)期期末數(shù)學(xué)試題)在某病毒疫苗的研發(fā)過(guò)程中,需要利用基因

編輯小鼠進(jìn)行動(dòng)物實(shí)驗(yàn).現(xiàn)隨機(jī)抽取100只基因編輯小鼠對(duì)該病毒疫苗進(jìn)行實(shí)驗(yàn),得到如下2x2列聯(lián)表(部

分?jǐn)?shù)據(jù)缺失):

被某病毒感染未被某病毒感染合計(jì)

注射疫苗1050

未注射疫苗3050

合計(jì)30100

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

計(jì)算可知,根據(jù)小概率值々=的獨(dú)立性檢驗(yàn),分析“給基因編輯小鼠注射該種疫苗能起到預(yù)防該病毒

感染的效果”()

n(ad-bc)~,,

附:Z2-----------------,n=a+b+c+a.

(a+b)(c+d)(a+c)(b+d)

A.0.001B.0.05C.0.01D.0.005

【答案】B

【解析】完善2x2列聯(lián)表如下:

被某病毒感染未被某病毒感染合計(jì)

注射疫苗104050

未注射疫苗203050

合計(jì)3070100

假設(shè):“給基因編輯小鼠注射該疫苗不能起到預(yù)防該病毒感染的效果”.

100(10x30-20x40)2

因?yàn)椋毫??4.762,而3.841<4.762<6.635,

30x70x50x50

所以根據(jù)小概率值a=0.05的獨(dú)立性檢驗(yàn),推斷久不成立.

即認(rèn)為“給基因編輯小鼠注射該疫苗能起到預(yù)防該病毒感染的效果”.

故選:B

例6.(云南省曲靖市2024屆高三學(xué)期第一次質(zhì)量監(jiān)測(cè)數(shù)學(xué)試題)已知變量V關(guān)于x的回歸方程為3=/“。-6,

若對(duì)3=a一°6兩邊取自然對(duì)數(shù),可以發(fā)現(xiàn)inj與無(wú)線性相關(guān).現(xiàn)有一組數(shù)據(jù)如下表所示:

X12345

yee3e4e6e7

貝U當(dāng)x=6時(shí),預(yù)測(cè)了的值為()

A.9B.8C.e9D.e8

【答案】C

【解析】令〃=lny,由了=可得〃=足了=3x—0.6,如下表所不:

X12345

yee3e4e6e7

u13467

1+2+3+4+5c-1+3+4+6+7

由表格中的數(shù)據(jù)可得已=------------------=3,u=-------------------=44.2,

55

貝!I有步-0.6=4.2,解得務(wù)=1,6,故「=屋6工46,

當(dāng)x=6時(shí),y=e1,^6-0,6=e9.

故選:C.

例7.(山東省濱州市2024屆高三學(xué)期期末數(shù)學(xué)試題)某學(xué)校一同學(xué)研究溫差x(單位:。C)與本校當(dāng)天新

增感冒人數(shù)了(單位:人)的關(guān)系,該同學(xué)記錄了5天的數(shù)據(jù):

X568912

y1620252836

由上表中數(shù)據(jù)求得溫差x與新增感冒人數(shù)了滿足經(jīng)驗(yàn)回歸方程3=癥+2.6,則下列結(jié)論不乖理的是()

A.x與了有正相關(guān)關(guān)系B.經(jīng)驗(yàn)回歸直線經(jīng)過(guò)點(diǎn)(8,25)

C.3=2.4D.x=9時(shí),殘差為0.2

【答案】C

【解析】由表格可知,X越大,V越大,所以X與y有正相關(guān)關(guān)系,故A正確;

_5+6+8+9+12。_16+20+25+28+36?

x——o,y—=25,

樣本點(diǎn)中心為(8,25),經(jīng)驗(yàn)回歸直線經(jīng)過(guò)點(diǎn)(8,25),故B正確;

將樣本點(diǎn)中心代入直線方程,得25=筋+2.6,所以5=2.8,故C錯(cuò)誤;

y=2.8x+2.6,當(dāng)尤=9時(shí),9=27.8,了-夕=28-27.8=0.2,故D正確.

故選:C

例8.(云南省大理白族自治州2024屆高三第二次復(fù)習(xí)統(tǒng)一檢測(cè)數(shù)學(xué)試題)已知某種商品的廣告費(fèi)支出x(單

.(殘差=觀測(cè)

【答案】-1.5

【解析】x=1x(l+3+4+5+7)=4,j=|x(15+20+30+40+45)=30,

因?yàn)榛貧w直線過(guò)點(diǎn)(4,30),代入?=5.5x+4,可得30=5.5x4+碗=8,

當(dāng)x=7時(shí),3=5.5x7+8=38.5+8=46.5,

所以殘差為45-46.5=-1.5.

故答案為:-1.5

例9.(天津市八校聯(lián)考2023-2024學(xué)年高三學(xué)期期末質(zhì)量調(diào)查數(shù)學(xué)試卷)學(xué)習(xí)于才干信仰,猶如運(yùn)動(dòng)于健

康體魄,持之已久、行之愈遠(yuǎn)愈受益.為實(shí)現(xiàn)中華民族偉大復(fù)興,全國(guó)各行各業(yè)掀起了“學(xué)習(xí)強(qiáng)國(guó)”的高潮.某

老師很喜歡“學(xué)習(xí)強(qiáng)國(guó)”中“挑戰(zhàn)答題”模塊,他記錄了自己連續(xù)七天每天一次最多答對(duì)的題數(shù)如下表:

天數(shù)X1234567

一次最多答對(duì)題數(shù)y12151618212427

777

參考數(shù)據(jù):x=4,歹=19,\>;=140,?>;=2695,£%乂=600,2.45,

z=lz=li=l

由表中數(shù)據(jù)可知該老師每天一次最多答對(duì)題數(shù)y與天數(shù)x之間是相關(guān)(填“正”或"負(fù)”),其相關(guān)系數(shù)

(結(jié)果保留兩位小數(shù))

【答案】正0.99

【解析】由表中數(shù)據(jù)得了隨x的增大而增大,

所以該老師每天一次最多答對(duì)題數(shù)y與天數(shù)x之間是正相關(guān),

£町-7取

r=-------——

600-7x4x191能;,4二0.99

V140-7x4272695-7xl92!V72V427x2.45

故答案為:正;0.99.

例10.(2024年普通高等學(xué)校招生全國(guó)統(tǒng)一考試數(shù)學(xué)文科猜題卷(七))近年來(lái),隨著國(guó)家對(duì)新能源汽車產(chǎn)

業(yè)的支持,很多國(guó)產(chǎn)新能源汽車迅速崛起,其因顏值高、動(dòng)力充沛、提速快、空間大、用車成本低等特點(diǎn)

得到民眾的追捧,但是充電難成為影響新能源汽車銷量的主要原因,國(guó)家為了加快新能源汽車的普及程度,

在全國(guó)范圍內(nèi)逐步增建充電樁.某地區(qū)2019-2023年的充電樁數(shù)量及新能源汽車的年銷量如表所示:

年份20192020202120222023

充電樁數(shù)量X/萬(wàn)臺(tái)13579

新能源汽車年銷量M萬(wàn)輛2537485872

(1)已知可用線性回歸模型擬合了與x的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明(結(jié)果精確到0.001);

(2)求了關(guān)于x的線性回歸方程,預(yù)測(cè)當(dāng)該地區(qū)充電樁數(shù)量為24萬(wàn)臺(tái)時(shí),新能源汽車的年銷量是多少萬(wàn)輛?

£(x,.-x)(y2.-y)

參考公式:相關(guān)系數(shù)一下士,回歸方程f=&+%中斜率和截距的最小二乘估計(jì)公式分

V1=11=1

.__

別為6=i1I-,a=y-bx.

5_5_5________

參考數(shù)據(jù):£(X,-X)2=40,=1326,]*%=1430,753040^230.3041.

1=1i=li—1

-1—1

【解析】(1)由題知x=《x(l+3+5+7+9)=5,y=《x(25+37+48+58+72)=48,

5_5_5

又E(X,-X)2=40,-"=1326,£X,%=1430,

1=1i=li=l

5

-5

1430-5x5x48230

?999,

一740x1326530.3041

因?yàn)榇跖cx的相關(guān)系數(shù)近似為0.999,非常接近1,

所以y與x的線性相關(guān)程度很高,可以用線性回歸模型擬合丁與x的關(guān)系.

.f(x,-x)(Z-7)230——

(2)b3-j----------------==5.75,&=y-6x=48-5.75x5=19.25,

40

Z=1

所以y關(guān)于x的線性回歸方程為3=5.75X+19.25.

當(dāng)x=24時(shí),5.75x24+19.25=157.25,

故當(dāng)充電樁數(shù)量為24萬(wàn)臺(tái)時(shí),該地區(qū)新能源汽車的年銷量為157.25萬(wàn)輛.

例11.(湖北省七市州2024屆高三學(xué)期3月聯(lián)合統(tǒng)一調(diào)研測(cè)試數(shù)學(xué)試題)某高中學(xué)校為了解學(xué)生參加體育

鍛煉的情況,統(tǒng)計(jì)了全校所有學(xué)生在一年內(nèi)每周參加體育鍛煉的次數(shù),現(xiàn)隨機(jī)抽取了60名同學(xué)在某一周參

加體育鍛煉的數(shù)據(jù),結(jié)果如下表:

一周參加體育鍛煉次數(shù)01234567合計(jì)

男生人數(shù)1245654330

女生人數(shù)4556432130

合計(jì)579111086460

(1)若將一周參加體育鍛煉次數(shù)為3次及3次以上的,稱為“經(jīng)常鍛煉”,其余的稱為“不經(jīng)常鍛煉”.請(qǐng)完成

以下2x2列聯(lián)表,并依據(jù)小概率值a=0.1的獨(dú)立性檢驗(yàn),能否認(rèn)為性別因素與學(xué)生體育鍛煉的經(jīng)常性有關(guān)

系;

鍛煉

性別合計(jì)

不經(jīng)常經(jīng)常

男生

女生

合計(jì)

(2)若將一周參加體育鍛煉次數(shù)為0次的稱為“極度缺乏鍛煉”,“極度缺乏鍛煉”會(huì)導(dǎo)致肥胖等諸多健康問(wèn)

題.以樣本頻率估計(jì)概率,在全校抽取20名同學(xué),其中“極度缺乏鍛煉”的人數(shù)為X,求E(X)和。(X);

(3)若將一周參加體育鍛煉6次或7次的同學(xué)稱為“運(yùn)動(dòng)愛好者”,為進(jìn)一步了解他們的生活習(xí)慣,在樣本的

10名“運(yùn)動(dòng)愛好者”中,隨機(jī)抽取3人進(jìn)行訪談,設(shè)抽取的3人中男生人數(shù)為Y,求Y的分布列和數(shù)學(xué)期望.

2_n(ad-6c了

附:,(a+6)(c+d)(a+c)(b+d)n-a+b+c+d

a0.10.050.01

%2.7063.8416.635

【解析】(1)根據(jù)統(tǒng)計(jì)表格數(shù)據(jù)可得列聯(lián)表如下:

鍛煉

性別合計(jì)

不經(jīng)常經(jīng)常

男生72330

女生141630

合計(jì)213960

零假設(shè)為"。:性別與鍛煉情況獨(dú)立,即性別因素與學(xué)生體育鍛煉的經(jīng)常性無(wú)關(guān);

根據(jù)列聯(lián)表的數(shù)據(jù)計(jì)算可得

60(7x16-23x14)260x(7x30)2140

Z2---------------------=------X3.590>2.706=%1

21x39x30x3021x39x30x3039

根據(jù)小概率值a=0.1的獨(dú)立性檢驗(yàn),推斷久不成立,

即性別因素與學(xué)生體育鍛煉的經(jīng)常性有關(guān)系,此推斷犯錯(cuò)誤的概率不超過(guò)0.1

(2)因?qū)W校總學(xué)生數(shù)遠(yuǎn)大于所抽取的學(xué)生數(shù),故X近似服從二項(xiàng)分布,

易知隨機(jī)抽取一人為“極度缺乏鍛煉”者的概率尸**

即可得丫~8(20,《],

故£(X)=20x'=9,£>(X)=20x—x—.

v7123v7121236

(3)易知10名“運(yùn)動(dòng)愛好者”有7名男生,3名女生,

所以F的所有可能取值為0』,2,3;

且y服從超幾何分布:

/^0/~*31z^rl

尸(丫=。)=符=占,尸(y=i)=眷21_7

5oiZU5o120^-40

故所求分布列為

Y0123

17217

P

120404024

可得3如4+1><02*+3><>票

例12.(陜西省漢中市漢臺(tái)區(qū)2024屆高三學(xué)期第四次校際聯(lián)考數(shù)學(xué)試題)大學(xué)生劉銘去某工廠實(shí)習(xí),實(shí)習(xí)

結(jié)束時(shí)從自己制作的某種零件中隨機(jī)選取了10個(gè)樣品,測(cè)量每個(gè)零件的橫截面積(單位:mm2)和耗材量

(單位:mm3),得到如下數(shù)據(jù):

樣本號(hào)i12345678910總和

零件的橫截面積X,0.030.050.040.070.070.040.050.060.060.050.52

耗材量%0.240.400.230.550.500.340.350.450.430.413.9

10(10_2

并計(jì)算得?>比=0.2143,-I。x=1.4336乂0t

j=li=l

(1)估算劉銘同學(xué)制作的這種零件平均每個(gè)零件的橫截面積以及平均一個(gè)零件的耗材量;

(2)求劉銘同學(xué)制作的這種零件的橫截面積和耗材量的樣本相關(guān)系數(shù)(精確到0.01);

(3)劉銘同學(xué)測(cè)量了自己實(shí)習(xí)期制作的所有這種零件的橫截面積,并得到所有這種零件的橫截面積的和為

182mm2,若這種零件的耗材量和其橫截面積近似成正比,請(qǐng)幫劉銘計(jì)算一下他制作的零件的總耗材量的估

,71.49136?1.221

【解析】(1)樣本中10個(gè)這種零件的橫截面積的平均值》=芥=0.052,

樣本中10個(gè)這種零件的耗材量的平均值夕=芳=0.39,

由此可估算劉銘同學(xué)制作的這種零件平均每個(gè)零件的橫截面積為0.052mm2,

平均一個(gè)零件的耗材量為0.39mm3.

2%乂TO盯

0.2143-10x0.052x0.39

(2)r=4

fz2-io72V1.49136xl0~

i=l

1.151.15

0.94,

71,49136?1.221

這種零件的橫截面積和耗材量的樣本相關(guān)系數(shù)為0.94.

(3)設(shè)這種零件的總耗材量的估計(jì)值為rmn?,

又已知這種零件的耗材量和其橫截面積近似成正比,

0.052182,

二,=--->解得f=1365mm3,

0.39t

故這種零件的總耗材量的估計(jì)值為1365mm3.

例13.在一次抽樣調(diào)查中測(cè)得5個(gè)樣本點(diǎn),得到下表及散點(diǎn)圖.

X0.250.5124

y1612521

16-

14-

12-?

10-

8-

6~

4-

2-?

*

_______I___|____|_____]?

O1234X

⑴根據(jù)散點(diǎn)圖判斷y=a+&與了=c+hx-哪一個(gè)適宜作為y關(guān)于x的回歸方程;(給出判斷即可,不必說(shuō)明

理由)

(2)根據(jù)(1)的判斷結(jié)果試建立了與X的回歸方程;(計(jì)算結(jié)果保留整數(shù))

^x^-n-x-y^(x,.-x)(y,,-j)

參考公式:b=R,----------=-----------,a=y-bx

^xj-n-x2之伍-可②

z=li=\

【解析】(I)由題中散點(diǎn)圖可以判斷,y=c+左適宜作為V關(guān)于X的回歸方程;

(2)令f=x-,則>=。+〃,原數(shù)據(jù)變?yōu)?/p>

t4210.50.25

y1612521

由表可知V與t近似具有線性相關(guān)關(guān)系,計(jì)算得F=;=1.55,

_16+12+5+2+1

了=—5—=72,

「4x16+2x12+1x5+0.5x2+0.25x1-5x1.55x7.238.45,

42+22+12+0.52+0.252-5x1.5529.3

所以,c=y-la=7.2-4x1.55=1,則夕=由+1.

所以歹關(guān)于》的回歸方程是夕=2+1.

【過(guò)關(guān)測(cè)試】

一、單選題

1.對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得以下散點(diǎn)圖,關(guān)于其樣本相關(guān)系數(shù)的比較,下列結(jié)論正確的是()

3535

3030

2525

2020

1515

1010

55

0510152025303505101520253035

樣本相關(guān)系數(shù)為小樣本相關(guān)系數(shù)為上

3535

3030

2525

2020

1515

1010

55

0510152025303505101520253035

樣本相關(guān)系數(shù)為-3樣本相關(guān)系數(shù)為-4

A.r2<r4<0<r3<rIB.r4<r2<0<rx<r3

C.〃<馬<0<々"D.弓<q<0"<4

【答案】B

【解析】由給出的四組數(shù)據(jù)的散點(diǎn)圖可以看出,

左側(cè)兩圖是正相關(guān),樣本相關(guān)系數(shù)大于0,則4〉。,4〉。,

右側(cè)兩圖是負(fù)相關(guān),樣本相關(guān)系數(shù)小于0,則々<0,〃<0,

下方兩圖的點(diǎn)相對(duì)更加集中,所以相關(guān)性較強(qiáng),所以々接近于1,G接近于一1,

上方兩圖的點(diǎn)相對(duì)分散一些,所以相關(guān)性較弱,所以彳和4比較接近0,

由止匕可得q<4<0<4<4.

故選:B.

2.(上海市普陀區(qū)桃浦中學(xué)2024屆高三學(xué)期期末數(shù)學(xué)試題)下列命題中,真命題的是()

A.若回歸方程P=-2x+0.1,則變量歹與1負(fù)相關(guān)

B.線性回歸分析中決定系數(shù)用來(lái)刻畫回歸的效果,若該值越小,則模型的擬合效果越好

C.若樣本數(shù)據(jù)須,馬,???,/()的方差為2,則數(shù)據(jù)3石,3%2,…J%。的方差9

D.若P(/)與尸(3)獨(dú)立,則P(/uB)=P(4|5)P(4)

【答案】A

【解析】對(duì)于A,回歸方程為>=-2x+0.1,又???6=—0.2<0,所以變量歹與“負(fù)相關(guān),故A正確,

對(duì)于B,線性回歸分析中決定系數(shù)改用來(lái)刻畫回歸的效果,若及2值越大,說(shuō)明模型的擬合效果越好,故B

錯(cuò)誤.

對(duì)于C,若樣本數(shù)據(jù)石,%2,…,再oo的方差為2,則數(shù)據(jù)3再,3%,…,3/o的方差32x2=18,故C錯(cuò)誤,

對(duì)于D,擲一枚骰子,設(shè)事件/:點(diǎn)數(shù)小于3,則p(/)=;;

事件8:點(diǎn)數(shù)為偶數(shù),則尸(2)=:,尸(")=:,

所以尸(4B)=P(A)P⑻,即尸⑷與P(B)獨(dú)立,

又尸(4|8)=與卻=q=(,P(AUB)=^P(A\B)P(A),故D錯(cuò)誤.

9(8)36

,'2

故選:A.

3.(內(nèi)蒙古呼和浩特市2024屆高三學(xué)期學(xué)業(yè)質(zhì)量監(jiān)測(cè)數(shù)學(xué)試題)用模型了=優(yōu)底擬合一組數(shù)據(jù)組

(x"J(i=l,2,3,…,7),其中%+%+…+5=14,設(shè)2=lny,得變換后的線性回歸方程為]=x+l,則

%%,,,%=()

A.e35B.e21C.35D.21

【答案】B

【解析】由題意得1=網(wǎng)+%;…+號(hào)=2,

故z=x+l=3,

BPInj/j+Iny2+—I-\ny7=3x7=21,

故In5%…%)=21,解得必力…%=e2:

故選:B

4.(上海市浦東新區(qū)2024屆高三學(xué)期期中教學(xué)質(zhì)量檢測(cè)數(shù)學(xué)試卷)通過(guò)隨機(jī)抽樣,我們繪制了如圖所示的

某種商品每千克價(jià)格(單位:百元)與該商品消費(fèi)者年需求量(單位:千克)的散點(diǎn)圖.若去掉圖中右下方

246810每千克價(jià)格/百元

消費(fèi)者年需求量與商品每千克價(jià)格的散點(diǎn)圖

A.“每千克價(jià)格”與“年需求量”這兩個(gè)變量由負(fù)相關(guān)變?yōu)檎嚓P(guān)

B.“每千克價(jià)格”與“年需求量”這兩個(gè)變量的線性相關(guān)程度不變

C.“每千克價(jià)格”與“年需求量”這兩個(gè)變量的線性相關(guān)系數(shù)變大

D.“每千克價(jià)格”與“年需求量”這兩個(gè)變量的線性相關(guān)系數(shù)變小

【答案】D

【解析】對(duì)于A:去掉圖中右下方的點(diǎn)A后,根據(jù)圖象,兩個(gè)變量還是負(fù)相關(guān),A錯(cuò)誤;

對(duì)于BCD:去掉圖中右下方的點(diǎn)A后,相對(duì)來(lái)說(shuō)數(shù)據(jù)會(huì)集中,相關(guān)程度會(huì)更高,

但因?yàn)槭秦?fù)相關(guān),相關(guān)系數(shù)會(huì)更接近-1線性相關(guān)系數(shù)會(huì)變小,故D正確,BC錯(cuò)誤.

故選:D.

二、多選題

5.(2024屆廣東省湛江市高三一模數(shù)學(xué)試題)某養(yǎng)老院有110名老人,經(jīng)過(guò)一年的跟蹤調(diào)查,過(guò)去的一年

中他們是否患過(guò)某流行疾病和性別的相關(guān)數(shù)據(jù)如下表所示:

是否患過(guò)某流行疾病

性別合計(jì)

患過(guò)該疾病未患過(guò)該疾病

男a=20ba+b

女Cd=50c+d

合計(jì)a+c80110

下列說(shuō)法正確的有()

n(ad-bcY

參考公式:z2其中n=a+b+c+d.

(a+6)(c+d)(a+c)G+d)

附表:

a0.10.050.0250.010.001

%2.7063.8415.0246.63510.828

a+bc+d

B.力2>6.635

C.根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),認(rèn)為是否患過(guò)該流行疾病與性別有關(guān)聯(lián)

D.根據(jù)小概率值夕=0.01的獨(dú)立性檢驗(yàn),沒有充分的證據(jù)推斷是否患過(guò)該流行疾病與性別有關(guān)聯(lián)

【答案】ABC

【解析】根據(jù)列聯(lián)表中的數(shù)據(jù)可求得a=20,6=30,c=10,d=50;

對(duì)于A,代入計(jì)算可得一-=->——-=正確;

a+b5c+a6

對(duì)于B,經(jīng)計(jì)算可得力2=U°x(20x50-30x10)2-7,486>6,635-可得B正確;

30x80x50x60

對(duì)于CD,結(jié)合附表數(shù)值以及獨(dú)立性檢驗(yàn)的實(shí)際意義,可認(rèn)為根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),認(rèn)為是

否患過(guò)該流行疾病與性別有關(guān)聯(lián),即C正確,D錯(cuò)誤;

故選:ABC

6.(河北省滄州市泊頭市聯(lián)考2024屆高三學(xué)期高考模擬考試數(shù)學(xué)試題)下表是某地從2019年至2023年能

源消費(fèi)總量近似值7(單位:千萬(wàn)噸標(biāo)準(zhǔn)煤)的數(shù)據(jù)表:

年份20192020202120222023

年份代號(hào)X12345

能源消費(fèi)總量近似值了(單位:千萬(wàn)噸標(biāo)準(zhǔn)煤)44.244.646.247.850.8

以X為解釋變量,y為響應(yīng)變量,若以戈=仇尤+4為回歸方程,則決定系數(shù)&y0.9298,若以

為回歸方程,則咫。0.9965,則下面結(jié)論中正確的有()

A.變量x和變量y的樣本相關(guān)系數(shù)為正數(shù)

B.%=仇%2+出工+。2比%=4工+%的擬合效果好

C.由回歸方程可準(zhǔn)確預(yù)測(cè)2024年的能源消費(fèi)總量

D.y=3b1+ax

【答案】ABD

【解析】對(duì)于A選項(xiàng):隨著變量x的增加,變量了也在增加,故變量V和變量x成正相關(guān),即樣本相關(guān)系數(shù)

為正數(shù),正確;

對(duì)于B選項(xiàng):因?yàn)闊o(wú)>庶,故%=為,+%》+。2比%=¥+4的擬合效果好,正確;

對(duì)于C選項(xiàng):回歸方程可預(yù)測(cè)2024年的能源消費(fèi)總量,不可準(zhǔn)確預(yù)測(cè),錯(cuò)誤;

對(duì)于D選項(xiàng):由回歸方程必過(guò)樣本中心點(diǎn),可知歹=34+%,正確.

故選:ABD.

7.(FHsxl225yll36)(多選)某學(xué)校為了調(diào)查學(xué)生對(duì)“只要學(xué)習(xí)夠努力,成績(jī)一定有奇跡”這句話的認(rèn)可程度,

隨機(jī)調(diào)查了90名本校高一、高二的學(xué)生,得到如下列聯(lián)表.用樣本估計(jì)總體,則下列說(shuō)法正確的是(參考數(shù)

據(jù):-不,n=a+b+c+d,P(x2>6.635)=0.010,P(Z2>10.828)=0.001)()

(a+o)(c+a)(a+c)(o+a)

認(rèn)可不認(rèn)可總計(jì)

高一202040

高二401050

總計(jì)603090

A.高一高二大約有66.7%的學(xué)生認(rèn)可這句話

B.高一高二大約有99%的學(xué)生認(rèn)可這句話

C.依據(jù)a=0.01的獨(dú)立性檢驗(yàn),認(rèn)為學(xué)生對(duì)這句話認(rèn)可與否與年級(jí)有關(guān)

D.在犯錯(cuò)誤的概率不超過(guò)0.01的前提下,認(rèn)為學(xué)生對(duì)這句話認(rèn)可與否與年級(jí)無(wú)關(guān)

【答案】AC

【解析】隨機(jī)調(diào)查了90名學(xué)生,其中一共有60名學(xué)生認(rèn)可,所以認(rèn)可率大約為66.7%,1=加.:

abcdacba

90x20x1040x202

=9.因?yàn)?.635<9<10.828,故C正確,D錯(cuò)誤.故選AC.

40x50x60x30

8.(安徽省蕪湖市安徽師范大學(xué)附屬中學(xué)2024屆高三第二次模擬考試數(shù)學(xué)試題)已知由樣本數(shù)據(jù)

2,3,…,10)組成的一個(gè)樣本,得到回歸直線方程為,=r+3,且1=4.剔除一個(gè)偏離直線較大的異常

點(diǎn)(-5,-1)后,得到新的回歸直線經(jīng)過(guò)點(diǎn)(6,-4).則下列說(shuō)法正確的是

A.相關(guān)變量x,y具有正相關(guān)關(guān)系

B.剔除該異常點(diǎn)后,樣本相關(guān)系數(shù)的絕對(duì)值變大

C.剔除該異常點(diǎn)后的回歸直線方程經(jīng)過(guò)點(diǎn)(5,-1)

D.剔除該異常點(diǎn)后,隨x值增加相關(guān)變量y值減小速度變小

【答案】BC

【解析】依題意,原樣本中,1=T+3=-l,

剔除一個(gè)偏離直線較大的異常點(diǎn)(-5,-1)后,新樣本中,p=4xl0-(-5)=5p=-lxl0-(-l)=_b

因此剔除該異常點(diǎn)后的回歸直線方程經(jīng)過(guò)點(diǎn)(5,-1),C正確;

由新的回歸直線經(jīng)過(guò)點(diǎn)(6,-4),得新的回歸直線斜率為二=新,因此相關(guān)變量x,y具有負(fù)相關(guān)關(guān)系,

6-5

A錯(cuò)誤;

又則剔除該異常點(diǎn)后,隨x值增加相關(guān)變量y值減小速度變大,D錯(cuò)誤;

由剔除的是偏離直線較大的異常點(diǎn),得剔除該點(diǎn)后,新樣本數(shù)據(jù)的線性相關(guān)程度變強(qiáng),即樣本相關(guān)系數(shù)的

絕對(duì)值變大,B正確.

故選:BC

9.(湘豫名校聯(lián)考2024年2月高三第一次模擬考試數(shù)學(xué)試題)下列說(shuō)法中,正確的是()

A.設(shè)有一個(gè)經(jīng)驗(yàn)回歸方程為?=1-2》,變量x增加1個(gè)單位時(shí),j)平均增加2個(gè)單位

B.已知隨機(jī)變量自?N(0,,),若尸C>2)=0.2,則尸(一24442)=0.6

C.兩組樣本數(shù)據(jù)x,,x2,x3,x4和%,%,力,乂的方差分別為s;,si.若已知%+%=10且無(wú),.<%。=1,2,3,4),

則S:=

D.已知一系列樣本點(diǎn)(x,,%)(z,=l,2,3,…)的經(jīng)驗(yàn)回歸方程為夕=3尤+3,若樣本點(diǎn)⑺,3)與(2,〃)的殘差

相等,則3刃+〃=10

【答案】BC

【解析】若有一個(gè)經(jīng)驗(yàn)回歸方程f=l-2x,隨著x的增大,夕會(huì)減小,A錯(cuò)誤;

曲線關(guān)于x=0對(duì)稱,因?yàn)槭?>2)=0.2,所以尸代<-2)=0.2,

所以尸(_2Vg42)=l—/片>2)_尸?<_2)=0.6,B正確;

141414141

=i"=£,所以元

因?yàn)槠?N4tM+7=z/+i5>,=a

Z=1""Z=1'?i='=1l'i=l'

2

4

x;—2X]X+x之+xj—2X2X+x之+…+%j—2X4X+x2

4

x;+%2+x;+x:-(2/+212+29+2%4)x_2

4

_xf+xf+xf+%4_2,-2_+-^2+x3+x4-2

------------------------ZoA-TX----------------X,

44

同理可得聞=仝”一干

(10-X)2+(10-X)2+(10-X)2+(10-X)2

1234-(10-x)2

4

400—20(%]+%2+、3+%4)+x;+x;+x;+%:

-(10-x)2

4

—廣+*。。+2-丁丁』」,

故s:=s;,C正確;

經(jīng)驗(yàn)回歸方程為,=3x+&,且樣本點(diǎn)(m,3)與(2,n)的殘差相等,

貝!|3-(3加+&)=〃一(6+&)=>3機(jī)+〃=9,D錯(cuò)誤.

故選:BC.

10.(河南省部分重點(diǎn)中學(xué)2024屆高三學(xué)期2月質(zhì)量檢測(cè)數(shù)學(xué)試題)已知變量尤/之間的經(jīng)驗(yàn)回歸方程為

y^~x+a,且變量xj的數(shù)據(jù)如下表所示:

6

X5681214

y108651

則下列說(shuō)法正確的是()

A.變量%》之間負(fù)相關(guān)B.5=13

C.當(dāng)x=3時(shí),可估計(jì)V的值為11D.當(dāng)x=8時(shí),殘差為-1

【答案】AC

【解析】對(duì)于A選項(xiàng),由-1■<(),可得變量X/之間負(fù)相關(guān),故A選項(xiàng)正確;

6

_1_1

對(duì)于B選項(xiàng),x=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論