




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
專題28統(tǒng)計(jì)案例和回歸方程
【考點(diǎn)預(yù)測(cè)】
知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系
1、變量之間的相關(guān)關(guān)系
當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于
相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過(guò)程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過(guò)收
集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.
注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,
而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.
2、散點(diǎn)圖
將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(x,,%)(,=1,2,…,?)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖
中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.
(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它
稱為正相關(guān),如圖(1)所示;
(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它
稱為負(fù)相關(guān),如圖(2)所示.
(1)(2)
3、相關(guān)系數(shù)
若相應(yīng)于變量l的取值玉,變量丁的觀測(cè)值為%(IV〃),則變量x與〉的相關(guān)系數(shù)
〃__n_
E(%-x)(%-y)2-nxy
r=IJ,I丁,通常用廠來(lái)衡量x與夕之間的線性關(guān)系的強(qiáng)弱,r
的范圍為-1VrVI.
(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).
(2)N越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);卜|越接近0,表示兩個(gè)變量間幾乎不存在線性相
關(guān)關(guān)系.當(dāng)網(wǎng)=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.
(3)通常當(dāng)上|>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.
知識(shí)點(diǎn)二、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.
對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(XI,力),(X2,/),…,(X",%),其回歸方程i=+Z的求法為
n__n___
八E(西--y)ExJ-nxy
b=—----------------=號(hào)---------
t(七一^^x^-nx2
Z=1Z=1
a=y-bx
_i?_i?__
其中,x=-tXi,y=-tJyi,(X,y)稱為樣本點(diǎn)的中心.
,i
n=ni=i
2、殘差分析
對(duì)于預(yù)報(bào)變量y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值%,通過(guò)回歸方程得到的S稱為預(yù)測(cè)值,觀測(cè)值減
去預(yù)測(cè)值等于殘差,自稱為相應(yīng)于點(diǎn)(4X)的殘差,即有?=殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)
殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差
分析.
(1)殘差圖
通過(guò)殘差分析,殘差點(diǎn)(%?)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,其中這
樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精確度越高;反之,不合適.
(2)通過(guò)殘差平方和。=『分析,如果殘差平方和越小,則說(shuō)明選用的模型的擬合效果越好;
;=1
反之,不合適.
(3)相關(guān)指數(shù)
£(%-%)2
用相關(guān)指數(shù)來(lái)刻畫回歸的效果,其計(jì)算公式是:心=1-4~—?
Z(z-y)2
Z=1
發(fā)越接近于1,說(shuō)明殘差的平方和越小,也表示回歸的效果越好.
知識(shí)點(diǎn)三、獨(dú)立性檢驗(yàn)
1、分類變量和列聯(lián)表
(1)分類變量:
變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯(lián)表:
①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.
②2x2列聯(lián)表.
一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{xl,x2}和{jl,y2),其樣本頻數(shù)列聯(lián)表(稱
為2x2列聯(lián)表)為
%總計(jì)
aba+b
Cdc+d
總計(jì)a+cb+da+b+c+d
從2x2列表中,依據(jù)二與二的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示
列聯(lián)表數(shù)據(jù)的頻率特征.
(2)觀察等高條形圖發(fā)現(xiàn),與'相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.
a+bc+d
3、獨(dú)立性檢驗(yàn)
(1)定義:利用獨(dú)立性假設(shè)、隨.機(jī)變量犬2來(lái)確定是否有一定把握認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法
稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).
(2)公式:K2=-----"竺二巴--------,其中力=°+b+c+d為樣本容量.
(a+b)(c+d)(a+c)(b+d)
(3)獨(dú)立性檢驗(yàn)的具體步驟如下:
①計(jì)算隨機(jī)變量K?的觀測(cè)值左,查下表確定臨界值勺:
2
P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001
ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
②如果42虧,就推斷“x與y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過(guò)"K?2幻);否則,就認(rèn)為在犯
錯(cuò)誤的概率不超過(guò)p(K2N/)的前提下不能推斷“X與y有關(guān)系”.
(2)兩個(gè)分類變量x和y是否有關(guān)系的判斷標(biāo)準(zhǔn):
統(tǒng)計(jì)學(xué)研究表明:
當(dāng)片43.841時(shí),認(rèn)為X與y無(wú)關(guān);
當(dāng)片>3.841時(shí),有95%的把握說(shuō)X與y有關(guān);
當(dāng)片>6.635時(shí),有99%的把握說(shuō)X與丫有關(guān);
當(dāng)片>10.828時(shí),有99.9%的把握說(shuō)X與Y有關(guān).
【典型例題】
例1.(山東省棗莊市2024屆高三學(xué)期3月模擬考試數(shù)學(xué)試題)某兒童醫(yī)院用甲、乙兩種療法治療小兒消化
不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到兩種療法治療數(shù)據(jù)的列聯(lián)表:
療效
療法合計(jì)
未治愈治愈
甲155267
乙66369
合計(jì)21115136
經(jīng)計(jì)算得到力2x4.881,根據(jù)八概率值a=0.005的獨(dú)立性檢驗(yàn)(已知/獨(dú)立性檢驗(yàn)中無(wú)。儂=7.879),則可
以認(rèn)為()
A.兩種療法的效果存在差異
B.兩種療法的效果存在差異,這種判斷犯錯(cuò)誤的概率不超過(guò)0.005
C.兩種療法的效果沒有差異
D.兩種療法的效果沒有差異,這種判斷犯錯(cuò)誤的概率不超過(guò)①005
【答案】C
【解析】零假設(shè)為X。:療法與療效獨(dú)立,即兩種療法效果沒有差異.
2
根據(jù)列聯(lián)表中的數(shù)據(jù),Z-4.881<7,879=%,005,根據(jù)小概率值a=0.005的獨(dú)立性檢驗(yàn),
沒有充分證據(jù)推斷以。不成立,
因此可以認(rèn)為“°成立,
即認(rèn)為兩種療法效果沒有差異.
故選:C.
例2.(四川省成都市2024屆高三學(xué)期第二次診斷性檢測(cè)文科數(shù)學(xué)試題)對(duì)變量x,y有觀測(cè)數(shù)據(jù)(%,%乂ieN*),
得散點(diǎn)圖1;對(duì)變量",v有觀測(cè)數(shù)據(jù)(%,vJ(ieN*),得散點(diǎn)圖2/表示變量xj之間的線性相關(guān)系數(shù),馬表
示變量w#之間的線性相關(guān)系數(shù),則下列說(shuō)法正確的是()
A.變量x與〉呈現(xiàn)正相關(guān),且聞<聞B.變量x與〉呈現(xiàn)負(fù)相關(guān),且間>|目
C.變量x與了呈現(xiàn)正相關(guān),且間>聞D.變量x與了呈現(xiàn)負(fù)相關(guān),且同<問(wèn)
【答案】C
【解析】由題意可知,變量的散點(diǎn)圖中,了隨X的增大而增大,所以變量X與了呈現(xiàn)正相關(guān);
再分別觀察兩個(gè)散點(diǎn)圖,圖1比圖2點(diǎn)更加集中,相關(guān)性更好,所以線性相關(guān)系數(shù)間>目.
故選:C.
例3.(FHsxl225yli36)如圖,去掉點(diǎn)。(3,10)后,下列說(shuō)法錯(cuò)誤的是()
"y.£(10,12)
?0(3,10)
?C(4,5)
?B(2,4)
"(1,3)
-0x
A.相關(guān)系數(shù)廠變大
B.殘差平方和變大
C.決定系數(shù)R2變大
D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)
【答案】B
【解析】去掉。(3,10)后,其他數(shù)據(jù)都在一條直線附近,變量x與變量夕的相關(guān)性變強(qiáng),模型擬合效果變
好,故殘差平方和變小.
例4.(湖南省2024年普通高等學(xué)校招生全國(guó)統(tǒng)一考試考前演練二數(shù)學(xué)試題)某騎行愛好者在專業(yè)人士指導(dǎo)
下對(duì)近段時(shí)間騎行鍛煉情況進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)每次騎行期間的身體綜合指標(biāo)評(píng)分x與騎行用時(shí)V(單位:
小時(shí))如下表:
身體綜合指標(biāo)評(píng)分(X)12345
用時(shí)(了/小時(shí))9.58.87.876.1
由上表數(shù)據(jù)得到的正確結(jié)論是()
555
參考數(shù)據(jù):一可、10,'(%一刃、7.06,£億一可同一刃=-8.4,V70^X8.402.
1=1J=1Z=1
-初入-7)
參考公式:相關(guān)系數(shù):=IL.
也(%一)*(%-刃2
VZ=1Z=1
A.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)y正相關(guān)
B.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)了的相關(guān)程度較弱
C.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)了的相關(guān)程度較強(qiáng)
D.身體綜合指標(biāo)評(píng)分x與騎行用時(shí)了的關(guān)系不適合用線性回歸模型擬合
【答案】C
5
'(%-可(K-7)
-8.4
【解析】因?yàn)橄嚓P(guān)系數(shù),=i=l
557V10x7.06
Z=1Z=1
即相關(guān)系數(shù)近似為-1/與X負(fù)相關(guān),且相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合了與X的關(guān)系.
所以選項(xiàng)ABD錯(cuò)誤,C正確.
故選:C.
例5.(四川省成都市第七中學(xué)2024屆高三學(xué)期期末數(shù)學(xué)試題)在某病毒疫苗的研發(fā)過(guò)程中,需要利用基因
編輯小鼠進(jìn)行動(dòng)物實(shí)驗(yàn).現(xiàn)隨機(jī)抽取100只基因編輯小鼠對(duì)該病毒疫苗進(jìn)行實(shí)驗(yàn),得到如下2x2列聯(lián)表(部
分?jǐn)?shù)據(jù)缺失):
被某病毒感染未被某病毒感染合計(jì)
注射疫苗1050
未注射疫苗3050
合計(jì)30100
a0.10.050.010.0050.001
%2.7063.8416.6357.87910.828
計(jì)算可知,根據(jù)小概率值々=的獨(dú)立性檢驗(yàn),分析“給基因編輯小鼠注射該種疫苗能起到預(yù)防該病毒
感染的效果”()
n(ad-bc)~,,
附:Z2-----------------,n=a+b+c+a.
(a+b)(c+d)(a+c)(b+d)
A.0.001B.0.05C.0.01D.0.005
【答案】B
【解析】完善2x2列聯(lián)表如下:
被某病毒感染未被某病毒感染合計(jì)
注射疫苗104050
未注射疫苗203050
合計(jì)3070100
假設(shè):“給基因編輯小鼠注射該疫苗不能起到預(yù)防該病毒感染的效果”.
100(10x30-20x40)2
因?yàn)椋毫??4.762,而3.841<4.762<6.635,
30x70x50x50
所以根據(jù)小概率值a=0.05的獨(dú)立性檢驗(yàn),推斷久不成立.
即認(rèn)為“給基因編輯小鼠注射該疫苗能起到預(yù)防該病毒感染的效果”.
故選:B
例6.(云南省曲靖市2024屆高三學(xué)期第一次質(zhì)量監(jiān)測(cè)數(shù)學(xué)試題)已知變量V關(guān)于x的回歸方程為3=/“。-6,
若對(duì)3=a一°6兩邊取自然對(duì)數(shù),可以發(fā)現(xiàn)inj與無(wú)線性相關(guān).現(xiàn)有一組數(shù)據(jù)如下表所示:
X12345
yee3e4e6e7
貝U當(dāng)x=6時(shí),預(yù)測(cè)了的值為()
A.9B.8C.e9D.e8
【答案】C
【解析】令〃=lny,由了=可得〃=足了=3x—0.6,如下表所不:
X12345
yee3e4e6e7
u13467
1+2+3+4+5c-1+3+4+6+7
由表格中的數(shù)據(jù)可得已=------------------=3,u=-------------------=44.2,
55
貝!I有步-0.6=4.2,解得務(wù)=1,6,故「=屋6工46,
當(dāng)x=6時(shí),y=e1,^6-0,6=e9.
故選:C.
例7.(山東省濱州市2024屆高三學(xué)期期末數(shù)學(xué)試題)某學(xué)校一同學(xué)研究溫差x(單位:。C)與本校當(dāng)天新
增感冒人數(shù)了(單位:人)的關(guān)系,該同學(xué)記錄了5天的數(shù)據(jù):
X568912
y1620252836
由上表中數(shù)據(jù)求得溫差x與新增感冒人數(shù)了滿足經(jīng)驗(yàn)回歸方程3=癥+2.6,則下列結(jié)論不乖理的是()
A.x與了有正相關(guān)關(guān)系B.經(jīng)驗(yàn)回歸直線經(jīng)過(guò)點(diǎn)(8,25)
C.3=2.4D.x=9時(shí),殘差為0.2
【答案】C
【解析】由表格可知,X越大,V越大,所以X與y有正相關(guān)關(guān)系,故A正確;
_5+6+8+9+12。_16+20+25+28+36?
x——o,y—=25,
樣本點(diǎn)中心為(8,25),經(jīng)驗(yàn)回歸直線經(jīng)過(guò)點(diǎn)(8,25),故B正確;
將樣本點(diǎn)中心代入直線方程,得25=筋+2.6,所以5=2.8,故C錯(cuò)誤;
y=2.8x+2.6,當(dāng)尤=9時(shí),9=27.8,了-夕=28-27.8=0.2,故D正確.
故選:C
例8.(云南省大理白族自治州2024屆高三第二次復(fù)習(xí)統(tǒng)一檢測(cè)數(shù)學(xué)試題)已知某種商品的廣告費(fèi)支出x(單
.(殘差=觀測(cè)
【答案】-1.5
【解析】x=1x(l+3+4+5+7)=4,j=|x(15+20+30+40+45)=30,
因?yàn)榛貧w直線過(guò)點(diǎn)(4,30),代入?=5.5x+4,可得30=5.5x4+碗=8,
當(dāng)x=7時(shí),3=5.5x7+8=38.5+8=46.5,
所以殘差為45-46.5=-1.5.
故答案為:-1.5
例9.(天津市八校聯(lián)考2023-2024學(xué)年高三學(xué)期期末質(zhì)量調(diào)查數(shù)學(xué)試卷)學(xué)習(xí)于才干信仰,猶如運(yùn)動(dòng)于健
康體魄,持之已久、行之愈遠(yuǎn)愈受益.為實(shí)現(xiàn)中華民族偉大復(fù)興,全國(guó)各行各業(yè)掀起了“學(xué)習(xí)強(qiáng)國(guó)”的高潮.某
老師很喜歡“學(xué)習(xí)強(qiáng)國(guó)”中“挑戰(zhàn)答題”模塊,他記錄了自己連續(xù)七天每天一次最多答對(duì)的題數(shù)如下表:
天數(shù)X1234567
一次最多答對(duì)題數(shù)y12151618212427
777
參考數(shù)據(jù):x=4,歹=19,\>;=140,?>;=2695,£%乂=600,2.45,
z=lz=li=l
由表中數(shù)據(jù)可知該老師每天一次最多答對(duì)題數(shù)y與天數(shù)x之間是相關(guān)(填“正”或"負(fù)”),其相關(guān)系數(shù)
(結(jié)果保留兩位小數(shù))
【答案】正0.99
【解析】由表中數(shù)據(jù)得了隨x的增大而增大,
所以該老師每天一次最多答對(duì)題數(shù)y與天數(shù)x之間是正相關(guān),
£町-7取
r=-------——
600-7x4x191能;,4二0.99
V140-7x4272695-7xl92!V72V427x2.45
故答案為:正;0.99.
例10.(2024年普通高等學(xué)校招生全國(guó)統(tǒng)一考試數(shù)學(xué)文科猜題卷(七))近年來(lái),隨著國(guó)家對(duì)新能源汽車產(chǎn)
業(yè)的支持,很多國(guó)產(chǎn)新能源汽車迅速崛起,其因顏值高、動(dòng)力充沛、提速快、空間大、用車成本低等特點(diǎn)
得到民眾的追捧,但是充電難成為影響新能源汽車銷量的主要原因,國(guó)家為了加快新能源汽車的普及程度,
在全國(guó)范圍內(nèi)逐步增建充電樁.某地區(qū)2019-2023年的充電樁數(shù)量及新能源汽車的年銷量如表所示:
年份20192020202120222023
充電樁數(shù)量X/萬(wàn)臺(tái)13579
新能源汽車年銷量M萬(wàn)輛2537485872
(1)已知可用線性回歸模型擬合了與x的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明(結(jié)果精確到0.001);
(2)求了關(guān)于x的線性回歸方程,預(yù)測(cè)當(dāng)該地區(qū)充電樁數(shù)量為24萬(wàn)臺(tái)時(shí),新能源汽車的年銷量是多少萬(wàn)輛?
£(x,.-x)(y2.-y)
參考公式:相關(guān)系數(shù)一下士,回歸方程f=&+%中斜率和截距的最小二乘估計(jì)公式分
V1=11=1
.__
別為6=i1I-,a=y-bx.
5_5_5________
參考數(shù)據(jù):£(X,-X)2=40,=1326,]*%=1430,753040^230.3041.
1=1i=li—1
-1—1
【解析】(1)由題知x=《x(l+3+5+7+9)=5,y=《x(25+37+48+58+72)=48,
5_5_5
又E(X,-X)2=40,-"=1326,£X,%=1430,
1=1i=li=l
5
-5
1430-5x5x48230
?999,
一740x1326530.3041
因?yàn)榇跖cx的相關(guān)系數(shù)近似為0.999,非常接近1,
所以y與x的線性相關(guān)程度很高,可以用線性回歸模型擬合丁與x的關(guān)系.
.f(x,-x)(Z-7)230——
(2)b3-j----------------==5.75,&=y-6x=48-5.75x5=19.25,
40
Z=1
所以y關(guān)于x的線性回歸方程為3=5.75X+19.25.
當(dāng)x=24時(shí),5.75x24+19.25=157.25,
故當(dāng)充電樁數(shù)量為24萬(wàn)臺(tái)時(shí),該地區(qū)新能源汽車的年銷量為157.25萬(wàn)輛.
例11.(湖北省七市州2024屆高三學(xué)期3月聯(lián)合統(tǒng)一調(diào)研測(cè)試數(shù)學(xué)試題)某高中學(xué)校為了解學(xué)生參加體育
鍛煉的情況,統(tǒng)計(jì)了全校所有學(xué)生在一年內(nèi)每周參加體育鍛煉的次數(shù),現(xiàn)隨機(jī)抽取了60名同學(xué)在某一周參
加體育鍛煉的數(shù)據(jù),結(jié)果如下表:
一周參加體育鍛煉次數(shù)01234567合計(jì)
男生人數(shù)1245654330
女生人數(shù)4556432130
合計(jì)579111086460
(1)若將一周參加體育鍛煉次數(shù)為3次及3次以上的,稱為“經(jīng)常鍛煉”,其余的稱為“不經(jīng)常鍛煉”.請(qǐng)完成
以下2x2列聯(lián)表,并依據(jù)小概率值a=0.1的獨(dú)立性檢驗(yàn),能否認(rèn)為性別因素與學(xué)生體育鍛煉的經(jīng)常性有關(guān)
系;
鍛煉
性別合計(jì)
不經(jīng)常經(jīng)常
男生
女生
合計(jì)
(2)若將一周參加體育鍛煉次數(shù)為0次的稱為“極度缺乏鍛煉”,“極度缺乏鍛煉”會(huì)導(dǎo)致肥胖等諸多健康問(wèn)
題.以樣本頻率估計(jì)概率,在全校抽取20名同學(xué),其中“極度缺乏鍛煉”的人數(shù)為X,求E(X)和。(X);
(3)若將一周參加體育鍛煉6次或7次的同學(xué)稱為“運(yùn)動(dòng)愛好者”,為進(jìn)一步了解他們的生活習(xí)慣,在樣本的
10名“運(yùn)動(dòng)愛好者”中,隨機(jī)抽取3人進(jìn)行訪談,設(shè)抽取的3人中男生人數(shù)為Y,求Y的分布列和數(shù)學(xué)期望.
2_n(ad-6c了
附:,(a+6)(c+d)(a+c)(b+d)n-a+b+c+d
a0.10.050.01
%2.7063.8416.635
【解析】(1)根據(jù)統(tǒng)計(jì)表格數(shù)據(jù)可得列聯(lián)表如下:
鍛煉
性別合計(jì)
不經(jīng)常經(jīng)常
男生72330
女生141630
合計(jì)213960
零假設(shè)為"。:性別與鍛煉情況獨(dú)立,即性別因素與學(xué)生體育鍛煉的經(jīng)常性無(wú)關(guān);
根據(jù)列聯(lián)表的數(shù)據(jù)計(jì)算可得
60(7x16-23x14)260x(7x30)2140
Z2---------------------=------X3.590>2.706=%1
21x39x30x3021x39x30x3039
根據(jù)小概率值a=0.1的獨(dú)立性檢驗(yàn),推斷久不成立,
即性別因素與學(xué)生體育鍛煉的經(jīng)常性有關(guān)系,此推斷犯錯(cuò)誤的概率不超過(guò)0.1
(2)因?qū)W校總學(xué)生數(shù)遠(yuǎn)大于所抽取的學(xué)生數(shù),故X近似服從二項(xiàng)分布,
易知隨機(jī)抽取一人為“極度缺乏鍛煉”者的概率尸**
即可得丫~8(20,《],
故£(X)=20x'=9,£>(X)=20x—x—.
v7123v7121236
(3)易知10名“運(yùn)動(dòng)愛好者”有7名男生,3名女生,
所以F的所有可能取值為0』,2,3;
且y服從超幾何分布:
/^0/~*31z^rl
尸(丫=。)=符=占,尸(y=i)=眷21_7
5oiZU5o120^-40
故所求分布列為
Y0123
17217
P
120404024
可得3如4+1><02*+3><>票
例12.(陜西省漢中市漢臺(tái)區(qū)2024屆高三學(xué)期第四次校際聯(lián)考數(shù)學(xué)試題)大學(xué)生劉銘去某工廠實(shí)習(xí),實(shí)習(xí)
結(jié)束時(shí)從自己制作的某種零件中隨機(jī)選取了10個(gè)樣品,測(cè)量每個(gè)零件的橫截面積(單位:mm2)和耗材量
(單位:mm3),得到如下數(shù)據(jù):
樣本號(hào)i12345678910總和
零件的橫截面積X,0.030.050.040.070.070.040.050.060.060.050.52
耗材量%0.240.400.230.550.500.340.350.450.430.413.9
10(10_2
并計(jì)算得?>比=0.2143,-I。x=1.4336乂0t
j=li=l
(1)估算劉銘同學(xué)制作的這種零件平均每個(gè)零件的橫截面積以及平均一個(gè)零件的耗材量;
(2)求劉銘同學(xué)制作的這種零件的橫截面積和耗材量的樣本相關(guān)系數(shù)(精確到0.01);
(3)劉銘同學(xué)測(cè)量了自己實(shí)習(xí)期制作的所有這種零件的橫截面積,并得到所有這種零件的橫截面積的和為
182mm2,若這種零件的耗材量和其橫截面積近似成正比,請(qǐng)幫劉銘計(jì)算一下他制作的零件的總耗材量的估
,71.49136?1.221
【解析】(1)樣本中10個(gè)這種零件的橫截面積的平均值》=芥=0.052,
樣本中10個(gè)這種零件的耗材量的平均值夕=芳=0.39,
由此可估算劉銘同學(xué)制作的這種零件平均每個(gè)零件的橫截面積為0.052mm2,
平均一個(gè)零件的耗材量為0.39mm3.
2%乂TO盯
0.2143-10x0.052x0.39
(2)r=4
fz2-io72V1.49136xl0~
i=l
1.151.15
0.94,
71,49136?1.221
這種零件的橫截面積和耗材量的樣本相關(guān)系數(shù)為0.94.
(3)設(shè)這種零件的總耗材量的估計(jì)值為rmn?,
又已知這種零件的耗材量和其橫截面積近似成正比,
0.052182,
二,=--->解得f=1365mm3,
0.39t
故這種零件的總耗材量的估計(jì)值為1365mm3.
例13.在一次抽樣調(diào)查中測(cè)得5個(gè)樣本點(diǎn),得到下表及散點(diǎn)圖.
X0.250.5124
y1612521
加
16-
14-
12-?
10-
8-
6~
4-
2-?
*
_______I___|____|_____]?
O1234X
⑴根據(jù)散點(diǎn)圖判斷y=a+&與了=c+hx-哪一個(gè)適宜作為y關(guān)于x的回歸方程;(給出判斷即可,不必說(shuō)明
理由)
(2)根據(jù)(1)的判斷結(jié)果試建立了與X的回歸方程;(計(jì)算結(jié)果保留整數(shù))
^x^-n-x-y^(x,.-x)(y,,-j)
參考公式:b=R,----------=-----------,a=y-bx
^xj-n-x2之伍-可②
z=li=\
【解析】(I)由題中散點(diǎn)圖可以判斷,y=c+左適宜作為V關(guān)于X的回歸方程;
(2)令f=x-,則>=。+〃,原數(shù)據(jù)變?yōu)?/p>
t4210.50.25
y1612521
由表可知V與t近似具有線性相關(guān)關(guān)系,計(jì)算得F=;=1.55,
_16+12+5+2+1
了=—5—=72,
「4x16+2x12+1x5+0.5x2+0.25x1-5x1.55x7.238.45,
42+22+12+0.52+0.252-5x1.5529.3
所以,c=y-la=7.2-4x1.55=1,則夕=由+1.
所以歹關(guān)于》的回歸方程是夕=2+1.
【過(guò)關(guān)測(cè)試】
一、單選題
1.對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得以下散點(diǎn)圖,關(guān)于其樣本相關(guān)系數(shù)的比較,下列結(jié)論正確的是()
3535
3030
2525
2020
1515
1010
55
0510152025303505101520253035
樣本相關(guān)系數(shù)為小樣本相關(guān)系數(shù)為上
3535
3030
2525
2020
1515
1010
55
0510152025303505101520253035
樣本相關(guān)系數(shù)為-3樣本相關(guān)系數(shù)為-4
A.r2<r4<0<r3<rIB.r4<r2<0<rx<r3
C.〃<馬<0<々"D.弓<q<0"<4
【答案】B
【解析】由給出的四組數(shù)據(jù)的散點(diǎn)圖可以看出,
左側(cè)兩圖是正相關(guān),樣本相關(guān)系數(shù)大于0,則4〉。,4〉。,
右側(cè)兩圖是負(fù)相關(guān),樣本相關(guān)系數(shù)小于0,則々<0,〃<0,
下方兩圖的點(diǎn)相對(duì)更加集中,所以相關(guān)性較強(qiáng),所以々接近于1,G接近于一1,
上方兩圖的點(diǎn)相對(duì)分散一些,所以相關(guān)性較弱,所以彳和4比較接近0,
由止匕可得q<4<0<4<4.
故選:B.
2.(上海市普陀區(qū)桃浦中學(xué)2024屆高三學(xué)期期末數(shù)學(xué)試題)下列命題中,真命題的是()
A.若回歸方程P=-2x+0.1,則變量歹與1負(fù)相關(guān)
B.線性回歸分析中決定系數(shù)用來(lái)刻畫回歸的效果,若該值越小,則模型的擬合效果越好
C.若樣本數(shù)據(jù)須,馬,???,/()的方差為2,則數(shù)據(jù)3石,3%2,…J%。的方差9
D.若P(/)與尸(3)獨(dú)立,則P(/uB)=P(4|5)P(4)
【答案】A
【解析】對(duì)于A,回歸方程為>=-2x+0.1,又???6=—0.2<0,所以變量歹與“負(fù)相關(guān),故A正確,
對(duì)于B,線性回歸分析中決定系數(shù)改用來(lái)刻畫回歸的效果,若及2值越大,說(shuō)明模型的擬合效果越好,故B
錯(cuò)誤.
對(duì)于C,若樣本數(shù)據(jù)石,%2,…,再oo的方差為2,則數(shù)據(jù)3再,3%,…,3/o的方差32x2=18,故C錯(cuò)誤,
對(duì)于D,擲一枚骰子,設(shè)事件/:點(diǎn)數(shù)小于3,則p(/)=;;
事件8:點(diǎn)數(shù)為偶數(shù),則尸(2)=:,尸(")=:,
所以尸(4B)=P(A)P⑻,即尸⑷與P(B)獨(dú)立,
又尸(4|8)=與卻=q=(,P(AUB)=^P(A\B)P(A),故D錯(cuò)誤.
9(8)36
,'2
故選:A.
3.(內(nèi)蒙古呼和浩特市2024屆高三學(xué)期學(xué)業(yè)質(zhì)量監(jiān)測(cè)數(shù)學(xué)試題)用模型了=優(yōu)底擬合一組數(shù)據(jù)組
(x"J(i=l,2,3,…,7),其中%+%+…+5=14,設(shè)2=lny,得變換后的線性回歸方程為]=x+l,則
%%,,,%=()
A.e35B.e21C.35D.21
【答案】B
【解析】由題意得1=網(wǎng)+%;…+號(hào)=2,
故z=x+l=3,
BPInj/j+Iny2+—I-\ny7=3x7=21,
故In5%…%)=21,解得必力…%=e2:
故選:B
4.(上海市浦東新區(qū)2024屆高三學(xué)期期中教學(xué)質(zhì)量檢測(cè)數(shù)學(xué)試卷)通過(guò)隨機(jī)抽樣,我們繪制了如圖所示的
某種商品每千克價(jià)格(單位:百元)與該商品消費(fèi)者年需求量(單位:千克)的散點(diǎn)圖.若去掉圖中右下方
246810每千克價(jià)格/百元
消費(fèi)者年需求量與商品每千克價(jià)格的散點(diǎn)圖
A.“每千克價(jià)格”與“年需求量”這兩個(gè)變量由負(fù)相關(guān)變?yōu)檎嚓P(guān)
B.“每千克價(jià)格”與“年需求量”這兩個(gè)變量的線性相關(guān)程度不變
C.“每千克價(jià)格”與“年需求量”這兩個(gè)變量的線性相關(guān)系數(shù)變大
D.“每千克價(jià)格”與“年需求量”這兩個(gè)變量的線性相關(guān)系數(shù)變小
【答案】D
【解析】對(duì)于A:去掉圖中右下方的點(diǎn)A后,根據(jù)圖象,兩個(gè)變量還是負(fù)相關(guān),A錯(cuò)誤;
對(duì)于BCD:去掉圖中右下方的點(diǎn)A后,相對(duì)來(lái)說(shuō)數(shù)據(jù)會(huì)集中,相關(guān)程度會(huì)更高,
但因?yàn)槭秦?fù)相關(guān),相關(guān)系數(shù)會(huì)更接近-1線性相關(guān)系數(shù)會(huì)變小,故D正確,BC錯(cuò)誤.
故選:D.
二、多選題
5.(2024屆廣東省湛江市高三一模數(shù)學(xué)試題)某養(yǎng)老院有110名老人,經(jīng)過(guò)一年的跟蹤調(diào)查,過(guò)去的一年
中他們是否患過(guò)某流行疾病和性別的相關(guān)數(shù)據(jù)如下表所示:
是否患過(guò)某流行疾病
性別合計(jì)
患過(guò)該疾病未患過(guò)該疾病
男a=20ba+b
女Cd=50c+d
合計(jì)a+c80110
下列說(shuō)法正確的有()
n(ad-bcY
參考公式:z2其中n=a+b+c+d.
(a+6)(c+d)(a+c)G+d)
附表:
a0.10.050.0250.010.001
%2.7063.8415.0246.63510.828
a+bc+d
B.力2>6.635
C.根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),認(rèn)為是否患過(guò)該流行疾病與性別有關(guān)聯(lián)
D.根據(jù)小概率值夕=0.01的獨(dú)立性檢驗(yàn),沒有充分的證據(jù)推斷是否患過(guò)該流行疾病與性別有關(guān)聯(lián)
【答案】ABC
【解析】根據(jù)列聯(lián)表中的數(shù)據(jù)可求得a=20,6=30,c=10,d=50;
對(duì)于A,代入計(jì)算可得一-=->——-=正確;
a+b5c+a6
對(duì)于B,經(jīng)計(jì)算可得力2=U°x(20x50-30x10)2-7,486>6,635-可得B正確;
30x80x50x60
對(duì)于CD,結(jié)合附表數(shù)值以及獨(dú)立性檢驗(yàn)的實(shí)際意義,可認(rèn)為根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),認(rèn)為是
否患過(guò)該流行疾病與性別有關(guān)聯(lián),即C正確,D錯(cuò)誤;
故選:ABC
6.(河北省滄州市泊頭市聯(lián)考2024屆高三學(xué)期高考模擬考試數(shù)學(xué)試題)下表是某地從2019年至2023年能
源消費(fèi)總量近似值7(單位:千萬(wàn)噸標(biāo)準(zhǔn)煤)的數(shù)據(jù)表:
年份20192020202120222023
年份代號(hào)X12345
能源消費(fèi)總量近似值了(單位:千萬(wàn)噸標(biāo)準(zhǔn)煤)44.244.646.247.850.8
以X為解釋變量,y為響應(yīng)變量,若以戈=仇尤+4為回歸方程,則決定系數(shù)&y0.9298,若以
為回歸方程,則咫。0.9965,則下面結(jié)論中正確的有()
A.變量x和變量y的樣本相關(guān)系數(shù)為正數(shù)
B.%=仇%2+出工+。2比%=4工+%的擬合效果好
C.由回歸方程可準(zhǔn)確預(yù)測(cè)2024年的能源消費(fèi)總量
D.y=3b1+ax
【答案】ABD
【解析】對(duì)于A選項(xiàng):隨著變量x的增加,變量了也在增加,故變量V和變量x成正相關(guān),即樣本相關(guān)系數(shù)
為正數(shù),正確;
對(duì)于B選項(xiàng):因?yàn)闊o(wú)>庶,故%=為,+%》+。2比%=¥+4的擬合效果好,正確;
對(duì)于C選項(xiàng):回歸方程可預(yù)測(cè)2024年的能源消費(fèi)總量,不可準(zhǔn)確預(yù)測(cè),錯(cuò)誤;
對(duì)于D選項(xiàng):由回歸方程必過(guò)樣本中心點(diǎn),可知歹=34+%,正確.
故選:ABD.
7.(FHsxl225yll36)(多選)某學(xué)校為了調(diào)查學(xué)生對(duì)“只要學(xué)習(xí)夠努力,成績(jī)一定有奇跡”這句話的認(rèn)可程度,
隨機(jī)調(diào)查了90名本校高一、高二的學(xué)生,得到如下列聯(lián)表.用樣本估計(jì)總體,則下列說(shuō)法正確的是(參考數(shù)
據(jù):-不,n=a+b+c+d,P(x2>6.635)=0.010,P(Z2>10.828)=0.001)()
(a+o)(c+a)(a+c)(o+a)
認(rèn)可不認(rèn)可總計(jì)
高一202040
高二401050
總計(jì)603090
A.高一高二大約有66.7%的學(xué)生認(rèn)可這句話
B.高一高二大約有99%的學(xué)生認(rèn)可這句話
C.依據(jù)a=0.01的獨(dú)立性檢驗(yàn),認(rèn)為學(xué)生對(duì)這句話認(rèn)可與否與年級(jí)有關(guān)
D.在犯錯(cuò)誤的概率不超過(guò)0.01的前提下,認(rèn)為學(xué)生對(duì)這句話認(rèn)可與否與年級(jí)無(wú)關(guān)
【答案】AC
【解析】隨機(jī)調(diào)查了90名學(xué)生,其中一共有60名學(xué)生認(rèn)可,所以認(rèn)可率大約為66.7%,1=加.:
abcdacba
90x20x1040x202
=9.因?yàn)?.635<9<10.828,故C正確,D錯(cuò)誤.故選AC.
40x50x60x30
8.(安徽省蕪湖市安徽師范大學(xué)附屬中學(xué)2024屆高三第二次模擬考試數(shù)學(xué)試題)已知由樣本數(shù)據(jù)
2,3,…,10)組成的一個(gè)樣本,得到回歸直線方程為,=r+3,且1=4.剔除一個(gè)偏離直線較大的異常
點(diǎn)(-5,-1)后,得到新的回歸直線經(jīng)過(guò)點(diǎn)(6,-4).則下列說(shuō)法正確的是
A.相關(guān)變量x,y具有正相關(guān)關(guān)系
B.剔除該異常點(diǎn)后,樣本相關(guān)系數(shù)的絕對(duì)值變大
C.剔除該異常點(diǎn)后的回歸直線方程經(jīng)過(guò)點(diǎn)(5,-1)
D.剔除該異常點(diǎn)后,隨x值增加相關(guān)變量y值減小速度變小
【答案】BC
【解析】依題意,原樣本中,1=T+3=-l,
剔除一個(gè)偏離直線較大的異常點(diǎn)(-5,-1)后,新樣本中,p=4xl0-(-5)=5p=-lxl0-(-l)=_b
因此剔除該異常點(diǎn)后的回歸直線方程經(jīng)過(guò)點(diǎn)(5,-1),C正確;
由新的回歸直線經(jīng)過(guò)點(diǎn)(6,-4),得新的回歸直線斜率為二=新,因此相關(guān)變量x,y具有負(fù)相關(guān)關(guān)系,
6-5
A錯(cuò)誤;
又則剔除該異常點(diǎn)后,隨x值增加相關(guān)變量y值減小速度變大,D錯(cuò)誤;
由剔除的是偏離直線較大的異常點(diǎn),得剔除該點(diǎn)后,新樣本數(shù)據(jù)的線性相關(guān)程度變強(qiáng),即樣本相關(guān)系數(shù)的
絕對(duì)值變大,B正確.
故選:BC
9.(湘豫名校聯(lián)考2024年2月高三第一次模擬考試數(shù)學(xué)試題)下列說(shuō)法中,正確的是()
A.設(shè)有一個(gè)經(jīng)驗(yàn)回歸方程為?=1-2》,變量x增加1個(gè)單位時(shí),j)平均增加2個(gè)單位
B.已知隨機(jī)變量自?N(0,,),若尸C>2)=0.2,則尸(一24442)=0.6
C.兩組樣本數(shù)據(jù)x,,x2,x3,x4和%,%,力,乂的方差分別為s;,si.若已知%+%=10且無(wú),.<%。=1,2,3,4),
則S:=
D.已知一系列樣本點(diǎn)(x,,%)(z,=l,2,3,…)的經(jīng)驗(yàn)回歸方程為夕=3尤+3,若樣本點(diǎn)⑺,3)與(2,〃)的殘差
相等,則3刃+〃=10
【答案】BC
【解析】若有一個(gè)經(jīng)驗(yàn)回歸方程f=l-2x,隨著x的增大,夕會(huì)減小,A錯(cuò)誤;
曲線關(guān)于x=0對(duì)稱,因?yàn)槭?>2)=0.2,所以尸代<-2)=0.2,
所以尸(_2Vg42)=l—/片>2)_尸?<_2)=0.6,B正確;
141414141
=i"=£,所以元
因?yàn)槠?N4tM+7=z/+i5>,=a
Z=1""Z=1'?i='=1l'i=l'
2
4
x;—2X]X+x之+xj—2X2X+x之+…+%j—2X4X+x2
4
x;+%2+x;+x:-(2/+212+29+2%4)x_2
4
_xf+xf+xf+%4_2,-2_+-^2+x3+x4-2
------------------------ZoA-TX----------------X,
44
同理可得聞=仝”一干
(10-X)2+(10-X)2+(10-X)2+(10-X)2
1234-(10-x)2
4
400—20(%]+%2+、3+%4)+x;+x;+x;+%:
-(10-x)2
4
—廣+*。。+2-丁丁』」,
故s:=s;,C正確;
經(jīng)驗(yàn)回歸方程為,=3x+&,且樣本點(diǎn)(m,3)與(2,n)的殘差相等,
貝!|3-(3加+&)=〃一(6+&)=>3機(jī)+〃=9,D錯(cuò)誤.
故選:BC.
10.(河南省部分重點(diǎn)中學(xué)2024屆高三學(xué)期2月質(zhì)量檢測(cè)數(shù)學(xué)試題)已知變量尤/之間的經(jīng)驗(yàn)回歸方程為
y^~x+a,且變量xj的數(shù)據(jù)如下表所示:
6
X5681214
y108651
則下列說(shuō)法正確的是()
A.變量%》之間負(fù)相關(guān)B.5=13
C.當(dāng)x=3時(shí),可估計(jì)V的值為11D.當(dāng)x=8時(shí),殘差為-1
【答案】AC
【解析】對(duì)于A選項(xiàng),由-1■<(),可得變量X/之間負(fù)相關(guān),故A選項(xiàng)正確;
6
_1_1
對(duì)于B選項(xiàng),x=
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全國(guó)甲卷2024年高考語(yǔ)文真題含解析
- 湖北卷2024年高考化學(xué)真題含解析
- 紐扣式電池制作工藝與組裝技術(shù)培訓(xùn)
- 確保通過(guò)中級(jí)會(huì)計(jì)的試題及答案
- 中班安全信息課件
- 中級(jí)審計(jì)師考生在職學(xué)習(xí)試題及答案
- 《騰訊課堂解決方案》課件
- 化工廠安全生產(chǎn)
- 儀式流程管理會(huì)計(jì)
- 《項(xiàng)目經(jīng)理教程》課件
- 污水管網(wǎng)工程項(xiàng)目方案資料目錄清單及其表格
- 第1講:二元一次方程組培優(yōu)
- 《信息安全技術(shù)數(shù)據(jù)安全能力成熟度模型》
- 建筑材料采購(gòu)?fù)稑?biāo)方案(技術(shù)標(biāo))
- 2024年山東省春季高考技能考試-汽車專業(yè)備考試題庫(kù)(濃縮500題)
- 港口建設(shè)項(xiàng)目風(fēng)險(xiǎn)評(píng)估報(bào)告
- 傳媒公司主播離職協(xié)議書
- 環(huán)氧樹脂畢業(yè)設(shè)計(jì)
- 水電廠汛期安全培訓(xùn)
- 第四單元 舞蹈音樂(lè)天地-二拍子 四拍子舞曲 童聲合唱《閑聊波爾卡》 課件 2022-2023學(xué)年粵教版初中音樂(lè)九年級(jí)下冊(cè)
- 辦稅服務(wù)外包投標(biāo)方案(完整版)
評(píng)論
0/150
提交評(píng)論