




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第三節(jié)成對數(shù)據(jù)的統(tǒng)計分析
第1課時變量間的相關(guān)關(guān)系及回歸模型
課標解讀考向預(yù)測
1.結(jié)合具體實例,了解一元線性回歸模型的含
預(yù)計2025年高考,變量間的相關(guān)關(guān)系、回歸
義,了解模型中參數(shù)的統(tǒng)計意義,了解最小
模型主要以應(yīng)用題的方式出現(xiàn),需要在復(fù)雜
二乘原理,掌握一元線性回歸模型中參數(shù)的
的題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模型,
最小二乘估計方法,會使用相關(guān)的統(tǒng)計軟件.
并且運用數(shù)學(xué)模型解決實際問題,考查分析
2.針對實際問題,會用一元線性回歸模型進行
問題和處理數(shù)據(jù)的能力.
預(yù)測.
必備知識——強基礎(chǔ)
知識梳理
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系
兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱
為相關(guān)關(guān)系.
⑵散點圖
將各數(shù)據(jù)在平面直角坐標系中的對應(yīng)點畫出來,得到表示兩個變量的一組數(shù)據(jù)的圖形,這樣
的圖形叫做回散點圖.利用散點圖,可以判斷兩個變量是否相關(guān),相關(guān)時是正相關(guān)還是負
相關(guān).
⑶正相關(guān)和負相關(guān)
①當一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱這兩個變量畫
正相關(guān).
②負相關(guān):當一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減小的趨勢,則稱這兩個變量
廚負相關(guān).
(4)線性相關(guān)
①一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在畫一條直線附近,我
們就稱這兩個變量線性相關(guān).
②一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相
關(guān)或曲線相關(guān).
2.樣本相關(guān)系數(shù)
(1)相關(guān)系數(shù)r的計算
變量尤和變量y的樣本相關(guān)系數(shù)r的計算公式如下:
z孫一,龍y
___________________________
―r>iz_r'i二
A/Z焉fx2yZy—ny2
(2)相關(guān)系數(shù)r的性質(zhì)
①當r>0時,稱成對樣本數(shù)據(jù)畫歪相關(guān);當K0時,稱成對樣本數(shù)據(jù)畫負相關(guān);當r=0
時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)r的取值范圍為畫「一1,11.
當川越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越畫強;
當卜|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越畫弱.
3.一元線性回歸模型
經(jīng)驗回歸方程與最小二乘法
我們將£=源+)稱為y關(guān)于X的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形
AA
稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的b,。叫做6,a的最
小二乘估計,其中
<n——n__
Z%)(%—y)y,xzyz—nTTV
b=J——z-----------------------=回^~~—.
qZ(即-x)2y,^~nx~-
i=l尸]
A—A——
<a=y—bx.
4.殘差與殘差分析
_____A
(1)殘差:對于響應(yīng)變量匕通過觀測得到的數(shù)據(jù)稱為萬口觀測值,通過經(jīng)驗回歸方程得到的y
稱為何預(yù)測值,向觀測值減去畫預(yù)測值稱為殘差.
(2)殘差分析:殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,
以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.
(3)刻畫回歸效果的方式
①殘差圖法
作圖時縱坐標為殘差,橫坐標為自變量無,這樣作出的圖形稱為殘差圖.在殘差圖中,殘差
點比較均勻地分布在以取值為0的橫軸為對稱軸的水平的帶狀區(qū)域內(nèi),說明選用的模型比較
合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高.
②殘差平方和法
nA_____
殘差平方和為2⑴一加2,殘差平方和回越小,模型擬合效果越好.
③利用決定系數(shù)F刻畫回歸效果
nA
X(M—8)2
R2=l—彳-----二一,改越回大,模型擬合效果越好;R2越回小,模型擬合效果越差.
23一y產(chǎn)
常用
八/\--
1.求解經(jīng)驗回歸方程的關(guān)鍵是確定回歸系數(shù)a,b,應(yīng)充分利用回歸直線過點(x,y).
2.根據(jù)經(jīng)驗回歸方程計算的;值,僅是一個預(yù)測值,不是真實發(fā)生的值.
診斷自測
1.概念辨析(正確的打“小,錯誤的打“X”)
AAAA
(1)經(jīng)驗回歸方程中,若〃<0,則變量%和y負相關(guān).()
AAA
(2)經(jīng)驗回歸直線至少經(jīng)過點(xi,yi),⑴,yi),(xn,y”)中的一個點.()
(3)樣本相關(guān)系數(shù)的絕對值越接近1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強.()
(4)殘差平方和越大,線性回歸模型的擬合效果越好.()
答案(l)x(2)x(3)4(4)x
2.小題熱身
(1)甲、乙、丙、丁四位同學(xué)在建立變量尤,y的回歸模型時,分別選擇了4種不同模型,計
算可得它們的F分別如下表:
X甲乙丙T
R20.980.780.500.85
建立的回歸模型擬合效果最好的是()
A.甲B.乙
C.丙D.丁
答案A
解析此越大,表示回歸模型的擬合效果越好.
(2)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:。C)的關(guān)系,在20個
不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(如y;)0=l-2,20)得到下面的散點
圖
0%
8%
發(fā)
6%
芽
率4%
2%
O
由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中,最適宜作為發(fā)芽率〉和溫度
尤的回歸方程類型的是()
A.y=a~\~bxB.y=a+Z?x2
C.y—a-\~bexD.y—a^rblnx
答案D
解析由散點圖分布可知,散點圖分布在一個對數(shù)型函數(shù)圖象的附近,因此最適宜作為發(fā)芽
率y和溫度x的回歸方程類型的是y=a+blnx.故選D.
(3)(人教A選擇性必修第三冊復(fù)習(xí)參考題8T2改編)在一元線性回歸模型Y^bx+a+e中,下
列說法正確的是()
A.y=Zzx+a+e是一次函數(shù)
B.響應(yīng)變量Y是由解釋變量x唯一確定的
c.響應(yīng)變量y除了受解釋變量尤的影響外,可能還受到其他因素的影響,這些因素會導(dǎo)致
隨機誤差e的產(chǎn)生
D.隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e的產(chǎn)生
答案C
解析對于A,一元線性回歸模型Y=bx+a+e中,方程表示的不是確定性關(guān)系,因此不是
一次函數(shù),所以A錯誤;對于B,響應(yīng)變量y不是由解釋變量X唯一確定的,所以B錯誤;
對于c,響應(yīng)變量y除了受解釋變量X的影響外,可能還受到其他因素的影響,這些因素會
導(dǎo)致隨機誤差e的產(chǎn)生,所以C正確;對于D,隨機誤差是不能避免的,只能將誤差縮小,
所以D錯誤.
(4)若某商品的廣告費支出x(單位:萬元)與銷售額M單位:萬元)之間有如下表所示的對應(yīng)數(shù)
據(jù):
X24568
y2040607080
AA
根據(jù)表中數(shù)據(jù),利用最小二乘法求得y關(guān)于x的經(jīng)驗回歸方程為y=6尤+1.5,當廣告費支出
為10萬元時,銷售額的估計值為萬元.
答案106.5
—1—1
解析X=§x(2+4+5+6+8)=5,y=m<(20+40+60+70+80)=54,所以樣本中心為(5,
AAAA
54),將其代入經(jīng)驗回歸方程y=6x+1.5中,有54=56+1.5,解得6=10.5,所以經(jīng)驗回歸方
AA
程為y=10.5x+1.5,當x=10時,10.5x10+1.5=106.5.
考點探究一提素養(yǎng)
考點一變量間相關(guān)關(guān)系的判斷
例1(1)對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確
的是()
-~~~~~o1~~~~-~
51015202530355101520253035
樣本相關(guān)系數(shù)為小樣本相關(guān)系數(shù)為「2
①②
101520253035101520253035
樣本相關(guān)系數(shù)為n樣本相關(guān)系數(shù)為小
③④
A.r2<-4<0<廠3<r1B.F4<r2<0<ri<r3
C.廠4<廠2〈0〈廠3<r1D.r2<「4<0<r1<-3
答案A
解析由散點圖知圖①與圖③是正相關(guān),故r>0,廠3>0,圖②與圖④是負相關(guān),故々<0,r4<0,
且圖①與圖②的樣本點集中在一條直線附近,因此尸2<廠4<0<廠3<小
⑵(2023?河北邢臺階段考試)已知廠1表示變量X與y之間的線性相關(guān)系數(shù),廠2表示變量。與V
之間的線性相關(guān)系數(shù),且ri=0.837,72=一0.957,則()
A.變量x與y之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性強于u與丫之間的相關(guān)性
B,變量x與y之間呈負相關(guān)關(guān)系,且x與y之間的相關(guān)性強于u與v之間的相關(guān)性
c.變量u與丫之間呈負相關(guān)關(guān)系,且x與丫之間的相關(guān)性弱于。與v之間的相關(guān)性
D.變量u與v之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性弱于u與丫之間的相關(guān)性
答案c
解析因為線性相關(guān)系數(shù)r1=0.837,廠2=—0.957,所以變量X與丫之間呈正相關(guān)關(guān)系,變量
。與丫之間呈負相關(guān)關(guān)系,且X與V之間的相關(guān)性弱于U與卜之間的相關(guān)性.故選C.
【通性通法】
判斷相關(guān)關(guān)系的方法
(1)散點圖法:如果樣本點的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;
如果樣本點的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.
⑵樣本相關(guān)系數(shù):當廠>0時,正相關(guān);當廠<0時,負相關(guān);IH越接近于1,相關(guān)性越強.
AA
(3)經(jīng)驗回歸方程:當b>0時,正相關(guān);當6<0時,負相關(guān).
【鞏固遷移】
1.在一組樣本數(shù)據(jù)(尤1,J1),(尤2,>2),…,(xn,yn)(n^2,XI,X2,X”不全相等)的散點圖
中,若所有樣本點(知刈。=1,2,”)都在直線y=—5+1上,則這組樣本數(shù)據(jù)的樣本
相關(guān)系數(shù)為()
A.-1B.0
C.一;D.1
答案A
解析因為所有樣本點都在直線y=一5+1上,呈現(xiàn)完全負相關(guān),所以樣本相關(guān)系數(shù)為一1.
2.(2023?天津高考)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示.其中相關(guān)系數(shù)r=
0.8245,下列說法正確的是()
A.花瓣長度和花萼長度沒有相關(guān)性
B.花瓣長度和花萼長度呈負相關(guān)
C.花瓣長度和花萼長度呈正相關(guān)
D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245
答案C
解析因為相關(guān)系數(shù)r=0.8245>0.75,所以花瓣長度和花萼長度的相關(guān)性較強,并且呈正相
關(guān),所以A,B錯誤,C正確;因為相關(guān)系數(shù)與樣本的數(shù)據(jù)有關(guān),所以當樣本發(fā)生變化時,
相關(guān)系數(shù)也可能會發(fā)生變化,所以D錯誤.故選C.
考點二樣本相關(guān)系數(shù)、決定系數(shù)的應(yīng)用
例2(2022.全國乙卷)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山,為估計一林
區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:n?)
和材積量(單位:nf),得到如下數(shù)據(jù):
樣本
12345678910總和
號i
根部
橫截0.040.060.040.080.080.050.050.070.070.060.6
面積
Xi
材積
0.250.400.220.540.510.340.360.460.420.403.9
量,
101010
并計算得£蠟=0.038,2必=1,6158,2擊y=0.2474.
i=li=\i=\
(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;
(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);
(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和
為186nl2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹
木的總材積量的估計值.
n——
£(爸一x)(%—y)
附:相關(guān)系數(shù)「=I?,
22
A/Z(尤「無)Zy)
\lf=li=l
^1.896^1.377.
解(1)設(shè)這種樹木平均一棵的根部橫截面積為最,平均一棵的材積量為,,
貝?x=*=0.06,y=得=0.39.
10______
2孫一10工y
(2)廠=Iioio
\(X^-io72)(2a-10丁)
\1z=lz=lJ
____________0.2474—10x0.06x0.39__________
-4(0.038-10x0.062)x(1.6158—10x0.392)
_0.01340昨4一0.0134
40.002x0.09480.01可1.8960.01377'"
vnQQ
(3)設(shè)所有這種樹木的根部橫截面積總和為X,總材積量為Y,則5=工r,故¥=儒義186=
I——U.UO
y
1209(m3).
【通性通法】
經(jīng)驗回歸方程的擬合效果,可以利用相關(guān)系數(shù)r判斷,當|〃|越趨近于1時,兩變量的線性相
關(guān)性越強.或利用決定系數(shù)R2判斷,R2越大,擬合效果越好.
【鞏固遷移】
3.我國機床行業(yè)核心零部件對外依存度較高,我國整機配套的中高檔功能部件大量依賴進口,
根據(jù)中國機床工具工業(yè)協(xié)會的數(shù)據(jù),國內(nèi)高檔系統(tǒng)自給率不到10%,約90%依賴進口.因此,
迅速提高國產(chǎn)數(shù)控機床功能部件制造水平,加快國產(chǎn)數(shù)控機床功能部件產(chǎn)業(yè)化進程至關(guān)重
要.通過對某機械上市公司近幾年的年報公布的研發(fā)費用x(單位:億元)與產(chǎn)品的直接收益
M單位:億元)的數(shù)據(jù)進行統(tǒng)計,得到下表:
年份2016201720182019202020212022
234681013
y15222740485460
.A
根據(jù)數(shù)據(jù),可建立y關(guān)于x的兩個回歸模型:模型①:y=4.1x+10.9;模型②:y=21.3C—
14.4.
(1)根據(jù)表格中的數(shù)據(jù),分別求出模型①,②的決定系數(shù)代的大小(結(jié)果保留三位有效數(shù)字);
(2)(i)根據(jù)(1)選擇擬合精度更高、更可靠的模型;
(ii)若2023年該公司計劃投入研發(fā)費用17億元,使用(i)中的模型預(yù)測可為該公司帶來多少
直接收益?
回歸模型模型①模型②
7A
Z(yi-yd279.1318.86
i=l
nA
Z2_
附:R2=I—---------=—,
Z(M—y)2
i=l
解(1)因為
-15+22+27+40+48+54+60
y=y=38,
7_
所以Z(yi-y)2=232+162+ll2+22+102+162+222=1750,
i=l
7A
E(Mf)2
則模型①的決定系數(shù)出=1一早-----二一=1一卷煉0.955,
Z⑶一…"’
z-1
7A
2(?-%)2
模型②的決定系數(shù)a=1—〒--------二一=1一號畀0.989.
Z(M一2”
/=1
(2)(i)由⑴知,豚<感所以模型②的擬合精度更高、更可靠.
AA
(ii)由經(jīng)驗回歸方程》=21.35—14.4,可得當x=17時,y=21.3寸萬一14.4M2.93,
所以若2023年該公司計劃投入研發(fā)費用17億元,大約可為該公司帶來72.93億元的直接收
益.
考點三回歸分析(多考向探究)
考向1一元線性回歸模型
例3已知某綠豆新品種發(fā)芽的適宜溫度在6?22℃之間,一農(nóng)學(xué)實驗室研究人員為研究溫
度x(單位:。C)與綠豆新品種發(fā)芽數(shù)y(單位:顆)之間的關(guān)系,每組選取了成熟種子50顆,分
別在對應(yīng)的8?14℃的溫度環(huán)境下進行實驗,得到如下散點圖:
_7__
其中y=24,.Z,x)?-y)=70,
7_
."8-4=176.
1=1
(1)運用相關(guān)系數(shù)進行分析說明,是否可以用線性回歸模型擬合y與x的關(guān)系?
AAA
(2)求出y關(guān)于x的經(jīng)驗回歸方程并預(yù)測在19°C的溫度下,種子的發(fā)芽顆數(shù).
參考公式:相關(guān)系數(shù)
n—一
,工(汨一無)(y,-y)
z^lAAAA
經(jīng)驗回歸方程y=+其中人=
2
A/.X.(沏一無)22(y,—y)
\J1=11=1
n——
卷](即一x)A_A_
z,Q=y-bx.
za-I)2
Z=1
參考數(shù)據(jù):^77-8.77.
——i
解(1)根據(jù)題意,得x=7X(8+9+10+11+12+13+14)=11.
7_
2(X,—X)2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2
i=l
=28,
_7__________
2
(xz—x)X(%一>)2=^28x176=8"\/7^[70.16.
z=l
因而相關(guān)系數(shù)r=區(qū)港0998.
21(XLX)2R
由于|廠卜0.998很接近1,
,可以用線性回歸模型擬合y與x的關(guān)系.
A57
關(guān)于x的經(jīng)驗回歸方程為y=]x—
A57
若x=19,則y=]xl9—]=44顆,
在19℃的溫度下,預(yù)測種子的發(fā)芽顆數(shù)為44.
【通性通法】
求經(jīng)驗回歸方程的步驟
計算出手陷靖,鼻須%或
步驟一>—?_產(chǎn)
、-?.(xi-x)(y,-y),斗(即-動2的值
1=11=1
步驟己〉—利用公式計算8,b
步驟。一寫出經(jīng)驗回歸方程k嬴+8
【鞏固遷移】
4.(2023?安徽馬鞍山第三次教學(xué)質(zhì)量監(jiān)測)為了研究某果園的一種果樹的產(chǎn)量與種植密度的關(guān)
系,某中學(xué)的數(shù)學(xué)興趣小組在該果園選取了一塊種植區(qū)域進行了統(tǒng)計調(diào)查,他們將每株果樹
與其直線距離不超過1米的果樹株數(shù)x記為其密度,在記錄了該種植區(qū)域內(nèi)每株果樹的密度
后,從中選取密度為0,1,2,3,4的果樹,統(tǒng)計其產(chǎn)量的平均值y(單位:kg),得到如下統(tǒng)
計表:
(1)小組成員甲認為y與尤有很強的線性相關(guān)關(guān)系,請你幫他利用最小二乘法求出y關(guān)于x的
AAA
經(jīng)驗回歸方程y=6x+a;
⑵小組成員乙提出:若利用經(jīng)驗回歸方程計算的平均產(chǎn)量的估計值:與實際的平均產(chǎn)量
1nA
〃€1^*)滿足/21%一訓(xùn)>。.5,則應(yīng)該修正模型,尋找更合適的函數(shù)擬合%與y的關(guān)
系.統(tǒng)計知種植密度分別為5,6的果樹的平均產(chǎn)量為5.5kg、4.4kg,請你以這七組數(shù)據(jù)為
依據(jù)判斷(1)中得到的經(jīng)驗回歸方程是否需要修正?
n___
A£孫一"龍〉A(chǔ)_A_
參考公式:b=r-----——,a=y-bx.
2君一〃X2
i=l
__55_
解(l)x=2,y=11,Z%i%=93,Z焉一5%2=10,
i=l/=!
5
故~5二=1.7,。=ybx=14.4,
Z裔一5x2
i=\
A
所以經(jīng)驗回歸方程為y=-1.7x+14.4.
AA
(2)令%=0,1,2,3,4,5,6,代入y=—1.7x+14.4,分別得|y—y|=0.6,0,7,0,0.3,0.4,
0.4,0.2,
17A?6
從而721M?一訓(xùn)=亍<0?5,故不需要修正.
考向2非線性回歸模型
例4某工廠生產(chǎn)一種產(chǎn)品,從該種產(chǎn)品中隨機抽取6件合格產(chǎn)品,測得數(shù)據(jù)如下:
尺寸x/mm384858687888
質(zhì)量y/g16.818.820.722.42425.5
(1)若按照檢測標準,合格產(chǎn)品的質(zhì)量y與尺寸x之間近似滿足關(guān)系式y(tǒng)=o/(c,d為大于0
的常數(shù)),求y關(guān)于尤的經(jīng)驗回歸方程;
(2)已知合格產(chǎn)品的收益z(單位:千元)與合格產(chǎn)品尺寸和質(zhì)量的關(guān)系為z=2y—0.32x,根據(jù)(1)
中經(jīng)驗回歸方程分析,當合格產(chǎn)品的尺寸x約為何值時(結(jié)果用整數(shù)表示),收益z的預(yù)報值最
大?
6666
附:①參考數(shù)據(jù):2(In燈lny?=75.3,£(lnx,)=24.6,£(lny,)=18.3,g(Inx,)2=101.4.
i=li=li=li=l
AAA
②參考公式:對于樣本⑴,⑷(i=l,2,n),其經(jīng)驗回歸直線"=6v+a的斜率和截距的最
n一一n___
A£X(%—v)(%一u)V.77.ViU-nvuA一A——
小二乘估計公式分別為--------------------=------Z-,。=u—bv,e-2.7182.
E(均一v)2ZW—〃v2
i=li=l
解(1)對y=c/(c,d>0)兩邊取自然對數(shù)得lny=lnc+Mnx.
AAAAA
令%=lnx"Ui=lnyi,則〃=血+〃,其中〃=lnc.
根據(jù)所給統(tǒng)計量及最小二乘估計公式得
6_____
2刈的一6vu
%=氣----
Xw-6v2
Z=1
66
z(lux/)(In
6
i=\i=1
z(Inwin%)
i=l6
[Z(InXi)]2
6
£(In汨)21=1_____________
6
Z=1
75.3-24.6x18.3^60.271
101.4-24.6M=O54=2,
66
Z(Iny)Z(InXi)
AA——A
Z=1i=\18.3124.6
a=u-dVdx
66^~-5x3=1,
AAA
又〃=lnc=\,所以c=e,
A1
所以y關(guān)于x的經(jīng)驗回歸方程為y=e,,2
A1A
⑵由⑴得y=e「,所以z=26&-0.32x=-0.32(5)2+2班.
pA
令則當時,z取得最大值,
此時X=/U72,
所以當合格產(chǎn)品的尺寸x約為72時,收益z的預(yù)報值最大.
【通性通法】
非線性回歸分析的步驟
【鞏固遷移】
5.(2024?淄博診斷)小葉紫檀是珍稀樹種,因其木質(zhì)好備受玩家喜愛.其幼苗從觀察之日起,
第x天的高度為ycm,測得數(shù)據(jù)如下:
Xi4916253649
y0479111213
數(shù)據(jù)的散點圖如圖所示:
y
124
O
8
6
4
2
OO
205()
為近似描述y與尤的關(guān)系,除了一次函數(shù)y=6x+a,還有y=”5+a和>="2+。兩個函數(shù)
可選.
A
⑴從三個函數(shù)中選出“最好”的曲線擬合y與x的關(guān)系,并求出其回歸方程(b保留到小數(shù)點后
1位);
⑵判斷說法“高度從1000cm長到1001cm所需時間超過一年”是否成立,并給出理由.
n—一n___
Az(M-x)(y-y)^Xiyi-nxy
參考公式:b=~-----------二-------=—,-----—,
2
Z(Xz—X)Z蠟一
i=li=l
A—A—
a=y-bx.
____77
參考數(shù)據(jù)(其中%=?,%=竟):x=20,u=4,t=668,y=8,2需=4676,Z"?=140,
i=li=l
777
£方=7907396,Z]?=1567,Z〃"=283,
i=lz=li=l
7
z砂i=56575.
i=l
解(1)從散點圖可以看出,曲線的形狀與函數(shù)>=也相似,
故選擇函數(shù)擬合y與X的關(guān)系.
z283—7x4x859
b=140-7X42=2F2-b
A
心8—2.1義4=一0.4,
其經(jīng)驗回歸方程為y=21G—。4
(2)將y=1000,1001分別代入經(jīng)驗回歸方程,得2.16一0.4=1000和2.16一0.4=1001,
.「1001.41<1000.47
故X2_xi=(jrr13H45%
顯然454>365,
所以,說法“高度從1000cm長到1001cm所需時間超過一年”成立.
課時作業(yè)
A級基礎(chǔ)鞏固練
一、單項選擇題
1.(2024?湘豫名校模擬)根據(jù)下表樣本數(shù)據(jù):
X23456
y42.5-0.5-2-3
AAA
得到的經(jīng)驗回歸方程為y=6x+a,貝ij()
AAAA
A.a>0,b>0B.a>0,b<0
AAAA
C.〃<0,b>0D.a<0,b<0
答案B
A—2+3+4+5+6—
解析由表中的數(shù)據(jù)可得,變量y隨著x的增大而減小,貝防<0,x=--------------------=4,>
4+25—05—2—3AAAA
=——:~~r----------=0.2,又經(jīng)驗回歸直線丫=法+”經(jīng)過點(4,0.2),可得a>0.
2.甲、乙、丙、丁四位同學(xué)各自對A,8兩個變量的線性相關(guān)性做試驗,并用回歸分析的方
法分別求得樣本相關(guān)系數(shù)r與殘差平方和m,如下表:
X甲乙丙T
r0.820.780.690.85
m106115124103
則哪位同學(xué)的試驗結(jié)果體現(xiàn)A,8兩個變量有更強的線性相關(guān)性?()
A.甲B.乙
C.丙D.T
答案D
解析7"的絕對值越大,機越小,線性相關(guān)性越強.
3.(2023?河北高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的
是()
殘差f殘差
40040
20020.?
0
2.4-6101214觀測:24,6.8町1214觀測
-200
時間????時間
-40()
B
[殘差
10004
5002?????
0;力。”打2臧測
24.6.B.10L214觀測?
-500
二?.時間1.?時間
-1000
CD
答案D
解析用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣
的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,顯然D項的擬合精度最
高.故選D.
人AAA
4.已知某地的財政收入x與支出y滿足經(jīng)驗回歸方程y=bx+a+e(單位:億元),其中6=0.8,
A
a=2,|e|<0.5,如果今年該地區(qū)的財政收入為10億元,那么支出預(yù)計不會超過()
A.9億元B.10億元
C.9.5彳乙元D.10.5彳乙元
答案D
A
角星析y=0.8xl0+2+e=10+eW10.5.
5.用模型y=ceh擬合一組數(shù)據(jù)時,為了求出經(jīng)驗回歸方程,設(shè)z=lny,其變換后得到經(jīng)驗
AA
回歸方程為z=0.5x+2,貝b=()
A.0.5B.e05
C.2D.e2
答案D
AAA
解析因為y=ce",兩邊取對數(shù)得lny=ln(ce丘)=lnc+lne"=fcv+lnc,貝>Jz=g:+lnc,而
AAA
z=0.5x+2,于是得lnc=2,RPc=e2.
A
6.根據(jù)一組樣本數(shù)據(jù)(尤i,弘),(物》2),…,(%",%),求得經(jīng)驗回歸方程為y=L5x+0.5,
且1=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個樣本點(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求
得的經(jīng)驗回歸直線/的斜率為1.2,貝ij()
A.去除兩個誤差較大的樣本點后,y的估計值增加速度變快
B.去除兩個誤差較大的樣本點后,重新求得的經(jīng)驗回歸直線一定過點(3,4)
A
C.去除兩個誤差較大的樣本點后,重新求得的經(jīng)驗回歸方程為y=1.2x+L4
D.去除兩個誤差較大的樣本點后,樣本點(2,3.75)對應(yīng)的殘差為0.05
答案C
解析對于A,因為所以去除兩個誤差較大的樣本點后y的估計值增加速度變慢,
故A錯誤;對于B,當(=3時,7=3xl.5+0.5=5,設(shè)去掉兩個誤差較大的樣本點后,橫
坐標的平均值為縱坐標的平均值為3',則.二幻十二十…:即―6=加[=3,,,=
吐吐二普二12=生12=5,故B錯誤;對于C,因為去除兩個誤差較大的樣本點后,
n~2n~2
AA
重新求得經(jīng)驗回歸直線/的斜率為1.2,所以5=3xl.2+a,解得。=1.4,所以去除兩個誤差
AA
較大的樣本點后的經(jīng)驗回歸方程為y=L2尤+1.4,故C正確;對于D,當尤=2時,>=1.2x2
A
+14=3.8,y-y=3.75-3.8=—0.05,故D錯誤.
二、多項選擇題
7.下列說法中正確的是()
A.經(jīng)驗回歸分析中,比的值越大,說明殘差平方和越小
B.若一組觀測數(shù)據(jù)(xi,yi),(X2,y2),…,(xn,%)滿足y尸如+a+e;G=l,2,n),且
ei恒為0,則R2=i
C.經(jīng)驗回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法
D.畫殘差圖時,縱坐標為殘差,橫坐標一定是編號
答案ABC
解析對于A,經(jīng)驗回歸分析中,R2的值越大,說明模型的擬合效果越好,則殘差平方和越
小,A正確;對于B,若一組觀測數(shù)據(jù)(即,yi),(X2,>2),…,(x?,%)滿足yi=bxi+a+e^i
=1,2,…,ri),且々恒為0,則R2=I,B正確;對于C,經(jīng)驗回歸分析是對具有相關(guān)關(guān)系
的兩個變量進行統(tǒng)計分析的一種常用方法,C正確;對于D,殘差圖中橫坐標可以是樣本編
號,也可以是身高數(shù)據(jù),還可以是體重的估計值等,D錯誤.
8.下列有關(guān)經(jīng)驗回歸分析的說法中正確的是()
A.經(jīng)驗回歸直線必過點(無,y)
B.經(jīng)驗回歸直線就是散點圖中經(jīng)過樣本數(shù)據(jù)點最多的那條直線
C.當樣本相關(guān)系數(shù)/>0時,兩個變量正相關(guān)
D.如果兩個變量的相關(guān)性越弱,則團就越接近于0
答案ACD
解析對于A,經(jīng)驗回歸直線必過點(I,7),故A正確;對于B,經(jīng)驗回歸直線在散點圖
中可能不經(jīng)過任一樣本數(shù)據(jù)點,故B不正確;對于C,當樣本相關(guān)系數(shù)r>0時,則兩個變量
正相關(guān),故C正確;對于D,如果兩個變量的相關(guān)性越弱,則|廠|就越接近于0,故D正確.故
選ACD.
三、填空題
9.(2023?廣東廣州模擬)某車間為了提高工作效率,需要測試加工零件所花費的時間,為此進
行了5次試驗,這5次試驗的數(shù)據(jù)如下表:
零件數(shù)x(個)
加工時間y(min)
若用最小二乘法求得經(jīng)驗回歸方程為y=0.67x+54.9,則a的值為
答案68
62+。+75+81+89=61+與,所以
5
10.用模型>=/一1去擬合一組數(shù)據(jù)時,已知如下數(shù)據(jù):2而二18,9丁2丁3"4'5>6=匕48,則實數(shù)
i=l
k的值為.
答案3
6
解析由y=e"-1得lny=fcr—1,所以以丁2丁3丁4丁5、6=匕48=>左2即—6=18左一6=48,貝!)%=3.
,=1
n.(2023?海南調(diào)研)在一組樣本數(shù)據(jù)8,yD,(%2,竺),…,(X6,詞的散點圖中,若所有樣
1666
本點(如M)(i=l,2,6)都在曲線丁=加一5附近波動,經(jīng)計算ZH=12,£M=14,£姆
乙Z=1i=li=\
=23,則實數(shù)Z?的值為.
宏安—
u木23
6
_z*
解析令方=—,則非線性經(jīng)驗回歸方程變?yōu)榫€性經(jīng)驗回歸方程,即丁=初一看此時,=氣一
6
ZM
23-z=i14小、,1田14,23117
=不,y=—=y-代入y=6f一],侍不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 無刷直流電機調(diào)速控制系統(tǒng)設(shè)計方案畢業(yè)論文
- 25年公司級員工安全培訓(xùn)考試試題及參考答案(典型題)
- 2025日常安全培訓(xùn)考試試題附答案(B卷)
- 2025年國際商業(yè)代理合同范本
- 2025實習(xí)協(xié)議、就業(yè)協(xié)議和勞動合同的區(qū)別與選擇
- 2025關(guān)于建設(shè)局《合同價款結(jié)算管理》和《合同變更與索賠管理》及
- 2025起重機械租賃合同
- 2025年院線經(jīng)營項目建議書
- 2025網(wǎng)站信息會員信息服務(wù)合同書樣本
- 2025廣告公司收購合同范本
- 航空器駕駛員指南系列咨詢通告口試參考題庫(含答案)
- X文體培訓(xùn)學(xué)校年度財務(wù)審計報告
- 消防設(shè)施檢查與維護培訓(xùn)
- 如何防范勒索軟件和網(wǎng)絡(luò)勒索攻擊
- 重點監(jiān)管的危險化學(xué)品名錄完整版及相關(guān)解讀
- 2024年福建國有企業(yè)海峽人力南平分公司招聘筆試參考題庫含答案解析
- 七年級下冊英語單詞默寫表直接打印
- 菜品退單原因分析報告
- 新能源電動汽車技術(shù)簡介
- 天融信運維安全審計系統(tǒng)V3
- 2024年初級社會工作者《社會工作實務(wù)(初級)》考試練習(xí)題(含答案)
評論
0/150
提交評論