2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對數(shù)據(jù)的統(tǒng)計分析_第1頁
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對數(shù)據(jù)的統(tǒng)計分析_第2頁
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對數(shù)據(jù)的統(tǒng)計分析_第3頁
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對數(shù)據(jù)的統(tǒng)計分析_第4頁
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對數(shù)據(jù)的統(tǒng)計分析_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三節(jié)成對數(shù)據(jù)的統(tǒng)計分析

第1課時變量間的相關(guān)關(guān)系及回歸模型

課標解讀考向預(yù)測

1.結(jié)合具體實例,了解一元線性回歸模型的含

預(yù)計2025年高考,變量間的相關(guān)關(guān)系、回歸

義,了解模型中參數(shù)的統(tǒng)計意義,了解最小

模型主要以應(yīng)用題的方式出現(xiàn),需要在復(fù)雜

二乘原理,掌握一元線性回歸模型中參數(shù)的

的題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模型,

最小二乘估計方法,會使用相關(guān)的統(tǒng)計軟件.

并且運用數(shù)學(xué)模型解決實際問題,考查分析

2.針對實際問題,會用一元線性回歸模型進行

問題和處理數(shù)據(jù)的能力.

預(yù)測.

必備知識——強基礎(chǔ)

知識梳理

1.變量的相關(guān)關(guān)系

(1)相關(guān)關(guān)系

兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱

為相關(guān)關(guān)系.

⑵散點圖

將各數(shù)據(jù)在平面直角坐標系中的對應(yīng)點畫出來,得到表示兩個變量的一組數(shù)據(jù)的圖形,這樣

的圖形叫做回散點圖.利用散點圖,可以判斷兩個變量是否相關(guān),相關(guān)時是正相關(guān)還是負

相關(guān).

⑶正相關(guān)和負相關(guān)

①當一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱這兩個變量畫

正相關(guān).

②負相關(guān):當一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減小的趨勢,則稱這兩個變量

廚負相關(guān).

(4)線性相關(guān)

①一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在畫一條直線附近,我

們就稱這兩個變量線性相關(guān).

②一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相

關(guān)或曲線相關(guān).

2.樣本相關(guān)系數(shù)

(1)相關(guān)系數(shù)r的計算

變量尤和變量y的樣本相關(guān)系數(shù)r的計算公式如下:

z孫一,龍y

___________________________

―r>iz_r'i二

A/Z焉fx2yZy—ny2

(2)相關(guān)系數(shù)r的性質(zhì)

①當r>0時,稱成對樣本數(shù)據(jù)畫歪相關(guān);當K0時,稱成對樣本數(shù)據(jù)畫負相關(guān);當r=0

時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.

②樣本相關(guān)系數(shù)r的取值范圍為畫「一1,11.

當川越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越畫強;

當卜|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越畫弱.

3.一元線性回歸模型

經(jīng)驗回歸方程與最小二乘法

我們將£=源+)稱為y關(guān)于X的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形

AA

稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的b,。叫做6,a的最

小二乘估計,其中

<n——n__

Z%)(%—y)y,xzyz—nTTV

b=J——z-----------------------=回^~~—.

qZ(即-x)2y,^~nx~-

i=l尸]

A—A——

<a=y—bx.

4.殘差與殘差分析

_____A

(1)殘差:對于響應(yīng)變量匕通過觀測得到的數(shù)據(jù)稱為萬口觀測值,通過經(jīng)驗回歸方程得到的y

稱為何預(yù)測值,向觀測值減去畫預(yù)測值稱為殘差.

(2)殘差分析:殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,

以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.

(3)刻畫回歸效果的方式

①殘差圖法

作圖時縱坐標為殘差,橫坐標為自變量無,這樣作出的圖形稱為殘差圖.在殘差圖中,殘差

點比較均勻地分布在以取值為0的橫軸為對稱軸的水平的帶狀區(qū)域內(nèi),說明選用的模型比較

合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高.

②殘差平方和法

nA_____

殘差平方和為2⑴一加2,殘差平方和回越小,模型擬合效果越好.

③利用決定系數(shù)F刻畫回歸效果

nA

X(M—8)2

R2=l—彳-----二一,改越回大,模型擬合效果越好;R2越回小,模型擬合效果越差.

23一y產(chǎn)

常用

八/\--

1.求解經(jīng)驗回歸方程的關(guān)鍵是確定回歸系數(shù)a,b,應(yīng)充分利用回歸直線過點(x,y).

2.根據(jù)經(jīng)驗回歸方程計算的;值,僅是一個預(yù)測值,不是真實發(fā)生的值.

診斷自測

1.概念辨析(正確的打“小,錯誤的打“X”)

AAAA

(1)經(jīng)驗回歸方程中,若〃<0,則變量%和y負相關(guān).()

AAA

(2)經(jīng)驗回歸直線至少經(jīng)過點(xi,yi),⑴,yi),(xn,y”)中的一個點.()

(3)樣本相關(guān)系數(shù)的絕對值越接近1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強.()

(4)殘差平方和越大,線性回歸模型的擬合效果越好.()

答案(l)x(2)x(3)4(4)x

2.小題熱身

(1)甲、乙、丙、丁四位同學(xué)在建立變量尤,y的回歸模型時,分別選擇了4種不同模型,計

算可得它們的F分別如下表:

X甲乙丙T

R20.980.780.500.85

建立的回歸模型擬合效果最好的是()

A.甲B.乙

C.丙D.丁

答案A

解析此越大,表示回歸模型的擬合效果越好.

(2)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:。C)的關(guān)系,在20個

不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(如y;)0=l-2,20)得到下面的散點

0%

8%

發(fā)

6%

率4%

2%

O

由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中,最適宜作為發(fā)芽率〉和溫度

尤的回歸方程類型的是()

A.y=a~\~bxB.y=a+Z?x2

C.y—a-\~bexD.y—a^rblnx

答案D

解析由散點圖分布可知,散點圖分布在一個對數(shù)型函數(shù)圖象的附近,因此最適宜作為發(fā)芽

率y和溫度x的回歸方程類型的是y=a+blnx.故選D.

(3)(人教A選擇性必修第三冊復(fù)習(xí)參考題8T2改編)在一元線性回歸模型Y^bx+a+e中,下

列說法正確的是()

A.y=Zzx+a+e是一次函數(shù)

B.響應(yīng)變量Y是由解釋變量x唯一確定的

c.響應(yīng)變量y除了受解釋變量尤的影響外,可能還受到其他因素的影響,這些因素會導(dǎo)致

隨機誤差e的產(chǎn)生

D.隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e的產(chǎn)生

答案C

解析對于A,一元線性回歸模型Y=bx+a+e中,方程表示的不是確定性關(guān)系,因此不是

一次函數(shù),所以A錯誤;對于B,響應(yīng)變量y不是由解釋變量X唯一確定的,所以B錯誤;

對于c,響應(yīng)變量y除了受解釋變量X的影響外,可能還受到其他因素的影響,這些因素會

導(dǎo)致隨機誤差e的產(chǎn)生,所以C正確;對于D,隨機誤差是不能避免的,只能將誤差縮小,

所以D錯誤.

(4)若某商品的廣告費支出x(單位:萬元)與銷售額M單位:萬元)之間有如下表所示的對應(yīng)數(shù)

據(jù):

X24568

y2040607080

AA

根據(jù)表中數(shù)據(jù),利用最小二乘法求得y關(guān)于x的經(jīng)驗回歸方程為y=6尤+1.5,當廣告費支出

為10萬元時,銷售額的估計值為萬元.

答案106.5

—1—1

解析X=§x(2+4+5+6+8)=5,y=m<(20+40+60+70+80)=54,所以樣本中心為(5,

AAAA

54),將其代入經(jīng)驗回歸方程y=6x+1.5中,有54=56+1.5,解得6=10.5,所以經(jīng)驗回歸方

AA

程為y=10.5x+1.5,當x=10時,10.5x10+1.5=106.5.

考點探究一提素養(yǎng)

考點一變量間相關(guān)關(guān)系的判斷

例1(1)對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確

的是()

-~~~~~o1~~~~-~

51015202530355101520253035

樣本相關(guān)系數(shù)為小樣本相關(guān)系數(shù)為「2

①②

101520253035101520253035

樣本相關(guān)系數(shù)為n樣本相關(guān)系數(shù)為小

③④

A.r2<-4<0<廠3<r1B.F4<r2<0<ri<r3

C.廠4<廠2〈0〈廠3<r1D.r2<「4<0<r1<-3

答案A

解析由散點圖知圖①與圖③是正相關(guān),故r>0,廠3>0,圖②與圖④是負相關(guān),故々<0,r4<0,

且圖①與圖②的樣本點集中在一條直線附近,因此尸2<廠4<0<廠3<小

⑵(2023?河北邢臺階段考試)已知廠1表示變量X與y之間的線性相關(guān)系數(shù),廠2表示變量。與V

之間的線性相關(guān)系數(shù),且ri=0.837,72=一0.957,則()

A.變量x與y之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性強于u與丫之間的相關(guān)性

B,變量x與y之間呈負相關(guān)關(guān)系,且x與y之間的相關(guān)性強于u與v之間的相關(guān)性

c.變量u與丫之間呈負相關(guān)關(guān)系,且x與丫之間的相關(guān)性弱于。與v之間的相關(guān)性

D.變量u與v之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性弱于u與丫之間的相關(guān)性

答案c

解析因為線性相關(guān)系數(shù)r1=0.837,廠2=—0.957,所以變量X與丫之間呈正相關(guān)關(guān)系,變量

。與丫之間呈負相關(guān)關(guān)系,且X與V之間的相關(guān)性弱于U與卜之間的相關(guān)性.故選C.

【通性通法】

判斷相關(guān)關(guān)系的方法

(1)散點圖法:如果樣本點的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;

如果樣本點的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.

⑵樣本相關(guān)系數(shù):當廠>0時,正相關(guān);當廠<0時,負相關(guān);IH越接近于1,相關(guān)性越強.

AA

(3)經(jīng)驗回歸方程:當b>0時,正相關(guān);當6<0時,負相關(guān).

【鞏固遷移】

1.在一組樣本數(shù)據(jù)(尤1,J1),(尤2,>2),…,(xn,yn)(n^2,XI,X2,X”不全相等)的散點圖

中,若所有樣本點(知刈。=1,2,”)都在直線y=—5+1上,則這組樣本數(shù)據(jù)的樣本

相關(guān)系數(shù)為()

A.-1B.0

C.一;D.1

答案A

解析因為所有樣本點都在直線y=一5+1上,呈現(xiàn)完全負相關(guān),所以樣本相關(guān)系數(shù)為一1.

2.(2023?天津高考)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示.其中相關(guān)系數(shù)r=

0.8245,下列說法正確的是()

A.花瓣長度和花萼長度沒有相關(guān)性

B.花瓣長度和花萼長度呈負相關(guān)

C.花瓣長度和花萼長度呈正相關(guān)

D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245

答案C

解析因為相關(guān)系數(shù)r=0.8245>0.75,所以花瓣長度和花萼長度的相關(guān)性較強,并且呈正相

關(guān),所以A,B錯誤,C正確;因為相關(guān)系數(shù)與樣本的數(shù)據(jù)有關(guān),所以當樣本發(fā)生變化時,

相關(guān)系數(shù)也可能會發(fā)生變化,所以D錯誤.故選C.

考點二樣本相關(guān)系數(shù)、決定系數(shù)的應(yīng)用

例2(2022.全國乙卷)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山,為估計一林

區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:n?)

和材積量(單位:nf),得到如下數(shù)據(jù):

樣本

12345678910總和

號i

根部

橫截0.040.060.040.080.080.050.050.070.070.060.6

面積

Xi

材積

0.250.400.220.540.510.340.360.460.420.403.9

量,

101010

并計算得£蠟=0.038,2必=1,6158,2擊y=0.2474.

i=li=\i=\

(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;

(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);

(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和

為186nl2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹

木的總材積量的估計值.

n——

£(爸一x)(%—y)

附:相關(guān)系數(shù)「=I?,

22

A/Z(尤「無)Zy)

\lf=li=l

^1.896^1.377.

解(1)設(shè)這種樹木平均一棵的根部橫截面積為最,平均一棵的材積量為,,

貝?x=*=0.06,y=得=0.39.

10______

2孫一10工y

(2)廠=Iioio

\(X^-io72)(2a-10丁)

\1z=lz=lJ

____________0.2474—10x0.06x0.39__________

-4(0.038-10x0.062)x(1.6158—10x0.392)

_0.01340昨4一0.0134

40.002x0.09480.01可1.8960.01377'"

vnQQ

(3)設(shè)所有這種樹木的根部橫截面積總和為X,總材積量為Y,則5=工r,故¥=儒義186=

I——U.UO

y

1209(m3).

【通性通法】

經(jīng)驗回歸方程的擬合效果,可以利用相關(guān)系數(shù)r判斷,當|〃|越趨近于1時,兩變量的線性相

關(guān)性越強.或利用決定系數(shù)R2判斷,R2越大,擬合效果越好.

【鞏固遷移】

3.我國機床行業(yè)核心零部件對外依存度較高,我國整機配套的中高檔功能部件大量依賴進口,

根據(jù)中國機床工具工業(yè)協(xié)會的數(shù)據(jù),國內(nèi)高檔系統(tǒng)自給率不到10%,約90%依賴進口.因此,

迅速提高國產(chǎn)數(shù)控機床功能部件制造水平,加快國產(chǎn)數(shù)控機床功能部件產(chǎn)業(yè)化進程至關(guān)重

要.通過對某機械上市公司近幾年的年報公布的研發(fā)費用x(單位:億元)與產(chǎn)品的直接收益

M單位:億元)的數(shù)據(jù)進行統(tǒng)計,得到下表:

年份2016201720182019202020212022

234681013

y15222740485460

.A

根據(jù)數(shù)據(jù),可建立y關(guān)于x的兩個回歸模型:模型①:y=4.1x+10.9;模型②:y=21.3C—

14.4.

(1)根據(jù)表格中的數(shù)據(jù),分別求出模型①,②的決定系數(shù)代的大小(結(jié)果保留三位有效數(shù)字);

(2)(i)根據(jù)(1)選擇擬合精度更高、更可靠的模型;

(ii)若2023年該公司計劃投入研發(fā)費用17億元,使用(i)中的模型預(yù)測可為該公司帶來多少

直接收益?

回歸模型模型①模型②

7A

Z(yi-yd279.1318.86

i=l

nA

Z2_

附:R2=I—---------=—,

Z(M—y)2

i=l

解(1)因為

-15+22+27+40+48+54+60

y=y=38,

7_

所以Z(yi-y)2=232+162+ll2+22+102+162+222=1750,

i=l

7A

E(Mf)2

則模型①的決定系數(shù)出=1一早-----二一=1一卷煉0.955,

Z⑶一…"’

z-1

7A

2(?-%)2

模型②的決定系數(shù)a=1—〒--------二一=1一號畀0.989.

Z(M一2”

/=1

(2)(i)由⑴知,豚<感所以模型②的擬合精度更高、更可靠.

AA

(ii)由經(jīng)驗回歸方程》=21.35—14.4,可得當x=17時,y=21.3寸萬一14.4M2.93,

所以若2023年該公司計劃投入研發(fā)費用17億元,大約可為該公司帶來72.93億元的直接收

益.

考點三回歸分析(多考向探究)

考向1一元線性回歸模型

例3已知某綠豆新品種發(fā)芽的適宜溫度在6?22℃之間,一農(nóng)學(xué)實驗室研究人員為研究溫

度x(單位:。C)與綠豆新品種發(fā)芽數(shù)y(單位:顆)之間的關(guān)系,每組選取了成熟種子50顆,分

別在對應(yīng)的8?14℃的溫度環(huán)境下進行實驗,得到如下散點圖:

_7__

其中y=24,.Z,x)?-y)=70,

7_

."8-4=176.

1=1

(1)運用相關(guān)系數(shù)進行分析說明,是否可以用線性回歸模型擬合y與x的關(guān)系?

AAA

(2)求出y關(guān)于x的經(jīng)驗回歸方程并預(yù)測在19°C的溫度下,種子的發(fā)芽顆數(shù).

參考公式:相關(guān)系數(shù)

n—一

,工(汨一無)(y,-y)

z^lAAAA

經(jīng)驗回歸方程y=+其中人=

2

A/.X.(沏一無)22(y,—y)

\J1=11=1

n——

卷](即一x)A_A_

z,Q=y-bx.

za-I)2

Z=1

參考數(shù)據(jù):^77-8.77.

——i

解(1)根據(jù)題意,得x=7X(8+9+10+11+12+13+14)=11.

7_

2(X,—X)2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2

i=l

=28,

_7__________

2

(xz—x)X(%一>)2=^28x176=8"\/7^[70.16.

z=l

因而相關(guān)系數(shù)r=區(qū)港0998.

21(XLX)2R

由于|廠卜0.998很接近1,

,可以用線性回歸模型擬合y與x的關(guān)系.

A57

關(guān)于x的經(jīng)驗回歸方程為y=]x—

A57

若x=19,則y=]xl9—]=44顆,

在19℃的溫度下,預(yù)測種子的發(fā)芽顆數(shù)為44.

【通性通法】

求經(jīng)驗回歸方程的步驟

計算出手陷靖,鼻須%或

步驟一>—?_產(chǎn)

、-?.(xi-x)(y,-y),斗(即-動2的值

1=11=1

步驟己〉—利用公式計算8,b

步驟。一寫出經(jīng)驗回歸方程k嬴+8

【鞏固遷移】

4.(2023?安徽馬鞍山第三次教學(xué)質(zhì)量監(jiān)測)為了研究某果園的一種果樹的產(chǎn)量與種植密度的關(guān)

系,某中學(xué)的數(shù)學(xué)興趣小組在該果園選取了一塊種植區(qū)域進行了統(tǒng)計調(diào)查,他們將每株果樹

與其直線距離不超過1米的果樹株數(shù)x記為其密度,在記錄了該種植區(qū)域內(nèi)每株果樹的密度

后,從中選取密度為0,1,2,3,4的果樹,統(tǒng)計其產(chǎn)量的平均值y(單位:kg),得到如下統(tǒng)

計表:

(1)小組成員甲認為y與尤有很強的線性相關(guān)關(guān)系,請你幫他利用最小二乘法求出y關(guān)于x的

AAA

經(jīng)驗回歸方程y=6x+a;

⑵小組成員乙提出:若利用經(jīng)驗回歸方程計算的平均產(chǎn)量的估計值:與實際的平均產(chǎn)量

1nA

〃€1^*)滿足/21%一訓(xùn)>。.5,則應(yīng)該修正模型,尋找更合適的函數(shù)擬合%與y的關(guān)

系.統(tǒng)計知種植密度分別為5,6的果樹的平均產(chǎn)量為5.5kg、4.4kg,請你以這七組數(shù)據(jù)為

依據(jù)判斷(1)中得到的經(jīng)驗回歸方程是否需要修正?

n___

A£孫一"龍〉A(chǔ)_A_

參考公式:b=r-----——,a=y-bx.

2君一〃X2

i=l

__55_

解(l)x=2,y=11,Z%i%=93,Z焉一5%2=10,

i=l/=!

5

故~5二=1.7,。=ybx=14.4,

Z裔一5x2

i=\

A

所以經(jīng)驗回歸方程為y=-1.7x+14.4.

AA

(2)令%=0,1,2,3,4,5,6,代入y=—1.7x+14.4,分別得|y—y|=0.6,0,7,0,0.3,0.4,

0.4,0.2,

17A?6

從而721M?一訓(xùn)=亍<0?5,故不需要修正.

考向2非線性回歸模型

例4某工廠生產(chǎn)一種產(chǎn)品,從該種產(chǎn)品中隨機抽取6件合格產(chǎn)品,測得數(shù)據(jù)如下:

尺寸x/mm384858687888

質(zhì)量y/g16.818.820.722.42425.5

(1)若按照檢測標準,合格產(chǎn)品的質(zhì)量y與尺寸x之間近似滿足關(guān)系式y(tǒng)=o/(c,d為大于0

的常數(shù)),求y關(guān)于尤的經(jīng)驗回歸方程;

(2)已知合格產(chǎn)品的收益z(單位:千元)與合格產(chǎn)品尺寸和質(zhì)量的關(guān)系為z=2y—0.32x,根據(jù)(1)

中經(jīng)驗回歸方程分析,當合格產(chǎn)品的尺寸x約為何值時(結(jié)果用整數(shù)表示),收益z的預(yù)報值最

大?

6666

附:①參考數(shù)據(jù):2(In燈lny?=75.3,£(lnx,)=24.6,£(lny,)=18.3,g(Inx,)2=101.4.

i=li=li=li=l

AAA

②參考公式:對于樣本⑴,⑷(i=l,2,n),其經(jīng)驗回歸直線"=6v+a的斜率和截距的最

n一一n___

A£X(%—v)(%一u)V.77.ViU-nvuA一A——

小二乘估計公式分別為--------------------=------Z-,。=u—bv,e-2.7182.

E(均一v)2ZW—〃v2

i=li=l

解(1)對y=c/(c,d>0)兩邊取自然對數(shù)得lny=lnc+Mnx.

AAAAA

令%=lnx"Ui=lnyi,則〃=血+〃,其中〃=lnc.

根據(jù)所給統(tǒng)計量及最小二乘估計公式得

6_____

2刈的一6vu

%=氣----

Xw-6v2

Z=1

66

z(lux/)(In

6

i=\i=1

z(Inwin%)

i=l6

[Z(InXi)]2

6

£(In汨)21=1_____________

6

Z=1

75.3-24.6x18.3^60.271

101.4-24.6M=O54=2,

66

Z(Iny)Z(InXi)

AA——A

Z=1i=\18.3124.6

a=u-dVdx

66^~-5x3=1,

AAA

又〃=lnc=\,所以c=e,

A1

所以y關(guān)于x的經(jīng)驗回歸方程為y=e,,2

A1A

⑵由⑴得y=e「,所以z=26&-0.32x=-0.32(5)2+2班.

pA

令則當時,z取得最大值,

此時X=/U72,

所以當合格產(chǎn)品的尺寸x約為72時,收益z的預(yù)報值最大.

【通性通法】

非線性回歸分析的步驟

【鞏固遷移】

5.(2024?淄博診斷)小葉紫檀是珍稀樹種,因其木質(zhì)好備受玩家喜愛.其幼苗從觀察之日起,

第x天的高度為ycm,測得數(shù)據(jù)如下:

Xi4916253649

y0479111213

數(shù)據(jù)的散點圖如圖所示:

y

124

O

8

6

4

2

OO

205()

為近似描述y與尤的關(guān)系,除了一次函數(shù)y=6x+a,還有y=”5+a和>="2+。兩個函數(shù)

可選.

A

⑴從三個函數(shù)中選出“最好”的曲線擬合y與x的關(guān)系,并求出其回歸方程(b保留到小數(shù)點后

1位);

⑵判斷說法“高度從1000cm長到1001cm所需時間超過一年”是否成立,并給出理由.

n—一n___

Az(M-x)(y-y)^Xiyi-nxy

參考公式:b=~-----------二-------=—,-----—,

2

Z(Xz—X)Z蠟一

i=li=l

A—A—

a=y-bx.

____77

參考數(shù)據(jù)(其中%=?,%=竟):x=20,u=4,t=668,y=8,2需=4676,Z"?=140,

i=li=l

777

£方=7907396,Z]?=1567,Z〃"=283,

i=lz=li=l

7

z砂i=56575.

i=l

解(1)從散點圖可以看出,曲線的形狀與函數(shù)>=也相似,

故選擇函數(shù)擬合y與X的關(guān)系.

z283—7x4x859

b=140-7X42=2F2-b

A

心8—2.1義4=一0.4,

其經(jīng)驗回歸方程為y=21G—。4

(2)將y=1000,1001分別代入經(jīng)驗回歸方程,得2.16一0.4=1000和2.16一0.4=1001,

.「1001.41<1000.47

故X2_xi=(jrr13H45%

顯然454>365,

所以,說法“高度從1000cm長到1001cm所需時間超過一年”成立.

課時作業(yè)

A級基礎(chǔ)鞏固練

一、單項選擇題

1.(2024?湘豫名校模擬)根據(jù)下表樣本數(shù)據(jù):

X23456

y42.5-0.5-2-3

AAA

得到的經(jīng)驗回歸方程為y=6x+a,貝ij()

AAAA

A.a>0,b>0B.a>0,b<0

AAAA

C.〃<0,b>0D.a<0,b<0

答案B

A—2+3+4+5+6—

解析由表中的數(shù)據(jù)可得,變量y隨著x的增大而減小,貝防<0,x=--------------------=4,>

4+25—05—2—3AAAA

=——:~~r----------=0.2,又經(jīng)驗回歸直線丫=法+”經(jīng)過點(4,0.2),可得a>0.

2.甲、乙、丙、丁四位同學(xué)各自對A,8兩個變量的線性相關(guān)性做試驗,并用回歸分析的方

法分別求得樣本相關(guān)系數(shù)r與殘差平方和m,如下表:

X甲乙丙T

r0.820.780.690.85

m106115124103

則哪位同學(xué)的試驗結(jié)果體現(xiàn)A,8兩個變量有更強的線性相關(guān)性?()

A.甲B.乙

C.丙D.T

答案D

解析7"的絕對值越大,機越小,線性相關(guān)性越強.

3.(2023?河北高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的

是()

殘差f殘差

40040

20020.?

0

2.4-6101214觀測:24,6.8町1214觀測

-200

時間????時間

-40()

B

[殘差

10004

5002?????

0;力。”打2臧測

24.6.B.10L214觀測?

-500

二?.時間1.?時間

-1000

CD

答案D

解析用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣

的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,顯然D項的擬合精度最

高.故選D.

人AAA

4.已知某地的財政收入x與支出y滿足經(jīng)驗回歸方程y=bx+a+e(單位:億元),其中6=0.8,

A

a=2,|e|<0.5,如果今年該地區(qū)的財政收入為10億元,那么支出預(yù)計不會超過()

A.9億元B.10億元

C.9.5彳乙元D.10.5彳乙元

答案D

A

角星析y=0.8xl0+2+e=10+eW10.5.

5.用模型y=ceh擬合一組數(shù)據(jù)時,為了求出經(jīng)驗回歸方程,設(shè)z=lny,其變換后得到經(jīng)驗

AA

回歸方程為z=0.5x+2,貝b=()

A.0.5B.e05

C.2D.e2

答案D

AAA

解析因為y=ce",兩邊取對數(shù)得lny=ln(ce丘)=lnc+lne"=fcv+lnc,貝>Jz=g:+lnc,而

AAA

z=0.5x+2,于是得lnc=2,RPc=e2.

A

6.根據(jù)一組樣本數(shù)據(jù)(尤i,弘),(物》2),…,(%",%),求得經(jīng)驗回歸方程為y=L5x+0.5,

且1=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個樣本點(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求

得的經(jīng)驗回歸直線/的斜率為1.2,貝ij()

A.去除兩個誤差較大的樣本點后,y的估計值增加速度變快

B.去除兩個誤差較大的樣本點后,重新求得的經(jīng)驗回歸直線一定過點(3,4)

A

C.去除兩個誤差較大的樣本點后,重新求得的經(jīng)驗回歸方程為y=1.2x+L4

D.去除兩個誤差較大的樣本點后,樣本點(2,3.75)對應(yīng)的殘差為0.05

答案C

解析對于A,因為所以去除兩個誤差較大的樣本點后y的估計值增加速度變慢,

故A錯誤;對于B,當(=3時,7=3xl.5+0.5=5,設(shè)去掉兩個誤差較大的樣本點后,橫

坐標的平均值為縱坐標的平均值為3',則.二幻十二十…:即―6=加[=3,,,=

吐吐二普二12=生12=5,故B錯誤;對于C,因為去除兩個誤差較大的樣本點后,

n~2n~2

AA

重新求得經(jīng)驗回歸直線/的斜率為1.2,所以5=3xl.2+a,解得。=1.4,所以去除兩個誤差

AA

較大的樣本點后的經(jīng)驗回歸方程為y=L2尤+1.4,故C正確;對于D,當尤=2時,>=1.2x2

A

+14=3.8,y-y=3.75-3.8=—0.05,故D錯誤.

二、多項選擇題

7.下列說法中正確的是()

A.經(jīng)驗回歸分析中,比的值越大,說明殘差平方和越小

B.若一組觀測數(shù)據(jù)(xi,yi),(X2,y2),…,(xn,%)滿足y尸如+a+e;G=l,2,n),且

ei恒為0,則R2=i

C.經(jīng)驗回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法

D.畫殘差圖時,縱坐標為殘差,橫坐標一定是編號

答案ABC

解析對于A,經(jīng)驗回歸分析中,R2的值越大,說明模型的擬合效果越好,則殘差平方和越

小,A正確;對于B,若一組觀測數(shù)據(jù)(即,yi),(X2,>2),…,(x?,%)滿足yi=bxi+a+e^i

=1,2,…,ri),且々恒為0,則R2=I,B正確;對于C,經(jīng)驗回歸分析是對具有相關(guān)關(guān)系

的兩個變量進行統(tǒng)計分析的一種常用方法,C正確;對于D,殘差圖中橫坐標可以是樣本編

號,也可以是身高數(shù)據(jù),還可以是體重的估計值等,D錯誤.

8.下列有關(guān)經(jīng)驗回歸分析的說法中正確的是()

A.經(jīng)驗回歸直線必過點(無,y)

B.經(jīng)驗回歸直線就是散點圖中經(jīng)過樣本數(shù)據(jù)點最多的那條直線

C.當樣本相關(guān)系數(shù)/>0時,兩個變量正相關(guān)

D.如果兩個變量的相關(guān)性越弱,則團就越接近于0

答案ACD

解析對于A,經(jīng)驗回歸直線必過點(I,7),故A正確;對于B,經(jīng)驗回歸直線在散點圖

中可能不經(jīng)過任一樣本數(shù)據(jù)點,故B不正確;對于C,當樣本相關(guān)系數(shù)r>0時,則兩個變量

正相關(guān),故C正確;對于D,如果兩個變量的相關(guān)性越弱,則|廠|就越接近于0,故D正確.故

選ACD.

三、填空題

9.(2023?廣東廣州模擬)某車間為了提高工作效率,需要測試加工零件所花費的時間,為此進

行了5次試驗,這5次試驗的數(shù)據(jù)如下表:

零件數(shù)x(個)

加工時間y(min)

若用最小二乘法求得經(jīng)驗回歸方程為y=0.67x+54.9,則a的值為

答案68

62+。+75+81+89=61+與,所以

5

10.用模型>=/一1去擬合一組數(shù)據(jù)時,已知如下數(shù)據(jù):2而二18,9丁2丁3"4'5>6=匕48,則實數(shù)

i=l

k的值為.

答案3

6

解析由y=e"-1得lny=fcr—1,所以以丁2丁3丁4丁5、6=匕48=>左2即—6=18左一6=48,貝!)%=3.

,=1

n.(2023?海南調(diào)研)在一組樣本數(shù)據(jù)8,yD,(%2,竺),…,(X6,詞的散點圖中,若所有樣

1666

本點(如M)(i=l,2,6)都在曲線丁=加一5附近波動,經(jīng)計算ZH=12,£M=14,£姆

乙Z=1i=li=\

=23,則實數(shù)Z?的值為.

宏安—

u木23

6

_z*

解析令方=—,則非線性經(jīng)驗回歸方程變?yōu)榫€性經(jīng)驗回歸方程,即丁=初一看此時,=氣一

6

ZM

23-z=i14小、,1田14,23117

=不,y=—=y-代入y=6f一],侍不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論