統(tǒng)計(jì)案例(原卷版)_第1頁
統(tǒng)計(jì)案例(原卷版)_第2頁
統(tǒng)計(jì)案例(原卷版)_第3頁
統(tǒng)計(jì)案例(原卷版)_第4頁
統(tǒng)計(jì)案例(原卷版)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

專題52統(tǒng)計(jì)案例

【題型歸納目錄】

題型一:變量間的相關(guān)關(guān)系

題型二:線性回歸

題型三:非線性回歸

題型四:獨(dú)立性檢驗(yàn)

題型五:誤差分析

【考點(diǎn)預(yù)測(cè)】

知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收

集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點(diǎn)圖

將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(x,,%)(i=1,2,)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖

中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.

(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它

稱為正相關(guān),如圖(1)所??;

(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它

稱為負(fù)相關(guān),如圖(2)所不.

y

???????

,??

,*

o5;o

(1)(2)

3、相關(guān)系數(shù)

若相應(yīng)于變量X的取值X,,變量y的觀測(cè)值為y(1<i<ri),則變量x與y的相關(guān)系數(shù)

n__

E(X]-x)(%-y)^x^-nxy

?2L,通常用廠來衡量x與y之間的線性關(guān)系的強(qiáng)弱,r

唇廠孩唇:-方

的范圍為一.

(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)廠<0時(shí),表示兩個(gè)變量負(fù)相關(guān).

(2)W越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);H越接近0,表示兩個(gè)變量間幾乎不存在線性相

關(guān)關(guān)系.當(dāng)加=1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.

(3)通常當(dāng)|廠|>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.

知識(shí)點(diǎn)二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(尤1,yi),(%2,J2),...,(X",y"),其回歸方程y=加+。的求法為

〃__“__

£-尤)(yt-v)£X:yt-nxy

b=^—^---------------------T--------------------

一彳了一屋

i=li=\

a=y-bx

其中,X=~txi,y=-tyi'(x,y)稱為樣本點(diǎn)的中心.

n/=in,=i

2、殘差分析

對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值y,通過回歸方程得到的y稱為預(yù)測(cè)值,觀測(cè)值減去

預(yù)測(cè)值等于殘差,自稱為相應(yīng)于點(diǎn)(七,y)的殘差,即有=殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)殘

差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分

析.

U)殘差圖

通過殘差分析,殘差點(diǎn)&,自)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣

的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和。=£(?-%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

;=|

反之,不合適.

(3)相關(guān)指數(shù)

Z(y-y,-)2

用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:R2=I--=1'".

Z(2)2

/=!

代越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

知識(shí)點(diǎn)三、非線性回歸

解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原

后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;

(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);

(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二

次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、幕函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;

(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.

知識(shí)點(diǎn)四、獨(dú)立性檢驗(yàn)

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.

②2x2列聯(lián)表.

一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{xl,尤2}和{yl,y2],其樣本頻數(shù)列聯(lián)表(稱

為2x2列聯(lián)表)為

%為總計(jì)

%aba+b

x2Cdc+d

總計(jì)a+cb+da+b+c+d

從2x2列表中,依據(jù)‘二與工的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示

列聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn),二與上相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.

a+bc+d

3、獨(dú)立性檢驗(yàn)

(1)定義:利用獨(dú)立性假設(shè)、隨機(jī)變量K2來確定是否有一定把握認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法

稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).

(2)公式:K2=---------------------------------,其中〃=a+O+c+d為樣本容量.

(a+b)(c+d)(a+c)(b+d)

(3)獨(dú)立性檢驗(yàn)的具體步驟如下:

①計(jì)算隨機(jī)變量K?的觀測(cè)值%,查下表確定臨界值即:

2

P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001

k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果左2%,就推斷“x與y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過/(片?%);否則,就認(rèn)為在犯

錯(cuò)誤的概率不超過°(片?片)的前提下不能推斷“乂與/有關(guān)系”.

(2)兩個(gè)分類變量X和y是否有關(guān)系的判斷標(biāo)準(zhǔn):

統(tǒng)計(jì)學(xué)研究表明:

當(dāng)Q43.841時(shí),認(rèn)為X與Y無關(guān);

當(dāng)3.841時(shí),有95%的把握說X與Y有關(guān);

當(dāng)片>6.635時(shí),有99%的把握說X與/有關(guān);

當(dāng)片>10.828時(shí),有99.9%的把握說X與¥有關(guān).

【方法技巧與總結(jié)】

常見的非線性回歸模型

(1)指數(shù)函數(shù)型〉=。優(yōu)(。>0且awl,c>0)

兩邊取自然對(duì)數(shù),Iny=In[cax),即Iny=lnc+xlna,

令[y,'=lny,原方程變?yōu)閥=lnc+尤'Ina,然后按線性回歸模型求出In。,Inc.

[x=X

(2)對(duì)數(shù)函數(shù)型y=+a

令=y,原方程變?yōu)閥'=bx'+a,然后按線性回歸模型求出6,a.

[x=Inx

(3)塞函數(shù)型y=ax〃

兩邊取常用對(duì)數(shù),lgy=lg(ax〃),即lgy=mgx+lga,

令,原方程變?yōu)閥'=nr'+lga,然后按線性回歸模型求出”,Iga.

[x=Igx

(4)二次函數(shù)型y=區(qū)2+。

令:,原方程變?yōu)閥'=6x'+a,然后按線性回歸模型求出6,?.

[X=X

(5)反比例函數(shù)型y=a+9型

y'=y

令,1,原方程變?yōu)閥'=6x'+“,然后按線性回歸模型求出6,a.

X=—

、X

【題型歸納目錄】

題型一:變量間的相關(guān)關(guān)系

題型二:線性回歸

題型三:非線性回歸

題型四:獨(dú)立性檢驗(yàn)

題型五:誤差分析

【典例例題】

題型一:變量間的相關(guān)關(guān)系

例1.(2022?上海嘉定?高三階段練習(xí))通過抽樣調(diào)研發(fā)現(xiàn),當(dāng)?shù)氐谌径鹊尼t(yī)院心腦血管疾病的人數(shù)和便利

店購(gòu)買冷飲的人數(shù)的相關(guān)系數(shù)很高,甲認(rèn)為這是巧合,兩者其實(shí)沒有關(guān)系:乙認(rèn)為冷飲的某種攝入成分導(dǎo)

致了疾??;丙認(rèn)為病人對(duì)冷飲會(huì)有特別需求:丁認(rèn)為兩者的相關(guān)關(guān)系是存在的,但不能視為因果,請(qǐng)判斷

哪位成員的意見最可能成立()

A.甲B.乙C.丙D.丁

例2.(2022?四川?成都七中高三階段練習(xí)(理))某統(tǒng)計(jì)部門對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后,獲得如圖所示的

散點(diǎn)圖.

35

30

25

20

15

10

5

V5101520253035

相關(guān)系數(shù)為八

35f-----------------------------

30-.

25-

20-

15-.,

io-.?

5-J*,

5101520253035

相關(guān)系數(shù)為「3相關(guān)系數(shù)為&

下面關(guān)于相關(guān)系數(shù)的比較,正確的是)

A.B.r2<r^<rx<r3C.D.

例3.(2022?上海交大附中高三階段練習(xí))某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)量有

所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些地塊中用簡(jiǎn)單隨機(jī)抽

樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(4%)?=1,2,…,20),其中天和力分別表示第,個(gè)樣區(qū)的

2020

植物覆蓋面積(單位:公頃)和這種野生動(dòng)物的數(shù)量(單位:頭),并計(jì)算得£七=60,2%=1200,

Z=1Z=1

20_220_20

=80,X(X-y)2=9000,£卜廠尤)(%->)=800.

z=li=\i=l

(1)估計(jì)該地區(qū)這種野生動(dòng)物的數(shù)量;

⑵求樣本(%,%)?=1,2,…,20)的相關(guān)系數(shù).(精確到0.01)

變式1.(2022?陜西?寶雞市陳倉(cāng)高級(jí)中學(xué)高三開學(xué)考試(理))對(duì)兩個(gè)變量無,y進(jìn)行線性相關(guān)檢驗(yàn),得線性

相關(guān)系數(shù)〃=0.8995,對(duì)兩個(gè)變量a,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)-0.9568,則下列判斷正確

的是()

A.變量x與y正相關(guān),變量“與v負(fù)相關(guān),變量尤與y的線性相關(guān)性較強(qiáng)

B.變量x與y負(fù)相關(guān),變量〃與v正相關(guān),變量x與y的線性相關(guān)性較強(qiáng)

C.變量x與y正相關(guān),變量〃與v負(fù)相關(guān),變量〃與v的線性相關(guān)性較強(qiáng)

D.變量尤與y負(fù)相關(guān),變量"與v正相關(guān),變量"與v的線性相關(guān)性較強(qiáng)

變式2.(2022?全國(guó)?高三專題練習(xí))甲、乙、丙、丁四位同學(xué)各自對(duì)兩變量的線性相關(guān)性做試驗(yàn),分別求

得樣本相關(guān)系數(shù)/,如下表:

甲乙丙T

r0.20-0.95-0.120.85

則試驗(yàn)結(jié)果中蒼丁兩變量有更強(qiáng)線性相關(guān)性的是()

A.甲B.乙C.丙D.丁

變式3.(2022.江蘇.南京市第一中學(xué)高三階段練習(xí))某網(wǎng)絡(luò)電視劇已開播一段時(shí)間,其每日播放量有如下統(tǒng)

計(jì)表:

開播天數(shù)X(單

12345

位:天)

當(dāng)天播放量y

335910

(單位:百萬

次)

(1)請(qǐng)用線性回歸模型擬合y與x的關(guān)系,并用相關(guān)系數(shù)加以說明;

(2)假設(shè)開播后的兩周內(nèi)(除前5天),當(dāng)天播放量y與開播天數(shù)尤服從(1)中的線性關(guān)系.若每百萬播放量

可為制作方帶來0.7萬元的收益,且每開播一天需支出1萬元的廣告費(fèi),估計(jì)制作方在該劇開播兩周內(nèi)獲得

的利潤(rùn).

參考公式:/,石二口七------------,a=y-bx.

歸x"歸y"自…

555_____

參考數(shù)據(jù):^xiyi=110,2%;=55,=224,7110-10.5.

i=li=li=l

注:①一般地,相關(guān)系數(shù)r的絕對(duì)值在0.95以上(含0.95)認(rèn)為線性相關(guān)性較強(qiáng);否則,線性相關(guān)性較弱.

②利潤(rùn)=收益一廣告費(fèi).

題型二:線性回歸

例4.(2022.重慶南開中學(xué)高三階段練習(xí))重慶位于北半球亞熱帶內(nèi)陸地區(qū),其氣候特征恰如幾句俗諺:春

早氣溫不穩(wěn)定,夏長(zhǎng)酷熱多伏旱,秋涼綿綿陰雨天,冬暖少雪云霧多.尤其是10月份,晝夜溫差很大,某

數(shù)學(xué)興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關(guān)系,他們分別到氣象局與某醫(yī)院抄錄了2021

年10月某六天的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:

日期第一日第三日第五日第四日第二日第六日

晝夜溫差X(℃)47891214

就診人數(shù)y(個(gè))%%%%)6

66_2

其中:%eN*,i=\,2,3,4,5,6,參考數(shù)據(jù):=2658,=258,7258?16.

i=li=l'

(D根據(jù)散點(diǎn)圖可以認(rèn)為x與y之間存在線性相關(guān)關(guān)系,且相關(guān)系數(shù)r=三,請(qǐng)用最小二乘法求出線性回歸

方程y=6x+a(?,b用分?jǐn)?shù)表示);

(2)分析數(shù)據(jù)發(fā)現(xiàn):第六日就診人數(shù)%=3。,第一日就診患者中有3個(gè)小孩,其他患者全是大人,現(xiàn)隨機(jī)的

Q

從第一日所有就診患者中選出2人,若2人中至少有一個(gè)小孩的概率為二;

①求%的值;

②若%<%<%<為,求%,為,>4,%的值(只寫結(jié)果,不要求過程).

2(%-磯%

(參考公式:J————a=y-b'X,

Z")

i=\

例5.(2022?全國(guó)?高三專題練習(xí))已知龍,丁的取值如表:

X0134

ya4.34.86.7

若X,y具有線性相關(guān)關(guān)系,且回歸方程為9=0.95x+2.6,則。=

例6.(2022?河北衡水?高三階段練習(xí))已知一組樣本數(shù)據(jù)(多,yj,(々,坊),…,(%,%)"22,占,巧,...,

乙不相等),若這組數(shù)據(jù)的樣本相關(guān)系數(shù)為T,則在這組樣本數(shù)據(jù)的散點(diǎn)圖中,所有樣本點(diǎn)(4》)(1=1,

2,〃)所在的曲線可能是()

A.y=-2x+3B.y=x+3C.y=-x1+3D.y=?+3

變式4.(2022?全國(guó)?高三專題練習(xí)(文))給出下列說法:①回歸直線夕=嬴+&恒過樣本點(diǎn)的中心丘,7),

且至少過一個(gè)樣本點(diǎn);②兩個(gè)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)⑺就越接近1;③將一組數(shù)據(jù)的每個(gè)數(shù)據(jù)都加

一個(gè)相同的常數(shù)后,方差不變;④在回歸直線方程3=2-0.5x中,當(dāng)解釋變量x增加一個(gè)單位時(shí),預(yù)報(bào)變量

亍平均減少0.5個(gè)單位.其中說法正確的是()

A.①②④B.②③④C.①③④D.②④

變式5.(2022?全國(guó)?高三專題練習(xí))對(duì)于數(shù)據(jù)組(專切[=1,2,3,...,“),如果由線性回歸方程得到的對(duì)應(yīng)于自

變量者的估計(jì)值是力,那么將稱為相應(yīng)于點(diǎn)(乙,%)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量無(噸)與

所需某種原材料丫噸)的相關(guān)性,在生產(chǎn)過程中收集4組對(duì)應(yīng)數(shù)據(jù)(x,y)如下表所示:

X3456

y2.534m

根據(jù)表中數(shù)據(jù),得出,關(guān)于x的線性回歸方程為y=0.7x+〃,據(jù)此計(jì)算出樣本點(diǎn)(4,3)處的殘差為一0.15,

則表中m的值為()

A.3.3B.4.5C.5D.5.5

變式6.(2022.全國(guó)?高三專題練習(xí))已知兩個(gè)變量工和,之間有線性相關(guān)關(guān)系,經(jīng)調(diào)查得到如下樣本數(shù)據(jù),

X34567

y3.52.41.1-0.2-1.3

根據(jù)表格中的數(shù)據(jù)求得同歸方程亍=%+&,則下列說法正確的是()

A.a>0,b>0B.a>0,b<0

C.a<0,b>0D.a<0,b<0

變式7.(2022.全國(guó)?高三專題練習(xí))為研究某種細(xì)菌在特定環(huán)境下,隨時(shí)間變化的繁殖情況,得到如下實(shí)驗(yàn)

數(shù)據(jù):

天數(shù)X(天)3456

繁殖個(gè)數(shù)y(千個(gè))2.5344.5

由最小二乘法得>與x的線性回歸方程為3=0.7x+&,則當(dāng)x=7時(shí),繁殖個(gè)數(shù)》的預(yù)測(cè)值為()

A.4.9B.5.25

C.5.95D.6.15

變式8.(2022?北京師大附中高三階段練習(xí)(文))為了規(guī)定工時(shí)定額,需要確定加工某種零件所需的時(shí)間,

為此進(jìn)行了5次試驗(yàn),得到5組數(shù)據(jù):(工,%),(孫力),(毛,%),(%,%),(%,%),由最小二乘法求得回歸直線

方程為y=0.67x+54.9.若己知占+々+%+%+%=15°,則%+%+%+%+%=

A.75B.155.4C.375D.466.2

變式9.(2022?廣東?順德一中高三階段練習(xí))據(jù)一組樣本數(shù)據(jù)(%,%),(々,為),…,(%,%),求得經(jīng)驗(yàn)回歸

方程為a=L5x+0.5,且;=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個(gè)樣本點(diǎn)(122.2)和(4.8,7.8)誤差較大,去除后

重新求得的經(jīng)驗(yàn)回歸直線/的斜率為1.2,則()

A.去除兩個(gè)誤差較大的樣本點(diǎn)后,丁的估計(jì)值增加速度變快

B.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程一定過點(diǎn)(3,4)

C.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程為a=L2x+L4

D.去除兩個(gè)誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)(2,3.75)的殘差為0.05

變式10.(2022.全國(guó)?高三專題練習(xí))新冠肺炎疫情發(fā)生以來,中醫(yī)藥全面參與疫情防控救治,做出了重要

貢獻(xiàn).某中醫(yī)藥企業(yè)根據(jù)市場(chǎng)調(diào)研與模擬,得到研發(fā)投入億元)與產(chǎn)品收益y(億元)的數(shù)據(jù)統(tǒng)計(jì)如下:

研發(fā)投入X(億元)12345

產(chǎn)品收益y(億元)3791011

(1)計(jì)算X,y的相關(guān)系數(shù)r,并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若

0.3<|r|<0.75,則線性相關(guān)程度一般,若|川>0.75,則線性相關(guān)程度較高)

(2)求出y關(guān)于x的線性回歸方程,并預(yù)測(cè)研發(fā)投入20(億元)時(shí)產(chǎn)品的收益.

555

2

參考數(shù)據(jù):£(尤,-可2=10,E(x-y)=4o,^(x,-x)(z-y)=i9.

z=li=li=l

附:相關(guān)系數(shù)公式:r=「,回歸直線方程的斜率A=J-----------------,截距

Vi=lVz=li-l

d=y-bx.

變式11.(2022.全國(guó)?模擬預(yù)測(cè)(文))2020年,國(guó)慶“遇上”中秋,中國(guó)人把這個(gè)“超長(zhǎng)黃金周”過出了年味.

假期期間,全國(guó)各大旅游景點(diǎn)、車站、機(jī)場(chǎng)人頭攢動(dòng)的景象也吸引了世界的目光.外國(guó)媒體、專家和網(wǎng)友“實(shí)

名羨慕”,這一派熱鬧景象證明了抗疫的成功,也展示了中國(guó)經(jīng)濟(jì)復(fù)蘇的勁頭.抗疫的成功離不開國(guó)家強(qiáng)大的

醫(yī)療衛(wèi)生體系,下表是某省2013年至2019年醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)》(單位:萬個(gè)):

年份2013201420152016201720182019

年份代號(hào),1234567

醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)y4.24.34.54.74.84.84.9

(1)求y關(guān)于f的線性回歸方程、=命+&(a,3保留兩位小數(shù));

(2)規(guī)定若某年的實(shí)際醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)與估計(jì)值的差的絕對(duì)值不超過500個(gè),則稱該年是“吻合”年.利用(1)

的結(jié)果,假設(shè)2020年該省醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)的估計(jì)值為實(shí)際值,現(xiàn)從2013年至2020年這8年中任選3年,

其中“吻合,,年的個(gè)數(shù)為X,求X的分布列與數(shù)學(xué)期望.

7

參考數(shù)據(jù):工4%=1322,7=4.6.

Z=1

參考公式:線性回歸方程y=中斜率和截距的最小二乘估計(jì)公式分別為:b=「----------,

Ef=l"

a=y—bt.

變式12.(2022?全國(guó)?高三專題練習(xí))在我國(guó)抗疫期間,素有“南抖音,北快手”之說的小視頻除了給人們帶

來生活中的快樂外,更在于傳遞了一種正能量,為抗疫起到了積極的作用,但一個(gè)優(yōu)秀的作品除了需要有

很好的素材外,更要有制作上的技術(shù)要求,某同學(xué)學(xué)習(xí)利用“快影”軟件將已拍攝的素材進(jìn)行制作,每次制作

分三個(gè)環(huán)節(jié)來進(jìn)行,其中每個(gè)環(huán)節(jié)制作合格的概率分別為3:,三4,:2,只有當(dāng)每個(gè)環(huán)節(jié)制作都合格才認(rèn)為一

453

次成功制作,該小視頻視為合格作品.

(1)求該同學(xué)進(jìn)行3次制作,恰有一次合格作品的概率;

(2)若該同學(xué)制作10次,其中合格作品數(shù)為X,求X的數(shù)學(xué)期望與方差;

(3)該同學(xué)掌握技術(shù)后制作的小視頻被某廣告公司看中,聘其為公司做廣告宣傳,決定試用一段時(shí)間,每

天制作小視頻(注:每天可提供素材制作個(gè)數(shù)至多40個(gè)),其中前7天制作合格作品數(shù)》與時(shí)間f如下表:(第

f天用數(shù)字t表示)

時(shí)間(,)1234567

合格作品數(shù)(V)3434768

其中合格作品數(shù)(V)與時(shí)間")具有線性相關(guān)關(guān)系,求,關(guān)于「的線性回歸方程(精確到0.01),并估算第14天

能制作多少個(gè)合格作品(四舍五入取整)?

.£占%一“

(參考公式》=號(hào)------=上———7^,6=3-威,參考數(shù)據(jù):1^=163.)

七年-wx-一;=1

z=li=\

題型三:非線性回歸

例7.(2022.廣東.順德一中高三階段練習(xí))在國(guó)家大力發(fā)展新能源汽車產(chǎn)業(yè)的政策下,我國(guó)新能源汽車的產(chǎn)

銷量高速增長(zhǎng).已知某地區(qū)2014年底到2021年底新能源汽車保有量的數(shù)據(jù)統(tǒng)計(jì)表如下:

年份(年)20142015201620172018201920202021

年份代碼X12345678

保有量W千輛1.952.924.386.589.8715.0022.5033.70

888

參考數(shù)據(jù):9=12.1]=2.1,£x;=204,=613.7,£必=92.4,,其中

z=li=lf=l

J=Iny,1g2P0.30,lg3?0.48,1gee0.43.

人力千輛

35

30

25

20

15

10

5

O12345678

(1)根據(jù)統(tǒng)計(jì)表中的數(shù)據(jù)畫出散點(diǎn)圖(如圖),請(qǐng)判斷9=&與5;=e&+<5哪一個(gè)更適合作為y關(guān)于x的經(jīng)驗(yàn)

回歸方程(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果建立y關(guān)于龍的經(jīng)驗(yàn)回歸方程:

(2)假設(shè)每年新能源汽車保有量按(1)中求得的函數(shù)模型增長(zhǎng),且傳統(tǒng)能源汽車保有量每年下降的百分比相

同.若2021年底該地區(qū)傳統(tǒng)能源汽車保有量為500千輛,預(yù)計(jì)到2026年底傳統(tǒng)能源汽車保有量將下降10%.

試估計(jì)到哪一年底新能源汽車保有量將超過傳統(tǒng)能源汽車保有量.

參考公式:對(duì)于一組數(shù)據(jù)(%,V/),(%,嶺),…,(""M),其經(jīng)驗(yàn)回歸直線£=/"+&的斜率和截距的最小

Z(M;-M)(v;-V)Zujvi-nu-V

二乘估計(jì)公式分別為B=上匕--------=%---------,a=v-^u-,;

22

Z(w;-M)工uf-nu

1=1i=l

例8.(2022?全國(guó)?高三專題練習(xí))2020年的“金九銀十”變成“銅九鐵十”,全國(guó)各地房?jī)r(jià)“跳水”嚴(yán)重,但某地

二手房交易卻“逆市”而行.下圖是該地某小區(qū)2019年11月至2020年H月間,當(dāng)月在售二手房均價(jià)(單位:

萬元/平方米)的散點(diǎn)圖.(圖中月份代碼1至13分別對(duì)應(yīng)2019年H月至2020年11月)()

A當(dāng)月在手二手房

L°4-均儕....

1.02-???*

1.00-??

0.98-?*

0.96-

?

0.94-

°12345678910111213月份代碼x

根據(jù)散點(diǎn)圖選擇、=。+6?和'=。+〃111萬兩個(gè)模型進(jìn)行擬合,經(jīng)過數(shù)據(jù)處理得到的兩個(gè)回歸方程分別為

y=0.9369+0.0285石和y=0.9554+0.0306Inx,并得到以下一些統(tǒng)計(jì)量的值:

)=0.9369+0.0285&y=0.9554+0.03061nx

R20.9230.973

注:£是樣本數(shù)據(jù)中關(guān)的平均數(shù),亍是樣本數(shù)據(jù)中了的平均數(shù),則于列說法不一定成立的是()

A.當(dāng)月在售二手房均價(jià)y與月份代碼x呈正相關(guān)關(guān)系

B.根據(jù)>=0.9369+0.02856可以預(yù)測(cè)2021年2月在售二手房均價(jià)約為1.0509萬元/平方米

C.曲線y=0.9369+0.02854與y=0.9554+0.0306Inx的圖形經(jīng)過點(diǎn)(x,y)

D.y=0.9554+0.0306Inx回歸曲線的擬合效果好于_y=0.9369+0.0285Vx

例9.(2022?全國(guó)?高三專題練習(xí))一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集了6組觀測(cè)數(shù)據(jù),y(單位:

個(gè))與溫度x(單位:℃)得到樣本數(shù)據(jù)(8%)(i=l,2,3,4,5,6),令z,=ln/,并將(4馬)繪制成

如圖所示的散點(diǎn)圖.若用方程y=ae"對(duì)y與x的關(guān)系進(jìn)行擬合,則()

z八

4■

3-??

2-?,,

1-,

——I——I——I——I——I——I-

20212223242526x

A.a>l,b>0B.a>l,b<0

C.Ovavl,b>0D.0<a<l,b<0

變式13.(2022?全國(guó)?高三專題練習(xí))用模型y=a*M(a>0)擬合一組數(shù)據(jù)時(shí),令z=lny,將其變換后得到

h

回歸直線方程z=2x+a,則一=()

a

A.eB.—C.—D.2

e2

變式14.(2022?全國(guó)?高三專題練習(xí))在一組樣本數(shù)據(jù)(4丹),(巧,%),匕,(天,為)的散點(diǎn)圖中,若所有

7

樣本點(diǎn)(4%)(,=1,2,L,7)都在曲線y=aln(%-1895)+12.15附近波動(dòng),經(jīng)計(jì)算T895)=210.77,

z=i

77

=73.50,^ln(x,.-1895)=23.10,則實(shí)數(shù)。=()

Z=1Z=1

A.一0.5B.0.5C.-iD.1

變式15.(2022?全國(guó)?高三專題練習(xí))如圖是一組實(shí)驗(yàn)數(shù)據(jù)構(gòu)成的散點(diǎn)圖,以下函數(shù)中適合作為》與無的回

歸方程的類型是()

2x

A.y=ax+bB.y=ax+cc.y=b\ogax+cD.y=ba+c

變式16.(2022?全國(guó)?高三專題練習(xí))如圖是一組實(shí)驗(yàn)數(shù)據(jù)構(gòu)成的散點(diǎn)圖,以下函數(shù)中適合作為丫與x的回

歸方程的類型是()

?

x

x

A.y=ax+bB.y=ax"+cC.y=b\ogax+cD.y=ba+c

變式17.(多選題)(2022?全國(guó)?高三專題練習(xí))在對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩個(gè)變量

不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利

用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散

點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()

A.y-cxx+c2x

C.y=q+ln(x+c2)

變式18.(2022?全國(guó)?高三專題練習(xí))我國(guó)為全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家,制定了從2021年到2025年的“十

四五”規(guī)劃.某企業(yè)為響應(yīng)國(guó)家號(hào)召,匯聚科研力量,加強(qiáng)科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金.現(xiàn)該企業(yè)為了了

解年研發(fā)資金投入額x(單位:億元)對(duì)年盈利額》(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)

劃發(fā)展期間近10年年研發(fā)資金投入額占和年盈利額%的數(shù)據(jù).通過對(duì)比分析,建立了兩個(gè)函數(shù)模型:①

y=a+歐;②y=其中a、夕、彳、t均為常數(shù),e為自然對(duì)數(shù)的底數(shù).令%=X;,”=In%G=1,2,…,10),

經(jīng)計(jì)算得如下數(shù)據(jù):

1010

XS(x-y)2u

Z=1Z=1

26215652680

10°101010

£(x,.-x)(v,.-v)

V力%-7)ZU-7)2

?=1Z=1i=li=\

5.36112501302.612

(1)請(qǐng)從相關(guān)系數(shù)的角度,分析哪一個(gè)模型擬合程度更好?

(2)根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于尤的回歸方程;(系數(shù)精確到o.oi)

(3)若希望2021年盈利額y為250億元,請(qǐng)預(yù)測(cè)2021年的研發(fā)資金投入額了為多少億元.(結(jié)果精確到0.01)

變式19.(2022.全國(guó)?高三專題練習(xí))在疫情防控常態(tài)化的背景下,山東省政府各部門在保安全,保穩(wěn)定的

前提下有序恢復(fù)生產(chǎn),生活和工作秩序,五一期間,文旅部門在落實(shí)防控舉措的同時(shí),推出了多款套票文

旅產(chǎn)品,得到消費(fèi)者的積極回應(yīng).下面是文旅部門在某地區(qū)推出六款不同價(jià)位的旅游套票,每款的套票價(jià)

格x(單位:元)與購(gòu)買人數(shù)y(單位:萬人)的數(shù)據(jù)如下表:

旅游類別城市展館科技游鄉(xiāng)村特色游齊魯紅色游登山套票游園套票觀海套票

套票價(jià)格X(元)394958677786

購(gòu)買數(shù)量y(萬人)16.718.720.622.524.125.6

在分析數(shù)據(jù)、描點(diǎn)繪圖中,發(fā)現(xiàn)散點(diǎn)(匕,①集中在一條直線附近,其中”=1叫,co,.=lny;

6666

附:①可能用到的數(shù)據(jù):?>叫=753£匕=246?>產(chǎn)1832>;=101.4.

i=\i=\i=\z=l

②對(duì)于一組數(shù)據(jù)(匕,sj,?,①2),…,3,3”),其回歸直線質(zhì)=加+<5的斜率和截距的最小二乘估計(jì)值分別

£vimi-rivm

^b=—..................,a=m-bv

”-怖2

,=i

(1)根據(jù)所給數(shù)據(jù),求y關(guān)于龍的回歸方程;

ee

(2)按照文旅部門的指標(biāo)測(cè)定,當(dāng)購(gòu)買數(shù)量y與套票價(jià)格x的比在區(qū)間-,-上時(shí),該套票受消費(fèi)者的歡迎

程度更高,可以被認(rèn)定為“熱門套票”,現(xiàn)有三位同學(xué)從以上六款旅游套票中,購(gòu)買不同的三款各自旅游.記

三人中購(gòu)買“熱門套票”的人數(shù)為X,求隨機(jī)變量X的分布列和期望.

變式20.(2022.全國(guó)?高三專題練習(xí))數(shù)據(jù)顯示,中國(guó)在線直播用戶規(guī)模及在線直播購(gòu)物規(guī)模近幾年都保持

高速增長(zhǎng)態(tài)勢(shì),下表為2017—2021年中國(guó)在線直播用戶規(guī)模(單位:億人),其中2017年—2021年對(duì)應(yīng)的

代碼依次為1—5.

年份代碼尤12345

市場(chǎng)規(guī)模y3.984.565.045.866.36

參考數(shù)據(jù):歹=5.16,V=1.68,^v,.y,.=45.10,其中匕=嘉.

1=1

參考公式:對(duì)于一組數(shù)據(jù)(qyj,(v2,%),…,(匕,%),其回歸直線5=加+力的斜率和截距的最小二乘

2匕%一〃藥

估計(jì)公式分別為3=嚀--------,a=y-bv.

2—2

匕一次

Zz=i

(1)由上表數(shù)據(jù)可知,可用函數(shù)模型9=+d擬合y與x的關(guān)系,請(qǐng)建立y關(guān)于x的回歸方程(6,g的值

精確到0.01);

(2)已知中國(guó)在線直播購(gòu)物用戶選擇在品牌官方直播間購(gòu)物的概率為p,現(xiàn)從中國(guó)在線直播購(gòu)物用戶中隨機(jī)抽

取4人,記這4人中選擇在品牌官方直播間購(gòu)物的人數(shù)為X,若P(X=3)=尸(X=4),求X的分布列與期

望.

變式21.(2022?湖南.長(zhǎng)沙市明德中學(xué)高三開學(xué)考試)近期國(guó)內(nèi)疫情反復(fù),對(duì)我們的學(xué)習(xí)生活以及對(duì)各個(gè)行

業(yè)影響都比較大,某房地產(chǎn)開發(fā)公司為了回籠資金,提升銷售業(yè)績(jī),讓公司旗下的某個(gè)樓盤統(tǒng)一推出了為

期10天的優(yōu)惠活動(dòng),負(fù)責(zé)人記錄了推出活動(dòng)以后售樓部到訪客戶的情況,根據(jù)記錄第一天到訪了12人次,

第二天到訪了22人次,第三天到訪了42人次,第四天到訪了68人次,第五天到訪了132人次,第六天到

訪了202人次,第七天到訪了392人次,根據(jù)以上數(shù)據(jù),用x表示活動(dòng)推出的天數(shù),y表示每天來訪的人次,

繪制了以下散點(diǎn)圖.

八川人次)

400

350

300

250

200

150

100

50

O

⑴請(qǐng)根據(jù)散點(diǎn)圖判斷,以下兩個(gè)函數(shù)模型y=a+法與y=(c,d均為大于零的常數(shù))哪一個(gè)適宜作為

人次y關(guān)于活動(dòng)推出天數(shù)元的回歸方程類型?(給出判斷即可,不必說明理由);

(2)根據(jù)(1)的判斷結(jié)果及下表中的數(shù)據(jù),求y關(guān)于元的回歸方程,并預(yù)測(cè)活動(dòng)推出第8天售樓部來訪的入

17

次,參考數(shù)據(jù):其中匕=lg、,v=-Xvz.

'z=l

7

£%匕084

V1O

Z=1

1.8458.556.9

八z七/一〃孫

線性回歸方程:§=》%+金,其中B=t---------丁,金=丁一令%.

2X;-

i=l

(3)己知此樓盤第一天共有10套房源進(jìn)行銷售,其中6套正價(jià)房,4套特價(jià)房,設(shè)第一天賣出的4套房中特

價(jià)房的數(shù)量為久求4的分布列與數(shù)學(xué)期望.

題型四:獨(dú)立性檢驗(yàn)

例10.(2022?江蘇?南京市秦淮中學(xué)高三階段練習(xí))某校為引導(dǎo)學(xué)生學(xué)習(xí)黨史,校黨委宣傳組織了黨史知識(shí)

競(jìng)賽,對(duì)前來參賽的150名學(xué)生(男生100人,女生50人),成績(jī)不低于80分的學(xué)生為“黨史達(dá)人”,成績(jī)

低于80分的學(xué)生為“非黨史達(dá)人”,統(tǒng)計(jì)了他們的成績(jī)情況,結(jié)果如下:男生中有60人被評(píng)為“黨史達(dá)人”,

女生中有40人被評(píng)為“黨史達(dá)人”.

(1)完善列聯(lián)表,并判斷:是否有99%的把握認(rèn)為黨史成績(jī)優(yōu)秀與否與性別有關(guān)?

性別

黨史達(dá)人非黨史達(dá)人

是否為黨史達(dá)人

男生

女生

(2)如果用這150名學(xué)生中,男生和女生“黨史達(dá)人”的頻率分別代替該校男生和女生被評(píng)為“黨史達(dá)人”的概

率,且每位學(xué)生是否被評(píng)為“黨史達(dá)人”相互獨(dú)立,現(xiàn)從該校學(xué)生中隨機(jī)抽取3人(2男1女),設(shè)隨機(jī)變量X

表示“3人中黨史達(dá)人”的人數(shù),試求X的分布列和數(shù)學(xué)期望.

n(ad-bc)2

附:K2=n=a+b+c+d

(a+/?)(c+d)(a+c)(6+d)'

P(K2>k]0.100.050.0250.010.005

k2.7063.8415.0246.6357.879

例11.(2022?四川?樹德中學(xué)高三階段練習(xí)(文))根據(jù)分類變量x與y的觀察數(shù)據(jù),計(jì)算得至1」片=2.974.依

據(jù)下面給出的臨界值表,

0.500.400.250.150.100.050.0250.0100.005

k00.4550.7081.3232.0722.7063.8415.0246.6357.879

可知下列判斷中正確的是()

A.有95%的把握認(rèn)為變量x與y獨(dú)立

B.有95%的把握認(rèn)為變量x與y不獨(dú)立

C.變量x與y獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過10%

D.變量x與y不獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過10%

例12.(2022?浙江省蒼南中學(xué)高三階段練習(xí))在新高考改革中,浙江省新高考實(shí)行的是7選3的3+3模式,

即語數(shù)外三門為必考科目,然后從物理、化學(xué)、生物、政治、歷史、地理、技術(shù)(含信息技術(shù)和通用技術(shù))

7門課中選考3門.某校高二學(xué)生選課情況如下列聯(lián)表一和列聯(lián)表二(單位:人)

選物理不選物理總計(jì)

男生340110450

女生140210350

總計(jì)480320800

表一

選生物不選生物總計(jì)

男生150300450

女生150200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論