31回歸分析的基本思想及其初步應用(一)課件1_第1頁
31回歸分析的基本思想及其初步應用(一)課件1_第2頁
31回歸分析的基本思想及其初步應用(一)課件1_第3頁
31回歸分析的基本思想及其初步應用(一)課件1_第4頁
31回歸分析的基本思想及其初步應用(一)課件1_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2022/12/10鄭平正制作3.1回歸分析的基本思想及其初步應用(一)高二數學選修2-32022/12/10鄭平正制作3.1回歸分析的基本思想(一)回顧:數學3——線性回歸分析的步驟:溫故知新1、畫散點圖4、用回歸直線方程進行預報3、求回歸直線方程

2、求(一)回顧:數學3——線性回歸分析的步驟:溫故知新1、畫散

(二)最小二乘估計公式:稱為樣本點的中心。(二)最小二乘估計公式:稱為樣本點的中心。

(三)描述兩個變量之間線性相關關系的強弱的相關系數r(三)描述兩個變量之間線性相關關系的強弱的相關系數r課前檢測:假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統計資料。使用年限x23456維修費用y2.23.85.56.57.0若由資料知,y對x呈線性相關關系。試求:(1)線性回歸方程的回歸系數;(2)估計使用年限為10年時,維修費用是多少?使用年限為10年時,維修費用是:12.38萬元課前檢測:假設關于某設備的使用年限x和所支出的維修費用例2、在一段時間內,某中商品的價格x元和需求量Y件之間的一組數據為:求出Y對的回歸直線方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753解:例2、在一段時間內,某中商品的價格x元和需求量Y件之間的一組例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。問題呈現:女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1解;1.由于問題中要求根據身高預報體重,因此選取身高為自變量x,體重為因變量y.3.回歸方程:2.散點圖;4.本例中,r=0.798>0.75.這表明體重與身高有很強的線性相關關系,從而也表明我們建立的回歸模型是有意義的。解;1.由于問題中要求根據身高預報體重,因此選取身高為自變探究:身高為172cm的女大學生的體重一定是60.316kg嗎?如果不是,你能解析一下原因嗎?答:身高為172cm的女大學生的體重不一定是60.316kg,但一般可以認為她的體重接近于60.316kg。探究:答:身高為172cm的女大學生的體重不一定是60.31例1從某大學中隨機選取8名女大學生,其身高和體重數據如表所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表所解;1.由于問題中要求根據身高預報體重,因此選取身高為自變量x,體重為因變量y.3.回歸方程:2.散點圖;4.本例中,r=0.798>0.75.這表明體重與身高有很強的線性相關關系,從而也表明我們建立的回歸模型是有意義的。解;1.由于問題中要求根據身高預報體重,因此選取身高為自變例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表131回歸分析的基本思想及其初步應用(一)課件1我們可以用下面的線性回歸模型來表示:y=bx+a+e,

(3)其中a和b為模型的未知參數,e稱為隨機誤差。y=bx+a+e,E(e)=0,D(e)=

(4)

在線性回歸模型(4)中,隨機誤差e的方差越小,通過回歸直線(5)預報真實值y的精度越高。我們可以用下面的線性回歸模型來表示:y=bx+a+e,E(e例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1我們可以用下面的線性回歸模型來表示:y=bx+a+e,

(3)其中a和b為模型的未知參數,e稱為隨機誤差。y=bx+a+e,E(e)=0,D(e)=

(4)

在線性回歸模型(4)中,隨機誤差e的方差越小,通過回歸直線(5)預報真實值y的精度越高。隨機誤差是引起預報值與真實值y之間的誤差的原因之一,其大小取決于隨機誤差的方差。另一方面,由于公式(1)和(2)中和為截距和斜率的估計值,它們與真實值a和b之間也存在誤差,這種誤差是引起預報值與真實值y之間誤差的另一個原因。我們可以用下面的線性回歸模型來表示:y=bx+a+e,E(e

假設1:身高和隨機誤差的不同不會對體重產生任何影響,54.554.554.554.554.554.554.554.5體重/kg170155165175170157165165身高/cm87654321編號54.5kg怎樣研究隨即誤差?假設1:身高和隨機誤差的不同不會對體重產生任何5943616454505748體重/kg170155165175170157165165身高/cm87654321編號

例如,編號為6的女大學生的體重并沒有落在水平直線上,她的體重為61kg。解釋變量(身高)和隨機誤差共同把這名學生的體重從54.5kg“推”到了61kg,相差6.5kg,所以6.5kg是解釋變量和隨機誤差的組合效應。用這種方法可以對所有預報變量計算組合效應。數學上,把每個效應(觀測值減去總的平均值)的平方加起來,即用表示總的效應,稱為總偏差平方和。5943616454505748體重/kg1701551655943616454505748體重/kg170155165175170157165165身高/cm87654321編號

假設2:隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。怎樣研究隨即誤差?5943616454505748體重/kg170155165

因此,數據點和它在回歸直線上相應位置的差異是隨機誤差的效應,稱為殘差。例如,編號為6的女大學生,計算隨機誤差的效應(殘差)為:對每名女大學生計算這個差異,然后分別將所得的值平方后加起來,用數學符號稱為殘差平方和,它代表了隨機誤差的效應。表示為:因此,數據點和它在回歸直線上相應位置的差異我們可以用相關指數R2來刻畫回歸的效果,其計算公式是如何衡量預報的精度?顯然,R2的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。

如果某組數據可能采取幾種不同回歸方程進行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較大的模型作為這組數據的模型。我們可以用相關指數R2來刻畫回歸的效果,其計算公式是如何衡量學以致用:1、在對兩個變量X,Y進行線性回歸分析時有下列步驟:①對所求出的回歸方程作出解釋,②收集數據(,)③求線性回歸方程,④求相關系數,⑤根據所搜集的數據繪制散點圖.如果根據可靠性要求能夠作出變量X,Y具有線性相關結論,則在下列操作順序中正確的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①學以致用:1、在對兩個變量X,Y進行線性回歸分析時有下列步學以致用:2、對于相關指數,下列說法正確的是()A、的取植越小,模型擬合效果越好B、的取值可以是任意大,且取值越大擬合效果越好C、的取值越接近1,模型擬合效果越好D、以上答案都不對學以致用:2、對于相關指數,下列說法正確的是()A學以致用:3、甲、乙、丙,丁四位同學各自對A,B兩變量的線性相關性做實驗,并用回歸分析方法分別求得相關系數r與殘差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103則哪位同學的實驗結果體現A,B兩變量有更強的線性相關性A.甲B.乙C.丙D.丁學以致用:3、甲、乙、丙,丁四位同學各自對A,B兩變量的線性學以致用:4、已知兩個變量x和y之間有線性相關性,4次實驗得到樣本如下:6.13.920y3210x(1)則y對x的線性回歸方程是___________(2)相應于各樣本點的殘差(i=1,2,3,4)分別是__,___,___,___.殘差平方和是___________學以致用:4、已知兩個變量x和y之間有線性相關性,4次實驗課堂總結:1、線性回歸分析的步驟2、回歸模型的建立3、隨機誤差的研究知識小節:數學思想小結:1、最小二乘法思想2、函數與方程的思想3、數形結合課堂總結:1、線性回歸分析的步驟知識小節:數學思想小結:1、2022/12/10鄭平正制作3.1回歸分析的基本思想及其初步應用(一)高二數學選修2-32022/12/10鄭平正制作3.1回歸分析的基本思想(一)回顧:數學3——線性回歸分析的步驟:溫故知新1、畫散點圖4、用回歸直線方程進行預報3、求回歸直線方程

2、求(一)回顧:數學3——線性回歸分析的步驟:溫故知新1、畫散

(二)最小二乘估計公式:稱為樣本點的中心。(二)最小二乘估計公式:稱為樣本點的中心。

(三)描述兩個變量之間線性相關關系的強弱的相關系數r(三)描述兩個變量之間線性相關關系的強弱的相關系數r課前檢測:假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統計資料。使用年限x23456維修費用y2.23.85.56.57.0若由資料知,y對x呈線性相關關系。試求:(1)線性回歸方程的回歸系數;(2)估計使用年限為10年時,維修費用是多少?使用年限為10年時,維修費用是:12.38萬元課前檢測:假設關于某設備的使用年限x和所支出的維修費用例2、在一段時間內,某中商品的價格x元和需求量Y件之間的一組數據為:求出Y對的回歸直線方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753解:例2、在一段時間內,某中商品的價格x元和需求量Y件之間的一組例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。問題呈現:女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1解;1.由于問題中要求根據身高預報體重,因此選取身高為自變量x,體重為因變量y.3.回歸方程:2.散點圖;4.本例中,r=0.798>0.75.這表明體重與身高有很強的線性相關關系,從而也表明我們建立的回歸模型是有意義的。解;1.由于問題中要求根據身高預報體重,因此選取身高為自變探究:身高為172cm的女大學生的體重一定是60.316kg嗎?如果不是,你能解析一下原因嗎?答:身高為172cm的女大學生的體重不一定是60.316kg,但一般可以認為她的體重接近于60.316kg。探究:答:身高為172cm的女大學生的體重不一定是60.31例1從某大學中隨機選取8名女大學生,其身高和體重數據如表所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表所解;1.由于問題中要求根據身高預報體重,因此選取身高為自變量x,體重為因變量y.3.回歸方程:2.散點圖;4.本例中,r=0.798>0.75.這表明體重與身高有很強的線性相關關系,從而也表明我們建立的回歸模型是有意義的。解;1.由于問題中要求根據身高預報體重,因此選取身高為自變例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表131回歸分析的基本思想及其初步應用(一)課件1我們可以用下面的線性回歸模型來表示:y=bx+a+e,

(3)其中a和b為模型的未知參數,e稱為隨機誤差。y=bx+a+e,E(e)=0,D(e)=

(4)

在線性回歸模型(4)中,隨機誤差e的方差越小,通過回歸直線(5)預報真實值y的精度越高。我們可以用下面的線性回歸模型來表示:y=bx+a+e,E(e例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359女大學生的身高與體重例1從某大學中隨機選取8名女大學生,其身高和體重數據如表1我們可以用下面的線性回歸模型來表示:y=bx+a+e,

(3)其中a和b為模型的未知參數,e稱為隨機誤差。y=bx+a+e,E(e)=0,D(e)=

(4)

在線性回歸模型(4)中,隨機誤差e的方差越小,通過回歸直線(5)預報真實值y的精度越高。隨機誤差是引起預報值與真實值y之間的誤差的原因之一,其大小取決于隨機誤差的方差。另一方面,由于公式(1)和(2)中和為截距和斜率的估計值,它們與真實值a和b之間也存在誤差,這種誤差是引起預報值與真實值y之間誤差的另一個原因。我們可以用下面的線性回歸模型來表示:y=bx+a+e,E(e

假設1:身高和隨機誤差的不同不會對體重產生任何影響,54.554.554.554.554.554.554.554.5體重/kg170155165175170157165165身高/cm87654321編號54.5kg怎樣研究隨即誤差?假設1:身高和隨機誤差的不同不會對體重產生任何5943616454505748體重/kg170155165175170157165165身高/cm87654321編號

例如,編號為6的女大學生的體重并沒有落在水平直線上,她的體重為61kg。解釋變量(身高)和隨機誤差共同把這名學生的體重從54.5kg“推”到了61kg,相差6.5kg,所以6.5kg是解釋變量和隨機誤差的組合效應。用這種方法可以對所有預報變量計算組合效應。數學上,把每個效應(觀測值減去總的平均值)的平方加起來,即用表示總的效應,稱為總偏差平方和。5943616454505748體重/kg1701551655943616454505748體重/kg170155165175170157165165身高/cm87654321編號

假設2:隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。怎樣研究隨即誤差?5943616454505748體重/kg170155165

因此,數據點和它在回歸直線上相應位置的差異是隨機誤差的效應,稱為殘差。例如,編號為6的女大學生,計算隨機誤差的效應(殘差)為:對每名女大學生計算這個差異,然后分別將所得的值平方后加起來,用數學符號稱為殘差平方和,它代表了隨機誤差的效應。表示為:因此,數據點和它在回歸直線上相應位置的差異我們可以用相關指數R2來刻畫回歸的效果,其計算公式是如何衡量預報的精度?顯然,R2的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。

如果某組數據可能采取幾種不同回歸方程進行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論