1.1《回歸分析的基本思想及其初步應用》(1課時)_第1頁
1.1《回歸分析的基本思想及其初步應用》(1課時)_第2頁
1.1《回歸分析的基本思想及其初步應用》(1課時)_第3頁
1.1《回歸分析的基本思想及其初步應用》(1課時)_第4頁
1.1《回歸分析的基本思想及其初步應用》(1課時)_第5頁
已閱讀5頁,還剩10頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數學統計畫散點圖了解最小二乘法的思想求回歸直線方程ybxa用回歸直線方程解決應用問題選修-統計案例引入線性回歸模型ybxae了解模型中隨機誤差項e產生的原因了解相關指數 R2 和模型擬合的效果之間的關系了解殘差圖的作用利用線性回歸模型解決一類非線性回歸問題正確理解分析方法與結果回歸分析的內容與步驟:最后,是利用回歸模型,根據自變量去估計、預測因變量。 回歸分析通過一個變量或一些變量的變化解釋另一變量的變化。 其主要內容和步驟是,首先根據理論和對問題的分析判斷,將變量分為自變量和因變量;其次,設法找出合適的數學方程式(即回歸模型)描述變量間的關系;第三,由于涉及到的變量具有不確定性,接著還要對回

2、歸模型進行統計檢驗;編 號12345678身高/cm165165 157 170 175 165 155 170體重/kg 4857 50 54 64 61 43 59例1 :從某大學中隨機選取8名女大學生, 其身高和體重數據如下表所示 求根據一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重. 案例1:女大學生的身高與體重1.作散點圖選取身高為自變量x,體重為因變量y由散點圖知道身高和體重有比較好的線性相關關系,因此可以用線性回歸方程刻畫它們之間的關系。2.求回歸直線(同學們完成)編 號12345678身高/cm165165 157 170 175 165

3、155 170體重/kg 4857 50 54 64 61 43 593.當x=172時,y=60.316(kg) 思考:身高為172cm的女大學生的體重 一定是60.316kg嗎?通過探討發現:體重與身高之間的關系不能用一次函數y=bx+a來嚴格的刻畫.探究P3:身高為172cm的女大學生的體重一定是60.316k嗎?如果不是,你能解析一下原因嗎?我們可以用下面的線性回歸模型來表示: y=bx+a+e,其中a和b為模型的未知參數,e稱為隨機誤差。答:身高為172cm的女大學生的體重不一定是60.316kg,但一般可以認為她的體重在60.316kg左右。思考P4產生隨機誤差項e的原因是什么?隨

4、機誤差e的來源(可以推廣到一般):1、其它因素的影響:影響身高 y 的因素不只是體重 x,可能 還包括遺傳基因、飲食習慣、生長環境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高 y 的觀測誤差。表1-4列出了女大學生身高和體重的原始數據以及相應的殘差數據。 在研究兩個變量間的關系時,首先要根據散點圖來粗略判斷它們是否線性相關,是否可以用回歸模型來擬合數據。殘差分析與殘差圖的定義: 然后,我們可以通過殘差 來判斷模型擬合的效果,判斷原始數據中是否存在可疑數據,這方面的分析工作稱為殘差分析。編號12345678身高/cm165165157170175165155170體重/kg485

5、7505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382 我們可以利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖。殘差圖的制作及作用。坐標縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點應該分布在以橫軸為心的帶形區域;對于遠離橫軸的點,要特別注意。身高與體重殘差圖異常點 錯誤數據 模型問題 幾點說明: 第一個樣本點和第6個樣本點的殘差比較大,需要確認在采集過程中是否有人為的錯誤。如果數據采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數

6、據;如果數據采集沒有錯誤,則需要尋找其他的原因。 另外,殘差點比較均勻地落在水平的帶狀區域中,說明選用的模型計較合適,這樣的帶狀區域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高。我們可以用相關指數R2來刻畫回歸的效果,其計算公式是另外,顯然,R2的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。在線性回歸模型中,R2表示解析變量對預報變量變化的貢獻率。 總的來說:相關指數R2是度量模型擬合效果的一種指標。在線性模型中,它代表自變量刻畫預報變量的能力。R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差用身高預報體重時,需要注意下列問題:1、回歸方程只適用于我們所研究

7、的樣本的總體;2、我們所建立的回歸方程一般都有時間性;3、樣本采集的范圍會影響回歸方程的適用范圍;4、不能期望回歸方程得到的預報值就是預報變量的精確值。 事實上,它是預報變量的可能取值的平均值。這些問題也適用于其他問題。涉及到統計的一些思想:模型適用的總體;模型的時間性;樣本的取值范圍對模型的影響;模型預報結果的正確理解。小結:一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解析變量,哪個變量是預報變量。(2)畫出確定好的解析變量和預報變量的散點圖,觀察它們之間的關系 (如是否存在線性關系等)。(3)由經驗確定回歸方程的類型(如我們觀察到數據呈線性關系, 則選用線性 回歸方

8、程y=bx+a).(4)按一定規則估計回歸方程中的參數(如最小二乘法)。(5)得出結果后分析殘差圖是否有異常(個別數據對應殘差過大,或殘差 呈現不隨機的規律性,等等),如果存在異常,則檢查數據是否有誤, 或模型是否合適等。例1 假設關于某設備的使用年限x和所有支出的維修費用y(萬元)有如下的統計數據:x23456Y2.23.85.56.57.0試求:對變量y與x進行相關性檢驗求回歸直線根據你得到的模型,預報使用年限為10年時,維修費用是多少?你認為這個模型能較好地刻畫年限與維修費用的關系嗎? 請說明理由詳細解題過程例2 (2007年廣東)下表提供了某廠節能降耗技術改造后生產甲產品過程中記錄的產量x(噸)與相應的生產能耗y (噸標準煤)的幾組對應數據。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論