(教案)1.1回歸分析的基本思想及其初步應用_第1頁
(教案)1.1回歸分析的基本思想及其初步應用_第2頁
(教案)1.1回歸分析的基本思想及其初步應用_第3頁
(教案)1.1回歸分析的基本思想及其初步應用_第4頁
(教案)1.1回歸分析的基本思想及其初步應用_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精品1.1回歸分析的基本思想及其初步應用授課教師: 王宏 郭懿 教學重點:(1)通過對實際問題的分析,了解回歸分析的必要性與回歸分析的 一般步驟;了解線性回歸模型與函數模型的區別;(2)嘗試做散點圖,求回歸直線方程;(3)能用所學的知識對實際問題進行回歸分析,體會回歸分析的實 際價值與基本思想;了解判斷刻畫回歸模型擬合好壞的方法一一糕指 數和殘差分析。教學難點:(1)求回歸直線方程,會用所學的知識對實際問題進行回歸分析.(2)掌握回歸分析的實際價值與基本思想.(3)能運用自己所學的知識對具體案例進行檢驗與說明.(4)殘差變量的解釋; (5)偏差平方和分解的思想;教學內容:一、基礎知識梳理1 .

2、回歸直線:如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這 兩個變量之間具有線性相關關系,這條直線叫作回歸直線。求回歸直線方程的一般步驟:作出散點圖(由樣本點是否呈條狀分布 來判斷兩個量是否具有線性相關關系),若存在線性相關關系一求 回歸系數一寫出回歸直線方程,并利用回歸直線方程進行預測說 明.2 .回歸分析:對具有相關關系的兩個變量進行統計分析的一種常用方 法。建立回歸模型的基本步驟是:確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量; 畫好確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系 (線性關系).由經驗確定回歸方程的類型.按一定規則估計回歸方程中的參數(最小

3、二乘法);得出結論后在分析殘差圖是否異常,若存在異常,則檢驗數據是否 有誤,后模型是否合適等.3 .利用統計方法解決實際問題的基本步驟:(1)提出問題;(2)收集數據;(3)分析整理數據;(4)進行 預測或決策。4 .殘差變量白的主要來源:(1)用線性回歸模型近似真實模型(真實模型是客觀存在的,通常 我們并不知道真實模型到底是什么)所引起的誤差。可能存在非線性 的函數能夠更好地描述)與x之間的關系,但是現在卻用線性函數 來表述這種關系,結果就會產生誤差。這種由于模型近似所引起的誤 差包含在學中。(2)忽略了某些因素的影響。影響變量尸的因素不只變量入一個, 可能還包含其他許多因素(例如在描述身高

4、和體重關系的模型中,體 重不僅受身高的影響,還會受遺傳基因、飲食習慣、生長環境等其他因素的影響),但 通常它們每一個因素的影響可能都是比較小的,它 們的影響都體現在營中。(3)觀測誤差。由于測量工具等原因,得到的 的觀測值一般是有 誤差的(比如一個人的體重是確定的數,不同的秤可能會得到不同的 觀測值,它們與真實值之間存在誤差),這樣的誤差也包含在白中。 上面三項誤差越小,說明我們的回歸模型的擬合效果越好。二、例題選講 例1:研究某灌溉渠道水的流速 與水深式 之間的關系,測得一組數據如下:水深力物1.401.501.601.701.801.902.002.10流速1.701.791.881.95

5、2.032.102.162.21(1)求產對X的回歸直線方程;(2 )預測水深為1.95沿 時水的流速是多少? 分析:本題考查如何求回歸直線的方程,可先把有關數據用散點圖表 示出來,若這些點大致分布在通過散點圖中心的一條直線附近,說明 這兩個變量線性相關,從而可利用我們學過的最小二乘估計思想及計 算公式求得線性回歸直線方程(1)由于問題中要求根據水深預報水的流速,因此選取水深為解釋變量,流速為預報變量,作散點圖:15 -144111HN。 x/m由圖容易看出,或 與T之間有近似的線性關系,或者說,可以用一個回歸直線方程A 1 1-b = 0.7330.694產取來反映這種關系。由計算器求得15

6、。對或的回歸直線方程為W0.733工十0.694 。(2)由(1)中求出的回歸直線方程,把x = L95代入,易得9 = 0.7g乂 195-0694 劉 2.12(掰曲)- o計算結果表示,當水深為茄 時可以預測渠水的流速為0評注:建立回歸模型的一般步驟:(1)確定研究對象,明確兩個變量即解釋變量和預報變量;(2)畫出散點圖,觀察它們之間的關系;(3)由經驗確定回歸方程類型(若呈線性關系,選用線性回歸方程);(4)按一定規則估計回歸方程中的參數(如最小二乘法);(5)得出結果后分析殘差圖是否有異常(個別數據對應殘差過大, 或殘差出現不隨機的規律性,等等),若存在異常,則檢查數據是否 有誤,或

7、模型是否合適等。例2: 1993年到2002年中國的國內生產總值(GDP)的數據如下:年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197314.8-可編輯-2002104790.6作GDP和年份的散點圖,根據該圖猜想它們之間的關系應是什么建立年份為解釋變量,GDP為預報變量的回歸模型,并計算殘差根據你得到的模型,預報2003年的GDP,并查閱資料,看看你 的預報與實際GDP的誤差是多少。你認為這個模型能較好地刻畫GDP和年份的關系嗎?請說明理 由。

8、解:(1)由表中數據制作的散點圖如下:從散點圖中可以看出GDP值與年份近線呈線性關系;用yt表示GDP值,t表示年份,根據截距和斜率的最小二乘計算公式,得:阪-142g25”729年用7191969從而得線性回歸方程:y = 7191%9t-14292537 729殘差計算結果見下表:GDP值與年份線性擬合殘差表年19931994199519961997殘-6422.269-1489.2383037.4935252.0244638.055年19981999200020012002殘1328.685-2140.984-1932.353-1277.622-993.7912003 年的GDP預報值為

9、112976.360,根據國家統計局2004 年統計,2003年實際GDP值為117251.9 ,所以預報與實際相 -4275.540;上面建立的回歸方程的R2=0.974 ,說明年份能夠解釋約97%的 GDP值變化,因此所建立的模型能夠很好地刻畫GDP和年份的關系。說明:關于2003年的GDP的值來源,不同的渠道可能會有所不同。例3:如下表所示,某地區一段時間內觀察到的大于或等于某震級x的地震個數為N,試建立回歸方程表述二者之間的關系震級33.23.43.63.844.24.44.64.85.0地震數2838120380147951069576415502384226981919135697

10、3震級5.25.45.65.866.26.46.66.87地震數74660443527420614898574125解:由表中數據得散點圖如下:從散點圖中可以看出,震級x與大于該震級的地震次數N之間不呈 線性相關關系,隨著x的減少,所考察的地震數N近似地以指數形 式增長.做變換y=lgN ,得到的數據如下表所示:x33.23.43.63.844.24.44.64.85y4.4534.3094.1704.0293.8833.7413.5853.4313.2833.1322.988x5.25.45.65.866.26.46.66.87y2.8732.7812.6382.4382.3142.1701

11、.9911.7561.6131.398x和y的散點圖如下:25 31K 3 4jO Q 5 0>6 0 .8.5 7j0 工5從這個散點圖中可以看出x和y之間有很強的線性相差性,因此可以用線性回歸模型擬合它們之間的關系。根據截距和斜率的最小二乘計算公式,得:6 704, £-0 741,故線性回歸方程為:-OKIk+ 6.704相關指數R2= 0.997,說明x可以解釋y的99.7%的變化。因此,可 以用回歸方程由=1加4Msm4描述x和y之間的關系。例4:電容器充電后,電壓達至,然后開始放電,由經驗知道, 此后電壓?隨時間£變化的規律公式口三以小之。)表示,觀測得時

12、 間網田時的電壓雙乃如下表所示:£012345678910U100755540302015101055試求電壓P 對時間2的回歸方程 分析:由于兩個變量不呈線性相關關系,所以不能直接利用線性回歸 方程來建立兩個變量之間的關系,我們可通過對數變換把指數關系變 為線性關系,通過線性回歸模型來建立? 與看之間的非線性回歸方 程。解:對兩邊取自然對數得現,令尸3M,即沙”由所給數據可得012345678910In W4.64.34.03.93.42.92.72.32.31.61.64clflb由散點圖可知與七具有線性相關關系,可用來表示。經計算得:£",嚴£遂&

13、quot;03:印6 (最小二乘法),.y= 一0.裁 +46即島口 = 一0至+4石。 所以,=產.評注:一般地,有些非線性回歸模型通過變換可以轉化為線性回歸模 型,即借助于線性回歸模型研究呈非線性回歸關系的兩個變量之間的 關系:(1)如果散點圖中的點分布在一個直線狀帶形區域,可以選用線性 回歸模型來建模;(2)如果散點圖中的點的分布在一個曲線狀帶形區域,要先對變量 作適當的變換,再利用線性回歸模型來建模。隨堂練習:1.對具有相關關系的兩個變量統計分析的一種常用的方法是()A.回歸分析 B.相關系數分析 C.殘差分析 D.相關指 數分析2 .在畫兩個變量的散點圖時,下面敘述正確的是 A.預報

14、變量在內軸上,解釋變量在丁軸上 上,預報變量在丁軸上C.可以選擇兩個變量中任意一個變量在黑軸上 變量中任意一個變量在7軸上3 .兩個變量相關性越強,相關系數?()A .越接近于0B.越接近于1( )B.解釋變量在界軸D.可以選擇兩個C.越接近于1D.絕對值越接近14.若散點圖中所有樣本點都在一條直線上,解釋變量與預報變量的相 關系數為()A. 0B.1C. 1D. 1 或 15.一位母親記錄了她兒子3到9歲的身高,數據如下表:年齡(歲13456789身高產)194.8104.2108.7117.8124.3130.8139.0由此她建立了身高與年齡的回歸模型尸= 73.93 + 719工,她用

15、這個模型預測兒子10歲時的身高,則下面的敘述正確的是()A.她兒子10歲時的身高一定是145.83匕淞 B.她兒子10歲時的身高在145.83.以上C.她兒子10歲時的身高在145.83 加 左右 D.她兒子10歲時的身高在145.83源以下八6 .兩個變量有線性相關關系且正相關,則回歸直線方程中,*二歷十口 的系數b ()A,:B :C> " -D. -7 .兩個變量有線性相關關系且殘差的平方和等于0,則()A.樣本點都在回歸直線上 B.樣本點都集中在回歸直線附近C.樣本點比較分散D.不存在規律8 .在建立兩個變量尸 與X的回歸模型中,分別選擇了 4個不同的模 型,它們的相關

16、指數屈如下,其中擬合最好的模型是()A.模型1的相關指數爐 為0.98B.模型2的相關指數爐 為0.80C.模型3的相關指數屈 為0.50D.模型4的相關指數爐 為0.259 .相關指數.010 .某農場對單位面積化肥用量川炮)和水稻相應產量炮)的關系 作了統計,得到數據如下:15202530354045卜330345365405445450455如果K與/之間具有線性相關關系,求出回歸直線方程,并預測當 單位面積化肥用量為無履 時水稻的產量大約是多少?(精確到 。跖)11 .假設美國10家最大的工業公司提供了以下數據:公司銷售總額經X1/百萬美元利潤X2/百萬美元通用汽車1269744224

17、福特969333835埃克森866563510BM634383758通用電氣552643939美孚509761809菲利普交1斯390692946克萊斯勒36156359杜邦352092480德士古324162413(1)作銷售總額和利潤的散點圖,根據該圖猜想它們之間的關系應 是什么形式; 建立銷售總額為解釋變量,利潤為預報變量的回歸模型,并計 算殘差;(3) 你認為這個模型能較好地刻畫銷售總額和利潤之間的關系 嗎?請說明理由。參考答案:A B D BC A A A一-丁京二1-軍-9 .口10 .由于問題中要求根據單位面積化肥用量預報水稻相應的產量,因此選取單位面積的化肥用量為解釋變量,相應

18、水稻的產量為預報變量,作散點圖:由圖容易看出,h與y之間有近似的線性關系,或者說,可以用一個回歸直線方程y = 3 來反映這種關系。由計算器求得方"上,”256.79。¥對或的回歸直線方程為戶4萬“256.T9( *)。由(*)中求出的回歸直線方程,把032代入巨陽 3二4乃乂32+256.79=408.79計算結果表示,當單位面積化肥用量為義炮時水稻的產量大約是 408.79ig.11 .將銷售總額作為橫軸,利潤作為縱軸,根據表中數據繪制散點圖如下:由于散點圖中的樣本點基本上在一個帶形區域分布,猜想銷售總額與 利潤之間呈現線性相關關系; 由最小二乘法的計算公式,得:1334.5,0.026 則線性回歸方程為:9 =其殘差值計算結果見下表:銷售總額12697496933866

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論