回歸分析的基本思想及應用_第1頁
回歸分析的基本思想及應用_第2頁
回歸分析的基本思想及應用_第3頁
回歸分析的基本思想及應用_第4頁
回歸分析的基本思想及應用_第5頁
已閱讀5頁,還剩70頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

精品資料精品資料●課程目標1.雙基目標(1)通過典型(diǎnxíng)案例的探究,進一步了解回歸分析的基本思想、方法及其初步應用.(2)通過典型(diǎnxíng)案例的探究,了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及其初步應用.2.情感目標本章提供了數據處理的方法,通過對數據的收集、整理和分析,使學生認識統計方法的直觀特點、增強學生的社會實踐能力,培養學生分析問題、解決問題的能力,養成科學嚴謹的良好品質.精品資料●重點難點本章重點:回歸分析、殘差分析、相關指數的意義以及獨立性檢驗中K2的有關計算.本章難點:借助于回歸分析的思想選擇恰當的模型擬合變量間的相關關系(尤其是非線性的),由于該部分內容的數據相對較復雜,故在高考(ɡāokǎo)中出現大題的可能性不是很大,應以選擇、填空題為主,旨在考察對回歸方程的求解及預測,K2的計算等.精品資料●學法探究本章內容是統計案例中常見方法中的兩種:回歸分析和獨立性的檢驗.通過對典型案例的學習,理解問題和方法的實質,進一步體會統計方法在解決實際問題中的基本(jīběn)思想.在學習過程中多與社會實踐相結合,親自動手實踐,加深對知識的認識,鞏固知識,不斷創新,多尋找規律,形成方法.精品資料1.1回歸分析的基本(jīběn)思想及其初步應用精品資料精品資料1.知識與技能通過收集現實問題中兩個有關聯變量的數據作出散點圖,并利用散點圖直觀認識變量間的相關關系.2.過程與方法通過求線性回歸方程,探究(tànjiū)相關性檢驗的基本思想.通過對典型案例的探究(tànjiū),體會回歸分析在生產實際和日常生活中的廣泛應用.精品資料精品資料本節重點:了解(liǎojiě)線性回歸模型與函數模型的差異,了解(liǎojiě)判斷刻畫模型擬合效果的方法——相關指數和殘差分析.本節難點:解釋殘差變量的含義,了解(liǎojiě)偏差平方和分解的思想.精品資料精品資料1.通過復習線性回歸方程,探究相關性檢驗的基本(jīběn)思想.2.培養類比、遷移、化歸的能力.精品資料精品資料一、相關關系的概念當一個變量取值一定(yīdìng)時,另一個變量的取值帶有一定(yīdìng)隨機性的兩個變量之間的關系叫做相關關系.二、回歸分析的相關概念1.回歸分析是處理兩個變量之間 的一種統計方法.若兩個變量之間具有線性相關關系,則稱相應的回歸分析為 .相關(xiāngguān)關系線性回歸分析精品資料精品資料3.線性相關關系強與弱的判斷:用 來描述線性相關關系的強弱.當r>0時,表明兩個變量 ;當r<0時,表明兩個變量 .r的絕對值越接近1,表明兩個變量的線性相關性越強;r的絕對值接近于0時,表明兩個變量之間 線性相關關系.通常當|r|大于 時,認為兩個變量有很強的線性相關關系.4.隨機誤差的概念:當樣本點散布在某一條(yītiáo)直線的附近,而不是在一條(yītiáo)直線上時,不能用一次函數y=bx+a來描述兩個變量之間的關系,而是用線性回歸模型

來表示,其中 為模型的未知參數, 稱為隨機誤差.相關系數r正相關(xiāngguān)負相關幾乎不存在0.75y=bx+a+ea和be精品資料精品資料R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越 .在線性回歸(huíguī)模型中,R2表示解釋變量對預報變量變化的 .R2越接近于1,表示回歸(huíguī)的效果越好(因為R2越接近于1,表示解釋變量和預報變量的線性相關性越強).好貢獻率精品資料精品資料(2)利用圖形來分析殘差特性,作圖時縱坐標為

,橫坐標可以選為 ,這樣作出的圖形稱為殘差圖.如果圖中有某個樣本點的殘差比較大,需要確認在采集這個樣本點的過程中是否有人為的錯誤.如果數據采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數據;如果數據采集沒有錯誤,則需要尋找其他的原因.另外,殘差點比較均勻地落在水平的帶狀區域中,說明選用(xuǎnyòng)的模型比較合適.這樣的帶狀區域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高.殘差樣本(yàngběn)編號精品資料回歸分析問題有線性回歸問題和非線性回歸問題,對于非線性回歸問題,往往利用轉換變量的方法(fāngfǎ)進行轉化,轉變為線性回歸問題.精品資料精品資料[例1]有下列說法:①線性回歸分析就是由樣本點去尋找一條直線,使之貼近這些樣本點的數學方法;②利用樣本點的散點圖可以直觀判斷兩個變量的關系是否可以用線性關系表示;④因為由任何一組觀測值都可以求得一個(yīɡè)線性回歸方程,所以沒有必要進行相關性檢驗.其中正確命題的個數是 ()精品資料A.1 B.2C.3 D.4[分析]由題目可獲取以下信息:①線性回歸分析;②散點圖;③相關性檢驗等的相關概念及意義.解答本題(běntí)可先逐一核對相關概念及其性質,然后再逐一作出判斷,最后得出結論.精品資料[答案]C[解析]①反映的正是最小二乘法思想,故正確.②反映的是畫散點圖的作用,也正確.③解釋的是回歸方程=x+的作用,故也正確.④是不正確的,在求回歸方程之前必須進行(jìnxíng)相關性檢驗,以體現兩變量的關系.[點評]線性回歸分析的過程:(1)隨機抽取樣本,確定數據,形成樣本點(2)由樣本點形成散點圖,判定是否具有線性相關關系;(3)由最小二乘法確定線性回歸方程;(4)由回歸方程觀察變量的取值及變化趨勢.精品資料下列有關線性回歸的說法,不正確的是 ()A.變量取值一定(yīdìng)時,因變量的取值帶有一定(yīdìng)隨機性的兩個變量之間的關系叫做相關關系B.在平面直角坐標系中用描點的方法得到表示具有相關關系的兩個量的一組數據的圖形叫做散點圖C.線性回歸方程最能代表具有線性相關關系的x,y之間的關系D.任何一組觀測值都能得到具有代表意義的線性回歸方程精品資料[答案]D[解析]只有對兩個變量具有(jùyǒu)線性相關性作出判斷時,利用最小乘法求出線性方程才有意義.精品資料[例2]某種產品的廣告費支出x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下對應(duìyìng)數據:(1)畫出散點圖;(2)求y關于x的回歸直線方程.精品資料[解析(jiěxī)](1)散點圖如圖所示.精品資料(2)列出下表,并用科學計算器進行有關(yǒuguān)計算.精品資料[點評]求回歸直線方程,關鍵在于正確地求出,,由于,的計算量較大,計算時要仔細謹慎、分層進行(jìnxíng),避免計算失誤.精品資料精品資料精品資料精品資料[例3]一個車間為了規定工時定額(dìngé),需要確定加工零件所花費的時間,為此進行了10次試驗,測得數據如下:把零件數x作為解釋變量,加工時間y作為預報變量.(1)計算總偏差平方和、殘差平方和及相關指數;(2)作出殘差圖;(3)進行殘差分析.精品資料[解析(jiěxī)](1)由x,y的數據得散點圖如圖.精品資料由散點圖可以認為樣本點大致分布在某條直線的附近,因此可以用線性回歸模型(móxíng)來擬合.設線性回歸方程為=+x,列出下表:續表精品資料精品資料將數據代入相應(xiāngyīng)公式可得如下數據表:精品資料續表精品資料(2)作出殘差圖如圖,橫坐標為零件(línɡjiàn)數的數據,縱坐標為殘差.精品資料(3)由題中數據可得樣本相關系數r的值為0.9998,再結合散點圖可以說明x與y有很強的線性相關關系.由R2的值可以看出回歸效果很好,也說明用線性回歸模型擬合數據效果很好.由殘差圖也可以觀察到,第4個樣本點和第5個樣本點的殘差比較大,需要確認在采集在這兩個樣本點的過程中是否有人為的錯誤.[點評]本題涉及公式多且復雜,計算量也很大,需首先了解(liǎojiě)公式,明白原理.精品資料(2)在利用殘差圖對數據進行殘差分析時,殘差點比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適.這樣的帶狀區域寬度越窄,說明模型擬合精度(jīnɡdù)越高,回歸方程的預報精度(jīnɡdù)越高.精品資料某運動員訓練次數與運動成績之間的數據關系(guānxì)如下:(1)作出散點圖;(2)求出線性回歸方程;(3)作出殘差圖;(4)計算R2;(5)試預測該運動員訓練47次及55次的成績.精品資料[解析](1)作出該運動員訓練次數(x)與成績(chéngjì)(y)之間的散點圖,如圖所示,由散點圖可知,它們之間具有線性相關關系.精品資料精品資料(3)殘差分析作殘差圖如圖所示,由圖可知,殘差點比較均勻地分布在水平帶狀區域中,說明選用(xuǎnyòng)的模型比較合適.精品資料(4)計算相關指數R2計算相關指數R2=0.9855.說明了該運動員的成績的差異(chāyì)有98.55%是由訓練次數引起的.精品資料精品資料[例4]煉鋼廠出鋼時所用的盛鋼水的鋼包,在使用過程中,由于鋼液廠爐渣對包襯耐火材料的侵蝕(qīnshí),使其容積不斷增大,請根據表格中的數據找出使用次數x與增大的容積y之間的關系.精品資料續表[解析]先根據試驗(shìyàn)數據作散點圖,如圖所示.精品資料精品資料精品資料精品資料[點評]作出散點圖,由散點圖選擇合適(héshì)的回歸方程類型是解決本題的關鍵,在這里線性回歸模型起了轉化的作用.對于非線性回歸問題,并沒有給出經驗公式,這時我們可以畫出已知數據的散點圖,把它與必修模塊《數學1》中學過的各種函數(冪函數、指數函數、對數函數等)的圖象作比較,挑選一種跟這些散點擬合得最好的函數,然后采用適當的變量代換,把問題轉化為線性回歸問題,使其得到解決.精品資料精品資料[例5]在一次抽樣調查中測得樣本的5個樣本點數值如下表:試建立(jiànlì)y與x之間的回歸直線方程.精品資料精品資料[辨析]此題解法是錯誤的,原因是這兩個變量之間不是線性相關關系.此類問題的解決,應先對兩個變量間的相關關系進行相關性檢驗,然后(ránhòu)結合作出的散點圖,選擇適宜的回歸方程.精品資料精品資料由置換(zhìhuàn)后的數值表作散點如圖所示:精品資料由散點圖可以看出y與t呈近似的線性相關關系(guānxì).列表如下:精品資料精品資料精品資料一、選擇題1.下列說法中錯誤的是 ()A.如果變量x與y之間存在著線性相關關系,則我們根據實驗數據得到(dédào)的點(xi,yi)(i=1,2,…,n)將散布在某一條直線的附近B.如果兩個變量x與y之間不存在線性關系,那么根據它們的一組數據(xi,yi)(i=1,2,…,n)不能寫出一個線性方程精品資料[答案]B[解析]兩變量x與y之間不存在(cúnzài)線性關系,根據它們的一組數據(xi,yi)(i=1,2,3,…n)可通過已有的函數知識進行變換,利用線性回歸模型來建立y與x之間的非線性回歸方程精品資料A.y平均增加(zēngjiā)2.5個單位B.y平均增加(zēngjiā)2個單位C.y平均減少2.5個單位D.y平均減少2個單位[答案]C精品資料精品資料[答案(dáàn)]C精品資料4.下列兩個變量之間的關系不是函數(hánshù)關系的是()A.角度和余弦值B.正n邊形的邊數和一個內角的度數C.棱錐的體積和底面積D.某種物質和溶解度和溫度[答案]D精品資料精品資料6.某種產品(chǎnpǐn)的廣告費支出x與銷售額y(單位:萬元)之間有下表關系:已知y與x之間是線性相關關系,若實際銷售額不低于82.5萬元,則廣告費支出最少是__________萬元.[答案]10[解析]由本節例2可知y關于x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論