回歸分析的基本思想及其初步應用(共25頁)_第1頁
回歸分析的基本思想及其初步應用(共25頁)_第2頁
回歸分析的基本思想及其初步應用(共25頁)_第3頁
回歸分析的基本思想及其初步應用(共25頁)_第4頁
回歸分析的基本思想及其初步應用(共25頁)_第5頁
已閱讀5頁,還剩20頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上新課標 數 學選修1211回歸分析的基本思想及其初步應用(教師用書獨具)三維目標1知識與技能通過典型案例的探究,了解回歸分析的基本思想,會對兩個變量進行回歸分析,明確解決回歸模型的基本步驟,并對具體問題進行回歸分析以解決實際應用問題了解最小二乘法的推導,解釋殘差變量的含義,了解偏差平方和分解的思想,了解判斷刻畫模型擬合效果的方法相關指數和殘差分析掌握利用計算器求線性回歸直線方程參數及相關系數的方法2過程與方法通過收集數據作散點圖,分析散點圖,求回歸直線方程,分析回歸效果,利用方程進行預報3情感、態度與價值觀培養學生利用整體的觀點和互相聯系的觀點來分析問題, 進一步加強

2、數學的應用意識,培養學生學好數學、用好數學的信心,加強與現實生活的聯系,以科學的態度評價兩個變量的相互關系重點難點重點:回歸分析的基本方法、隨機誤差e的認識、殘差圖的概念、用殘差及R2來刻畫線性回歸模型的擬合效果難點:回歸分析的基本方法、殘差概念的理解及擬合效果的判定、非線性回歸向線性回歸的轉化教學時要以殘差分析為重點,突出殘差表和R2的計算,通過舉例說明相關關系與確定性關系的區別,說明回歸分析的必要性及其方法借助例題使學生掌握作散點圖、求回歸直線方程的方法,通過作殘差圖、計算R2讓學生掌握擬合效果的判斷方法對于非線性回歸問題重點在如何轉換,引導學生分析總結轉化方法和技巧,從而化解難點(教師用

3、書獨具)教學建議 本節課建議教師采取探究式教學,把“關注知識”轉向“關注學生”,在教學過程中,把“給出知識”的過程轉變為“引起活動,讓學生探究知識的過程”,把“完成教學任務”轉向“促進學生發展”,讓學生成為課堂上的真正主人在教學中,知識點可由學生通過探索“發現”,讓學生充分經歷探索與發現的過程,并引導學生積極解決探索過程中發現的問題教學中不要以練習為主,而是定位在知識形成過程的探索,例題的解答也要由學生探討、教師點撥,共同完成要注重數學的思想性,如統計思想、隨機觀念、函數思想、數形結合的思想方法等,引導學生體驗數學中的理性精神,加強數學形式下的思考和推理能力教學流程創設問題情境,引出問題,引導

4、學生探討,從而引出回歸分析、線性回歸模型、刻畫回歸效果的有關概念及解決方法利用填一填的形式,使學生自主學習本節基礎知識,并反饋了解,對理解有困難的概念加以講解引導學生在學習基礎知識的基礎上分析回答例題1的問題,并總結規律方法,完成變式訓練引導學生分析例題2,根據圖中的數據計算系數,求出回歸方程,列出殘差表,求出R2并判斷擬合效果,完成變式訓練完成當堂雙基達標,鞏固所學知識及應用方法,并進行反饋矯正歸納整理,進行課堂小結,整體認識本節所學知識,強調重點內容和規律方法通過老師啟發引導,完成例題3,并要求學生借鑒例題3的解法完成變式訓練引導學生分析例題3,讓學生作出散點圖,觀察相關性,引出問題,即如

5、何使問題轉化為相關關系并用線性回歸分析二者關系課標解讀1.會用散點圖分析兩個變量是否存在相關關系(重點)2會求回歸方程,掌握建立回歸模型的步驟,會選擇回歸模型(重點、難點)線性回歸模型【問題導思】一臺機器由于使用時間較長,生產的零件有一些會有缺陷按不同轉速生產出有缺陷的零件的統計數據如下:轉速x(轉/秒)1614128每小時生產有缺陷的零件數y(件)119851.在平面直角坐標系中作出散點圖【提示】2從散點圖中判斷x和y之間是否具有相關關系?【提示】有3若轉速為10轉/秒,能否預測機器每小時生產缺陷的零件件數?【提示】可以根據散點圖作出一條直線,求出直線方程后可預測(1)回歸直線方程: x,其

6、中:,i,i.(2)變量樣本點中心:(,),回歸直線過樣本點的中心(3)線性回歸模型:ybxae,其中e稱為隨機誤差,a和b是模型的未知參數,自變量x稱為解釋變量,因變量y稱為預報變量刻畫回歸效果的方式殘差對于樣本點(xi,yi)(i1,2,n)的隨機誤差的估計值iyii,稱為相應于點(xi,yi)的殘差殘差圖利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖殘差圖法殘差點比較均勻地落在水平的帶狀區域內,說明選用的模型比較適合,這樣的帶狀區域的寬度越窄,說明模型擬合精度越高殘差平方和殘差平方和為(yii)2,殘差平方和越小,

7、模型擬合效果越好相關指數R2R21,R2表示解釋變量對預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好回歸分析的有關概念有下列說法:線性回歸分析就是由樣本點去尋找一條直線,使之貼近這些樣本點的數學方法;利用樣本點的散點圖可以直觀判斷兩個變量的關系是否可以用線性關系表示;通過回歸方程x,可以估計和觀測變量的取值和變化趨勢;因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗其中正確命題的個數是()A1B2C3D4【思路探究】可借助于線性相關概念及性質逐一作出判斷【自主解答】反映的正是最小二乘法思想,故正確反映的是畫散點圖的作用,也正確解釋的是回歸方程x的作用,故也正

8、確是不正確的,在求回歸方程之前必須進行相關性檢驗,以體現兩變量的關系【答案】C1解答例1中時,必須明確具有線性相關關系的兩個變量間才能求得一個線性回歸方程,否則求得的方程無實際意義因此必須先進行線性相關性判斷,后求線性回歸方程2回歸分析的過程:(1)隨機抽取樣本,確定數據,形成樣本點;(2)由樣本點形成散點圖,判斷是否具有線性相關關系;(3)由最小二乘法確定線性回歸方程;(4)由回歸方程觀察變量的取值及變化趨勢關于變量y與x之間的回歸直線方程敘述正確的是()A表示y與x之間的一種確定性關系B表示y與x之間的相關關系C表示y與x之間的最真實的關系D表示y與x之間真實關系的一種效果最好的擬合【解析

9、】回歸直線方程能最大可能地反映y與x之間的真實關系,故選項D正確【答案】D線性回歸分析已知某種商品的價格x(元)與需求量y(件)之間的關系有如下一組數據:x1416182022y1210753求y關于x的回歸直線方程,并說明回歸模型擬合效果的好壞【思路探究】回歸模型擬合效果的好壞可以通過計算R2來判斷,其值越大,說明模型的擬合效果越好【自主解答】(1416182022)18,(1210753)7.4,1421621822022221 660,iyi14×1216×1018×720×522×3620,所以1.15,7.41.15×182

10、8.1,所以所求回歸直線方程是1.15x28.1.列出殘差表:yii00.30.40.10.2yi4.62.60.42.44.4所以(yii)20.3,(yi)253.2,R210.994,所以回歸模型的擬合效果很好1回歸直線方程能定量地描述兩個變量的關系,系數,刻畫了兩個變量之間的變化趨勢,其中表示x變化一個單位時,y的平均變化量利用回歸直線可以對問題進行預測,由一個變量的變化去推測另一個變量的變化2線性回歸分析中:(1)殘差平方和越小,預報精確度越高(2)相關指數R2取值越大,說明模型的擬合效果越好某運動員訓練次數與運動成績之間的數據關系如下:次數(x)3033353739444650成績

11、(y)3034373942464851(1)作出散點圖;(2)求出線性回歸方程;(3)作出殘差圖,并說明模型的擬合效果;(4)計算R2,并說明其含義【解】(1)作出該運動員訓練次數(x)與成績(y)之間的散點圖,如圖所示(2)可求得39.25,40.875,12 656,13 731,iyi13 180,1.041 5,0.003 875,線性回歸方程為1.041 5x0.003 875.(3)作殘差圖如圖所示,由圖可知,殘差點比較均勻地分布在水平帶狀區域中,說明選用的模型比較合適(4)相關指數R20.985 5.說明了該運動員的成績的差異有98.55%的可能性是由訓練次數引起的.非線性回歸分

12、析下表為收集到的一組數據:x21232527293235y711212466115325(1)作出x與y的散點圖,并猜測x與y之間的關系;(2)建立x與y的關系,預報回歸模型并計算殘差;(3)利用所得模型,預報x40時y的值【思路探究】(1)畫出散點圖或進行相關性檢驗,確定兩變量x、y是否線性相關由散點圖得x、y之間的回歸模型(2)進行擬合,預報回歸模型,求回歸方程【自主解答】(1)作出散點圖如圖,從散點圖可以看出x與y不具有線性相關關系,根據已有知識可以發現樣本點分布在某一條指數函數曲線yc1ec2x的周圍,其中c1、c2為待定的參數(2)對兩邊取對數把指數關系變為線性關系,令zln y,則

13、有變換后的樣本點應分布在直線zbxa,aln c1,bc2的周圍,這樣就可以利用線性回歸模型來建立y與x之間的非線性回歸方程了,數據可以轉化為:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回歸直線方程為0.272x3.849,e0.272x3.849.殘差如下表:yi711212466115325i6.44311.10119.12532.95056.770128.381290.325i0.5570.1011.8758.9509.2313.38134.675(3)當x40時,ye0.272x3.8491 131.兩個變量不具有線性關系

14、,不能直接利用線性回歸方程建立兩個變量的關系,可以通過變換的方法轉化為線性回歸模型,如yc1ec2x,我們可以通過對數變換把指數關系變為線性關系,令zln y,則變換后樣本點應該分布在直線zbxa(aln c1,bc2)的周圍有一個測量水流量的實驗裝置,測得試驗數據如下表:i1234567水高h(厘米)0.71.12.54.98.110.213.5流量Q(升/分鐘)0.0820.251.811.237.566.5134根據表中數據,建立Q與h之間的回歸方程【解】由表中測得的數據可以作出散點圖,如圖觀察散點圖中樣本點的分布規律,可以判斷樣本點分布在某一條曲線附近,表示該曲線的函數模型是Qm

15、83;hn(m,n是正的常數)兩邊取常用對數,則lg Qlg mn·lg h.令ylg Q,xlg h,那么ynxlg m,即為線性函數模型ybxa的形式(其中bn,alg m)由下面的數據表,用最小二乘法可求得2.509 7,0.707 7,所以n2.51,m0.196.ihiQixilg hiyilg Qixxiyi10.70.0820.154 91.086 20.0240.168 321.10.250.041 40.602 10.001 70.024 932.51.80.397 90.255 30.158 30.101 644.911.20.690 21.049 20.476

16、40.724 258.137.50.908 51.574 00.825 41.430 0610.266.51.008 61.822 81.017 31.838 5713.51341.130 32.127 11.277 62.404 34.0225.140 13.780 76.642于是所求得的回歸方程為Q0.196·h2.51.沒有理解相關指數R2的意義而致誤關于x與y有如下數據:x24568y3040605070為了對x、y兩個變量進行統計分析,現有以下兩種線性模型:甲模型6.5x17.5,乙模型7x17,試比較哪一個模型擬合的效果更好【錯解】R110.845.R110.82.又8

17、4.5%>82%,乙選用的模型擬合的效果更好【錯因分析】沒有理解R2的意義是致錯的根源,用相關指數R2來比較模型的擬合效果,R2越大,模型的擬合效果越好,并不是R2越小擬合效果更好【防范措施】R21,R2越大,殘差平方和越小,從而回歸模型的擬合效果越好在線性回歸模型中,R2表示解釋變量對于預報變量變化的貢獻率,R2越接近1,表示回歸的效果越好(因為R2越接近1,表示解釋變量和預報變量的線性相關性越強)從根本上理解R2的意義和作用,就可防止此類錯誤的出現【正解】R110.845,R110.82,845%>82%,所以甲模型擬合效果更好1在研究兩個變量間的關系時,首先要根據散點圖來粗略

18、判斷它們是否線性相關,是否可以用線性回歸模型來擬合數據然后,可以通過殘差1,2,n來判斷模型擬合的效果,判斷原始數據中是否存在可疑數據這方面的分析工作稱為殘差分析2我們還可以用相關指數R2來反映回歸的效果,其計算公式是:R21.顯然,R2取值越大,意味著殘差平方和越小,也就是說模型的擬合效果越好在線性回歸模型中,R2表示解釋變量對于預報變量變化的貢獻率.1已知x和y之間的一組數據x0123y1357則y與x的線性回歸方程x必過點()A(2,2)B(,0)C(1,2) D(,4)【解析】(0123),(1357)4,回歸方程x必過點(,4)【答案】D2(2013·青島高二檢測)在下列各

19、組量中:正方體的體積與棱長;一塊農田的水稻產量與施肥量;人的身高與年齡;家庭的支出與收入;某戶家庭的用電量與電價其中量與量之間的關系是相關關系的是()AB CD【解析】是函數關系Va3;電價是統一規定的,與用電量有一定的關系,但這種關系是確定的關系中的兩個量之間的關系都是相關關系,因為水稻的產量與施肥量在一定范圍內是正比、反比或其他關系,并不確定;人的身高一開始隨著年齡的增加而增大,之后則不變化或降低,在身高增大時,也不是均勻增大的;家庭的支出與收入有一定的關系,在一開始,會隨著收入的增加而支出也增加,而當收入增大到一定的值后,家庭支出趨向于一個常數值,也不是確定關系【答案】D3下列命題正確的

20、有_在線性回歸模型中,e是bxa預報真實值y的隨機誤差,它是一個可觀測的量;殘差平方和越小的模型,擬合的效果越好;用R2來刻畫回歸方程,R2越小,擬合的效果越好;在殘差圖中,殘差點比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適,若帶狀區域寬度越窄,說明擬合精度越高,回歸方程的預報精度越高【解析】對于隨機誤差e是一個不可觀測的量,R2越趨于1,擬合效果越好,故錯誤對于殘差平方和越小,擬合效果越好,同理當殘差點比較均勻地落在水平的帶狀區域時,擬合效果越好,故正確【答案】4下表提供了某廠節能降耗技術改造后生產甲產品過程中記錄的產量x(噸)與相應的生產能耗y(噸標準煤)的幾組對照數據:x345

21、6y2.5344.5(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,用最小二乘法求出y關于x的線性回歸方程;(3)已知該廠技改前100噸甲產品的生產能耗為90噸標準煤試根據(2)求出的線性回歸方程,預測技改后生產100噸甲產品比技改前少消耗多少噸標準煤(參考數值:3×2.54×35×46×4.566.5)【解】(1)如下圖(2)iyi3×2.54×35×46×4.566.5,4.5,3.5,3242526286.0.7,3.50.7×4.50.35,因此,所求的線性回歸方程為0.7x0.35.(

22、3)根據回歸方程預測,現在生產100噸產品消耗的標準煤的數量為0.7×1000.3570.35(噸),故耗能減少了9070.3519.65(噸標準煤).一、選擇題1在畫兩個變量的散點圖時,下面敘述正確的是()A預報變量在x軸上,解釋變量在y軸上B解釋變量在x軸上,預報變量在y軸上C可以選擇兩個變量中任意一個變量在x軸上D可以選擇兩個變量中任意一個變量在y軸上【解析】結合線性回歸模型ybxae可知,解釋變量在x軸上,預報變量在y軸上,故選B.【答案】B2(2013·泰安高二檢測)在回歸分析中,相關指數R2的值越大,說明殘差平方和()A越大B越小C可能大也可能小 D以上均錯【解

23、析】R21,當R2越大時,(yii)2越小,即殘差平方和越小【答案】B3設變量y對x的線性回歸方程為22.5x,則變量x每增加一個單位時,y平均()A增加2.5個單位 B增加2個單位C減少2.5個單位 D減少2個單位【解析】回歸直線的斜率2.5,表示x每增加一個單位,y平均減少2.5個單位【答案】C4(2012·湖南高考)設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系,根據一組樣本數據(xi,yi)(i1,2,n),用最小二乘法建立的回歸方程為0.85x85.71,則下列結論中不正確的是()Ay與x具有正的線性相關關系B回歸直線過樣本點的中心(,)C若該大學

24、某女生身高增加1 cm,則其體重約增加0.85 kgD若該大學某女生身高為170 cm,則可斷定其體重必為58.79 kg【解析】由于線性回歸方程中x的系數為0.85,因此y與x具有正的線性相關關系,故A正確又線性回歸方程必過樣本中心點(,),因此B正確由線性回歸方程中系數的意義知,x每增加1 cm,其體重約增加0.85 kg,故C正確當某女生的身高為170 cm時,其體重估計值是58.79 kg,而不是具體值,因此D不正確【答案】D5在判斷兩個變量y與x是否相關時,選擇了4個不同的模型,它們的相關指數R2分別為:模型1的相關指數R2為0.98,模型2的相關指數R2為0.80,模型3的相關指數

25、R2為0.50,模型4的相關指數R2為0.25.其中擬合效果最好的模型是()A模型1 B模型2C模型3 D模型4【解析】相關指數R2能夠刻畫用回歸模型擬合數據的效果,相關指數R2的值越接近于1,說明回歸模型擬合數據的效果越好【答案】A二、填空題6在研究身高和體重的關系時,求得相關指數R2_,可以敘述為“身高解釋了64%的體重變化,而隨機誤差貢獻了剩余的36%”,所以身高對體重的效應比隨機誤差的效應大得多【解析】結合相關指數的計算公式R21可知,當R20.64時,身高解釋了64%的體重變化【答案】0.647調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調查顯示年收入x

26、與年飲食支出y具有線性相關關系,并由調查數據得到y對x的回歸直線方程:0.254x0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加_萬元【解析】以x1代x,得0.254(x1)0.321,與0.254x0.321相減可得,年飲食支出平均增加0.254萬元【答案】0.2548已知回歸直線的斜率的估計值為1.23,樣本點的中心為(4,5),則回歸直線方程是_【解析】由斜率的估計值為1.23,且回歸直線一定經過樣本點的中心(4,5),可得51.23(x4),即1.23x0.08.【答案】1.23x0.08三、解答題9某省2013年的閱卷現場有一位質檢老師隨機抽取5名學生的總

27、成績和數學成績(單位:分)如下表所示:學生ABCDE總成績(x)482383421364362數學成績(y)7865716461(1)作出散點圖;(2)對x與y作回歸分析;(3)求數學成績y對總成績x的回歸直線方程;(4)如果一個學生的總成績為500分,試預測這個學生的數學成績【解】(1)散點圖如圖所示:(2),x819 794,y23 167,xiyi137 760.r ·)0.989.因此可以認為y與x有很強的線性相關關系(3)回歸系數0.132 452,14.501 315.回歸方程為0.132 452x14.501 315.(4)當x500時,81.即當一個學生的總成績為50

28、0分時,他的數學成績約為81分10(2012·福建高考)某工廠為了對新研發的一種產品進行合理定價,將該產品按事先擬定的價格進行試銷,得到如下數據:單價x(元)88.28.48.68.89銷量y(件)908483807568(1)求回歸直線方程bxa,其中b20,ab;(2)預計在今后的銷售中,銷量與單價仍然服從(1)中的關系,且該產品的成本是4元/件,為使工廠獲得最大利潤,該產品的單價應定為多少元?(利潤銷售收入成本)【解】(1)由于(88.28.48.68.89)8.5,(908483807568)80,又b20,所以ab8020×8.5250,從而回歸直線方程為20x2

29、50.(2)設工廠獲得的利潤為L元,依題意得Lx(20x250)4(20x250)20x2330x1 00020(x8.25)2361.25.當且僅當x8.25時,L取得最大值故當單價定為8.25元時,工廠可獲得最大利潤11在關于人的脂肪含量(百分比)和年齡的關系的研究中,研究人員獲得了一組數據如下表:年齡x2327394145495053545657586061脂肪含量y9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(1)作出散點圖,并判斷y與x是否線性相關若線性相關,求線性回歸方程;(2)求相關指數R2,并說明其含義;(3)給

30、出37歲時人的脂肪含量的預測值【解】(1)散點圖如圖所示由散點圖可知樣本點呈條狀分布,脂肪含量與年齡有比較好的線性相關關系,因此可以用線性回歸方程來刻畫它們之間的關系設線性回歸方程為x,則由計算器算得0.576,0.448,所以線性回歸方程為0.576x0.448.(2)殘差平方和: (yii)237.78.總偏差平方和:(yi)2644.99.R210.941.R20.941,表明年齡解釋了94.1%的脂肪含量變化(3)當x37時,0.576×370.44820.9,故37歲時人的脂肪含量約為20.9%.(教師用書獨具)為研究重量x(單位:克)對彈簧長度y(單位:厘米)的影響,對不同重量的6個物體進行測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論