




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
高中數學打印版第課教學目標知識與技能從相關指數和殘差分析角度探討回歸模型的擬合效果,以及建立回歸模型的基本步驟.過程與方法在發現直接求回歸直線方程存在缺陷的基礎上學生去發現解決問題的新思—進行回歸分析,進而介紹殘差分析的方法和利用R獻率.
來表示解釋變量對于預報變量變化的貢情感、態度與價值觀通過本節課的學習數與實生活的聯系學態度評價兩個變量的相關性,掌握處理問題的方法成謹治學態度和鍥而不舍的求學精神養生運用所學知識解決實際問題的能力教學中適地利用學生的合作與交流學生在學習的同時體與他人合作的重要性.重點難點教學重點從殘差分析相關指數角度探討回歸模型的擬合效果及建立回歸模型的基本步驟;教學難點:了解評價回歸效果的兩個統計量:相關指數、殘差和殘差平方和.教過引入新課(幻燈片)編號身高/
體重/
54646143上表是上一節課我們從某大學選取名大學生其身高和體重數據組成的數據表一節課中我們通過數據建立了回歸直線方程,并根據方程預測了身高為72的大學生的體重.當時們提到根據回歸直線方程求得的體重數據僅是一個估計值,其與真實值之間存在著誤差,為了綜合分析身高和體重的關系,我們引入了線性回歸模型y=bx+來表示兩變量之間的關系,其中隨機變量,又稱隨機誤差.線性回歸模型y=bx+ae增加了隨機誤差項e,因變量y的由自變量x和機誤差同確定.假設隨機誤差對體重沒有影響也就是說體僅身高的影響那么散點圖中所有的點將完全落在回歸直線上.但是,在圖中,數據點并沒有完全落在回歸直線上.這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線推”開了,自變量x能解釋部分的化.同學們考慮一下,隨機變量e的均值是多少?差又是多少?活動設計:學生思考回答問題.學情預測:學生回答E(e),D(e)σ教師提問:能否通過D(e)來刻畫線性回歸模型的合程度?學情預測隨誤差的方差越小通回歸直線預報真實值y的度高隨誤差是引起預報值與真實值y之的誤差原因之一,其大小取決于隨機誤差的方差.設計意圖說研究隨機誤差的要性通過研究隨機誤差以分析預報值的可信度.提出問題:既然可以用隨機變量的方差來衡量隨機誤差的大小,即通過方差2
來刻畫預報變量體重)的變化在多大程度上與隨機誤差有關,那么如何獲得方差σ學生活動:學生獨立思考,小組合作交流討論.
呢?活動結果:可以采用抽樣統計的思想,通過隨機變量e的本來估計σ精心校對版本
的大小.
^^^^^^^12nn^^iiii^^^^^^^12nn^^iiiiiiin^iii^^設計目的:復習抽樣統計思想,以便通過隨機變量e的本來估計總體.探究新知提出問題既然表了解釋變量以外其他各種影響預報值的因素帶來的誤差么如何獲得e的樣本來計算σ
呢?學生活動:分組合作討論交流.學情預測:由函數模y=bx+a和歸模型y=bx++可=yy,樣根據圖表中女大學生的身高求出預報值,再與真實值作差,即可求得e的一個估計值.教師由在計算回歸直線方程利用公式求得和為斜率和截距的估計值它們與真實值間存在誤差,因y是計值,所e=y-y也一個估計值.由上可知,對于樣本(x,),(x,y),,(x,)而言,它們的隨機誤差為e=y-bx-,i,,稱其估計值=y-
i
為相應于點x)的差.將所有殘差的平方加起來,即i
2這個和稱作殘差平方和.i類比樣本方差估計總體方差的思想,可以用^σ
=
^12(y-y)-n-ii
2
作為2
的估計量,通常σ
越小,預報精度越高.這樣當們求得回歸直線方程以通過殘差來判斷模型擬合程度的效果判斷原始數據中是否存在可疑數據,這方面的分析工作稱為殘差分析.設計目的:通過問題誘思,引入殘差概念.理解新知提出問題對照女大學生的身高體重的原始數據合求出的回歸直線方程求出相應的殘差數據.學生活動:獨立完成.活動結果:編號身高(體重kg)殘差e
-
-
-
提出問題根據表格中的數據樣本編號為橫坐標差值為縱坐標出點圖這樣的散點圖稱作殘差.學生活動:分組合作,共同完成.活動結果:殘差圖精心校對版本
^^^n^iiiiiii高中數學打印版^^^n^iiiiiii提出問題觀察上面的殘差圖認哪幾個樣本點在采集時可能存在人為的錯誤?為什么?學生活動:分組討論.活動結果第一個和第六個樣本在采集過程中可能存在錯誤為他的樣本點基本都集中在一個區域內只有這兩樣本點的殘差比較大對其他樣本點來說分得較為分散.提出問題:如何從殘差圖來判斷模型的擬合程度?學生活動:獨立思考也可相互討論.活動結果:因
越小,預報精度越高,即模型的擬合程度越高,2小的值越集中故殘差點比較均勻落在水平的帶狀區域內明選用的模型比較合適且帶狀區域的寬度越窄,說明擬合精度越高,回歸直線的預報精度越高.教師:在統計學上,人們經常用相關指數(y-2
來刻畫回歸的效果,其計算公式是:R
=1-
1n(y21提出問題:分析上面計算相關指數R
的公式,如何根據R2
來判斷模型的擬合效果?學生活動:獨立思考也可相互討論,教師加以適當的引導提示.n活動結果:因為對于確定的樣本數據而言,(y-y)21意味著殘差平方和越小,也就是說模型的擬合效果越好.
是一個定值,故R2
取值越大,提出問題:在線性回歸模型中R
表示解釋變量對于預報變量變化的貢獻率
越接近1,表示回歸的效果越好,即解釋變量和預報量的線性相關性越強,試計算關于女大學生身高與體重問題中的相關指數R
學生活動:學生獨立計算獲得數據.活動結果:2≈0.64.根據R≈0.64就得出“女大學生的身高解釋了64%體重變”,或者說“大學生的體重差異有64%由身高引起的就難理解為什么預報體重和真實值之間有差距了.設計目的結合圖象讓生直觀感受殘差圖在刻畫回歸模型擬合效果方面的應用會殘差分析和相關指數的意義.提出問題根據前面得到的回歸程否預測一名美國女大學生的體重?建立回歸模型后能否一勞永逸,在若干年后還可以使用,或者適用于多年以前的女大學生體重預測?精心校對版本
^^^12n^高中數學^^^12n^學生活動:討論交流總結發言.活動結果:在使用回歸方程進行預報時要注意:(1)回歸方程只適用于我們所研究樣本的總體;(2)我們建立的回歸方程一般都有間性;(3)樣本取值的范圍會影響回歸方的適用范圍;(4)不能期望回歸方程得到的預報就是預報變量的精確值.提出問題:結合我們剛學習的概念,現在能否將建立回歸模型的步驟補充完整?學生活動:討論交流,合作完成.活動結果:一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量解釋變量,哪個變量是預報變量.(2)畫出確定好的解釋變量和預報量的散點圖,觀察它們之間的關如是否存在線性關系等).(3)由經驗確定回歸方程的類如我們觀察到數據呈線性關系,則選用線性回歸方.(4)按一定規則如最小二乘)估計回歸方程中的參數.(5)得出結果后分析殘差圖是否有(如個別數據對應殘差過大,殘差呈現不隨機的規律性,等).若存在異常,則檢查數據是否有誤,或模型是否合適等.設計意圖設問題,讓學生討分析出用回歸方程進行預報需注意的問題,并讓學生完善建立回歸模型的步驟.在這個過程中師宜做太多引導,要放手給學生,讓學生討論,充分參與進來.運用新知例1個車間為了規定工時定額,需確定加工零件所花費的時間,為此進行了0次試驗,測得的數據如下:編號零件數x/個
加工時間y/
68758189102115122(1)建立零件數為解釋變量,加工間為預報變量的回歸模型,并計算殘差;(2)你認為這個模型能較好地刻畫件數和加工時間的關系嗎?分:先根據散點圖粗略判斷變量是否具線性相關性斷是否可以用線性回歸模型來擬合數據,然后通過殘ee來判斷模型擬合的效果,判斷原始數據是否存在可疑數據.解:(1)根據表中數據作出散點圖下:散點圖由散點圖可知變量之間具有線性相關關系,可以通過求線性回歸方程來擬合數據.根據公式可求得加工時間對零件數的線性回歸方程y=0.668x+精心校對版本
^^^^^^ii5^5iii高中數學打印版^^^^^^ii5^5iii殘差數據如下表:編號
10殘差e
-
-0.65
-
-0.37
-0.05
(2)畫出殘差圖殘差圖由圖可知殘點分布較均勻即用上述回歸模型擬合數據效果很好但需注意由差圖也可以看出4個本和第樣本點殘差較大要認在采集這兩個樣本點的過程中是否有人為的錯誤.點評由點圖判斷兩個變量的性相關關系差較大利殘差圖可以較好地評價模型的擬合程度,并能發現樣本點中的可疑數據.【變練演編】例一段時間內,某種商品的價格元)和需求量y()之間的一組數據為:價格元需求量y/
161820504341求出y對x的歸方程,并說明擬合效果的好壞.思分:根據散點圖判斷兩個變量是否線性相關若相關,求出回歸直線方程后通過相關指數的大小來評價擬合效果的好壞.解:作出散點圖:從作出的散點圖可以看出這些點在一條直線附近用線性回歸模型來擬合數據由數據可得=,y=,由計算公式=,=y-bx=故yx的歸方程y=2.35x+,列表yy
i
1.2
-0.14.6
--
0.3-4.4
-8.4所以(y-)2=8.3,(y-2229.2.i
i1精心校對版本
5^iiiii高中數學打印版5^iiiii(y-2相關指數R2
=1-
1
≈0.946.5(y-y)
1因為很近1所以該模型的擬合效果很好.變式:若要分析是否在上述樣本的采集過程中存在可疑數據,應如何分析?活動設計:學生分組討論,回顧課本解答問題.活動成果:可以畫出殘差圖來進行分析.變式:既然利用殘差圖和相關指數都能夠評價回歸模型的擬合效果,能否總結一下兩種方法各自的特點?活動成果利用殘差圖可以直觀示擬合的效果且可以發現樣本數據中的可疑數據而關指數是把對擬合效果的評價轉換為數值大小的判斷于化處理并能在數量上表現解釋變量對于預報變量變化的貢獻率.設計意圖:進一步熟悉判斷擬合效果的方法以及各自的特點.【達標檢測】.分析下列殘差圖,所選用的回歸模型效果最好的()ABC
D.下列說法正確的()①回歸直線方程適用于一切樣本和總體回直線方程一般都有時間性樣本的取值范圍會影響回歸直線方程的適用范圍據回歸直線方程得到的預測值是預測變量的精確值.A①③④B.③C.①②D.④.在研究氣溫和熱茶銷售杯數的關系時,若求得相關指數2,氣溫解釋了85%熱茶銷售杯數變化或說熱銷售杯數差異有是由氣溫引起的.答案:1.D2.B3.0.85.精心校對版本
n^iii^^5^ii11i221高中數學打印版n^iii^^5^ii11i221課堂小結學生回顧本節課學習的內容嘗總結然后不充分的地方由學生相互補充后老師的引導下,用精煉的語言進行概括:.判斷變量是否線性相關的方法以及各自的特點;.在運用回歸模型時需注意的事項;.建立回歸模型的基本步驟.設計意圖學自己小結是一個多維整合的過程一個高層次的自我認識過程.補充練習【基礎練習】.有下列說法:①在殘差圖中,殘差點比較均勻地落在水平的帶狀區域內,說明選的模型比較合適.②用相關指數來畫回歸的效果,2值接近于,說明模型的擬效果越好③較兩個模型的擬效果以比較殘差平方和的大小殘差平方和越小的模型,擬合效果越好.正確的是()A①②B.②③.①③D①②③.甲、乙、丙、丁四位同學各自對AB兩量做回歸分析,分別得到散點圖與殘差平方和(y-y)
如下表
1甲
乙
丙
丁散點圖殘差平方和
哪位同學的實驗結果體現擬合AB兩量關系的模型擬精度高(A甲B乙.D丁.關于x與y有下數據:xy
為了對xy兩個變量進行統計分析有下兩種線性模型y=+17.5乙:y=+試較哪一個模型擬合效果更好.答案或提示2.D(yy)2.析:設甲模型相關指數為R2則R2=-
i=1-5(y)2
=0.845設乙i模型的相關指數為R
,則可求得R
=,因為R2>R
,所以甲模型的擬合效果更好.【拓展練習】假設某種農作物本苗數與有效穗之存在相關關系測得5數據如下:精心校對版本
^^^^^^^^^^^^123455^iii5^i^^^^^^^^^^^^123455^iii5^iiix36.644.4y43.149.2(1)以x為釋變量y為報變量,作出散點圖;(2)求y與x之的回歸方程,對于基本苗數56.7預有效穗數.(3)計算各組殘差;(4)求2并說明隨機誤差對有效穗數的影響占百分之幾?解:(1)散點圖如圖:由可以看出,樣本點呈條狀分布,有比較好的線性相關關系,因此可用線性回歸方程來建立兩個變量之間的關系.設線性回歸方程y=bx+a,數據可以求得:≈0.291a=y-x=34.67.故所求的線性回歸方程為y=+當x=時,=0.291×56.7+=51.1697.估計有效穗數為51.169(3)各組數據的殘差分別≈0.37e,≈-,≈-2.22e≈1.61.(4)殘差平方和:(y-y)
5=,又(y-y)250.18,∴
=1-
i1(y-)i8.425=1≈0.832.5(y2
ii即解釋變量(農作物基本苗數對有效穗數的影響約占了83.2%所以隨機誤差對有效穗數的影響約占1=16.8%.設說本課時從上一節課的案例出發,通過分析隨機誤差產生的原因,引入隨機變量、殘差、殘差平方和指的有關概念關數和殘差分析等角度探討回歸模型擬合的效果,并通過案例說明利用所建立的回歸模型進行預報時需要注意的問題結建立回歸模型的基本步驟.在教學過程中以問題為引導思考的動機重學生合作意識的培養過案例的分析,培養學生對數據的處理能力,讓學生初步了解回歸分析思想在實際生活中的運用.精心校對版本
iin^ii^^^n^iin^n^iiiin^^iiiiiii=)+(y-y)+2n^^iiiiiin^iin^ii^^^n^iin^n^iiiin^^iiiiiii=)+(y-y)+2n^^iiiiiin^^n^^^iiiiiiin^[^^]iiii=b(x-x)(y-y)b(x)i備資有關總偏差平方和、回歸平方和、殘差平方和以及相關指數等概念的說明n.總偏差平方和SST(y)2刻畫了預報變量y的化劇烈程度.
1.回歸平方和:SSR=(y-y2i1
,公式中所有預測值的平均值也等于,故^1^^^^^^=x+a=x+=x+y-bx=y,iii
1因此回歸平方和又可以寫成從而回歸平方和刻畫了估計量ya+x的化程度由估計量由解釋變量所決定以歸方和刻畫了預報變量的變化中由解釋變量通過線性回歸模型引起的那一部分的變化程度..殘差平方和:SSE=(y-y2
,刻畫了殘差變量變化的程度.i.偏差平方和分解:即指公式(y-y2(y-y2-y2,i
i
i稱為平方和分解公式,用文字表示為:總偏差平方和=回歸平方和+殘差平方和.公式證明如下:假設觀測數據為(,),i,…,n,則(y-)2=(y-y+y-ynn^22iii
1(y-)(y-y).
i1
1
1
1而-y)(y-)=(b-bx--bx)
1i
1=(x-x--x--)
1^[]iii
1
精心校對版本
^ii
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 脂肪肝試題及答案解析
- 2025年度配電線路安規考試題庫及答案(共154題)
- 基于2025年的教育園區建設社會穩定風險評估與風險評估體系優化報告
- 探討家具設計師職業素養與專業技能題試題及答案
- 聚焦2025互聯網+教育示范項目資金申請可行性分析報告
- 2025南航招聘測試題及答案
- 未來挑戰2025年物理試題及答案
- 聚焦2025:廣播影視行業媒體融合與內容創新趨勢研究報告
- 施工現場作業安全技能考核試題及答案
- 生態環境保護與土木工程試題及答案
- 2024年甘肅蘭州事業單位考試真題
- 2025年導游從業資格通關秘籍
- 中國法院知識產權司法保護狀況2024
- 四川省綿陽市2025屆高三下學期第三次診斷性測試數學試卷(含答案)
- 外賣配送員工作流程總結
- 新式茶飲產業的技術發展現狀與未來創新趨勢
- 【國浩律師事務所】2025中國企業出海戰略與法律支持需求調研報告
- 當代中國外交(外交學院)知到智慧樹章節測試課后答案2024年秋外交學院
- 小學科學湘科版六年級下冊全冊同步練習含答案
- IACSURS26 中文
- 中層干部360度考核測評表(共4頁)
評論
0/150
提交評論