




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2、3、2線性回歸方程講義編寫者:數學教師孟凡洲某小賣部為了了解熱茶銷售量與氣溫之間的關系,隨機統計并制作了某6天賣出熱茶的杯數與當天氣溫的對照表:氣溫/261813104-1杯數202434385064 如果某天的氣溫是-5 ,你能根據這些數據預測這天小賣部賣出熱茶的杯數嗎?為解決這個問題我們接著學習兩個變量的線性相關回歸直線及其方程.一、【學習目標】1、理解相關關系,能判斷兩個變量之間是否是相關關系;2、會求線性回歸方程,理解其真正含義(估計).【教學效果】:教學目標的給出有利于學生整體把握課堂.二、【自學內容和要求及自學過程】閱讀教材8689頁內容,回答問題(回歸直線方程)<1&g
2、t;請你說出作散點圖的步驟和方法.<2>請你說出正、負相關的概念.<3>什么是線性相關?<4>看人體的脂肪百分比和年齡的散點圖,當人的年齡增加時,體內脂肪含量到底是以什么方式增加的呢?<5>什么叫做回歸直線?<6>如何求回歸直線的方程?什么是最小二乘法?它有什么樣的思想?結論:<1>建立相應的平面直角坐標系,將各數據在平面直角坐標中的對應點畫出來,得到表示兩個變量的一組數據的圖形,這樣的圖形叫做散點圖.(a.如果所有的樣本點都落在某一函數曲線上,就用該函數來描述變量之間的關系,即變量之間具有函數關系b.如果所有的樣本點都落
3、在某一函數曲線附近,變量之間就有相關關系.c.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系)<2>如果散點圖中的點散布在從左下角到右上角的區域內,稱為正相關.如果散點圖中的點散布在從左上角到右下角的區域內,稱為負相關.<3>如果所有的樣本點都落在某一直線附近,變量之間就有線性相關的關系.<4>大體上來看,隨著年齡的增加,人體中脂肪的百分比也在增加,呈正相關的趨勢,我們可以從散點圖上來進一步分析.<5>如下圖;從散點圖上可以看出,這些點大致分布在通過散點圖中心的一條直線附近.如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱
4、這兩個變量之間具有線性相關關系,這條直線叫做回歸直線(regression line).如果能夠求出這條回歸直線的方程(簡稱回歸方程),那么我們就可以比較清楚地了解年齡與體內脂肪含量的相關性.就像平均數可以作為一個變量的數據的代表一樣,這條直線可以作為兩個變量具有線性相關關系的代表.<6>從散點圖上可以發現,人體的脂肪百分比和年齡的散點圖,大致分布在通過散點圖中心的一條直線. 那么,我們應當如何具體求出這個回歸方程呢? 有的同學可能會想,我可以采用測量的方法,先畫出一條直線,測量出各點與它的距離,然后移動直線,到達一個使距離的和最小的位置,測量出此時的斜率和截距,就可得到回歸方程了
5、.但是,這樣做可靠嗎? 有的同學可能還會想,在圖中選擇這樣的兩點畫直線,使得直線兩側的點的個數基本相同.同樣地,這樣做能保證各點與此直線在整體上是最接近的嗎? 還有的同學會想,在散點圖中多取幾組點,確定出幾條直線的方程,再分別求出各條直線的斜率、截距的平均數,將這兩個平均數當成回歸方程的斜率和截距. 同學們不妨去實踐一下,看看這些方法是不是真的可行?(學生討論:1.選擇能反映直線變化的兩個點.2.在圖中放上一根細繩,使得上面和下面點的個數相同或基本相同.3.多取幾組點對,確定幾條直線方程.再分別算出各個直線方程斜率、截距的算術平均值,作為所求直線的斜率、截距.)教師:分別分析各方法的可靠性.如
6、下圖: 上面這些方法雖然有一定的道理,但總讓人感到可靠性不強. 實際上,求回歸方程的關鍵是如何用數學的方法來刻畫“從整體上看,各點與此直線的距離最小”.人們經過長期的實踐與研究,已經得出了計算回歸方程的斜率與截距的一般公式其中,b是回歸方程的斜率,a是截距.推導公式的計算比較復雜,這里不作推導.但是,我們可以解釋一下得出它的原理.假設我們已經得到兩個具有線性相關關系的變量(x1,y1),(x2,y2),(xn,yn),且所求回歸方程是=bx+a,其中a、b是待定參數.當變量x取xi(i=1,2,n)時可以得到=bxi+a(i=1,2,n),它與實際收集到的yi之間的偏差是yi-=yi-(bxi
7、+a)(i=1,2,n).這樣,用這n個偏差的和來刻畫“各點與此直線的整體偏差”是比較合適的.由于(yi-)可正可負,為了避免相互抵消,可以考慮用來代替,但由于它含有絕對值,運算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2 來刻畫n個點與回歸直線在整體上的偏差.這樣,問題就歸結為:當a,b取什么值時Q最小,即總體偏差最小.經過數學上求最小值的運算,a,b的值由公式給出.通過求 式的最小值而得出回歸直線的方法,即求回歸直線,使得樣本數據的點到它的距離的平方和最小,這一方法叫做最小二乘法(method of least square).【教學效果】:
8、理解線性回歸的真正內涵.三、【綜合練習與思考探索】例1 有一個同學家開了一個小賣部,他為了研究氣溫對熱飲銷售的影響,經過統計,得到一個賣出的熱飲杯數與當天氣溫的對比表:溫度/-504712151923273136熱飲杯數15615013212813011610489937654(1)畫出散點圖;(2)從散點圖中發現氣溫與熱飲銷售杯數之間關系的一般規律;(3)求回歸方程;(4)如果某天的氣溫是2 ,預測這天賣出的熱飲杯數.結論:(1)散點圖如下圖所示:(2)從上圖看到,各點散布在從左上角到右下角的區域里,因此,氣溫與熱飲銷售杯數之間呈負相關,即氣溫越高,賣出去的熱飲杯數越少.(3)從散點圖可以看
9、出,這些點大致分布在一條直線的附近,因此,可用公式求出回歸方程的系數.利用計算器容易求得回歸方程=-2.352x+147.767.(4)當x=2時,=143.063.因此,某天的氣溫為2 時,這天大約可以賣出143杯熱飲. 思考:氣溫為2 時,小賣部一定能夠賣出143杯左右熱飲嗎?為什么? 這里的答案是小賣部不一定能夠賣出143杯左右熱飲,原因如下:1.線性回歸方程中的截距和斜率都是通過樣本估計出來的,存在隨機誤差,這種誤差可以導致預測結果的偏差.2.即使截距和斜率的估計沒有誤差,也不可能百分之百地保證對應于x的預報值,能夠與實際值y很接近.我們不能保證點(x,y)落在回歸直線上,甚至不能百分
10、之百地保證它落在回歸直線的附近,事實上,y=bx+a+e=+e. 這里e是隨機變量,預報值與實際值y的接近程度由隨機變量e的標準差所決定. 一些學生可能會提出問題:既然不一定能夠賣出143杯左右熱飲,那么為什么我們還以“這天大約可以賣出143杯熱飲”作為結論呢?這是因為這個結論出現的可能性最大.具體地說,假如我們規定可以選擇連續的3個非負整數作為可能的預測結果,則我們選擇142,143和144能夠保證預測成功(即實際賣出的杯數是這3個數之一)的概率最大.例2 下表為某地近幾年機動車輛數與交通事故數的統計資料.機動車輛數x千臺95110112120129135150180交通事故數y千件6.27
11、.57.78.58.79.810.213(1)請判斷機動車輛數與交通事故數之間是否有線性相關關系,如果不具有線性相關關系,說明理由;(2)如果具有線性相關關系,求出線性回歸方程.結論:(1)在直角坐標系中畫出數據的散點圖,如下圖.直觀判斷散點在一條直線附近,故具有線性相關關系(2)計算相應的數據之和:=1 031,=71.6, =137 835,=9 611.7.將它們代入公式計算得b0.077 4,a=-1.024 1,所以,所求線性回歸方程為=0.077 4x-1.024 1.【教學效果】:通過練習鞏固新知.四、【作業】1、必做題:習題2.3A組3、4,B組1、2;2、選做題:完成課后練習
12、.五、【小結】 本節課主要學習了兩個內容1o求線性回歸方程的步驟:(1)計算平均數; (2)計算xi與yi的積,求xiyi; (3)計算xi2,yi2,(4)將上述有關結果代入公式求b,a,寫出回歸直線方程2o經歷用不同估算方法描述兩個變量線性相關的過程.知道最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程.六、【教學反思】 因材施教說起來很容易,事實上很難.教師要認識自己的學生,真正的認識自己的學生,才能使你的學生進步.七、【課后練習】1、下列兩個變量之間的關系哪個不是函數關系( )A.角度和它的余弦值 B.正方形邊長和面積C.正邊形的邊數和它的內角和 D.人的年齡和身高答
13、案:2、三點(3,10),(7,20),(11,24)的線性回歸方程是( )A. B.=1.75+5.75x C. D.=5.75+1.75x答案:3、已知關于某設備的使用年限x與所支出的維修費用y(萬元),有如下統計資料:使用年限x23456維修費用y2238556570 設y對x呈線性相關關系試求:(1)線性回歸方程=bx+a的回歸系數a,b;(2)估計使用年限為10年時,維修費用是多少?答案:(1)b=1.23,a=0.08;(2)12.38.4、我們考慮兩個表示變量x與y之間的關系的模型,為誤差項,模型如下:模型1:y=6+4x;模型2:y=6+4x+e(1)如果x=3,e=1,分別求
14、兩個模型中y的值;(2)分別說明以上兩個模型是確定性模型還是隨機模型解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是確定性模型;模型2中相同的x值,因的不同,所得y值不一定相同,且為誤差項是隨機的,所以模型2是隨機性模型5、以下是收集到的新房屋銷售價格y與房屋大小x的數據:房屋大小x(m2)80105110115135銷售價格y(萬元)18.42221.624.829.2(1)畫出數據的散點圖;(2)用最小二乘法估計求線性回歸方程.解:(1)散點圖如下圖.(2)n=5,=54
15、5,=109,=116,=23.2,=60 952,=12 952,b=0.199,a=23.2-0.199×1091.509,所以,線性回歸方程為y=0.199x+1.5096、下列關系中,是帶有隨機性相關關系的是 正方形的邊長面積之間的關系;水稻產量與施肥量之間的關系人的身高與年齡之間的關系降雪量與交通事故的發生率之間的關系.答案:兩變量之間的關系有兩種:函數關系與帶有機性的相關關系.正方形的邊長與面積之間的關系是函數關系.水稻產量與施肥量之間的關系不是嚴格的函數關系,但是具有相關性,因而是相關關系.人的身高與年齡之間的關系既不是函數關系,也不是相關關系,因為人的年齡達到一定時期
16、身高就不發生明顯變化了,因而他們不具備相關關系.降雪量與交通事故的發生率之間具有相關關系,因此填、.7、現隨機抽取某校10名學生在入學考中的數學成績X與入學后的第一次數學考試成績Y,數據如下:學號12345678910X12010911710410311010410599108Y84648468696869465771問這10名同學的兩次數學考試成績是否具有相關關系?答案:應用散點圖分析,(圖略)這10名同學的兩次數學考試成績具有相關關系.8、在下列各圖中,每個圖的兩個變量具有相關關系的圖是( ) A、(1)(2) B、(1)(3) C、(2)(4) D、(2)(3)9、線性回歸方程必過 A、(0,0)點 B、(,0)點 C、(0,)點心 D、()點10、設有一個直線回歸方程為y=21.5x, 則變量x增加一個單位時A、y平均增加1.5個單位于 B、y平均增加2個單位C、y平均減少1.5個單位 D、y平均減少2個單位10、下列變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 區塊鏈技術在能源管理的創新應用
- 醫療數據合規管理與商業倫理
- 醫療健康服務的政策支持與可持續發展
- 建筑設備自動化總結模版
- 明癬的臨床護理
- 區塊鏈技術助力教育物資供應鏈的透明與高效
- 醫療信息化的安全保障措施研究
- 錄像課心得體會模版
- ST段抬高型心肌梗死的臨床護理
- 小兒消化性潰瘍的臨床護理
- 學校文化活動對兒童成長的影響研究
- 項目實施進度跟蹤與調整方案
- 2025屆湖北省武漢市高三英語質量檢測試卷(一模)(附答案)
- 【感恩話題】《永遠的感恩》感恩教育主題班會教案
- 自然語言處理與人工智能知到課后答案智慧樹章節測試答案2025年春中山大學
- 《BACnet基礎教程》課件
- 《重大交通事故案例分析》課件
- 綜合實踐 50有多大 抓抓數數(說課稿)-2024-2025學年一年級下冊數學蘇教版
- 《基于PLC的包裝機控制系統的設計與實現》10000字(論文)
- 2025年江蘇交通控股有限公司招聘筆試參考題庫含答案解析
- 2025年成都地鐵運營有限公司招聘筆試參考題庫含答案解析
評論
0/150
提交評論