




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
RegressionAnalsys
回歸分析
童新元
中國人民解放軍總醫院名人格言縱使世界給我珍寶和榮譽,我也不愿意離開我的祖國,因為縱使我的祖國在恥辱之中,我還是喜歡,熱愛,祝福我的祖國。
---裴多菲(匈牙利詩人,1823—1849)問題能否由脂肪的含量推出熱量的多少?知道父代身高,可否推測子代身高?回歸方程解決由一個量變化推斷另一量變化的問題。1)“回歸”概念的來源“香港回歸”,“澳門回歸”….“回歸”這一名詞起源于19世紀生物學家和統計學家F·Galton的遺傳學研究。問題:現實直觀經驗:“通常都認為子女比父母的身高要高”。這是人身的客觀規律還是一種假象?如果這個趨勢是客觀規律話,人身高應該是越來越高,早就超過了現在的水平。觀察研究英國生物遺傳學家Galton觀察了1078對夫婦與子女,分析他們的身高關系。以每對夫婦的平均身高作為x,取他們的一個成年兒子的身高作為y,將結果在平面直角坐標系上繪成散點圖,發現趨勢近乎一條直線。計算出的回歸直線方程為:Y^=33.73+0.516x這種趨勢及回歸方程表明父母平均身高x每增加一個單位時,其成年兒子的身高y也平均增加0.516個單位。結果表明,雖然高個子父輩確實有生高個子兒子的趨勢,但父輩身高增加一個單位,兒子身高僅增加半個單位左右。平均說來,一群高個子父輩的兒子們的平均高度要低于他們父輩的平均高度,他們兒子的身高沒有比他們更高,高個子父輩偏離其父輩平均身高的一部分被其子代拉回來了,即子代的平均身高向中心回歸。低個子父輩的兒子們雖然仍為低個子,平均身高卻比他們的父輩增加了,即父輩偏離中心的部分在子代被拉回來一些。說明子代的平均身高沒有比他們的父輩更低。正因為子代的身高有回到父輩平均身高的趨勢,才使人類的身高在一定時間內相對穩定,沒有出現父輩個子高其子女更高,父輩個子矮其子女更矮的兩極分化現象。這個例子說明了生物學中“種”的概念的穩定性。正是為了描述這種有趣的現象,Galton引進了“回歸”這個名詞來描述父輩身高與子代身高的關系。大自然界很多物種都有
“回歸”現象:大象、螞蟻后代體重回歸到其平均水平人類社會的“回歸”.少小離家,老大歸。。。社會學…葉落歸根和諧社會穩定--發展貧富分化嚴重社會不穩定中國改革開放中國經濟體制改革“中國經濟進入中等發達國家水平”中國政治體制改革“我深知改革的難度,主要是任何一項改革必須有人民的覺醒、人民的支持、人民的積極性和創造精神。”
--溫家寶中國半數人還處于文革狀態,要么是缺乏理性的文革戰士,要么是逆來順從的奴隸狀態,基本不懂現代社會的處事原則?!┯谳Y“權利回歸于人民,人民真正當家作主””沒有獨裁專制,才有新中國“由父高推測子女身高的設想影響子女身高y的因素:基本生長規律、父母的身高x
個體差異(隨機誤差)問題的模型化:回歸分析模型子高=基本生長+父母高作用+個體差異2)回歸方程回歸分析研究目的是由自變量的信息去推斷因變量,并用直線方程來表示它們的線性關系。直線回歸方程的一般表達式為
回歸分析的數據基本格式變量x變量yx1y1x2y2
......xnyn相關問題回歸分析的任務:
在平面上怎么找最佳的直線?實現的類似問題:
某地區有若干個房子,現要修建一條直的公路,怎樣讓大家都滿意?3)參數的估計回歸方程:采用最小二乘法原理:所有實測點到回歸直線的縱向距離平方之和最小.求解線性方程組,而得到最小二乘估計系數b和a
參數的計算公式β的估計:
α
的估計:
計算結果a=33.73,b=0.516回歸方程:y^=33.73+0.516x例12-1
測定16種食物中的熱量(卡路里)和脂肪含量(克).試建立食物熱量與脂肪含量之間的回歸方程.計算結果a=36.0727,b=15.2584回歸方程:y^=36.0727+15.2584x回歸方程的基本含義回歸方程在坐標軸上的含義
a:截距b:斜率稱為回歸系數。回歸系數b的意義:回歸系數b反映的是x每增加1個單位時y的增加幅度;b越大,x對y的影響幅度越大。回歸直線與散點圖的關系b>0b<0b=0b=0b=0b=04)回歸方程的檢驗回歸方程的抽樣誤差:回歸方程來自樣本,存在抽樣誤差回歸方程的假設檢驗步驟:1建立假設:
H0:回歸方程無統計學意義
H1:回歸方程有統計學意義α=0.05
2變異的分解:方差分析思想
yi-y=(yi-y^)+(y^-y)
∑(yi-y)2=∑(yi-y^)2+∑(y^-y)2
變異分解示意圖F值的構造SS總=SS殘差
+SS回歸df總=df殘差
+df回歸MS回歸=SS回歸/df回歸MS殘差
=SS殘差
/df殘差F=
MS回歸/MS殘差
F值越大,越不利H0假設的成立。
方差分析表
----------------------------------------------------------
y的變異來源
SSDFMS
F值P
----------------------------------------------------------
回歸方程SS回歸
1MS回歸
F=MS回歸/Mse
殘差
SSe
n-2Mse
總變異SSTn-1
---------------------------------------------------------3統計推斷與決策
p<α,拒絕H0;回歸方程有統計學意義
p>α,不拒絕H0。回歸方程無統計學意義5)回歸系數的假設檢驗:建立假設
H0:β=0
H1:β≠0α=0.05
回歸系數的標準誤與t統計量
得到P,做出推斷
p<α,拒絕H0;p>α,不拒絕H0。6)回歸方程價值的評價回歸方程評價:方程的假設檢驗回歸價值的評價:確定系數確定系數反映回歸方程對因變量y的影響程度。決定系數的意義決定系數越大,回歸方程價值越高.實際中,決定系數大于0.5時才有好的應用價值.本實例回歸方程的評價回歸模型的方差分析:
F=67.923P=0.000回歸系數的t檢驗:
tb=8.2416,P=0.000R2=0.82917)直線回歸圖若兩變量間存在直線關系,在散點圖上繪上回歸直線,形成直線回歸圖.直線回歸圖的CHISS實現1、進入數據模塊
點擊
數據→文件→打開數據庫表
打開文件名為:b12-1.DBF→確認2、進入圖形模塊
進行繪圖
點擊
圖形→統計圖→曲線擬合
→確認橫軸:X脂肪縱軸:Y熱量8)回歸分析的應用---預測
若回歸方程有意義時,可以通過自變量X的值來預測因變量Y的值.
通過知道父代身高推測子代平均身高例12-1中,脂肪含量與熱量值建立的回歸方程有意義P<0.05,且決定系數0.8291較大,我們可以通過食物中的脂肪含量來預測熱量值.
問:已知脂肪為10g,試求其對應熱量值.
解:已求得回歸方程為:
y^=36.0727+15.2584x
當x=10g時,代入回歸方程求得:y^=188.6567cal9)回歸分析的條件線性獨立正態等方差10)相關與回歸的注意事項1.相關與回歸的關系二者反映的是一個問題的兩個角度相關:關聯程度回歸:數量關系二者的基本結論一致相關系數的假設檢驗與回歸系數的假設檢驗等價2.相關與回歸應有實際意義經典統計案例1冰淇淋與犯罪率的關系美國一小鎮警察局長發現該鎮的冰淇淋銷量越多,犯罪率越高,呈正相關。1)能否限制冰淇淋銷量來降低犯罪率。2)試討論該問題。經典統計案例2小孩的身高同小樹的高關系呈正相關。試討論該問題。3.異常點的診斷y。。。。。。
x4.線性與非線性關系脈搏與測量時間人體的身高與年齡
注意:局部線性與整體非線性.4.伴隨關系與因果關系(1)兩相關變量間的關系伴隨關系因果關系(2)相關與因果關系相關分析泛指兩個變量間的關聯程度的分析。相關并不一定表示一個變量的改變是引起另一變化的原因,而可能受另一因素的影響。因此,相關關系并不一定是因果關系?;貧w反映的僅僅是兩變的數量關系,不能證明‘因果’,只可以作為‘因果’的證據之一。(3)因果關系的判斷判斷因果關系至少需要以下證據:數量方面的關系;時間上的先后關系;條件消失,結果消失;條件重現,結果重現。。。生物學中因果關系還需要動物模型方面的證據,生物學理論依據等。(4)關于‘相關’的若干提法及其關系*A與B是否有關A與B是否獨立不同A下B是否相等A對B是否有影響A與B的結果是否一致(配對)有關=不獨立=不相等=有影響=一致無關=獨立=相等=無影響=不一致(5)相關性與差異性*空腹血糖與餐后血糖
---有相關性,有差異性空腹身高與餐后身高
---有相關性,無差異性空腹答題得分與視力得分
---無相關
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 經貿順差協議書
- 藥流醫院協議書
- 聯建黨建協議書
- 承包腳手架合同協議書
- 土石方清運合同協議書
- 考研入會協議書
- 職業限制協議書
- 貓狗領養協議書
- 寵物薩摩耶領養協議書
- 商務和技術合作協議書
- 2024 IP文創行業專題:IP賦能文創轉型正當時
- 2025年江蘇鹽城射陽縣住房和城鄉建設局政府購買服務崗位招考聘用2人高頻重點提升(共500題)附帶答案詳解
- 2025年廣東省惠州博羅縣麻陂鎮招聘第二批村(社區)“兩委”班子儲備人選10人歷年高頻重點提升(共500題)附帶答案詳解
- 企業園區綠化提升實施方案
- 上海市2024年中考英語試題及答案
- 2025年上海市高考語文9道模擬作文題:含范文+詳細解析+參考立意
- 護理學基礎試題庫+答案
- 重慶2020-2024年中考英語5年真題回-學生版-專題04 完成句子
- 2024工業互聯網邊緣計算邊緣網關技術要求及測試方法標準
- 【MOOC】創新思維與創業實驗-東南大學 中國大學慕課MOOC答案
- 企業環境信息披露評價研究的國內外文獻綜述6400字
評論
0/150
提交評論