樣本相關系數課件_第1頁
樣本相關系數課件_第2頁
樣本相關系數課件_第3頁
樣本相關系數課件_第4頁
樣本相關系數課件_第5頁
已閱讀5頁,還剩24頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章成對數據的統計分析8.1.2樣本相關系數李思

這兩組成對變量都是線性正相關,你能判斷哪一組的線性相關性更強嗎?通過散點圖可以推斷兩個變量之間是否存在相關關系、是正相關還是負相關、是線性相關是非線性相關,但這些推斷是定性的推斷.從定量的角度刻畫成對樣本數據的線性相關程度,進而推斷兩個變量的線性相關程度。樣本相關數r根據散點圖特征,初步構造統計量:年齡/歲脂肪含量/%中心化成對樣本數據:將數據以

為零點進行平移,得到平移后的數據為:

通過繪圖分析可得,如果變量x和y正相關,那么關于均值平移后的大多數散點將分布在第一象限、第三象限,對應的成對數據同號的居多,如圖(1)所示;

如果變量x和y負相關,那么關于均值平移后的大多數散點將分布在第二象限、第四象限,對應的成對數據異號的居多,如圖(2)所示.利用散點

的橫縱坐標是否同號,可以構造一個量:一般情形下,

表明成對樣本數據正相關;

表明成對樣本數據負相關.

問題:你認為

的大小一定能度量出成對樣本數據的相關程度嗎?在研究體重與身高之間的相關程度時,如果體重的單位不變,把身高單位由米改為厘米,單位的改變不會改變體重與身高之間的相關程度。為了消除單位的影響,進一步做“標準化”處理:為簡單起見,把上述“標準化”處理后的成對數據分別記為:仿照Lxy的構造,可以得到樣本相關系數:樣本相關系數r是一個描述成對樣本數據的數字特征,它反映了兩個隨機變量之間的線性相關程度.r的符號反映了相關關系的正負性.|r|的大小反映了兩個變量線性相關的程度,即散點集中于一條直線的程度.我們稱r為變量x和變量y的樣本線性相關系數,簡稱樣本相關系數.當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.

樣本相關系數r是一個描述成對樣本數據的數字特征,它的正負和絕對值的大小可以反映成對樣本數據的變化特征.樣本相關系數r的正負能反映出成對變量的什么關系?標準化處理后的成對樣本數據:設其第一分量為設其第二分量為

新知探究

樣本相關系數r的取值范圍:樣本相關系數r的取值范圍為[-1,1]相關系數的性質:①當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.②|r|≤1;③當|r|越接近1時,成對數據的線性相關程度越強;當|r|越接近0時,成對數據的線性相關程度越弱;特別地,當|r|=0時,成對數據的沒有線性相關關系;當|r|=1時,成對數據都落在一條直線上.注意:若0.75≤|r|≤1,則認為y與x的線性相關程度很強;

若0.3≤|r|<0.75,則認為y與x的線性相關程度一般;若|r|≤0.25,則認為y與x的線性相關程度較弱)圖(1)中成對樣本數據的正線性相關程度很強.圖(2)中成對樣本數據的負線性相關程度比較強.圖(3)中對樣本數據的線性相關程度很弱.圖(4)中成對樣本數據的線性相關程度極弱.練習1判斷正誤(正確的打“√”,錯誤的打“×”)(1)相關關系是一種非確定性關系,體現的不一定是因果關系,可能是伴隨關系.(

)(2)散點圖越接近某一條直線,線性相關程度越強,樣本相關系數越大.()(3)散點圖可以直觀地分析出兩個變量是否具有相關性.(

)(4)若變量x,y滿足函數關系,則這兩個變量線性相關.(

)×√×√練習2已知求得甲、乙、丙3組不同的數據的樣本相關系數分別為0.81,-0.98,0.63,其中________(填甲、乙或丙)組數據的線性相關程度最強.乙

例1根據表8.1-1中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度.解:由樣本數據可得由此可以推斷脂肪含量和年齡這兩個變量正線性相關,且相關程度很強.編號1234567891011121314年齡/歲2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6

變式1

在一次試驗中,測得(x,y)的4組值分別為(1,2),(2,0),(4,-4),(-1,6),則y與x的樣本相關系數為(

)A.1 B.-2C.0 D.-1√解:由樣本數據可得√變式3

兩個變量x,y的樣本相關系數r1=0.7859,兩個變量u,v的樣本相關系數r2=-0.9568,則下列判斷正確的是(

)CA.變量x與y正相關,變量u與v負相關,變量x與y的線性相關性較強B.變量x與y負相關,變量u與v正相關,變量x與y的線性相關性較強C.變量x與y正相關,變量u與v負相關,變量u與v的線性相關性較強D.變量x與y負相關,變量u與v正相關,變量u與v的線性相關性較強解析由樣本相關系數r1=0.7859>0知x與y正相關,由樣本相關系數r2=-0.9568<0知u,v負相關.又|r1|<|r2|,∴變量u與v的線性相關性比x與y的線性相關性強.

例3.在某校高一年級中隨機抽取25名男生,測得他們的身高、體重、臂展等數據,如表所示.體重與身高、臂展與身高分別具有怎樣的相關性?解:根據樣本數據畫出體重與身高、臂展與身高的散點圖,分別如圖(1)和(2)所示,兩個散點圖都呈現出線性相關的特征.

題型一:相關系數的計算

21232527293235711212466115325

21232527293235711212466115325

課本103頁1.已知變量x和變量y的3對隨機觀測數據(2,2),(3,-1),(5,-7),計算成對樣本數據的樣本相關系數.能據此推斷這兩個變量線性相關嗎?為什么?解:由樣本數據可得雖然樣本相關系數為-1,三個樣本點在一條直線上,但是由于樣本量太小,據此推斷兩個變量完全線性相關并不可靠.例2

假設關于某種設備的使用年限x(單位:年)與所支出的維修費用y(單位:萬元)有如下統計資料:x23456y2.23.85.56.57.0所以y與x之間具有正相關關系.

練習2.隨機抽取7家超市,得到其廣告支出與銷售額數據如下:解:由樣本數據可得正線性相關,相關性較強,銷售額與廣告支出的變化趨勢相同.超市ABCDEFG廣告支出/萬元1246101420銷售額/萬元19324440525354請推斷超市的銷售額與廣告支出之間的相關關系的類型、相關程度和變化趨勢的特征.課堂小結:1.樣本相關系數:2.相關系數的性質:①當r>0時,稱成對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論