演示文稿協(xié)方差及相關(guān)系數(shù)_第1頁(yè)
演示文稿協(xié)方差及相關(guān)系數(shù)_第2頁(yè)
演示文稿協(xié)方差及相關(guān)系數(shù)_第3頁(yè)
演示文稿協(xié)方差及相關(guān)系數(shù)_第4頁(yè)
演示文稿協(xié)方差及相關(guān)系數(shù)_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

協(xié)方差及相關(guān)系數(shù)當(dāng)前第1頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

前面我們學(xué)習(xí)了隨機(jī)變量的數(shù)學(xué)期望和方差,對(duì)于多維隨機(jī)變量,除了其數(shù)學(xué)期望和方差外,我們還要研究反映各分量之間關(guān)系的數(shù)字特征,其中最重要的,就是現(xiàn)在要討論的協(xié)方差和相關(guān)系數(shù)1.問(wèn)題的提出一、協(xié)方差與相關(guān)系數(shù)的概念及性質(zhì)當(dāng)前第2頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

在討論這個(gè)問(wèn)題之前,我們先看一個(gè)例子。在研究子女與父母的相象程度時(shí),有一項(xiàng)是關(guān)于父親的身高和其成年兒子身高的關(guān)系。當(dāng)前第3頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

這里有兩個(gè)變量,一個(gè)是父親的身高,一個(gè)是成年兒子身高.為了研究二者關(guān)系,英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜收集了1078個(gè)父親及其成年兒子身高的數(shù)據(jù),畫(huà)出了一張散點(diǎn)圖。兒子的身高父親的身高問(wèn):父親及其成年兒子身高存在怎樣的關(guān)系呢?fatherson當(dāng)前第4頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)類似的問(wèn)題有:1、吸煙和患肺癌有什么關(guān)系?2、受教育程度和失業(yè)有什么關(guān)系?3、高考入學(xué)分?jǐn)?shù)和大學(xué)學(xué)習(xí)成績(jī)有什么關(guān)系?……???當(dāng)前第5頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)協(xié)方差當(dāng)前第6頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)定義對(duì)兩個(gè)隨機(jī)向量(X,Y),若E(X-EX)(Y-EY)存在,則稱cov(X,Y)=E(X-EX)(Y-EY)

為X和Y的協(xié)方差。特別,若X=Y,則cov(X,X)=E(X-EX)2=D(X)因此,方差是協(xié)方差的特例,協(xié)方差刻畫(huà)兩個(gè)隨機(jī)變量之間的“某種”關(guān)系.可以證明若(X,Y)服從二維正態(tài)分布,即則2.定義當(dāng)前第7頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)可見(jiàn),若X與Y獨(dú)立,則4.計(jì)算協(xié)方差的一個(gè)簡(jiǎn)單公式Cov(X,Y)=0.

Cov(X,Y)=E(XY)-E(X)E(Y)

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)3隨機(jī)變量和的方差與協(xié)方差的關(guān)系當(dāng)前第8頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)(5)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)(3)Cov(X,Y)=Cov(Y,X)(對(duì)稱性)5.簡(jiǎn)單性質(zhì)(4)Cov(aX,bY)=abCov(X,Y)其中a、b是常數(shù)下面請(qǐng)大家利用上面所學(xué)的知識(shí)進(jìn)行證明。(1)Cov(X,X)=D(X)(2)Cov(X,c)=0(c為常數(shù))當(dāng)前第9頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

協(xié)方差的數(shù)值在一定程度上反映了X與Y相互間的聯(lián)系,但它受X與Y本身數(shù)值大小的影響.如令X*=kX,Y*=kY,這時(shí)X*與Y*間的相互聯(lián)系和X與Y的相互聯(lián)系應(yīng)該是一樣的,但是Cov(X*,Y*)=k2Cov(X,Y)

為了克服這一缺點(diǎn),在計(jì)算X與Y的協(xié)方差之前,先對(duì)X與Y進(jìn)行標(biāo)準(zhǔn)化:

再來(lái)計(jì)算X*和Y*的協(xié)方差,這樣就引進(jìn)了相關(guān)系數(shù)的概念.當(dāng)前第10頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)為隨機(jī)變量X和Y的相關(guān)系數(shù)(correlationcoefficient).1.定義:若D(X)>0,D(Y)>0,且Cov(X,Y)存在時(shí),稱

在不致引起混淆時(shí),記

為.二、相關(guān)系數(shù)當(dāng)前第11頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)2.相關(guān)系數(shù)的性質(zhì)注意

|ρXY|

的大小反映了X,Y之間線性關(guān)系的密切程度:ρXY=0時(shí),X,Y之間無(wú)線性關(guān)系;|ρXY|=1時(shí),X,Y之間具有線性關(guān)系.當(dāng)前第12頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)ρXY>0,X,Y正相關(guān)ρXY<0,X,Y負(fù)相關(guān)ρXY≠0,X,Y相關(guān)ρXY=0,X,Y不相關(guān)(ρXY=1,X,Y完全正相關(guān))(ρXY=-1,X,Y完全負(fù)相關(guān))xy0

完全正相關(guān)Y=aX+ba>0xy0

完全負(fù)相關(guān)Y=aX+ba<0當(dāng)前第13頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)xy0

完全不相關(guān)xy0

正相關(guān)xy0

負(fù)相關(guān)當(dāng)前第14頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)例:將一枚密度均勻硬幣拋n次,分別以X和Y記作正反面出現(xiàn)的次數(shù),則X和Y的相關(guān)系數(shù)為A:0B:1C:-1D:1或-1解:因?yàn)閄+Y=n,即P{Y=-X+n}=1,所以X與Y完全負(fù)相關(guān),故從而選C。注:若a>0時(shí),ρXY=1a<0時(shí),ρXY=-1則當(dāng)前第15頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)例2(X,Y)的聯(lián)合分布為:X-101Y-1011/81/81/81/801/81/81/81/8求相關(guān)系數(shù)ρXY,并判斷X,Y是否相關(guān),是否獨(dú)立.解:X-101Y-1011/81/81/83/81/801/82/81/81/81/83/83/82/83/81XY-101P2/84/82/8當(dāng)前第16頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)例2(X,Y)的聯(lián)合分布為:X-101Y-1011/81/81/81/801/81/81/81/8求相關(guān)系數(shù)ρXY,并判斷X,Y是否相關(guān),是否獨(dú)立.解:從而:X-101Y-1011/81/81/83/81/801/82/81/81/81/83/83/82/83/81另一方面:P(X=-1,Y=-1)=1/8≠P(X=-1)P(Y=-1)=(3/8)×(3/8)所以X與Y不獨(dú)立.當(dāng)前第17頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

這里可以利用相關(guān)系數(shù)的定義和微積分的知識(shí)可得即為X和Y的相關(guān)系數(shù),當(dāng)前第18頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)結(jié)論當(dāng)前第19頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)例3解當(dāng)前第20頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)當(dāng)前第21頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

X,Y不相關(guān)X,Y相互獨(dú)立X,Y不相關(guān)若(X,Y)服從二維正態(tài)分布,X,Y相互獨(dú)立X,Y不相關(guān)不相關(guān)與相互獨(dú)立當(dāng)前第22頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)解例4當(dāng)前第23頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)當(dāng)前第24頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)當(dāng)前第25頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

這一講我們主要介紹了協(xié)方差和相關(guān)系數(shù),相關(guān)系數(shù)是刻劃兩個(gè)隨機(jī)變量間線性相關(guān)程度的重要的數(shù)字特征,它取值在-1到1之間.

如果兩個(gè)變量之間存在強(qiáng)相關(guān),則已知一個(gè)變量的值對(duì)預(yù)測(cè)另一個(gè)變量的值將很有幫助,如前面幾個(gè)引例。小結(jié)當(dāng)前第26頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)1.定義當(dāng)前第27頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)2.協(xié)方差矩陣當(dāng)前第28頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)當(dāng)前第29頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

例設(shè)隨機(jī)變量X和Y相互獨(dú)立且X~N(1,2),Y~N(0,1).試求Z=2X-Y+3的概率密度.

故X和Y的聯(lián)合分布為正態(tài)分布,X和Y的任意線性組合是正態(tài)分布.解:

X~N(1,2),Y~N(0,1),且X與Y獨(dú)立,D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即

Z~N(E(Z),D(Z))當(dāng)前第30頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)故Z

的概率密度是Z~N(5,32)當(dāng)前第31頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)契比雪夫不等式證明取連續(xù)型隨機(jī)變量的情況來(lái)證明.

切比雪夫不等式當(dāng)前第32頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)得當(dāng)前第33頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)

切比雪夫不等式只利用隨機(jī)變量的數(shù)學(xué)期望及方差就可對(duì)的概率分布進(jìn)行估計(jì)。從切比雪夫不等式還可以看出,對(duì)于給定的>0,當(dāng)方差越小時(shí),事件{|X-E(X)|≥}發(fā)生的概率也越小,即X的取值越集中在E(X)附近.這進(jìn)一步說(shuō)明方差確實(shí)是一個(gè)描述隨機(jī)變量與其期望值離散程度的一個(gè)變量.當(dāng)D(X)已知時(shí),切貝雪夫不等式給出了X與E(X)的偏差小于的概率的估計(jì)值.

切比雪夫不等式的用途:

(1)證明大數(shù)定律;(2)估計(jì)事件的概率。當(dāng)前第34頁(yè)\共有36頁(yè)\編于星期四\3點(diǎn)例1

已知正常男性成人血液中,每一毫升白細(xì)胞數(shù)平均是7300,均方差是700.利用切比雪夫不等式估計(jì)每毫升白細(xì)胞數(shù)在5200~9400之間的概率.解:設(shè)每毫升白細(xì)胞數(shù)為X依題意,E(X)=7300,D(X)=7002所求為

P(5200X9400)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論