應(yīng)用多元統(tǒng)計分析課后答案_第1頁
應(yīng)用多元統(tǒng)計分析課后答案_第2頁
應(yīng)用多元統(tǒng)計分析課后答案_第3頁
應(yīng)用多元統(tǒng)計分析課后答案_第4頁
應(yīng)用多元統(tǒng)計分析課后答案_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2.1.試敘述多元聯(lián)合分布和邊際分布之間的關(guān)系。

解:多元聯(lián)合分布討論多個隨機(jī)變量聯(lián)合到一起的概率分布狀況,X=(X"X2,…X',)'的

聯(lián)合分布密度函數(shù)是一個P維的函數(shù),而邊際分布討論是X=(X”X2,…X/,)'的子向量的

概率分布,其概率密度函數(shù)的維數(shù)小于P。

2.2設(shè)二維隨機(jī)向量(X1X2)'服從二元正態(tài)分布,寫出其聯(lián)合分布。

一、

。12

解:設(shè)(X|X2)'的均值向量為p=(44),協(xié)方差矩陣為吃,則其聯(lián)

合分布密度函數(shù)為

2.3已知隨機(jī)向量(X1X2)'的聯(lián)合密度函數(shù)為

2Kd—C)(X1—〃)+(Z?—Q)(X>—c)—2(X|—6/)(%2—c)]

f(x,x)

t2(b-a)2(d-c)2

其中c<x2<d<,求

(1)隨機(jī)變量X1和*2的邊緣密度函數(shù)、均值和方差;

(2)隨機(jī)變量X1和X2的協(xié)方差和相關(guān)系數(shù);

(3)判斷X1和X?是否相互獨(dú)立。

(1)解:隨機(jī)變量X1和X2的邊緣密度函數(shù)、均值和方差;

r/x_'2[(d-c)(玉_。)+(/?_〃)(%2_。)-2(王一〃)(尤2—c)]

*1I(h-a)2(d-c)2

_2(J-c)(x,-a)x2rf2[(/>-a)(x2-c)-2(x(-a)(x2-c)]

4-

(b-a)\d-c)2S—a)2(d—42

2(d-c)(Xj—a)x2+1-。2](2—4),一2(七一&網(wǎng)小

2

22L-(b-a)\d-c)'

(b-a)(d-c)c

d-c

2(d-c)(x(—(1)X2[(b—。)廠—2(玉—a)廠]1

(b-aY(d-c)2+~

c(b-a)2(d—c)20b-a

所以

b+a.(b-aV

由于X|服從均勻分布,則均值為——,方差為'------

212

1

玉?,‘引,則均值為5

同理,由于X?服從均勻分布f^2)=\d-

x2

0其它

方差為(d-cf

力專為-------

12

(2)解:隨機(jī)變量X1和X2的協(xié)方差和相關(guān)系數(shù);

cov(xpx2)

a+bd+c[2[(J-c)(X]-a)+(b-a)(x-c)-2(玉-a)(x-<?)]

x.-----22-dxdx

122(b-a)\d-c)2{2

[c-d){b-a)

36

cov(x.,x)1

p=----!-J?=一

cra.3

X[x2

(3)解:判斷X1和X?是否相互獨(dú)立。

X1和X2由于/(花,々)。人(王)幾(工2),所以不獨(dú)立。

2.4設(shè)X=(X?X2,…X「)'服從正態(tài)分布,已知其協(xié)方差矩陣£為對角陣,證明其分量是相

互獨(dú)立的隨機(jī)變量。

解:因為X=(X],X2,…XJ的密度函數(shù)為

又由于E

|"28…G

(1

0-.2

1

E-1

1

則/(芭,

1

-2

1

']丫1-1/2

網(wǎng)=端6…可exp<_,(x-燈匚

1

1(%一〃3)~1⑷一〃,

2-al~3可

FT1(x「RY

=11-kexp\----^―>=/(x).../(七)

,=i0,2萬[2cr(.

則其分量是相互獨(dú)立。

2.5由于多元正態(tài)分布的數(shù)學(xué)期望向量和均方差矩陣的極大似然分別為

G=X=ZX:n

>=i

t=^(X,-X)(X,-X)7n

i=l/

35650.00A

12.33

17325.00

152.50

201588000.0038900.0083722500.00-736800.00、

38900.0013.06716710.00-35.80

83722500.0016710.0036573750.00-199875.00

-736800.00-35.800-199875.0016695.107

1o-

_1S=X3」1J:)X

注:利用X網(wǎng)=—X'1”,其中4=

01

在SPSS中求樣本均值向量的操作步驟如下:

1,選擇菜單項Analyze-*DescriptiveStatistics-*Descriptives,|JJFDescriptives對話框。

將待估計的四個變量移入右邊的Variables列表框中,如圖2.1。

圖2.1Descriptives對話框

2.單擊Options按鈕,打開Options子對話框。在對話

框中選擇Mean復(fù)選框,即計算樣本均值向量,如圖2.2所示。單擊Continue按

鈕返回主對話框。

圖2.2Options子對話框

3.單擊OK按鈕,執(zhí)行操作。則在結(jié)果輸出窗口中給出樣本均值向量,如表2.1,即

樣本均值向量為(353333,12.3333,17.1667,1.5250E2)。

描述統(tǒng)計里

N均值

X1635650.0000

x2612.3333

x3617325.0000

x46152.5000

有效的N(列表狀態(tài))6

表2.1樣本均值向量

在SPSS中計算樣本協(xié)差陣的步驟如下:

1.選擇菜單項Analyze-*Correlate->Bivariate,打開

BivariateCorrelations對話框。將三個變量移入右邊的Variables列表框中,如圖

2.3。

圖2.3BivariateCorrelations對話框

2.單擊Options按鈕,打開Options子對話框。選擇

Cross-productdeviationsandcovariances復(fù)選框,即計算樣本離差陣和樣本協(xié)差

陣,如圖2.4。單擊Continue按鈕,返回主對話框。

圖2.4Options子對話框

3.單擊OK按鈕,執(zhí)行操作。則在結(jié)果輸出窗口中給

出相關(guān)分析表,見表2.2o表中Covariance給出樣本協(xié)差陣。(另外,Pearson

Correlation為皮爾遜相關(guān)系數(shù)矩陣,SumofSquaresandCross-products為樣本離

差陣。)

X1x2x3x4

xlPearson1.758,975”-402

顯著性.081.001.430

平方與義租的和1.008E9194500.0004.186E8-3684000.000

協(xié)方差2.016E838900.0008.372E7-736800.000

N6666

x2Pearson相關(guān)性.7581.764-.077

顯著性(雙忸).081.077885

平方與叉稅的和19450000065.33383550000-179000

協(xié)方差3890000013.06716710000-35800

N6666

x3Pearson相關(guān)性.975".7641-.256

顯著性(歿博).001.077.625

平方與叉稅的和4.186E883550.0001.829E8-999375.000

協(xié)方差8.372E716710.0003.657E7-199875.000

N6666

x4Pearson10^1-.402-.077-.2561

顯著性(雙斜).430.885.625

平方與叉稅的和-3684000.000-179.000-999375.00083475500

協(xié)用!?736800.000-35.800-199875.00016695100

N6666

2.6漸近無偏性、有效性和一致性;

2.7設(shè)總體服從正態(tài)分布,X~叫”),有樣本X3X2,...,X“。由于*是相互獨(dú)立的正

態(tài)分布隨機(jī)向量之和,所以又也服從正態(tài)分布。又

E(又)=En-

\i=\

D(又)=D格X,'1

〃/=1〃/=1n

所以又~Np3,E)。

2.8方法1:£=」一汽(Xj—又)(X;—又y

n-\,=i

]〃__

=「Zxx-〃雙

n-1,=i

-1

E(E)=--蛉xx-〃歡)

n-\

/=1

1fE(X.X;)-〃E(雙)

n-i

f=l

1

----(A2-1)E=Eo

71-1A”撲n-\

方法2:S=f(Xj-*)(Xj-*)'

/=1

=£[%-"—(又—R][X,-N—(又—NJ

i=l

=X(X,.-H)(X,.-1!)'-2^(X,.-)(X-y+n(X-劉)'

MM|i)(XM-

i=I/=1

=£(X,.-M)(X,.-JI),-2/7(X-|i)(X-fl)'+n(X-|i)(X—河

/=1

=之區(qū)5)(x,r)'—〃(又一g)(x-

/?=i

=-^-EE(X,叩)(X「gy-nEtX-nXX一p)'=E。

〃-M,=i)

故一色—為2的無偏估計。

n-1

2.9.設(shè)X(1),X⑵,...,X(“)是從多元正態(tài)分布X~NJN,E)抽出的一個簡單隨機(jī)樣本,試求S

的分布。

證明:設(shè)

*、

**...*

r=**…*=(為)為一正交矩陣,即rr=i。

111

令Z=(Z|z2…zn)=(x.x2-xjr,

由于X[(i=1,2,3,4,…〃)獨(dú)立同正態(tài)分布,月T為正交矩陣

所以2'=億|Z2…Z")獨(dú)立同正態(tài)分布。且有

E(Z〃)=E("x,)(a=1,2,3,-1)

j=i

j=\7n

=&1小=o

I=I

VMZ")="("xj)

7=l

=力的*,)=虎寸=工

J=1J=1

所以Z|Z2Z,“獨(dú)立同N(0,E)分布。

又因為s=£(X)-x)(xy-xy

i=l

£XjX[-〃雙

j=l

因為〃忒'=〃=z“z:

八yJni=\J

nX'

2

又因為£XjX:=(Xix2…x?),

月?

1X”

X、

/、x;

=(%X2…Xn)「T:2

&

N、

=(Z.Z2-zn)Z2

所以原式£X/X:-Z,Z:=—Z“Z;

j=lj=l

=z1z;+z2z;+...+z?z;,-znz;

n-\

故5=工2/',,山于Z”Z2,…,Z“_|獨(dú)立同正態(tài)分布N/O.E),所以

j=l

n-1

S=ZZ£叫,(IZ)

j=l

2.10.設(shè)乂,(%、〃)是來自紇(禺,二)的簡單隨機(jī)樣本,,=123l?,攵,

(l)已知m=^2=...=%=4且工1==2=?-=工人’=Z,求JI和E的估計。

(2)已知A=%=??,=Z=工求%,%,…,,%和E的估計。

1k%

解:(。&=大=----------------Z£x:,

"]+%+…+%.4=1i=l

八火?(x:—)(x:—可‘

£_a=li=l_______________________

n[+%+…+%

(2)InL(內(nèi),…,%,E)

=ln[(2m"H『%xp[—:乞£(步-K)'E”(X;認(rèn))]

'a=\i=\

1n1An

InL(p,E)=-pnln(2^)-In£一0工2國'--)£々:-兒)

LL2a=li=l

aInL(n,L)=-F+;t£(xD(x:/J①)2=0

比'/a=\/=1

ainZ4i,,E)R.

一廣一=Z1(X小~)=0(j=1,2,…肉

i=i

解之,得

第三章

3.1試述多元統(tǒng)計分析中的各種均值向量和協(xié)差陣檢驗的基本思想和步驟。

其基本思想和步驟均可歸納為:

答:第一,提出待檢驗的假設(shè)比和H1;

第二,給出檢驗的統(tǒng)計量及其服從的分布;

第三,給定檢驗水平,查統(tǒng)計量的分布表,確定相應(yīng)的臨值,從而得到否定域;

第四,根據(jù)樣本觀測值計算出統(tǒng)計量的值,看是否落入否定域中,以便對待判假設(shè)做出

決策(拒絕或接受)。

均值向量的檢驗:

統(tǒng)計量拒絕域

在單一變量中

當(dāng)我已知z="。)G1zl>z

('aal2

當(dāng)4未知

0

1〃_

(s2=——y(x,.-x)2作為『的估計量)

〃一1仁

,個正態(tài)總體”0:「%

協(xié)差陣21已知年=〃(又—"。注九米_"。)~%2(p)T2>/

(〃一1)一〃+12口/、n-p口

協(xié)差陣£未知----------£----T-F(p,n-p)---------T2>F?

(〃-Dp(Dp"

(T?=(〃一1)[冊(又一^ys-'V^cx-%月)

兩個正態(tài)總體”0:出=%

,w-_-,_-_-~/⑺窗>必

有共同已知協(xié)差陣72=21()EI()

n+m

有共同未知協(xié)差陣F=---------------------TF(p,n+m-p-1)r>R

(〃+機(jī)-2)p

(其中T2=(“+〃L2)^-(X-Y)S-{.EHL(X-Y))

Vn+m+

協(xié)差陣不等〃-mF=上止2s、%~F(p,〃—p)F2

p

協(xié)差陣不等〃wmF=(〃二P)〃一元F(p,n—p)F>Fa

p

多個正態(tài)總體"o:〃]=〃2=…=d

SSA(D?

單因素方差F="ILF>F

SSE/(n-k)a

|E||E|

多因素方差A(yù)=Th|A+E|~A(P,iJ)

協(xié)差陣的檢驗

檢驗2=]

“°:£=2=exp{—g〃s}網(wǎng)'”[£)

=、,Ip2=exp|-^rS*j|s*|n,2Q

%E:

檢驗Xi=L=???=

2AH。:盤=%h..=國

統(tǒng)計量.=,2立聞"卷/印2點儼2

1=1//=!

3.2試述多元統(tǒng)計中霍特林T*分布和威爾克斯A分布分別與一元統(tǒng)計中t分布和F分布的關(guān)

系。

答:(1)霍特林1名分布是t分布對于多元變量的推廣。

r='"X丁=n(X-0(『尸(I-〃)而若設(shè)X~N?卬,E),S~匕(2E)且X與S

S

相互獨(dú)立,n>p,則稱統(tǒng)計量T;=?0(一|0'5-'(%一聞的分布為非中心霍特林/分布。

若X~N0(O,E),S~%,(〃,£)且X與S相互獨(dú)立,令T?=nX'S-'X,則

"一P+172乙,IX

--------T~F(p,n-p+i)o

np

(2)威爾克斯A分布在實際應(yīng)用中經(jīng)常把A統(tǒng)計量化為"統(tǒng)計量進(jìn)而化為F統(tǒng)計量,

利用F統(tǒng)計量來解決多元統(tǒng)計分析中有關(guān)檢驗問題。

A與尸統(tǒng)計量的關(guān)系

P九2F統(tǒng)計量及分別

-p+11-A(p,n),l),八

任意任意1?~F(p,%p+1)

P

n}-p1—,A(p,〃I,2)

任意任意2-r--------~Q(2p,2(〃]〃))

PjA(p,〃I,2)

/1—AU,%%)rz、

I任意任意?、~P(〃2,"J

n2A。/[,%)

?I-11-JAR,4,4)八、

2任意任意?;---------~F(2”2,2(〃|1))

〃2,A(2,〃|,〃2)

3.3試述威爾克斯統(tǒng)計量在多元方差分析中的重要意義。

答:威爾克斯統(tǒng)計量在多元方差分析中是用于檢驗均值的統(tǒng)計量。

Ho:內(nèi)=%=.,=即H\-至少存在i#/使內(nèi)H%

用似然比原則構(gòu)成的檢驗統(tǒng)計量為八一回一旦~A(p,n-k,k—V)給定檢驗水

lTl|A+E|

平a,查WUks分布表,確定臨界值,然后作出統(tǒng)計判斷。

第四章

4.1簡述歐幾里得距離與馬氏距離的區(qū)別和聯(lián)系。

答:設(shè)維歐幾里得空間”中的兩點x=(x..x,“&)'和。則歐幾里得距

P;;Y=(YVY2

離為£匕區(qū)-川尸。歐幾里得距離的局限有①在多元數(shù)據(jù)分析中,其度量不合理。②會受到

實際問題中量綱的影響。

設(shè)X,Y是來自均值向量為L,協(xié)方差為上的總體G中的p維樣本。則馬氏距離為

D(X,Y)=CC-Y)/o當(dāng)工7=[即單位陣時,

,

D(X)Y)=(X-1OCX-外=工2&-YL/即歐幾里得距離。

因此,在一定程度上,歐幾里得距離是馬氏距離的特殊情況,馬氏距離是歐幾里得距離

的推廣。

4.2試述判別分析的實質(zhì)。

答:判別分析就是希望利用已經(jīng)測得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某

種最優(yōu)性質(zhì),能把屬于不同類別的樣本點盡可能地區(qū)別開來。設(shè)RI,R2,…,Rk是p維空

間Rp的k個子集,如果它們互不相交,且它們的和集為RP,則稱R“為%的一個

劃分。判別分析問題實質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對p維空間Rp構(gòu)造一個“劃

分”,這個“劃分”就構(gòu)成了一個判別規(guī)則。

4.3簡述距離判別法的基本思想和方法。

答:距離判別問題分為①兩個總體的距離判別問題和②多個總體的判別問題。其基本思想都

是分別計算樣本與各個總體的距離(馬氏距離),將距離近的判別為一類。

①兩個總體的距離判別問題

設(shè)有協(xié)方差矩陣2相等的兩個總體G和a其均值分別是〃/和〃2,對于一個新的樣品X,

要判斷它來自哪個總體。計算新樣品才到兩個總體的馬氏距離gQX,G)和G(尤&),

-XEG],D'(X,G>)(X,G2)

.XeG;,加(X,GJ>(X,G2,

具體分析,

2

D(X,Gt)-D\X,G2)

=(X-F1,)X-'(X-冉)-(X-m)'匚(X_3)

-I-1

=XTX-2X2一U+西匚出一(X'lX-2XTI12+田匚畫)

=2X2”-冉)+吟口-哈"

=2X'I仙-內(nèi))+(冉+%)'1(內(nèi)心2)

--2(X-^A£T仙—%)

Iz)

=-2(X—R)'a=-2a'(X-@)

記W(X)=a'(X-m則判別規(guī)則為

Xg.,W(X)aO

xeG:,w(x)<o

②多個總體的判別問題。

設(shè)有火個總體G”G2,…,G*,其均值和協(xié)方差矩陣分別是內(nèi),修,…,人和A,%,…,Z,

且A=%=…=Z=£。計算樣本到每個總體的馬氏距離,到哪個總體的距離最小就屬

于哪個總體。

具體分析,£>2(X,G“)=(Xfa)'£T(X-|ia)

,||

=XT-X-2li;L-X+M;L-ga

=XX-'X-2(I;X+C?)

取C〃=一;心》勿〃,a=l,2,…收。

可以取線性判別函數(shù)為

M(X)=I:X+Q,a=\,2,-,k

相應(yīng)的判別規(guī)則為XeGj若叱(X)=max(I:X+Ca)

\<a<k

4.4簡述貝葉斯判別法的基本思想和方法。

基本思想:設(shè)k個總體…,G*,其各自的分布密度函數(shù)力(x),%(x),…,九(x),假設(shè)k

個總體各自出現(xiàn)的概率分別為名,%「?,/?,%20,=1。設(shè)將本來屬于G,總體的樣品

f=1

錯判到總體G,時造成的損失為C(j\/),i,j=1,2,…,女。

設(shè)女個總體G,G2,…,G.相應(yīng)的p維樣本空間為R=(&,R2,…,R”

在規(guī)則R下,將屬于G,的樣品錯判為G,的概率為

產(chǎn)(jli,R)=[£(x)dxi,j=1,2,…,kifj

則這種判別規(guī)則卜樣品錯判后所造成的平均損失為

r(i\R)=%C(jIi)P(j\i,R)]i=1,2,-J

j=l

則用規(guī)則R來進(jìn)行判別所造成的總平均損失為

g(H)=Zq/(,',R)

/=1

i=lj=l

貝葉斯判別法則,就是要選擇?種劃分…,/,使總平均損失g(K)達(dá)到極小。

kk

基本方法:g(R)=、>,5C(,li)P(jli,R)

/=1j=\

Z=1j=lJ

=1j,(X%C5"(x))dx

令Zq,C(jli)/(x)=%(x),則g(R)=Z1%(x)dx

若有另一劃分K*=(R:,&,,g(R*)=次1%(x)dx

jTj

則在兩種劃分下的總平均損失之差為

g(R)-g(R*)=?[

CR」Z(X)-勺(x)]dx

/=lJ=1

因為在凡上用(x)W〃j(x)對一切/成立,故上式小于或等于零,是貝葉斯判別的解。

從而得到的劃分&=(&出…,&)為K+W)=喇網(wǎng)}』2../

4.5簡述費(fèi)希爾判別法的基本思想和方法。

答:基本思想:從左個總體中抽取具有0個指標(biāo)的樣品觀測數(shù)據(jù),借助方差分析的思想構(gòu)

造一個線性判別函數(shù)

U(X)=u]Xi+u2X2+---+ul)Xp=u'X

系數(shù)u=(小,%,…,”p)‘可使得總體之間區(qū)別最大,而使每個總體內(nèi)部的離差最小。將新樣

品的〃個指標(biāo)值代入線性判別函數(shù)式中求出。(X)值,然后根據(jù)判別一定的規(guī)則,就可以判

別新的樣品屬于哪個總體。

4.6試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。

答:①費(fèi)希爾判別與距離判別對判別變量的分布類型無要求。二者只是要求有各類母體的

兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對來說較為簡單。

②當(dāng)k=2時,若&=%=工則費(fèi)希爾判別與距離判別等價。當(dāng)判別變量服從正態(tài)分布時,

二者與貝葉斯判別也等價。

③當(dāng)當(dāng)=工二時,費(fèi)希爾判別用局+%作為共同協(xié)差陣,實際看成等協(xié)差陣,此與距離判

別、貝葉斯判別不同。

(4)距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是X€GX,

W(X)21nd

XeG?,W(X)<lnd

距離判別的判別規(guī)則是

?XeGj,W(X)^Q

xeGj,w(x)<o

二者的區(qū)別在于閾值點。當(dāng)%=&,C(H2)=C(2I1)時,d=l,皿"=0。二者完全

相同。

4.7設(shè)有兩個二元總體G?和,從中分別抽取樣本計算得到

?母烈假設(shè)均試用距離判別法建立判別函數(shù)和判

別規(guī)則。樣品X=(6,0)'應(yīng)屬于哪個總體?

解:網(wǎng)第⑴-?,得-⑷,仲普(二)

Wp=a*Cx-P)=U-PJ/

&-㈤=(60-(4.0.5)=(Z.a,5)

£T=J7.6-Z.1J

狗671-乙15,8’

(l*i-的)=億與'

-2,1\/2\24,4

5.8f\3/~39£7

J.XeGj即樣品X屬于總體G&

4.8某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這卜種品

牌飲料的銷售價格(元)和顧客對各種飲料的口味評分、信任度評分的平均數(shù)。

銷售情況產(chǎn)品序號銷售價格口味評分信任度評分

12.258

27

暢銷2.56

33.039

43.286

52.876

平銷63.587

74.898

81.734

滯銷92.242

102.743

⑴根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對原樣本進(jìn)行回判。

⑵現(xiàn)有一新品牌的飲料在該超市試銷,其銷售價格為3.0,顧客對其口味的評分平均為

8,信任評分平均為5,試預(yù)測該飲料的銷售情況。

解:增加group變量,令暢銷、平銷、滯銷分別為groupl、2、3;銷售價格為X1,口味評

分為X2,信任度評分為X3,用spss解題的步驟如下:

1.在SPSS窗口中選擇AnalyzefClassifyfDiscriminate,調(diào)出判別分析主界面,

將左邊的變量列表中的“group”變量選入分組變量中,將汽、X2、X3變量選入自

變量中,并選擇Enterindependentstogether單選按鈕,即使用所有自變量進(jìn)行判

別分析。

2.點擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為

1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界

面。如圖4.1

圖4.1判別分析主界面

3.單擊Statistics...按鈕,指定輸出的描述統(tǒng)計量和判別函數(shù)系數(shù)。選中Function

Coefficients欄中的Fisher's:給出Bayes判別函數(shù)的系數(shù)。(注意:這個選項不是

要給出Fisher判別函數(shù)的系數(shù)。這個復(fù)選框的名字之所以為Fisher's,是因為按判

別函數(shù)值最大的一組進(jìn)行歸類這種思想是由Fisher提出來的。這里極易混淆,請

讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。

圖4.2statistics子對話框

4.單擊Classify...按鈕,彈出classification子對話框,選中Display選項欄中的

Summarytable復(fù)選框,即要求輸出錯判矩陣,以便實現(xiàn)題中對原樣本進(jìn)行回判的

要求。如圖4.3。

圖4.3classification對話框

5.返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過程。

1)根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):

Bayes判別函數(shù)的系數(shù)見表4.1。表中每一列表示樣本判入相應(yīng)類的Bayes判別函數(shù)系數(shù)。由

此可建立判別函數(shù)如下:

Groupl:Y1=-81.843-11.689X1+12.297X2+16.761X3

Group2:Y2=-94.536-10.707X1+13.361X2+17.086X3

Group3:K3=-17.449-2.194X1+4.960X2+6.447X3

將各樣品的自變量值代入上述三個Bayes判別函數(shù),得到三個函數(shù)值。比較這三個函數(shù)值,

哪個函數(shù)值比較大就可以判斷該樣品判入哪一類。

ClassificationFunctionCoefficients

group

123

x1-11.689-10.707-2.194

x212.29713.3614.960

x316.76117.0866.447

(Constant)-81.843-94.536-17.449

Fisher'slineardiscriminantfunctions

表4.1Bayes判別函數(shù)系數(shù)

根據(jù)此判別函數(shù)對樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷飲料中,有3種被

正確地判定,有1種被錯誤地判定為平銷飲料?,正確率為75%。在3種平銷飲料中,有2種被

正確判定,有1種被錯誤地判定為暢銷飲料,正確率為66.7%。3種滯銷飲料均正確判定。整

體的正確率為80.0%。

ClassificationResults3

PredictedGroupMembership

group123Total

OriginalCount13104

________21203

30033

%175.025.0.0100.0

233.366.7.0100.0

3.0.0100.0100.0

a.80.0%oforiginalgroupedcasescorrectlyclassified.

表4.2錯判矩陣

2)該新飲料的XI=3.0,X2=8,X3=5,將這3個自變量代入上一小題得到的Bayes

判別函數(shù),丫2的值最大,該飲料預(yù)計平銷。也可通過在原樣本中增加這一新樣本,重

復(fù)上述的判別過程,并在classification子對話框中同時要求輸出casewiseresults,運(yùn)行判

別過程,得到相同的結(jié)果。

4.9銀行的貸款部門需要判別每個客戶的信用好壞(是否未履行還貸責(zé)任),以決定是否給

予貸款??梢愿鶕?jù)貸款申請人的年齡(XQ、受教育程度(X?)、現(xiàn)在所從事工作的年數(shù)

(x3)、未變更住址的年數(shù)(X4)、收入(X5)、負(fù)債收入比例(X6)、信用卡債務(wù)(X,)、

其它債務(wù)(XQ等來判斷其信用情況。下表是從某銀行的客戶資料中抽取的部分?jǐn)?shù)據(jù),⑴

根據(jù)樣本資料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數(shù)和判別規(guī)則。

⑵某客戶的如上情況資料為(53,1,9,18,50,11.20,2.02,3.58),對其進(jìn)行信用好壞

的判別。

目前信用客戶

X,X,X,XsX,4

好壞序號

123172316.600.341.71

2341173598.001.812.91

已履行還

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論