多元統計期末復習題_第1頁
多元統計期末復習題_第2頁
多元統計期末復習題_第3頁
多元統計期末復習題_第4頁
多元統計期末復習題_第5頁
已閱讀5頁,還剩15頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多元數據分析練習題第二章多元正態的參數估計一. 判斷題(1 )若X (X-Xz,Xp)T Np(J, 口,3是對角矩陣,則 X1,X2- ,X p相互獨立。 ()(2) 多元正態分布的任何邊緣分布為正態分布,反之也成立。()(3)對任意的隨機向量 X =(X1,X2 ,Xp)T來說,其協方差矩陣 二是對稱矩陣,并且 總是半正定的。()(4)對標準化的隨機向量來說,它的協方差矩陣與原來變量的相關系數陣相同。()T本均值和樣本協差陣,則(5) 若 X =(Xi,X2,,X p) N pGM), X ,S 分別為樣1 X , - S分別為二,' 的無偏估計。() n二. 計算題32 ,試求相

2、關系916-41. 假設隨機向量X =(X_ X 2, X3)T的協方差矩陣為龍=-443 -2數矩陣R。R2.假設隨X二(x1, x2)T的協方差矩陣為20y1X2,試求y =(y1,y2)T的協方差矩陣。60-3!-3 27-3.假設 X0.5-10.5N3(43A=_0.5 0 _0,其 中"-(1,2,1)丁2 1Y= 121-11-1 ,試求y = Ax的分布。44證明題41. 設X,X(2),,X(n)是來自Np(4)的隨機樣本,X為樣本均值。試證明:1E(X ) -,D(X )n12. 設X(1),X(2),X(n)是來自Np(i,)的隨機樣本, S為樣本協差陣。試證明

3、:n _11E( S)二n _13 證明:若p維正態隨機向量 X -(X-Xz,X p廠的協差陣為對角矩陣,則 X的 各分量是相互獨立的隨機變量。第四章判別分析一. 判斷題1從某種意義上講,距離判別是Bayes判別的一種特例。()2距離判別的思想是分別計算樣本到各個總體的歐幾里得距離,根據距離的大小判別樣本屬于哪個總體。()3量綱的變化對歐幾里得距離的計算結果有影響,而馬氏距離則克服了這種影響。歐氏距離是馬氏距離的一種特例。()4貝葉斯判別法是一種考慮了總體出現的先驗概率和誤判損失的判別方法。()5在貝葉斯判別法中,R二侃,R2,,Rk )是一個劃分,h (x)是將樣品誤判給總體 Gj的加權平

4、均損失,則Rj =xho)下訃(幼i十飛。()6費希爾判別法是借助方差分析的思想構造線性判別函數, 個個體內部的離差最小。()二. 計算題1設有兩個正態總體 G-G2,已知:使得總體之間區別最大,而使每藥._2l'32 ''Z4_1、,鼻(2) = |,乙=,龍2 =34<_1 I (1)(1 )建立距離判別法的判別準則;(2)判斷:樣品:=f"1,應歸屬于哪一類?x G2D(x,G(答案:D(x,G2)-22 x2- 51 ),)-28 x2- 52 )1 2 2=(4x<!3x2 - 4x! x2 4x<!8x1x2x1x2376924:

5、G157:G24748(1) 求兩樣本的樣本均值X,x(2)及協方差矩陣S1;S2 ;X(1)=(3,6)T,X(2)=(5,8)T Si3 ;S2z2 1、II12丿(2)假定兩總體協方差矩陣相等,記為,用S1;S2聯合估計匕;<3 6丿1I =211O 11,Z2-1=2 丿2 i _11(3)建立距離判別法則;W (Xt, x2) - -2(X!3x2 - 25), W 以,x2) : 0, x 三 Gt ;W 區,x2) 0, x 三 G(4)假設有一新樣品x0 =(x1,x2)T =(2,7)丁,進行距離判別。x三G23.已知兩總體的概率密度分別為仏(x)和f2(x),且總體的

6、先驗分布為 Pt = 0.2, p2 = 0.8,誤判損失為 c(21) =50,c(1 2) =100。(1) 建立Bayes判別準則;(2) 假設有一新樣品x0滿足匕&0) =6.3和f2(x0) =0.5,判定x0的歸屬問題。4. 假設兩總體G1,G2的概率密度分別為f,x) =1 x , x <1和f?(x) =1 x 0.5 , 0.5 蘭 x W1.5。(1) 做出f,(x)和f2(x)的圖像。若假定先驗概率p p2,c(21)=c(12),求Bayes判 別區間的臨界點;(0.25)(2) 若 p1 =0.2, p2 =0.8,c(21)=c(12),求 Bayes

7、判別區間的臨界點;(-0.33)5. 假定有 G1 ,G 2 ,G 3 三個組,已知 P1 = 0.05 , P2 = 0.65 , P3 = 0.30 , fx。)= 0.10 和 f 2 (x0 ) =0.63 , f3(xo) =2.4。(1 )若不計誤判損失,判定x0屬于哪個組;(G3)(后驗概率分別為 0.004,0.361,0.635 )(2) 假定誤判代價矩陣為r誤判為G1G2G 3真實組 G,c(1|l) =0c(2|1) =10c(3l) =200G2c(12)=20c(2|2)=0c(32) =100G3c(13)=60c(2|3)=50c(3 3) = 0判定x0屬于哪個

8、組。(誤判的平均損失為51.39,36.05,41.95 G2)6. 已知兩總體的概率密度分別為f'x)和f2(x),且總體的先驗分布為卩勺=0.6, p2 = 0.4,誤判損失為 c(21) =4, c(12) =12。(1)建立Bayes判別準則;(2) 假設有一新樣品x0滿足匚(x0) =0.36和f2 (x0) = 0.24,判定x0的歸屬冋題。(G 2)7. 假設先驗概率,誤判代價及概率密度值已列于下表。試用貝葉斯判別法將樣品分到組G,G2 ,G3中的一個。若不考慮誤判代價,則判別結果又將如何?判別為G1G2真實組G,G2G 3先驗概率概率密度c(11) =0c(1|2) =

9、400c(1 3) =100P1 二 0.55f1(Xo) =0.46c(21) =20c(2 2) =0c(2 3) =50p2 二 0.15f2(Xo) =1.5c(31) =80c(32) =200c(3 3) =0P3 = 0.3f3(xo) =0 .708. 金融分析員需要有兩項重要指標來衡量,設總體 G1為金融分析員滿足要求”總體G2 為金融分析員不滿足要求”(兩個總體均服從正態分布,協差陣相等),今測得兩個總體的 若干數據,并由這些數據得到24-4 2_-1 4(1)假設對某一金融分析員進行測量得到兩個指標為x =(5,4)T,判別這一分析員是否能滿足這項工作。(滿足)(2 )當

10、兩組先驗概率分別為 q1 = 0.269, q2 =0.731,損失相同。問該金融分析員滿足要求 嗎?為什么?(不滿足)第五章聚類分析一. 判斷題1. 快速(動態)聚類分析中,分類的個數是確定的,不可改變。2. K均值聚類分析中,樣品一旦劃入某一類就不可改變。()3判別分析,聚類分析和主成分分析都不要求數據來自正態總體。4系統聚類可以對不同的類數產生一系列的聚類結果。()5. K均值聚類和系統聚類一樣,可以用不同的方法定義點點間的距離。()6. K均值聚類和系統聚類一樣,都是以距離的遠近親疏為標準進行聚類的。()二. 計算題1. 下面是5個樣品兩兩間的距離矩陣014 0(0)D = 6901

11、7 10 06 3 5 8 0試用最長距離法作系統聚類,并畫出譜系聚類圖。2. 假設有6個樣本,每個樣本只測量一個指標,數據如表。樣本點間使用絕對值距離,類間使用最長距離,利用系統聚類法對這6個樣本進行分類。要求:(1)寫出距離矩陣及類的合并過程;(2)畫出聚類的譜系圖;(3)寫出樣本分成兩類時的結果。樣本編號123456指標11243-4-23. 假定我們對A, B,C三個樣品分別測量兩個變量 X1和X2得到結果如表: 用快速聚類法將以上樣品聚成兩類。樣品變量X1X2A53B-11C124. 檢驗某產品的重量,抽了 6個樣品,每個樣品只測了一個指標,分別為1, 2,3,6,9,11,試用最短

12、距離法,重心法進行聚類分析。_01 05. 考慮下列4個樣品的距離矩陣:11 25 3對這4個樣品進行聚類,并畫出譜系圖。,用最短距離,最長距離法和類平均法0406.有8個樣本,每個樣本兩個指標,數據如表。樣本點間使用歐氏距離,類間使用最短距 離法,利用系統聚類法對這 8個樣本進行分類。樣本編號12345678指標12244-4-2-3-1指標25343322-37檢驗某產品的重量,抽了 5個樣品,每個樣品只測了一個指標,分別為1, 2, 6, 11,試用快速聚類法將樣品分為兩類。三. 簡答題1. 判別分析與聚類分析有何區別?判別分析是對于n個給定的樣本,已知每個樣本屬于k個類別中的某一類,利

13、用這些數據,找到一種判別方法,使得這種判別方法具有某種最優性質,能把屬于不同種類的樣本 點盡可能的區別開來,并對測得同樣指標數據的新樣本,能夠判別這個樣本歸屬于哪一類。聚類分析是在樣品和類之間定義一種距離,按照距離的大小對樣品進行聚類,距離相近 的樣品先聚成類,距離相遠的后聚成類,過程一直進行下去,每個樣品總能聚到合適的類 中。聚類分析沒有判別函數,對新的樣品無法判別它應該歸屬哪一類,必須重新進行聚類 過程,才能判別它屬于哪類。系統聚類分析能夠得到樣品從最小的分類(每個樣品自成一 類)到最大的分類的情況,而判別分析沒有這種功能,但判別分析的距離判別法與聚類分 析非常相似,也是根據距離的遠近判別

14、樣本的歸屬問題。2. K均值法與系統聚類法的異同(1) K均值法事先必須確定分類的個數,分類的個數確定,而系統聚類分析系統聚類分析能夠得到樣品從最小的分類(每個樣品自成一類) 到最大的分類的情況, 可以根據需要將樣品分為幾類。(2) K均值法可以隨意將樣品分為 K類,根據樣品到類中心的距離遠近重新進行分類, 而系統聚類中樣品一旦劃入某一類就不能更改。(3) K均值法樣品與不同類間的距離采用點到類中心的平方歐氏距離,而系統聚類中點 間距離有很多種定義方法。3. 簡述系統聚類法的思想 。4. 簡述快速聚類法的思想。第六章主成分分析一. 判斷題1主成分分析數學模型中的正交變換,在幾何上就是做一個坐標

15、旋轉。()2 .假設X !, X 2,., Xp為某實際問題所涉及的 p個變量,Y1, Y2 ,., Yp是其p個主成分, 判斷下列說法是否正確:(1)由原始變量 X,X2,X p的協方差矩陣和相關矩陣出發,求得的主成分是一致的。()(2) 對變量做主成分分析之前,必須對原始數據進行標準化。()(3 )由標準化數據的協方差矩陣出發求得的主成分與由原始數據的相關系數矩陣出發求得 的主成分一致。()(4)Cov (YYj) =0,i = j。()(5) 由于Y, ,Y2,Yp包含原始變量的信息量遞減,因而實際應用中選取前幾個主成分代替 原來的原始變量。()(6)當各個變量取值范圍相差不大或者是度量

16、單位相同的指標時,一般選擇直接從協方差 矩陣求解。()pp(7)v Var 億)=» Var (X :)。()i _1i _1(8)假設X1, X 2,X p的協方差矩陣為二, 1, 2 m為三的非零特征根,i ,i =1,2,., m 為對應的單位化的特征向量,則第i個主成分為Y. = X , i = 1,2,., m。()(9) 丫匚是X1,X2,., X p的線性組合。()(10)D (Yi )i ,i1,2,., p。()(11) 主成分的協方差矩陣是對角陣。()(12) 方差貢獻率表明了主成分綜合原始變量的能力。()3. 主成分分析中的信息,是用變量期望的大小來表示的。()

17、二. 計算題,求X的主成分Y1,Y2,并計算第1. 假設總體x -(X1, x 2)t的協方差矩陣為1 =主成分Y1的累計貢獻率。1廠2.假設總體X = (X 1 , X 2, X 3 )T的相關矩陣為R= P 1 P ,(_1<P<1)求 X 的標準|_P P 1化變量的主成分Yt,丫2 , 丫3 ,并計算各主成分的貢獻率和累計貢獻率。'1 = 1( P _' 1),-2 = ' 3 = 1 1 -111-2=(,0),t3 =(,)2 - 2.6.6 63.假設總體X =(X1,X2,X 3)T的協方差矩陣為 Z =_20廠2-2105,求X的主成分pp

18、ppY1,丫2, 丫3,并計算各主成分的貢獻率和累計貢獻率,確定應取幾個主成分。4. 設X =(X!,X2 ,Xp)T的協方差矩陣為-11,其中1 一二22 -一二pp,試求X的主成分及主成分具有cpp的特征值。(yi二Xi ,方差為匚ii )三. 簡答題1試述主成分分析的基本思想及求解步驟。2簡述主成分分析中累積貢獻率的具體意義。第七章因子分析一. 判斷題1因子載荷矩陣經過旋轉后,每個公因子對原始變量的貢獻度gi2不變。()2因子分析模型中公共因子Fj是互不相關、不可測的變量,并且Var (FJ =1。()3因子分析一般從變量的相關系數陣出發求因子模型。()4因子載荷矩陣經過旋轉后,變量Xj

19、的共同度h2不變。()5因子分析模型中特殊因子與公共因子是不相關的。()6因子分析與主成分分析都是一種降維,簡化數據的方法,都是通過把原變量轉化為新變量的線性組合達到降維的目的。()7主成分分析中,主成分是不唯一的,但在因子分析中,因子模型是唯一的。()二. 計算題彳0.630.45、1設標準化變量 X!,X2,X3的協差陣(即相關陣)為 R = d631035衛.450.351R的特征值和相應的單位正交化的特征向量分別為:、=1.96,= 0 .68 ,工-3 =0.36J = (0.63,0.59,0.51 ),丨2 =(-0 .22 ,0.49 ,0.84),丨3 = (0.750.64

20、0.18),要求:1)計算因子載荷矩陣A,并建立因子模型;2 22)計算變量X3的共同度h3和公因子F2的方差貢獻g2 ,并說明其各自的統計意義。2. 為研究某一片樹葉的葉片形態,選取50片葉測量其長度 x1(mm)和寬度x2(mm),按樣本數_"90 48 I據求得其平均值和協差陣為乂勺=134, x2 = 92,S,求相關系數矩陣R,并由R|4845出發進行因子分析。三. 簡答題1. 簡述因子模型X =AY ;中載荷矩陣A的統計意義。2 .因子分析與主成分分析的區別與聯系(1)因子分析從變量的相關性出發,根據相關性的大小將變量進行分組,同組變量的相關性較強,不同組變量的相關性較弱

21、,每組代表一個結構,這個結構用一個公因子表示,將變量表示成公因子的線性組合和特殊因子的和。主成分分析是從空間生成的角度尋找能解釋諸多變量變異絕大部分的幾組彼此不 相關的新變量。(2)因子分析是把變量表示成公因子的線性組合和特殊因子的和,主成分分析是把主成分表示成各變量的線性組合。(3)抽取因子的方法不僅有主成分法,還有主軸因子法,極大似然估計法等,主成分分析只有主成分法抽取主成分。(4)主成分分析中當給定的協差陣或相關系數陣的特征值唯一時,主成分一般是固定的,而因子分析中的因子不是固定的,可以旋轉得到不同的因子。四下表是以學生六門考試成績為變量,從相關系數陣出發, 以主成分法抽取因子, 進行因

22、子分析的部分結果,根據表格回答下列問題:表 3 Rotated Component Matrix(a)Component12math-.806.353phys-.674.531chem-.675.513literat.893.306history.825.435english.836.425表 2 Component Matrix(a)5.Component12math-.387.790phys-.172.841chem-.184.827literat.879-.343history.911-.201english.913-.216表 1 Total Variance ExplainedCom

23、ponentInitial EigenvaluesTotal% of VarianceCumulative %13.73562.25462.25421.13318.88781.1423.4577.61988.7614.3235.37694.1375.1993.32097.4576.1532.543100.000(1) 寫出變量X, ,X2的相關系數陣R的特征根 及X 1 , X 2/ , X 6的方差和;(2) 假設用Yi表示主成分,寫出前二個主成分的表達式及 Y,的貢獻率和前兩個主成分的累計貢獻率并說明累計貢獻率的統計意義;(3) 寫出旋轉后的因子載荷矩陣 A及因子模型;(4) 求變量mat

24、h的共同度hi2及因子F2的方差貢獻g?2,并解釋,g?2的統計意義;(5) 對因子Fi,F2進行合理的命名和解釋。第八章相應分析一. 判斷題1相應分析中,行慣量與列慣量相同。()2對變量進行相應分析時,應首先檢驗變量之間的獨立性,只有當變量不獨立時,進行相應分析才有意義。()3. 相應分析實際是對兩組高維空間的點的二維投影進行分析,并且相應分析主要是建立在圖形分析的基礎上,因此,相應分析的結果帶有一定的主觀性。()二. 計算題1.假定有兩個因素 A, B,每個因素各有兩個水平,隨機考察100個樣品,得到一個二維的列聯表如下,求:(1 )頻率矩陣F ;(2) 因素A的第一個水平的分布輪廓;(3

25、) 因素A兩個水平之間的 2距離;2(4) 檢驗因素 A,B 是否獨立。(口 =0.05,/0Q5 (1)=3.841)第九章典型相關分一.判斷題1典型相關分析是研究多組 多元統計方法。()因素A因素BB1B2A15020A21020析變量之間相關關系的一種2典型相關分析是識別并量化兩組變量之間的關系,將兩組變量的相關關系的研究轉化為組變量的線性組合與另一組變量的線性組合之間的相關關系的研究。()3若U = a X , V = b Y是兩組變量X,丫的第一對典型相關變量,則U ,V是X ,Y的所有線性組合對中相關系數最大的一對。()4進行典型相關分析時,若變量的量綱不同時,需要對變量進行標準化

26、或從相關陣出發求典型相關變量;而若變量的單位相同時,則不需要對數據進行標準化,直接分析即可。()5若U k, Vk , k =1,2,r是變量X ,Y的典型相關變量,則D(U Q =1, D(VQ =1, k =1,2,r,并且 Cov (U i ,U j) =Cov (V:, V j) = 0, i = j ()6. 若U k , Vk , k =1,2,r是變量X ,Y的典型相關變量, 二乙22分別是變量X ,Y的方差 陣,乙2是變量X ,Y的協方差陣, =1,2,,r是矩陣 二乙222七21的特征根,則(1) Cov (U i,Vj) =,i = 0,i = j,i =1,2,r.Cov

27、 (U i ,V j) = 0,i = j 或 j . r。其中 r 為矩 陣和 az1/l22 Z21 的秩。()2 2 2 2(2 )若! - '2 _/.r,則第一典型相關系數為1。()(3)若 J 一 J -幕,a(1),b(1)分別為矩陣'dj七21,三22七2111七12相FF應于'12的特征向量,則a(1) X(1),b(1) X(2)即為第一對典型相關變量。()7. 典型相關分析中,分別求出兩組變量的第一主成分,兩個第一主成分即構成第一對典型相關變量。()8利用樣本對兩組變量 x,X(2)進行典型相關分析時,即使X,X(2)互不相關,也有可能得到的典型相關變量的協差陣不為零,因而利用樣本數據進行典型相關分析時要對原 始變量的協差陣是否為零進行檢驗。()9典型載荷分析是了解每組變量提取的典型變量解釋的該組樣本總方差的比例,從而定量的測度典型變量所包含的原始信息量的大??;典型冗余分析是指原始變量與典型變量之間的相關性分析。()10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論