




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選優質文檔-傾情為你奉上多元數據分析練習題第二章多元正態的參數估計一. 判斷題(1)若是對角矩陣,則相互獨立。( )(2)多元正態分布的任何邊緣分布為正態分布,反之也成立。( )(3)對任意的隨機向量來說,其協方差矩陣是對稱矩陣,并且總是半正定的。( )(4)對標準化的隨機向量來說,它的協方差矩陣與原來變量的相關系數陣相同。( )(5)若分別為樣本均值和樣本協差陣,則分別為的無偏估計。( )二.計算題1. 假設隨機向量的協方差矩陣為,試求相關系數矩陣。2. 假設隨機向量的協方差矩陣為,令,試求的協方差矩陣。3.假設,其中,試求的分布。三.證明題1.設是來自的隨機樣本,為樣本均值。試證明: ,
2、。2.設是來自的隨機樣本,為樣本協差陣。試證明: 。3證明:若維正態隨機向量的協差陣為對角矩陣,則的各分量是相互獨立的隨機變量。第四章判別分析一.判斷題1.從某種意義上講,距離判別是Bayes判別的一種特例。( )2.距離判別的思想是分別計算樣本到各個總體的歐幾里得距離,根據距離的大小判別樣本屬于哪個總體。( )3.量綱的變化對歐幾里得距離的計算結果有影響,而馬氏距離則克服了這種影響。歐氏距離是馬氏距離的一種特例。( )4.貝葉斯判別法是一種考慮了總體出現的先驗概率和誤判損失的判別方法。( )5.在貝葉斯判別法中,是一個劃分,是將樣品誤判給總體的加權平均損失,則。 ( )6.費希爾判別法是借助
3、方差分析的思想構造線性判別函數,使得總體之間區別最大,而使每個個體內部的離差最小。( )二.計算題1.設有兩個正態總體,已知: (1)建立距離判別法的判別準則;(2)判斷:樣品:,應歸屬于哪一類?(答案:)2.設G1,G2為兩個二元總體,從中分別抽取容量為3的樣本如下:x1 x2x1 x23 72 4 : G14 76 95 7 :G24 8(1)求兩樣本的樣本均值及協方差矩陣;(2)假定兩總體協方差矩陣相等,記為,用聯合估計;(3)建立距離判別法則;(4)假設有一新樣品,進行距離判別。3.已知兩總體的概率密度分別為和,且總體的先驗分布為,誤判損失為。(1)建立Bayes判別準則;(2)假設有
4、一新樣品滿足和,判定的歸屬問題。4. 假設兩總體G1,G2的概率密度分別為和。(1)做出和的圖像。若假定先驗概率,求Bayes判別區間的臨界點;(0.25)(2)若,求Bayes判別區間的臨界點;(-0.33)5.假定有三個組,已知,和,。(1)若不計誤判損失,判定屬于哪個組;()(后驗概率分別為0.004,0.361,0.635)(2)假定誤判代價矩陣為誤判為真實組 判定屬于哪個組。(誤判的平均損失為51.39,36.05,41.95 )6. 已知兩總體的概率密度分別為和,且總體的先驗分布為,誤判損失為。(1)建立Bayes判別準則;(2)假設有一新樣品滿足和,判定的歸屬問題。()7.假設先
5、驗概率,誤判代價及概率密度值已列于下表。試用貝葉斯判別法將樣品分到組中的一個。若不考慮誤判代價,則判別結果又將如何?判別為真實組 先驗概率概率密度8. 金融分析員需要有兩項重要指標來衡量,設總體G1為“金融分析員滿足要求”;總體G2為“金融分析員不滿足要求”(兩個總體均服從正態分布,協差陣相等),今測得兩個總體的若干數據,并由這些數據得到 (1)假設對某一金融分析員進行測量得到兩個指標為,判別這一分析員是否能滿足這項工作。(滿足)(2)當兩組先驗概率分別為,損失相同。問該金融分析員滿足要求嗎?為什么?(不滿足)第五章聚類分析一.判斷題1.快速(動態)聚類分析中,分類的個數是確定的,不可改變。(
6、 )2.K均值聚類分析中,樣品一旦劃入某一類就不可改變。( )3.判別分析,聚類分析和主成分分析都不要求數據來自正態總體。( )4.系統聚類可以對不同的類數產生一系列的聚類結果。( )5. K均值聚類和系統聚類一樣,可以用不同的方法定義點點間的距離。( )6. K均值聚類和系統聚類一樣,都是以距離的遠近親疏為標準進行聚類的。( )二. 計算題1. 下面是5個樣品兩兩間的距離矩陣 試用最長距離法作系統聚類,并畫出譜系聚類圖。2. 假設有6個樣本,每個樣本只測量一個指標,數據如表。樣本點間使用絕對值距離,類間使用最長距離,利用系統聚類法對這6個樣本進行分類。要求:(1)寫出距離矩陣及類的合并過程;
7、(2)畫出聚類的譜系圖;(3)寫出樣本分成兩類時的結果。樣本編號123456指標11243-4-23. 假定我們對三個樣品分別測量兩個變量和得到結果如表:用快速聚類法將以上樣品聚成兩類。樣品變量 X1X2A53B-11C124. 檢驗某產品的重量,抽了6個樣品,每個樣品只測了一個指標,分別為1,2,3,6,9,11,試用最短距離法,重心法進行聚類分析。5. 考慮下列4個樣品的距離矩陣:,用最短距離,最長距離法和類平均法對這4個樣品進行聚類,并畫出譜系圖。6. 有8個樣本,每個樣本兩個指標,數據如表。樣本點間使用歐氏距離,類間使用最短距離法,利用系統聚類法對這8個樣本進行分類。樣本編號12345
8、678指標12244-4-2-3-1指標25343322-37.檢驗某產品的重量,抽了5個樣品,每個樣品只測了一個指標,分別為1,2,6,11,試用快速聚類法將樣品分為兩類。三.簡答題1.判別分析與聚類分析有何區別?判別分析是對于n個給定的樣本,已知每個樣本屬于k個類別中的某一類,利用這些數據,找到一種判別方法,使得這種判別方法具有某種最優性質,能把屬于不同種類的樣本點盡可能的區別開來,并對測得同樣指標數據的新樣本,能夠判別這個樣本歸屬于哪一類。 聚類分析是在樣品和類之間定義一種距離,按照距離的大小對樣品進行聚類,距離相近的樣品先聚成類,距離相遠的后聚成類,過程一直進行下去,每個樣品總能聚到合
9、適的類中。聚類分析沒有判別函數,對新的樣品無法判別它應該歸屬哪一類,必須重新進行聚類過程,才能判別它屬于哪類。系統聚類分析能夠得到樣品從最小的分類(每個樣品自成一類)到最大的分類的情況,而判別分析沒有這種功能,但判別分析的距離判別法與聚類分析非常相似,也是根據距離的遠近判別樣本的歸屬問題。2.K均值法與系統聚類法的異同(1) K均值法事先必須確定分類的個數,分類的個數確定,而系統聚類分析系統聚類分析能夠得到樣品從最小的分類(每個樣品自成一類)到最大的分類的情況,可以根據需要將樣品分為幾類。(2) K均值法可以隨意將樣品分為K類,根據樣品到類中心的距離遠近重新進行分類,而系統聚類中樣品一旦劃入某
10、一類就不能更改。(3) K均值法樣品與不同類間的距離采用點到類中心的平方歐氏距離,而系統聚類中點間距離有很多種定義方法。3. 簡述系統聚類法的思想。4. 簡述快速聚類法的思想。第六章主成分分析一.判斷題1.主成分分析數學模型中的正交變換,在幾何上就是做一個坐標旋轉。( )2假設為某實際問題所涉及的個變量,是其個主成分,判斷下列說法是否正確:(1)由原始變量的協方差矩陣和相關矩陣出發,求得的主成分是一致的。 ( )(2)對變量做主成分分析之前,必須對原始數據進行標準化。( )(3)由標準化數據的協方差矩陣出發求得的主成分與由原始數據的相關系數矩陣出發求得的主成分一致。( )(4)。( )(5)由
11、于包含原始變量的信息量遞減,因而實際應用中選取前幾個主成分代替原來的原始變量。( )(6)當各個變量取值范圍相差不大或者是度量單位相同的指標時,一般選擇直接從協方差矩陣求解。( )(7)。 ( )(8)假設的協方差矩陣為,為的非零特征根, 為對應的單位化的特征向量,則第個主成分為。( )(9)是的線性組合。 ( )(10)。( )(11)主成分的協方差矩陣是對角陣。( )(12)方差貢獻率表明了主成分綜合原始變量的能力。( )3.主成分分析中的信息,是用變量期望的大小來表示的。( )二. 計算題1.假設總體的協方差矩陣為,求的主成分并計算第一主成分的累計貢獻率。2.假設總體的相關矩陣為,求的標
12、準化變量的主成分并計算各主成分的貢獻率和累計貢獻率。(,)3.假設總體的協方差矩陣為,求的主成分并計算各主成分的貢獻率和累計貢獻率,確定應取幾個主成分。4.設的協方差矩陣為,其中,試求的主成分及主成分具有的特征值。(,方差為)三.簡答題1.試述主成分分析的基本思想及求解步驟。2.簡述主成分分析中累積貢獻率的具體意義。第七章因子分析一.判斷題1.因子載荷矩陣經過旋轉后,每個公因子對原始變量的貢獻度不變。( )2.因子分析模型中公共因子是互不相關、不可測的變量,并且。( )3.因子分析一般從變量的相關系數陣出發求因子模型。( )4.因子載荷矩陣經過旋轉后,變量的共同度不變。( )5.因子分析模型中
13、特殊因子與公共因子是不相關的。( )6.因子分析與主成分分析都是一種降維,簡化數據的方法,都是通過把原變量轉化為新變量的線性組合達到降維的目的。( )7.主成分分析中,主成分是不唯一的,但在因子分析中,因子模型是唯一的。( )二. 計算題1.設標準化變量的協差陣(即相關陣)為 的特征值和相應的單位正交化的特征向量分別為:要求: 1) 計算因子載荷矩陣A,并建立因子模型;2)計算變量的共同度和公因子的方差貢獻,并說明其各自的統計意義。2. 為研究某一片樹葉的葉片形態,選取50片葉測量其長度x1(mm)和寬度x2(mm),按樣本數據求得其平均值和協差陣為,求相關系數矩陣,并由出發進行因子分析。三.
14、簡答題1.簡述因子模型中載荷矩陣的統計意義。2.因子分析與主成分分析的區別與聯系(1) 因子分析從變量的相關性出發,根據相關性的大小將變量進行分組,同組變量的相關性較強,不同組變量的相關性較弱,每組代表一個結構,這個結構用一個公因子表示,將變量表示成公因子的線性組合和特殊因子的和。主成分分析是從空間生成的角度尋找能解釋諸多變量變異絕大部分的幾組彼此不相關的新變量。(2) 因子分析是把變量表示成公因子的線性組合和特殊因子的和,主成分分析是把主成分表示成各變量的線性組合。(3) 抽取因子的方法不僅有主成分法,還有主軸因子法,極大似然估計法等,主成分分析只有主成分法抽取主成分。(4) 主成分分析中當
15、給定的協差陣或相關系數陣的特征值唯一時,主成分一般是固定的,而因子分析中的因子不是固定的,可以旋轉得到不同的因子。四下表是以學生六門考試成績為變量,從相關系數陣出發,以主成分法抽取因子,進行因子分析的部分結果,根據表格回答下列問題:表1 Total Variance ExplainedComponentInitial Eigenvalues Total% of VarianceCumulative %13.73562.25462.25421.13318.88781.1423.4577.61988.7614.3235.37694.1375.1993.32097.4576.1532.543100.
16、000表2 Component Matrix(a) 表3 Rotated Component Matrix(a)Component12math-.806.353phys-.674.531chem-.675.513literat.893.306history.825.435english.836.425Component12math-.387.790phys-.172.841chem-.184.827literat.879-.343history.911-.201english.913-.2165.(1) 寫出變量的相關系數陣的特征根 及 的方差和;(2) 假設用表示主成分,寫出前二個主成分的表
17、達式及的貢獻率和前兩個主成分的累計貢獻率并說明累計貢獻率的統計意義;(3) 寫出旋轉后的因子載荷矩陣及因子模型;(4) 求變量math的共同度及因子的方差貢獻,并解釋,的統計意義;(5) 對因子,進行合理的命名和解釋。第八章相應分析一.判斷題1.相應分析中,行慣量與列慣量相同。( )2.對變量進行相應分析時,應首先檢驗變量之間的獨立性,只有當變量不獨立時,進行相應分析才有意義。( )3.相應分析實際是對兩組高維空間的點的二維投影進行分析,并且相應分析主要是建立在圖形分析的基礎上,因此,相應分析的結果帶有一定的主觀性。( )二.計算題1.假定有兩個因素,每個因素各有兩個水平,隨機考察100個樣品
18、,得到一個二維的列聯表如下,求:(1)頻率矩陣;(2)因素的第一個水平的分布輪廓;(3)因素兩個水平之間的距離; (4)檢驗因素是否獨立。(,)因素因素50201020第九章典型相關分析一.判斷題1.典型相關分析是研究多組變量之間相關關系的一種多元統計方法。( )2.典型相關分析是識別并量化兩組變量之間的關系,將兩組變量的相關關系的研究轉化為一組變量的線性組合與另一組變量的線性組合之間的相關關系的研究。( )3.若是兩組變量的第一對典型相關變量,則是的所有線性組合對中相關系數最大的一對。( )4.進行典型相關分析時,若變量的量綱不同時,需要對變量進行標準化或從相關陣出發求典型相關變量;而若變量
19、的單位相同時,則不需要對數據進行標準化,直接分析即可。( )5.若是變量的典型相關變量,則,并且( )6. 若是變量的典型相關變量,分別是變量的方差陣,是變量的協方差陣,是矩陣的特征根,則(1)。其中為矩陣的秩。( )(2)若,則第一典型相關系數為。( )(3)若,分別為矩陣,相應于的特征向量,則即為第一對典型相關變量。( )7. 典型相關分析中,分別求出兩組變量的第一主成分,兩個第一主成分即構成第一對典型相關變量。( )8.利用樣本對兩組變量進行典型相關分析時,即使互不相關,也有可能得到的典型相關變量的協差陣不為零,因而利用樣本數據進行典型相關分析時要對原始變量的協差陣是否為零進行檢驗。(
20、)9.典型載荷分析是了解每組變量提取的典型變量解釋的該組樣本總方差的比例,從而定量的測度典型變量所包含的原始信息量的大小;典型冗余分析是指原始變量與典型變量之間的相關性分析。( )10.對變量進行相應分析時,應首先檢驗變量之間的獨立性,只有當變量不獨立時,進行相應分析才有意義。( )二以下是對一對二維變量的典型相關分析的結果,請根據結果回答下列問題。 表1 Canonical Correlations1.7882.054表2 Test that remaining correlations are zero Wilk's Chi-SQ DF Sig.1 .378 20.930 4.000 .0002 .99
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沿海漁村海洋經濟發展
- 老年護理評估課件內容
- 老年人的健康保健課件
- 老師用課件介紹視頻
- 生態保護現場調研委托合同書
- 建筑項目現場測量員雇傭合同
- 深海探測設備操作員勞動合同書
- 殘疾人勞動合同簽訂與就業援助政策實施策略
- 茶樹種植基地承包與茶葉市場推廣協議
- 出租車公司司機加班費及休息日調休合同范本
- 倉儲物流部事故應急預案
- 浙江省臺州市2024-2025學年高一下學期期末政治試卷
- 社區專職考試題庫及答案
- 法院法警考試試題及答案
- 應急工器具培訓課件
- 中國食用油市場調研及發展策略研究報告2025-2028版
- 2026屆江蘇省名校新高三6月適應性調研測試語文試題及答案
- 2024年財政部會計法律法規答題活動題目及答案一
- 經緯度數轉換工具
- 機要工作心得體會
- 焓差實驗室技術規格書
評論
0/150
提交評論