多元統計分析課后練習答案_第1頁
多元統計分析課后練習答案_第2頁
多元統計分析課后練習答案_第3頁
多元統計分析課后練習答案_第4頁
多元統計分析課后練習答案_第5頁
已閱讀5頁,還剩34頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第1章多元正態分布數據的標準化是將數據按比例縮放,使之落入一個小的特定區間。在某些比較和評價的指標處理中經常會用到,去除數據的單位限制,將其轉化為無量綱的純數值,便于不同單位或量級的指標能夠進行比較和加權。其中最典型的就是0-1標準化和Z標準化。2、歐氏距離與馬氏距離的優缺點是什么?優點:它不受量綱的影響,兩點之間的馬氏距離與原始數據的測量單位無關。由標22122準化數據和中心化數據計算出的二點之間的馬氏距離相同。馬氏距離還可以排除變量之間的相關性的干擾。缺點:夸大了變化微小的變量的作用。受協方差矩陣不穩定的影響,馬氏距離并不總是能順利計算出3、當變量X1和X2方向上的變差相等,且與互相獨立時,采用歐氏距離與統計距離是否一致?統計距離區別于歐式距離,此距離要依賴樣本的方差和協方差,能夠體現各變量在變差大小上的不同,以及優勢存在的相關性,還要求距離與各變量所用的單位無關。如果各變量之間相互獨立,即觀測變量的協方差矩陣是對角矩陣,則馬氏距離就退化為用各個觀測指標的標準差的倒數作為權數的加權歐氏距離。4、如果正態隨機向量X(X,X?,LXo)的協方差陣?為對角陣,證明X的分量是相互獨立的隨機變量解:因為X(X?,X?,LXo)的密度函數為又由于ZO則其分量是相互獨立(b)如果y寫出yy關于y?與yz的表達式,并寫出yy的分布。(c)如果yY1且y~N(,),寫出yy關于y?與y?的表達式,并寫出yyy2的分布。解:(a)由于y?~N(0,1),所以y?~(21)。(b)由于y?~N(0,1),yz~N(3,4);所以y23~N(0,1);2第2章均值向量和協方差陣的檢驗1、略2、試談Wilks統計量在多元方差分析中的重要意義3、題目此略多元均值檢驗,從題意知道,容量為9的樣本,總體協方差未知假設H0:檢驗統計統計量T2實際上是樣本均值與已知總體均值之間的馬氏距離再乘以n*(n-1),這個值相等的可能性越小,備擇假設成立時,T2有變大的趨勢,所以拒絕域選擇T2值較大的右側部分,也可以轉變為F統計量零假設的拒絕區域{(n-p)/[(n-1)*p]}*T2>F?np()1/10*T2>F5,4(5)樣本均值(4208.7835.121965.8912.2127.79)'(樣本均值-μ0)'=(-2003.232.25-1006.112.7112.01)協方差矩陣(降維因子分析抽取)(元)三產比重(%)人均消費(元)文盲半文盲人口增長(%)文盲半文盲6.625-213.634-3130.03825.410協方差的逆矩陣第3章聚類分析批這此之間相似程度較大的樣品又聚合為另外一類,直到把所有的樣品聚合完畢,形成一個有小系統聚類是將每個樣品分成若干類的方法,其基本思想是先將各個樣品各看成一類,然后規定類與類之間的距離,選擇距離最小的一對合并成新的一類,計算新類與其他類之間的距離,再將距離最近的兩類合并,這樣每次減少一類,直至所有的樣品合為一類是必要的)5、計算新類與當前各類的距離,若類的個數等于1,轉到6;否則回4;6、畫聚類圖;樣第4章判別分析(2)各組變量的協方差矩陣相等。判別分析最簡單和最常用的的形式是采用現行判別函數,他們是判別變量的簡單線性組合,在各組協方差矩陣相等的假設條件下,可以使用很簡單的公式來計算判別函數和進行顯著性檢驗。品的投影值盡量靠近)。k要做到這一點,只要投影后的k個一元總體均值有顯著差異,即可利用方差分析的方法使組間平方和盡可能的大。則選取投影方向a使△(a)達極大因子;接著挑選第三個因子,這因子是在第一、第二因子的基礎上具有最顯著判別能力的因子。由于因子之間的相互關系,當引進了新的因子之后,會使原來已引入的因子失去顯著判別能力。因此,在引入第三個因子之后就要先檢驗已經引入的因子是否還具有顯著判別能力,如果有就要剔除這個不顯著的因子;接著再繼續引入,直到再沒有顯著能力的因子可剔除為止,最后利用已選中的變量建立判別函數。測精確的統計顯著性。(6)判別函數的解釋:需要多少個函數。評價單個函數主要從判別權重、判別載荷、偏F值幾個方面;評價兩個以上的判別函數,分為評價判別的函數和評價合并的函數。(7)判別結果的驗證:分開樣本或交叉驗證,刻畫組間的差異。6、略第5章主成分分析1、主成分的基本思想是什么?在對某一事物進行實證研究時,為更全面、準確地反映事物的特征及其發展規律,往往考慮與其有關的多個指標,在多元統計中也稱為變量。一方避免遺漏重要信息而考慮盡可能多的指標看,另一方面考慮指標的增多,又難以避免信息重疊。希望涉及的變量少,而得到的信息量有較多。主成分的基本思想是研究如何通過原來的少數幾個線性組合來解釋原來變量絕大多數信息的一種多元統計方法。研究某一問題涉及的眾多變量之間有一定的相關性,必然存在著支配作用的公共因素。通過對原始變量相關矩陣或協方差矩陣內部結構關系的研究,利用原始變量的線性組合形成幾個無關的綜合指標(主成分)來代替原來的指標。通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主組就是要求Cov(F1,F2)=0則稱F2為第二主成分,依此類推可以構造出第三、第四第P2、主成分在應用中的主要作用是什么?作用:利用原始變量的線性組合形成幾個綜合指標(主成分),在保留原始變量主要信息的前提下起到降維與簡化問題的作用,使得在研究復雜問題時更容易抓住主要矛盾。通過主成分分析,可以從事物之間錯綜復雜的關系中找出一些主要成分,從而能有效利用大量數據進行定量分析,解釋變量之間的內在關系,得到對事物特征及其發展規律的一些深層次的啟發,把研究工作引向深入。主成分分析能降低所研究的數據空間的維數,有時可通過因子載荷ajj的結論,弄清X變量間的某些關系,多維數據的一種圖形表示方法,用主成分分析篩選變量,可以用較少的計算量來選擇,獲得選擇最佳變量子集合的效果。(1)由協方差陣出發設隨即向量X=(X1,X2,X3,………Xp)'的協方差矩陣為2,?1≥?2>………≥?p為2的特征值,γ1,γ2,……p為矩陣A各特征值對應的標準正交特征向量,則第i個主此時VAR(Yi)=?i,COV(Yi,Yj)=0,i≠j我們把X1,X2,X3,………Xp的協方差矩陣∑的非零特征根?1≥?2>……≥?p>0向量對應的(2)由相關陣出發Z=(2^1/2)^-1*(X-μ)cov(Z)=RYi=yi'*Z=yi*(2^1/2)^-1*(X-μ)第6章因子分析量起解釋作用的公共因子和特殊因子,以及公共因子和特殊因子的線性組合。主成分分析則簡單一些,它只是從空間生成的角度尋找能解釋諸多變量絕大部分變異的幾組彼此不相關的新變量分表示成各變量的線性組合(3)主成分分析中不需要有一些專門假設,因子分析則需要一些假設,因子分析的假設包括:各個因子之間不相關,特殊因子之間不相關,公共因子和特殊因子之間不相關。(4)在因子分析中,提取主因子的方法不僅有主成分法,還有極大似然法等,基于這些不同算法得到的結果一般也不同。而主成分分析只能用主成分法提取。(5)主成分分析當給定的協方差矩陣或者相關矩陣的特征根唯一時,主成分一般是固定;而因子分析中,因子不是固定的,可以旋轉得到不同的因子。(6)在因子分析中,因子個數需要分析者指定,結果隨指定的因子數不同而不同。在主成分分析中,主成分的數量是一定的,一般有幾個變量就有幾個主成分。(7)與主成分分析相比,由于因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢。而如果想把現有的變量變成少數幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進行后續的分析,則可以使用主成分分析。重要性的指標。g?越大,表明公共因子F對x的貢獻越大,或者說對X的影響作用就越第7章對應分析對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。它最大特點是能把眾多的樣品和眾多的變量同時作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去了因子選擇和因子軸旋轉等復雜的數學運算及中間過程,可以從因子載荷圖上對樣品進行直觀的分類,而且能夠指示分類的主要參數(主因子)以及分類的依據,是一種直觀、簡單、方便的多元統計方法。?特點:對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。它最大特點是能把眾多的樣品和眾多的變量同時作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去了因子選擇和因子軸旋轉等復雜的數學運算及中間過程,可以從因子載荷圖上對樣品進行直觀的分類,而且能夠指示分類的主要參數(主因子)以及分類的依據,是一種直觀、簡單、方便的多元統計方法。2、試述對應分析中總慣量的意義。?,同時與×統計量總慣量不僅反映了行剖面集定義的各點與其重心加權距離的總和2差一個常數,而x2統計量反映了列聯表橫聯與縱聯的相關關系,因此總慣量也反映了兩個屬性變量各狀態之間的相關關系。對應分析就是在對總慣量信息損失最小的前提下,簡化數據結構以反映兩屬性變量之間的相關關系。3、略第8章典型相關分析1、試述典型相關分析的統計思想及該方法在研究實際問題中的作用。答:典型相關分析是研究兩組變量之間相關關系的一種多元統計方法。用于揭示兩組變量之間的內在聯系。典型相關分析的目的是識別并量化兩組變量之間的聯系。將兩組變量相關關系的分析轉化為一組變量的線性組合與另一組變量線性組合之間的相關關(1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關系數。Ui?a1X1?a2X2??…………?aPXP=Vi?b1Y1?b2Y2??…………?bqYq=b‘Y(2)選取和最初挑選的這對線性組合不相關的線性組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論