多元統計分析期末考試考點整理(共12頁)_第1頁
多元統計分析期末考試考點整理(共12頁)_第2頁
多元統計分析期末考試考點整理(共12頁)_第3頁
多元統計分析期末考試考點整理(共12頁)_第4頁
多元統計分析期末考試考點整理(共12頁)_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上 多元統計分析題型一 定義、名詞解釋題型二 計算(協方差陣、模糊矩陣)題型三 解答題一、定義二 名詞解釋1、 多元統計分析:多元統計分析是運用數理統計的方法來研究多變量(多指標)問題的理論和方法,是一元統計學的推廣2、 聚類分析:是根據“物以類聚”的道理,對樣品或指標進行分類的一種多元統計分析方法。將個體或對象分類,使得同一類中的對象之間的相似性比與其他類的對象的相似性更強。使類內對象的同質性最大化和類間對象的異質性最大化3、 隨機變量:是指的值無法預先確定僅以一定的可能性(概率)取值的量。它是由于隨機而獲得的非確定值,是概率中的一個基本概念。即每個分量都是隨機變量的

2、向量為隨機向量。類似地,所有元素都是隨機變量的矩陣稱為隨機矩陣。4、統計量:多元統計研究的是多指標問題,為了了解總體的特征,通過對總體抽樣得到代表總體的樣本,但因為信息是分散在每個樣本上的,就需要對樣本進行加工,把樣本的信息濃縮到不包含未知量的樣本函數中,這個函數稱為統計量3、 計算題解:2、答:答:題型三 解答題1、簡述多元統計分析中協差陣檢驗的步驟答:第一,提出待檢驗的假設 和H1;第二,給出檢驗的統計量及其服從的分布;第三,給定檢驗水平,查統計量的分布表,確定相應的臨界值,從而得到否定域;第四,根據樣本觀測值計算出統計量的值,看是否落入否定域中,以便對待判假設做出決策(拒絕或接受)。2、

3、簡述一下聚類分析的思想答:聚類分析的基本思想,是根據一批樣品的多個觀測指標,具體地找出一些能夠度量樣品或指標之間相似程度的統計量,然后利用統計量將樣品或指標進行歸類。把相似的樣品或指標歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標)聚合完畢.3、多元統計分析的內容和方法答:1、簡化數據結構,將具有錯綜復雜關系的多個變量綜合成數量較少且互不相關的變量,使研究問題得到簡化但損失的信息又不太多。(1)主成分分析(2)因子分析(3)對應分析等2、分類與判別,對所考察的變量按相似程度進行分類。(1)聚類分析:根據分析樣本的各研究變量,將性質相似的樣本歸為一類的方法。(2)判別分析:判別樣本應屬

4、何種類型的統計方法。4、系統聚類法基本原理和步驟答:1)先計算n個樣本兩兩間的距離2)構造n個類,每個類只包含一個樣本3)合并距離最近的兩類為一新類4)計算新類與當前各類的距離5)類的個數是否等于1,如果不等于回到3在做6)畫出聚類圖7)決定分類個數和類5、 聚類分析的類型有:答:(1) 對樣本分類,稱為Q型聚類分析(2) 對變量分類,稱為R型聚類分析 # Q型聚類是對樣本進行聚類,它使具有相似性特征的樣本聚集在一起,使差異性大的樣本分離開來。# R型聚類是對變量進行聚類,它使具有相似性的變量聚集在一起,差異性大的變量分離開來,可在相似變量中選擇少數具有代表性的變量參與其他分析,實現減少變量個

5、數,達到變量降維的目的。6、 簡述歐氏距離與馬氏距離的區別和聯系。 7、  試述系統聚類的基本思想。 答:系統聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠的后聚成類,過程一直進行下去,每個樣品(或變量)總能聚到合適的類中。 8對樣品和變量進行聚類分析時所構造的統計量分別是什么?簡要說明為什么這樣構造? 答:對樣品進行聚類分析時,用距離來測定樣品之間的相似程度。因為我們把n個樣本看作p維空間的n個點。點之間的距離即可代表樣品間的相似度。常用的距離為 9、在進行系統聚類時,選擇距離公式應遵循哪些原則?&

6、#160;答:(1)要考慮所選擇的距離公式在實際應用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。 (2)要綜合考慮對樣本觀測數據的預處理和將要采用的聚類分析方法。如在進行聚類分析之前已經對變量作了標準化處理,則通常就可采用歐氏距離。 (3)要考慮研究對象的特點和計算量的大小。樣品間距離公式的選擇是一個比較復雜且帶有一定主觀性的問題,我們應根據研究對象的特點不同做出具體分折。實際中,聚類分析前不妨試探性地多選擇幾個距離公式分別進行聚類,然后對聚類分析的結果進行對比分析,以確定最合適的距離測度方法。10、歐式距離的優點缺點答:優點:幾何意義明確,簡單,容易掌握,由于中學數學就已初步接觸,數學知識不多的人也可以把握它的基本含義。 缺點:從統計學的角度看,使用歐式距離要求一個向量的n個分量不相關,且具有相當的方差,或者說各個坐標對歐式距離的貢獻同等且變差大小相同,此時使用歐式距離才合適,且效果良好,否則就不能如實反映情況且容易導致錯誤的結論。因此需要對坐標加權,化為統計距離11、模糊聚類分析的實質和基本原理答:模糊聚類分析的實質就是根據研究對象本身的屬性而構造模糊矩陣,在此基礎上根據一定的隸屬度來確定其分類關系基本原理:如果水平 滿足 ,則按水平分出的每一類必是按

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論