高級心理統計課件_第1頁
高級心理統計課件_第2頁
高級心理統計課件_第3頁
高級心理統計課件_第4頁
高級心理統計課件_第5頁
已閱讀5頁,還剩432頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多元回歸分析多元回歸分析的一般目的和描述一元回歸分析:只有一個引數,只能處理兩個變數之間的關係多元回歸分析:考察多個變數對一個變數的影響1多元回歸分析vs多元相關分析多元回歸分析主要回答的問題多元回歸分析主要回答四大類問題:(1)驗證引數對因變數的影響;(2)檢驗單個或一組引數的重要性;(3)建立預測模型;(4)分析引數之間的交互作用。2多元回歸分析主要回答的問題可細化為是個方面:第一,考察因變數和多個引數之間關係的強度。第二,考察已有引數的重要性。第三??疾煸黾右龜档谋匾浴5谒?,在統計上預先控制協變數的影響。第五,基於假設的需要定義變數影響順序。第六,比較多組引數的重要性。第七,尋找最佳的預測模型。第八,在新樣本上預測因變數分數。第九,重新定義引數以解釋非線性關係。第十,同時處理分類引數和連續引數對因變數的影響。2多元回歸分析的假設及模型33.1使用多元回歸分析的前提假設(1)存在兩個或兩個以上的引數及一個因變數;(2)因變數服從正態分佈;(3)引數與因變數之間呈線性關係;(4)所有變數的觀測必須是彼此獨立的。多元回歸分析的假設及模型33.2多元回歸方程的建立多元回歸分析的假設及模型33.3多元回歸方程的參數估計最小二乘法根據最佳擬合的原則,最小二乘法要求估計得到的參數滿足殘差平方和最小求出參數使殘差平方和

取得最小值多元回歸分析的類型44.1標準多元回歸(standardmultipleregression)又稱為同時回歸(simultaneousregression)所有引數同時進入回歸方程僅度量了每個引數進入方程後增加的預測因變數的貢獻標準多元回歸在計算單個引數的貢獻時,該引數與其它所有引數共同解釋的部分都被排除,僅計算剩餘的可解釋的部分所有重疊的部分將不計入任何引數的貢獻多元回歸分析的類型44.2序列回歸(sequentialregression)又稱分層回歸(hierarchicalregression)引數將根據研究者指定的順序進入回歸方程由於存在前後順序,衡量一個(或一組)引數的貢獻時,與其它變數共同解釋的部分會歸為先進入的變數。多元回歸分析的類型44.3統計回歸(statisticalregression)完全以統計標準決定進入引數進入回歸方程的順序,沒有考慮變數的意義和理論解釋的問題,是一種帶有爭議的回歸類型。一個變數會進入或被排除出方程完全根據該樣本下計算出的統計指標,一些細微的差異將會對衡量變數重要性造成較大的影響。多元回歸分析的類型44.4三種回歸的比較標準回歸會剔除所有引數的重疊部分,可以體現出每個引數的單獨貢獻。序列回歸可以在某些變數進入方程的前提下探討另一些變數的貢獻。統計回歸可以辨別具有多重共線性的變數,將為未來的研究剔除某些明顯冗餘的變數。多元回歸分析中引數的重要性55.1多元測定係數回歸平方和(regressionsumofsquares)總平方和(totalsumofsquares)多元回歸分析中引數的重要性55.2調整的多元測定係數多元回歸分析中引數的重要性55.3偏相關係數偏相關(partialcorrelation)指的是控制其他引數後Y和X的相關,它等於從Y和X中都除去其他預測變數的影響之後,Y和X中剩餘部分的簡單相關。將偏相關係數平方後便可以得到偏測定係數(coefficientofpartialdetermination)偏測定係數是在控制其他引數的條件下,單一引數對因變數的邊際解釋力。多元回歸分析中引數的重要性55.4半偏相關係數半偏相關(semi-partialcorrelation)又稱部分相關(partcorrelation)多元回歸分析中引數的重要性5多元回歸分析中引數的重要性55.5標準化回歸係數因為標準化的Z變數是無量綱的變數,所以此時的回歸係數就稱為標準化的回歸係數(standardizedregressioncoefficient)。多元回歸分析中的統計檢驗66.1回歸方程的顯著性檢驗多元回歸分析中的統計檢驗66.2新加入變數的顯著性檢驗

多元回歸分析中的統計檢驗66.3回歸係數的顯著性檢驗多元回歸分析中的一些值得注意的問題77.1樣本量樣本量與一系列問題有關,包括要求的檢驗力,α水準,引數個數、預期的效應量以及結果的泛化性等。當樣本量非常大時,幾乎所有回歸係數都將顯著地不等於0,即使不能很好預測因變數的引數也是如此。多元回歸分析中的一些值得注意的問題77.2異常值模式異常的個案可以對回歸係數的估計精度產生巨大影響。單變數檢測的常用方式有Z分數和盒式圖等雙變數下的散點圖多變量下的馬氏距離等在回歸的過程中可以同時檢測異常值最為常用的方法是殘差分析多元回歸分析中的一些值得注意的問題77.3多重共線性如果兩個引數之間的相關係數很高,或者一個引數可以由其他引數線性表示,即認為存在多重共線性問題。共線性現象的不良影響(1)回歸係數的置信區間變寬,係數變得不穩定,由樣本推到總體的泛化性變差;(2)回歸係數不能很好地反映單個引數對因變數的獨立影響;(3)使變數的偏測定係數變??;(4)當方程用於預測時,回歸結果變得不可靠。多元回歸分析中的一些值得注意的問題77.3多重共線性常用的指標及其標準:(1)容忍度(Tolerance)(2)方差膨脹因數(VarianceInflateFactor,VIF)(3)條件指數(ConditionIndex,CI)消除多重共線性影響的補救辦法:(1)去掉與y相關程度低、而與其它引數高度相關的引數;(2)根據容忍度或VIF刪除變數,去掉可以被其餘引數線性表示的變數;(3)增加樣本量;(4)採用新的樣本數據;(5)合併變數(6)換用其他形式的回歸(7)變數轉換多元回歸分析中的一些值得注意的問題77.4殘差分析多元回歸分析假設殘差具有正態性,線性和方差同質性,同時假設誤差具有獨立性。殘差的正態性假設指的是殘差在每個因變數的預測分數下都呈正態分佈。線性假設指的是殘差與預測分數呈直線關係。方差同質性假設在所有預測分數下殘差的方差相同。誤差的獨立性假設意味著每次觀測的結果都不應受其他觀測的影響。通常的驗證方法是畫出殘差的散點圖,進行殘差分析,其中橫軸表示因變數的預測值,縱軸表示殘差。多元回歸分析中的一些值得注意的問題77.5分類引數的虛擬編碼如果研究的引數是分類變數,並希望將分類引數納入回歸,則需要對分類變數進行虛擬編碼(dummycoding)。假設該引數有K個類別,則需要構造K-1個新變數。將其中一個類別指定為對照類別,將對照類別在K-1個新變數上全部編碼為0,其餘K-1個類別依次在K-1個新變數上編碼為1。如果將虛無編碼中對參考類別的編碼換為-1而不是0,形成的編碼方式稱為效應編碼(effectcoding)。另一種常用的編碼方式稱為對照編碼(contrastcoding),對照編碼的一個優點在於編碼後生成的新變數相互正交。多元回歸分析中的一些值得注意的問題77.5分類引數的虛擬編碼回歸分析的局限性8回歸分析旨在揭示變數之間的關係,但並不能做出因果推斷。研究變數的選取同樣應該借助理論而不能僅靠統計?;貧w分析假設引數的測量沒有殘差,然而在絕大部分心理學研究中都幾乎不存在如此理想的情況。應用案例及SPSS操作99.1標準多元回歸案例《高級心理統計》P76-82。9.2序列回歸案例《高級心理統計》P82-85。關鍵術語多元回歸分析

標準多元回歸序列回歸

統計回歸偏回歸係數

多元測定係數偏相關係數

半偏相關係數多重共線性

殘差分析邏輯回歸

LogisticRegression1.Logistic回歸分析概述用於處理因變數為離散的二分變數的問題,也可以進一步擴展為多分類Logistic回歸。logistic回歸分析中並不直接對二分結果變數進行回歸分析,而是將其轉換到logit尺度下,引入發生比(事件發生的概率/事件不發生的概率)的概念,再對發生比取自然對數(ln)作為因變數,探究引數的線性組合對轉換後的因變數的影響。1.Logistic回歸分析概述Logistic回歸的優勢:對預測變數的分佈和類型沒有特定假設,預測變數可以是連續變數、分類變數等;尤其適用於引數對因變數的影響具有收益遞減規律或非線性的情況,即當引數處於取值範圍的兩端時,其值的變化對因變數的影響較??;當引數處於取值範圍的中間部分時,其值的變化對於因變數的影響較大的情況。2.主要回答的問題能否根據一系列的預測變數來預測個案在結果變數的類別?各預測變數的效果如何?預測變數之間是否存在交互作用?個案的分類結果是否準確?預測變數的效應值多大?3.前提假設與模型一、模型假設連續預測變數與經過logit轉換後的結果變數之間存在線性關係;結果變數應為二分變數;預測變數可以是連續變數、離散變數,如果是分類變數,採用虛擬編碼;每次觀測相互獨立、殘差均值為0。3.前提假設與模型3.前提假設與模型Logistic曲線我們以0.5作為截點,將事件發生概率大於0.5的結果變數賦值為1(事件發生),否則賦值為0(事件未發生)。3.前提假設與模型3.前提假設與模型5.模型評價負2倍對數似然值(-2LL):反映了假設擬合模型為實際情境時觀察到特定樣本的概率,其值處於0和1之間。其值越大,表明回歸方程的似然值越小,則擬合越差。將截距模型(不包含任何預測變數)與含有預測變數的logistic模型的-2LL進行比較,如果前者顯著高於後者,那麼可以證明含有預測變數的模型顯著改善了模型的擬合情況,即預測變數可以顯著改善模型的擬合情況。顯著性的檢驗採用卡方檢驗。注意樣本量的影響。偽測定係數(pseudo-R2):預測準確性:分類表(classificationtable)4.注意事項第一,樣本量大小。第二,個案與變數的比例。第三,預測變數的多重共線性。第四,分類結果中的異常值。5.案例及SPSS操作本章的應用案例是模擬生成的,因此其分析結果不能推論到實際之中,我們僅以此為例演示logistic回歸分析過程。本案例數據檔參見“4_1logistic.sav”詳見《高級心理統計》P92-P97關鍵術語二分變數分類表發生比對數發生比優勢比logistic曲線logit轉換logit模型發生比模型logistic回歸係數logistic回歸係數冪值對數似然函數偽測定係數wald檢驗內容小結1.對於因變數為二分變數的情境,傳統多元回歸的方法不再適用,logistic回歸則適用於此情境。2.通過對發生比取自然對數來進行logit轉換,從而將二分結果變數轉移到連續的量尺上,使之與引數之間形成線性可加的關係。3.logistic回歸方程由於對結果變數進行了轉換,其對回歸係數的解釋比傳統多元回歸方程的解釋更加複雜。通常採用回歸係數的冪值,即EXP(B)來反映預測變數對結果變數發生比的影響。用Waldtest對回歸係數的顯著性進行檢驗。4.用-2LL和偽測定係數對logistic回歸方程進行整體檢驗和擬合優度的評價。判別分析

discriminantanalysis1.判別分析一般目的和描述判別分析(discriminantanalysis)又稱作鑒別分析、區分分析,在教育心理評價方面有廣泛應用。判別分析是一種根據已知屬於不同類別的樣本為標準,結合所觀測的不同樣本的若干項不同的觀測指標數據,建立一個或幾個線性組合(即判別函數,discriminantfunction),據此將待判別的事物加以分類的一種多元統計方法2.判別分析主要回答的問題判別分析大致可以回答以下幾個問題:(1)能否根據一系列觀測指標變數有效區分不同的類別?(2)究竟有多少個顯著的判別函數?(3)使用哪種線性方程來對新的個案進行分組?(4)所選擇的一系列觀測指標與不同類別的關聯程度有多大?3.判別分析假設條件及模型判別分析的假設條件樣本量各組別樣本量不同對判別分析結果的影響不會很大;但是如果在分組過程中,你希望判別為不同組別的先驗概率不同,那麼樣本量會對此產生影響。3.判別分析假設條件及模型判別分析的假設條件觀測指標變數的多元正態分佈在判別分析中,假定各觀測指標變數滿足多元正態分佈,即觀測指標變數的得分是從一個總體中獨立隨機抽樣,任何觀測指標變數的線性組合的抽樣分佈都是正態分佈的。3.判別分析假設條件及模型判別分析的假設條件各類別方差-協方差齊性一般來說,當樣本量較大、各類別樣本量均衡的時候,違反方差齊性的假設並不會對判別函數的顯著性造成太大的影響;但是當樣本量較小各組別樣本量不均衡的時候,估計判別函數的顯著性的判斷會受到較大的影響,很可能造成偏差。3.判別分析假設條件及模型判別分析的假設條件多重共線性如果觀測指標變數有高相關,那麼類似於多元回歸很可能會出現多重共線性。3.判別分析假設條件及模型判別分析的基本模型判別函數判別函數表示分組變數與滿足條件假設的觀測指標變數之間的關係。和多元線性回歸方程形式類似,判別函數的因變數為不同判別函數的得分,此得分並不是分組變數的編碼值,而是通過對觀測指標變數進行座標旋轉而得到的間距測度變數,其作用在於最大化組間差異、最小化組內差異。3.判別分析假設條件及模型判別分析的基本模型分類函數判別函數反映了預測指標變數和判別值之間的關係,而分類函數則解決如何將個案劃分到不同的類別的問題4.判別分析的主要類型建立判別函數的方法(1)在標準判別分析(standarddiscriminantanalysis)中,所有選擇的預測變數都將進入方程之中,變數之間共同對於組間方差的解釋將不屬於任何一個變數。4.判別分析的主要類型建立判別函數的方法(2)在序列判別分析(sequentialdiscriminantanalysis)中,研究者可以根據已有研究或假設對預測變數進入方程的順序進行設定。4.判別分析的主要類型建立判別函數的方法(3)在統計判別分析(statisticaldiscriminantanalysis)中,當研究者對於預測變數進入方程的順序沒有特定要求,那麼可以通過統計標準來確定進入順序4.判別分析的主要類型對個案進行分類的方法(1)距離判別距離判別的基本思想是:在P維空間中,對已知的K個總體G1,G2,…,GK來說,在每個總體內部,由於所有元素同屬一個總體,元素與元素之間的距離相對較短,而對於異質總體的元素來說,其間的距離應該相對較長一些。4.判別分析的主要類型對個案進行分類的方法(2)貝葉斯判別。貝葉斯判別是在判別分析中充分利用先驗概率資訊的一種判別方法。4.判別分析的主要類型對個案進行分類的方法(3)Fisher判別Fisher判別通過尋找一個將P維空間的點降為一維數值的線性函數,然後利用這個線性函數把P維空間中已知類別總體以及未知類別歸屬的空間點都轉換為一維數據,再根據它們之間的疏密情況把未知歸屬的點判為相應的總體。5.判別分析的參數及解釋判別係數判別係數又稱為函數係數、判別權重,反映了各預測變數對於判別函數的作用,可以分為標準化和非標準化兩種。

5.判別分析的參數及解釋結構係數在判別分析中結構係數又稱為判別負載,反映了各觀測指標變數與判別函數值之間的相關係數。

5.判別分析的參數及解釋分組的矩心分組的矩心是每個類別判別函數值的均值,它描述了以判別函數為軸,每個類別的中心所在的位置。

5.判別分析的參數及解釋特徵根每個判別函數都會對應一個特徵根,其數值等於組間差異與組內差異的比例。特徵根反映了該判別函數的判別能力,越大說明判別能力越佳。

5.判別分析的參數及解釋典型相關係數典型相關係數的計算公式如下:

5.判別分析的參數及解釋Wilks’Lambda參數Wilks’Lambda

反映的是組內平方和占總平方和的比例,其值越小,則表明組內平方和占總平方和的比例越小,對應的組間平方和占總平方和的比例越大。

6.判別分析應用案例及SPSS操作本例數據包含ID、numeracy(計算能力)、reasoning(推理能力)、spacial(空間能力)、GROUP(類別)變數。其中,ID表示個案編號,GROUP為分組變數,一共有三個組別(優秀、良好、不及格),對應變數值為1、2、3,隨機挑選了9個個案的分組變數為缺失值。其餘變數為預測變數,均為1-10點評分。操作步驟詳見《高級心理統計》P104~P110關鍵術語分組變數判別變數判別函數分類函數分類函數值標準判別序列判別統計判別距離判別貝葉斯判別Fisher判別判別係數結構係數分組矩心特徵根典型相關係數Wilks’Lambda聚類分析1.一般目的和描述聚類分析是將所觀測的事物或觀測事物的指標進行分類的一種統計分析方法,它的目的是辨認在某些特徵上相似的事物,並將這些事物按照這些特徵劃分為幾個類,使得同一類中的事物具有較高的同質性,不同類中的事物具有較大的異質性。聚類分析的對象有兩個方面,一個方面是對樣品也即個案或被試聚類(稱Q型聚類),另一個方面是對指標也即變數進行聚類(稱R型聚類)。2.主要回答的問題如何測量變之間的相似性或個體之間的距離如何將相似的事物或變數聚為一類如何描述和解釋所聚成的各類3.模型及原理距離每個樣品(案例)有p個指標(變數),故每個樣品可以看成p維空間中的一個點,n個樣品組成p維空間中的n個點,用距離來度量樣品之間接近的程度。距離測度應滿足下列四個條件:1)dij

0;2)dij=dji,即距離具有對稱性;3)dijdik+dkj,即三角不等式,任意一邊小於其他兩邊之和;4)如果dij0,則ij3.模型及原理距離3.模型及原理相似係數3.模型及原理相似係數選擇原則要考慮所選擇的距離/相似係數公式在實際應用中有明確的意義。要綜合考慮對樣本觀測數據的預處理和將要採用聚類分析方法。要考慮研究對象的特點及計算量的大小。3.模型及原理變數的標準化中心化變換變數的標準化標準化變換中心化變換變數的標準化極差正規化變換中心化變換變數的標準化對數變換中心化變換4.聚類分析的主要類型根據聚類分析的對象劃分樣品聚類(稱Q型聚類)指標聚類(稱R型聚類)根據聚類分析的原理劃分層次聚類法(HierarchicalCluster)非層次聚類法(NonhierarchicalCluster)或K平均數法(K—meansmethods)4.1層次聚類1、聚集法:首先把每個案例各自看成一類,先把距離最近的兩類合併,然後重新計算類與類之間的距離,再把距離最近的兩類合併,每一步減少一類,這個過程一直持續到所有案例歸為一類為止。2、分解法:與聚集法相反,首先把所有的案例看成一類,然後把最不相似的案例分為兩類,每一步增加一類,直到每個案例都成為一類為止。4.1層次聚類(1)最短距離法(SingleLinkage)類與類之間的距離定義為一個類中的所有案例與另一類中的所有案例之間的距離最小者。(2)最長距離法(CompleteLinkage)與最短距離法相反,類與類之間的距離定義為兩類中離得最遠的兩個案例之間的距離。4.1層次聚類(3)中間距離法4.1層次聚類(4)重心法4.1層次聚類(5)類平均法4.1層次聚類(6)可變類平均法4.1層次聚類(7)可變法4.1層次聚類(7)離差平方和法4.2非層次聚類K平均數法的計算步驟如下:(1)指定要形成的聚類個數,對樣本點進行初始分類並計算每一個初始分類的重心;(2)調整分類,計算每個樣本點到各類重心的距離,把每個樣本點歸到距離重心最近的那個類;(3)重新計算每個類的重心;(4)重複第(2)和第(3)步,直到沒有樣本點可以再調整為止5.值得注意的問題5.1分類數目的確定和結果解釋類間差異與類內差異相比,類間差異顯著大於類內差異所分出的各類有明確的含義;若選用不同的方法進行聚類,應該得到較多相同的類;確定的類中,每類所包含的元素的個數不應太多。5.值得注意的問題5.2聚類分析與其他多元分析方法的聯繫聚類分析與因素分析研究使用的目的不同,因素分析是從眾多的測量指標中尋求潛在變數,即決定諸多指標之間存在相關的潛變數因素是什麼,而聚類分析,只尋求指標是有哪些不同的類別。假設不同,不管哪種因素分析模型,都假設原有的觀測指標可以用新的因素取代,而聚類只是尋求其中一個有代表性的指標代替原來的眾多指標。計算方法不同,求解因素的方法與聚類的計算思路與方法有很大差異。5.值得注意的問題5.2聚類分析與其他多元分析方法的聯繫聚類分析與回歸分析回歸分析是從諸多引數(因)中尋求與因變數(果)之間變數關係的統計分析的方法。聯繫,當回歸分析中進入的引數太多時,為了減少引數的數目,簡化回歸計算,可以先用聚類分析,從各指標類別中選取有代表性的指標,用這些少數有代表性的指標進行回歸分析,可大大減少引數的數目,簡化回歸分析中的的計算,特別是當引數很多的情況下,此種方法的優點就顯現出來了。6.案例及SPSS操作一、應用案例及SPSS操作層次聚類K-平均值聚類詳見課本P121-128關鍵術語聚類分析層次聚類法非層次聚類法K平均數法內容小結聚類分析是將所觀測的事物或觀測事物的指標進行分類的一種統計分析方法,它的目的是辨認在某些特徵上相似的事物,並將這些事物按照這些特徵劃分為幾類,使得同一類中的事物具有較高的同質性,不同類中的事物具有較大的異質性。根據聚類分析的對象,可以將聚類分析分為對樣品進行聚類的Q型聚類和對指標進行聚類的R型聚類。根據聚類方法原理,可以將聚類分析分為層次聚類法和非層次聚類法。聚類分析主要應用於探索性的研究,其分析的結果可以提供多個可能的解,選擇最終的解需要研究者的主觀判斷和後續的分析。探索性因素分析

ExploratoryFactorAnalysis1.探索性因素分析的一般目的和描述一種用來定義變數的潛在結構的分析技術考查多個變數之間的相互關係並用它們共同的潛在維度來解釋這些變數這些潛在維度稱為因素(factors)同時考慮所有變數以及變數之間的相互關係1探索性因素分析的一般目的和描述語言能力

語文數學英語科學1906089552459066100388668570488779556…………………………理科思維2.因素分析的模型、假設及基本步驟模型及原理基本概念前提假設基本步驟xi=ai1fi1+ai2fi2+…+aimfim+ui(i=1,2,…,k)2.1模型及原理觀測數據公因數特殊因數因數載荷2.1模型及原理x1f1f2x2xkfm…………u1u2uk……a11a21ak1a12a22ak2a1ma2makm2.1模型及原理觀測變數的方差可以分為三部分觀測變量方差公因子方差Commonvariance特殊因子方差Specificvariance誤差方差Errorvariance抽取的方差未抽取的方差2.2基本概念因素載荷觀測變數依賴公因數的分量當公因數間完全不相關時,因數載荷=觀測變數與因數之間的相關係數xi=ai1fi1+ai2fi2+…+aimfim+ui(i=1,2,…,k)2.2基本概念共同度觀測變數方差中由公因數解釋的比例當公因數間不相關時,公因數方差等於和該變數有關的因數載荷的平方和hi2

=ai12

+ai22

+…+aim2eg.x1=0.95*f1+0.22*f2+u1h12

=0.9509作用:如果用公因數替代觀測變數後,原來每個變數的資訊被保留的程度2.2基本概念特徵根每個公因數對數據變異的解釋能力;該因數所解釋的總方差計算:與該因數有關的因數載荷的平方和x1=0.95*f1+0.22*f2+u1x2=0.45*f1+0.52*f2+u2x3=0.15*f1+0.92*f2+u3因數f1的貢獻=0.952+0.452+0.152=1.12752.2基本概念貢獻度指各因素的特徵值在總的公共因素方差(或總的特徵值)中所占的比例。貢獻率反映了該因素對所有觀測變數變異的貢獻程度。貢獻率大,說明該因素的影響大、重要性大或權重大。因為每一個變數的方差都被標準化為1,所以總的公共因素方差之和為n,n為變數個數,貢獻率則可表示為λ/n。2.3前提假設因素分析的目的是簡化數據或者找出基本的數據結構,因此使用因素分析的前提假設包括理論假設與統計假設。理論假設是指所選的一組變數中,確實存在某種潛在結構。統計假設是指,觀測變數之間應該有較強的相關關係。如果變數之間的相關程度很小,則它們不可能共用公共因素。所以,在計算出相關矩陣後,需要對相關矩陣進行檢驗。如果相關矩陣中的大部分相關係數都小於0.3,則不適合做因素分析。SPSS軟體提供了三個統計量來判斷觀測數據是否適合做因素分析。

(1)變數間相關矩陣(2)反映像相關矩陣(3)KMO測度和Bartlett球形檢驗2.4基本步驟第一步:明確探索性因素分析的目的。第二步:設計探索性因素分析。第三步:檢驗探索性因素分析的前提假設。第四步:抽取因素。第五步:解釋因素。第六步:探索性因素分析的效度驗證。第七步:探索性因素分析的結果處理。根據探索性因素分析的目的、原理、方法,其基本步驟可以分為七個過程(Hair,Black,Babin,&Anderson,2010)。2.4基本步驟明確因素分析目的因素分析設計判斷數據是否符合因素分析假設抽取因數並計算模型擬合程度因數解釋和命名效度檢驗因素分析結果的其他用途3.探索性因素分析前的準備明確目的設計分析檢驗假設分析是探索性的還是驗證的?數據總結and/or數據簡化?3.1明確目的3.1明確目的因數分析分類探索性因素分析驗證性因素分析是否有理論依據,可以對潛在結構做出假設?3.1明確目的因素分析目的數據匯總:生成潛在維度,從而用比原始數據更少的變數去描述數據數據縮減:在數據匯總的基礎上,給每個潛在維度賦予分值從而代替原始數據語言能力

語文數學英語科學1906089552469066100388668570488779556…………………………理科思維語言能力理科思維89.557569586689165…………Stage1Stage2驗證性探索性結構方程模型選擇因數分析的類型分析單元:變數/個案?研究問題探索性/驗證性?因數分析目的:數據匯總&識別結構數據簡化3.1明確目的3.2設計分析數據計算方法:R分析:針對變數的因素分析Q分析:針對個案的因素分析通常的因素分析都是R分析Q分析≠聚類分析3.2設計分析Q分析≠聚類分析Q分析:反應模式相似性聚類分析:因數水準相似性3.2設計分析1.確定數據計算方法:R分析vs.

Q分析2.變數個數及屬性:潛在維度個數和每個維度下變數個數都要合理數據類型應為連續變數可以有少量虛擬變數3.必需的樣本量:一般情況≥100;至少≥50如果為了識別潛在結構,最好一個因數有5個(或以上)變數樣本量和變數數之比至少為5:1,最好為10:1Stage1Stage2研究問題探索性/驗證性?因數分析目的:數據匯總&識別結構數據簡化驗證性探索性結構方程模型選擇因數分析的類型分析單元:變數/個案?研究設計加入哪些變數變數是如何測量的樣本量個案Q分析,聚類分析變數R分析3.2設計分析3.3檢驗假設所選的一組變數中,確實存在某種潛在結構樣本是同質的,有相同的潛在結構例如:理論問題X2X1X3X4X5X6F1F2男性X2X1X3X4X5X6F1F2女性3.3檢驗假設不要求正態性、方差齊性、線性識別變數的內部相關→某種程度的共線性實踐問題相關MSA值Bartlett球形度檢驗KMO值3.3檢驗假設整體檢驗變數間相關:如果所有或大部分相關小於0.3,則不適合做EFABartlett球形檢驗:顯著,說明變數間存在足夠的相關KMO檢驗:0~1,應大於0.50,值越大越適合進行EFA對單個變數的檢驗MSA值:反映像相關矩陣(anti-imagecorrelationmatrix),單個變數的MSA值應大於0.50,否則應被剔除3.3檢驗假設研究問題探索性/驗證性?因數分析目的:數據匯總&識別結構數據簡化Stage1驗證性探索性結構方程模型選擇因數分析的類型分析單元:變數/個案?Stage2研究設計加入哪些變數變數是如何測量的樣本量前提假設對正態性、方差齊性、線性的統計考慮樣本同質性概念上的聯繫Stage3Stage43.3檢驗假設個案Q分析,聚類分析變數R分析4.因素的抽取和旋轉選擇抽取因素的方法公共因素數目的確定因素旋轉解釋因素4.1選擇抽取因素的方法主軸因素法

最小二乘法極大似然法Alpha因數提取法映像分析法最大相關法形心心素法參照析因迭代法複相關平方法提取因數全分量模型公共因素模型4.1選擇抽取因素的方法主成分分析法從原始變數的總體方差變異出發,儘量使原始變數的方差能夠被主成分所解釋公因數分析法重在解釋變數的相關性,確定內在結構,而對於變數的方差的解釋相對不太重視當研究的目的重在確定結構時,可以使用此方法4.2公共因素數目的確定決定因數個數先驗標準:結合前人研究結果因數的特徵根大於1因數的變異總解釋率大於60%

(取決於具體研究)碎石圖拐點被試不同質時應抽取更多的因數前提假設對正態性、方差齊性、線性的統計考慮樣本同質性概念上的聯繫Stage3選擇因素分析方法要分析的是總方差還是共同方差?總方差主成分分析共同方差共因數分析設定因數矩陣決定因數個數Stage4Stage5Stage24.2公共因素數目的確定4.3因素旋轉因數旋轉的原因:未旋轉時,基於因數解釋方差的多少來抽取因數,第一個因數解釋的變異最多,越往後解釋的變異越少重新分佈每個因數上的方差,從而達到更簡單更有意義的因數模式因數旋轉的類型:正交旋轉:旋轉軸保持90度斜交旋轉:旋轉軸不保持90度因數旋轉的原理:改變坐標軸的位置,重新分配各個因數所解釋的方差的比例,使得各個變數在盡可能少的因數上有較高載荷4.3因素旋轉正交旋轉默認各因數之間不存在相關正交旋轉使用最為廣泛目的為數據簡化時使用正交旋轉4.3因素旋轉斜交旋轉允許因數之間存在相關比正交旋轉更加靈活目的為得到有理論意義的因數和結構時使用斜交旋轉4.3因素旋轉正交斜交4.3因素旋轉4.4解釋因素因數載荷多大才算顯著:至少大於0.30一般應該大於0.40在預設檢驗力水準下,樣本量會影響統計顯著性樣本量增大,判斷載荷顯著的臨界值水準降低(更小的載荷就有可能顯著)1.檢查載荷矩陣2.找到每個變數在所有因數中最高的載荷3.評估變數的共同度4.是否需要重設模型5.因數命名因數矩陣解釋步驟4.4解釋因素因數載荷

載荷顯著需要的樣本量* .30 350 .35 250 .40 200 .45 150 .50 120 .55 100 .60 85 .65 70 .70 60 .75 50*顯著是基於0.05的顯著性水準,80%的檢驗力,假定標準誤是一般相關係數標準誤的兩倍4.4解釋因素變數數量增加,達到顯著的載荷臨界值減小→更小的載荷就可能顯著因數數量增加,達到顯著的載荷臨界值增大→更大的載荷才可能顯著交叉載荷的變數通常要刪除,除非有理論支持或目的只是簡化數據。當所有變數都只在某一個因數上有高載荷時,得到的結構最優4.4解釋因素1.檢查載荷矩陣2.找到每個變數在所有因數中最高的載荷3.評估變數的共同度4.是否需要重設模型5.因數命名因數矩陣解釋步驟4.4解釋因素1.檢查載荷矩陣2.找到每個變數在所有因數中最高的載荷3.評估變數的共同度4.是否需要重設模型5.因數命名共同度通常應該達到0.50以上才能被接受因數矩陣解釋步驟4.4解釋因素1.檢查載荷矩陣2.找到每個變數在所有因數中最高的載荷3.評估變數的共同度4.是否需要重設模型5.因數命名刪除了變數使用了不同的旋轉方法需要抽取不同數量的因數改變抽取因數的方法因數矩陣解釋步驟:4.4解釋因素1.檢查載荷矩陣2.找到每個變數在所有因數中最高的載荷3.評估變數的共同度4.出現以下情況需要重設模型5.因數命名因數命名是基於對因數載荷的解釋因數命名時,應主要考慮每個因數中載荷最顯著的變數,旋轉方式的選擇會影響對因數載荷的解釋:正交旋轉時因數之間無相關,斜交旋轉時因數之間有相關因數矩陣解釋步驟:選擇因素分析方法要分析的是總方差還是共同方差?總方差主成分分析共同方差共因數分析設定因數矩陣決定因數個數Stage4Stage5解釋旋轉的因數矩陣是否有顯著的載荷?因數是否能命名?共同度是否足夠大?正交方法VARIMAXEQUIMAXQUARTIMAX斜交方法ObliminPromaxOrthoblique選擇旋轉方法因數之間應該有相關(斜交)還是不相關(正交)?因數模型重新設定是否刪除了變數?是否想改變因數個數?是否想用另一種旋轉方法?是否Stage6否是4.4解釋因素5.探索性因素分析的應用效度驗證結果處理5.1效度驗證評估結果的可重複性比較探索性因素分析和對探索性因素分析的結果進行驗證性因素分析評估因數結構穩定性穩定性高度依賴於樣本量和每個變數的觀測數量檢查有影響的觀測值分別在包含和不包含有影響的觀測值時,運行因數模型,找到異常值5.2結果處理如何將因數分析的結果用到其他分析中?選擇代表性變量(surrogatevariable)用因子中載荷最高的變量,代表該因子優點:已操作,好解釋缺點:1)并不能代表一個因子的所有方面2)易受測量誤差的影響合成維度分(summatedscale)對所有在同一因子上載荷高的變量,加和或求均值優點:1)減少了測量誤差2)代表一個概念的多個方面3)不同研究中可重復缺點:1)只包含了高載荷變量,2)不一定正交3)要求先分析信效度計算因素得分(factorscore)根據所有變量在因子上的載荷合成優點:1)代表了所有加載于因子上的變量2)數據簡化的最好方式3)默認正交,避免多重共線性造成的復雜問題缺點:1)更難解釋2)不同研究很難重復5.2結果處理Stage6因數矩陣的效度檢驗拆分/多個樣本對子樣本分別進行分析找到有影響的個案選擇代表性變數計算因素得分合成維度分Stage7Stage66.探索性因素分析中一些值得注意的問題樣本量的問題缺失值的問題抽取因素數充分性的問題因素的重要性及其內部一致性的問題6.1樣本量的問題一般認為,當樣本量的數量小於50時,是不適合進行因素分析的,因此,有研究者提出樣本量最好在100以上。例如,Comrey和Lee(1992)就提出了樣本量的參考標準,樣本量為50時,因素分析的結果會很差,100時較差,300時較好,500時非常好,1000時特別好。其實,經驗的法則是,樣本量的數量應當至少為要分析的變數數量的5倍,更被普遍認可的標準是10倍及以上,甚至有的研究者提出20倍的要求。6.2缺失值的問題當數據中存在缺失值時,回顧之前學習的知識,需要識別數據的缺失機制,同時對缺失值進行處理。處理的方式包括忽略、刪除缺失被試、估計缺失值等。如果研究者在非隨機缺失的情況下採取了刪除缺失被試的方法,就要考慮刪除後的樣本量是否足夠,以及刪除被試是否會造成有偏的估計結果。如果採用回歸等方式插補缺失值,就要考慮這種方式是否會造成模型過度擬合數據,使得相關偏高,從而產生出一些不存在的因素。6.3抽取因素充分性的問題在探索性因素分析中,如果抽取的因素數量越多,模型的擬合程度就越高,可以解釋的方差比例就越大,但是,模型的複雜性就會增強。最極端的情況,如果抽取的因素數等於變數的數量,那麼模型的擬合程度應該最好,而這樣的模型也失去了降維的意義。因此,探索性因素分析中對因素數量的選取體現了對模型擬合程度與模型簡潔性的平衡。6.4

因素的重要性及其內部一致性的問題因素的重要性因素的重要性是由旋轉後,每個因素解釋方差或協方差的比例來衡量的。在旋轉前後,每個因素解釋的方差或協方差的比例是不同的,這裏需要使用旋轉後的結果。因素的內部一致性因素的內部一致性是用因素分多重相關的平方來確定的(Tabachnick&Fidell,2001)。多重相關係數是某個因素分與其他因素分之間線性相關程度的指標(Allison,1999)。該值一般在0到1之間,值越大,說明因素內部一致性越強,因素越穩定。如果因素分多重相關的平方較高(如,大於0.7),意味著觀測變數能夠解釋因素分的變異。如果因素分多重相關的平方大於1,說明整個分析結果需要重新考量。6.4

因素的重要性及其內部一致性的問題因素解釋的問題為了解釋因素,就必須瞭解每個因素所有有載荷的變數。通過正交旋轉和斜交旋轉,都可以得到因素載荷矩陣,但是,這兩種旋轉方式下,載荷的意義是不同的。正交旋轉之後,因素載荷矩陣中的數值表示變數和因素的相關。研究者可以確定一個標準(例如,0.3),高於這個標準的相關才是有意義的。然後,可以選擇所有與某個因素的相關有意義的變數,試著對這些變數的潛在共同點加以概括。斜交旋轉之後,載荷不再是變數和因素的相關,只是測量了它們之間的關係。因為因素之間是相關的,所以一個變數和一個因素的相關可能並不是因為它們直接的相關,而是通過因素之間的相關達到的。6.5探索性因素分析的局限性在理論方面首先,研究者在選擇因素時面臨著雙重困境。研究者為了證明某個假設,總是想盡可能多的保留有與研究主題有關聯的因素,如果一旦遺漏了重要的因素,將會扭曲所測量的因素之間的關係,從而得到有偏差的結果。其次,有的變數會存在有交叉載荷的問題。在探索性因素分析中,我們當然希望每個變數都只測量一個因素。但是有時,一個變數與多個因素都有相關,這個變數在這幾個因素上就存在交叉載荷。這樣會對整個數據結構的確定和因素的解釋帶來一定的困難。最後,探索性因素分析有時對樣本的異質性很敏感。一方面,不同類型的群體在同樣的變數上可能得到不同的因素分析結果。另一方面,即使對於相同的樣本,隨著時間的推移,潛在的因素結構也可能會發生改變。因此,如果不能排除這些異質性的影響,就應當對不同的樣本分別分析。6.5探索性因素分析的局限性在實踐方面首先,儘管探索性因素分析對變數的數據分佈沒有嚴格假設,但是,數據的分佈的確會影響分析結果的準確性。如果變數之間滿足多元正態分佈,並且兩兩之間的關係是線性的,那麼分析結果的有效性較高。反之,數據的偏態分佈和變數之間的非線性關係將會降低分析結果的可靠性。其次,如果數據中包含一個變數或多個變數上的奇異值,那麼這些奇異值將會對因素分析的解有較大的影響。最後,相關矩陣得到高相關,也不一定意味著存在潛在因素。有時候,這些相關僅代表兩個變數之間的關係,而沒有反映潛在因素對多個變數的同時影響。因此,對所有變數計算兩兩之間的偏相關也很重要,這樣能夠得到除去其他變數的影響後,兩兩變數之間單獨的關聯。如果數據背後有潛在因素存在,那麼兩兩變數得到的二列相關就應該較高,而偏相關較低。SPSS和SAS中都可以輸出偏相關矩陣。7應用案例及SPSS操作一個關於幽默風格的問卷:分析目的及設計數據整理前提假設檢驗第一次探索性因素分析因素數固定為5的探索性因素分析因素數固定為4的探索性因素分析刪除Q22後的探索性因素分析刪除Q22、Q28後的探索性因素分析操作步驟詳見《高級心理統計》P149~P1647應用案例及Mplus操作一個關於幽默風格的問卷:第一次探索性因素分析刪除Q28後的探索性因素分析刪除Q28、Q22後的探索性因素分析操作步驟詳見《高級心理統計》P164~P171關鍵術語探索性因素分析因素載荷公共因素方差特徵根貢獻率全分量模型公共因素模型因素旋轉正交旋轉斜交旋轉因素得分內容要點1、因素分析(FactorAnalysis)是一種將描述某一事物的多個可觀測的“變數”縮減成描述該事物的少數幾個不可觀測的“潛變數”(又稱潛在因素)的統計技術。因素分析具體可以分為探索性因素分析(exploratoryfactoranalysis,EFA)和驗證性因素分析(confirmatoryfactoranalysis,CFA)兩大類。2、因素分析的基本模型是將觀察到的數據表示成幾個潛在因素的線性組合。探索性因素分析的基本模型可以分為兩類:全分量模型和公共因素模型。3、探索性因素分析的基本假設是,所選擇的變數確實存在潛在的相關結構。相關矩陣、Anti-image相關矩陣、Bartlett球形檢驗和KMO測度就可以對變數相關的假設進行統計檢驗。4、一般來說,可以結合先驗的標準、特徵值原則、碎石檢驗準則、因素累積解釋方差的比例標準來確定公共因素的數量。5、因素旋轉可以重新分配各個因素所解釋的方差的比例,使因素結構簡單並易於解釋。因素旋轉的方式有兩種,一種是正交旋轉,另一種是斜交旋轉。斜交旋轉比正交旋轉更具有一般性,它假設因素之間有相關。6、在實際中,可以通過使用變數替代、合成維度分或者使用因素得分的方式將探索性因素分析的結果應用到後續分析中。驗證性因素分析1.驗證性因素分析與探索性因素分析比較探索性因素分析(1)所有的公共因素都相關(或都無關)。(2)所有的公共因素都直接影響所有的觀測變數。(3)特殊因素之間相互獨立。(4)公共因素和特殊因素相互獨立。驗證性因素分析(1)公共因素之間可以相關也可以無關。(2)觀測變數可以只受某一個或幾個公共因素的影響而不必受所有公共因素的影響。(3)特殊因素之間可以有相關,還可以出現不存在誤差因素的觀測變數。(4)公共因素和特殊因素之間相互獨立。1.驗證性因素分析與探索性因素分析比較探索性因素分析(5)觀測變數與潛在變數之間的關係不是事先假定的。(6)潛在變數的個數不是在分析前確定的。(7)模型複雜,通常是不可識別的。驗證性因素分析(5)觀測變數與潛變數之間的關係事先假定的;(6)潛在變數的個數在數據分析前確定的;(7)模型通常要求是可識別的。圖示2.驗證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

X1

觀測變數潛變數潛變數(或特殊因數)對觀測變數的影響特殊因數潛變數之間的相關2.驗證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13

2.驗證性因素分析的圖示、模型及基本步驟模型導出協方差矩陣測量模型中誤差項之間的協方差矩陣觀測變數之間的協方差矩陣觀測變數X相應於ξ的載荷陣潛變數之間的協方差矩陣模型的估計:求解協方差方程中的各個參數的估計值,以便使模型更好地重新產生觀測變數的協方差矩陣。2.驗證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13觀測變數之間的協方差矩陣:X1,X2,…,X9變數之間的協方差矩陣總體協方差矩陣用∑表示具體應用中根據實際數據計算樣本協方差矩陣S是結構方程模型中的輸入部分2.驗證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13因素載荷矩陣:由理論假設的模型確定因素載荷矩陣的結構和需要估計的參數,用Λx表示是驗證性因素分析需要估計的部分2.驗證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13潛變數協方差矩陣:由理論假設的模型確定協方差矩陣的結構和需要估計的參數,用Ф表示是驗證性因素分析需要估計的部分2.驗證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13

2.驗證性因素分析的圖示、模型及基本步驟基本步驟第一步:設定驗證性因素分析模型。第二步:判斷驗證性因素分析模型是否能識別。第三步:驗證性因素分析的參數估計。第四步:驗證性因素分析的模型評價。第五步:驗證性因素分析的模型修正。第六步:驗證性因素分析的模型應用。3.驗證性因素分析模型的確定和識別模型確定驗證性因素分析模型的定義往是基於不同理論和研究者觀點提出。模型1:自我概念(Self-Concept,簡寫為SC)有四個維度,分別為整體自我概念(GSC)、學業自我概念(ASC)、英語自我概念(ESC)、數學自我概念(MSC)。模型2:自我概念有兩個維度,GSC和ASC。模型3:另有研究者指出,自我概念為單維度結構,只有GSC一個維度。3.1模型確定模型1:自我概念(Self-Concept,簡寫為SC)有四個維度,分別為整體自我概念(GSC)、學業自我概念(ASC)、英語自我概念(ESC)、數學自我概念(MSC)。測驗題目與因素之間的關係為:題目T1-T4測量GSC、題目T5-T8測量ASC、題目T9-T12測量ESC、題目T13-T16測量MSC;每個題目只測量一個維度,不存在交叉載荷。四個維度GSC、ASC、ESC和MSC之間兩兩相關。特殊因素之間相互獨立。3.1模型確定模型1:自我概念(Self-Concept,簡寫為SC)有四個維度,分別為整體自我概念(GSC)、學業自我概念(ASC)、英語自我概念(ESC)、數學自我概念(MSC)。T1T2T3T4T5T6T7T8T9T10T11T12T13T14T15T16GSCASCESCMSC3.1模型確定模型2:自我概念有兩個維度,GSC和ASC。測驗題目與因素之間的關係為:題目T1-T4測量GSC、題目T5-T16測量ASC;每個題目只測量一個維度,不存在交叉載荷。兩個維度GSC和ASC相關。特殊因素之間相互獨立。3.1模型確定模型2:自我概念有兩個維度,GSC和ASC。T1T2T3T4T5T6T7T8T9T10T11T12T13T14T15T16GSCASC3.1模型確定模型3:自我概念為單維度結構,只有GSC一個維度。測驗題目與因素之間的關係為:題目T1-T16測量GSC。特殊因素之間相互獨立。T1T2T3T4T5T6T7T8T9T10T11T12T13T14T15T16GSC3.2模型識別模型識別是指求出參數的唯一解,即模型的協方差方程中自由估計的參數有唯一滿足方程的值3.2模型識別不可識別不可識別是指模型中方程式的個數小於要估計的參數的個數,使參數有多個解??梢宰R別的情況恰好識別恰好識別是指模型中方程式的個數等於要估計的參數的個數,每個參數都能求得唯一解。超識別超識別是指模型中方程式的個數大於要估計的參數的個數,一個待識別的參數可以用一個以上的已知量表示時,該參數可取不同值。3.2模型識別識別的必要條件T準則:模型中自由參數的個數不能超過協方差矩陣的元素數。3.2模型識別

3.2模型識別

3.2模型識別複雜模型識別的充分條件對於每一個因素,至少需要滿足下列條件之一:(1)至少含有三個測量指標變數,其測量誤差之間不存在相關;(2)至少含有兩個測量指標變數,其測量誤差之間不存在相關,且滿足下列條件之一:(a)這兩個指標的測量誤差不與測量另一個因素的第三個指標的測量誤差項相關;(b)限定這兩個指標的因素載荷相等3.2模型識別複雜模型識別的充要條件對於任意的兩個因素,至少存在兩個指標變數,它們來自不同的因素,其測量誤差之間不存在相關。除了上述因素載荷中關於測量誤差相關的約定,對於有交叉載荷的每個因素,必須至少有一個指標不存在交叉載荷(即只在一個因素上有載荷),並且與含有交叉載荷的指標變數的測量誤差不相關4.驗證性因素分析中的數據收集和參數估計測量的量尺在進行驗證性因素分析中,所使用的數據類型最好是順序數據、等距數據或比率數據。驗證性因素分析可以處理包含不同計分點的數據。4.驗證性因素分析中的數據收集和參數估計設定潛變數量尺設定潛變數量尺的方法有兩種:一是對每個潛變數,固定一條路徑的因素載荷為1;二是固定潛變數的方差為1。4.驗證性因素分析中的數據收集和參數估計X1X2X3X4X5X6X7X8X9

X1X2X3X4X5X6X7X8X9

1111111111111111111111114.2參數估計在驗證性因素分析中的參數估計的方法有:未加權最小二乘法(ULS)廣義最小二乘估計(GLS)極大似然估計(ML)工具變數法(IV)兩階段最小平方法(TSLS)加權最小平方法(WLS)對角加權最小平方(DWLS)貝葉斯估計方法(BAYES)5.驗證性因素分析中的模型評價與修正模型評價絕對擬合指數(AbsoluteIndex)這些指數比較的是觀測的與期望的方差和協方差,即測量絕對的模型擬合。擬合優度卡方統計量擬合優度指數(GFI)和調整的擬合優度指數(AGFI)近似誤差均方根(RMSEA)5.驗證性因素分析中的模型評價與修正模型評價相對擬合指數(RelativeIndex)這些指數比較了一個模型與另一個模型的相對擬合。比較擬合指數CFI遞增擬合指數IFI標準擬合指數NFI非標準擬合指數NNFI/TLI5.驗證性因素分析中的模型評價與修正模型修正如果模型不能很好地擬合數據,就需要對模型進行修正和再次設定。對於模型的選取應該遵循省儉原則,省儉原則是指當兩個模型同樣吻合數據時,應當取兩個模型中比較簡單的一個。模型的修正可以根據:

①因素載荷值的大小,考慮刪除載荷小的題目;

②考察有交叉載荷的題目,考慮刪除;

③結合修正指數的情況,進行模型的修改。5.驗證性因素分析中的模型評價與修正模型修正修正指數:是當模型與數據擬合不好的時候,基於數據提出的一種模型擬合改進的方法和指標。該值表示,如果估計這條路徑,模型擬合的整體卡方值會減小的數值。嵌套模型比較

然後,可以對差值進行卡方顯著性檢驗。

6.驗證性因素分析模型的應用效度檢驗結構效度總的來看,各項擬合指數都較好,說明測驗具有較好的結構效度,反之,說明測驗工具有待進一步修訂或理論構想有待於進一步完善。區分效度區分效度是指不同的潛變數之間存在區別的程度。如果潛變數的區分效度高,說明這個潛變數是獨特的,它包含了其他潛變數不能測量的東西。6.驗證性因素分析模型的應用信度檢驗信度可以定義為公共因素與觀測變數相關的平方,它表示在一個觀測變數的總方差中,能夠由公共因素所解釋的方差的比例。構想信度:潛變數所有觀測變數載荷的標準化平方和,除以它與誤差方差的和。6.驗證性因素分析模型的應用等價性檢驗測量等價性指的是,應用量表進行測量時,當觀測變數和潛在特質之間的關係在相比較的各個組之間等同時,就稱該量表具備測量等價性。模型1:因素模式相同模型(configuralmodel)模型2:因素載荷等價模型模型3:截距等價模型模型4:誤差的方差協方差矩陣等價模型模型5:潛變數的方差協方差矩陣等價模型模型6:潛變數均值等價模型7.驗證性因素分析應用案例及Mplus操作《高級心理統計》P190-199《高級心理統計》P200-2088.等價性檢驗應用案例及Mplus操作關鍵術語驗證性因素分析潛變數觀測變數T準則三指標準則二指標準則嵌套模型測量等價性因素模式相同模型因素載荷等價模型路徑分析

PathAnalysis1.一般目的和描述路徑分析是研究因果關係的一種統計方法,用於解釋一組變數之間的相關關係以及它們之間如何相互影響。路徑分析是一種“證實性技術”,而不是探索性技術。2.主要解決的問題2.1多元回歸的局限性多元回歸只是把所有的引數放在同樣的位置,來看待一整組引數對因變數的解釋和預測程度,無法分析和評價各個引數之間的關係?;貧w分析兼具有預測和解釋兩種功能,當研究的側重點是預測的時候,研究人員更重視的是全部引數的變化在多大程度上解釋了因變數的變化。當研究的側重點是解釋時,研究人員更希望瞭解的是引數是如何影響因變數的以及作用程度如何。在回歸模型中,可以通過偏回歸係數等結果來瞭解相關資訊。當研究人員將引數之間的相互作用考慮進來之後,引數除了對因變數有直接作用外,還可能通過其他變數對因變數產生間接作用。2.主要解決的問題2.2

路徑分析的研究問題路徑分析中X2、X4對X5的總效應和間接效應:在回歸方程模型中:X2對X5的回歸係數是0.16,X4對X5的回歸係數是0.393.模型和原理3.1基本概念3.2前提條件3.3模型的表示3.4基本步驟3.1基本概念3.2前提條件為了得到X影響Y(X→Y)的推論,還需要滿足以下所有條件:存在時間先後順序,即X在時間上先於Y;指定正確的因果方向,即指定X影響Y,而不是X和Y相關影響;X和Y之間的關係不是虛假相關,不會隨著第三變數被控制為常數後就消失。3.3模型的表示

3.3模型的表示

3.4基本步驟模型假設。根據充分的理論依據或實踐證據,對變數之間的因果關係進行指定;確定模型是否可識別。即電腦能否對模型參數進行估計得到唯一參數結果變數準備。根據所設定的模型,收集模型中所需要的變數數據,並進行數據清理;模型估計。選擇特定的電腦軟體根據設定的模型進行數據分析和參數估計,對估計結果進行模型擬合度評估、考慮等價可替換模型等方面的分析;進行模型評價和修正。在統計檢驗、理論假設與實際觀察三者的綜合考慮下不斷對模型進行修正,以期得到與實際數據擬合度最高的最佳模型。結果解釋與應用。根據最終得到的估計結果對實際問題進行分析和解釋。4.模型的分類和識別4.1路徑模型分類遞歸模型:因果關係結構中全部為單向鏈條關係,無回饋作用的路徑模型。非遞歸模型:變數之間存在多個方向的因果作用的路徑模型。非遞歸模型中的回饋回路可以分為間接回饋回路(圖a)、直接回饋回路(圖b)兩種類型

(a)間接回饋回路

(b)直接回饋回路4.模型的分類和識別飽和模型:在一個模型中,所有變數之間都有單向路徑或者表示相關的雙箭頭弧線所連接,也就是假設所有變數間都是有關系的,這種模型稱為飽和模型。那麼觀測值的數目為v(v-1)/2+v=v(v+1)/2(所有觀測變數方差和協方差的總數目)。飽和的遞歸模型是恰好識別的模型。非飽和模型:如果從飽和模型中剔除若干路徑,也就是說假設這些路徑係數為0,所形成的新模型則稱為非飽和模型。非飽和模型通常是超識別的模型,因此也可以說模型檢驗通常是對非飽和模型的檢驗。4.模型的分類和識別非遞歸模型的識別:遞歸模型都是可識別的,飽和的遞歸模型是恰好識別的模型。因此實際上並不存在檢驗遞歸模型是否可識別的問題。因此在路徑分析中,模型能否識別主要是針對非遞歸模型而言的。階條件:必要條件。Ev≥p-1,p為內源變數總數,Ev是某個內源變數沒有直接效應的變數數目;秩條件:充要條件,內源變數的方程餘子式Ci的秩等於p-1,證明這個方程可識別。大於是超識別。4.模型的分類和識別注意事項:1.對參數所施加的約束包括:(1)B被設定為一個對角線上元素為0的矩陣;(2)每個殘差與其對應的內源變數之間載荷限定為1,即殘差的均值和方差被限定到對應內源變數相同量尺上。2.階條件和秩條件適用於除了上述兩種基本約束條件外,對B,Γ,ψ矩陣未加額外約束的情況。3.對不可識別模型加一些限定條件使得模型達到識別。一般可以通過以下操作:(1)增加外源變數(2)設置工作變數4.模型的分類和識別注意事項:4.應注意的是:第一,如果外源變數間存在高相關,就不能輕易地將一個變數從方程中刪除,理想的情況是工具變數與其他外源變數是獨立的,因此找到一個好的工具變數往往並不容易。第二,相互間有因果關係的內源變數不能有同一個工具變數。5.求參數解的方法:模型類型是否識別可用方法遞歸模型可識別極大似然估計、線性代數、最小二乘法非遞歸模型可識別極大似然估計、未加權最小二乘法、兩階段最小二乘法、廣義最小二乘法5.效應分解及計算

5.效應分解及計算5.1效應分解的方法:路徑回溯方法1)根據研究需要選擇要進行效應分解的一對變數。2)由誰開始:當我們選定了要分解的一對變數之後,就需要確定路徑回溯的起始點。3)按照規則進行回溯。Duncan法則5.效應分解及計算5.2計算實例:遞歸模型5.效應分解及計算5.2計算實例:遞歸模型5.效應分解及計算5.3注意事項:非遞歸模型雖然迴圈回路的數目是無限的,但是所有效應值的和會趨近於一個常數。對迴圈回路中變數的自身效應進行分解和計算,橫向數據需要滿足平衡性。通過橫向

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論