SPSS原理及應(yīng)用課件_第1頁
SPSS原理及應(yīng)用課件_第2頁
SPSS原理及應(yīng)用課件_第3頁
SPSS原理及應(yīng)用課件_第4頁
SPSS原理及應(yīng)用課件_第5頁
已閱讀5頁,還剩269頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

SPSS原理及應(yīng)用吉林大學(xué)心理學(xué)系劉釗緒論:心理統(tǒng)計及SPSS概述什么是心理統(tǒng)計?1660年HermannConring

最先使用Statistik一詞。在三百多年前使用這個詞,指的是政府部門記錄人們出生和死亡信息的工作。現(xiàn)代意義的統(tǒng)計學(xué)是用以收集數(shù)據(jù)、分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則、方法。心理統(tǒng)計是一種用于心理學(xué)研究的工具。如何學(xué)習(xí)這門課程?關(guān)于統(tǒng)計學(xué)基礎(chǔ)學(xué)、悟、練的關(guān)系如何進行練習(xí)教材和參考書的使用統(tǒng)計學(xué)的主要思想(1)隨機性與規(guī)律性

統(tǒng)計把單獨的、隨機的事件置于規(guī)律性中,并揭示其變化的趨勢。個案分析:美國越戰(zhàn)征兵

73個較小的號碼分配給了前半年出生的人,110個較小號碼分配給了后半年出生的人,這意味著什么?統(tǒng)計學(xué)的主要思想(2)概率

概率是一個取值在0到1之間的數(shù),告訴我們某一特定事件發(fā)生的機會有多大。概率為從數(shù)據(jù)中取得結(jié)論奠定了基礎(chǔ)。我們永遠無法完全肯定兩個數(shù)字的差別是否超出了隨機性本身所預(yù)期的范圍,但我們可以確定這種差別發(fā)生的概率有多大。資料:為什么以P小于0.05作為評價差異是否顯著的標(biāo)準(zhǔn)?統(tǒng)計學(xué)的主要思想(3)變量變量是指可以取兩個或更多個可能值的特征、特質(zhì)或?qū)傩浴W兞康闹低ǔJ菍δ骋蕴囟▎卧亩攘浚@種單元通常被視為一個個體(element)。一個個體可以是一個人、一塊土地、一只動物、一種動物、一個國家等等,只要此個體對于數(shù)據(jù)的使用者而言是合適的,在分析過程中不會發(fā)生變化就行。統(tǒng)計方法的類別橫斷數(shù)據(jù)描述統(tǒng)計推斷統(tǒng)計多元統(tǒng)計縱向數(shù)據(jù)混合數(shù)據(jù)個案分析:心理學(xué)經(jīng)典研究中對統(tǒng)計方法的運用應(yīng)用統(tǒng)計時的常見錯誤

選擇了錯誤的樣本混淆統(tǒng)計聯(lián)系與因果聯(lián)系不分統(tǒng)計顯著與實際顯著的差別事后假設(shè)越級推斷過度推理統(tǒng)計錯誤案例LiteraryDigest對于1936年總統(tǒng)選舉結(jié)果的調(diào)查。(錯誤樣本)眼動對閱讀的影響的研究。(因果倒置)糙皮病的病因研究。(虛假相關(guān))證據(jù)集中原則

正視單個研究的不嚴(yán)謹(jǐn)理解證據(jù)集中原則實驗研究與相關(guān)研究的優(yōu)缺點

個案分析:如何能夠證明吸煙有害健康?思考題為什么要學(xué)習(xí)統(tǒng)計?心理統(tǒng)計不能做什么?不知戰(zhàn)之弊,不能盡知戰(zhàn)之利。——《孫子兵法》SPSS是什么?StatisticsPackageforSocialScience社會科學(xué)(適用于醫(yī)學(xué)、教育學(xué)、經(jīng)濟學(xué)、管理學(xué)、體育、社會學(xué)、人口學(xué)、心理學(xué)等多個學(xué)科)統(tǒng)計(進行統(tǒng)計分析的工具)軟件包(運用計算機軟件來實現(xiàn)統(tǒng)計分析過程)SPSS的系統(tǒng)運行方式窗口菜單運行管理方式程序運行管理方式混合運行管理方式SPSS的常用窗口及功能Data:數(shù)據(jù)編輯窗口,定義變量,錄入數(shù)據(jù),編輯、整理數(shù)據(jù)等;Output:輸出窗口,輸出統(tǒng)計圖表、出錯信息等;Syntax:語句窗口,編輯和運行SPSS程序;Chart:圖形編輯窗口,對圖形進行編輯、修改、打印;Help:幫助窗口。SPSS的菜單(1)SPSS12.0的菜單欄共有10個選項:File:文件管理菜單,用于文件的調(diào)入、存儲、顯示和打印等; Edit:編輯菜單,包括文本內(nèi)容的選擇、拷貝、剪貼、尋找和替換等;View:查看菜單,查看系統(tǒng)設(shè)置與狀態(tài)等;Data:數(shù)據(jù)管理菜單,有關(guān)數(shù)據(jù)變量定義、數(shù)據(jù)格式選定、觀察對象的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接、匯總等;SPSS的菜單(2)Transform:數(shù)據(jù)轉(zhuǎn)換處理菜單,有關(guān)數(shù)值的計算、重新賦值、缺失值替代等;Statistics:統(tǒng)計菜單,有關(guān)統(tǒng)計方法的應(yīng)用;Graphs:作圖菜單,有關(guān)統(tǒng)計圖的制作;Utilities:用戶選項菜單,有關(guān)命令解釋、文件信息、定義輸出標(biāo)題、窗口設(shè)計等;Windows:窗口管理菜單,有關(guān)窗口的排列、選擇、顯示等;Help:求助菜單,有關(guān)幫助文件的調(diào)用、查尋、顯示等。第一講

數(shù)據(jù)收集與數(shù)據(jù)文件管理選擇合適的變量為使研究的問題有結(jié)論,研究者必須清楚應(yīng)該測量什么樣的變量。然而,僅使用觀測數(shù)據(jù)來判斷哪些變量對其他變量有因果作用是非常困難的。沒有最好的方式去識別因果變量,對研究變量的選擇要同時考慮研究者的興趣及目的、研究結(jié)果有什么作用、對研究結(jié)果的解釋與其他解釋之間的關(guān)系等因素。思考:理科生比文科生更容易焦慮嗎?個案分析:達利和巴斯頓對助人行為的研究。定義變量數(shù)據(jù)收集的第一準(zhǔn)則是要清楚測量什么。

如果我們的思想模糊,響應(yīng)者的回答又不一致,那么我們的數(shù)據(jù)在含義上將會是極端不平衡的。所以在我們做研究之前,對變量必須有一個清晰、詳盡的定義。思考:家庭中有多少個孩子?個案分析:關(guān)于知識分子壽命長短的研究。關(guān)于知識分子壽命長短的研究1998年底,國家體委研究所發(fā)表的一篇關(guān)于中關(guān)村知識分子健康狀況的調(diào)查報告,統(tǒng)計后得出結(jié)論:中關(guān)村知識分子的平均死亡年齡為53歲。2004年7月,國家人事部、北京市人事局委托中國人民大學(xué)社會與人口學(xué)院組成課題組,進行中年高級專業(yè)技術(shù)人才的健康狀況調(diào)查,得到的結(jié)論是中關(guān)村死亡的知識分子的平均年齡是70歲。比中國普通人的壽命多出8歲。

如何選擇觀測數(shù)據(jù)的樣本隨機樣本vs.方便樣本總體的每個個體都有一個已知的機會(通常情況下是機會相等)被包含在樣本之中,這樣的樣本稱為隨機樣本(randomsample)。能夠很容易很經(jīng)濟地得到的樣本稱為方便樣本(conveniencesample)。用方便樣本推論總體情況要受到嚴(yán)格的條件限制。某些時候使用方便樣本進行研究就足夠了,然而大部分時候都需要使用隨機樣本。思考:為什么一些認知心理學(xué)的研究可以只選取幾個被試就推論總體?收集觀測數(shù)據(jù)時的誤差抽樣誤差:樣本與總體之間或多或少會存在一定的差異,這種差異的大小依賴于獲得樣本的方式和樣本容量大小。未響應(yīng)誤差(nonresponseerror):由于包含在樣本中的一部分人未回應(yīng)調(diào)查爾造成的誤差。響應(yīng)誤差(responseerror):指在調(diào)查過程中由于問題的提問方式、選項設(shè)置或訪員的影響而使響應(yīng)者在回答問題時產(chǎn)生的偏差。態(tài)度與行為之間未必一致。錯誤觀測數(shù)據(jù)的案例ShereHite關(guān)于結(jié)婚五年以上的女人中70%有婚外性生活的統(tǒng)計論斷。金西性學(xué)報告與海特性學(xué)報告。舒曼和普雷瑟《態(tài)度調(diào)查中的問題與答案》。Tide雜志對于《MetallicMetals法令》的民意調(diào)查。拉彼埃爾對于態(tài)度與行為關(guān)系的研究。如何獲得實驗數(shù)據(jù)實驗數(shù)據(jù)是指在實驗中控制實驗對象而收集到的變量的數(shù)據(jù)。操作定義

必須確切說明概念是如何被操作或測量的,以便其他人可以做重復(fù)實驗。實驗組和對照組(控制組)

接受實驗處理的組是實驗組;除了不接受實驗處理之外,與實驗組的處理完全相同的組是對照組。個案分析:小班教學(xué)的教育實驗。獲取實驗數(shù)據(jù)時的偏差及處理方法羅森塔爾效應(yīng)(皮格馬利翁效應(yīng))霍桑效應(yīng)安慰劑效應(yīng)單盲(singleblind)指的是在一個實驗中不告訴被試實驗的性質(zhì)及他們在哪個處理組中。雙盲(doubleblind)指的是評判者和被試對正在使用的實驗處理類型以及可能產(chǎn)生的效應(yīng)類型都不知情。數(shù)據(jù)文件的錄入與編輯數(shù)據(jù)格式變量的定義數(shù)據(jù)的輸入數(shù)據(jù)的剪切與復(fù)制計算賦值(Compute)重新編碼(Recode)轉(zhuǎn)換數(shù)據(jù)結(jié)構(gòu)(Transpose/Restructure)缺失值處理變量單元數(shù)據(jù)錄入練習(xí)數(shù)據(jù)實驗組1實驗組2對照組10111012101114129161210914713116141281510914137161212數(shù)據(jù)變量的測度等級分類變量(NominalVariable):其觀測值既無大小之分,又無等級或次序之分,僅是一種標(biāo)稱或類別。順序變量(OrdinalVariable):其觀測值盡管大小沒有特定意義,但屬于順序計量類型,適合于按照順序排列的變量。等距變量(IntervalVariable):其觀測值在某一范圍內(nèi)時,觀測值的大小和次序具有可比性,可以反映觀測值之間的大小差異。但該類變量的觀測值是在特定區(qū)間上有意義,超出該區(qū)間將沒有意義。等比變量(ScaleVariable):按照一定間隔、比例計量數(shù)據(jù)的變量類型,其觀測值“零”也是有定義的。觀測值之間可以進行加、減、乘、除的四則運算。思考:當(dāng)不同測度等級的數(shù)據(jù)相加時會得出什么樣的結(jié)果?核對數(shù)據(jù)文件當(dāng)數(shù)據(jù)量大的時候,出錯是必然的,沒有錯誤才是意外事件。絕對避免數(shù)據(jù)錯誤是不可能的,問題在于數(shù)據(jù)錄入錯誤對于分析結(jié)果會有多大的影響。對問卷和數(shù)據(jù)進行編碼查找特異值按訪員和錄入員抽查問卷練習(xí)題:數(shù)據(jù)結(jié)構(gòu)變換將練習(xí)數(shù)據(jù)轉(zhuǎn)化成為可以使用SPSS對三地區(qū)學(xué)生生理指標(biāo)進行比較的數(shù)據(jù)結(jié)構(gòu)。轉(zhuǎn)化后的數(shù)據(jù),身高以122.63厘米為分界區(qū)分為高\矮兩組;體重以22.23公斤為分界區(qū)分為輕\重兩組;胸圍以58.50為分界區(qū)分發(fā)育較好\發(fā)育較差兩組。第二講

描述統(tǒng)計與統(tǒng)計圖表的制作數(shù)據(jù)分析數(shù)據(jù)中包含大量的信息,以致我們無法全部理解數(shù)據(jù)的含義。因此,必須用一些方法從數(shù)據(jù)中提取重要信息并轉(zhuǎn)化成便于使用的形式,這就是數(shù)據(jù)分析。數(shù)據(jù)分析通常包含下列三種活動中的一種或多種:

1、為數(shù)據(jù)做一個圖(graph);

2、為數(shù)據(jù)制一個表(table);

3、從數(shù)據(jù)中計算(compute)出一些東西。簡化的收益與損失所有數(shù)據(jù)分析方法都包含一定程度的簡化,簡化使得理解數(shù)據(jù)和從數(shù)據(jù)中提取信息變得更容易。簡化帶來收益的同時也必然伴隨著丟失信息的損失,在分析數(shù)據(jù)時,我們需要在簡化和完全這兩個互相沖突的目標(biāo)之間尋求平衡點。集中量數(shù)和差異量數(shù)一組變量的次數(shù)分布至少有兩方面的基本特征:中心位置和離散程度。描述數(shù)據(jù)集中趨勢的統(tǒng)計量稱為集中量數(shù)。集中量數(shù)包括:平均數(shù)、中數(shù)、眾數(shù)等。描述數(shù)據(jù)間彼此差異程度的統(tǒng)計量稱為差異量數(shù)。差異量數(shù)包括:全距、四分位距、平均差、方差、標(biāo)準(zhǔn)差等。偏度與峰度偏度(skewness):描述某變量所有變量值分布形態(tài)的偏斜程度和方向的統(tǒng)計量。偏度為0表示對稱;大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大于均值;小于0表示負偏差大(左偏)。峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計量。峰度為0表示與正態(tài)分布峰度相同;大于0表示比正態(tài)分布陡,尖峰;小于0表示比正態(tài)分布緩,平峰。標(biāo)準(zhǔn)得分標(biāo)準(zhǔn)得分是用某一觀測值減均值所得的差除以標(biāo)準(zhǔn)差所得的值。不同變量一般有不同的平均數(shù)和標(biāo)準(zhǔn)差。在統(tǒng)計上,均值和標(biāo)準(zhǔn)差不同時,一個變量的值不能與另一個變量值相比較。思考:如何比較葡萄和西瓜的大小?描述統(tǒng)計(DescriptiveStatistics)頻次分析(Frequencies)描述統(tǒng)計量(Descriptives)探索分析(Explore)多維頻數(shù)分布交叉表(Crosstabs)思考:如果對連續(xù)變量進行頻次分析會出現(xiàn)什么效果?注意:這里可以將變量轉(zhuǎn)化成標(biāo)準(zhǔn)分如何處理問卷中的多選題平時我們所說的多選題更多是指不定項選擇題,這種情況需要使用虛擬變量加以處理。多選題的另外一種情況是規(guī)定選擇多個選項,這種情況下,規(guī)定選擇幾個選項就設(shè)定幾個變量,然后使用Crosstabs過程加以處理。定項多選題練習(xí)數(shù)據(jù)第一選項第二選項第三選項DEBEFAADCDBCAFDBECCDA在這里可以計算皮爾遜卡方評判好圖表的標(biāo)準(zhǔn)制作統(tǒng)計圖表的目的是幫助研究者從數(shù)據(jù)中提取信息和把信息傳遞給別人。正確的圖表傳達了正確的信息。好圖表得兼顧簡化數(shù)據(jù)和避免數(shù)據(jù)遺失雙重目的。制作統(tǒng)計圖條形圖(Bar)餅形圖(Pie)散點圖(Scatterplot)直方圖(Histogram)箱體圖(Boxplot)莖葉圖(Stem&Leaf)練習(xí)題:統(tǒng)計圖表的使用1、美、日、歐汽車的耗油量。2、不同汽缸數(shù)汽車的發(fā)動機排氣量。3、汽車的功率與扭矩之間的關(guān)系。4、美國汽車有什么樣的特點。第三講

抽樣分布與參數(shù)估計概率分布離散變量的概率分布二項分布、泊松分布連續(xù)變量的概率分布正態(tài)分布、T分布、F分布、χ2

分布總體分布與抽樣分布總體分布:個體某特征值的分布狀況。正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布抽樣分布:樣本統(tǒng)計量的分布狀況。抽樣分布是統(tǒng)計推論的重要依據(jù)。樣本平均數(shù)的分布:均值μx=μ

方差σx2=σ2/n

參數(shù)估計樣本統(tǒng)計量是從樣本數(shù)據(jù)中計算出來的數(shù)。總體參數(shù)是在原理上可以從整個總體中計算出來的數(shù)。點估計是一個用來估計總體參數(shù)的數(shù)。區(qū)間估計是估計的是參數(shù)的取值范圍。很多情況下,我們都需要通過樣本的統(tǒng)計量對總體參數(shù)進行估計。好估計值的標(biāo)準(zhǔn)無偏性:用多個樣本的統(tǒng)計量作為總體參數(shù)的估計值,其偏差的平均數(shù)為0。有效性:同為無偏估計值,抽樣分布的方差越小越好。一致性:當(dāng)樣本容量增大時,估計值能夠逐漸趨近于真值。充分性:樣本統(tǒng)計量是否充分地反映了樣本中全部數(shù)據(jù)的信息。個案分析:德軍有多少坦克?區(qū)間估計一個總體參數(shù)的置信區(qū)間是用一個樣本統(tǒng)計量加、減抽樣誤差得到的。樣本中的觀測值個數(shù)影響置信區(qū)間的長度。大樣本的置信區(qū)間短,小樣本的置信區(qū)間長。置信水平影響置信區(qū)間長度。低置信水平的置信區(qū)間短,高置信水平的置信區(qū)間長。注意:95%置信區(qū)間中包含真值的可能性是95%嗎?第四講假設(shè)檢驗假設(shè)與假設(shè)檢驗進行研究時需要先提出研究假設(shè),但統(tǒng)計學(xué)中無法對研究假設(shè)的真實性直接檢驗,因而需要建立一個與之對立的假設(shè)。H0:虛無假設(shè)(nullhypothesis)H1:備擇假設(shè)(alternativehypothesis)每一實驗的存在,僅僅是為了給事實一個反駁虛無假設(shè)的機會。——費舍(Fisher)假設(shè)檢驗的兩類錯誤接受H0

拒絕H0H0

為真正確接受α錯誤

H0為假

β錯誤

正確拒絕樣本統(tǒng)計量的差別可能代表了總體上確有差異,也可能是由于抽樣誤差造成的。經(jīng)過檢驗,如果所得差異超過了統(tǒng)計學(xué)規(guī)定的誤差限度,則表明這種差異具有統(tǒng)計學(xué)意義。在實際研究中,出于研究目的的考慮,更多關(guān)注的是α錯誤。增大樣本量是同時降低兩類錯誤的有效方法。假設(shè)檢驗的步驟建立虛無假設(shè)和備擇假設(shè)在H0成立的前提下,確定合適的統(tǒng)計量及其抽樣分布,并計算統(tǒng)計量的值。選定顯著性水平,根據(jù)相應(yīng)的分布情況確定臨界值,以便區(qū)分H0拒絕區(qū)間和接受區(qū)間。對H0做出判斷和解釋。幾種T檢驗的計算方法檢驗樣本是否來自某一總體檢驗兩個獨立樣本所代表的總體之間是否存在差異檢驗兩個相關(guān)樣本所代表的總體之間是否存在差異平均數(shù)比較(CompareMeans)單樣本T檢驗(One-SampleTTest)獨立樣本T檢驗(Independent-SamplesTTest)配對樣本T檢驗(Paired-SamplesTTest)已知的總體平均數(shù)思考:如果把分類變量放入這個窗口會出現(xiàn)什么效果?這個按鈕可以翻頁,以此能夠了解多個分類變量交叉后各個單元格的平均數(shù)。練習(xí)題:T檢驗被試在實驗中是否出現(xiàn)了過度自信?在估計得分、實際得分、過度自信上是否存在性別差異?被試在實驗中的估計得分和實際得分之間是否存在差異?思考:在做上述練習(xí)中發(fā)現(xiàn)了什么情況?這是否是巧合使然?第五講

實驗設(shè)計與方差分析T檢驗到方差分析T檢驗用于多組平均數(shù)比較的缺陷兩兩比較非常煩瑣有可能增加α錯誤

方差分析的虛無假設(shè)μ1=μ2=…=μk思考:方差分析的備擇假設(shè)是什么?方差分析的基本原理(1)假設(shè)所有抽樣樣本屬于同一總體,則總變異可以分解為兩部分:組內(nèi)變異(隨機因素),組內(nèi)各案例關(guān)于組平均值的分布離散程度。組間變異(控制因素),各組平均值關(guān)于總平均值的分布離散程度。組間變異均方差除以組內(nèi)變異均方差以后的統(tǒng)計量服從F分布。方差分析的基本原理(2)方差分析的目的是要分析觀測變量的變異是否主要是由控制因素造成還是由隨機因素造成的,以及控制變量的各個水平是如何對觀測變量造成影響的。當(dāng)F值較大時,說明由控制因素造成的變異顯著大于隨機因素造成的,也就是說不同水平下的各總體均值有顯著差異。方差分析的適用條件各樣本相互獨立因變量取值服從正態(tài)分布方差齊性因變量為連續(xù)變量影響因素為非連續(xù)變量在SPSS中實現(xiàn)方差分析單因素方差分析(One-wayANOVA)多因素方差分析(Univariate)協(xié)方差分析(analysisofcovariance)多元方差分析(Multivariate)常見實驗設(shè)計完全隨機設(shè)計區(qū)組設(shè)計析因設(shè)計拉丁方設(shè)計被試內(nèi)設(shè)計混合實驗設(shè)計在完全隨機設(shè)計的方差分析中,進行方差齊性檢驗是必需步驟,如果方差不齊則進行的方差分析是無效的。當(dāng)F值顯著時,必須進行平均數(shù)的多重比較,以便了解影響因素如何產(chǎn)生影響。多重比較方法的選擇一般可以參照如下標(biāo)準(zhǔn):如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較,宜用Bonferroni法或LSD法;若需要進行的是多個均數(shù)間的兩兩比較(探索性研究),且各組個案數(shù)相等,適宜用Tukey法;其它情況宜用Scheffe法。在多因素方差分析的窗口中只選入一個影響因素,其效果與平均數(shù)比較菜單中提供的單因素方差分析一樣。在多因素方差分析菜單中,這里可以進行方差齊性檢驗,但在進行多因素方差分析或隨機區(qū)組設(shè)計時,方差齊性檢驗僅僅作為參考,不再是一個重要指標(biāo)。這個彈出菜單提供多重比較。模型選擇菜單是一個非常重要的菜單,不同的實驗設(shè)計所采用的不同方法,有些時候僅僅是在這里做了不同的設(shè)置而已。想對模型進行自定義設(shè)置,先選這里。這里用于選擇在模型中分析哪些因素及其交互作用。一般不需要修改,但在有空單元格時要改成TypeIV為什么有固定因素和隨機因素兩個窗口?隨機區(qū)組設(shè)計在模型選擇的時候只選入?yún)^(qū)組的主效應(yīng),不加入?yún)^(qū)組與影響因素的交互作用。思考:如果發(fā)現(xiàn)區(qū)組作用并不顯著,能否去掉區(qū)組因素進行分析?析因設(shè)計的分析方法析因設(shè)計時,交互作用也都被考慮在影響之內(nèi),所以對析因設(shè)計的數(shù)據(jù)進行方差分析就是使用飽和模型進行多因素方差分析。但在影響因素比較多時,常常不考慮高階的交互作用。思考:假設(shè)我做了一個四因素的析因設(shè)計,僅考慮主效應(yīng)和二階交互作用,可否把四個因素兩兩配對以二因素飽和模型進行分析?拉丁方設(shè)計的特別之處在拉丁方設(shè)計中,有兩個可以作為分母(隨機變異參照標(biāo)準(zhǔn))的值:單元格內(nèi)誤差和殘差。單元格內(nèi)誤差是毫無疑問的隨機變異,殘差卻不一定是。使用SPSS進行統(tǒng)計分析時,分母默認為殘差。而使用殘差作隨機變異的參照標(biāo)準(zhǔn),有時會把影響因素的效應(yīng)估低。協(xié)方差分析需要控制和排除影響的因素,在統(tǒng)計分析中稱為協(xié)變量。協(xié)方差分析(analysisofcovariance)是用來消除協(xié)變量影響的分析方法。協(xié)方差分析的基本思想是在做平均數(shù)比較之前用直線回歸的方法找出因變量與協(xié)變量之間的數(shù)量關(guān)系,然后用方差分析比較假定協(xié)變量取值相等時的修正均數(shù)之間有沒有差異。在這里加入?yún)f(xié)變量。思考:如果協(xié)變量作用不顯著,能否把協(xié)變量去掉進行分析?方差分析中的注意事項要不要做方差齊性檢驗使用何種方法進行事后比較正確認識交互作用多元方差分析適用條件:一元方差分析的所有條件各因變量之間存在一定關(guān)系總樣本和單元格內(nèi)樣本都更大分析工具:Multivariate菜單因變量的位置可以加入多個變量多元方差分析的最主要指標(biāo)多元方差分析的輸出結(jié)果,除多元方差分析表外,所有的內(nèi)容都與做多次一元方差分析相同被試內(nèi)設(shè)計及混和設(shè)計在實驗中,每個被試僅接受一個實驗處理,稱為被試間設(shè)計。實驗中每個被試都接受一個變量的所有處理水平,稱為被試內(nèi)設(shè)計。這種設(shè)計能夠更好的控制被試的個體差異。在多因素實驗設(shè)計中,即包含重復(fù)測量因素,又包含非重復(fù)測量因素,稱為混和設(shè)計。處理被試內(nèi)設(shè)計和混和設(shè)計使用RepeatedMeasures菜單。這個數(shù)字由自己填寫,是重復(fù)測量的次數(shù)。填寫好測量次數(shù)后,點擊這個鍵。加入重復(fù)測量的變量后,點擊這個鍵對各次測量進行詳細說明。第六講

相關(guān)分析與回歸分析積差相關(guān)(皮爾遜相關(guān))適用條件:兩列變量都是連續(xù)變量兩列變量所來自的總體必須是正態(tài)分布或者近似正態(tài)的對稱單峰分布兩列變量必須具備一一對應(yīng)關(guān)系等級相關(guān)(斯皮爾曼相關(guān))適用條件:兩列具有等級順序的測量數(shù)據(jù)或者總體為非正態(tài)的連續(xù)變量在使用小樣本,或者樣本中有不能刪除的極端值時使用等級相關(guān)效果優(yōu)于積差相關(guān)。Correlate-Bivariate稱名(標(biāo)識)變量的相關(guān)分析質(zhì)量相關(guān)及其與假設(shè)檢驗的關(guān)系點雙列相關(guān)雙列相關(guān)偏相關(guān)分析作用:判斷中介變量確定兩個變量之間的“純”關(guān)系Correlate-Partial

Distances過程調(diào)用此過程可對變量內(nèi)部各觀察單位間的數(shù)值進行距離相關(guān)分析,以考察相互間的接近程度;同時也可對變量間進行距離相關(guān)分析。Correlate-Distances回歸分析的基本原理嚴(yán)格來說,回歸分析是對自變量與因變量之間的統(tǒng)計關(guān)系進行量化描述的方法。了解變量間關(guān)系的最好方法是觀察散點圖,便于更有效的提取信息,可以通過簡單函數(shù)擬合散點。如果使用某個函數(shù)來擬合散點,可以比單純的用參數(shù)進行估計取得更好的預(yù)測作用,則說明這個擬合函數(shù)是有效的。線性回歸模型的假設(shè)條件方差齊性誤差項間相互獨立、無自相關(guān)誤差項與自變量之間相互獨立殘差成正態(tài)分布自變量與因變量均為連續(xù)變量變量間成線性關(guān)系自變量間不相關(guān)Linear過程因變量自變量這里提供了6種進行回歸運算的方法,常被我們用到的是Enter和Stepwise兩種方法。這里可以把自變量定義成不同的組別。對回歸模型的檢驗回歸系數(shù)/偏回歸系數(shù)標(biāo)準(zhǔn)化回歸系數(shù)/標(biāo)準(zhǔn)化偏回歸系數(shù)確定系數(shù)/偏確定系數(shù)調(diào)整后的確定系數(shù)對回歸方程的方差分析選取的回歸運算方法R2體現(xiàn)的是因變量的變異能夠被回歸方程解釋的比例。衡量模型應(yīng)該收入幾個變量以調(diào)節(jié)后的R2不再增加為準(zhǔn)。標(biāo)準(zhǔn)化偏回歸系數(shù)反映的是自變量對因變量的影響程度。F值用于檢驗整個回歸方程是否有效。偏回歸系數(shù)反映自變量變化一單位時因變量的變化情況。現(xiàn)實意義上的影響統(tǒng)計意義上的影響回歸分析的常見問題自相關(guān)強影響點變量間非直線關(guān)系多重共線性杜賓-瓦特森檢驗可以作為判斷是否出現(xiàn)自相關(guān)的指標(biāo)。取值范圍為0-4,值越靠近2越能夠說明沒出現(xiàn)自相關(guān)殘差診斷指標(biāo)可以尋找強影響點。判斷強影響點還可以通過做散點圖來實現(xiàn)。如果標(biāo)準(zhǔn)化殘差很大(一般以超過+/-2為標(biāo)準(zhǔn)),則相應(yīng)數(shù)距離回歸直線遠,可能是強影響點用因變量的觀測值與標(biāo)準(zhǔn)化殘差做的散點圖可以用于分析自變量與因變量之間的關(guān)系是不是線性的。用散點圖也可以判斷自變量與因變量之間的關(guān)系是不是線性的。散點散布于圖內(nèi)說明殘差分布符合假設(shè),自變量與因變量是線性關(guān)系如果能夠在圖中看出散點分布有一定趨勢說明線性回歸模型可能會有問題如何判定是否出現(xiàn)了多重共線性自變量之間的相關(guān)非常高容忍度的值比較小增減模型中的變量時,模型各項指數(shù)的波動非常大整個模型作用顯著,所有自變量的偏作用都不顯著容忍度可以作為評判是否出現(xiàn)多重共線性的一個重要指標(biāo)。容忍度取值范圍從0-1,值越小越表明可能出現(xiàn)了多重共線性。多重共線性的解決方法刪除不太重要或者測量誤差比較大的共線性因子進行主成分分析,用提取出的主成分代替原變量進行分析使用基于最小一乘法的嶺回歸進行分析使用路徑分析回歸分析中虛擬變量的使用連續(xù)變量的降維使用從非連續(xù)變量到虛擬變量的轉(zhuǎn)化虛擬變量的在回歸方程中的實際意義虛擬變量在回歸方程中的使用回歸方程中體現(xiàn)交互作用方差分析與回歸分析的關(guān)系回顧方差分析與回歸分析的基本原理用回歸分析的方法進行方差分析用方差分析的方法進行回歸分析思考:方差分析與回歸分析的互相替代說明了什么問題?第七講

因子分析與主成分分析主成分分析的基本原理嚴(yán)格來說,主成分分析只是一種中間手段,其作用為簡化數(shù)據(jù)。主成分分析不能作為研究結(jié)果,應(yīng)該在進行主成分分析之后繼續(xù)使用其他多元統(tǒng)計方法進行分析。主成分分析所使用的方法是通過線性變換將原來的多個指標(biāo)組合成相互獨立的少數(shù)幾個能夠反映出大部分信息的指標(biāo)。因子分析的基本原理因子分析有探索性因子分析和驗證性因子分析兩種。其中探索性因子分析的主要作用是簡化數(shù)據(jù)和探索數(shù)據(jù)結(jié)構(gòu);驗證性因子分析的作用是對數(shù)據(jù)結(jié)構(gòu)的先在假設(shè)進行檢驗。因子分析使用的方法是分解原始變量,通過相關(guān)找出潛在的“類別”,把每一類變量看作一個共同因子,從此確定數(shù)據(jù)結(jié)構(gòu)。對樣本量的要求主成分分析對于樣本量沒有嚴(yán)格的要求,只要把需要進行分析的樣本都用于進行主成分分析即可。因子分析理想的樣本量是樣本數(shù)為變量數(shù)的10~25倍,考慮到因子分析時的變量數(shù)通常很多,5~10倍的樣本量也可以使用。在輸出結(jié)果中增加觀測變量的描述統(tǒng)計結(jié)果和相關(guān)矩陣KMO和Bartlett球形檢驗是分辨數(shù)據(jù)能否進行因子分析的一個重要指標(biāo)KMO取值范圍從0到1,值越大越適合進行因子分析,可允許的最小值沒有確定的標(biāo)準(zhǔn)公因子方差指觀測變量能夠被公因子所解釋的變異占總變異的百分比公因子貢獻率指一個公因子能夠解釋所有觀測變量總變異的百分比特征根的含義是公因子能夠解釋的變異是一個觀測變量變異的多少倍因子負荷矩陣,也就是公因子與觀測變量的相關(guān)矩陣SPSS中提供了7種提取公因子的方法,默認的方法是主成分分析,一般情況下選用默認的方法就可以輸出結(jié)果中加入碎石圖,碎石圖可以作為截取公因子時的重要參照截取公因子的方法,可使用特征根大于特定值或者指定公因子數(shù)目兩種方法截取碎石圖截取公因子的標(biāo)準(zhǔn)特征根大于1公因子累積貢獻率達到一定水平碎石圖的拐點去掉因子負荷大于0.5非常少的因子如果想把因子分存儲下來用于進一步分析,可以把這個選項選上在數(shù)據(jù)文件中新生成的兩個變量就是提取出的公因子的因子分選擇是否進行因子旋轉(zhuǎn)的菜單,這里面提供了三種正交旋轉(zhuǎn)和兩種斜交旋轉(zhuǎn)的方法,默認值為不進行旋轉(zhuǎn)。因子分析中的正交旋轉(zhuǎn)方法Varimax

方差最大法只有少數(shù)幾個變量在某個因子上有較高的負載,其他變量在這個因子上的負載盡可能低。該方法強調(diào)對因子的解釋的簡潔性。Quartimax四次方最大法每個變量只在某一個因子上有較高的負載,在其他的因子上有盡可能低的負載。該方法強調(diào)了對變量解釋的簡潔性。Equamax等量最大法等量最大法是上面兩種方法的加權(quán)平均。選擇最常用的方差最大法進行正交旋轉(zhuǎn)。呈現(xiàn)因子負荷圖因子轉(zhuǎn)換矩陣因子轉(zhuǎn)換矩陣就是旋轉(zhuǎn)前的公因子與旋轉(zhuǎn)后的公因子之間的相關(guān)矩陣未旋轉(zhuǎn)時的因子負荷圖。正交旋轉(zhuǎn)后的因子負荷圖因子分析中的斜交旋轉(zhuǎn)斜交旋轉(zhuǎn)與正交旋轉(zhuǎn)所不同的是各因子間不一定相互獨立。在不旋轉(zhuǎn)或正交旋轉(zhuǎn)時,因子負荷矩陣也就是公因子與觀測變量之間的相關(guān)矩陣。但在斜交旋轉(zhuǎn)時,這兩個矩陣有所差別。因子模式矩陣是因子負荷矩陣,而因子結(jié)構(gòu)矩陣是指因子與觀測變量之間的相關(guān)矩陣。因子模式矩陣因子結(jié)構(gòu)矩陣斜交旋轉(zhuǎn)的公因子的相關(guān)矩陣斜交旋轉(zhuǎn)后的因子負荷圖因子分析的一般步驟KMO與Bartlett`s球型檢驗進行分析,按一定標(biāo)準(zhǔn)提取公因子如果進行主成分分析則將主成分存為新變量用于繼續(xù)分析;如果進行因子分析則考察公因子的實際意義,如有必要還需要進行因子旋轉(zhuǎn),以尋求對因子的最佳解釋。如有必要可以計算因子得分等中間指標(biāo)供進一步分析使用。選上后,因子負荷矩陣按照負荷大小排序低于特定值的因子負荷不顯示不排序并顯示所有因子負荷排序、不顯示比較小的因子負荷驗證性因子分析簡介在尋找公共因子的過程中,是否利用先驗信息,產(chǎn)生了探索性因子分析和確定性因子分析的區(qū)別。探索性因子分析是在事先不知道影響因素的基礎(chǔ)上,完全依據(jù)資料數(shù)據(jù),以一定的原則進行因子分析,最后得出因子的過程。而驗證性因子分析充分利用了先驗信息,是在已知因子的情況下檢驗所搜集的數(shù)據(jù)資料是否按事先預(yù)定的結(jié)構(gòu)方式產(chǎn)生作用。因此探索性因子分析主要是為了找出影響觀測變量的因子個數(shù),以及各個因子和各個觀測變量之間的相關(guān)程度;而驗證性因子分析的主要目的是決定事前定義因子的模型擬合實際數(shù)據(jù)的能力。

兩種因子分析的比較第八講

統(tǒng)計分析在量表修訂中的運用平行測試?yán)碚摦?dāng)前常用的量表大多數(shù)都建立在平行測試假設(shè)的基礎(chǔ)之上。量表實際測量的是一個潛在變量,而量表中的各個題項是這個潛在變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論