




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SPSS基礎/數據篩選課堂安排答問題選擇課堂討論方法科研課題數據庫SPSS基礎數據篩選打開SPSS(OpeningSPSS)開始(Start)→所有程序(AllPrograms)→SPSSInc→SPSS17.0→SPSS16.0打開數據文件(Opening
Data)文件(File)
打開(Open)
數據(Data)數據編輯器(DataEditor)數據編輯器(DataEditor) Spreadsheet-likesystemfordefining,entering,editing,anddisplayingdata.Extensionofthesavedfilewillbe“sav.”文件擴展名是“sav”輸出瀏覽器(OutputViewer)OutputViewer
運行結果,包括運行錯誤(Displaysoutputanderrors.Extensionofthesavedfilewillbe“spv.”)默認窗口(DefaultWindow)DataEditor(數據編輯器)Therearetwosheetsinthewindow(有兩頁):
數據頁(Dataview)visiblewhenyoufirstopentheDataEditor2.Variableview(變量頁)
數據視圖
數據視圖(Dataview)變量頁窗口(VariableViewwindow)記錄變量輸入情況(Thissheetcontainsinformationaboutthedatasetthatisstoredwiththedataset)
Name(名稱)1stcharactermustbealphabetic(第一個必須是字母)Variablenamesmustbeunique,characters≤64.(不能重復,《64字符)SpacesareNOTallowed.(不能有空格)變量頁窗口:類型(VariableViewwindow:Type)類型(Type)界定變量類型(Thiscolumnenablesyoutospecifythetypeofvariable.)數字和字串(Basictypes:numericandstring.)
變量頁窗口:寬度
VariableViewwindow:Width寬度(Width)64字符(#ofcharactersallowedtobeenteredforthevariable)變量頁窗口:小數點位數(VariableViewwindow:Decimals)小數點位數(Decimals)#ofdecimals≤16變量頁窗口:注釋
VariableViewwindow:Label變量注釋(Label)注釋每一個變量的含義(Specifythedetailsofthevariable)256個字符(#ofcharacters≤256)變量頁窗口:值(VariableViewwindow:Values)值(Values)whichnumbersrepresentwhichcategorieswhenthevariablerepresentsacategory定義變量(Definingthevaluelabels)點價值選項(Clickthecellinthevaluescolumn)最多60字符(Upto60characters)點ok選項(AfterdefiningthevaluesclickaddandthenclickOK.)數據類型、測量級別和變量列表圖標顯示在對話框列表中的變量旁邊的圖標提供有關變量類型和測量級別的信息練習1(Practice1)HowwouldyouputthefollowinginformationintoSPSS?“1”representsMaleand“2”representsFemale練習1-答案
[Practice1(SolutionSample)]練習1-答案選擇要用的數據保存文件另存為
點擊--變量
新的文件名對數據進行排序(Sortingthedata)數據
排序(“Data”
“SortCases”)對數據進行排序[Sortingthedata(cont’d)]點“變量名”(DoubleClick“Nameofthestudents”.)練習2(Practice2)如何對“身高”數據進行下降式排序(Howwouldyousortthedatabytheheightofstudentsindescendingorder?)轉換數據(Transformingdata)轉換數據
‘計算變量(Transform”“ComputeVariable…”)轉換數據(Transformingdata)(cont’d)Example:Addanewvariablenamed“lnheight”whichisthenaturallogofheightTargetVariable(newname):typein“lnheight”UnderFunctiongroupselect“Arithmetic”,thenselect“Ln”Click“Height”overtothe“NumericExpression”box轉換數據Transformingdata(cont’d)Anewvariable‘lnheight’isaddedtothetable練習3(Practice3)創建一個新變量–身高的平方(Createanewvariablenamed“sqrtheight”whichisthesquarerootofheight.)數據篩選的目的對于各個研究變量,應使用足夠的數據過濾方法,以便在進行數據分析前找出(并剔除)錯誤錄入的、缺失的、或混亂的數據???數據錄入檢查適當的數據過濾第一步通常包括確認數據被正確地錄入
分別檢查每個人的數據錄入
適用于數據集合小或者數據檢查步驟適當
而如果數據集合很大代價則可能很昂貴,因此使用時要很小心…檢查數據的范圍,以及簡單的頻率計數需要檢查缺失的數據是否隨機如果缺失的數據少于5%,無需擔心系統性地缺失數據如果多于5%,則需要判定缺失的數據是否隨機–系統性地缺失數據會影響分析.家例如,如果女性沒有回答問題的話,就是一種系統性缺失數據的情況–無法檢查女性面對缺失數據的情況刪除:當樣本數量不是問題,缺失數據量也不大時,使用此方法插補:當樣本數量已經不大時,使用全面排除刪除SPSS將不包括那些分析變量存在缺失值的數據組(研究對象)如進行單變量分析,完全排除刪除法即簡單地分析現有的數據.如進行多變量分析,完全排除刪除法將排除那些其中任一變量有缺失值的數據組(研究對象)全面排除刪除—問題一個壞處是造成了數據丟失:因為排除了研究對象的全部數據,而研究對象可能回答了部分問題,雖非全部(比如部分沒有數據).這樣一來,減少了樣本數量
缺失數據的特征/規律:進行全面數據組分析基于缺失數據是隨機的這一假設
完備的數據組分析使用全面排除刪除法的話,僅使用了這一數據組配對刪除SPSS將包括全部可用數據.與完全排除刪除法將只要有分析變量有缺失值即排除數據(研究主題)不同,配對刪除法僅僅將這些缺失值從分析中排除而非整個數據組配對刪除換句話說,所有可用的數據都用了.如果你在做多個變量的相關性,而一些變量有缺失值,那么SPSS將在全部可用的數據點間進行二元相關,而僅僅忽略那些缺失值.在這一情況下,配對刪除法造成的結果將是對于每一個相關有不同的樣本大小.配對刪除配對刪除–優點當樣本量小或缺失值多的時候,配對刪除法是有用的,因為可使用的數值并沒有那么多,那為什么要使用完全排除刪除法去省略更多呢配對刪除–缺點在進行多元回歸、因素分析、或者結構方程建模時不要使用此方法,由于有相當程度的可變性、甚至偏差提示為更好地理解完全排除刪除法和配對刪除法對于你的結果可能造成什么影響,可以試試分別用兩種方法做同樣的測試.結果有變化嗎?另外,很重要的,請務必記取,對于你進行的每一類測試,你需要鑒定SPSS是使用完全排除刪除還是配對排除刪除.大多數測試允許你選擇你的喜好提示總是檢查你在每一個分析中使用的數據組數目,并以此確定是使用了配對排除還是全面排除刪除法
在SPSS中,如果你不明確你的喜好,將使用配對排除法刪除數據組處理缺失數據–插補法插補(替換而非刪除缺失數據)變量均值插入–最常用且最保守的方法.問題–減少方差子組均值插入–如果你對數據進行了分組,那么用研究對象所在組的平均值,而不是用全部樣本的平均值,替換缺失值處理缺失數據回歸–根據其它變量的分數,預測一個研究對象的某一變量的缺失值.可反復使用.反復使用的意思是重復這一過程,直至估計值穩定這是一個更好的也更復雜的方法,但也存在問題–過度擬合處理缺失數據插補(替換缺失數據)估計最大化(EM)算法–這是一種最大可能性疊代估計方法
多重插補–如前所述,使用多種方法,計算平均估計值
這樣做的好處是你同時得到了這一估計值的一個標準誤差估計推薦當僅存在少量缺失值,以及樣本數量比較大時,使用數據組完全排除刪除法當缺失值比例小時,使用平均值代替以及回歸插補可能時,使用SPSS遺漏值分析異常值技術上說是一個遠離分布的數據點;因此是潛在有害的,因為對于分布可能造成抵消的影響異常值-單變量首先總需要檢查數據是否錄入正確以兩種方法判斷如果某一數據點與分布中的其它數據點不相聯系,它是異常值如果Z-score>3.3,該數據是異常值
異常值-指數杠桿作用–一個數據組與其余的數據距離有多遠差異–一個數據點與其余的數據相符合的程度影響–如果一個數據組被刪除后,在回歸方程(Bs)中變化的數量.作為杠桿作用和差異的組合計算得到異常值處理單變量異常值一旦發現異常值對數據組進行調查,看是否有跡象顯示這一數據組并非你所希望的樣本的組成如果確非,刪除這一數據組
減小異常值的影響移動數值,使其向分布的其余部分貼近,同時仍使其保持極值多元異常值的檢測研究對象的評分,作為單變量來看,不一定是一個異常值;但作為變量組合來看,是一個異常值
“作為一個十幾歲的孩子是正常的,一年掙$50,000是正常的,但一個十幾歲的孩子一年掙$50,000則是一個多元異常值多元異常值的檢測馬氏距離(M距)–用于衡量與質心(由所有的變量的方式所產生的多元分布的中心)
間的偏移計算氏距離,你得到一個
2
(chisquare)分布
2(df=#變量),查找臨界值(withα=.001)如MD>CV參與者是一個多元異常值一般對于發現的多元異常值,基本上只能刪除檢查數據分布頻率表
直方圖和條形圖數據重新編制一些變量需要進行重新編制/分組(比如刪除,重分組)以進行適當地分析,因為樣本數量極大地影響統計效能正態性所有連續數據遵循正態分布曲線偏度(單變量)–描述數據分布
(i.e.,分布的對稱性;偏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物化學(第4版)課件 第2章 核酸化學
- 氣候變化所致小島國損失損害補償責任問題研究
- 基于STSE教育理念的初中化學金屬和金屬材料的教學實踐研究
- 下雨天安全教育
- 關愛婦女心理健康:現狀與行動指南
- 頸椎間盤的護理課件
- 爆炸安全知識培訓
- 人事勞資培訓
- 項目管理人員安全教育培訓
- 項目介紹課件模版
- 毀林毀草違規行為集中整治實施方案
- 日本2025年食品過敏原培訓
- 中新天津生態城教育系統招聘教職人員筆試真題2024
- GB/T 45817-2025消費品質量分級陶瓷磚
- DB37∕T 5302-2024 既有城市橋梁現場檢測及承載能力評估技術標準
- 安徽省池州市貴池區2024-2025學年八年級下學期數學期末檢測試卷(含答案)
- 正畸接診標準化流程
- 中心靜脈壓(CVP)監測與護理
- 酒店前臺接待禮儀與溝通技巧練習題
- 床上用品采購 投標方案
- 口腔工藝管理課件
評論
0/150
提交評論