SPSS數據文件的建立和預處理_第1頁
SPSS數據文件的建立和預處理_第2頁
SPSS數據文件的建立和預處理_第3頁
SPSS數據文件的建立和預處理_第4頁
SPSS數據文件的建立和預處理_第5頁
已閱讀5頁,還剩67頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、zf11.SPSS1.SPSS軟件簡介軟件簡介oSPSS軟件是由多個窗口組成。o其中最基本的兩個窗口是:數據編輯窗口和結果輸出窗口zf21.1 1.1 數據窗口(數據窗口(data editordata editor)1 1)功能:)功能:對數據文件進行定義、錄入、修改、管理等基本操作。2 2)窗口組成:)窗口組成:標題欄、菜單欄、工具欄、二維表格、狀態欄3)spss各統計分析功能是針對當前數據窗口中文件進行的,數據文件的擴展名是:.savzf3窗口主菜單窗口主菜單工具欄工具欄數據編輯區數據編輯區系統狀態欄系統狀態欄zf4對對SPSSSPSS相關文件進行基本管理,如:新建、打開、保存、打印等相

2、關文件進行基本管理,如:新建、打開、保存、打印等zf5對數據編輯窗口中的數據進行基本編輯,如:撤銷對數據編輯窗口中的數據進行基本編輯,如:撤銷/ /恢復、剪切、恢復、剪切、復制、粘貼等,并實現數據查找、軟件參數設置等功能復制、粘貼等,并實現數據查找、軟件參數設置等功能zf6對對SPSSSPSS窗口外觀等進行設置,如:狀態欄、表格線、變量值標簽窗口外觀等進行設置,如:狀態欄、表格線、變量值標簽等是否顯示、字體設置等。等是否顯示、字體設置等。zf7對數據編輯窗口中的數據進行加工整理,如:數據的排序、轉置、對數據編輯窗口中的數據進行加工整理,如:數據的排序、轉置、選取、分類匯總、加權等選取、分類匯總

3、、加權等zf8對數據編輯窗口中的數據進行基本處理,如:生成新變量、計數、對數據編輯窗口中的數據進行基本處理,如:生成新變量、計數、分組等。分組等。zf9Analyze統計分析對數據編輯窗口中的數據進行統計分析和建模,如:統計分析對數據編輯窗口中的數據進行統計分析和建模,如:基本統計分析、均值比較、相關分析、回歸分析、非參數檢驗等。基本統計分析、均值比較、相關分析、回歸分析、非參數檢驗等。zf10對數據編輯窗口的數據生成各種統計圖形,如:條形圖、直方圖、對數據編輯窗口的數據生成各種統計圖形,如:條形圖、直方圖、餅圖、線圖、散點圖等。餅圖、線圖、散點圖等。zf11SPSSSPSS其他輔助管理,如:

4、顯示變量信息、定義變量集、菜單編輯器等其他輔助管理,如:顯示變量信息、定義變量集、菜單編輯器等zf12對對SPSSSPSS中的多個窗口進行管理,如:窗口切換、最小化窗口等中的多個窗口進行管理,如:窗口切換、最小化窗口等zf13實現實現SPSSSPSS的聯機幫助,如語句檢索、統計教練等的聯機幫助,如語句檢索、統計教練等zf141.21.2結果輸出窗口(結果輸出窗口(outputoutput)標題欄分析結果文本欄工具欄輸出導航欄菜單欄zf151.3 SPSS1.3 SPSS數據分析的一般步驟數據分析的一般步驟建立建立SPSSSPSS數據文件數據文件加工整理加工整理SPSSSPSS數據數據定義定義S

5、PSSSPSS數據的結構數據的結構錄入和修改錄入和修改SPSSSPSS數據數據統計分析統計分析SPSSSPSS數據數據解釋解釋SPSSSPSS分析結果分析結果zf162.SPSS2.SPSS數據文件的建立數據文件的建立建立方式之一:建立方式之一:。即利用SPSS數據編輯窗口定義SPSS數據的結構并輸入數據。建立方式之二:建立方式之二:。即直接讀取其他格式的數據文件并將其轉為SPSS格式數據zf17o熟悉數據窗口中的兩個重要按鈕:數據視圖和變量視圖。o對變量進行名稱、類型、長度、標簽小數點位等進行設置o錄入數據,在值與標簽之間進行轉換o保存數據到指定文件夾2.1 SPSS2.1 SPSS數據的直

6、接錄入數據的直接錄入zf18(1 1)熟悉數據視圖和變量視圖按鈕)熟悉數據視圖和變量視圖按鈕數據錄入窗口數據錄入窗口變量設置窗口變量設置窗口zf19(2 2)變量設置)變量設置變量的默認設置:變量為數值型(變量的默認設置:變量為數值型(numeric)numeric);小數點;小數點2 2位位(decimals)(decimals);變量名寬度;變量名寬度8 8字符字符(width)(width);數字右對齊;數字右對齊(right)(right);變量為連續型;變量為連續型(scale)(scale);其余自定義;其余自定義變量名變量名數據類型數據類型 數據寬度數據寬度 小數位數小數位數 變

7、量名標簽變量名標簽 變量值標簽變量值標簽 缺失值定義缺失值定義 列顯示寬度列顯示寬度 度量尺度定義度量尺度定義 顯示位置定義顯示位置定義zf20n變量名的字符個數不多于8個;n首字符應以英文字母開頭,后面可以跟除了!?*之外的字母或數字。下劃線、圓點不能為變量名的最后一個字符n變量名不區分大小寫字母nSPSS有默認的變量名,以VAR開題,后面補足5位數字。如:VAR00001等。zf21B B、變量、變量(typetype)定義每個變量取值的類型。定義每個變量取值的類型。數值型(數值型(numericnumeric): :默認寬度為默認寬度為8 8,小數,小數位為位為2 2;逗號型(逗號型(c

8、ommacomma): :整數部分從各位開始整數部分從各位開始每每3 3位以一個逗號分隔,如:位以一個逗號分隔,如:1,234.561,234.56科學計數型(科學計數型(scientific scientific notationnotation):120:120用科學計數法表示為用科學計數法表示為1.2E+021.2E+02日期型、美元符號型、字符型等。日期型、美元符號型、字符型等。zf22C C、變量、變量(widthwidth):):變量可顯示的最大字符位數變量可顯示的最大字符位數D D、位數(位數(decimalsdecimals)E E、變量名、變量名(labellabel): :

9、對變量名含義的進一步解對變量名含義的進一步解釋說明,可增強變量名的可視性和統計結果的可讀性。釋說明,可增強變量名的可視性和統計結果的可讀性。zf23F F、變量、變量標簽(標簽(valuevalue)SPSSSPSS變量的數據類型大多應定變量的數據類型大多應定義為數值型,這樣有利于以后義為數值型,這樣有利于以后的數據分析;的數據分析;變量值標簽對于品質型數據尤變量值標簽對于品質型數據尤為重要,可實現該類型變量的為重要,可實現該類型變量的數值化,同時也對變量取值含數值化,同時也對變量取值含義進行解釋說明。義進行解釋說明。例如:性別變量,可用例如:性別變量,可用1 1表示男表示男性,性,2 2表示

10、女性。表示女性。zf24G G、(missingmissing)A 無缺失值(系統默認)B 離散缺失值(最多定義3個)C 連續缺失值或多于3個的離散缺失值(輸入上下限定義,但不能包含合法值)系統默認的缺失值用圓點表示。系統默認的缺失值用圓點表示。zf25H H、寬度(寬度(columnscolumns): :數據編輯窗口中每列數據顯數據編輯窗口中每列數據顯示的字符位數示的字符位數I I、(AlignAlign): :數據顯示位置的定義,靠左數據顯示位置的定義,靠左/ /靠右靠右/ /居中居中J J、(MeasureMeasure): :將數據劃分為定距型數據將數據劃分為定距型數據(scale)

11、、定序型數據()、定序型數據(ordinal)、定類型數據)、定類型數據(Nominal)等。)等。zf26通常是指如身高、體重、收入通常是指如身高、體重、收入等的連續型數據,也包括諸如人數、商品件數等離散型等的連續型數據,也包括諸如人數、商品件數等離散型數據。(即可加減乘除的數據)數據。(即可加減乘除的數據)具有固有大小或高低順序的具有固有大小或高低順序的數據,一般可以用數值或字符表示。如:職稱、滿意度數據,一般可以用數值或字符表示。如:職稱、滿意度沒有內在固有大小或高低順沒有內在固有大小或高低順序,一般以數值或字符表示的分類數據。序,一般以數值或字符表示的分類數據。zf27a. 文件(Fi

12、le)-保存(Save)或另存為(Save as)b. 選擇存放數據文件的目錄路徑和文件名,并根據需要選擇數據文件的格式。(3 3)數據的錄入)數據的錄入(4 4)數據的保存)數據的保存將數據保存為將數據保存為ExcelExcel文件格式時,文件格式時,將變量名寫入表格將變量名寫入表格呈可用呈可用狀態,可指定是否將變量名寫入狀態,可指定是否將變量名寫入ExcelExcel的第一行上。的第一行上。zf281)選擇菜單文件(File) 打開(open)- 數據(data)2)選擇數據文件的類型,并輸入數據文件名2.2 2.2 讀取其他格式的數據文件讀取其他格式的數據文件zf29o若打開的是文本數據

13、(.txt)會打開文本數據導入向導:第一步:觀察該窗口,確認SPSS是否已經正確地識別和分隔了數據;zf30o選擇固定寬度和否第二步:若第一步未能正確識別,進入該步回答數據項間如何分隔數據文件的第一行上是否有變量名;zf31第三步:選擇數據從文本文檔的第幾行開始導入,多少行表示一個個案數據是全部導入還是部分導入;第四步:數據項間分隔符的選擇,字符型數據分隔符的選擇;zf32第五步:對數據預覽中的變量進行規范(通常忽略進入下一步);第六步:點擊完成即可;zf33數據預處理的意義:數據預處理的意義:(1)對數據進行補充、修正、刪除等工作,以保證數據的準確、完整。(2)對數據進行排序、加權、選擇、合

14、并等工作以滿足分析要求(3)對數據進行轉換或再計算,產生含有更豐富信息的新數據,以保證分析條件及目的的實現。3.SPSS3.SPSS數據的預處理數據的預處理主要內容:主要內容:(1)數據的編輯(插入變量、個案,查找,替換等等)。(2)數據的處理(合并、拆分、選擇、加權等等)zf34插入變量(插入變量(insert variable)insert variable)插入個案(插入個案(insert case)insert case)查找替換(查找替換(fide & replace)fide & replace)轉至個案(轉至個案(go to case )go to case )轉

15、向變量(轉向變量(go to variable )go to variable )變量的刪除、復制和移動(變量的刪除、復制和移動(cutcut、copy copy 等)等)3.1 SPSS3.1 SPSS數據的編輯(數據的編輯(EditEdit)zf35 數據操作管理主要完成有關數據的排序、轉置、合并、拆分、加權、選擇、分類匯總等。3.2 SPSS3.2 SPSS數據操作管理(數據操作管理(datadata)zf363.2.1 3.2.1 數據的排序數據的排序-(數據(數據-排序個案)排序個案)排序的作用:排序的作用:(1)數據排序便于數據的瀏覽,有助于了解數據的取值狀況、缺失值數量的多少;(

16、2)通過排序能夠快捷找到數據的最大值和最小值,初步把握和比較數據的離散度;(3)通過數據排序能夠快捷地發現數據異常值和輸入錯誤等;(4)排序為進一步統計分析提供基礎。單值排序單值排序(排序變量只有一個)多重排序多重排序(排序變量有多個,可依次指定各變量的排序規則)zf37就是實現數據文件的行列互換。即變量轉化為個案,而個案轉化為變量。n(1)選擇菜單:數據(data)-轉置(transpose)n(2)指定數據轉置后應保留哪些變量,將其選入變量(name)框中n(3)指定轉置后數據文件中各變量如何取名。應取一個取值唯一的變量作為標記變量放到名稱變量(name variable)3.2.2 3.

17、2.2 數據的轉置數據的轉置-(數據(數據-轉置)轉置)zf38zf39即是增加個案,就是將數據編輯窗口中的數據與另一個SPSS數據文件的數據進行首尾對接。數據(data)-合并文件(merge files)-添加個案(add cases) (1)為方便數據文件的縱向合并,一般情況下,兩個文件應具有相同的應具有相同的變量變量; (2)若變量不同可以人為強迫不同變量配對,但要求有相同的數據類型;要求有相同的數據類型; (3)可強行加入,不過會出現很多缺失值。3.2.3 3.2.3 數據合并(數據合并(merge filesmerge files)主要有:、zf40可以選擇其中的兩個變量名并點擊對

18、(pair)指定配對后進入;可以對某變量單擊重命名(rename)后再指定配對;單擊不經匹配強行進入。zf41o在數據加工(職工數據.sav)的基礎上縱向合并數據加工(縱向合并職工數據.sav)案例說明案例說明zf42,即:增加變量,就是價格數據編輯窗口中的數據與另一SPSS數據文件的數據左右對接。: 數據(data)-合并文件(merge files)-添加變量(add variables): (1)兩個數據文件必須至少有一個名稱相同的變量,該變量是兩個數據文 件拼接的依據,稱為關鍵變量。 (2)兩個數據文件都必須實現按關鍵變量進行升序排序;(若未排序則需選關鍵變量以其id號為依據進行合并)

19、 (3)為方便數據文件的橫向合并,不同數據文件中數據含義不相同的數據項,變量名不應相同。zf43zf44案例說明案例說明o在數據加工(職工數據.sav)的基礎上縱向合并數據加工(橫向合并職工數據.sav)zf45與數據排序很相似,不同的是,數據拆分不僅是按指定變量進行簡單排序,更重要的是根據變量對數據進行分組根據變量對數據進行分組(即按指定變量把文件劈成幾部分),為以后進行的分組統計分析提供便利。(1)選擇菜單數據(data)-拆分文件(split files)(2)選擇拆分依據變量進入分組方式(Group based on)(3)拆分后會出現:一是將分組結果輸出在同一張表格中,以便于不同組之

20、間的比較;二是將分組統計結果分別輸出在不同的表格中。3.2.4 3.2.4 數據拆分(數據拆分(split filesplit file)zf46zf47是根據分析需要,從已搜集的大批量數據中按照一定的規則抽取部分數據參與分析的過程,也成為樣本抽樣。提高數據分析的效率(只是要確保抽取的樣本應具有總體代表性);檢驗模型的需要(為了驗證模型,一般依據一定的抽樣方法只選取部分樣本參與數據建模,剩余數據用于模型檢驗)。(1)選擇菜單數據(data)-選擇個案(select files)(2)根據需要選擇數據選取方式;3.2.5 3.2.5 數據選取(數據選取(select fileselect fil

21、e)注意:select cases過程也是一個預處理過程,一旦選擇了某些數據,再調用其他程序分析時,只分析選中數據。zf48zf49zf50本質是數據復制,使用指定變量對其他變量進行加權,該過程適用于計算加權描述統計,列聯分析,卡方檢驗等。(1)選擇菜單數據(data)-加權個案(weight files)(2)選擇加權個案選項,并將某變量作為加權變量選入頻率變量中;3.2.6 3.2.6 數據的加權(數據的加權(weight caseweight case)注意:一旦指定了加權變量,那以后的分析處理中加權是一直有效的,直到取消加權為止。zf51zf52n(1)變量中某個選項的比例過高n(2)

22、數據中存在表明相同的變量值出現的頻數的變量時,需對頻數加權希望掌握某菜市場某天蔬菜銷售的平均價格。 應考慮銷售量對平均價格的影響。需以蔬菜的銷售量為權數計算各種蔬菜銷售單價的加權平均數,能較準確地反應平均價格水平。治療組緩解未緩解合計單純化療 48351復合化療 421355合計9016106兩化療組的緩解率比較兩化療組的緩解率比較 判斷化療對于緩解癥狀是否有效。判斷化療對于緩解癥狀是否有效。zf53zf54根據指定變量進行分類,在分類后計算各組各變量的描述統計量。(1)選擇菜單數據(data)-分類匯總(aggregate)(2)選擇分組變量 以及匯總變量 ;(3)單擊函數按鈕,指定對匯總變

23、量計算哪些統計量(SPSS默認計算均值)(4)指定將分類匯總結果保存到何處。3.2.7 3.2.7 數據的分類匯總數據的分類匯總注意:分類匯總變量可以是多個,即多重分類匯總。類似于數據的排序,分類變量的先后次序決定了分類匯總的先后次序。zf55zf56居民儲蓄調查數據居民儲蓄調查數據按照戶口類型對存取款金額進行分類匯總,了解城鎮儲戶和農村儲戶的存取款狀況。u由上表可看出:城鎮儲戶的一次平均存取款金額高于農村儲戶;農村儲戶的一次存取款金額的平均差異程度高于城鎮儲戶。zf57數據的基本處理數據的基本處理轉換轉換主要包括:對數據進行四則運算,;對數據進行重新編碼,;給數據賦予等級,由等距以上數據轉化

24、為等級數據;其它一些功能,如,等3.3 3.3 數據的基本處理數據的基本處理轉換(轉換(transformtransform)zf583.3.1 3.3.1 變量計算(變量計算(compute variable)compute variable)是在原有數據的基礎之上,根據用戶給出的SPSS算術表達式以及函數,對所有個案或滿足條件的部分個案,計算產生一系列的新變量。計算產生一些含有更豐富信息的新數據;利用變量計算對原有數據的分布進行轉換以滿足建模需要。(1)選擇菜單轉換(transform)-計算(compute)(2)選擇目標變量 以及算術表達式或函數 ;(3)如果僅是對符合一定條件的個案進

25、行變量計算,則單擊 如果按鈕進行設定。zf59新變量名稱及類型標簽設置編制計算公式,以產生新變量,公式中可以有函數、數學運算、關系運算和邏輯運算等數學運算關系運算邏輯運算函數說明框設定條件,以便確定哪些數據參與轉化各種函數新變量名稱及類型標簽設置編制計算公式,以產生新變量,公式中可以有函數、數學運算、關系運算和邏輯運算等數學運算關系運算邏輯運算函數說明框設定條件,以便確定哪些數據參與轉化各種函數n(1)字符串必須用單引號或雙引號引住,若字符串中有了單引號,則必須用雙引號引住。n(2)若調用函數,則自變量必須放在函數后的括號中n(3)每個關系表達式必須單獨定義,表達式間若用符號隔開,必須用英文字符zf60zf613.3.2 3.3.2 個案計數(個案計數(countcount)oSPSS的計數是對所有個案或滿足某條件的部分個案,計算若干變量中有幾個變量的值落在指定的區間內,并將計數結果存入一個新變量的過程。(1)選擇菜單轉換(transform)-對個案內數值計數(compute)(2)將參與計數的變量選到 數字變量框中 ;(3)在目標變量框中輸入存放計數結果的變量,并在目標標簽輸入相應的變量名標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論