




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據分析方法及軟件應用授課教師:楊小寶北京交通大學2016.092023/2/4SPSS入門--自學章節1.SPSS數據的錄入、編輯2.SPSS數據文件合并3.數據預處理的其它功能SPSS數據的錄入(與Excel類似,自學)
SPSS數據的編輯(與Excel類似,自學)
SPSS數據的定位
插入和刪除一條個案
插入和刪除一個變量
數據的移動、復制和刪除1.SPSS數據的錄入、編輯1)錄入定義好SPSS數據結構后,可將具體的數據輸入到SPSS中,最終形成SPSS數據文件。SPSS數據的錄入操作在數據編輯窗口中的數據視圖(DataView)卡片中實現。其操作方法與EXCEL基本類似,也是以電子表格的方式進行錄入。錄入帶有變量值標簽的數據時,可以在下拉按鈕中的值標簽列表中選擇一個作為輸入2)SPSS數據的編輯
數據必須輸入正確才能保證正確的分析結果。但很難一次輸入正確,所以就需要進行修改,一般包括數據的定位、插入、刪除、修改、復制等。2a)SPSS數據的定位
數據的定位目的是將當前數據單元定位到某個特定的單元中。有三種定位方式:
1、按個案號碼定位:將當前單元格定位在任何單元格中,選擇菜單編輯(Edit)轉至個案(GotoCase),出現如下對話框,輸入欲定位的個案號碼并確認。2.按變量號碼定位:編輯(Edit)轉至變量(GotoVariable)
3、按變量值定位:編輯Edit查找Find將當前單元定位在某變量列的任何一個個案上選擇菜單編輯Edit查找Find,出現如下對話框輸入定位變量值并確認于是,SPSS自動對指定的變量進行搜索,并將當前單元定位于定位變量值相等的第一個個案上。2b)插入和刪除一個個案插入一個個案,即在數據編輯窗口的某個個案前插入一個新個案:將當前數據單元確定在一個個案上,選擇菜單編輯Edit插入個案InsertCase(或工具欄插入個案圖標按鈕)
刪除一個個案,在欲刪除的個案號碼上單擊鼠標左鍵,于是待刪除的個案數據全部反向顯示;單擊鼠標右鍵,從彈出菜單中選擇清除cut選項。2c)插入和刪除一個變量插入一個變量,即在數據編輯窗口的某個變量前插入一個新變量:將當前數據單元確定在一個變量上,選擇菜單菜單編輯Edit插入變量InsertVariable刪除一個變量,在欲刪除的變量名上單擊鼠標左鍵,于是待刪除的數據全部反向顯示;單擊鼠標右鍵,從彈出菜單中選擇清除cut選項。2d)數據的移動、復制和刪除
數據的移動、復制和刪除:與一般的應用程序相同選擇操作對象(變量、個案、若干連續單元等)剪切:Edit+Cut(Ctrl+X)復制:Edit+Copy(Ctrl+C)粘貼:Edit+Paste(Ctrl+V)
恢復刪除或修改前數據Edit+Undo(或工具欄Undo圖標按鈕)縱向合并數據文件橫向合并數據文件2.SPSS數據文件合并
當數據量較多時經常會把一份大的數據分成幾個小的部分,有幾個錄入員分別錄入,以期加快數據錄入速度,但一份完整的數據被分別存儲在幾個數據文件中,如果要分析這份數據就必須首先將若干個小的數據文件合并起來。要實現兩個或多個SPSS數據文件的合并,應首先將其中的某個數據文件讀入數據編輯窗口中,然后依次與其他數據文件合并。合并的方式有兩種:縱向合并和橫向合并。1)縱向合并數據文件從外部數據文件中增加個案到當前數據文件中,稱為縱向合并,相互合并的數據文件應該有相同的變量。步驟:打開一個數據文件;菜單:數據Data合并文件MergeFiles添加個案AddCases在彈出窗口中打開一個存在于磁盤上的需要縱合并的文件不同名變量同名變量注意:有變量的Pair(配對)問題,右邊的新的活動數據集中的變量VariablesInnewworkingdatafile框中顯示的變量名是兩個數據文件中都有的變量名,左邊的非成對變量UnpairedVariables框中的變量名是兩個文件中的不同變量名,其中變量名后面的*表示該變量是當前數據編輯窗口中的變量,+表示該變量是待合并文件中的變量。如果希望在合并后的數據文件中看出個案的來源,可以選擇將個案源表示為變量Indicatecasesourceasvariable項將自動生成一個變量名為source01取值0或1的變量。可選擇其中的兩個變量名并單擊對pair按鈕指定配對,表示雖名稱不同但數據含義是相同,可合并的數據;也可指定某變量,不經匹配,強行合并。匹配合并后的數據結果2)橫向合并數據文件從外部數據文件增加變量到當前數據文件,稱為橫向合并,橫向合并文件時要注意以下三個問題:1、相互合并的數據文件必須至少有一個名稱相同的變量,該變量是兩文件橫向合作的依據,稱為關鍵變量;2、兩個數據文件都必須先按關鍵變量進行升序排列;3、不同數據文件中數據含義不相同的數據項變量名不應相同。步驟:打開一個數據文件;菜單:數據Data合并文件MergeFiles添加變量AddVariables在彈出窗口中打開一個存在于磁盤上的需要橫向合并的文件橫向合并后的數據結果1)計數2)數據轉置3)加權處理4)SPSS缺失值處理5)數據排秩6)SPSS變量集3.數據預處理的其它功能(自學)(1)計數目的(2)計數區間(3)計數的基本操作(4)計數的應用舉例1)計數(1)計數目的SPSS實現的計數是對所有個案或滿足某條件的部分個案,計算若干變量中有幾個變量的值落在指定的區間內,并將計數結果存入一個新變量中的過程。例如對大學畢業班學生的成績進行綜合測評時,可以依次計算每個學生的若干門課程中有幾門課程得了優,有幾門課程得了良,有幾門課程不及格。SPSS實現計數的關鍵步驟是:指定哪些變量參與計數,計數的結果存入哪個新變量中指定計數區間(尤為關鍵)SPSS中的計數區間可以有以下幾種描述形式:單個變量值(Value)系統缺失值(System-missing)系統缺失值或用戶缺失值(Systemoruser-missing)給定最大值和最小值的區間(nthroughm)小于等于某指定值的區間(Lowestthroughn)大于等于某指定值的區間(nthroughhighest)(2)計數區間(a)選擇菜單轉換Transform對個案內的值計數Count,出現如下窗口:(3)計數的基本操作居民儲蓄調查數據.sav(b)將參與計數的變量選到
變量(V)NumericVariables框中(c)在目標變量TargetVariable框中輸入存放計數結果的變量名,并在目標標簽TargetLabel框中輸入相應的變量名標簽。(d)單擊定義值DefineValues按鈕定義計數區間,出現如下圖窗口:通過單擊添加Add、更改Change、刪除Remove按鈕完成計數區間的增加、修改和刪除。(e)如果僅希望對滿足某條件的個案進行計數,則單擊如果If按鈕并輸入相應的SPSS條件表達式。否則,本步可略去。居民儲蓄調查數據.sav利用居民儲蓄調查數據分析近些年儲戶收入的總體狀況。我們認為如果儲戶收入今年比去年增加了,且認為今后收入仍會增加則認為收入狀況較好。試分析有多少個儲戶的收入狀況較好。收入情況為順序數據,其中1表示增加,2表示基本不變,3表示減少。(4)計數的應用舉例思路:從兩個變量中分別選出其值為1,即收入增加的,計數為1。若兩變量都為1,則計數為2結果居民儲蓄調查數據.savSPSS的數據轉置就是將數據編輯窗口中數據的行列互換。基本操作步驟如下:
(1)選擇菜單數據Data轉置Transpose。
(2)指定數據轉置后應保留哪些變量,將它們選入變量Variables框中,未被選中的變量將在新文件中缺失。
(3)指定轉置后數據文件中各變量如何取名。2).數據轉置
應選擇一個取值唯一的變量(如職工號)作為標記變量并放到名稱變量NameVariable框中。轉置后數據各變量取名為K_標記變量值(如K_001、K_002、K_003等)。如果略去本步,則轉置后數據各變量名默認為VAR00001,VAR00002,VAR00003等。同時,SPSS還會自動產生一個名為Case_lbl的新變量,用來存放原數據文件中的各變量名。注:字符串數據不能轉置數據加工(職工數據).sav應用舉例結果3)加權處理統計分析中的加權處理是極為常見的,如計算加權平均數等。例如,希望掌握菜市場某天蔬菜銷售的平均價格。如果僅用各種蔬菜銷售單價的平均數作為平均價格就很不合理,還應考慮到銷售量對平均價格的影響。因此,以蔬菜的銷售量為權數計算各種蔬菜銷售單價的加權平均數,就能夠較準確地反應平均價格水平。SPSS中指定加權變量的操作步驟是:
(1)選擇菜單數據Data加權個案WeightCases。
(2)選擇加權個案WeightCasesby選項,并將某變量作為加權變量選到WeightCasesby框中。注意的是一旦指定了加權變量,那么以后的分析處理中加權是一直有效的,直到取消加權為止。取消加權應選擇請勿對個案加權Donotweightcases選項。
大量的缺失值會給數據分析帶來極大的影響,這就需要采用科學的方法對缺失值進行插補。操作步驟如下:
(1)選擇菜單轉置Transform替換缺失值replacemissingvalues。(2)將需要插補的變量單擊按鈕送到新變量NewVariables框中,該變量自動會生成一個新的變量,變量名為原變量名_13)在方法Method中選擇插補方法。
4)SPSS缺失值處理Seriesmean:該變量所有非缺失值的均值Meanofnearbypoints:該變量相鄰非缺失值的均值Medianofnearbypoints:該變量相鄰非缺失值的中位數Linearinterpolation:線性內插法(用缺失值前后兩點的中點值做替代,如果前后值有一個是缺失值,則得不到替換值)Lineartrendatpoint:用線性擬合方式確定替代值,自變量為1-n的數值。
結果數據排秩是根據某變量觀測值的大小,按一定的順序排秩,生成一個代表其秩次的新變量,但原始觀測值本身順序不發生改變。操作步驟如下:
(1)選擇菜單轉置Transform個案排秩rankcases(2)將需要排秩的變量單擊按鈕送到變量Variables框中,該變量自動會生成一個新的變量,變量名為R+原變量名;可選擇分類變量到排序標準By框中,如果選擇,系統將按照此變量的不同組別分別進行排秩。5)數據排秩(3)選擇將秩指定給AssignRank1to下面的復選框選擇排秩的順序。(4)在秩的類型RankTypes對話框中選擇排秩方式;在結Ties對話框中選擇相同觀測值排秩方式。
秩結果=(N+1)/2數據加工(職工數據).sav應用舉例實際統計分析中SPSS數據編輯窗口的變量會有幾十甚至上百個,此時簡化變量選擇的操作變顯得非常必要,SPSS變量集變是一種通過減少變量顯示個數而簡化變量選擇操作的方式。6)SPSS變量集SPSS變量集是存放許多SPSS變量名的集合。SPSS變量集包括系統變量集和用戶變量集兩大類。系統變量集用戶變量集系統變量集
SPSS事先定義好的的變量集,它包括兩個集合,分別名為ALLVARIABLES和NEWVARIABLES。其中ALLVARIABLES變量集中存放數據編輯窗口中的所有變量名,NEWVARIABLES變量集中存放數據編輯窗口中所有尚未存盤的新定義的變量名。這兩個系統變量集有時包含的變量名是完全相同的。用戶變量集是用戶根據實際需要自己定義的變量集,可以有若干個。如果用戶僅希望對SPSS眾多變量中的某幾個變量進行相同的處理及分析,則可以先將這幾個變量定義到一個用戶變量集中,然后再指定使用這個變量集。于是,在數據處理或分析時,SPSS僅顯示指定變量集中的變量名,進而大大減少了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年 甘肅工業和信息化廳廳屬事業單位地質測繪類專業招聘考試筆試試題附答案
- 2025年中國電抗器行業市場供需現狀及投資前景展望報告
- 壓花塑料板材項目投資可行性研究分析報告(2024-2030版)
- 中國微功率無線模塊行業市場發展前景及發展趨勢與投資戰略研究報告(2024-2030)
- 2025年中國GRE管行業市場深度分析及發展趨勢預測報告
- 2025年中國智能售貨機行業市場發展現狀及投資方向研究報告
- 中國阻燃母料行業調查報告
- 分享培訓課件錄音
- 2025年中國調味水產干制品行業市場深度分析及投資策略咨詢報告
- 文案撰寫合同
- (高清版)JTGT D81-2017 公路交通安全設施設計細則
- 2023-2024全國初中物理競賽試題-杠桿(解析版)
- 新概念馬學智慧樹知到期末考試答案章節答案2024年內蒙古農業大學
- 《臨床試驗生物樣本倫理管理指南(征求意見稿)》
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗收規范
- 乳腺癌患者術后心理護理
- 國際貨運代理實務 全套課件
- 國家開放大學《Python語言基礎》形考任務4參考答案
- 中學生心理健康診斷測驗(MHT)
- 人力資源薪酬專員個人月工作計劃
- 期末考試(試題)-2023-2024學年五年級下冊數學人教版
評論
0/150
提交評論