




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 SPSS的基本(jbn)數據管理功能SPSS Basic Data Management參考文獻:SPSS Programming and Data Management, 2nd Edition: A Guide for SPSS and SAS Users. SPSS Inc. 2005.第1頁/共86頁第一頁,共87頁。一、數據獲取二、變量屬性三、記錄排序四、文件拆分五、篩選記錄 六、數據文件的合并縱向合并七、數據文件的合并橫向(hn xin)合并八、通過計算產生新變量九、重新賦值十、排秩十一、重排格式十二、日期計算十三、隨機抽樣第2頁/共86頁第二頁,共87頁。一、數據(shj)獲取
2、Getting Data into SPSS讀取SPSS數據文件:*.sav , 常用的其他外部數據文件: *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb 注意:醫學領域(ln y)常用數據庫EpiData軟件,先將數據文件*.rec轉換為*.sps文件,然后在SPSS的語法窗口運行,生成*.sav 文件。第3頁/共86頁第三頁,共87頁。數據獲取途徑第4頁/共86頁第四頁,共87頁。二、變量(binling)屬性Variable Properties:變量名。允許用中文,但習慣上采用英文變量名。:變量類型,常用數值型(Numeri
3、c)、字符型(String)、日期型(Date)。:變量寬度,默認為8。:小數位數,默認為2。5.Label:變量編碼(bin m),又稱為變量標簽,用于注釋變量名的含義。第5頁/共86頁第五頁,共87頁。6.Values:變量值編碼,又稱為變量值標簽,用于注釋變量值的含義。例如:變量sex,變量標簽為“性別”;變量值為1與2,變量值編碼:1為“男性”,2為“女性(nxng)”。:缺失值。默認為系統缺失值,用“.”表示。:列寬,默認為8。:對齊方式。數值型變量默認右對齊(Right),字符型變量默認左對齊(Left) 。:測度,包括三類:數值變量(Scale),名義變量或無序分類變量(Nomi
4、nal),有序分類變量或等級變量(Ordinal)。第6頁/共86頁第六頁,共87頁。數據清單變量清單數據文件(數據窗口(chungku)數據清單界面)第7頁/共86頁第七頁,共87頁。數據文件(數據窗口(chungku)變量清單界面)注意:一行對應一個“記錄(Case)”;一列(y li)對應一個“變量(Variable)”。此數據窗口不是一個很好的數據錄入界面。第8頁/共86頁第八頁,共87頁。刪除(shnch)ex .sav文件中id為57的case,將文件另存為為以后(yhu)使用方便,將ex .sav另存為如下數據庫(Save As.)第9頁/共86頁第九頁,共87頁。刪除(shnc
5、h)ex .sav文件中id為14的case,將文件另存為第10頁/共86頁第十頁,共87頁。刪除ex .sav文件(wnjin)中變量sbp1dbp2,刪除id6的記錄,將文件(wnjin)另存為第11頁/共86頁第十一頁,共87頁。只保留ex .sav文件(wnjin)中變量id、sbp1dbp2,刪除id7的記錄,將文件(wnjin)另存為第12頁/共86頁第十二頁,共87頁。三、記錄(jl)排序Sort Cases 第13頁/共86頁第十三頁,共87頁。ex .sav文件中, 按照“height(身高(shn o))”的大小排序。升序降序第14頁/共86頁第十四頁,共87頁。四、文件(
6、wnjin)拆分 Split File 第15頁/共86頁第十五頁,共87頁。比較組分組變量根據分組變量排序ex .sav文件中, 按照(nzho)“sex(性別)”拆分文件第16頁/共86頁第十六頁,共87頁。第17頁/共86頁第十七頁,共87頁。分性別對“height(身高(shn o))”進行統計描述描述性統計第18頁/共86頁第十八頁,共87頁。第19頁/共86頁第十九頁,共87頁。不同(b tn)性別的“height(身高)”統計描述所有記錄(jl)的“height(身高)”統計描述注意(zh y):SPSS的輸出結果文件為*.spo第20頁/共86頁第二十頁,共87頁。 五、篩選(
7、shixun)記錄 Select Cases第21頁/共86頁第二十一頁,共87頁。如果條件滿足過濾刪除selectunselect第22頁/共86頁第二十二頁,共87頁。篩選(shixun)條件:有高血壓家族史(genic 0)第23頁/共86頁第二十三頁,共87頁。如果選用Deleted,則一定要將篩選后的文件另存一個文件名第24頁/共86頁第二十四頁,共87頁。filter_$變量,0表示未選中該記錄,1表示選中該記錄不符合條件的記錄,被用斜線篩除第25頁/共86頁第二十五頁,共87頁。有高血壓家族史的患者身高的統計(tngj)描述所有(suyu)患者身高的統計描述第26頁/共86頁第二
8、十六頁,共87頁。六、數據文件的合并(hbng)縱向合并(hbng):增加記錄Merge Files.Add Cases打開(d ki)數據文件作為“工作數據文件”第27頁/共86頁第二十七頁,共87頁。打開(d ki)作為“外部數據文件”第28頁/共86頁第二十八頁,共87頁。*代表工作數據文件,代表外部數據文件。第29頁/共86頁第二十九頁,共87頁。將連接后的文件(wnjin)另存一個文件(wnjin)名:第30頁/共86頁第三十頁,共87頁。七、數據文件的合并(hbng)橫向合并(hbng):增加變量Merge Files.Add Variables打開作為(zuwi)“工作數據文件”
9、第31頁/共86頁第三十一頁,共87頁。打開(d ki)作為“外部數據文件”第32頁/共86頁第三十二頁,共87頁。(1)兩個文件(wnjin)均提供記錄(Both files provide cases)關鍵變量對于排序的文件,按照關鍵變量進行匹配*代表工作數據文件,代表外部數據文件。第33頁/共86頁第三十三頁,共87頁。警告:如果數據未按照關鍵變量的升序進行排序,那么不能按照關鍵變量匹配第34頁/共86頁第三十四頁,共87頁。連接(linji)后的數據文件,另存為第35頁/共86頁第三十五頁,共87頁。(2)按照關鍵變量,將外部數據文件匹配(ppi)到工作數據文件中(External f
10、ile is keyed table)。第36頁/共86頁第三十六頁,共87頁。連接(linji)后的數據文件,另存為第37頁/共86頁第三十七頁,共87頁。(3)按照關鍵(gunjin)變量,將工作數據文件匹配到外部數據文件中(Working file is keyed table)。第38頁/共86頁第三十八頁,共87頁。連接(linji)后的數據文件,另存為第39頁/共86頁第三十九頁,共87頁。八、通過計算(j sun)產生新變量 compute第40頁/共86頁第四十頁,共87頁。產生一個(y )新變量:bmi體重/(身高)*2)第41頁/共86頁第四十一頁,共87頁。第42頁/共8
11、6頁第四十二頁,共87頁。九、重新(chngxn)賦值Recode. Into different variables第43頁/共86頁第四十三頁,共87頁。舊及新的變量值第44頁/共86頁第四十四頁,共87頁。根據bmi對7個記錄(jl)進行分組,bmi: 正常:;超重:;肥胖:。第45頁/共86頁第四十五頁,共87頁。定義新的變量名:bmi _ gr第46頁/共86頁第四十六頁,共87頁。第47頁/共86頁第四十七頁,共87頁。問題(wnt):當bmi時,bmi_gr的取何值?根據上述recode方法(fngf), bmi_gr為缺失值!解決辦法:RECODE bmi (18.0 thru
12、 =1) (24.0 thru =2) (28.0 thru Highest=3) INTO bmi_gr .EXECUTE .第48頁/共86頁第四十八頁,共87頁。十、排秩 rank cases第49頁/共86頁第四十九頁,共87頁。對sbp1(治療(zhlio)前SBP)進行排秩第50頁/共86頁第五十頁,共87頁。排秩后產生新變量rsbp1,其中對于(duy)相等的變量值(稱為結點ties)取平均秩次。本例中第2、3位的平均秩次為。第51頁/共86頁第五十一頁,共87頁。十一(ShY)、重排格式Restructure第52頁/共86頁第五十二頁,共87頁。1.將變量轉換(zhunhun
13、)為記錄 Restructure selected variables into cases 第53頁/共86頁第五十三頁,共87頁。將變量轉換為同一組第54頁/共86頁第五十四頁,共87頁。記錄標識轉置后的新變量需要轉置的變量需要固定的變量第55頁/共86頁第五十五頁,共87頁。創建一個索引變量第56頁/共86頁第五十六頁,共87頁。索引變量的變量名按照自然數列對索引變量取值第57頁/共86頁第五十七頁,共87頁。未選取的變量從新數據庫中刪除第58頁/共86頁第五十八頁,共87頁。開始重排第59頁/共86頁第五十九頁,共87頁。重排后的數據文件。 第60頁/共86頁第六十頁,共87頁。2.將
14、記錄(jl)轉換為變量 Restructure selected cases into variables第61頁/共86頁第六十一頁,共87頁。第62頁/共86頁第六十二頁,共87頁。記錄標識索引變量第63頁/共86頁第六十三頁,共87頁。按照“記錄標識”變量排序第64頁/共86頁第六十四頁,共87頁。按照原變量值順序,排列新變量組第65頁/共86頁第六十五頁,共87頁。開始重排第66頁/共86頁第六十六頁,共87頁。重排后的數據文件。 第67頁/共86頁第六十七頁,共87頁。十二(sh r)、日期計算 Date/Time 第68頁/共86頁第六十八頁,共87頁。用日期與時間進行計算第69頁
15、/共86頁第六十九頁,共87頁。兩個日期之間的計算第70頁/共86頁第七十頁,共87頁。Date1與Date2之差以“天”為單位第71頁/共86頁第七十一頁,共87頁。結果變量:day,單位為“天”變量標簽第72頁/共86頁第七十二頁,共87頁。第73頁/共86頁第七十三頁,共87頁。十三、隨機抽樣 Random Sampling 步驟(bzhu)1 隨機數種子(Random Number Seed)的設定以數據文件data.sav為例第74頁/共86頁第七十四頁,共87頁。指定種子(此處以隨機抽樣的日期為種子)第75頁/共86頁第七十五頁,共87頁。步驟2 隨機篩選(shixun)記錄(Se
16、lect Cases Randomly)第76頁/共86頁第七十六頁,共87頁。隨機抽取樣本單擊Sample按鈕第77頁/共86頁第七十七頁,共87頁。從前10個記錄中隨機抽取2個記錄第78頁/共86頁第七十八頁,共87頁。從前10個記錄中隨機抽取2個記錄第79頁/共86頁第七十九頁,共87頁。隨機抽樣的結果(ji gu): 抽取了no為3、4的兩個記錄。第80頁/共86頁第八十頁,共87頁。注意:1.隨機抽樣主要用于現場調查中,從總體中用簡單隨機的方法隨機抽取一個樣本。2.隨機抽樣的過程中,需要設定種子,以保證隨機抽樣結果是可重現的。(一般來說,如果不設定種子,那么(n me)第二次抽樣很可
17、能與第一次抽樣的結果不同。)第81頁/共86頁第八十一頁,共87頁。小貼士:SPSS通過菜單,可以實現大部分的數據管理及統計分析功能,軟件操作簡單(jindn)、易學。在學習SPSS時,要養成一個好習慣:用語法文件(*.sps)保存每一步操作(只需要在每個對話框中點擊Paste,就可以將操作粘貼到語法窗口,即Syntax窗口)。這樣做,至少有兩個益處:1.避免重復地操作;2.很清楚地記錄了統計分析的過程。第82頁/共86頁第八十二頁,共87頁。如果您偷懶(tu ln),從不保存語法文件1.您花了一整天的時間進行了復雜的數據整理(zhngl)及統計分析幾天后,老板告訴您:數據庫需要刪除一個記錄,
18、您要重新做統計!天啊!為了這一個記錄(jl),難道還要再花費一整天重頭開始么?!第83頁/共86頁第八十三頁,共87頁。如果您偷懶,從不保存(bocn)語法文件2.您花了一整天的時間進行(jnxng)了復雜的數據整理及統計分析。很幸運,數據很準確,方法很合適,似乎沒有什么遺憾了。N年后,有人拿著您的統計結果,很崇拜地請教:當初您是怎么算出這個結果的?天啊!我怎么(zn me)可能記得N年前的事情?!第84頁/共86頁第八十四頁,共87頁。如果您養成了這個(zh ge)好習慣:用語法文件(*.sps)保存每一步操作哈哈(h ha)!只需要幾秒鐘我就能將統計結果重現!a piece of cake !第85頁/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合同解除條件示例
- 體育技能培訓合同協議書
- 果園收購合同協議書模板
- 監理合同協議書的違約
- 代賣合同協議書圖片
- 2025正規苗木供應合同協議書
- 個人汽車租憑合同協議書
- 2025委托維修合同范本2
- 2025年合同樣本:商業店鋪銷售合同
- 廚房小吃外包合同協議書
- 2024年中國新就業形態勞動糾紛解決研究報告+Resolution+of+Labour+Disputes+Involving+New+Forms+of+Employment+in+China
- 卡西歐手表EFA-120中文使用說明書
- 《十萬個為什么》整本書閱讀-課件-四年級下冊語文(統編版)
- 2024年山東省濟南市中考化學試卷( 含答案)
- 廣東省江門市2023-2024學年高一下學期7月期末考試語文試題(解析版)
- 超市經營服務方案投標方案(技術標)
- 新質生產力視角下高校產教融合人才培養模式研究
- 景觀魚池施工合同范本
- 孟萬金編制的中國大學生積極心理品質量表+評分方式
- 《應用文寫作》中職全套教學課件
- 新能源并網系統寬頻振蕩分析與抑制閱讀記錄
評論
0/150
提交評論