




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
常用統計分析軟件SPSS
13.0forWindows主講:楊澤峰電話:7979358Email:yzfcn@126.com統計學與統計軟件市場經濟呼喚統計學統計學是研究客觀事物數量特征和數量關系的方法論學科,能夠告訴人們如何通過打開幾扇窗口去探索一個未知的世界,教會人們怎樣用一種新的方式來思考問題,是一門很實用的學科。大至國家的宏觀決策,小至企事業單位的微觀管理,都離不開統計的應用。現代市場經濟對統計信息的需求急劇增加,對統計理論與方法提出了更高的要求。社會發展問題、經濟可持續發展問題、國際競爭力問題、金融風險管理問題、保險精算問題、人口與社會保障問題、環境保護問題、科學研究探索問題等等,這些都迫切地等待著我們去深入地研究。統計學的分類統計方法的基本功用提供了整理和描述數據的科學的方法提供由樣本推論總體的科學的方法提供通過誤差分析以鑒定處理效應的科學的方法提供了分析多個變數間相關密切程度的科學的方法提供進行科學試驗設計的科學的方法推薦使用的幾本教材以上教材均被超星數字圖書館收藏,校園網用戶均可直接下載。SPSS等統計軟件的下載地址:/incoming/Science/stat/statnews/das/spss13.rar請迅速下載,將在一周后刪除該鏈接本課程的教學網站網站地址http:///statnews內容教案教學大綱習題留言官方地址http://SPSS入門序言SPSS基礎SPSS數據文件的建立與管理SPSS數據的基本加工和處理SPSS輸出窗口序言統計分析軟件是數據分析的主要工具完整的數據分析過程包括:數據的收集數據的整理數據的分析結果的解釋和推論統計學為數據分析過程提供一套完整的科學的方法論。統計軟件為數據分析提供了實現手段。序言統計分析軟件的一般特點功能全面,系統地集成了多種成熟的統計分析方法;有完善的數據定義、操作和管理功能;方便地生成各種統計圖形和統計表格;使用方式簡單,有完備的聯機幫助功能;軟件開放性好,能方便地和其他軟件進行數據交換。序言常用統計軟件簡介SAS(Ver9.1)--真正的巨無霸。被譽為國際上的標準統計軟件和最權威的組合式優秀統計軟件。人機對話界面太不友好圖形操作界面比較糟糕一切圍繞編程設計學習起來較困難(編程)說明書非常難懂價格貴的人直跳序言常用統計軟件簡介SPSS(Ver15)--統計軟件中的貴族操作界面極為友好所有統計軟件中最友好的精心設計的圖形操作界面美觀的結果輸出強大的輔助教學功能輸出結果與中文WORD尚存在一定兼容問題在國內深受歡迎,特別是市場調研行業在歐洲各研究機構中得到廣泛應用序言常用統計軟件簡介S-Plus(Ver7)S語言(AT&T貝爾實驗室)的后續發展極為強大的統計功能和繪圖能力應用上以理論研究、統計建模為主需要有較好的數理統計背景對編程能力要求極高序言國外通行的計量經濟學軟件
Stata(Ver9)軟件小巧繪圖美觀統計分析能力極強數據接口差不提供對話框界面,命令行方式操作序言最易上手的統計軟件--NCSS2006界面友好功能齊全數據接口太簡單序言國產統計軟件的佼佼者-DPS(v7.55)一套通用多功能數據處理、數值計算、統計分析和模型建立軟件;較強的統計分析和數學模型模擬分析功能;是目前國內功能最完整的統計軟件包。自稱:DPS=Excel+SPSS網站地址
序言學習使用統計分析軟件的基本方法弄清分析的目的正確收集待處理和分析的數據(目的、影響因素的剔除)。弄清統計概念和統計含義,知道統計方法的適用范圍,無需記憶公式。選擇一種或幾種統計分析方法探索性地分析數據。讀懂計算機分析的數據結果,發現規律,得出分析SPSS基礎軟件名稱StatisticalPackageforSocialScienceStatisticalProductandServiceSolutions軟件發展60年代:美國斯坦福大學三位研究生研制70年代:SPSS總部成立于芝加哥,推出SPSS中小型機版—SPSSX80年代:微機版(V1-3)SPSS/PC+90年代:Windows版(v5-11)2003年:Windows版(v12)SPSS基礎基本窗口數據編輯窗口(dataeditor)功能:對SPSS的數據進行定義、錄入、修改、管理等基本操作的窗口包含數據視圖工作表(dataview)和變量視圖工作表(variableview)兩部分。組成:窗口主菜單(Data、Transform、Analyze、Graphs)、工具欄、數據編輯區、狀態顯示區SPSS運行過程中自動打開;且只能打開一個窗口;運行過程中無法關閉SPSS中各統計分析功能都是針對該窗口中的數據進行的;窗口中的數據以.sav存于磁盤上SPSS基礎基本窗口輸出窗口(viewer)功能:SPSS統計分析報表及圖形的輸出窗口組成:窗口主菜單、工具欄、結果顯示區、狀態顯示區在進行第一次分析時自動打開,也可手工打開;可以手工打開若干個可相互切換的viewer窗口;輸出窗口可以關閉;狀態欄上的!表示當前輸出窗口窗口內容以.spo存于磁盤上SPSS基礎SPSS的菜單SPSS基礎利用SPSS做數據分析的一般步驟建立SPSS數據文件定義數據文件結構錄入修改和編輯待分析的數據分析數據統計分析之前的數據預處理統計分析和建模結果的說明和解釋數據和分析結果的保存SPSS數據文件的建立與管理數據文件的特點結構的定義數據的錄入和保存數據的編輯與其他軟件數據共享
SPSS數據文件的特點SPSS數據文件是一種有結構的數據文件數據文件的每一行代表一個觀測量(概率事件)每一列代表一個變量在數據編輯器中可以輸入和編輯數據,但是不能輸入數學表達式和函數定義數據文件的結構變量名(Variablename)變量名是變量存取的唯一標志變量類型(type)和顯示寬度(width)數值型:常用標準數值型(Numeric):默認類型8.2如:12345678、12345.67、-1234.56字符型(String):存儲字符數據8位。如:beijing處理時用雙引號擴起來日期型(Date):存儲日期數據,如:20-AUG-1999注意:顯示寬度不影響數據的存儲定義數據文件的結構變量名標簽(Variablelabel)對變量名進行標記,以便在結果輸出時方便閱讀。變量值標簽(Valuelabel)用于注釋變量值,尤其方便分類變量的輸入和顯示。變量列格式(ColumnFormat)缺失值(MissingValues)變量度量(Measurement)scale:數值型Ordinal:序數型Nominal:名詞型數據的編輯打開數據文件數據定位插入和刪除個案插入和刪除變量數據單元數據的移動和復制與其他軟件共享數據打開其他格式的數據文件直接打開在SPSS13已經可以直接讀入許多常用格式的數據文件使用數據庫查詢打開利用通用數據庫ODBC接口讀取數據文件在9.0及以前版本中非常重要使用文本導入向導讀入文本文件和大型機交換文件時常用與其它軟件共享直接打開SPSS數據的基本加工和處理數據文件的整理個案排序、個案選取、文件合并、文件轉置數據加工計算變量、產生計數變量、分類匯總數據分組手工分組數據文件的其他處理功能指定加權變量、SPSS變量集的定義和使用數據文件的整理個案排序(sort)將所有個案按照用戶指定的某一個或多個變量的變量值的升序或降序重新排列快速查找異常值、極端值個案選取(selectcases)個案選取方式數據文件的整理文件合并(mergefile)將兩個SPSS數據文件合并到一個數據文件中。縱向合并(addcases)、橫向合并(addvariables)文件轉置(transpose)將數據文件行列互換,即:將個案轉為變量,變量轉為個案。將數值型變量的數據旋轉90°。數據的加工變量計算(compute)產生新變量或對原變量進行必要的轉換SPSS算術表達式和邏輯表達式SPSS函數產生計數變量(count)對所有或部分個案,計算若干個變量中有幾個變量的值落在指定的區域內,并將結果存入新變量中。SPSS函數SPSS函數是事先編好并存儲在SPSS軟件中,能夠實現某些特定任務的一段計算機程序。根據函數功能和處理的變量類型,SPSS函數大致可以分成八大類:算術函數、統計函數、分位數函數、邏輯函數、字符串函數、缺失值函數、日期函數和其他函數。算術函數算術函數統計函數數據的加工分類匯總(aggregate)按指定的分類變量的變量值對個案分組;計算每組個案的匯總變量的基本統計量;將計算結果生成到一新文件中,即:在新文件中對應分類變量的每一個分類值產生一個個案。數據的分組目的:了解數據的總體分布狀況手工分組(recode)將指定按哪個變量分組,即:指定分組變量;定義分組變量的分組區間(不重、不漏);指定一個存放分組結果的標志變量自動分組(CategorizeVariables)將連續性變量自動按分位數要求分成幾類數據文件的其它處理功能加權(weightcases)指定某一變量為加權變量。變量集加快變量選擇的速度變量集的定義變量集的使用第二章統計分析基礎統計包括:描述性統計、方差分析、t-檢驗、線性回歸、相關分析等專業統計:包括:辨別分析、因子分析、聚類分析、主成分分析等高級統計分析包括:logistic回歸分析、多元方差分析、非線性回歸、probit回歸分析、曲線估計等2.1描述性統計分析頻數分布分析(Frequencies)描述性統計分析(Descriptives)探索性分析(Explore)列聯表資料分析(Crosstabs)2.1.1頻數分布分析目的頻數分布分析主要通過頻數分布表、條圖和直方圖,以及集中趨勢和離散趨勢的各種統計量,描述數據的分布特征。采用的方法計算頻率分布表繪制統計圖形上述方法適用于定序、定類、定距類型數據步驟【Analyze】【Descriptive
Statistics】【Frequences】2.1.2描述性統計分析目的:描述性統計分析主要用以計算描述集中趨勢和離散趨勢的各種統計量,并可對變量進行標準化處理。步驟:【Analyze】【DescriptiveStatistics】【Descriptives】2.2常用統計圖統計圖是用點、線、面等各種幾何圖形表達統計數據的一種形象的形式,其特點是簡明生動,形象具體、通俗易懂且又一目了然。SPSS具有較強的制圖功能,可以繪制多種統計圖形,這些圖形可以由各種統計分析過程產生,也可以直接由菜單“Graphs”圖形菜單產生。SPSS軟件系統提供了許多產生統計圖形的方法。常用的統計圖有條形圖(barchart)、餅圖(piechart)、線圖(linearchart)和直方圖(histogram)等。2.2.1條形圖條形圖一般用于歸類資料,主要適用于彼此獨立的資料互相比較。2.2.1條形圖【Graphs】【Bar…】對話框選項說明〖Simple〗--簡單條形圖〖Clustered〗--分組(類)條形圖〖Stacked〗--堆積圖(分段條形圖)〖Summariesforgroupscases〗--觀察值分類描述模式,即對變量中的觀察值進行分組后繪圖。〖Summariesofseparatevariables〗--變量描述模式,即對每個變量生成一個條形圖。〖Valuesofindividualcases〗--觀察值描述模式,即對應分類軸變量中的每一觀察值生成一個條形圖。2.2.1復式條形圖2.2.2散點圖散點圖散點圖就是將兩個變數的n對觀察值分別以坐標點的形式標記于同一直角坐標的平面上。【Graphs】【scatter/dot】改內容將在線性回歸中加以介紹2.2.3線圖調用“Graphs”菜單中的“Line”過程,可繪制線圖。線圖是用線條的上下波動形式,反映連續性的相對資料的變化趨勢。2.2.3復式線圖直方圖(柱形圖、矩形圖)直方圖適用于表示連續性資料(計量資料)的次數分布。【Graphs】【Histogram】SPSS系統根據原始數值的最大值和最小值自動對變量分組,畫出直方圖。如果要修改組數等,可以在圖形編輯窗口中改變。直接雙擊直方圖的橫軸,開啟Properties對話框。2.3均值檢驗統計假設測驗概述單樣本的t測驗兩個獨立樣本的t測驗兩個配對樣本的t測驗2.3.1統計假設測驗概述統計推斷(statisticalinference),就是根據抽樣分布律和概率理論,由樣本結果(統計數)來推論總體特征(參數)。統計推斷的基本內容:統計假設測驗(hypothesistest)參數估計(parametricestimate)統計假設測驗是指根據某種實際需要,對未知的或不完全知道的統計總體提出一些假設(這些假設通常構成完全事件系),然后由樣本的實際結果,經過一定的計算,作出在概率的意義上應當接受那種假設的測驗。假設測驗的步驟
提出無效假設:實得差異由誤差造成;備擇假設:實得差異由總體參數不同造成。確定顯著水平。在為正確的假設下,根據統計數的一定分布律,算出實得差異由誤差造成的概率。如果這個概率,則在水平上否定,接受;反之亦然。2.3.2單樣本的t測驗含義:檢驗某變量的總體均值與指定的檢驗值之間是否存在顯著差異。要求:樣本來自的總體服從正態分布。步驟:【Analyze】【Comparemeans】【Onesamplettest】例題2.3.2單樣本的t測驗簡明分析步驟2.3.3兩獨立樣本的t測驗(一)含義:根據兩獨立樣本的數據,對兩總體均值是否有顯著差異進行推斷。例如:男生和女生的計算機平均成績有顯著差異嗎?城鎮和農村的平均存(取)款金額有顯著差異嗎?(二)要求:兩樣本必須相互獨立,即:抽取其中一批樣本對抽取另一批樣本沒有任何影響。(如:北京周歲兒童與上海兒童的平均身高)兩總體服從正態分布2.3.3兩獨立樣本的t測驗步驟【Analyze】【CompareMeans】【Independent-samplettest】結論首先,如果F檢驗的P≤α,認為方差不齊性;其次看Unequal行的t檢驗概率。如果≤α,則拒絕t檢驗的H0,認為兩總體均值有顯著差異;如果>α,則不拒絕t檢驗的H0。首先,如果F檢驗的P>α,認為方差齊性;其次看equal行的t檢驗概率。其余同上例題2.3.3兩獨立樣本的t測驗簡明分析步驟2.3.4兩配對樣本的t測驗含義:根據配對樣本對兩總體均值是否有顯著差異進行推斷。例如:某種減肥茶是否有效。則可以研究在服用減肥茶前后的體重,個體之間必須為一一對應的關系。要求:兩樣本數據必須兩兩配對,即:樣本個數相同,個案順序相同.如:減肥茶的效果、不同廣告形式對銷售額的影響.(控制了個案自身的影響)兩總體服從正態分布2.3.4兩配對樣本的t測驗基本思路計算兩樣本對應的個案的差值di=Y1i-Y2i計算t統計量和對應的相伴概率P(絕對值大于等于的雙側概率)結論:P≤α,則拒絕H0,認為兩總體均值有顯著差異.P>α,不能拒絕H0.步驟【Analyze】【CompareMeans】【Paired-samplettest】例題2.3.4兩配對樣本的t測驗簡明分析步驟例題2.4方差分析目的:方差分析是從數據間的差異入手,分析哪些因素是影響數據差異的眾多因素中的主要因素。例如:影響某農作物畝產量的因素(品種、施肥量、氣候等)影響推銷某種商品的推銷額(不同的推銷策略、價格、包裝方式、推銷人員的形象等)核心問題從數據差異角度看:觀測變量的數據差異=控制因素造成+隨機因素造成方差分析正是要分析觀測變量的變動是否主要是由控制因素造成還是由隨機因素造成的,以及控制變量的各個水平是如何對觀測變量造成影響的。2.4方差分析單因素試驗資料方差分析多因素試驗資料方差分析二因素無重復試驗資料的方差分析二因素有重復試驗資料的方差分析二因素隨機區組試驗資料的方差分析協方差分析2.4.1單因素方差分析目的檢驗某一個控制因素的改變是否會給觀察變量帶來顯著影響.例如:考察不同肥料對某農作物畝產量是否有顯著差異.考察不同學歷是否對工資收入產生顯著影響.步驟【Analyze】【CompareMeans】【One-wayANOVA】例題2.4.1單因素方差分析簡明分析步驟例題方差分析中的多重比較目的如果總體均值存在差異,F檢驗不能說明哪個水平造成了觀察變量的顯著差異。多重比較將對每個水平的均值逐對進行比較檢驗。常用方法LSD法實際上就是t檢驗的變形,只是在變異和自由度的計算上利用了整個樣本信息。Duncan氏新復極差測驗法Tukey氏固定極差測驗法Dunnett氏最小顯著差數測驗法實現手段【PostHoc…】按鈕2.4.2多因素方差分析控制因素的種類固定效應因素(FixedFactor):指的是試驗因素的k個水平是經過特意選擇的。隨機效應因素(RandomFactor):指試驗因素的k個水平是從該因素水平總體中隨機抽出的樣本。兩種因素的區別長江流域有成千上萬的水稻地方品種。如果通過篩選,選出若干個來作比較試驗,則該因素為固定效應因素。若我們是從這成千上萬的品種中隨機抽取若干個來研究,希望了解長江流域水稻品種總體的遺傳組成或生態特點,則該因素為隨機效應因素。2.4.2多因素方差分析基本思路:以兩個控制變量的方差分析為例:SS總=SSA+SSB+SSAB+SSeSSAB表示兩個控制變量的交互影響,即:兩個控制變量各水平之間搭配時對觀察變量的影響.步驟【Analyze】【GeneralLinearModel】【Univariate】2.4.2多因素方差分析例題2.4.2多因素方差分析2.4.2多因素方差分析簡明分析步驟2.4.2多因素方差分析隨機區組試驗這種類型的試驗應用重復、隨機化和局部控制三個原則。局部控制是指將整個試驗空間分成若干個各自相對均勻的局部,這個局部叫做區組。區組可以是培養箱的某一層,某一畜舍或試驗地的某一段等。然后,在各個區組上試行重復和隨機化。2.4.2多因素方差分析2.4.3協方差分析協方差分析是將回歸分析和方差分析結合起來的一種統計分析方法,其主要的功用是對試驗誤差進行統計控制。目的:將無法或很難控制的因素作為協變量,在排除協變量影響的條件下更精確地分析控制變量對觀察變量的影響。協方差分析的主要功用測驗多個線性回歸方程中回歸系數bi的差異顯著性矯正處理平均數并測驗矯正平均數間的差異顯著性作出不同變異來源的相關關系分析2.4.3協方差分析2.4.3協方差分析基本思路:協變量是數值型的;與觀測變量的線性關系在各水平均成立,且斜率大致相同。SS總=SS協+SSA+SSB+SSAB+SSe步驟【Analyze】【GeneralLinearModel】【Univariate】注意:在彈出的對話框中將協變量選入【Covariate(s)】欄簡明分析步驟2.5相關和回歸分析相關分析一元回歸分析多元回歸分析曲線擬合非線性回歸分析2.5相關和回歸分析相關分析和回歸分析的任務研究對象:統計關系相關分析旨在測度變量間線性關系的強弱程度。回歸分析側重考察變量之間的數量變化規律,并通過一定的數學表達式來描述這種關系,進而確定一個或幾個變量的變化對另一個變量的影響程度。2.5相關和回歸分析目的通過樣本數據,研究兩變量間線性相關程度的強弱。(例如:職工的年齡和收入之間的關系、工人數和管理人員之間的數量關系)基本方法繪制散點圖、計算相關系數繪制散點圖的方法【Graphs】【Scatter】實例實例2.5.1相關系數作用:以精確的相關系數(r)體現兩個變量間的線性關系程度.r:[-1,+1];r=1:完全正相關;r=-1:完全負相關;r=0:無線性相關。說明:相關系數只是較好地度量了兩變量間的線性相關程度,不能描述非線性關系。數據中存在極端值時不好。步驟【Analyze】【Correlate】【Bivariate】2.5.2一元線性回歸方程一元回歸方程:Y=a+bXa為常數項;b為Y對X回歸系數,即:X每變動一個單位所引起的Y的平均變動回歸方程的顯著性檢驗(1)目的:檢驗自變量與因變量之間的線性關系是否顯著,是否可用線性模型來表示.(2)檢驗方法t檢驗F檢驗(一元回歸中,F檢驗與t檢驗一致,即:F=t2,兩種檢驗可以相互替代)步驟【Analyze】【Regression】【Linear】2.5.3多元線性回歸分析多元線性回歸方程多元回歸方程:Y=β0+β1X1+β2x2+...+βkxkβ1、β2、βk為偏回歸系數。β1表示在其他自變量保持不變的情況下,自變量X1變動一個單位所引起的因變量Y的平均變動多元線性回歸分析的主要問題回歸方程的檢驗自變量篩選多重共線性問題2.5.3多元線性回歸分析自變量篩選法Enter:所選擇的自變量將全部進入建立的回歸方程中,該項為默認方式。對一元線性回歸采用較多。Remove:將進入方程中的自變量同時剔除。Forward:向前篩選法,是自變量不斷進入回歸方程的過程。Backward:向后篩選法,是自變量不斷剔除出回歸方程的過程。Stepwise:逐步篩選法,是“向前法”和“向后法”的結合實例2.5.4曲線擬合目的:在一元回歸分析或時間序列中,因變量與自變量(時間)之間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 計算機四級軟件測試中的核心問題分析試題及答案
- 公司大廈食堂管理制度
- 公司債券債務管理制度
- 培訓機構鑒定管理制度
- 數據庫數據分析報告撰寫試題及答案
- 嵌入式系統開發與應用試題及答案
- 學校文具倉庫管理制度
- 信息系統監理師考試內容解析試題及答案
- 軟件項目中的測試溝通試題及答案
- 公司財務用章管理制度
- DG-TJ 08-2122-2021 保溫裝飾復合板墻體保溫系統應用技術標準
- SFR-SE-ARC-0031激光跟蹤設置-作業指導書
- 錄音棚、攝影棚、直播室設計方案
- 河北工業大學C++終極題庫
- 安全生產隱患排查概述PPT課件
- CRCC認證目錄
- 稻谷加工畢業設計日加工秈稻400噸免淘洗大米生產線設計
- 因式分解—完全平方公式
- 社會保險申請表
- (完整版)高速公路拌合站設置規劃方案
- 中山市中考英語英語閱讀理解(含答案)
評論
0/150
提交評論