




已閱讀5頁,還剩31頁未讀, 繼續免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
10.11統計分析軟件&SPSS建立數據目錄10.11統計分析軟件&SPSS建立數據110.25數據加工作圖111. 08繪圖解答&描述性分析:22.描述性統計分析:2四格表卡方檢驗:(檢驗某個連續變量的分布是否與某種理論分布一致, 如是否符合正態分布)2第七章 非參數檢驗21.單樣本的非參數檢驗2(1)卡方檢驗2(2)二項分布檢驗22.兩獨立樣本的非參數檢驗23.多獨立樣本的非參數檢驗24.兩相關樣本的非參數檢驗25.多相關樣本的非參數檢驗2第五章 均值檢驗與T檢驗21.Means過程(均值檢驗)(24. 單樣本T檢驗25. 兩獨立樣本T檢驗26.兩配對樣本T檢驗2第六章 方差分析2單因素方差分析:2多因素方差分析:210.25數據加工作圖1.Excel中隨機取值:=randbetween(55,99)2.SPSS中新建數據,一列40個,正態分布隨機數:先在40那里隨便輸入一個數 表示選擇40個可用的,然后按一下操作步驟:3.排序:個案排秩4.數據選?。簲祿?選擇個案-如果條件滿足:計算新變量:5.頻次分析:分析-統計描述-頻率還原:個案-全部6.加權:還原7.畫圖:11. 08繪圖解答&描述性分析:1.課后題:長條圖2.描述性統計分析:(1) 頻數分析:(2) 描述性分析:描述性統計分析沒有圖形功能,也不能生成頻數表,但描述性分析可以將原始數據轉換成標準化得分,并以變量形式存入數據文件中,以便后續分析時應用。操作:分析描述性分析:然后對結果進行篩選,去掉異常值,就得到標準化的數據: 任何形態的數據經過Z標準化處理之后就會是正態分布的錯誤!標準化是等比例縮放的,不會改變數據的原始分布狀態,(3) 探索分析:(檢驗是否是正態分布:莖葉圖、箱圖)實例:操作:(4) 交叉列聯表(探索定類型的變量間的相關性):【純數值的變量用回歸分析,名義變量用交叉分析】操作:實例:四格表卡方檢驗:(檢驗某個連續變量的分布是否與某種理論分布一致, 如是否符合正態分布)例子:第1步 建立數據文建:第2步:對數據進行預處理;(給數據加權)第3步 進行卡方檢驗:第4步 結果分析P0.0110.05, 則在5%顯著性水平下拒絕原假設, 差異有顯著性意義,即藥物加化療與單用藥物治療癌癥的療效有顯著性差異。如何選sig值:期望值就是T 是理論頻數 N是樣本數量(合計)對應:1)選第一個:2)選3)選配對卡方檢驗:第1步 建立數據文建:第2步 對數據進行加權處理第3步 進行配對卡方檢驗結果分析:第七章 非參數檢驗使用情況:在總體分布未知的情況下用非參數檢驗,分布已知用參數檢驗。1.單樣本的非參數檢驗(1)卡方檢驗分析步驟 第1 步 提出零假設:卡方檢驗的零假設H0是“總體服從某種理論分布”,其對立假設H1是“總體不服從某種理論分布”。 第2步 選擇檢驗統計量:卡方分布選擇的是Pearson卡方統計量。已證明,當n充分大時,它近似地服從自由度為k-1的卡方分布。 第3步 計算檢驗統計量的觀測值和概率p值。 第4步 給出顯著性水平,作出決策。 實例:某公司質檢負責人欲了解企業一年內出現的次品數是否均勻分布在一周的五個工作日中,隨機抽取了90件次品的原始記錄,其結果如下表,問該企業一周內出現的次品數是否均勻分布在一周的五個工作日中?( ) 工作日12345次品數251581626第1步 分析:由于考慮的是次品是否服從均勻分布的問題,考慮用卡方檢驗。 第2步 數據的組織:數據分成兩列,一列是工作日,其變量名為“weekday”,另一列是次品數,變量名為“number”,輸入數據并保存。第3步 加權設置:將變量“number”定義為權變量。第4步 進行卡方檢驗: 第5步 主要結果及分析左表是頻數分布情況表,第二列為實際觀察值出現次數,第三列為理論上每天應出現的次數,第四列為殘差右表是計算的卡方統計量及對應的相伴概率值,由于Sig.=0.0140.05,因此沒有理由拒絕零假設。這說明此地新生兒男女比例與通常的男女比例相同。2.兩獨立樣本的非參數檢驗【例7-3】 某公司希望了解兩種品牌汽油A和B每加侖的行駛里程是否有區別,表7.15是兩種品牌汽油每加侖的行駛里程數,在顯著性水平0.05下,判斷兩個品牌間是否存在顯著性差異?A30.428.729.232.531.729.530.831.130.731.8B33.529.830.131.433.830.931.329.632.833第1步 分析:由于是兩種品牌的汽油,可以認為是兩個獨立樣本,但行駛里程數根本不知道服從何種分布,可用兩獨立樣本的非參數檢驗進行分析。第2步 數據組織:由于獨立樣本的非參數檢驗所檢驗的數據只有一列,故應將A,B數據組織成一列,用另一列來區分A和B,作分組變量。第3步 進行獨立樣本的非參數檢驗雙尾檢驗的相伴概率為0.151,大于0.05,說明兩種汽油無顯著性差異。兩個相伴概率都大于顯著性水平0.05,因此應接受零假設,認為兩種汽油之間無顯著性差異。Kolmogorov-Smirnov Z值為0.894,相伴概率值為0.400,大于顯著性水平0.05,因此應接受兩種汽油之間無顯著性差異的原假設;根據游程檢驗計算的Z統計量為-1.149,對應在單尾顯著性概率為0.128,大于顯著性水平,因此應接受兩種汽油之間無顯著性差異的原假設。從以上四種檢驗方法所得到的結果是相同的,即兩種汽油之間無顯著性差異。3.多獨立樣本的非參數檢驗4.兩相關樣本的非參數檢驗某企業提出了一項新工藝,為了檢驗新工藝是否能降低單位成本,隨機抽取16個工人分別用新舊工藝生產產品,測得單位成本資料如下表,請在顯著性水平0.05下檢驗是否新工藝降低了成本? new25121422211722161718192422152223old18171619241928182224223025202421第1步 分析:由于是同一批工人和同一批機器,其先后的成本是相關的,同時也不知數據的分布情況,故應用兩相關樣本的非參數檢驗。第2步 數據組織:數據分成兩列,第一列為新工藝的成本,第二列為舊工藝的成本。第3步 兩相關樣本的非參數檢驗 :設置如下圖Z統計量為-2.160,相伴概率為0.031,小于顯著水平0.05,故應拒絕原假設,即認為兩樣本不是來自于同一總體,說明有差異,新工藝可省成本。結果分析:Z統計量為-2.160,相伴概率為0.031,小于顯著水平0.05,故應拒絕原假設,即認為兩樣本不是來自于同一總體,說明有差異,新工藝可省成本。 其相伴概率為0.021,小于0.05,說明新工藝與舊工藝有顯著性差異,這與Wilxocon檢驗結果是一致的。5.多相關樣本的非參數檢驗某文藝晚會有5個節目,共有5個評委參與打分,其數據如下表。問這5個評委的判斷標準是否一致 。節目1節目2節目3節目4節目5評委18.758.258.898.5評委2109.59.58.99.5評委39.69.19.18.59.6評委49.28.58.99.19.4評委59.659.29.19.18.9第1步 分析:由于5個評委打分是分別針對同一個節目,所以數據之間具有相關性,同時不知道數據所服從的分布,可以采用多相關樣本的非參數檢驗。第2步 數據組織:由于是分析的評委之間的評判標準是否一致,故應將每個評委所打的分各分成一列。第3步 多相關樣本的非參數檢驗:結果分析:卡方值為9.102,自由度為4,相伴概率為0.0590.05,故應認為5個評委打分是一致的??ǚ街禐?.102,自由度為4,相伴概率為0.0590.05,也應認為5個評委的打分具有一致性,這與Friedman檢驗具有一致性。非參數檢驗與卡方檢驗比較:卡方檢驗是 數據總體是服從什么樣的分布(都是 頻次的方式呈現出來的)非參數檢驗 是總體分布情況未知第五章 均值檢驗與T檢驗 參數檢驗必須說明,他是服從某種分布的實例:1.Means過程(均值檢驗)(與非參檢驗比較)非參檢驗中的二項式檢驗,但是只能是兩個變量。第1步 數據組織; 根據表5.1生成SPSS數據文件,建3個變量:“sex”、“edu”、“num”, 數據文件的部分數據如圖5-3所示。3、實例分析第2步 打開主對話框;選擇分析 比較均值 均值,打開同圖5-1一樣的均值過程主對話框。第3步 確定要進行均值比較的變量;在圖5-1的對話框中,從左邊的候選變量列表框中選擇“人口數量(num)”變量,移入“因變量列表”文本框中,表示對該變量進行均值比較分析。第4步 確定分組變量;分組變量可以有幾層,選擇“性別(sex)”變量作為第一層分組變量,將其移入“自變量列表”文本框中。第5步 確定輸出的統計量;單擊圖5-1上的選項按鈕,彈出如圖所示的子對話框,選擇方差和eta復選框,進行方差分析,單擊繼續按鈕,返回主對話框。結果分析:此表是性別的單因素方差分析。表中的Sig.值遠大于0.05,說明不同性別受教育的人口數量沒有顯著性差異。 人口數量與性別的相關性度量表。此時的Eta和Eta方 取值都很小,說明性別和受教育的人口數量的相關性很差,這也和單因素方差分析表的結論是一致的。4. 單樣本T檢驗(它是對總體均值的假設檢驗)【例5-2】某生產食鹽的生產線,其生產的袋裝食鹽的標準重量為500g,現隨機抽取10袋,其重量分別為:495,502,508,496,505,499,503,498,505,500。假設數據總體呈正態分布,請檢驗生產線的工作情況。第1步 數據組織;首先建立SPSS數據文件,只需建立一個變量“Weight”,錄入相應的數據即可。第2步 打開主對話框; 選擇分析 比較均值 單樣本T檢驗,打開同圖5-3一樣的單樣本T檢驗主對話框。第3步 確定要進行T檢驗的變量; 在圖5-3所示的對話框中,選擇“Weight”變量作為檢驗變量,移入“檢驗變量”框中。第4步 輸入要檢驗的值; 在圖5-4的對話框中的“檢驗值”中輸入要檢驗的值,本例應輸入500。單樣本T檢驗結果表,第一行的Test Value為檢驗參數值500,即用于比較的總體均值,下面從左至右依次為檢驗統計量(t)、自由度(df)、雙尾檢測概率P值(Sig.(2-tailed))、樣本均值與和檢驗值的差(Mean Difference)、均值差的95%置信區間(95%Confidence Interval of the Difference)。 當置信水平為95%時,顯著性水平為0.05,從表中可以看出,雙尾檢測概率P值為0.432,大于0.05,故零假設成立,也就是說抽樣袋裝食鹽的重量與500克無顯著性差異,有理由相信生產線工作狀態正常。5. 兩獨立樣本T檢驗【例5-3】為比較兩種不同品種的玉米的產量,分別統計了8個地區的單位面積產量,具體數據見表5.8。假定樣本服從正態分布,且兩組樣本相互獨立,試比較在置信度為95%的情況下,兩種玉米產量是否有顯著性差異。第1步 數據組織;根據表5.8,SPSS數據文件中建立兩個變量,分別為“品種”、“產量”,變量“品種”的變量值標簽為:a-品種A,b-品種B,錄入數據即可。第2步 打開主對話框;選擇分析 比較均值獨立樣本T檢驗 ,打開同圖5-4一樣的兩獨立樣本T檢驗主對話框。第3步 確定要進行T檢驗的變量;在圖5-4所示的對話框中,選擇“產量”變量作為檢驗變量,移入“檢驗變量”框中。第4步 確定分組變量;選擇變量“品種”作為分組變量,將其移入圖5-4中的“分組變量”文本框中,并定義分組的變量值:Group11,Group22。結果分析:首先做2個樣本方差的齊性檢驗。上圖中sig.=0.7520.05,因此認為2個樣本方差不存在差異,可以按照P=0.332取值。在顯著性水平為0.05的情況下,T統計量的概率p值大于0.05,故不應拒絕零假設,,即認為兩樣本的均值是相等的,在本例中,不能認為兩種玉米品種的產量有顯著性差異。6.兩配對樣本T檢驗3、實例分析【例5-4】以下是某大學跆拳道選手15人的平衡訓練的數據,統計實驗前、后平衡訓練成績是否有差異。訓練前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88訓練后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第1步 數據組織; 首先建立SPSS數據文件,建立兩個變量:“訓練前”、“訓練后”,錄入相應數據。第2步 打開主對話框;選擇分析 比較均值 配對樣本T檢驗,打開同圖5-5一樣的配對樣本T檢驗主對話框。第3步 確定配對分析的變量;將變量“訓練前”和“訓練后”添加到“成對變量”框中,作為第一對分析的配對變量。兩配對樣本T檢驗的簡單相關關系及其檢驗結果。表中第3列為訓練前和訓練兩樣本的相關系數,第4列是相關系數的檢驗p值。從表中可以看出,在顯著性水平為0.05時,訓練前后的概率p值為0.132,大于0.05,接受零假設,可以認為訓練前后的成績沒有明顯的線性關系。由于概率p值為0.041,小于0.05,拒絕零假設,可以認為訓練前后對成績有顯著效果。第六章 方差分析單因素方差分析:用四種飼料喂豬,共19頭分為四組,每一組用一種飼料。一段時間后稱重,豬體重增加數據如下表所示,比較四種飼料對豬體重增加的作用有無不同。飼料A飼料B飼料C飼料D133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6第1步 分析:由于考慮的是一個控制變量(飼料)對一個觀測變量(豬體重)的影響,而且是4種飼料,所以不適宜用獨立樣本T檢驗(僅適用兩組數據),應采用單因素方差分析。第2步 數據的組織:數據分成兩列,一列是豬的體重,變量名為“weight”,另一變量是飼料品種(變量值分別為1,2,3,4),變量名為“fodder”,輸入數據并保存。 第3步 方差相等的齊性檢驗:由于方差分析的前提是各個水平下(這里是不同的飼料folder影響下的體重weight)的總體服從正態分布,且各組方差具有齊性。其中正態分布的要求并不是很嚴格,但對于方差相等的要求是比較嚴格的,因此必須對方差相等的前提進行檢驗。 方差齊性檢驗的方法:打開分析比較均值單因素ANOVA選項,在“方差同質性檢驗”前打鉤就可以了。方差齊性檢驗的方法:方差齊性檢驗的H0假設是:方差相等。從上表可看出相伴概率Sig.=0.995(0.05)說明應該接受H0假設(即方差相等)。故下面就用方差相等的檢驗方法。上表是幾種飼料方差分析的結果,組間(Between Groups)平方和(Sum of Squares)為20538.698,自由度(df)為3,均方為6846.233;組內(Within Groups)平方和為652.159,自由度為15,均方為43.477;F統計量為157.467。由于組間比較的相伴概率Sig.(p值)=0.0000.05,故應拒絕H0假設(四種飼料喂豬效果無顯著差異),說明四種飼料對養豬的效果有顯著性差異。從整個表反映出來四種飼料相互之間均存在顯著性差異,從效果來看是第4種最好,其次是第3種,第1種最差。多因素方差分析:研究一個班三組不同性別的同學(分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家具廠溯源管理制度
- 家淘寶平臺管理制度
- 形象進度與管理制度
- 徑向井安全管理制度
- 德魯納酒店管理制度
- 志愿團規章管理制度
- 快速充電站管理制度
- 性少數群體管理制度
- 總經理巡檢管理制度
- 意向金轉正管理制度
- 再生障礙性貧血診斷與治療中國指南(2024年版)解讀
- 《旅游概論》考試復習題庫(附答案)
- 內蒙古呼和浩特市(2024年-2025年小學五年級語文)人教版綜合練習(下學期)試卷及答案
- 2024年基金應知應會考試試題
- 康復進修匯報
- 2024年云南省中考物理試題含答案
- 2024年石家莊市市屬國企業面向社會公開招聘403名管理人員及專業技術人員高頻難、易錯點500題模擬試題附帶答案詳解
- 醫藥代表聘用合同模板
- 2024-2030年中國公路工程行業市場發展分析及前景預判與投資研究報告
- 2023北京西城區初二期末(下)道法試卷及答案
- 2.4圓周角(第1課時)(課件)九年級數學上冊(蘇科版)
評論
0/150
提交評論