數據分析實驗指導書_第1頁
數據分析實驗指導書_第2頁
數據分析實驗指導書_第3頁
數據分析實驗指導書_第4頁
數據分析實驗指導書_第5頁
已閱讀5頁,還剩39頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄

實臉一描述性分析

實臉二正態總襪的均值檢臉

實驗三非參數槍臉

實臉四方差分析

實驗五回歸分析

實臉大判別、聚類分析

實驗上主成分分析

實驗八因子分析

實驗一描述性分析

【實驗目的】

1.掌握數字特征的計算[AJ;

2.掌握相關矩陣計算〔A〕。

【實驗原理】

數據分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料

進展分析,以求最大化地開發數據資料的I力能,發揮數據的作用;是為了提取有

用信息和形成結論而對數據加以詳細研究和祗括總結的過程。

要對數據進展分析,當篋要分析數據中包含的主要信息,如要分析數據的主

要特征,也就是說,要挑究數據的數字特征。對于數據的數字特征,要分析數據

的集中位置、分散程度。數據的分布是正態的還是偏態等。對于多元數據,還要

分析多元數據的各個分量之間的相關性等。

【實驗工程設計】

1.給定一組單變量數據,介組it算均值、方差、Q1、Q3、偏度、峰度。

2.給定一組多變量數據,計算相關矩陣。

【實驗容】

一、單樣本的數字特征計算

(習題1.4)從*商店的營業日中除機抽取12天,得日營業額數據為〔單位:萬元〕:

12.5,17.2,9.1,25.4,31.2,20,18.9,22.8,21.1,17.8,25.1,27.7

試求樣本均值、樣本方差、樣本變異系數、樣本中位數、上樣本四分位數、下樣

本四分位數、樣本四分位數同他和極差。

1.建數據集

Datad4;

Input*;

Cards;

12.517.29.125.431.22018.922.821.117.825.127.7

Run;

2.使用SAS/分析家"菜單

(1)解開"分析家"界面。

選擇SAS界面的級班菜單:"解決方案"A分析""分析家"o

(2)調出數據文件Work.D4o

在界面的空白處,右鍵彈出菜單,選擇級聯菜單:塊件"A"按SAS名稱翻開"o

依次選擇退輯庫和文件對象,分刖為"Work"、"D4",單方確定"按肌

⑶確定分析方法。

選擇界面上的級聯菜單:"統計""描述性統計""分布"

⑷輸送變量。

首先選中變量*',然后單擊"Analyst"按肌即舟成變量的輸送,確定變量“'

作為分析變量。單擊“QK"。

(5)得到輸出結果

上述便那分析家”的調用過程等價于程序調用univariate過程:

procunivariatedata=d4;

Var*;

Run;

3.解答

樣本均值mean=

樣本方差Variance=

樣本變異系數CoeffVariation=

樣本上四介位數75%Q3=

樣本中位數Median=

樣本下四分位數25%Q1=

極差Range=

樣本四分位數間班InterquartileRange=

二、相關矩陣計算

(例3.2.3)今對31個人進展3體測試,考察或沸試的七個指標是:年齡(*1)、

體重(*2)、加活量(*3)、1.5英里胞的時間(*4)、休息時的脈搏(*5)、跑步時的脈

持(*6)和附步時記錄的最大脈搏(*7)。數據列于表321。現鍬對這些指標作一些

相關分析。

1.對于給定E*CEL數據文件,導入數據建數據集e323.sas7bdat

2.使用SAS/INSIGHT菜單

3.輸出

實驗二正態總體的均值檢驗

【實驗目的】

1.掌握單正態總體樣本的均值槍驗〔B〕;

2.掌握兩獨立組樣本(服從正態總體)進展均值比較[AJ;

3.掌握兩對照組樣本(服從正態總體)進展均值比較〔A〕;

4.了解兩組樣本均值差的置信區間計算〔CK

【實驗原理】

1.單樣本總體均值的t檢臉

2.兩獨立組樣本總煉的方差比較

【實驗工程設計】

1.單個正態總體的均值檢驗;

2.兩獨立組樣本(服從正態總體)進展均值比較檢臉;

3.兩對照組樣本(服從正態總體)進展均值比較檢驗。

【實驗容】

一、單個正態總體的均值校驗

(習題1.4)從“商店的營業日中隨機抽取12天,得日營業額數據為〔單位:萬元〕:

12.5,17.2,9,1,25.4,31.2,20,18.9,22.8,21.1,17.8,25.1,27.7

試檢臉:M0=10o

1.建數據集

Datad4;

Input*;

Cards;

12.517.29.125.431.22018.922.821.117.825.127.7

Run;

2.使用SAS/分析家〃菜單

(1)翻開"分析家”界而。

⑵調出數據文件Work.D4o

(3)確定分析方法。

選擇界面上的級聯菜單:"統計"A"假設檢驗"A均值的單樣本T檢聆”

(4)輸送變量。

確定變量為分析變量。

(5)得到輸出結果

3.解答

HO:M0=10H1:M0#10

檢臉方法:t檢驗

統計量取值:t=—

檢驗P值;

結論:拒絕/承受H0.

二、兩獨立組樣本(服從正態總體)進展均值比較

(習題1.22)為比較甲、乙兩抻安眠藥的療效,將20名患者介成兩組,每組10

大,假定服藥后延長的腌眠時間都近似服從正態分布且方差相等,潮得其數據如

下:

1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,4.6,3.4

0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0,2

試問在顯著性水平a=0.05下檢驗兩種安眠藥的療效有無顯著性差異,p值是多少.

1.建數據集

前面的“分析家"界面不要關閉,切換到程序編輯窗口,輸人程序。

Datad22;

Input*y;

Cards;

1.90.7

0.8-1.6

1.1-0.2

0.1-1.2

-0.1-0.1

4.43.4

5.53.7

1.60.8

4.60

3.42

J

Run;

2.使的SAS/分析家"菜單

(1)回到"分析家"界面,調出數據文件work.d22

(2)確定分析方法。

選擇級聯菜單:"統計"A喂設檢臉”A均值的雙樣本T槍般”

(3)設置數據集work.d22中,各樣本分組數據對應的變量個數:,Two

variables"o

(4)輸送變量。

將變量輸送給"groupf,Y輸送給"group2,z,單擊"OK"

(5)輸出結果如下

(6)涉及到兩獨立組的方差,繼續檢驗兩組方差是否相等。

回到“分析家”界面上,選擇級勝菜單"統計"》邯設檢驗"A節差的雙樣本T檢

臉“

⑺輸送變量。

將變量*'輸送給"groupf,Y輸送給"group2w,單擊"OK"。

(8)輸出結果如下

3.解答

HO:o1=a2H1:。1六。2

檢驗方法:F檢驗

統計量颯值:F=—

檢驗P值=

結論:拒絕/承受H0.兩獨立組的方差是/否相等。

HO:M1=U2H1:M1#M2

檢驗方法:t檢驗

統計量取值:t=—

檢驗p值=

結論:拒絕/承受H0.兩種安眠藥的療效有/無顯著性差異

三、兩對照組樣本(服從正態總體)進展均值比較

〔習題1.24〕甲、乙兩種稻種分別幡種在10塊試驗田中,每塊試驗田甲、乙稻

利各抻一半。假設同一塊田中兩抻作物的產量之差服從正態分布。現獲10塊田

Datad24;

Input*y;

Cards;

140135137136125140140145128

148131140130135140144131141125

Run;

2.使的SAS/分析家”菜單

⑴回到“分析家"界而,調出數據文件work.d24

⑵確定分析方法。

選擇級聯菜單:"統計〃A喂設檢驗""均值的雙樣本應對T檢驗”

(3)輸送變量。

設置各分組數據對應的變量個數:"Twovariables",并輸送變量*',",單擊

"OK",得到輸出結果如下:

3.解答

HO:p1=p2H1:g六.2

檢驗方法:t槍舞

統計量取值:世—

檢驗P值;

結論:拒絕/承受H0,兩抻稻抻產量有/無顯著性差異.

實驗三非參數檢驗

【實驗目的】

1.掌樨卡萬檢聆:A1;

2.熟悉符合檢臉、符號狀和檢驗、狀和檢聆。

【實驗原理】

非參數統計是統計分析的重要組成局部。可是與之很不相稱的是它的理論開

展遠遠不及參數檢驗完善,因而比較完善的可供更用的方法也不多。在SAS中,

非參數統計主要由UNIVARIATEjj程、MEANS過程和NPAR1WAY過程來實現,使

用SAS的”分析家〃系第可以方便地進展界面操作。

【實驗工程段計】

1.對列聯表,檢臉行變量與列變量的關聯性;

2.給定一組未知總體的樣本數據,檢相u=uO;

3.給定兩組未知總體的樣本數據,槍驗口1二口2。

【實驗容】

一、對列蛛表,檢臉行變量與列變量的關聯性

(習題4.7)下表為「藥治療感冒效果的3/3列表。

療效'年齡兒童成年老年合計

顯著583832128

-ffi284445117

較差23181455

合計10910091300

試同:療效與年齡是否關聯[a=0.05].

1.建數據集

DataJ0407;

D。effect上顯普二一肌'較差

Doage='兒童?成年?老年

inputnum;

output;

end;

end;

Cards;

583832

284445

231814

Run;

2.使臚SAS/分析家"菜單

(6)翻開"分析家"界面。

⑺調出數據文件Work.D04070

(8)懈定分析方法。

選擇界面上的級聯菜單:"統計"A表分析"

得到列坎表的空白界面。

(9)輸送變量。

選中變量"effect",單擊"Row"按鈕;選中變量"age",單擊"Column"按鈕;選

中變量"num",單擊tellCounts”按鈕。完成變量輸送。顯示如下。

(10)。擇附加的統計方法。

在列聯表分析〔TableAnalysis)界面的右邊下角,點擊"statistics"按鈕,翻開選

項設置頁。勾選"chi-squarestatistics"。如下列圖。單擊"OK"按鈕。

值得一提的是,卡方檢驗默認使用近似計算,目的是為了節省時間。當然也可以

勾選中間的,E*acttest”選項卡,來指定準確檢驗,只是*些時候的運行時間無法

控制。

(11)得到輸出結果

3.解答

HO:H效與年齡獨立。

槍腺統計量及其分布:z2Z2(4)

統計量=

檢驗P值二

結論:

二、對未知總體的一組樣本數據,進展均值的非參數檢驗[HO:M=

(習題4.9)從*企業中隨機抽取12名職工,調查他們的年抽人,數據如下〔單

位:萬元〕:

5.425.655.645.134.695.134.814.375.826.31

4.785.52

試用舒號槍聆對該企“職工年收入的中位數是否顯著超過了5萬元進展符號檢

驗(a=0.05]o

1.建數據集

前面的"分析家”界面不要關閉,切換到程序窗口,運行以下程序。

Datad0409;

i叩utine;

d=ine-5;

cards;

5.425.655.645.134.695.13

4.814.375.826.314.785.52

run;

2.使用SAS/分析家"菜單

(1)在未關閉的“分析家"界面中,調出數據文件Work.D0409。

(2)翻開對應于univariate程序U]能的菜單分析界面。

選擇界面上的級聯菜單:"統計">描述性統計""分布"

⑶輸送差值變量"d"。選中差值變量"d",單擊Analysis框。單擊"0K"。

⑷得到輸出結果°

3.解答

HO:m=5H1:m>5

①符號檢臉

檢驗統計量及其分布:$+〃(12,0.5)

統計量s+=2+E(S+)=8

檢驗p值=0.3877/2=0.194〔單邊檢驗,故概率除以2〕

結論:承受H0o

②符號扶檢驗〔前提:假定總體的分布式對稱的〕

檢驗統計量〃代表差值變量d中取值為正的數據項帙總和。

統計量T+=19+E(T+)=19+12(12+1)/4=19+39=58,

檢驗Plt=0.1455/2=0.〔單邊檢器,故概率除以2〕

結論:承受H0o

三、兩組未知總體的樣本數據,非參數檢驗總體均值

〔習題4.12)在甲、乙丙臺同型梳棉機上,進展纖維箕移率試臉,除機臺外其他工藝條件

M一樣,經試盼得兩個容量不同的纖維轉移率樣本數據如下表:

甲8.6359.9.2318.7979.8710.325

乙7.3427.4368.038.9469.1316.8238.9658.6968.345

試用株和檢驗,對纖維楊秘率而言,這兩臺機器是否存在顯著的機臺差異[a=0.05].

1.建數據集

前面的“分析家"界面不要關閉,切換到程序窗口,運行以下程序。

datad04012;

input*class$;

;

cards

5

8.63

9.甲

9.231甲

7

8.79甲

9.87甲

25

10,3乙

2

7.34乙

6

7.43乙

8.03乙

6

8.94乙

9.131乙

3

6.82乙

5

8.96乙

6

8.69乙

5

8.34

run;

ay過

padw

運行n

2.

o*on;

wilc

4012

ta=d0

ayda

ar1w

prop

c;

class

;

var*

run;

結果

輸出

得到

3.

解答

4.

差異(

顯著的

器存在

兩臺機

H1:

2〕

g=u

異〔即

的差

顯著

沒有

機器

兩臺

HO:

2)

g-

和),

的株

據中

合數

在混

數據

樣本

機器的

表甲臺

T代

計量

7,(豌

T=6

zz

〕,

|Z|

Pr>

d

?side

Two

驗的

z檢

選用

驗,應

雙邊檢

292

值=0.0

檢驗P

O,

拒絕H

著差異

存在顯

臺機器

認為兩

題】

【思考

別。

的區

檢驗

參數

臉和

數檢

非參

說出

問題1

變量d

差值

引入

要以

有需

問題

幾類

有哪

,都

聆中

數槍

非參

說出

問題2

實驗四方差分析

【實驗目的】

3,掌提單因素力差分析、多重比較〔A〕;

4.掌握兩因素方差分析算〔A〕。

【實驗原理】

力差分析(analysisofvariance,簡稱AN0VA)是用來對多個總體的均值作比較

檢驗的統計方法。在進展單因素方差分析時,如果檢驗拒絕了原假設,則我們有

時還需進一步檢臉到底哪些均值之間存在差異,出同時比較任意兩個水平下的總

體均值有無顯著差異的問題稱為多重比較問題。常用的有費希爾LSD法和邦弗

倫尼法。

【實驗工程設計】

1.進展單變量方差分析;

2.考慮交互作用進展雙因素方差分析;

3.不考慮交互作用進展雙因素方差分析。

【實驗容】

一、單因素方差分析&多重比較

CM5.1.1)為檢驗甲、乙、丙三種型號的機器混合一批原料所需平均時間是否一樣,*管理

人員得到了混合原料所需時間的如表5.1.1所示的數據。

機器所需時間

甲212522262322

乙272325242726

丙192221252120

(M5.2.1)在倒5.1.1中,k=3,n1=n2=n3=6,n=18,并假定在三個水平下的總體3布皆為正態,

且方差相等。試給出方差分折表〔參考教材124頁〕并進展多重比較。

1.建數據集

/*引入組別變量a和數值變量*,建數據集C05017

Datac0501;

input*;

if_n_<7thena='甲';

elseif_n_<13thena='乙

elsea='丙';

cards;

212522262322

272325242726

192221252120

run;

2.使用"SAS/分析家”菜單

⑴翻開"分析家”界面,調出數據文件Work.C05010

⑵翻開單因素方差分析界面。

/*SAS\ANALYST菜單:?統計"A方差分析(A)"A單向方差分析(0)"*/

⑶輸送變量。

⑷得到輸出結果。

臉證:SST=SSA+SSE

3.進展多重比較

⑴翻開單因素方差分析界面

/*SAS\ANALYST菜單:?統it”》方差分析伍廠A單向方差分析(0)"*/

(2)單擊界而上的"Means”按鈕

單擊選項卡"parisonMethod"右倒的黑色下箭頭,彈出的列表中選擇適宜的方法。

(3)3用Fisher'sLSD法的多重比較結果〔參考教材126頁〕

(4)使用邦弗倫尼尼的多重此較結果〔參考教材127頁〕

二、考慮交互作用的雙因素方差分析

CM5.3.1)為研究影用合成纖維抗斷強度的因素,表5.3.1記錄了三位操作員用

同一批產品的纖維在瓜臺生產機器上試驗的數據。

機器甲乙丙丁

操作員

1109,110110,115108,109110,108

2110,112110,111111,109114,112

3116,114112,115114,119120,117

〔例5.3.2〕在例5.3.1中,a=3,b=4,r=2,并假定在12個水平組合下的總體分布皆

為正態,且方差相等。試給出方差分析表〔參考教材136頁〕

1.建數據集

/*引人因素變量A、B和數值變量*,建數據集C0502*/

Datac0502;

DoA='p1','p2,;p3,;

DoB=甲,Z,'丙;「;

Dor=1,2;

Input*;

Output;

End;end;end;

cards;

109110110115108109110108

110112110111111109114112

116114112115114119120117

>

Run;

2.使用"SAS/分析家”菜單

⑴翻開"分析家”界面,調出數據文件Work.C05020

⑵翻開雙因素方差分析界面。

/*SAS\ANALYST菜單:,統計"A方差分析(A)"片因子方差分析(0)"*/

(3)輸送雙因素變量A、B和數值變量*。保存窗口。

(4)輸送交互因素AxB。

單擊Model按鈿,彈出如下頁面。同時迭中左If變1A、B,單擊cross按鈿,完成交互因素

的添加。單擊PK”按鈕。

(5)得到輸出結果。

三、不考慮

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論