使用EXCEL進行數據分析_第1頁
使用EXCEL進行數據分析_第2頁
使用EXCEL進行數據分析_第3頁
使用EXCEL進行數據分析_第4頁
使用EXCEL進行數據分析_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數 據信 息統計分析(報表)數據挖掘(專業工具和算法)掌握EXCEL的常用統計函數;熟悉使用EXCEL透視表進行數據分析和分類匯總;了解使用EXCEL進行數據分析版本:EXCEL 2000 完全安裝典型安裝最小化安裝常用統計函數常用統計函數數據透視分析數據透視分析圖表圖表數據透視表數據透視表( (圖圖) )數據分析數據分析描述統計描述統計檢驗分析檢驗分析z- z-檢驗:雙樣本平均檢驗:雙樣本平均差檢驗差檢驗 F-F-檢驗:雙樣本方差檢驗:雙樣本方差 t- t-檢驗:雙樣本等方差檢驗:雙樣本等方差假設假設 t- t-檢驗:雙樣本異方差檢驗:雙樣本異方差假設假設 t- t-檢驗:平均值的成對檢驗:

2、平均值的成對二樣本分析二樣本分析 方差分析方差分析單因素方差分析單因素方差分析 無重復雙因素分析無重復雙因素分析 可重復雙因素分析可重復雙因素分析 相關系數與回歸分析相關系數與回歸分析 協方差協方差 相關系數相關系數 回歸分析回歸分析 一般統計函數:用來統計給定某個區域的數據的平均值、最大值或者最小值等 數理統計函數:對數據進行相關的概率分 布的統計,進行回歸分析等。 某班級的成績表,如下圖所示,其中有兩個學生的該門課程缺考,需要分別用到AVERAGE和和AVERAGEA函數函數來計算兩個不同的平均值。 在單元格D3中輸入公式“=AVERAGE(B2:B9)”,可以計算參加考試學生的平均成績,

3、函數AVERAGE在計算時對缺考的兩個學生的成績自動認為是0。 在單元格D6中輸入公式“=AVERAGEA(B2:B9)”,可以計算全體學生的平均成績,對缺考的學生成績,AVERAGE函數將自動忽略。 某班級的成績表,如下圖所示。需要用到FREQUENCY函數來來統計各個分數段的分布學生人數。 功能:統計指定單元格區域中數據的頻率分布頻率分布。由于函數 FREQUENCY 返回一個數組,必須以數組公式的形式輸入。 語法形式: FREQUENCY(data_array,bins_array) data_array為一數組或對一組數值的引用,用來計算頻率。如果 data_array 中不包含任何數

4、值,函數 FREQUENCY 返回零數組。 bins_array為一數組或對數組區域的引用,設定對 data_array 進行頻率計算的分段點。如果 bins_array 中不包含任何數值,函數 FREQUENCY 返回 data_array 元素的數目。 在E4E7單元格輸入進行頻率計算的分段點59,70,80,90; 選中F4F8單元格,作為輸出統計結果的單元格; 在公式欄輸入“=FREQUENCY(B2:B11,E4:E8)”,然后按下“CtrlShiftEnter” 組合鍵鎖定數組公式即可。 輸入數組公式首先必須選擇用來存放結果的單元格區域(可以是一個單元格),在編輯欄輸入公式,然后按

5、CtrlShiftEnter組合鍵鎖定數組公式,Excel將在公式兩邊自動加上花括號“ ”。 功能是單元格區域中的兩個數列之間的相關系數。 表達式為CORREL(arrnyl,arrny2)。arrnyl和arrny2表示的都是兩個數據列CORREL函數可以用來分辨兩種屬性之間的關系。 某醫生為了探討缺碘地區母嬰TSH水平關系,應用免疫放射分析測定了160名孕婦(孕周1517w)及分娩時臍帶血TSH水平(mU/L),現隨機抽取10對數據如圖2-8所示,試求臍帶血TSH水平對母血TSH水平的相關系數。選中結果輸出單元格B14;在公式欄輸入“=CORREL(C3:C12,B3:B12)”,點擊公式

6、欄 按鈕;在單元格A14輸入“相關系數”即可。 某地120名7歲男童的身高,已知身高均數為119.41cm,標準差為4.38cm。試估計該地7歲男童身高在110cm以下者的概率,身高在110cm120cm之間的概率。如果要制定一個健康標準使得90的7歲男童符合健康標準,那么健康標準應該定多少? NORMDIST函數 功能:返回指定平均值和標準偏差的正態分布函數 表達式:NORMDIST(x,mean,standard_dev,cumulative)。 x是需要計算其分布的數值; mean是分布的算術平均值: standard_dev表示分布的標準偏差; cumulative是一邏輯值,指明函數

7、的形式。如果cumulative為TRUE,NORMDIST函數返回累積分布函數,否則返回概率密度函數。此函數在統計方面應用范圍廣泛。 NORMINV函數 功能:返回指定平均值和標準偏差的正態累積分布函數的反函數。 表達式:NORMINV(probability,mean,standard_dev) probability是正態分布的概率; mean是分布的算術平均值; standard_dev表示分布的標準偏差。 某地120名7歲男童的身高,已知身高均數為119.41cm,標準差為4.38cm, 如下圖所示。試估計該地7歲男童身高在110cm以下者的概率,身高在110cm120cm之間的概率

8、。如果要制定一個健康標準使得90的7歲男童符合健康標準,那么健康標準應該定多少? 在單元格C5中輸入公式“=NORMDIST(110,B2,B3,TRUE)”,計算身高在110cm以下者的概率為0.015841; 在單元格C6中輸入公式“=NORMDIST(120,B2,B3,TRUE)-C5”,計算成功身高在110cm120cm之間的概率為0.537736; 在單元格C7中輸入公式“=NORMINV(0.9,B2,B3)”,計算使90的7歲男童身高達標的健康標準為125.0232cm。=NORMDIST(110,B1,B2,TRUE)=NORMDIST(120,B1,B2,TRUE)-C5=

9、NORMINV(0.9,B2,B3)概念:工作表數據的圖形化表概念:工作表數據的圖形化表示、清晰易懂、形象直觀。示、清晰易懂、形象直觀。 種類:種類:1414種圖表類型,包含了種圖表類型,包含了若干種不同的圖表子類型。在若干種不同的圖表子類型。在處理醫藥數據中常用的幾類圖處理醫藥數據中常用的幾類圖表:表: 1、折線圖、折線圖 2、柱形圖、柱形圖 3、餅圖、餅圖 4、XY散點圖散點圖 5、條形圖、條形圖 6、雷達圖、雷達圖 柱形圖是Excel 的默認圖表類型,也是用來處理醫藥數據常用的圖表類型之一。通常把每個數據點顯示為一個垂直柱體,其高度對應于數值,用來顯示一段時期內數據的變化或描述各項之間的

10、比較關系。分類項水平組織,數值垂直組織,即強調數據隨時間的變化。 柱形圖共有7 種子圖表類型:簇狀柱形圖、堆積簇狀柱形圖、堆積柱形圖、百分比堆積柱形圖、三維簇狀柱形圖、柱形圖、百分比堆積柱形圖、三維簇狀柱形圖、三維堆積柱形圖、三維百分比堆積柱形圖和三維三維堆積柱形圖、三維百分比堆積柱形圖和三維柱形圖。柱形圖。 在藥物實驗中的應用,現有藥物止血效果實驗采集的數據表,A列為實驗對照組和七種不同的止血藥物,分別做了六次藥物止血實驗,得到六組凝血時間實驗數據(單位:秒)。通過柱形圖可以形象地描繪了這七種不同藥物止血功能的差異。 返回返回返回返回返回返回(1)選擇圖表類型,單擊選擇圖表類型,單擊“插入插

11、入”|“圖表圖表”。 (2)選擇圖表源數據。選擇圖表源數據。 (3)設置標題和圖例。設置標題和圖例。 (4)確定圖表位置。確定圖表位置。 (5)編輯圖表區。用戶需要編輯的內容包括顏編輯圖表區。用戶需要編輯的內容包括顏色、填充和邊框等色、填充和邊框等 。(6)編輯數據軸、分類軸。編輯數據軸、分類軸。 雷達圖是由一個中心向四周射出多條數雷達圖是由一個中心向四周射出多條數值坐標軸,每個指標都擁有自己的數值坐值坐標軸,每個指標都擁有自己的數值坐標軸,把同一數據序列的值用折線連接起標軸,把同一數據序列的值用折線連接起來而形成。雷達圖用來比較若干個數據序來而形成。雷達圖用來比較若干個數據序列指標的總體情況

12、,可比較多個單位不同列指標的總體情況,可比較多個單位不同指標的數據特征,如最大值、最小值等。指標的數據特征,如最大值、最小值等。雷達圖的雷達圖的3 個子圖表類型分別為雷達圖、個子圖表類型分別為雷達圖、數據點雷達圖和填充雷達圖。數據點雷達圖和填充雷達圖。 為了反映醫院管理的質量,某市抽樣調查了幾所醫院的6 項指標(指標值越大表示質量越高),其中三所醫院的調查結果如圖2-65所示,請繪制雷達圖反映三所醫院的管理質量。 數據透視表 數據透視圖數據透視圖 數據透視表是一種對大量數據快速匯總和建立交叉列表的交互式表格和圖表。 在Excel50以上版本就提供有這一功能,它不僅可以轉換行和列行和列以查看源數

13、據的不同匯總結果,顯示不同頁面以篩選數據,還可以根據需要顯示區域中的明細數據,這對分析、組織復雜數據是非常方便有用的。 數據透視表最大的特點就是它的交互性交互性。創建一個數據透視表以后,可以任意重新排列數據信息,并且還可以根據習慣將數據分組。橫向分類依據的字段 縱向分類依據的字段 統計依據的字段 分類顯示(篩選)依據的字段 以下圖數據為例分析藥材的分布、產量情況。以下圖數據為例分析藥材的分布、產量情況。 選擇選擇“數據”菜單中的菜單中的“數據透視表和數據透視圖” 選項,彈出選項,彈出 “數據透視表和數數據透視表和數據透視圖向導據透視圖向導”對話框,按步驟依次完成。對話框,按步驟依次完成。 編輯

14、數據透視表編輯數據透視表添加、刪除分類和統計字段 改變統計字段的算法改變統計字段的算法 修改、刪除數據透視表數據透視表更新數據透視表中的數據更新數據透視表中的數據 根據透視表建立透視圖根據透視表建立透視圖:選擇數據透視表中的任意單元格,然后在“數據透視表”工具欄上單擊“數據透視表”按鈕,單擊“數據透視圖”命令,。 對應于透視表的列字段對應于透視表的行字段對應于透視表的數據區域對應于透視表的頁字段 根據源數據建立數據透視圖:根據源數據建立數據透視圖:根據數據庫的源數據建立透視圖的方法類似于創建數據透視表,具體操作步驟如下:(1)單擊欲建立數據透視圖的數據清單。(2) 選擇“數據”菜單中的“數據透

15、視表和數據透視圖”選項,在彈出的對話框中選擇“數據透視圖”,按步驟依次完成。 返回返回返回返回返回返回 描述統計描述統計 檢驗分析檢驗分析 z-檢驗:雙樣本平均差檢驗檢驗:雙樣本平均差檢驗 F-檢驗:雙樣本方差檢驗:雙樣本方差 t-檢驗:雙樣本等方差假設檢驗:雙樣本等方差假設 t-檢驗:雙樣本異方差假設檢驗:雙樣本異方差假設 t-檢驗:平均值的成對二樣本分析檢驗:平均值的成對二樣本分析 方差分析方差分析 單因素方差分析單因素方差分析 無重復雙因素分析無重復雙因素分析 可重復雙因素分析可重復雙因素分析 相關系數與回歸分析相關系數與回歸分析 協方差 相關系數 回歸分析 統計檢驗計算統計檢驗計算檢驗

16、分析報告檢驗分析報告其基本步驟如下:1、啟動Excel2000,執行菜單欄中的“工具”|“加載宏”命令,打開“加載宏”對話框,選中“分析工具庫”復選框。2、單擊“確定”按鈕,返回到工作表。執行菜單欄的“工具”|“數據分析”命令,打開“數據分析”對話框 ,即可使用各種數據分析工具。注意:EXCEL必須是“完全安裝” “描述統計”是基礎分析工具之一,用于生成對輸入區域中數據的單變量單變量統計分析報表,提供有關數據趨中性和易變性的信息,而這些信息是進一步分析數據的起點,可以指示哪一種檢驗適合進一步的探討。 描述統計的統計函數一般包括:MAX、MIN、AVERAGE、MEDIAN、GEOMEAN、HA

17、RMEAN、AVEDEV、STDEV、VAR、KURT和SKEW函數等,他們分別用于計算最大值、最小值、平均值、中位數、幾何平均數、調和平均數,以及變異統計的平均差、標準差、方差峰度和偏度。 某老師對幾名學生的五次考試成績進行某老師對幾名學生的五次考試成績進行分析,以便對這幾個學生在學習方面存在分析,以便對這幾個學生在學習方面存在的問題加以解決。使用的問題加以解決。使用“描述統計描述統計”分析分析工具對其數據進行分析。工具對其數據進行分析。返回返回返回返回返回返回1、執行菜單欄的“工具”|“數據分析”命令,打開“描述統計”對話框,選中“分析工具”列表框中的“描述統計”選項,單擊“確定”按鈕,打

18、開“描述統計”對話框。3、在“輸入區域”編輯框中鍵入三列數據所在的單元格區域引用($A$4:$F$8)。4、單擊“逐行”選項。5、選中“標志位于第一列”選項。6、在“輸出選項”下單擊“新工作表組”選項,并在對應編輯框中輸入新工作表的名稱,如:“描述統計結果”。 “t-檢驗:平均值的成對雙樣本分析檢驗:平均值的成對雙樣本分析”分析工具及其公式可以進行成對雙樣本t-檢驗,用來確定樣本平均值是否不等。此t-檢驗窗體并不假設兩個總體的方差是相等的。當樣本中出現自然配對的觀察值時,可以使用這種成對檢驗。例如,對一個樣本組進行了兩次檢驗,抽取實驗前的一次和實驗后的一次。 某醫院用中藥治療9例再生障礙性貧血

19、,結果如下圖所示。試用“t-檢驗:平均值的成對二樣本分析”工具,分析治療前后是否有改變?返回返回返回返回返回返回(1)在Excel2003,創建一個新的Excel工作薄,如圖2-108所示輸入需要分析的數據;(2)執行菜單欄中的“工具”|“數據分析”命令,打開“數據分析”對話框,選中“分析工具”列表框中的“t-檢驗:平均值的成對二樣本分析”選項。該分析工具通過簡單的方差分析,對兩個以上樣本平均值進行相等性假設檢驗(樣本取自具有相同平均值的樣本總體)。此方法是對雙平均值檢驗(如t-檢驗)的擴充。 某醫院用三種方法治療某種疾病,結果如下表2-2所示,試問三組治愈天數有無差別?中藥中藥37762西藥

20、西藥9121185中西結合中西結合12467返回返回返回返回返回返回(1)執行菜單欄中的“工具”|“數據分析”命令,打開“數據分析”對話框,選中“分析工具”列表框中的“方差分析:單因素方差分析”選項;(2)單擊“確定”按鈕,執行“方差分析:單因素方差分析”對話框; “協方差”工具用來度量兩個區域中數據的關系,用于返回各數據點與其各自所在數據組的平均值之間的偏差乘積的平均值。 使用協方差工具可以用來確定兩個區域中數據的變化是否相關,即一個集合的較大數據是否與另一個集合的較大數據相對應(正協方差);或者一個集合的較小數據是否與另一個集合的較大數據相對應(負協方差);還是兩個集合中的數據互不相關(協方差為零)。協方差對度量單位是敏感的。 18名兒童身高、體重、表面積測定數據如下圖所示,試利用“協方差”分析工具分析身高、體重、表面積三個指標之間的關系。返回返回返回返回返回返回(1)執行菜單欄中的“工具”|“數據分析”命令,打開“數據分析”對話框,選中“分析工具”列表框中的“協方差”選項;(2)單擊“確定”按鈕,執行“協方差”對話框。 用于度量兩個數據集(可以使用不同的度量單位)之間的相關性,與兩組數據的相關分析和度量單位無關。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論