數學統計案例解析(ppt 48頁).ppt_第1頁
數學統計案例解析(ppt 48頁).ppt_第2頁
數學統計案例解析(ppt 48頁).ppt_第3頁
數學統計案例解析(ppt 48頁).ppt_第4頁
數學統計案例解析(ppt 48頁).ppt_第5頁
已閱讀5頁,還剩42頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本資料來源,評分標準,第1題:25分,其中第1問5分,第2問和 第3問各10分。 第2、3、4題:各25分,其中 (1)正確應用統計方法5分; (2)正確使用Excel進行統計分析10分; (3)根據統計分析結果得出較有建設性的結論10分。,需交作業,Word紙質文檔一份,Excel函數(包括統計函數)的使用,選擇適當的函數值存放的單元格; 使用“插入”菜單“函數”選項,或使用“常用”工具欄中的“粘貼函數”按鈕進入“粘貼函數”對話框; 在“函數分類”列表中選擇“統計”,在“函數名”列表中選擇相應的函數(對話框內提示函數的語法和功能); 點擊“確定”按鈕,出現輸入數據或單元格范圍的對話框; 輸入

2、數據或單元格范圍; 點擊“確定”按鈕,在函數值存放的單元格即計算出(返回)函數值。,Excel制表、繪圖,(1)單擊“插入”菜單,選擇“圖表”選項,或單擊“常用”工具欄中的“圖表向導”按鈕,出現 “圖表向導 4步驟之1 圖表類型”對話框,在“圖表類型”列表中選擇相應的圖表。 (2)單擊“下一步”,出現“圖表向導 4步驟之2 圖表數據源”對話框,選擇數據區域。 (3)單擊“下一步”,出現“圖表向導 4步驟之3 圖表選項”對話框;選擇“數據標志”選項卡中的數據標志為“顯示百分比”。 (4)在“標題”選項卡中的圖表標題文本框中輸入圖的標題。 (5)在“圖例”選項卡中,點擊“顯示圖例”復選框使之被選中

3、,并在“位置”單選框中選擇“靠右” 。 (6)單擊“下一步”,出現“圖表向導 4步驟之4 圖表位置”對話框,當前的選擇表示該圖表作為對象(插入)顯示在“圖表”工作表內; (7)單擊“完成” 。,時間序列數據線圖,表示時間序列數據趨勢的圖形 時間一般繪在橫軸,數據繪在縱軸 圖形的長寬比例大致為10 : 7 4. 一般情況下,縱軸數據下端應從“0”開始,以便于比較。數據與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷,時間序列數據線圖,【例】我國19912003年城鄉居民家庭的人均收入數據如右表。試繪制線圖,時間序列數據線圖,指數平滑法(exponential smoothing),是加權平

4、均的一種特殊形式 對過去的觀察值加權平均進行預測的一種方法 觀察值時間越遠,其權數隨之呈現指數的下降,因而稱為指數平滑 有一次指數平滑、二次指數平滑、三次指數平滑等 一次指數平滑法也可用于對時間序列進行修勻,以消除隨機波動,找出序列的變化趨勢,一次指數平滑(single exponential smoothing),只有一個平滑系數 觀察值離預測時期越久遠,權數變得越小 以一段時期的預測值與觀察值的線性組合作為第t+1期的預測值,其預測模型為,Yt為第t期的實際觀察值 Ft 為第t期的預測值 為平滑系數 (0 1),一次指數平滑 ( 的確定),不同的會對預測結果產生不同的影響 當時間序列有較大

5、的隨機波動時,宜選較大的 ,以便能很快跟上近期的變化 當時間序列比較平穩時,宜選較小的 選擇時,還應考慮預測誤差 用誤差均方來衡量預測誤差的大小 確定時,可選擇幾個進行預測,然后找出預測誤差最小的作為最后的值,一次指數平滑 (例題分析),用Excel進行指數平滑預測 第1步:選擇【工具】下拉菜單 第2步:選擇【數據分析】,并選擇【指數平滑】,然后【確定】 第3步:當對話框出現時 在【輸入區域】中輸入數據區域 在【阻尼系數】( 注意:阻尼系數=1- )輸入的值 選擇【確定】,【例】對居民消費價格指數數據,選擇適當的平滑系數 ,采用Excel進行指數平滑預測,計算出預測誤差,并將原序列和預測后的序

6、列繪制成圖形進行比較,一次指數平滑 (例題分析),一次指數平滑 (例題分析),分類數據整理頻數分布表 (例題分析),【例】一家市場調查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調查。調查員在某天對50名顧客購買飲料的品牌進行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次 。右邊就是記錄的原始數據,使用Excel計數函數 (COUNTIF),如果只需要計算某一類別的數據個數,可以使用Excel中的統計函數【COUNTIF】。在對話框【Range】后輸入數據區域,在【Criteria】后輸入數字、表達式、字符串等,計數單元格必須符合的條件,即可得出結果

7、例如,我們要計算出可口可樂出現的頻數,在【Range】后輸入A1:A50(數據所在的區域),在【Criteria】后輸入“可口可樂”,結果為15。如果數據區域是數值型數據,計算符合特定條件的數據個數,則可在【Criteria】后輸入“某一數值”、“某一數值”、“=某一數值”,等等,使用Excel頻數函數 (FREQUENCY),Excel的【直方圖】工具的缺陷是:頻數分布及直方圖沒有與數據鏈接,當改變任何一個數據時,頻數分布表和直方圖不會跟著改變,使用統計函數【FREQUENCY】創建頻數分布表和直方圖可解決這一問題。具體步驟是: (1) 選擇與接受區域相臨近的單元格區域,作為頻數分布表輸出的

8、區域; (2)選擇統計函數中的【FREQUENCY】函數 (3)在對話框【Date-array】后輸入數據區域,在【Bins-array】后輸入接受區域 (4)按F2鍵,同時按下“Ctrl-Shift-Enter”組合鍵,即得到頻數分布,用Excel計算描述統計量,將120個銷售量的數據輸入到Excel工作表中,然后按下列步驟操作 第1步:選擇【工具】下拉菜單 第2步:選擇【數據分析】選項 第3步:在分析工具中選擇【描述統計】,然后選擇【確定】 第4步:當對話框出現時 在【輸入區域】方框內鍵入數據區域 在【輸出選項】中選擇輸出區域 選擇【匯總統計】 選擇【確定】,數據透視表,可以從復雜的數據中

9、提取有用的信息 可以對數據表的重要信息按使用者的習慣或分析要求進行匯總和作圖 形成一個符合需要的交叉表(列聯表) 在利用數據透視表時,數據源表中的首行必須有列標題,數據透視表(用Excel創建數據透視表),第1步:在Excel工作表中建立數據清單 第2步:選中數據清單中的任意單元格,并選擇【數據】菜單中的【數據透視表和數據透視圖】 第3步:確定數據源區域 第4步:在【向導3步驟之3】中選擇數據透視表的輸出位置,然后選擇【布局】 第5步:在【向導布局】對話框中,依次將“分類變量”拖左邊的“行”區域,上邊的“列”區域,將需要匯總的“變量” 拖至“數據區域” 第6步:然后單擊【確定】,自動返回【向導

10、3步驟之3】對話框。然后單擊【完成】 ,即可輸出數據透視表,方差分析?,分析4個行業之間的服務質量是否有顯著差異,也就是要判斷“行業”對“投訴次數”是否有顯著影響 作出這種判斷最終被歸結為檢驗這四個行業被投訴次數的均值是否相等 若它們的均值相等,則意味著“行業”對投訴次數是沒有影響的,即它們之間的服務質量沒有顯著差異;若均值不全相等,則意味著“行業”對投訴次數是有影響的,它們之間的服務質量有顯著差異,構造檢驗的統計量(計算總誤差平方和 SST),全部觀察值 與總平均值 的離差平方和 反映全部觀察值的離散狀況 其計算公式為,構造檢驗的統計量(計算組間平方和 SSA),各組平均值 與總平均值 的離

11、差平方和 反映各總體的樣本均值之間的差異程度 該平方和既包括隨機誤差,也包括系統誤差 計算公式為,前例的計算結果 SSA = 1456.608696,構造檢驗的統計量(計算組內平方和 SSE ),每個水平或組的各樣本數據與其組平均值的離差平方和 反映每個樣本各觀察值的離散狀況 該平方和反映的是隨機誤差的大小 計算公式為,前例的計算結果 SSE = 2708,構造檢驗的統計量(三個平方和的關系),總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和 (SSA) 之間的關系,SST = SSA + SSE,前例的計算結果 4164.608696=1456.608696+2708,構

12、造檢驗的統計量(計算均方MS),各誤差平方和的大小與觀察值的多少有關,為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差 由誤差平方和除以相應的自由度求得 三個平方和對應的自由度分別是 SST 的自由度為n-1,其中n為全部觀察值的個數 SSA的自由度為k-1,其中k為因素水平(總體)的個數 SSE 的自由度為n-k,構造檢驗的統計量(計算均方 MS),組間方差:SSA的均方,記為MSA,計算公式為,組內方差:SSE的均方,記為MSE,計算公式為,構造檢驗的統計量(計算檢驗統計量 F ),將MSA和MSE進行對比,即得到所需要的檢驗統計量F 當H0為真時,二者的比值服

13、從分子自由度為k-1、分母自由度為 n-k 的 F 分布,即,構造檢驗的統計量(F分布與拒絕域),如果均值相等,F=MSA/MSE1,統計決策, 將統計量的值F與給定的顯著性水平的臨界值F進行比較,作出對原假設H0的決策 根據給定的顯著性水平,在F分布表中查找與第一自由度df1k-1、第二自由度df2=n-k 相應的臨界值 F 若FF ,則拒絕原假設H0 ,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響 若FF ,則不拒絕原假設H0 ,無證據表明所檢驗的因素對觀察值有顯著影響,單因素方差分析表(基本結構),單因素方差分析(例題分析),用Excel進行方差分析 (Excel分析步驟)

14、,第1步:選擇【工具 】下拉菜單 第2步:選擇【數據分析】選項 第3步:在分析工具中選擇【單因素方差分析】 然后選擇【確定】 第4步:當對話框出現 在【輸入區域 】方框內鍵入數據單元格區域 在【】方框內鍵入0.05(可根據需要確定) 在【輸出選項 】中選擇輸出區域,相關分析,相關系數一般可以從正負符號和絕對數值的大小兩個層面理解。正負說明現象之間是正相關還是負相關。絕對數值的大小說明兩現象之間線性相關的密切程度。,(1)r的取值在-1到+1之間。 (2)r=+1,為完全正相關;r=-1為完全負相關。表明變量之間為完全線性相關,即函數關系。 (3)r=0,表明兩變量無線性相關關系。 (4)r0,

15、表明變量之間為正相關;r0,表明變量之間為負相關。 (5)r的絕對值越接近于1,表明線性相關關系越密切;r越接近于0,表明線性相關關系越不密切。,相關程度可分為以下幾種情況:, ,為無線性相關; 0.3 0.5,為低度線性相關; 0.5 0.8,為顯著線性相關; 0.8,一般稱為高度線性相關。 以上說明必須建立在相關系數通過顯著性檢驗的基礎之上。,利用EXCEL計算相關系數,以表1的資料為例,處理的簡要步驟與結果如 下: 在EXCEL主頁面中,從【工具 】【數據 分析】【相關系數】進入相關關系窗口做相 應處理得以下結果:,回歸分析,(一)回歸分析的概念和特點 1回歸分析的概念 回歸分析就是對具

16、有相關關系的變量之間數 量變化的一般關系進行測定,確定一個相關的 數學表達式,以便于進行估計或預測的統計方 法。,2回歸分析的特點,(1)在變量之間,必須根據研究目的具體確定哪些是自變量,哪個是因變量。 (2)回歸方程的作用在于,在給定自變量的數值情況下來估計因變量的可能值。一個回歸方程只能做一種推算。推算的結果表明變量之間具體的變動關系。,(3)直線回歸方程中,自變量的系數為回歸系數。回歸系數的符號為正時,表示正相關;回歸系數的符號為負時,表示負相關。 (4)確定回歸方程時,只要求因變量是隨機的,而自變量是給定的數值。,(二)一元線性回歸分析,1一元線性回歸模型的確定 設有兩個變量 和 ,變量 的取值隨變量 取值的變化而變化,我們稱 為因變量, 為自變量; 反之亦然。一般來說,對于具有線性相關關系的兩個 變量,可以用一條直線方程來表示它們之間的關系, 即: 倚 回歸方程: 倚 回歸方程:,建立一元線性回歸模型,【例】求不良貸款對貸款余額的回歸方程,回歸方程為:y = -0.8295 + 0.037895 x 回歸系數 =0.037895 表示,貸款余額每增加1億元,不良貸款平均增加0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論