




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
社會統計學重點章節講義第1頁,課件共52頁,創作于2023年2月2.1變量的類型定類變量定序變量定距/比變量第2頁,課件共52頁,創作于2023年2月2.1變量的類型級別測量等級變量類別統計內容性質低高名稱級定類變量頻數、交互等定性型(非數值型)—離散型順序級定序變量比較大小、強弱、差值無意義定量型(數值型)—離散型—連續型間隔級定距變量比較大小、順序及差值比例級定比變量零點有意義高測量級別的變量可當作低測量級別的變量來分析,反之不可。不同變量適合不同的統計方法(離散型、連續型)。第3頁,課件共52頁,創作于2023年2月2.2樣本分布描述樣本分布:概括而非具體描述圖表:頻數表條形圖直方圖統計量:分布的中心分布的形狀職業頻次比例(%)公司職員90345.2公務員1115.6個體戶/自營職業者1658.3專職家庭主婦24712.4學生23811.9合計2000100第4頁,課件共52頁,創作于2023年2月2.2樣本分布原始數據第5頁,課件共52頁,創作于2023年2月2.2樣本分布頻數表職業頻次比例(%)公司職員90345.2公務員1115.6個體戶/自營職業者1658.3專業技術人員(醫生/律師等)1185.9專職家庭主婦24712.4學生23811.9其他21810.9合計2000100第6頁,課件共52頁,創作于2023年2月2.2樣本分布條形圖(離散型變量)第7頁,課件共52頁,創作于2023年2月2.2樣本分布折線圖(離散型變量)第8頁,課件共52頁,創作于2023年2月2.2樣本分布直方圖(連續型變量)第9頁,課件共52頁,創作于2023年2月2.2樣本分布曲線圖(連續型變量)第10頁,課件共52頁,創作于2023年2月2.2樣本分布頻數/相對頻率全面直觀描述概括抽象描述分布的中心分布的形狀眾數中位數均值極差四分位數差標準差調查中最常用的統計量是均值和標準差均值和標準差分別是樣本的一階矩和二階矩定距/定比定距/定比定類定序定序定距/定比第11頁,課件共52頁,創作于2023年2月2.2樣本分布計算百分位數(中位數/四分位數)原始數據:觀測變量奇數個例:一個n=9的身高樣本163,170,176,150,168,171,170,181,179按大小順序重新排列:150,163,168,170,170,171,176,179,181中位數:第25百分位數為綠色數字的中位數,第75百分位數為藍色數字的中位數。
觀測變量偶數個(去掉一個170)n=8150,163,168,170,171,176,179,181中位數:第25百分位數為綠色數字的中位數,第75百分位數為藍色數字的中位數。
第12頁,課件共52頁,創作于2023年2月2.2樣本分布分組數據:組中值估算精確計算30%20%1511571631692%6%22%32%第13頁,課件共52頁,創作于2023年2月2.2樣本分布計算均值、標準差原始數據分組數據注意分母n為樣本數而非分組數自由度信息的個數第14頁,課件共52頁,創作于2023年2月2.3概率分布概率的定義和性質概率是隨著樣本量n越來越大時相對頻率的(統計意義下的)極限。所有概率之和等于1[0≤P(A)≤1]概率分布/總體分布總體矩:總體均值、總體標準差離散型變量:二項分布連續型變量:正態分布(大樣本時離散變量近似適用)第15頁,課件共52頁,創作于2023年2月2.3概率分布——標準正態分布Pr(Z≥1.64)=0.05Pr(Z≥1.96)=0.025第16頁,課件共52頁,創作于2023年2月學習重點抽樣調查的原理和方法描述性統計推斷性統計抽樣分布參數估計假設檢驗群體間的差異性檢驗變量間的關聯性分析第17頁,課件共52頁,創作于2023年2月3.1抽樣分布蒙特卡羅法第18頁,課件共52頁,創作于2023年2月3.1抽樣分布——連續型變量樣本分布概率/總體分布抽樣分布直方圖條形圖正態分布正態近似定理標準正態分布n越大,波動越小第19頁,課件共52頁,創作于2023年2月3.1抽樣分布——離散型、連續型變量樣本比例分布總體比例分布抽樣比例分布條形圖二項分布正態近似定理標準正態分布n越大,波動越小第20頁,課件共52頁,創作于2023年2月3.1抽樣分布示例:總體12345678910抽取2個樣本:1.5≤均值≤9.5抽取3個樣本:2≤均值≤9抽取4個樣本:2.5≤均值≤8.5抽取5個樣本:3≤均值≤8正態近似定理:在容量為n的非常簡單隨機樣本中,樣本均值以的標準誤差(σ為總體標準差)圍繞著總體均值μ波動。隨著n的增大,的分布也就圍繞其目標μ波動得越來越小,它也就越來越接近于正態(鈴狀)。總體數的大小N對的波動沒有影響無論總體是否呈正態分布,樣本的均值分布都接近正態隨著樣本增大,波動越來越小。第21頁,課件共52頁,創作于2023年2月3.2參數估計點估計:均值、比例區間估計:置信區間第22頁,課件共52頁,創作于2023年2月3.2參數估計——置信區間注意:此處為抽樣分布而非樣本分布。第23頁,課件共52頁,創作于2023年2月案例——估計當前市場容量B1在過去的三個月里,您家是否使用了純水? 1是,使用了 2沒有,沒有使用B1:過去三個月里使用純水的家庭比例P,據此估計總體比例π的95%置信區間:第24頁,課件共52頁,創作于2023年2月案例——估計當前市場容量B2在過去的三個月里,您家使用了多少桶純水?B2:月平均用水量,并據此估計總體平均用水量μ的95%置信區間:大樣本時,t值與Z值近似,故用此公式。第25頁,課件共52頁,創作于2023年2月案例——估計當前市場容量估算總量:純水家庭用戶數量(戶)=總戶數×家庭用戶總體比例家庭月用水總量(桶)=家庭用戶總體平均月用水量(桶)×純水家庭用戶數量(戶)已知:4個城區總戶數:327,314戶第26頁,課件共52頁,創作于2023年2月案例——估計當前市場容量統計結果:用戶規模樣本比例總體比例用戶總數(戶)8.3%6.4%~10.2%20,948~33,386月用水量樣本均值總體均值月總用水量(桶)3.262.55~3.9768,291~108,839第27頁,課件共52頁,創作于2023年2月3.3假設檢驗假設檢驗是定量研究的基本思想原假設(H0):0假設,無差異,不相關等備選假設(H1):大于、小于、不等于、有差異、有相關性等思想依據小概率事件原理:小概率事件在一次試驗中是幾乎不可能發生的第28頁,課件共52頁,創作于2023年2月3.3假設檢驗假設檢驗的幾種方法置信區間:設定計算置信區間檢驗參數檢驗:Z檢驗、t檢驗、F檢驗、卡方檢驗計算概值檢驗經典假設檢驗:設定計算臨界域檢驗第一類錯誤、第二類錯誤第29頁,課件共52頁,創作于2023年2月3.3假設檢驗利用置信區間進行假設檢驗兩個總體均值之差的置信區間估算公式:總體方差已知但不相等時:總體方差已知且相等時:第30頁,課件共52頁,創作于2023年2月3.3假設檢驗兩個總體比例之差的置信區間估算公式(大樣本公式):
第31頁,課件共52頁,創作于2023年2月3.3假設檢驗概值第32頁,課件共52頁,創作于2023年2月學習重點抽樣調查的原理和方法描述性統計推斷性統計群體間的差異性檢驗差異性檢驗的基本方法方差分析變量間的關聯性分析第33頁,課件共52頁,創作于2023年2月4.1差異性檢驗的基本方法單一樣本檢驗:置信區間t檢驗概值兩個獨立/配對樣本檢驗:置信區間t檢驗概值多個樣本:方差分析:F檢驗概值t、F越大,概值越小,H0越不可信。第34頁,課件共52頁,創作于2023年2月4.2方差分析統計量:F比值F的取值情況:如果為真,則F比值將圍繞1波動;如果不真,則F比值將傾向于大于1,而且F比值越大,原假設就越不可信。第35頁,課件共52頁,創作于2023年2月4.2方差分析第36頁,課件共52頁,創作于2023年2月案例:過去三月平均每戶用水量單一樣本t檢驗H0:6桶;H1:9.08桶檢驗值=6tdf雙側概值平均差異差值的95%置信區間下限上限用了多少桶水2.6650.0123.080.715.44概值小于0.05,可以在95%置信度下拒絕原假設。第37頁,課件共52頁,創作于2023年2月案例:過去三月平均每戶用水量兩個獨立樣本t檢驗全家平均月收入2000以下者:9.49桶全家平均月收入2000以上者:8.19桶假設:H0:低收入家庭—高收入家庭=0H1:低收入家庭—高收入家庭=1.3檢驗:置信區間:-3.806~6.403t=0.508;雙側概值=0.613﹥0.05結論:無法在95%置信度下拒絕原假設,低收入家庭與高收入家庭用水量無顯著差異第38頁,課件共52頁,創作于2023年2月案例:方差分析變量地區樣本量均值標準差95%置信區間最小值最大值下限上限
提前消費水平中國5000.72221.5125570.58930.8551108.879韓國5001.457181.793791.299571.6147908.399日本5001.38961.9984911.2141.5652011.999臺灣5002.685841.9900182.510982.86069011.999變差來源變差自由度方差F比值概值組間變差1004.4833334.82899.5060.000組內變差6716.36519963.365
總變差7720.8481999
第39頁,課件共52頁,創作于2023年2月學習重點抽樣調查的原理和方法描述性統計推斷性統計群體間的差異性檢驗變量間的關聯性分析回歸分析相關分析兩個定類變量——交互分析兩個定距變量——簡單積距相關第40頁,課件共52頁,創作于2023年2月5.1回歸分析在回歸分析中,斜率b的意義是X有一個單位的變化時Y伴隨著發生的變化量。要使的估計更加準確,研究者可以控制的方法主要有:
-減小總體標準差
-增加樣本量
-增加樣本的標準差Sx,即加大X的變化范圍啞變量
當自變量為定類變量時,需要引入啞變量(0-1變量)將數據轉化為數量型變量,進一步分析,啞變量的個數為(變量類型-1)第41頁,課件共52頁,創作于2023年2月5.1回歸分析估計總體回歸直線總體斜率的估計與檢驗:置信區間t檢驗:F檢驗:第42頁,課件共52頁,創作于2023年2月5.1回歸分析回歸模型擬合效果評價:決定系數:r2=0回歸的效果等于零或Y的變差中可被回歸解釋的比例為0;r2=1擬合的回歸模型解釋了Y中100%的變差。第43頁,課件共52頁,創作于2023年2月5.2簡單積距相關皮爾遜相關系數r=1:兩個變量有完全正向的線性聯系r=-1:兩個變量有完全負向的線性聯系r=0:兩個變量沒有線性聯系總體相關系數的檢驗置信區間(圖解法)t檢驗第44頁,課件共52頁,創作于2023年2月案例:過去用水量與今后用水量第45頁,課件共52頁,創作于2023年2月回歸與相關相關與回歸:維度相關回歸X與Y關系平等回歸子—響應變量要求X、Y都為隨機變量Y為隨機變量解釋的問題相對較少更廣泛第46頁,課件共52頁,創作于2023年2月5.3交互分析適用情形:兩個定類變量的關聯性檢驗方法:卡方檢驗卡方檢驗的局限性以及可能的補救辦法第47頁,課件共52頁,創作于2023年
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 千圖網特邀設計師
- 家務任務:成長必修課
- Ivacaftor-13C6-VX-770-sup-13-sup-C-sub-6-sub-生命科學試劑-MCE
- 福安經濟開發區鋰電新能源配套產業小微園區項目可行性研究報告
- 2025年航空發動機維修技術革新與維修政策法規解讀報告
- 2025年環境監測物聯網在環境監測領域的物聯網技術應用與產業發展報告
- 2025年醫療器械國產化替代的關鍵技術與產業布局報告
- 多式聯運信息平臺功能優化與協同發展在物流園區運營中的應用探索報告
- 教育信息化基礎設施建設在智能教育評價系統中的應用報告
- 2025年紡織服裝行業智能化生產智能化生產設備技術升級項目實施報告
- 2024年國家知識產權局知識產權發展研究中心招聘考試真題
- 四川綿陽公開招聘社區工作者考試高頻題庫帶答案2025年
- 《水利工程造價與招投標》課件-模塊六 招投標程序
- 關于水表考試題及答案
- 2025年安全管理員安全培訓考試試題(典型題)
- 短文選詞填空12篇(新疆中考真題+中考模擬)(解析版)
- 2025年中國黃石市寫字樓行業發展前景預測及投資方向研究報告
- 初中歷史論述題必需的24個答題模版
- 新能源發展與環境保護試題及答案
- 液晶彈性體在人工肌肉領域的新進展
- 中國海洋生態環境監測市場調查研究及行業投資潛力預測報告
評論
0/150
提交評論