統計學基礎-NEW課件_第1頁
統計學基礎-NEW課件_第2頁
統計學基礎-NEW課件_第3頁
統計學基礎-NEW課件_第4頁
統計學基礎-NEW課件_第5頁
已閱讀5頁,還剩50頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計學基礎

講授者:李敬蘭郵箱:orchidlee@統計學基礎統計學基礎基礎知識*統計學基本問題*統計學研究對象和方法*統計學基本概念基礎技能*統計調查*統計整理分析技能*描述統計*推斷統計*社會經濟統計模塊一基礎知識統計學基本問題統計學的研究對象和研究方法統計學基本概念統計學的起源

以我國為例:時間夏禹時代封建社會迄今領域人口統計戶籍統計經濟、社會、生態、醫學個領域統計統計學的起源

以我國為例:時間夏禹時代封建社會迄今領域人口統計戶籍統計經濟、社會、生態、醫學個領域統計統計理論的產生和發展統計含義=統計工作+統計資料+統計學統計學性質:

統計學本身是一門科學、一種工具,當與其它領取(經濟、社會、醫學等)結合后,便具有更強的生命力!

派系國勢學派政治算術學派數學統計學派社會統計學派時間17世紀17世紀19世紀19世紀國別德國英國比利時德國代表人物康令&阿亨瓦爾約翰.格朗特

威廉.配第阿道夫.凱特勒恩格爾&梅爾應用領域國家各項事務

人口、軍隊、領土等各國綜合

實力比較統計學結合概率論,形成數

理統計研究社會現象

人口與工業調查統計學的幾個基本概念統計總體和總體單位小仔,醒醒,大魚要出現啦~~~~~!總體單位單位單位單位單位單位單位單位單位單位單位單位總體單位單位單位@統計總體特征:大量性、差異性、同質性(例:許多大小不一的蘋果)@統計總體分類:有限總體,例我國人口數量;無限總體,海洋里魚的數量。@總體與單位的聯系:可以相互轉化(例:某校各班打瞌睡的人數的單位是班級,而某班打瞌睡的人數的總體也是班級)標志和變量

1)含義:說明總體單位特征或屬性的名稱(性別、年齡等)

2)分類:標志品質標志數量標志可變標志不變標志按標志值性質分按標志值是否變化分用文字表示用數量表示變量定性變量隨機變量連續變量離散變量4)統計指標與標志統計指標標志

*區別:1)體現總體數量特征體現單位特征

如:某區國有企業總產值如:每個國有企業

2)必須可量未必都可量(如品質標志)*聯系:1)總體單位的數量標志

2)兩者可相互轉換5)統計指標體系

匯總/分析統計指標的數值匯總間接計算員工年工資總額員工年平均工資統計指標A統計指標B統計指標C相互聯系、相互補充:

例:每位員工年工資模塊二基礎技能

統計調查統計整理含義:收集被研究對象的各標志值的過程。要求:準確、及時、完整、系統。種類:方式:統計報表&普查&抽樣調查&重點調查

&典型調查&綜合運用各種調查方式步驟:確定調查目的、對象、項目、時間和期限;擬定調查表;確定實施計劃。方法:觀察&詢問調查&實驗&報告&網上調查調查問卷設計組織形式:統計報表&專門調查總體范圍:全面調查&非全面調查調查時間是否連續:連續&非連續調查搜集資料方法:直接&憑證&采訪&問卷調查調查時間周期長短:經常性&一次性調查范例重點:統計整理意義:科學整理統計調查所得資料,將其轉化為反映總體的基本統計指標。

步驟:制作統計表和統計圖統計匯總統計分組審核、訂正調查資料設計整理方案制作統計表和統計圖統計匯總統計分組審核、訂正調查資料設計整理方案制作統計表和統計圖統計匯總統計分組審核、訂正調查資料設計整理方案4)數量分組中常用的概念:

*全距R(極差)=最大變量值-最小變量值*組限*閉口組:上限和下限都具備,如(5,6),(100,200);開口組:只有上限或下限,如“5以上”,“10以下”。

*組距d=*組中值=重疊式組限(50~60,60~70,70~80)銜接式組限(1-2,3-5,6-9)各組變量值“含上限不含下限)重疊式組限的組距d=上限-下線銜接式組限的組距=相鄰組的下限-本組上限開口組的組距=相鄰組的組距2上限+下限=下限+2組距=上限-2組距分配數列

1)概念:統計整理結果的一種表現形式。

2)要素:總體所分各組&各組所占有的總體單位數(次數/

頻數)

3)分類:品質分配數列&變量分配數列

4)步驟:*排序:將原始資料按大小排序,以觀其分布特點;*全距:確定變動范圍和變動幅度;*組距:應是整數,最好是5或10的整數倍*組數=全距/組距*組限:變量相對集中,采用閉口式;變量相對分散,采用開口式;*編制變量分配數列

表1某零售企業集團30家連鎖店營業額分析表總標題橫欄標題按營業額分組(百萬元)頻數(家)頻率(%)累計頻數累計頻率向上累計向下累計向上累計向下累計80-90310.033010.0100.090-100310.062720.0907172456.780.0110-120930.0261386.743.3120-130413.3304100.013.3合計30100.0------------按營業額分組(百萬元)頻數(家)頻率(%)累計頻數累計頻率向上累計向下累計向上累計向下累計80-90310.033010.0100.090-100310.062720.0907172456.780.0110-120930.0261386.743.3120-130413.3304100.013.3合計30100.0------------縱欄標題指標數值主詞賓詞統計表

1)含義:用縱橫交叉的線條所繪制的用以表現統計資料的表格。

2)構成:詳見上一頁表1所示。

3)種類:按主詞分組狀況分為簡單表、分組表、復合表:*簡單表:主詞未經任何分組,僅羅列總體各單位的名稱或時期;*分組表:主詞只按一個標志分組;*復合表:主詞按兩個或以上的標志進行層疊分組。班級1班2班3班總人數656068按產業分組增加值(億元)比重(%)第一產業第二產業第三產業14628449352987916.350.333.4合計89442100組別人數(人)比重(%)女性教授非教授男性教授非教授

109020805451040合計2001004)統計表的設計原則

a.標題簡明、準確(內容、時間、空間);

b.計量單位必須注明在相應的縱欄標題上(若表中資料都屬同一計量單位,可將計量單位寫于表的右上方;

c.開口式設計,即左右兩邊不封口。表的上下橫線用粗線表示;

d.數字對齊,當有相同數值時應填寫該數,不能用“同上”、“同左”等字樣代替;若沒有數字或不應該有數字式,要用短線“——”表示;當缺乏某項資料室,可用省略號“……”表明,表示不是漏填;

e.若統計欄數較多,應加以編號,并可以表明其相互關系。主詞欄:(甲)、(乙)、(丙)等文字編號;賓詞欄:(1)、(2)、(3)等數字編號;

f.統計表的資料來源以及其他需要附加的說明可以寫在表的下端,以便核查。

統計圖

1)含義:用幾何圖形顯示統計資料的直觀、形象的形式。

2)種類:

A:條形圖:寬度相同,高度/長短不一的條形來比較。“條”可以換為圓柱、方體、椎體等。

某市2010年7月份各年齡人數統計分析圖某班同學每天看電視時間統計分析圖B.折線圖:用折線方式顯示數據的變化趨勢。C.餅狀圖:以圓的分割來表示總體的分組及結構情況。D.曲線圖:*含義:當變量和組數較多時,折線可以近似的表現為一條平滑的曲線,利用曲線的升降起伏反映現象的數量變動情況的圖形。*分類:

正態分布曲線右偏態分布曲線左偏態分布曲線U型分布曲線倒J形分布曲線J形分布曲線含義:描述一定條件下社會現象的總規模、總水平或工作總量的綜合指標,是最基本的統計指標。種類:1)反映內容:總體單位總量(單位個數的總和)總體標志總量(單位某一標志值的總和)例:調查全國工業企業的生產經營狀況,全國工業企業總數即為總體單位總量;體現各工業企業的生產經營狀況的各標志值之和即為總體標志總量,如全國工業企業的總產值、工業增加值、工資總額等;

2)反映時間:時期指標(時間段的總量)---產品產量、GDP等時點指標(時間點的總量)---年末職工數、月末庫存

3)計量單位:實物指標(實物單位計量的總量)--某市棉花產量;價值指標(貨幣單位計量的總量)--GDP/工資總額;勞動量指標(勞動量單位計量的總量)--出勤工時。總量指標計算方法

1)直接計算法:直接計數、點數和測量后加以匯總即得;

2)間接推算法:采用社會現象之間的平衡、因果、比例等關系推算總量的方法。例:利用產量、銷量計算產品庫存;利用樣本資料推斷某批次產品的合格率等。計算要點:

1)明確每項指標的含義和范圍;

2)注意現象的同質性;

3)正確確定每項指標的計量單位。含義:描述社會經濟現象的一般水平,數值表現為平均數,體現總體分布的集中趨勢。計算:1)算術平均數=總體標志總量/總體單位數根據計算復雜性,可分為:

A.簡單算術平均數

B.加權算術平均數平均指標2)調和平均數:

無論算術平均數,還是調和平均數,核心要點是抓住計算平均指標的基本原理,即平均指標=總量/數量。3)幾何平均數:適用于平均比率和平均速度指標的計算,又分為:

*簡單幾何平均數

*加權幾何平均數4)中位數:*含義:總體各單位按某一數量標志值排序后,居于中間位置的標志值,由于其位置居中,某些情況中可以反映現象的一般水平。

*種類:A.未分組資料:

第一步,排序:

第二步,確定中位數:

當n為奇數當n為偶數B.單項數列:第一步,計算累計次數∑f;第二步,確定中位數。

C.組距數列:第一步,計算累計次數∑f;第二步,計算中位數所在的組:(∑f)/2,即“中位數組”,該組的上、下限就規定了中位數的可能取值范圍。第三步,插值法計算中位數的近似值;

當∑f為奇數當∑f為偶數

下限公式(較小制累計時使用)

上限公式(較大制累計時使用)

5)眾數*含義:總體中出現次數最多的標志值。*計算:

A:單項數列:出現次數最多的標志值。

B:組距數列(必須是等距數列):

第一步:確定眾數所在的組,即眾數組;第二步:根據比值插值法推算眾數的近似值:

下限公式

上限公式

算術平均數、中位數(Me)、眾數(Mo)的關系對稱分布右偏分布左偏分布含義:說明總體各單位標志值之間差異程度的指標。種類:

1)全距R=最大標志值-最小標志值

2)平均差AD

的計算情況分為兩種:變異指標簡單平均法,適用于未分組資料加權平均法,適用于分組資料3)方差和標準差:

*計算標志值為數量標志的方差和標準差:*計算是非標志的方差和標準差:設標志值為“是”的概率為p,標志值為”非“的概率為q,則p+q=1.此時:

適用于分組資料適用于未分組資料4)離散系數(變異系數)V:

平均差系數標準差系數項目5動態數列動態數列概述水平分析速度分析趨勢分析動態數列概述

1)含義:又稱時間數列、時間序列。將某一指標在不同時間上的數值按時間順序排列的統計數列。

2)種類:按指標數值表現形式不同,分為:B.相對數動態數列A.絕對數動態數列C.平均數動態數列數值表現形式時間狀況(時期、時點)時期數列時點數列一般水平的變化過程或發展趨勢例:單位成本、平均畝產量數量對比關系或現象發展變化過程例:人口密度、人口自然增長率連續性取得、可加性、時間性一次性取得、不可加性、數值大小與時間長短無關3)編制原則:可比性

A.時間長短應該相等(特殊情況除外)即:時期指標所屬的時間長度應該相等;時點指標所間隔的時間長度應該相等。

B.總體范圍一致:即:隨時間的變動,總體的空間范圍不變,否則不滿足可比性。

C.經濟內容相同:即:明確指標的經濟內容,且保持一致。

D.指標的計算方法、計量單位和計算價格應該一致

水平分析發展水平

A.根據數值表現形式可分為絕對水平、相對水平、平均水平;

B.根據位置不同,可分為最初水平、中間水平和最末水平。

C.根據研究計算需要,可分為基期水平、報告期水平;平均發展水平增長量:逐期增長量累計增長量平均增長量=逐期增長量之和/逐期增長量項數

=數列末期累計增長量/數列項數-1絕對數動態數列相對數或平均數動態數列時期數列:簡單算術平均數時點數列連續時點間斷時點逐日連續分組連續簡單算術平均數加權算術平均數等間隔不等間隔首末折半法加權序時平均法速度分析發展速度=(報告期水平/基期水平)*100%

環比發展速度=報告期水平/前一期水平定基發展速度=報告期水平/固定期水平年距發展速度=本期發展水平/去年同期發展水平增長速度=(增長量/基期水平)*100%=發展速度-1

環比增長速度=逐期增長量/前一期水平定基發展速度=累計增長量/固定期水平年距發展速度=本期年距增長量/去年同期發展水平平均增長速度=平均發展速度-1平均發展速度:增長1%的絕對值=(逐期增長量/環比增長速度)*1%趨勢分析影響動態序列因素構成:

1)長期趨勢T:即持續向上、向下或持平的趨勢。(GDP)2)季節變動S:隨季節更替而出現有規律的變動。(交通客運量)

3)循環變動C:在若干年中發生的周期性起伏變動。(經濟發展周期)

4)不規則變動I:臨時的、偶然的、不明原因的影響而引起的隨機變動。(地震)長期趨勢T分析測定方法:

1)時距擴大法:增大時間間隔來編制新的動態數列。

2)移動平均法:計算移動序時平均數來編制新的動態數列。季節變動S分析方法:

1)按月(季)平均法:不考慮長期趨勢影響,直接計算。

2)移動平均趨勢剔除法:剔除長期趨勢后再求季節變動。項目6抽樣推斷概述抽樣誤差抽樣估計確定樣本容量概述

1.含義:研究總體中的部分單位,并以此推斷總體。

2.特點:隨機抽取單位、用樣本推斷總體、抽樣誤差可算可控。

3.應用:A、抽樣推斷能夠完成其他調查方式不能完成的調查任務;

B、修正和檢驗全面調查資料;

C、利用推斷的結果進行假設檢驗,對事物做出正確判斷;

D、對工業生產過程進行質量監控。

4.基本概念:a.全及總體:即統計總體,簡稱總體;

b.樣本總體:從總體隨機抽取部分單位的集合,又稱樣本;

c.參數:反映總體數量特征的綜合指標(平均數,頻率,標準差,方差)

d.統計量:反映樣本總體數量特征的綜合指標(樣本平均數、樣本頻率、樣本標準差、樣本方差)

5.抽樣方法:重置抽樣+不重置抽樣順序抽樣+非順序抽樣

6.抽樣組織形式:簡單隨機、類型(分層)、等距、整群、多階段抽樣抽樣誤差

1.含義:用樣本指標推斷總體指標所產生的偏差。

2.來源:登記誤差+代表性誤差(非隨機+隨機)

3.抽樣平均誤差:

A.含義:指抽樣平均數或抽樣成數的標準差。

B.定義式:樣本平均數的抽樣平均誤差樣本成數的抽樣平均誤差重置抽樣不重置抽樣重置抽樣不重置抽樣C.影響抽樣平均誤差的因素總體變異程度(正比)、樣本容量(反比)、抽樣方法(重置抽樣>不重置抽樣)、抽樣組織形式(整群抽樣常大于其他形式)4.抽樣極限誤差:5.抽樣誤差的概率度:

樣本平均數的抽樣極限誤差樣本成數的抽樣極限誤差抽樣估計

1.含義:利用樣本指標數值估計總體指標的數值

2.分類:

A.點估計:不考慮抽樣誤差,直接將樣本指標數值作為總體指標數值。

B.區間估計:將樣本指標數值+抽樣誤差來推算總體的指標數值。確定樣本容量總體平均數的估計區間總體成數的估計區間抽樣平均數的單位數抽樣成數的單位數重置抽樣不重置抽樣項目7相關與回歸分析相關分析

1.含義:現象之間相互聯系、相互制約的關系成為相關關系。

2.特點:現象間非確定性的相互依存。

3.種類:A.影響因素的多少:單相關、復相關

B.表現形態:直線相關、曲線相關

C.變動方向:正相關、負相關

D.密切程度:完全相關、不完全相關、不相關

4.分析步驟:

A.定性分析:利用理論知識和實際經驗判斷現象之間是否存在相關關系。

B.相關表/相關圖:利用圖、表粗略觀察相關關系的類型和相關程度的高低。

C.測定相關系數:(僅適用于兩個變量之間線性相關程度的測定)1)r的取值范圍【-1,1】;2)r=0,表明兩變量不相關;

r>0,表明正相關;

r<0,表明負相關;

r=1,表明完全正相關;

r=-1,表明完全負相關。回歸分析

1.含義:測定具有相關關系的現象之間的數量表達式。

2.種類:根據自變量的個數:一元回歸、多元回歸根據回歸線的形狀:線性回歸、非線性回歸

3.與相關分析的區別:

A.變量關系B.變量隨機性C.變量間關系的表現形式

4.一元線性回歸方程:

1)含義:y=a+bx2)前提:兩個變量之間存在顯著線性相關關系,且有一定數量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論