




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據的特征(第2-5章)
對經濟問題的大量分析離不開統計數據。在經濟計量學中,數據是不可或缺
的一個重要元素。沒有數據,一切都是空談。同樣地,清除地認識數據也非常有
助于經濟計量分析。這部分,我們在對數據特征總結的基礎上,借助EVicws實
現對數據的初步認識
1.數據來源
在經濟計量的實證研究中,獲得數據的方式主要有兩種:觀測數據和試驗數
據。前者可以通過一些免費或者付費的數據庫得到,后者需要進行統計試驗得到。
2.數據類型
統計數據一般有三種類型:
(1)橫截面數據:一個或多個變量在某一時點的數據集合。如2009年中
國各省的宏觀經濟數據。下表給出了1988年9月9個工業國的名義
利率(X)和通貨膨脹(Y)的數據,是一個截面數據的例子。
國家n%)M%)
澳大利亞11.97.7
加拿大9440
法國7.53.1
德國4.C1.6
意大利11.34.8
墨西哥66.351.0
瑞典2.22.0
英國10.368
美國7.64.4
資料來源:RudigerDormbush.SianleyFischer《宏觀經濟學3,第五版,1990.第652頁原始數據來
自國際貨幣基金組織出版的《國際金融統計》.
(2)時間序列數據:同一個體按時間順序排列的數據。如1978-2009年中
國的宏觀經濟數據。表1-1就是一個時間序列數據的例子。
表1-1城市勞動力參與率(CLFPR),城市失業率(CUNR)與真實的小時平均工資(AHE82K
年CLFPR(%)CUNR(%)AHE82/S
198063.87.17.78
198163.97.67.69
198264.09.77.68
198364.09.67.79
198464.47.57.80
198564.87.27.77
198665.37.07.81
198765.66.27.73
198865.95.57.69
19896655.37.64
19906655.67.52
199166.26.87.45
199266.47.57.41
19936636.97.39
199466.66.17.40
199566.65.67.40
199666.85.47.43
①AHE82代表1982年的平均小時工資(用美元計算)
資料來源:EconomicReportofthePresident,2PP7,CLFPRfromTableB-37.p.343.CUNRfromTableB-
4O.p.346.andAHE82fromTableB-45.p.352.
(3)面板數據:即包含時間序列數據,又包含橫截面數據。特別地,這里
的時間可以是不連續的,但截面個體是相同的。下表是一個面板數據
的例子。
美國、加拿大以及英國制造業的失業率和小時工資,19861999
美國加拿大英國
小時工費,失業率,小時工資,失業率,小時工資,失業率,
觀測值
美元/小時%美元/小時%美元/小時%
198055.67.149.07.243.77.0
198161.17.654.17.344.110.5
198267.09.759.610.642.211.3
198368.89.663.911.539.011.8
198471.27.564.310.937.211.7
198575.17.263.510.239.011.2
198678.57.063.39.247.811.2
198780.76.268.08.460.210.3
198884.05.576.07.368.38.6
198986.65.384.17.067.77.2
199090.85.691.57.781.76.9
199195.66.8100.19.890.58.8
1992100.07.5100.010.6100.010.1
1993102.76.995.510.788.710.5
1994105.66.191.79.492.39.7
1995107.95.693.38.595.98.7
1996109.35.493.18.795.68.2
1997111.44.994.48.2103.37.0
1998117.34.590.67.5109.86.3
1999123.24.091.95.7112.26.)
小時工奏以美元計,指數1992?100。
資料來源.:EconomicReportofthePresident,January2001.TalkBl09.n.399.
3.數據特征
在統計學中,把研究對象的全體稱為總體,組成總體的每個單位稱為個體,
總體中包含的個體數量稱為總體容量。實際上,總體通常不能被完全觀測到,或
者可能觀測成本非常高昂。也就是說,只能觀測到總體的一部分。由總體中的部
分個體組成的集合,成為樣本。樣本是總體的一個子集。由于樣本來自于總體,
所以樣本中的個體具有和總體個體相同的性質特征。樣本中所含個體的個數稱為
樣本容量。
由于總體是未知,我們只能利用樣本包含的關于總體的(不完全)信息來研
究總體可能具有的特征。利用樣本信息研究總體特征的方法稱為統計推斷,主要
包括參數估計和假設檢驗。特別地,樣本數據要能夠有效地反映總體特征,必須
具有代表性,這在很大程度上取決于樣本數據的選擇方法。常用的抽樣方法是簡
單隨機抽樣(SRS)
這里,我們從4個方面介紹樣本數據特征:集中趨勢、離散程度、分布狀況
和相關程度。考慮樣本容量為〃的樣本{汨,…,4}。
3.1集中趨勢特征
能夠反映樣本數據集中趨勢的統計量有樣本均值(mean)和中位數
(median)o樣本均值表示為
x=—Vx,(3-1)
y
中位數表示為
4號),〃為奇數
2(3-2)
|+),〃為偶數
其中工⑺表示樣本從小到大排列,位于第,個位置的觀測值。均值和中位數都可
以度量樣本的平均水平或者集中趨勢,但是前者適用于描述對稱分布的總體,而
后者適用于描述不對稱總體的分布,如收入。
3.2離散程度
描述樣本數據離散程度的特征包括極差(全距)、樣本方差和樣本標準差等。
極差定義為樣本數據最大值和最小值的差,表示數據的最大取值范圍。樣本方差
定義為
而標準差則為樣本方差的算術平方根5=正。樣本方差或者標準差度量了樣本
數據分布的離散程度,或者說樣本數據相對于平均水平的偏離程度。方差(或標
準差)越大,分布的離散程度越大;方差(或標準差)越小,分布的離散程度越
小,或者說分布越集中。
3.3分布狀況
前面關于集中趨勢和離散程度的統計量都可以反映樣本數據的分布狀況,除
此之外,反映分布狀況的統計量還有偏度和峰度.
偏度定義為
Xj-X(3-4)
偏度反映數據分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北省初中三年級下學期期末數學試題(含答案詳解)
- 2025年Python編程實務技巧試題及答案
- 班組長現場管理能力提升
- java面試題及答案對數據庫了解
- java面試題及答案github總結
- 產褥期護理措施
- 2025個人所得稅申報流程圖
- java面試題及答案11000素數
- 2025學年小學數學植樹問題應用題專項突破卷
- java面試題及答案bean
- 汽車制造業產品質量管理措施
- 中國老年患者術后譫妄防治專家共識
- 科學上海會考試卷及答案
- 中小學校園安全風險防控規范操作手冊與案例分析
- 大模型備案-落實算法安全主體責任基本情況-XX集團有限公司
- 重大危險源安全管理培訓
- 封閉管理的疫情防控課件
- 離婚協議書正規打印(2025年版)
- 門診口腔院培訓
- 世界各地文化創意產業發展報告表
- 園林植物養護管理 項目4 任務4.5行道樹整形修剪學習資料
評論
0/150
提交評論