統原PP第三章統計整理_第1頁
統原PP第三章統計整理_第2頁
統原PP第三章統計整理_第3頁
統原PP第三章統計整理_第4頁
統原PP第三章統計整理_第5頁
已閱讀5頁,還剩83頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1第三章第三章 統計整理統計整理第一節第一節 統計整理的概念和作用統計整理的概念和作用 一、統計整理的概念一、統計整理的概念統計整理 指根據統計研究的目的,將所搜集到的大量原始資料用 科學的方法進行分組匯總,使之系統化、條理化,成為 能夠反映事物總體特征的綜合資料的過程。統計整理一 般指初級資料整理,廣義的統計整理也包括次級資料的 再整理。手工整理 統計整理一般是為了某項統計研究或統計任務的特定目 的而進行的;由于受計算手段的限制,統計整理的主要 內容是匯總、分組、再加工,整理后的資料主要存儲在 紙介質上,然后按既定的目的使用。計算機整理 可以通過建立數據庫把這些寶貴的資料加以有序的排 列,儲

2、存在磁介質上,然后可以根據多方面、多層次隨 時發生的需要,多次使用于不同的目的,從而實現統計 數據的一源多用,信息共享。2使用電子計算機進行統計整理,不僅可以加快計算速度,擴大計算規模,提高計算準確性,而且可以大大增加統計信息的利用率。下面示意圖顯示計算機整理與手工整理獲得信息量的比較。在電子計算機整理條件下,統計整理的概念可以概括如下:統計整理 指根據研究的需要,將統計調查所得的原始資料或已加 工的綜合資料進行科學的處理和管理,包括對統計資料 的分組、匯總、加工、傳輸、存儲、更新,使之系統化 條理化,反映事物的總體特征,并在建立數據庫的基礎 上達到一源多用。3二、統計整理的作用二、統計整理的

3、作用(意義意義)1統計整理是承前啟后的環節 統計調查搜集到的統計資料是個 別的、分散的,不能反映總體的綜合數量特征,達不 到認識社會經濟現象總體的目的。因此在統計調查之 后,統計分析之前,需要把原始資料系統化、條理化, 使其能夠反映事物總體特征。2統計整理是認識過程中的一個重要階段 從認識過程來看,社 會經濟統計是一種從個體的實際表現到總體的綜合數 量表現的認識過程,也是從對現象的感性認識到對現 象的規律性認識。3統計整理是統計分析的基礎工作 統計整理的目的,是為統計 分析準備系統化、條理化的綜合資料。統計分析是要 找出事物數量關系的規律性,得到對社會經濟現象的 系統的、深刻的認識。統計整理可

4、以從原始數據中獲 得大量新的信息,以滿足統計分析的需要。4三、統計整理的內容三、統計整理的內容 (一)統計數據處理1.分組 統計分組的目的在于將同質總體中具有不同特點的單位按 一定標準區分為幾個不同的類型,從而更深入地研究總體 的特征,這是完成從個體數據向總體數據轉化的關鍵一步。2.匯總 確定統計分組后,還需要將原始數據按分組標志進行綜合,這一過程稱為統計匯總,在不需要分組時,統計匯總是指 直接對各調查單位的數據進行綜合的過程。匯總的結果為 各種總量指標,包括標志總量和總體總量。3.制表 統計資料經過分組、匯總形成了說明總體情況的統計資料 這些資料還需要用一定的形式來表現,統計表是最常用的 表

5、現形式。統計表能有條理地排列統計資料,科學地組織 統計資料、系統地積累統計資料,使人們在利用統計資料 進行分析對比、研究和了解情況時十分方便。5(二)統計數據管理1.傳輸 傳輸是指統計數據在不同單位之間的傳遞、輸送。統計數據 傳輸經歷過人工護送、郵寄報表、電話、傳真和寄送軟盤、 磁帶等幾種方式,現在用計算機聯網、遠程通訊傳輸。2.存儲 存儲是指如何保存統計數據。傳統的保存數據方式是存儲在 紙介質上,或者報表、或者資料本,這使得查閱資料很麻煩 新的存儲方式主要存放在磁介質或微縮膠片上。統計數據庫 的建立,是統計資料的存儲和管理的核心,也是統計數據 源多用的關鍵。3.更新 由于統計信息具有一定的時

6、效性,反映一定內容的統計資料 在段時間以后就會失效,這就要不斷補充新的統計資料, 代替己失效的資料,這就是統計資料的更新。4.輸出 輸出是指統計資料整理結果的表達。數據處理階段的制表是 一種輸出方式,還可以以計算機屏幕顯示、打印數字、制圖 等不同的方式輸出。6第二節第二節 統計整理的組織與技術統計整理的組織與技術 一、統計整理的步驟p42 統計整理首先都做以下兩步工作:1設計和編制統計資料整理方案,確定整理工作的具體規劃和要 求,這是整理工作的指導性文件。2對原始資料進行審核,審核它們是否準確、完整,如果發現問 題,要進行必要的補充、調整、糾正,這是統計整理的前提。 在手工整理條件下,統計整理

7、的步驟可用下圖表示。7在計算機整理條件下,統計整理的步驟可用下圖表示。8 3.對調查資料進行分組、匯總、計算對調查資料進行分組、匯總、計算 依照一定標志,對調查資料進行分組。按分組的要求,對各項數字進行匯總,計算分組單位數、總體單位數、分組標志總量和總體標志總量。 4.對匯總后的調查資料審核對匯總后的調查資料審核 對整理好的資料再一次進行審核,改正匯總過程中所發生的各種差錯。匯總后審核可以從以下幾方面進行: 1)復計審核,即對每個指標數值進行復核計算; 2)表表審核,即審核不同統計表上重復出現的同一指標數值是否一致,對統計表中互有聯系的各個指標數值,則審核它們之間是否銜接和符合邏輯性; 3)表

8、實審核,即對匯總得到的指標數值,與了解的實際情況聯系起來進行檢查; 4)對照審核,即對某些統計、會計、業務三種核算都進行計算的指標數值,應進行相互對照檢查,看數字是否相同。 5.編制統計表、繪制統計圖編制統計表、繪制統計圖 把整理好的統計資料用統計表或統計圖的形式表現出來,以簡明扼要地表現社會經濟現象在數量方面的具體特征和相互關系。9二、統計整理的組織形式二、統計整理的組織形式(一)逐級整理 按照一定的統計管理體制對原始資料自下而上, 逐級地匯總整理。我國現行統計報表較多是采用 這種整理方式,專門調查的資料也有不少是采用 這種整理形式。這種整理形式的優點是可以就地 在較小范圍內對數字資料進行及

9、時檢查和核對, 資料也能及時提供給各級領導;缺點是匯總層次 多,反復轉錄,易出現差錯。(二)集中整理 把全部原始資料集中在一個機關直接進行整理, 對于十分重要的或要求時效性極高的調查,往往 采取這種整理形式。優點是便于采用計算機整 理,能夠提高資料的準確性和利用率;缺點是對原始資料的差錯不易及時發現和改正,整理結果不能及時滿足本地區、本部門的需要。 (三)逐級整理與集中整理相結合 兼有二者的優點。10三、三、 統計整理的技術統計整理的技術 1、手工整理技術、手工整理技術(1)劃記法)劃記法 用點、線或其它符號計算各組和總體單位數的方用點、線或其它符號計算各組和總體單位數的方 法,常用的符號有法

10、,常用的符號有“正正”字或字或“冊冊”等,劃記法簡便易行,等,劃記法簡便易行, 但容易出現漏錯,只適用于總體單位不太多的情況。但容易出現漏錯,只適用于總體單位不太多的情況。(2)過錄法)過錄法 將分散的原始資料過錄到預先設計好的整理表上,將分散的原始資料過錄到預先設計好的整理表上, 并計算出各種合計數,然后再填到綜合統計表上去。并計算出各種合計數,然后再填到綜合統計表上去。過錄法匯總的內容比較全面,但工作量比較大。過錄法匯總的內容比較全面,但工作量比較大。(3)折疊法)折疊法 將所有的調查表需要匯總的項目及其數值全部折在將所有的調查表需要匯總的項目及其數值全部折在 邊上,一張接一張地疊在一起直

11、接加總。這個方法邊上,一張接一張地疊在一起直接加總。這個方法 簡單易行,報表匯總常用此法,但匯總時必須細致。簡單易行,報表匯總常用此法,但匯總時必須細致。(4)卡片法)卡片法 一個調查單位用一張卡片,將這個單位的有關資料一個調查單位用一張卡片,將這個單位的有關資料 全部摘錄在卡片上,利用卡片作為分組計數的工具,全部摘錄在卡片上,利用卡片作為分組計數的工具, 加總總體單位數和標志值。這個方法比較準確可靠,加總總體單位數和標志值。這個方法比較準確可靠, 但比較費工費時。但比較費工費時。112、計算機數據處理的組織技術、計算機數據處理的組織技術(1)選擇計算機軟件包或自編程序)選擇計算機軟件包或自編

12、程序 為一般用戶著想軟件包中大為一般用戶著想軟件包中大 部分具有數據處理功能,例如部分具有數據處理功能,例如spss、lotus、 sas、tsp、minitab等。等。(2)編碼)編碼 統計調查表中有兩種信息,一種是數字信息,如某人統計調查表中有兩種信息,一種是數字信息,如某人 18周歲,某企業某月總產值為周歲,某企業某月總產值為120萬元;另一種萬元;另一種 是文字信息,如某人為男性,朝鮮族,高中畢是文字信息,如某人為男性,朝鮮族,高中畢 業。前者可以直接錄入計算;后者必須根據統計分組業。前者可以直接錄入計算;后者必須根據統計分組 編碼的規定,將文字信息轉化為數字信息,如男編碼的規定,將文

13、字信息轉化為數字信息,如男 性編碼為性編碼為1,朝鮮族為,朝鮮族為10,高中畢業為,高中畢業為03。(3)數據錄入)數據錄入 編碼之后的調查表只有數字符號,采用手工錄入編碼之后的調查表只有數字符號,采用手工錄入 或光電錄入。或光電錄入。 (4)數據編輯)數據編輯 讓計算機對數據進行自動檢查或修改,或者讓計算機對數據進行自動檢查或修改,或者由計由計 算機打印錯誤清單算機打印錯誤清單,由人工進行檢查更正。,由人工進行檢查更正。(5)計算與制表)計算與制表 根據事先編好的程序,對數據進行計算和制表,根據事先編好的程序,對數據進行計算和制表,得出所需要的各種分組匯總表或各種排序表。得出所需要的各種分組

14、匯總表或各種排序表。12第三節第三節 統計分組統計分組一、概念一、概念 根據統計研究的任務和現象的特點,按照一根據統計研究的任務和現象的特點,按照一定的標志把定的標志把 總體劃分為若干組成部分,每一部分稱為總體劃分為若干組成部分,每一部分稱為組。組。 就總體而言為就總體而言為“分分”,就個體而言為,就個體而言為“組組”; 以分組標志為準,以分組標志為準,“同者歸類,異者區分同者歸類,異者區分”二、作用二、作用 1、劃分社會現象的不同類型,稱為、劃分社會現象的不同類型,稱為類型分組類型分組; 2、反映社會現象的內部結構,稱為、反映社會現象的內部結構,稱為結構分組結構分組; 3、分析現象之間的依存

15、關系,稱為、分析現象之間的依存關系,稱為分析分組分析分組; 4、經過統計分組整理后,可以發現零星分散統、經過統計分組整理后,可以發現零星分散統計資料的特點與規律。計資料的特點與規律。13第三節第三節 統計分組統計分組三、方法三、方法 1、分組標志的選擇、分組標志的選擇 反映本質特征和內在聯系的標志反映本質特征和內在聯系的標志1)根據統計研究的目的與任務選擇分組標志)根據統計研究的目的與任務選擇分組標志如果研究的目的是要分析不同經濟類型的企業在總體中的構成,那么就要選如果研究的目的是要分析不同經濟類型的企業在總體中的構成,那么就要選擇經濟類型作為分組標志;如果要研究工業企業規模構成狀況,則可以選

16、擇擇經濟類型作為分組標志;如果要研究工業企業規模構成狀況,則可以選擇產值、固定資產原值等作為分組標志。產值、固定資產原值等作為分組標志。2)要從眾多標志中,選擇最能反映被研究現象本質特征的標志作分組標志)要從眾多標志中,選擇最能反映被研究現象本質特征的標志作分組標志職工家庭成員人均收入水平更能反映職工生活水平的高低,更能反映現象的職工家庭成員人均收入水平更能反映職工生活水平的高低,更能反映現象的本質特征,因為,即使某一職工工資水平較高,但如果他贍養的人口數很多本質特征,因為,即使某一職工工資水平較高,但如果他贍養的人口數很多的話,其家庭生活水平也不會很高。的話,其家庭生活水平也不會很高。3)根

17、據現象所處的歷史條件或經濟條件來選擇標志)根據現象所處的歷史條件或經濟條件來選擇標志在生產力水平較低的情況下,用職工人數的多少來表示企業規模的大小比較在生產力水平較低的情況下,用職工人數的多少來表示企業規模的大小比較適當;而在技術進步的歷史時期或技術裝備比較先進的情況下,有的企業由適當;而在技術進步的歷史時期或技術裝備比較先進的情況下,有的企業由于采用了機械化生產,雖然職工數不多,但生產能力卻很大。于采用了機械化生產,雖然職工數不多,但生產能力卻很大。4)此外,在選擇分組標志時,還要遵循窮盡性和互斥性兩個原則。)此外,在選擇分組標志時,還要遵循窮盡性和互斥性兩個原則。 2、分組界限的確定、分組

18、界限的確定 相鄰組間的性質界限或數量界限相鄰組間的性質界限或數量界限 品質標志分組品質標志分組 屬性差別屬性差別(類型、結構,規定分類標準目錄類型、結構,規定分類標準目錄) 數量標志分組數量標志分組 數量差異數量差異(分析、質變界限,成績、計劃分析、質變界限,成績、計劃) (1)單項式分組:即每)單項式分組:即每一組只包含一個變量值。一組只包含一個變量值。 (2)組距式分組:即在變量值變異幅度較大時,將變量值取值范圍人為的劃分為若干個區間 四、統計分組體系四、統計分組體系 對同一總體進行多種分組而形成的相互聯系、對同一總體進行多種分組而形成的相互聯系、 相互補充的系統,稱為分組體系。相互補充的

19、系統,稱為分組體系。 1、簡單分組和平行分組體系。、簡單分組和平行分組體系。2、復合分組和復合分組體系、復合分組和復合分組體系。14簡單分組和平行分組體系簡單分組和平行分組體系 復合分組和復合分組體系復合分組和復合分組體系按院系分組按院系分組按性別分組按性別分組農學院農學院動科院動科院林學院林學院男男女女學生人數學生人數院院 系系農學院農學院動科院動科院林學院林學院性性 別別男男女女男男女女男男女女男男女女學生人數學生人數15理工科理工科研究生研究生本科生本科生專科生專科生男生男生女生女生男生男生女生女生男生男生女生女生文科文科研究生研究生本科生本科生專科生專科生男生男生女生女生男生男生女生女

20、生男生男生女生女生16第四節第四節 次數分布和統計表次數分布和統計表 、次數分布的概念、次數分布的概念次數分布次數分布 在統計分組的基礎上,將總體中的所有單位按組歸類整在統計分組的基礎上,將總體中的所有單位按組歸類整 理,形成總體單位數在各組的分布,叫做次數分布,也理,形成總體單位數在各組的分布,叫做次數分布,也 稱為分布數列,或稱分配數列。稱為分布數列,或稱分配數列。頻數與頻率頻數與頻率 各組單位的次數,又稱頻數;各組次數與總次數之比各組單位的次數,又稱頻數;各組次數與總次數之比 稱為頻率。稱為頻率。分分 類類 根據分組標志的不同,分布數列可以分為品質分布數列根據分組標志的不同,分布數列可以

21、分為品質分布數列 和變量分布數列兩種。和變量分布數列兩種。 按品質標志分組所編制的分布數列叫做按品質標志分組所編制的分布數列叫做品質數列品質數列; 按數量標志分組所編制的分布數列叫按數量標志分組所編制的分布數列叫 做做變量數列變量數列。 (1)單項式分配數列()單項式分配數列(2)組距式分配數列)組距式分配數列 意意 義義 次數分布是統計整理的一種重要形式,它可以表明總體次數分布是統計整理的一種重要形式,它可以表明總體 的分布特征、結構情況,并據以研究總體某一標志的平的分布特征、結構情況,并據以研究總體某一標志的平 均水平及其變動的規律性。均水平及其變動的規律性。17分布數列分布數列品質數列品

22、質數列(品質標志分布數列品質標志分布數列)變量數列變量數列(數量標志數量標志分布數列分布數列)單項數列單項數列 (一個變量值作為一個組一個變量值作為一個組)組距數列組距數列(變量值變量值劃分區間劃分區間作組作組)等距數列等距數列(各組組各組組距都相等距都相等) (便于對便于對比、計算、比、計算、繪圖繪圖)上限上限下限下限組限組限開口組開口組閉合組閉合組組距組距=上限上限-下限下限全距全距=組距組距 =組數組數組距組距組中值組中值=下限下限+組距組距2 =上限上限-組距組距2異距數列異距數列(類型分類型分組、結構組、結構分組分組)開口組的組距組中值按照相鄰組計算開口組的組距組中值按照相鄰組計算1

23、8 在組距數列中,需要明確以下幾個概念:在組距數列中,需要明確以下幾個概念:l組限:組距數列中,各組的界限稱為組限。組限:組距數列中,各組的界限稱為組限。組限又分為上限和下限。下限是每組最小組限又分為上限和下限。下限是每組最小的標志值,上限是每組最大的標志值。如的標志值,上限是每組最大的標志值。如標志值標志值150160元一組,元一組,150元和元和160元是元是組限,組限,150元為下限,元為下限,160元為上限。元為上限。 組距數列中,如果各組的組限都齊全,稱組距數列中,如果各組的組限都齊全,稱為閉口組;若組限不齊全,即有上限缺下為閉口組;若組限不齊全,即有上限缺下限或有下限缺上限,稱為開

24、口組。限或有下限缺上限,稱為開口組。19l組距:每組下限與上限之間的距離叫組組距:每組下限與上限之間的距離叫組距。每組組距等于上限與下限之差,即距。每組組距等于上限與下限之差,即組距組距= =上限下限。標志值上限下限。標志值150150160160元組元組的組距的組距=160=160元元150150元元=10=10元。元。組距又有兩種表現形式:一種是各組組距組距又有兩種表現形式:一種是各組組距都相等,稱為等距。這樣的組距數列稱都相等,稱為等距。這樣的組距數列稱為等距數列。一種是各組組距不完全相為等距數列。一種是各組組距不完全相等,稱為異距。這樣的組距數列稱為異等,稱為異距。這樣的組距數列稱為異

25、距數列,也稱不等距數列。距數列,也稱不等距數列。20l組中值:每組下限與上限之間的中點數組中值:每組下限與上限之間的中點數值叫組中值。組中值等于下限與上限和值叫組中值。組中值等于下限與上限和的一半。的一半。標志值標志值150160元組元組2上限下限即組中值(元)組中值1552160150212鄰組組距該組上限缺下限組組中值若若 “ “160160元以下元以下”,則,則 元該組組中值1552101602鄰組組距該組下限缺上限組組中值若若 “ “200200元以上元以上”,則,則 元該組組中值20521020022 確定組數時,還可以利用美國學者斯特基斯(hasturges)提出的經驗公式。其公式

26、如下: (其中n為標志值項數) 不過這一公式不是在任何情況下都必須遵守的法則,它只適用于總體趨于正態分布的條件下進行等距分組的情況。而且,利用斯特基斯公式確定組數時,如果數據個數少,則確定的組數數值過大;數據個數多,則確定的組數數值過小。所以,在實際工作中,這一公式作為組數確定的參考公式運用是可以的,但不必嚴格地根據公式所確定的組數執行。nlg322. 31組數23全距、組數和組距的關系用公式表達如下kri minmaxxxrirkmaxxminx組距,全距,組數,最大變量值,最小變量值24 以上計算結果只是一個參考數值,為計算方便,實際工作中一般組距取5或10的整數倍。當然也可以先確定組距,

27、再確定組數。 例如,編制上例某縣城40戶居民家庭人均月消費性支出分配數列時,其組數確定為: 組數=1+3.322lg40=6.32 因此,可以取整數6為組數。則: (元) 組距可以取為50元。17.486289kri25品質數列品質數列 .性別性別x學生人數學生人數f比重比重(%)男男3060女女2040合計合計50100 x產值產值(萬元萬元)f比重比重(%)農農 業業5025工工 業業7035建筑業建筑業3015運輸業運輸業157.5商商 業業3517.5合合 計計20010026按輕工工業分組按輕工工業分組企業數(萬個)企業數(萬個) 占總數的比重(占總數的比重(% %)輕工業輕工業36

28、6.1366.170.670.6重工業重工業152.4152.429.429.4合計合計518.5518.5100.0100.0表表 我國某年工業企業按輕重工業分組資料我國某年工業企業按輕重工業分組資料27單項數列單項數列.年齡年齡x學生人數學生人數f比重比重19510202040211530221020合計合計50100養豬頭數養豬頭數x學生人數學生人數f比重比重02512.517537.52804032010合計合計20010028擁有發電機組擁有發電機組(套)(套)發電廠數(個)發電廠數(個)比率(比率(% %)1 1353528.028.02 2484838.438.43 326262

29、0.820.84 412129.69.65 54 43.23.2合計合計125125100.0100.0例如,某電業局發電廠按擁有發電機組的套數分組,例如,某電業局發電廠按擁有發電機組的套數分組,可編成如下變量數列:可編成如下變量數列:29等距數列等距數列.身高分組身高分組(cm)學生人數學生人數f比重比重160以下以下1020160-1702040170-1801530180以上以上510合計合計50100按收入分組按收入分組人口數人口數f比重比重800以下以下1507.5800-1200105052.51200-1600600301600以上以上20010合計合計200010030異距數列

30、異距數列.年齡分組年齡分組人口數人口數f比重比重0-7808.07-161401416-606206260以上以上16016合計合計100010031二、次數分布的表示方法二、次數分布的表示方法 (一)列表法(一)列表法 用統計表來表示次數分布,稱為列表法。用統計表來表示次數分布,稱為列表法。學生考試成績組距數列表學生考試成績組距數列表 頻數是分布在各組的學生數,頻率是各組學生數與學生總數之比,又叫比重頻數是分布在各組的學生數,頻率是各組學生數與學生總數之比,又叫比重。分分 數數(上組限上組限不在內不在內) 組中值組中值x 學生數學生數f(頻數頻數) 比重比重(頻率頻率)向上累計向上累計次數次

31、數(小小于上限于上限) 向下累計向下累計次數次數(大大于下限于下限) 密度次數密度次數(組次數組次數組距組距) 4050506060707080809090100 455565758595 1581394 0.0250.1250.2000.3250.2250.100 1614273640 40393426134 0.10.50.81.30.90.4 合合 計計 4010004.032累計次數累計次數 把各組次數累計起來叫做累計次數分布,可據以研究在把各組次數累計起來叫做累計次數分布,可據以研究在 一定組限值以上或以下的次數總和。累計次數又分向上一定組限值以上或以下的次數總和。累計次數又分向上

32、累計和向下累計兩種。累計和向下累計兩種。向上累計向上累計 用小于各組上限的次數累計計算,即從分組資料小值一用小于各組上限的次數累計計算,即從分組資料小值一 端開始累計;端開始累計;向下累計向下累計 用大于各組下限的次數累計計算,即從分組資料大值一用大于各組下限的次數累計計算,即從分組資料大值一 端開始累計,累計次數到總次數止。端開始累計,累計次數到總次數止。密度次數密度次數 密度次數組次數組距。它與比重次數的關系是:在密度次數組次數組距。它與比重次數的關系是:在 等距數列中兩者作用相同,但在異距數列中兩者作用不等距數列中兩者作用相同,但在異距數列中兩者作用不 同,在異距數列中的密度次數,可使不

33、可比的次數變為同,在異距數列中的密度次數,可使不可比的次數變為 可比,可比,用可比次數作圖或分析計算才有意義用可比次數作圖或分析計算才有意義。由于異距。由于異距 數列的密度次數不同于原次數,用這兩種次數計算結果數列的密度次數不同于原次數,用這兩種次數計算結果 也不同,當以密度次數為準。也不同,當以密度次數為準。33(二)圖示法(二)圖示法 直觀地顯示次數分布的特征,可用統計圖來表示次數分布,直觀地顯示次數分布的特征,可用統計圖來表示次數分布,這一方法稱為圖示法。常用的表示次數分布的圖形有直方圖、折這一方法稱為圖示法。常用的表示次數分布的圖形有直方圖、折線圖和曲線圖。線圖和曲線圖。1直方圖直方圖

34、 即用直方形的寬度和高度來表示次數分布的圖形。例:即用直方形的寬度和高度來表示次數分布的圖形。例:直方圖的各直方形的寬度相等,都是等組距直方圖的各直方形的寬度相等,都是等組距10分,高度是各組學分,高度是各組學生人數(次數)、各直方形的高低表示各組次數的多少。生人數(次數)、各直方形的高低表示各組次數的多少。34 統計圖統計圖0 90 100 110 120 130 140 150 0 90 100 110 120 130 140 150 (完成(完成% %)15151010 5 5人人數數直方直方圖圖 橫軸表橫軸表示各組示各組組限組限 縱軸表示次縱軸表示次數(一般標數(一般標在左方)和在左方

35、)和比率(一般比率(一般標在右方)標在右方)352折線圖折線圖 用連續的折線來表示次數分布的圖形。例如,用分組用連續的折線來表示次數分布的圖形。例如,用分組 資料的組中值作橫軸尺度,學生人數(次數)作縱軸尺資料的組中值作橫軸尺度,學生人數(次數)作縱軸尺 度,然后用組中值度,然后用組中值x和組次數和組次數f畫出坐標點,將各坐標點畫出坐標點,將各坐標點 連接起來,就是折線圖。也可把各直方形頂邊的中點用連接起來,就是折線圖。也可把各直方形頂邊的中點用 直線連接而成。直線連接而成。36 用折線圖還可以表示累計次數的分布,由于累計次數分為向用折線圖還可以表示累計次數的分布,由于累計次數分為向上累計和向

36、下累計,也可以畫出向上累計次數分布折線圖和向下上累計和向下累計,也可以畫出向上累計次數分布折線圖和向下累計次數分布折線圖。圖中向上累計折線圖用各組上限與累計次累計次數分布折線圖。圖中向上累計折線圖用各組上限與累計次數畫坐標點,向下累計折線圖用下限畫坐標點,把兩條累計線畫數畫坐標點,向下累計折線圖用下限畫坐標點,把兩條累計線畫在一個圖上,兩線有一個交點,在累計次數尺度上是總次數的一在一個圖上,兩線有一個交點,在累計次數尺度上是總次數的一半(本例為半(本例為= 20人),在分數尺度上為人),在分數尺度上為74.6分,這是本數列的中分,這是本數列的中位數位數me,在此分數上下各有,在此分數上下各有2

37、0人。人。373曲線圖曲線圖 即用曲線來表示次數分布的圖形。變量數列所表達的次即用曲線來表示次數分布的圖形。變量數列所表達的次數分布,有經驗分布與理論分布之別。根據項數有限的隨機樣本數分布,有經驗分布與理論分布之別。根據項數有限的隨機樣本編制的變量分組數列所畫出的是編制的變量分組數列所畫出的是折線圖折線圖,理論分布是假定資料,理論分布是假定資料項項數無限多,組距無限小時數無限多,組距無限小時經驗分布的漸近分布,可用數學方法推經驗分布的漸近分布,可用數學方法推導出來,畫出的圖形是平滑曲線。理論分布在數理統計中有十分導出來,畫出的圖形是平滑曲線。理論分布在數理統計中有十分重要的用途。重要的用途。3

38、84.圓形圖圓形圖 圓形圖(pie chart)又叫餅形圖,是用圓形的面積大小來表示統計資料的圖形,多以圖形內扇形面積的大小表示現象數值的大小或現象各部分所占的比重的圖形結構,例如,根據表3-7的資料可畫圓形圖,如圖3-3所示。圓形圖常常用于總體各部分的結構比例。對于顯示較少的數據點很有效,但數據量太大時則很難說明問題。39圖圖3-3 2006年中國國內生產總值結構圖年中國國內生產總值結構圖資料來源:中國統計年鑒2007,57頁。北京:中國統計出版社,200740三、次數分布的主要類型三、次數分布的主要類型 (一)鐘形分布(一)鐘形分布鐘形分布鐘形分布 是在社會經濟現象中最常見的一種分布類型,

39、特點是是在社會經濟現象中最常見的一種分布類型,特點是“兩頭小、中間大兩頭小、中間大”,即靠近中間的變量值次數多,靠近兩端的,即靠近中間的變量值次數多,靠近兩端的變量值次數少,繪成曲線圖,就像一口鐘,所以稱其為鐘形分布。變量值次數少,繪成曲線圖,就像一口鐘,所以稱其為鐘形分布。鐘形分布有對稱的和非對稱的兩種,對稱分布有一個最高的次數,鐘形分布有對稱的和非對稱的兩種,對稱分布有一個最高的次數,在它上下兩側的次數呈對稱式下降,正態曲線就是一種對稱鐘形在它上下兩側的次數呈對稱式下降,正態曲線就是一種對稱鐘形曲線;非對稱曲線按其偏斜方向不同而分為負偏(左偏)和正偏曲線;非對稱曲線按其偏斜方向不同而分為負

40、偏(左偏)和正偏(右偏)兩種,(右偏)兩種,負偏負偏是在次數分布高峰的左側(是在次數分布高峰的左側(小值小值方向)次數方向)次數偏多,正偏則反之,在次數高峰的右側(大值方向)次數偏多。偏多,正偏則反之,在次數高峰的右側(大值方向)次數偏多。41例如,例如,1984年中國農民收入分布就是一種正偏鐘形分布,圖中顯示年中國農民收入分布就是一種正偏鐘形分布,圖中顯示出農民收入分布變化趨勢是:高收入人口所占比重顯著增加,低出農民收入分布變化趨勢是:高收入人口所占比重顯著增加,低收入人口所占比重顯著下降,人口收入人口所占比重顯著下降,人口眾數眾數由低收入組向較高的收入由低收入組向較高的收入組移動。組移動。

41、中國農民收入分布中國農民收入分布42(二)(二)u形分布形分布所謂所謂u形分布,即靠近中間的變量值分布次數少,靠近兩端的變量形分布,即靠近中間的變量值分布次數少,靠近兩端的變量值分布的次數多,形成值分布的次數多,形成“兩頭大、中間小兩頭大、中間小”的分布特征,繪成曲的分布特征,繪成曲線圖,像英文字母線圖,像英文字母u,也稱為倒鐘形分布。,也稱為倒鐘形分布。例如,人口按年齡分組的死亡率分布,是例如,人口按年齡分組的死亡率分布,是u形分布。兩端高、中間形分布。兩端高、中間低的低的u形圖,表明嬰兒死亡率和老年人死亡率都較高,中青年人形圖,表明嬰兒死亡率和老年人死亡率都較高,中青年人的死亡率低。的死亡

42、率低。u形分布也有對稱與非對稱之別。形分布也有對稱與非對稱之別。43(三)(三)j 形分布形分布j形分布的特點是隨著變量值的增大,其次數呈單調增加或單調減形分布的特點是隨著變量值的增大,其次數呈單調增加或單調減少,可分為正少,可分為正j形分布和反形分布和反j形分布二類。形分布二類。j形分布形分布圖中新中國死亡分布曲線(根據圖中新中國死亡分布曲線(根據1982年全國人口普查材料)已呈正年全國人口普查材料)已呈正j形,接近于人口低死亡率的模式,說明低年齡組死亡人口所占形,接近于人口低死亡率的模式,說明低年齡組死亡人口所占的比重大大下降,死亡人口的重心移向老年。這是新中國經濟發的比重大大下降,死亡人

43、口的重心移向老年。這是新中國經濟發展、社會進步的一個重要表現。展、社會進步的一個重要表現。 44(四)洛倫茨分布(四)洛倫茨分布為了研究國民收入、國民財富在國民之間的分配,美國統計學家洛為了研究國民收入、國民財富在國民之間的分配,美國統計學家洛倫茨(倫茨(molorenz)提出了洛倫茨分布曲線,如圖所示。橫軸)提出了洛倫茨分布曲線,如圖所示。橫軸oh表示人口(按收入由低到高分組)的累計百分比,縱軸表示人口(按收入由低到高分組)的累計百分比,縱軸om表示收入的累計百分比。假定收入絕對平等,人口累計百分比等表示收入的累計百分比。假定收入絕對平等,人口累計百分比等于收入累計百分比,洛倫茨曲線為對角線

44、于收入累計百分比,洛倫茨曲線為對角線ol。當收入絕對不平。當收入絕對不平等時,等時,1的人口占有的人口占有100的收入,洛倫茨曲線為折線的收入,洛倫茨曲線為折線ohl。實際上,各個國家的收入分配曲線都介于實際上,各個國家的收入分配曲線都介于ol和和ohl之間,為一之間,為一條上凹形曲線。條上凹形曲線。45羅倫茨曲線例羅倫茨曲線例人人 口口 收收 入入人口數人口數頻頻 率率(%)累計頻率累計頻率(%)總收入總收入(萬元萬元)頻頻 率率(%)累計頻率累計頻率(%)低低中下中下中中中上中上高高400120012008004001030302010104070901001040505050520252

45、5255255075100合合 計計400010020010046我國我國1978年、年、1989年居民收入分配的洛倫茨曲線圖見圖。年居民收入分配的洛倫茨曲線圖見圖。圖中的圖中的曲線顯示,我國居民收入分配的平等度明顯大于印度和巴西。從曲線顯示,我國居民收入分配的平等度明顯大于印度和巴西。從圖中還可以看出,圖中還可以看出,1989年我國居民收入的差距比年我國居民收入的差距比1978年拉大了一年拉大了一些。這是由于城鄉多種經濟成份的發展,允許一部分人先富起來些。這是由于城鄉多種經濟成份的發展,允許一部分人先富起來的政策的貫徹,使得城鄉居民的收入差距比過去大了。的政策的貫徹,使得城鄉居民的收入差距比

46、過去大了。 圖圖 312 中國、印度、巴西居民收入分配的洛倫茨曲線中國、印度、巴西居民收入分配的洛倫茨曲線47基尼系數基尼系數 測定收入分配不平均程度的統計指標。測定收入分配不平均程度的統計指標。 1、定義、定義 為不公平面積。為不公平面積。 2、計算、計算 3、意義、意義 w=0 收入分配絕對平均收入分配絕對平均 w=1 收入分配絕對不平均收入分配絕對不平均 0w1 w越趨于越趨于0,收入分配越平均;,收入分配越平均; w越趨于越趨于1,收入分配越不平均。,收入分配越不平均。baassswas48 基尼系數是衡量總體收入差距的重要指標。基尼系數是衡量總體收入差距的重要指標。從從1978年到年

47、到1984年,我國基尼系數穩定在年,我國基尼系數穩定在0.16的水平。而從的水平。而從1984年開始,基尼系數一年開始,基尼系數一路攀升,到路攀升,到2007年已達到年已達到0.473。一般說。一般說0.2之之下叫下叫“高度平等高度平等”,0.2到到0.4叫叫“低度的不平低度的不平等等”,0.4以上叫以上叫“高度不平等高度不平等”,我國現在,我國現在0.473說明不平等的問題已經比較突出。說明不平等的問題已經比較突出。 至于至于2007年以后,我國的基尼系數又達到了年以后,我國的基尼系數又達到了何種何種“新高新高”,幾乎所有官方媒體和統計部,幾乎所有官方媒體和統計部門保持了相對的沉默,似乎基尼

48、系數到門保持了相對的沉默,似乎基尼系數到0.473以后就停滯不前了。在百姓的生存體會中,以后就停滯不前了。在百姓的生存體會中,這個數據肯定還在繼續擴大,事實就是如此。這個數據肯定還在繼續擴大,事實就是如此。49 這是這是“世界工資研究世界工資研究”發表的最新統計資發表的最新統計資料料50四、四、 統計表統計表 (一一)統計表的概念和分類統計表的概念和分類統計表統計表 是統計資料的一種表現形式。把統計資料按照一定是統計資料的一種表現形式。把統計資料按照一定 的結構和順序在表格中表現出來,這種表格叫作統的結構和順序在表格中表現出來,這種表格叫作統 計表。計表。意意 義義 用統計表來表達數據,比用文

49、字表達更清晰更連貫、用統計表來表達數據,比用文字表達更清晰更連貫、 更簡明、更節省篇幅。統計表能以綜合的形式提供更簡明、更節省篇幅。統計表能以綜合的形式提供 系統的統計資料,便于顯示數字之間的聯系,便于系統的統計資料,便于顯示數字之間的聯系,便于 進行比較和研究。進行比較和研究。分分 類類 1、統計表按表的用途不同,可分為、統計表按表的用途不同,可分為調查表調查表、整理、整理表、分析表;表、分析表;2、統計表按表的總體分組情況不同,可分、統計表按表的總體分組情況不同,可分為為 簡單表、簡單分組表、復合表。簡單表、簡單分組表、復合表。51統計表的種類統計表的種類r 1 1用途不同用途不同r 調查

50、表:調查項目以表格的形式調查表:調查項目以表格的形式表示出來。表示出來。 r 整理表(又稱匯總表):對調查整理表(又稱匯總表):對調查資料直接整理的結果。資料直接整理的結果。 r 分析表:表述統計分析資料的統分析表:表述統計分析資料的統計表。計表。 521).簡單表簡單表 指總體未經任何分組的統計表,它把總體單位指總體未經任何分組的統計表,它把總體單位依次依次排列。或者把總體單位按時間次序排列,具有一覽表性排列。或者把總體單位按時間次序排列,具有一覽表性質。質。 直轄市直轄市總人口總人口其中:市轄縣人口其中:市轄縣人口北京市北京市天津市天津市上海市上海市10819407878540213341

51、896345698229303345127460r2.對總體是否進行分組及分組情況不同分對總體是否進行分組及分組情況不同分 53 2)簡單分組表)簡單分組表 指總體僅按某一個標志進行分組的統計表。利用分組指總體僅按某一個標志進行分組的統計表。利用分組表可以揭示不同類型的不同特征,研究總體的內部構成,表可以揭示不同類型的不同特征,研究總體的內部構成,分析現象之間的依存關系等。分析現象之間的依存關系等。 1990年農民家庭平均每人純收入年農民家庭平均每人純收入項項 目目金額金額(元元)比重比重()平均每人純收入平均每人純收入 從集體經營得到收入從集體經營得到收入 經濟聯合體得到收入經濟聯合體得到收

52、入 家庭經營純收入家庭經營純收入 其它非生產性收入其它非生產性收入629.79 60.31 2.44518.34 48.701009.580.3982.307.73543)復合表)復合表 復合表是總體按兩個或兩個以上標志進行復合分組的統計表。復合表是總體按兩個或兩個以上標志進行復合分組的統計表。復合表把幾個標志結合起來,能較深入地分析比較復雜的社會經復合表把幾個標志結合起來,能較深入地分析比較復雜的社會經濟現象。濟現象。 1990年農民家庭平均每人生活消費支出及構成年農民家庭平均每人生活消費支出及構成 項項 目目金額金額(元元)比重比重()平均每人生活消費支平均每人生活消費支出出1生活消費品支

53、出生活消費品支出食品食品衣著衣著燃料燃料住房住房 用品及其它用品及其它 2非商品支出非商品支出538.05497.65295.16 45.06 24.37 69.23 63.83 40.40100.0 92.5 54.9 8.4 4.5 12.9 11.9 7.555r 3.性質不同性質不同r 時間數列表:主詞欄中是按時間單位的順時間數列表:主詞欄中是按時間單位的順序排列的統計表,如表序排列的統計表,如表2929所示。所示。 表表2-9 2-9 我國歷年國內生產總值資料我國歷年國內生產總值資料年份年份國內生產總值國內生產總值/ /億元億元1978197836243624198019804518

54、4518198519858964896419901990185481854819981998793967939656空間數列表:反映在同一時間不同空間范空間數列表:反映在同一時間不同空間范圍內(如不同單位、不同地區、不同部門等)圍內(如不同單位、不同地區、不同部門等)的資料的統計表,如表的資料的統計表,如表210210所示。所示。 表表2-10 2-10 我國我國19981998年國內生產總值資料年國內生產總值資料產業產業國內生產總值國內生產總值/ /億元億元第一產業第一產業1460014600第二產業第二產業3869238692第三產業第三產業2610426104合計合計7939679396

55、57 統計表的結構統計表的結構統計統計表表形式形式內容內容 總標題總標題 橫行標題橫行標題 縱欄標題縱欄標題 數字資料數字資料 主詞主詞 賓詞賓詞 統計表的名稱,用以統計表的名稱,用以概概括統括統計表中全部統計資料的計表中全部統計資料的內容內容,一般放在表的上端中央一般放在表的上端中央 又稱橫標目,它表明統計表又稱橫標目,它表明統計表橫行項目的名稱橫行項目的名稱,一般置于,一般置于表的左邊表的左邊 又稱縱標目,它表明又稱縱標目,它表明縱欄指縱欄指標名稱標名稱,一般置于表的右上,一般置于表的右上方方 一般在各橫行標題與縱欄標一般在各橫行標題與縱欄標題的題的交叉處交叉處,是說明,是說明總體總體(各

56、組)數量特征(各組)數量特征的指標。的指標。 統計表所要說明的對象統計表所要說明的對象,即,即統計總體各個組成部分的名統計總體各個組成部分的名稱,一般是指表的標行標題稱,一般是指表的標行標題部分部分 。用來用來說明主詞的各種統計指標說明主詞的各種統計指標,一般指表,一般指表的的縱欄標題和數字資料縱欄標題和數字資料部分部分 。5859賓詞的設計賓詞的設計 統計表中賓詞的設計主要指統計指標的編排。賓詞指標的設計在不要求分組的情況下,可以按照指標的主次先后排列;在需要分組時,賓詞指標的設計分為簡單設計和復合設計。賓詞指標的簡單設計是將賓詞中的各個指標作平行的設置,即指標與指標之間彼此獨立。如表3-2

57、1所示6061 賓詞指標的復合設計是將說明主詞的各個指標按分組標志作層疊的設置,如表3-22所示, 賓詞指標的復合設計能夠更全面、更深入地描述所研究總體的特征,但由于復合設計中根據分組標志所劃分的指標欄目數量呈乘積關系,當分組標志較多時,賓詞指標會分得過多過細,容易造成統計表混亂不清。因此,對賓詞指標的復合設計應慎重考慮。6263(二二)統計表的設計規則和標準化統計表的設計規則和標準化 1、統計表、統計表形式的設計形式的設計(1) 統計表通常都應設計成縱橫線條交叉組成的長方形表格統計表通常都應設計成縱橫線條交叉組成的長方形表格, 在計算機處理的條件下,表式設計要考慮計算機輸出的條在計算機處理的

58、條件下,表式設計要考慮計算機輸出的條件。在手工制表的條件下,統計表除盡量使長寬之間有適件。在手工制表的條件下,統計表除盡量使長寬之間有適當比例,以保持美觀之外,應當考慮到印刷開本的條件。當比例,以保持美觀之外,應當考慮到印刷開本的條件。(2) 統計表一般采用統計表一般采用開口式開口式, 表的左右兩端表的左右兩端不畫縱線不畫縱線,表,表的上的上下通常用粗線封口下通常用粗線封口,統計表的各欄可用(,統計表的各欄可用(1)、()、(2)、)、(3)統一編號。統一編號。(3) 為閱讀方便為閱讀方便, 主詞按次序排列的橫行數據一般主詞按次序排列的橫行數據一般每隔五行要每隔五行要留一個空行留一個空行。(4

59、) 統計表的注解、數字的資料來源等一般都寫在表的下面,統計表的注解、數字的資料來源等一般都寫在表的下面,以便核查以便核查, 必要時還可附以簡要文字說明,以明確統計表必要時還可附以簡要文字說明,以明確統計表所反映的主要情況和問題。所反映的主要情況和問題。642、統計表、統計表內容的設計內容的設計(1) 統計表的主語和謂語的安排要通盤考慮,內容不要過分龐雜,統計表的主語和謂語的安排要通盤考慮,內容不要過分龐雜, 最好一個表最好一個表集中說明一個問題集中說明一個問題。如果內容較多,可分成幾張表。如果內容較多,可分成幾張表。(2) 統計表的總標題和縱橫標題都要簡明扼要,能恰當地反映表的統計表的總標題和

60、縱橫標題都要簡明扼要,能恰當地反映表的內容,內容,縱橫各欄的排列縱橫各欄的排列要注意表述資料的要注意表述資料的邏輯關系邏輯關系,反映現象的,反映現象的內在聯系。內在聯系。(3) 統計表中的數字要注明計算單位,如果統計表中的數字要注明計算單位,如果全表只有一個統一的計全表只有一個統一的計 算單位算單位,可以列在表的右上角;如,可以列在表的右上角;如各欄的計量單位不同時各欄的計量單位不同時,則應,則應將計量單位標寫在將計量單位標寫在各縱欄標題的下方或右側各縱欄標題的下方或右側;當同行統計資料以;當同行統計資料以同一單位計量,而同一單位計量,而各行的計量單位不同時各行的計量單位不同時,則可在,則可在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論