第二章數據的收集_第1頁
第二章數據的收集_第2頁
第二章數據的收集_第3頁
第二章數據的收集_第4頁
第二章數據的收集_第5頁
已閱讀5頁,還剩61頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章數據的收集與整理數據的收集統計數據來源統計數據收集的原則和方法統計調查方案統計調查問卷統計數據收集的組織形式2.1.1數據來源

從使用者的角度看,統計數據主要來源于兩種渠道:

1、源于直接的調查和科學實驗,對使用者來說,這是統計數據的直接來源,我們稱之為第一手或直接的統計數據;

2、源于別人調查或實驗的數據,對使用者來說,這是統計數據的間接來源,我們稱之為第二手或間接的統計數據。在經濟活動的分析中,我們通常大量使用二手數據現有統計資料(二手資料)的主要來源:兩個途徑:一是從相關的年鑒、期刊和有關出版物上獲取;二是從有關網站搜尋。(一)統計年鑒1、《中國統計年鑒》2、《國際統計年鑒》3、《地方統計年鑒》4、《中國縣(市)社會經濟統計年鑒》5、《中國金融年鑒》6、《中國人口統計年鑒》7、《中國統計摘要》(二)有關期刊1、《中國經濟數據分析》2、《經濟預測分析》(三)相關網站如:1、國家統計局網2、國研網3、中國經濟信息網4、中國經濟時報網2.1.2統計數據收集的原則和方法統計數據收集的原則:1、準確性原則2、及時性原則3、系統性原則4、完整性原則統計數據收集的方法:觀察法、報告法、詢問法。

確定調查的時間和方法

擬定調查提綱和調查表4321

統計調查方案

確定調查對象和調查單位

確定調查目的和任務1、確定調查目的

我國于1953、1964、1982、1990、2000年進行過五次人口普查。前四次都是以7月1日零時為標準時間。第一次是為制定第一個五年計劃,;第二次是在克服了嚴重困難后,為制定第三個五年計劃;第三次是在結束十年動亂,為國家提供準確、詳細人口數據;第四次是為制定“八五”計劃,;第五次是為制定人口政策,實現人口與資源環境的協調發展,以2000年11月1日零時為標準時間進行了第五次人口普查。國務院決定于2010年11月1日零時為標準時間開展第六次人口普查。其主要目的是查清我國人口在數量、結構、地區分布、受教育程度、遷移流動和居住環境等方面的變化情況,為編制“十二五”規劃提供科學準確的統計信息2、確定調查對象和調查單位調查對象:是指需要調查的現象總體,該總體是由許多性質相同的調查單位組成的。調查單位:是指所要調查的具體單位,它是進行調查登記的標志的承擔者。報告單位:報告單位亦稱填報單位,它是負責向上報告調查內容、提交統計資料的單位。調查單位與報告單位,有時是一致,有時不一致3.擬定調查提綱和調查表

調查提綱(調查項目):調查中所要登記的調查單位的特征,即調查單位所承擔的基本標志,它由一系列品質標志(或稱質量標志、屬性標志)和數量標志所構成。調查表:將各個調查項目按照一定的順序排列在一定的表格上,就構成了調查表。

4.確定調查的時間和方法

統計調查時間包括二種涵義,即調查時間和調查期限。

調查時間:是指調查資料所屬的時間。調查期限:是進行調查工作的時限,包括搜集資料和報送資料的工作所需的時間。人口普查(每10年進行一次,在逢0的年份實施)經濟普查(每10年兩次,分別在逢3,8的年份實施)農業普查(每10年進行一次,在逢6的年份實施)

統計調查問卷問卷的類型與結構問卷設計應注意的問題問卷的類型與結構問卷的類型按問卷填寫方式劃分,可將調查問卷分為自填式問卷和訪問式問卷調查問卷的基本結構一份完整的調查問卷,通常由題目、說明信、被調查者基本情況、調查事項的問題和答案、填寫說明與解釋等5個主要部分構成。問卷設計應注意的問題問卷上所列問題應該都是必要的。所問問題應是被調查者熟悉且易于回答的。注意詢問語句的措辭和語氣。私人生活問題,最好采用間接提問的方法。所擬答案要有窮盡性,避免重復或相互交叉。問卷紙張質地要良好,不宜破損,字跡印刷清晰。統計數據收集的組織形式統計數據收集的組織形式:統計報表、專門調查。統計報表:報送目錄、報表表式、填表說明。專門調查:普查、抽樣調查、重點調查、典型調查。數據的整理統計整理的概念和意義統計整理的步驟統計分組次數分布變量數列的編制次數分布的表現形式統計資料的匯總統計表和統計圖統計整理的概念和意義統計整理:是根據統計研究的任務與要求,對統計調查所搜集到的原始資料進行科學的綜合與加工,使之系統化、條理化的工作過程。

總產值(萬元)0-5050-100100-150150-200200-250合計企業數(個)1024352110100表2-12005年12月某市工業企業總產值分布表統計整理的概念和意義統計整理的意義:經過統計整理,實現了從個別單位的數量特征到總體數量特征的第一次綜合,得到了描述現象總體數量特征的最初始的綜合指標。統計整理的步驟統計整理的步驟包括:1.、制定統計整理方案2、審核、糾正統計數據資料3、進行科學的統計數據分組與匯總4、編制統計表和繪制統計圖審核資料的正確性,是檢查所填報的資料是否準確可靠。常用的審核方法有三種:(1)邏輯檢查首先,從理論上或常識上檢查資料是否有悖常理、有無不切實際或不符合邏輯的地方。其次,是檢查各項目之間有無相互矛盾的地方。(2)計算檢查即檢查各項指標的計算口徑、計量單位是否符合規定,并通過各種計算方法來檢查各指標間的數字是否相互銜接。(3)人機同審2a、資料審核后的訂正通過上述審核,如發現有缺報、缺份和缺項等情況,應及時催報、補報;如有不正確之處,則應分別不同情況作如下處理:(1)對于可以肯定的一般錯誤,應及時代為更正,并通知原報單位。(2)對于可疑之數或無法代為更正的錯誤,應要求原單位復查更正。(3)如果所發現的差錯在其他單位也可能發生時,應將錯誤情況通報所有單位,以免發生類似錯誤。(4)對于嚴重的錯誤,應發還重新填報,并查明發生錯誤的原因,若屬于違法行為,則應依法嚴肅處理。統計分組

統計分組的概念與作用分組標志的選擇統計分組的方法統計分組的概念與作用統計分組:就是根據統計研究的目的和現象總體的內在特征,按照一定的標志將統計總體劃分為若干個性質不同而又有聯系的幾個部分的一種統計方法。統計分組的概念與作用統計分組的作用:1、統計分組可以劃分社會經濟現象的類型。2、統計分組可以研究現象的內部結構。3、統計分組可以分析現象之間的相互依存關系。分組標志的選擇選擇分組標志遵循以下原則;1、窮盡原則2、互斥原則3、科學性統計分組的方法按品質標志分組或按數量標志分組按品質標志分組:是指選擇反映事物屬性差異的品質標志作為分組標志,并在品質標志的差異范圍內劃分各組界限,將總體劃分為性質不同的組成部分。如職工按性別、文化程度、工種分組;企業按經濟類型、地區分組;學生按生源、性別分組等都是按品質標志分組。統計分組的方法按品質標志分組或按數量標志分組按數量標志分組:是指選擇反映事物數量差異的數量標志作為分組標志,并在數量標志的變異范圍內劃分各組界限,將總體劃分為若干性質不同的組成部分。如人口按年齡、身高、體重分組;企業按總產值、職工人數、資金利潤率分組等。統計分組的方法簡單分組和復合分組簡單分組:就是按一個標志對總體進行分組。如學生按學習成績分組,企業按生產規模分組。

統計分組的方法簡單分組和復合分組復合分組:是指對總體按兩個或兩個以上的標志層疊起來進行的分組,即將總體先按一個分組標志進行分組,在此基礎上按另一個分組標志把已分成的各個組成部分再分成若干小組。例如,學生先按性別分組,在此基礎上,再按年齡分組就是復合分組。進行復合分組時,應根據統計分析的要求確定分組標志的主次順序。次數分布次數分布的概念次數分布的種類次數分布的概念在統計分組的基礎上,將總體的所有單位按組歸類整理,所形成的總體單位數在各組之間的分布,稱為次數分布。分布在各組的總體單位數叫次數或頻數。各組次數與總體總次數之比稱為比重或頻率。次數分布有兩個構成要素:一是總體分成的各個組,二是各組的單位數。次數分布的種類根據分組標志特征的不同,次數分布可以分為品質分布數列和變量分布數列。變量數列按變量的表示方法不同,可分為單項變量數列和組距變量數列兩種。品質分布數列按品質標志分組所形成的分布數列,稱為品質分布數列,簡稱品質數列。品質數列由各組名稱和次數構成。某企業工人性別構成情況表按性別分組職工人數(人)比重(%)男65065女35035合計1000100各組名稱次數頻率變量分布數列按數量標志分組所形成的次數分布數列叫變量分布數列,簡稱變量數列。變量數列由各組變量值和各組次數構成。按成績分組人數(人)比重(%)60以下41060-7061570-80164080-90102590以上410合計40100各組名稱次數頻率某班學生統計學成績分布表變量分布數列單項變量數列

1、單項變量數列是按數量標志分組后,用一個變量值代表一個組所形成的數列,簡稱單項數列。

2、單項數列適用于變量值個數較少,變量值變動范圍較小的離散型變量。平均日產量工人數絕對數(人)比重(%)7816818369193810510合計50100某車間第一季度工人平均日產量變量分布數列組距變量數列

1、組距變量數列是按照數量標志分組后,用變量值變動的一定范圍代表一個組所形成的數列。

2、組距變量數列適用于變量值個數較多,變動范圍較大的離散型變量以及所有的連續型變量按成績分組人數(人)比重(%)60以下41060-7061570-80164080-90102590以上410合計40100某班學生統計學成績分布表組距變量數列在組距數列中,表示各組界限的變量值叫組限,其中較小的變量值稱為下限,較大的變量值稱上限。各組上限與下限之間的距離叫組距,上限與下限之間的中點值叫組中值。組距=上限-下限組中值=(上限+下限)/2組距變量數列在編制組距數列時,常常使用“某某以上”或“某某以下”,這樣不確定組限的組,稱為開口組。開口組的組中值按下列公式計算:缺下限的最小組的組中值=上限-相鄰的組距/2

缺上限的最大組的組中值=下限+相鄰的組距/2某地區100個百貨商店月銷售額與流通費用情況銷售額(萬元)商店數(個)每百元商品銷售額中支付的流通費(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上組限U下組限L如:組距d=U-L=100-50=50(萬元)如:組中值x=(U+L)/2=(100+200)/2=150(萬元)某連續變量分組數列,其末組為開口組,下限為500,又知其相鄰組的組中值為480,則末組的組中值為()答案:520組距變量數列組距數列根據各組的組距是否相等可以分為等距數列和異距數列。如果各組的組距相等,稱為等距數列;如果各組的組距不相等,稱為異距數列。一般在社會經濟現象性質差異變動比較均衡的條件下使用等距數列。如,學生的學習成績分組,工人的工資。異距數列則能比較準確反映總體內部各部分之間的性質差異。變量數列的編制編制變量數列,要注意以下問題:

1、確定形式

2、確定組距和組數

3、確定組限次數分布的表現方法次數分布有向上累計和向下累計兩種計算方法。頻率各組單位數占總體單位總數的比重累計次數(頻率)

從變量值低的組開始,將各組次數(頻率)逐次向變量值高的組累計,說明某一組上限以下各組的累計次數(頻率)。向上累計向下累計

從變量值高的組開始,將各組次數(頻率)逐次向變量值低的組累計,說明某一組下限以上各組的累計次數(頻率)。

銷售額(百萬元)商店數頻率(﹪)累計次數累計頻率(﹪)向上累計向上累計5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合計50100——

銷售額(百萬元)商店數頻率(﹪)累計次數累計頻率(﹪)向上累計向下累計向上累計向下累計5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合計50100————莖葉圖由“莖”和“葉”兩部分組成,按“莖”把一組數據分為若干行,“莖”相同的數據分在同一行;(2)圖形是由數據構成的;(3)以該組數據的高位數作為莖,低位數(尾數)作為葉,樹莖一經確定,樹葉自然地長在樹莖上了。根據抽樣調查,某月某市50戶居民購買消費品支出資料如下(單位:元):83088012301100118015801210146011701080105011001070137012001630125013601270142011801030870115014101170123012601380151010108608101130114011901260135093014201080101010501250116013201380131012701250用莖葉圖整理數據810306070805930110001010305050708080

9110030405060707080809010120010303050505060607070111310205060708080714102020604151080216301

莖葉次數未分組數據—莖葉圖

(擴展的莖葉圖)樹莖樹葉10*10.11*11.12*12.13*13.78802234577788890012222333344455667778890133445799統計資料的匯總統計資料匯總就是在編制次數分布后,匯總計算各組及總體的單位數以及各組及總體的標志總量。統計資料匯總的組織形式一般有:逐級匯總、集中匯總和綜合匯總。統計資料的匯總技術有手工匯總和計算機匯總兩種。統計資料的匯總逐級匯總就是按照一定的統計組織管理系統,自下而上地逐級匯總本系統、本地區、本單位的調查資料。集中匯總就是將全部調查資料集中到組織調查的最高機關或其指定的機構進行匯總。綜合匯總及將逐級匯總和集中匯總兩種匯總形式結合起來使用。統計表和統計圖數據整理的結果最終表現為統計表和統計圖。具有容量大、方便計算等特點統計表以縱橫交叉的線條所形成的表格來表現統計資料的形式統計表的優點:1、能有條理、有系統的排列統計資料,使人在閱讀時一目了然;2、能合理地、科學地組織統計資料,便于對比分析;3、易于檢查統計數字的完整性和正確性。統計表年份第一產業第二產業第三產業合計2005224208736573433183217200624040103162847212119232007280951213811000542495302005-2007年我國國內生產總值億元表頭本表按當年價格計算資料來源:2008中國統計年鑒.北京:中國統計出版社,2008.行標題列標題數據注釋統計表的構成如下:統計表式設計注意事項統計表應設計成由縱橫交叉線條組成的長方形表格,長與寬之間保持適當的比例;合計欄設計。各縱列須合計時,應將合計列在最后一行,各橫行須合計時,將合計列在最前一欄或最后一欄。表的上、下端用粗線或雙線封口,左右兩端一般不封口;統計表內容設計注意事項標題設計。指標數值。表中數字應該填寫整齊,對準位數。當數字因小可略而不計時,可寫上“0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論