全套電子課件:統計學概論(第五版)_第1頁
全套電子課件:統計學概論(第五版)_第2頁
全套電子課件:統計學概論(第五版)_第3頁
全套電子課件:統計學概論(第五版)_第4頁
全套電子課件:統計學概論(第五版)_第5頁
已閱讀5頁,還剩279頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章總論本章主要講述統計學中的一些基本原理、基本理論和基本概念,從而使學生對統計學有一個大致的認識。重點:了解統計的科學涵義及發展簡史,明確統計學的學科性質及基本研究方法,牢固掌握統計學的基本概念。難點:統計學中的幾個基本概念。共分為三節:第一節統計的產生與發展第二節統計的研究對象與研究方法第三節統計學中的一些基本概念第一章總論笫一節統計的產生與發展(含義\產生發展)一、統計的含義含義包括:統計工作(統計活動)、統計資料和統計學。統計是統計工作(統計活動)、統計資料、統計學的統一體。統計工作是指對社會現象、經濟現象、自然現象的數據資料進行搜集、整理、分析研究的過程。統計資料是統計工作過程中所取得的各項數字資料和其他與之相聯系的資料的總稱。統計學是闡明如何搜集、整理和分析統計資料的理論與方法的科學。統計學是對統計實踐活動的經驗總結和理論概括。統計三個方面的含義之間存在下列關系:統計資料是統計工作的成果,統計學是對統計工作的經驗總結和理論概括,反過來又指導統計工作,使統計資料準確可靠。第一章總論二、統計的產生與發展統計是適應人類社會實踐活動的需要而產生和發展起來的。原----文字產生之前----“結繩記事”----統計計數活動---文字產生之后------古巴比倫的原始算版-----古埃及的紙草記錄-----古印度的貝多羅葉記錄-----古代中國的甲骨文記錄----統計計數活動日益深入人類社會實踐-------統計計數活動--------統計最初的萌芽。奴--形成---統計也初步形成公元前2000多年的夏禹-----有了人口、土地等記載《尚書》-----有對居民生活條件的調查記錄-----“數量和分組的初步概念已經形成”第一章總論封----我國的統計已略具規模《商君書》-----強國知十三數,即“境內倉、口(府)之數,壯男、壯女之數,老弱之數,宦士之數,以言談取食者之數,利民之數,馬、牛、芻、藁之數”封-----各個朝代都進行過人口、土地、財產等方面的統計調查-----并建立了一定的統計調查制度。第一章總論古希臘公元前600年-------人口普查古羅馬公元前----建立了出生、死亡登記制度。近代統計的發展是與資本主義的產生發展同步的17世紀至18世紀-----隨----資本主義的成長--人口、工業、農業的統計登記逐漸形成制度“商業、工業、農業、海關、外貿、物價等方面的統計得到了很大的發展”。第一章總論隨著統計實踐的發展,歐洲出現了一些統計理論著作在統計學的初創時期,政治算術學派和國勢學派(記述學派)的理論占據了統治地位。1政治算術學派的創始人是英國人威廉?配弟(W.Petty,1623-1687)和約翰?格蘭特(J.Graunt,1620-1674)。威謙?配弟的代表作是《政治算術》,該書運用大量實際統計資料,對英國、法國、荷蘭三國的國情國力,作了系統的數量對比分析。他的利用實際資料,用數量、重量和尺度來說話的方法,為統計的創立奠定了方法論的基礎。約翰?格蘭特的代表作是《對死亡率公報的自然觀察和政治觀察》,該書對倫敦人口的出生率、死亡率、性別比例作了分類計算和并編制了死亡率表,以死亡率表為依據進行了人口的統計推算預測。2國勢學派(記述學派)的創始人是德國人海?康令(H.Conring,1606-1682)和高?阿亨華爾(G.Arhenlwall,1719-1772)阿亨華爾把拉丁語Status和意大利語Stato引伸為德語Statistika(國勢學、統計學),意思是主要用文字來記述國家應注意的事項的學問。31850年德國人克尼斯(K.G.A.Knies,1821-1897)在《作為獨立科學的統計學》一書中,將國勢學正式命名為國家學,將英國人威廉·配弟和約翰·格郎特創立的政治算術正式命名為Statistika(統計學)41787年英國人齊麥曼(E.A.Zimmeman)把德語Statistika譯成英語Statistics(統計學)。519世紀中葉,隨著統計理論和實踐的發展,又產生了數理統計學派。數理統計學派的創始人是比利時人阿道夫.凱特勒(A.Quetelet,1796-1874)。其代表作有《社會物理學》。凱特勒把概率論引入統計學,使統計方法在準確性方面有了質的躍進20世紀初以英國人費希爾(R.A.Fisher,1890-1962)為代表,將數理統計發展成用隨機樣本推斷有關總體的推斷統計。數理統計學派認為統計學是一門獨立的方法論科學。619世紀下半葉,德國人克尼斯(K.G.A.Knies,1821-1897)和梅爾(G.V.Mayr,1841-1925)在繼承政治算術學派和在凱特勒的影響下創立了社會統計學派,社會統計學派的代表人物還有恩格爾(C.L.E.Engel,1821-1896)社統計學派認為統計學是一門實質性的社會科學6十月革命后,在前蘇聯及社會主義國家建立了社會經濟統計學,社會經濟統計學深受德國社會統計學的影響。前蘇聯統計學家認為統計學是一門獨立的社會科學,排斥數理統計學,認為數理統計學是數學的一個分支我們認為------社會經濟統計學認為是經濟領域的統計學------社會經濟統計學、數理統計學和自然科學各領域的統計學確定為統計學的分支認為社會經濟統計學是一門方法論的科學,社會經濟統計學不排斥數理統計方法的運用,數理統計方法應是社會經濟統計學的重要內容本書著重研究社會經濟統計學。三、統計學的研究對象

社會經濟統計的研究對象是大量社會經濟現象總體的數量方面,即研究社會經濟現象總體的數量特征和數量關系社會經濟統計學的研究對象也是大量社會經濟現象總體的數量方面,和社會經濟統計相比,它是對社會經濟現象總體數量方面的間接研究,它的研究對象是社會經濟統計這種調查研究活動的規律和方法它研究如何搜集、整理和分析大量社會經濟現象總體數量方面的規律和方法社會經濟統計學從其性質來講,研究的是方法論,它是一門研究方法論的社會科學

社會經濟統計具有如下特點:(一)數量性由于社會經濟統計的研究對象是大量社會經濟現象的數量方面,因此,數量性就成為社會經濟統計的基本特點。數量性特點具體包含三個方面的內容。

1.數量的多少。即研究現象的規模、大小、水平等。

2.現象間的數量關系。即研究現象的內部結構、比例關系、相關關系等。

3.質與量間的關系。即研究現象質與量互變的界限、研究質與量的統一功行賞(二)總體性由于社會經濟統計的研究對象是社會經濟現象的總體的數量方面,因此總體性就成為社會經濟統計的重要特點。(三)具體性社會經濟統計的研究對象是具體事物的數量方面,不是抽象的量,因此,社會經濟統計具有具體性特點。(四)社會性社會經濟統計以社會經濟現象作為研究對象,有明顯的社會性的特點;社會經濟統計本身也是一種社會實踐活動,更具備社會性的特征。四、統計的認識過程統計作為一種認識活動,其認識過程可以從兩個方面來理解。一方面,從質與量的關系看,統計的認識過程是從質開始到量,再到質與量的結合另一方面,從個體與總體的關系看,統計的認識過程是從對個體數量的認識開始,再到對總體數量特征的認識五、統計研究的具體方法主要有大量觀察法、統計分組法、綜合指標法和統計推斷法。(一)大量觀察法大量觀察法是指統計在研究社會經濟現象及其發展變化過程中要從總體上加以觀察,對現象總體的全部或足夠多數的個體進行調查研究并綜合分析,從而反映現象總體的數量特征。(二)統計分組法統計分組法是根據統計研究的需要和現象內在的特點,按一定標志,把總體劃分為若干個不同部分或組的一種統計方法。(三)綜合指標法將大量觀察所得的資料進行加工、匯總,就可以得到反映現象總體一般數量特征的綜合指標,運用各種綜合指標對現象總體的數量方面進行分析,這種分析方法叫綜合指標法。(四)統計推斷法統計推斷法是根據局部樣本資料,按一定的置信標準,用樣本數據來判斷總體數量特征的統計分析方法笫二節統計工作過程和基本職能一統計工作過程統計工作過程是指統計工作的步驟。統計工作的步驟有:統計設計、統計調查、統計整理和統計分析。

二、統計的基本職能統計的基本職能是指統計本身所固有的內在功能。統計具有信息、咨詢、監督三大職能。(一)統計信息職能統計信息職能是指統計具有信息服務的功能,也就是統計通過系統地搜集、整理、分析得到統計資料,在統計資料的基礎上再經過反復提煉篩選,提供大量有價值的、以數量描述為基本特征的統計信息,為社會服務。(二)統計咨詢職能統計咨詢職能是指統計具有提供咨詢意見和對策建議的服務功能,也就是指統計部門利用所掌握的大量的統計信息資源,經過進一步地分析、綜合、判斷,為宏觀、微觀決策,為科學管理提供咨詢意見和對策建議。統計咨詢分為有償咨詢和無償咨詢兩種。統計咨詢應更多地走向市場。(三)統計監督職能統計監督職能是指統計具有揭示社會經濟運行中的偏差,促使社會經濟運行不偏離正常軌道的功能,也就是統計部門以定量檢查、經濟監測、預警指標體系等手段,揭示社會經濟決策和執行中的偏差,使社會經濟決策及其運行按客觀規律的要求進行。第三節統計學中的幾個基本概念一、統計總體和總體單位1統計總體例如,研究全國私營企業的情況,全國的私營企業就構成一個總體。例如,研究某省的零售企業狀況,全省的零售企業就形成一個總體研究某市的零售企業狀況,全市的零售企業就構成一個總體再如,研究某市工傷事故情況,該市工傷事故就構成一個總體。

2構成總體的每個個體就是總體單位例如,全國的私營企業是一個總體,則每個私營企業就是一個總體單位。總體按包含個體的多少可以分為有限總體和無限總體有限總體無限總體例如,生產線上大量連續不斷生產出的某種小件產品,由于時間不斷延續,該種小件產品就構成一個無限總體

統計總體具有三個基本特征:大量性、同質性和差異性。(一)大量性大量性特征是指總體應包含足夠多的單位數(二)同質性同質性是指構成統計總體的每個個體必須至少在某一方面具有共同性質,就是這個共同性使這些個體結合成一個整體,同質性是構成總體的基礎。(三)差異性差異性是指構成總體的個體除了至少在某一方面具有共同性質外,在其他方面存在差異例如,全國的私營企業總體,除了都是中國的私營企業這一共同點外,在注冊資本、投資規模、凈利潤、職工人數等等方面存在差異。統計總體和總體單位的概念不是固定不變的,隨著研究目的的改變,原來的總體有可能變為總體單位,原來的總體單位有可能變為總體。例如,研究全國的鋼鐵企業生產情況,寶鋼就是其中的一個總體單位,而當研究寶鋼的經濟效益狀況時,它又成為統計總體了。二、標志、指標和指標體系標志是說明總體單位屬性或特征的名稱全國人口總體,每個人是總體單位,其中某人是一個總體單位,他是男性,這個特征的名稱叫性別,性別就是一個標志另外,年齡、民族、文化程度、身高等也是標志標志的具體表現是指在標志名稱之后所列示的屬性或數值在全國人口總體中,性別是個標志,性別分為男、女,“男”就是性別這個標志的具體表現,同樣“女”也是性別這個標志的具體表現在全國人口總體中,身高也是個標志,各總體單位身高不完全相同,身高可以有1.75m、1.76m等等,“1.75m”就是身高這個標志的具體表現。

按標志的性質不同可以分為品質標志和數量標志品質標志是表明事物屬性特征,只能用文字說明,不能用數值來表示的標志。性別只能用“男”、“女”兩個文字來表示又如,所有制只能用“國有”、“集體”、“私營”、“合資”來表示數量標志是表明事物量的特征,用數值來表示的標志身高用“1.75m”等數值來表示,身高是數量標志年齡、工資、產值、利潤、成本等都用數值來表示,且說明總體單位,均為數量標志數量標志的具體表現也稱做標志值標志按變異情況可分為不變標志和可變標志在一個總體中,對于一個標志來說,如果總體各單位具有相同的標志具體表現,則該標志叫不變標志。例如全國私營企業總體,所有制是不變標志在一個總體中,對于一個標志來說,如果總體各單位具有不同的標志具體表現,則該標志叫可變標志。同樣是全國私營企業總體,產值是可變標志

指標是說明總體的對于指標有兩種不同的理解,一種:認為指標是反映總體數量特征的概念或范疇。例如,國內生產總值是指標,國民收入、工業總產值、工業增加值、勞動生產率等也是指標。這種理解包涵三要素:指標的含義、指標計算范圍、指標計算方法及計量單位。這種理解是正確的,這種理解用于統計理論和統計設計另一種認為指標是反映總體數量特征的概念加具體數值。例如1990年我國耕地面積95.7×(43509.4萬畝)是指標。這種理解不僅包涵上述三要素,而且包涵下列要素:指標所屬時間、指標所屬空間、指標數值。這種理解也是正確的,這種理解具體用于統計調查、統計整理、統計分析指標按性質的不同分為數量指標和質量指標數量指標是反映現象總規模、總水平或總數量的統計指標,又稱總量指標。數量指標用絕對數表示例如人口總數、國民生產總值、工業總產值、工資總額、職工總數等均是數量指標質量指標是反映現象本身質量或反映現象強度、密度、工作質量和經濟效果的統計指標,質量指標表明現象的對比關系,質量指標用相對數或平均數表示例如,平均工資、人均收入、人口密度、出勤率、設備利用系數、利潤率等均是質量指標。

標志和指標既有區別又有聯系。它們的區別是:

1)標志說明總體單位的特征,指標說明總體的特征。

2)有的標志可用數值來表示,如數量標志。有的標志不能用數值表示,如品質標志。而所有的指標都可用數值表示。標志和指標間的聯系是:

1)數量指標的數值是根據數量標志的標志值匯總而來的。例如某企業全部職工總體,每個職工是總體單位,工資是數量標志,工資總額是數量指標,工資總額是根據每個職工的工資匯總得到的。

2)指標與標志間存在變換關系。隨著研究目的的改變,原來的總體變為總體單位,原來的指標相應地變為數量標志;隨著研究目的的改變,原來的總體單位變為總體,原來的數量標志相應地變為指標。單個指標只能反映現象總體的一個側面或一個方面,不可能反映總體的全面情況,為了揭示總體的全貌,必須把一系列相互聯系、相互補充的指標結合起來應用。若干個相互聯系、相互補充的指標結合在一起形成一個整體叫指標體系。指標體系可分為兩大類:基本統計指標體系和專題統計指標體系。基本統計指標體系是指反映國民經濟和社會發展及其各個組成部分基本情況的指標體系。具體又分三個層次:最高層次是反映國民經濟和社會發展的統計指標體系,從經濟上講主要是國民經濟綜合平衡指標體系,還應建立社會指標體系和科技指標體系;中間層次是各地區各部門統計指標體系,這個層次也應該建立中觀經濟綜合平衡指標體系、中觀社會指標體系和中觀科技指標體系;第三是基層統計指標體系,它是指微觀企業、事業單位的統計指標體系。專題統計指標體系是指針對某項社會或經濟問題而制定的專門統計指標體系。例如,就環保問題應建立環保指標體系;就能源問題建立能源統計指標體系,就社會保障問題應建立社會保障指標體系。三、變異和變量變異是指標志的具體表現在總體各單位間的差異。例如在人口總體中,性別是個標志,男、女是標志的具體表現,在這個總體中,性別這個標志的具體表現在總體各單位間是有差異的,這就是變異。同樣在人口總體中,年齡是個標志,年齡在總體各單位間表現是不同的,有0歲、1歲、2歲、……,這就是變異。變異分為品質變異和數量變異。人口總體中,性別分為男、女是品質變異年齡表現為0歲、1歲、2歲、……,是數量變異全國企業總體中,所有制分為國有、集體、私營和合資是品質變異職工人數具體表現為10人、20人、……是數量變異。可變的數量標志和所有的統計指標稱作變量,變量的具體取值叫變量值。例如在全國人口總體中,年齡是變量,年齡的具體取值0歲、1歲、2歲、……是變量值又例如在某企業職工總體中,工資是變量,工資的具體取值600元、700元、……是變量值。

變量可以按不同的標準進行分類按變量值是否連續分為離散變量和連續變量離散變量的各個變量值都是按整數位斷開的如職工人數、企業個數、設備臺數連續變量的各個變量值是連續不斷的,相鄰兩值間可作無限分割如身高、體重、面積、體積等。變量按性質的不同分為確定性變量和隨機變量確定性變量是指變量值受確定因素影響,其變動方向明確呈上升或下降趨勢隨機變量是指變量值受不確定因素的影響,其變動方向呈現偶然性。第二章統計調查學習目的:通過本章的學習,使學生掌握統計調查的種類、統計調查的組織以及幾種常用統計調查方式的特點和適用范圍,并能用所學知識從事具體的統計調查工作,為后續的統計工作打下基礎。第一節統計調查概述第二節統計調查方案第三節幾種常用統計調查方式。第一節統計調查概述一、統計資料的來源

1、直接來源:調查和科學實驗第一手資料

2、間接來源:公開出版物:《中國統計年鑒》、《中國統計摘要》、《中國社會統計年鑒》、《中國工業經濟統計年鑒》、《中國農村統計年鑒》、《中國人口統計年鑒》、《中國市場統計年鑒》、《世界經濟年鑒》、《國外經濟統計資料》、《世界發展報告》……。網絡1、統計調查

二、統計調查的概念2、統計調查的基本要求:精度:最低的抽樣誤差或隨機誤差及時性:在最短的時間里取得并公布數據關聯性:滿足用戶決策、管理和研究的需要一致性:保持時間序列的可比性最低成本:以最經濟的方式取得數據1、按統計調查的組織形式不同可分為:

統計報表:又可分為:全面統計報表非全面統計報表專門調查:如:普查、抽樣調查、重點調查、典型調查等2、按統計調查的范圍不同可分為:

全面調查:普查、全面統計報表非全面調查:如抽樣調查、重點調查、典型調查等三、統計調查的種類3、按登記資料的時間是否連續可分為:

經常性調查一次性調查4、按搜集資料的方式不同可分為:

直接觀察法:如盤點報告法:如統計報表采訪法:又可細分為:詢問法:個別深度訪問調查會自填法:首先要設計好調查問卷或調查表

此外,通訊法也越來越得到廣泛應用,如網上調查

四、統計調查的步驟

1、設計統計調查方案

2、具體實施統計調查方案

3、組織編報統計資料第二節統計調查方案一項完整的統計調查方案由以下幾部分構成:

一、確定調查目的 回答“為什么調查?”,調查要達到的具體目標。

調查之前必須明確二、確定調查對象和調查單位(回答“向誰調查?”)

1、調查對象:即調查研究的對象,即總體

2、調查單位:需要對之進行調查的單位。可以是調查對象的全部單位(全面調查),也可以是調查的一部分單位(非全面調查)。調查對象

調查單位?

三、確定調查項目和設計調查表(調查內容)

1、調查項目:即統計標志調查項目數目的確定應貫徹少而精的原則2、調查表:單一表一覽表Q1…………Q2…………Q3…………Q4…………四、方案設計中的其他問題

1、明確調查所采用的方法

2、確定調查時間:包括兩個方面(1)資料所屬的時間(2)調查工作時間:調查工作的起止時間,稱為調查期限。例:會計報表,上市公司年報制度等

3、確定調查地點:通常就是調查單位所在的地點

4、調查的組織與實施細則做好各項準備工作:如調查組織機構設置、調查人員配備、經費、資料等第三節幾種常用統計調查方式一、統計報表1、概念:過去曾經是我國主要的數據收集方式。是按照國家有關法規的規定,自上而下地統一布置、自下而上地逐級提供基本統計資料的一種調查方式。要求按照統一的表式、統一的指標內容、統一的報送時間和報送程序進行填報。2、種類:3、優點:信息量大缺點:靈活性差,資料具有相對的可靠性4、資料來源:原始記錄、統計臺帳、企業內部報表等二、普查1、要點:為特定目的專門組織的非經常性全面調查(1) 通常是一次性或周期性的(2) 一般需要規定統一的標準調查時間(3) 數據的規范化程度較高(4) 應用范圍比較狹窄2、組織形式:(1)設立專門的普查機構。如人口普查(2)不設立專門的普查機構和配備專門的人員。如盤點3、注意事項:(1)選擇合適的普查時期(調查期限)(2)確定標準時點(調查時間)(3)普查項目的一致性三、抽樣調查1、概念:是從總體中隨機抽取一定數量的單位(樣本)進行觀察,根據對這一部分單位觀察的結果(樣本指標)來推算總體數量特征(總體指標)的一種非全面調查方式。總體樣本2、特點:

(1)隨機原則:機會均等原則(2)數量上的推算:樣本指標總體指標(統計量)(參數)(3)誤差可事先計算(4)具有經濟性、時效性強、適應面廣、準確性高等特點四、重點調查1、概念:是在總體中選擇一部分重點單位進行調查,借以了解總體基本情況的一種非全面調查。2、重點單位:是指單位的數目在全部總體單位數目中只占較少的比重,但其標志總量在總體的標志總量中卻占較大的比重的總體單位,即所謂的“重要的少數”。

例:要了解我國鋼鐵企業生產情況,只要對少數的幾個大型的鋼鐵企業(如鞍鋼、寶鋼、首鋼等)進行調查,就可了解全國鋼產量的基本情況。3、調查結果不能用于推斷總體五、典型調查1、概念:是在對所研究對象進行初步的全面分析的基礎上,從中選擇具有代表性的典型單位,作周密系統的調查,借以認識事物的本質及其發展變化規律性的一種非全面調查方式。2、特點:(1)首先對總體進行全面分析(2)帶有一定的主觀性3、調查結果不能用于推斷總體第三章統計整理學習目的:通過本章的學習,使學生掌握統計資料整理的程序、統計分組的方法以及分布數列的編制、統計匯總的組織形式和技術方法,以及設計和編制統計表。分以下幾節來講:第一節統計整理概述第二節統計分組第三節分布數列第四節統計匯總第五節統計表

第一節統計整理概述一、概念原始統計資料綜合統計資料二、統計整理的步驟(一)資料審核:1、對原始資料的審核

完整性審核:檢查應調查的單位或個體是否有遺漏;所有的調查項目或指標是否填寫齊全。

準確性審核:邏輯檢查:檢查數據是否真實反映客觀實際情況,內容是否符合實際。

計算檢查:檢查數據是否有錯誤,計算是否正確等。2、對第二手資料的審核:(1)適用性審核弄清楚數據的來源、數據的口徑以及有關的背景材料確定這些數據是否符合自己分析研究的需要(2)時效性審核應盡可能使用最新的統計數據(3)確認是否必要做進一步的加工整理(二)統計分組:分類(三)統計匯總:加總,求合計數(四)編制統計表第二節統計分組一、概念

1、概念:總體各組2、分組原則:(1)周延性:即一個不漏(又稱窮舉原則)(2)互斥性:即不能重復(又稱互斥原則)即:要求保持組內資料同質性和組間資料的差異性二、統計分組的作用1、區分社會經濟現象的類型2、研究總體的內部結構3、研究現象之間的依存關系三、分組標志(分組標準)1、概念:即分組的依據2、選擇:(1)根據統計研究的目的選擇(2)選擇具有本質性的重要標志(3)結合現象所處的具體條件四、統計分組的種類(一)按分組標志的性質不同分

1、按品質標志分組

如:學生按性別分組,企業按所有制性質分組等

2、按數量標志分組

如:學生按年齡分組,企業按產值分組等(二)按分組標志的多少不同分

1、簡單分組:對總體只按一個標志分組。

例:對企業這個總體按所有制性質、規模大小分別分組。(1)(2)國有大型企業民營企業中型其他小型

若干個相互聯系的簡單分組構成平行分組體系2、復合分組:對同一總體按照兩個或兩個以上的標志層疊起來進行分組例:

大型國有企業中型小型大型企業民營企業中型小型大型其他經濟類型中型小型在復合分組方法下形成復合分組體系五、統計分組的方法(一)按品質標志分組

1、選擇品質標志作為分組標志

2、確定組數并表示出各組(根據品質標志的具體表現)

3、把各單位歸入相應的組匯總出各組的單位數(次數)

有的很簡單,如人口按性別分組。有的很復雜(如人口按職業分組),可查相應的專業分類目錄。

(二)按數量標志分組

1、選擇數量標志作為分組標志

2、確定組數、劃定各組的界限(較復雜)

3、把各單位歸入相應的組匯總得出各組的單位數(稱為次數或頻數;也可用相對數表示,稱為頻率)六、分組結果的表示方法

分組后的結果通常用如下形式來表示:這種形式稱為分布數列(或次數分布或頻率分布)

所分得的各組

各組次數(或頻率)

合計

總次數第三節分布數列一、分布數列1、概念:在統計分組的基礎上,將總體的各單位按組歸類整理,形成總體單位在各組間的分布。這種表明總體單位數在各組分配情況的資料稱為次數(頻率)分布,又稱分布數列。

例:我國第五次人口普查我國大陸人口年齡分布:人口按年齡分組人口數(億人)比率(%)14歲以下2.897922.8915——648.879370.1565歲以上0.88116.96

合計12.6583100.002、構成:

由兩部分構成:(1)各組(2)各組次數(或頻率)

3、種類:根據分組標志的不同可分為:品質分布數列:數量分布數列:簡稱為變量數列二、變量數列的種類按各組表示方式不同可分為:

1、單項變量數列:每組用一個數表示。適合于離散變量,且變量值較少的情況。這種類似于品質數列的編制,相對比較簡單。工人按日產量(件)分組工人數(人)25310432、組距數列:適合于連續變量和變量值較多的離散型變量

學生按成績分組學生數(人)60以下360——70770——802080——90890以上2

合計40三、組距數列中的有關概念1、組限:有:上限(μ)下限(L)

A、組限的表示方法有:(1)重疊組限:如:10——2020——30

(2)不重疊組限:如:10——20

(只適用于離散變量)21——30

…B、組的表示方法:(1)閉口組:上、下限都有(2)開口組:上、下限有一缺一2、組距計算公式:組距(i)=上限–

下限種類:根據各組組距是否相等,組距數列可分為:等距數列異距數列表示方法:一般用5、10、20、50、100等類似數字表示。另一相似的概念:全距(R)=最大變量值–

最小變量值3、組中值

概念:每組中點的數值計算公式:

對于開口組,需先假定其所缺的上限或下限(假設開口組的組距與其相鄰組的組距相等)。如:

各組

組中值60以下

5560——706570——807580——908590以上

954、組數(K)組數、組距、全距之間存在如下關系:

可用經驗公式來確定:

K=1+3.322lgn

但最佳決定還是依據常識和數列使用的目的而定。四、變量數列的編制1、排序:排序后:(1)求出全距R

(2)確定變量數列的種類(等距數列或不等距數列)2、確定組距和組數3、劃定各組的界限4、匯總得出各組單位數(次數)如:某工廠同工種的50名工人完成生產定額百分數(%)資料如下:

838812311011815812114613712016312513612714211812312613815110186821131421081011051251161321381171031141311088711912710511512612511010714113511793

根據上述資料編制變量數列第四節分布數列的表示方法一、表示法學生按成績分組組中值學生數(人)比率(%)向上累計向下累計工人數比率工人數比率60以下5525.025.040100.060~7065615.0820.03895.070~80751332.52152.53280.080~90851537.53690.01947.590~10095410.040100.0410.0合計—40100.0————計算累計次數方法:1、向上累計:由變量值小的組向大的組累計,累計次數表示該組上限以下(比該組上限小)的組的次數的總和,所以又稱為較小制累計。2、向下累計:由變量值大的組向小的組累計,累計次數表示該組下限以上(比該組下限大)的組的次數的總和,所以又稱為較大制累計。二、圖示法常用圖形有:次數分布直方圖次數分布折線圖次數分布曲線圖累計次數折線圖餅狀圖(圓形圖)根據上述資料可繪制如下圖形A、直方圖B、折線圖折線圖又稱頻數多邊形圖。對于組距數列,把直方圖中各頂邊的中點用直線連接起來(注意與橫軸的交點)。對于單項變量數列也可以畫次數折線圖。C、累計次數折線圖累計次數折線圖

累計次數折線圖有兩種形狀:或持續增長的或持續減少的。這分別取決于向上累計或向下累計。D、曲線圖:

當變量數列中的組數愈加增多,變量值也非常多時,折線圖會逐步過渡到平滑曲線。頻數分布曲線圖實質上是對應于連續變量的頻數分布的函數關系圖。年齡獲獎人數25歲以下25~3030~3535~4040~4545~5050歲以上15347068533728合計305曲線圖常見的類型有:鐘型分布、J型分布、U型分布對稱分布右偏分布左偏分布正J型分布反J型分布U型分布應用:洛侖茲曲線和基尼系數●洛侖茲(Lorenz)曲線是反映社會收入分配平均程度的一種累計百分數曲線,其特點是在縱軸和橫軸上都進行累計。(下凹程度愈大,表明收入分配愈不公平)基尼系數

意大利經濟學家基尼(Gini)根據洛侖茲曲線提出了判斷收入分配平均程度的量化指標。

合理界限0.2~0.3;警戒線0.4;紅線0.6。中國:2013:0.4732012:0.474,被稱為亞洲貧富差距最大的國家)

日本:2007:0.249印度:0.368品質數列可繪制的圖形

某城市居民關注廣告類型的頻數分布表

廣告類型人數(人)比例頻率(%)

商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001.000100.0例:為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調查,其中的一個問題是“您比較關心下列哪一類廣告?”

1.商品廣告2.服務廣告3.金融廣告

4.房地產廣告5.招生招聘廣告6.其他廣告1、條形圖

人數(人)5191610211204080120

商品廣告

服務廣告

金融廣告

房地產廣告

招生招聘廣告

其他廣告廣告類型

某城市居民關注不同類型廣告的人數分布圖2、圓形圖(餅形圖)

其他廣告1.0%

房地產廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務廣告25.5%

招生招聘廣告5.8%某城市居民關注不同類型廣告的人數構成第五節統計匯總一、概念在分組的基礎上,將總體各單位分別歸入各組,計算各組及總體的單位數,各組及總體的標志總量,使原始統計資料轉化為綜合統計資料的工作過程。即加總合計的過程。二、組織形式1、逐級匯總:自下而上逐級匯總如:班組車間廠部2、集中匯總:集中起來,一次匯總廠部車間班組3、綜合匯總:以上兩種方式結合使用三、技術方法1、手工匯總:常用的有劃記法過錄法折疊法卡片法2、計算機匯總第六節統計表統計表的概念

統計表是表示統計資料的表格,在由橫行、縱欄交叉結合而成的表格上,它能系統地組織和合理地安排大量數字資料。

二、統計表的結構1997~1998年城鎮居民家庭抽樣調查資料項目單位1997年1998年

一、調查戶數二、平均每戶家庭人口數三、平均每戶就業人口數四、平均每人全部收入五、平均每人實際支出消費性支出非消費性支出六、平均每人居住面積戶人人元元元元平方米378903.191.835188.544945.874185.64755.9411.90390803.161.805458.345322.954331.61987.1712.40

資料來源:《中國統計摘要1999》,中國統計出版社,1999,第79頁。

橫行標題數字資料總標題縱欄標題主詞賓詞從內容來看,一張統計表由兩部分構成:1、主詞:即統計表所要說明的對象。即橫行標題。2、賓詞:即用來說明統計表所要說明的對象,包括用來說明對象的有關標志或指標的名稱(即縱欄標題)及其具體數值(即數字資料)。三、統計表的種類根據主詞是否經過分組及分組方法不同,可分為:

1、簡單表:主詞未分組

2、簡單分組表:主詞經過簡單分組

3、復合分組表:主詞經過復合分組即主詞的三種設計方法

簡單表

第六次人口普查兩大城市人口

(2010年11月1日0時)

城市名稱人口數(人)

北京市上海市108194078787402●簡單分組表中國人口年齡結構狀況(單位:%)年齡組1953年1964年1982年1990年2000年0―14歲15―64歲65歲以上36.359.34.440.755.73.633.661.54.927.766.75.622.970.17.0●復合分組表

我國社會福利主要費用情況(單位:億元)項目1998199920002001(一)優撫對象補助金額國家支出集體供給(二)農村傳統救濟金額國家支出集體供給(三)城鄉各種福利院支出國家支出集體供給68.032.435.629.87.022.820.210.39.991.451.140.328.57.920.623.113.79.4

107.660.746.931.78.323.428.719.09.7

108.169.538.6

29.512.117.440.526.414.1合計118.0143.0168.0178.1三、統計表賓詞設計1、平行設計:賓詞平行排列如表3-14P482、復合設計:賓詞層疊排列如表3-15P48四、編制原則1、要合理安排統計表的結構2、各項標題要簡潔明確。總標題內容應滿足3W要求。3、表內各行、列按合乎邏輯的順序排列并編號。4、計量單位和數字填寫。5、表中的上下兩條橫線一般用粗線,其他線用細線。6、通常情況下,統計表左右兩邊不封口,即開口式表格。7、必要時可在表的下方加上注釋本章習題1、某工廠同工種的50名工人完成生產定額百分數(%)資料如下:

838812311011815812114613712016312513612714211812312613815110186821131421081011051251161321381171031141311088711912710511512612511010714113511793

要求:(1)根據上述資料編制變量數列(2)根據(1)的結果繪制直方圖、次數折線圖和累計次數折線圖。第五章抽樣推斷參數估計在統計方法中的地位統計方法描述統計推斷統計假設檢驗參數估計學習目標1、掌握抽樣推斷中的基本概念2、了解抽樣的基本方法3、掌握參數估計的方法分以下幾節來講第一節抽樣推斷概述第二節隨機抽樣方法與抽樣誤差第三節參數估計

第一節抽樣推斷概述一、抽樣推斷的概念與過程總體樣本樣本統計量例如:樣本均值、比例、方差總體均值、比例、方差抽樣推斷的作用在不可能進行全面調查的情況下可以使用抽樣推斷的方法.有些總體從理論上講可以進行全面調查,但實際辦不到或沒有必要.由于那些具有破壞性與消耗性的產品質量檢驗對全面調查的資料進行評價與修正用于工業生產管理二、抽樣中的有關概念(一)總體和樣本

總體:調查研究的事物或現象的全體,所包含的單位數用“N”表示。

樣本:從總體中所抽取的部分個體所構成的小的總體,當中所包含的單位數用“n”表示,稱為“樣本容量”。樣本可分為:大樣本小樣本

(二)全及指標與樣本指標(參數與統計量)

1、全及指標:說明全及總體的綜合數量特征,是唯一的,又稱為“參數”。

2、樣本指標:說明樣本的綜合數量特征,隨著樣本的變化而變化,不唯一的,是隨機變量,又稱為“統計量”。全及指標總體平均數總體方差總體成數樣本指標樣本均值總體服從正態分布樣本仍然服從正態分布稱為中心極限定理修正樣本標準差當樣本較大時,由于幾乎等于,因此常用公式(樣本標準差s)代替公式,并用于估計總體標準差。(三)樣本容量與樣本可能數目

1、樣本容量:樣本中所含個體的數量,用“n”

表示。當n≥30時,稱為大樣本,否則稱為小樣本。

n/N稱為抽樣比例

2、樣本可能數目:從N個個體中隨機抽取n個構成樣本,有多種可能,它取決于樣本容量和抽樣方法。(四)抽樣方法:重復抽樣與不重復抽樣1、重復抽樣:又叫“重置抽樣”,是有放回抽樣。樣本可能數目為2、不重復抽樣:又叫“不重置抽樣”,是無放回抽樣。樣本可能數目為

(五)抽樣組織方式概率抽樣

根據一個已知的概率選取被調查者。從理論上講,概率抽樣是最理想、最科學的抽樣方法,它能保證樣本數據對總體參數的代表性,而且能夠將抽樣誤差控制在一定的范圍之內。概率抽樣有以下幾種形式:1、純隨機抽樣:又叫簡單隨機抽樣,是對總體N個單位不分組不排序,隨機從中抽取n個單位構成樣本進行調查。具體方法有:抽簽法用隨機數字表

2、機械抽樣:又叫等距抽樣或系統抽樣做法:①對N個單位按一定標志排序并編號②按相等的間隔抽取樣本單位構成樣本3、類型抽樣:又叫分層抽樣。先將總體按某一主要標志分組,然后在各組內抽取一定數目的單位構成樣本。4、整群抽樣:先將總體劃分為若干組(或群),然后從中成批地抽取樣本單位構成樣本。

非概率抽樣不是完全按照隨機原則選取樣本。如:由調查人員自由選擇非調查者的非隨機選樣。如在購物中心采訪100名婦女。第二節隨機抽樣方法與抽樣誤差一、重復簡單隨機抽樣1概念重復簡單隨機抽樣又稱重置抽樣,是從具有N個單位的總體中隨機抽取n個單位為樣本,每次從總體中抽取一個單位登記其序號或標志值之后,又將它重新放回總體參加下一次抽選,連續進行n次抽選便構成了一個容量為n的樣本。2特點第一,總共可以構成個可能的樣本個數,每個樣本被抽取的概率都是相同的;第二,由于是重復抽樣,因此在n次抽樣中,總體中每個單位在各次抽樣中被抽取的概率都相同,n次抽樣就是n次相互獨立的試驗。例1P90例2P92二、不重復簡單隨機抽樣1概念不重復簡單隨機抽樣也稱不重置簡單隨機抽樣,是從具有N個單位的總體中隨機抽取一個容量為n的樣本,但每一次抽取一個單位登記其序號或標志值之后,不再將其重新放回總體參加下一次的抽選,因此這種抽樣方法實際上也就是一次同時從總體中抽取n個單位組成一個樣本。2特點

(1)總共可構成個可能的樣本個數,每個樣本被抽取的概率都是相同的。(2)由于是不重復抽樣,每抽樣一次,總體就少了一個單位數,因此在n次抽樣中,每個單位在各次抽樣中被抽取的概率不同,n次抽樣不是相互獨立的n次試驗。例3:P94例4P95例5P96三、抽樣誤差1、概念:是在遵循隨機原則的條件下,用樣本指標來代表全及指標所不可避免的誤差。就是統計誤差中的隨機誤差。抽樣誤差=樣本指標-全及指標2、影響因素:①抽取單位數n的多少②被研究標志的變異程度③抽樣方法④抽樣組織方式四、抽樣平均誤差1、概念:是所有可能組成的樣本的抽樣誤差的平均數,反映樣本指標與全及指標的平均誤差程度,是衡量樣本代表性大小的尺度,用“

”。2、公式:(1)重復抽樣條件下:

(2)不重復抽樣條件下:五、抽樣極限(允許)誤差1、概念:是在一定的概率保證下,用樣本指標估計全及指標時允許出現的最大誤差,用“△”表示.2、計算公式:

根據置信度(即可靠性,F(t)=1-α),查正態概率分布表,查得對應的概率度t。(在總體方差未知的情況下)

第三節參數估計一、概念

估計、推算樣本指標全及指標(統計量)(參數)二、方法

點估計區間估計(一)點估計又叫“定值估計”,是用樣本指標直接估計和代表全及指標,即不考慮誤差。全及指標--------樣本指標

(二)區間估計區間估計就是用點估計量和它的標準誤差(抽樣平均誤差)構成的區間估計總體參數,并說明總體參數落在這樣一個區間的可能性或置信度。區間估計必須具備三個基本要素:一是點估計量,可以是樣本的平均數,也可以是樣本成數p;二是誤差范圍,即抽樣極限誤差Δ通常都用樣本指標(點估計量)±抽樣極限誤差來表示總體指標的估計的區間,這個區間也叫做置信區間;三是置信度F(t)=(1-α)表示總體指標落入估計區間有百分之幾概率保證可以用數學公式簡潔地表示區間估計:

P(樣本指標一極限誤差≤總體指標≤樣本指標十極限誤差)=F(t)=1-α

抽樣極限誤差可以用概率度t和抽樣平均誤差μ相乘得到,即:

Δ=t·μ

概率度t可以通過查正態分布概率表得到。當F(t)=0.9500時,查正態分布概率表t=1.96;當F(t)=0.9545時,t=2;當F(t)=0.9973時,t=3。1總體平均數的區間估計用區間估計的方法來估計總體平均數,必須具備三要素:點估計量即樣本平均數、平均數的抽樣極限誤差Δx和置信度F(t)。公式如下:例:P982總體成數的區間估計用區間估計的方法來估計總體成數,必須具備三要素:點估計量即樣本成數p、成數的抽樣極限誤差Δp和置信度F(t)。公式如下:例P98【例】從一個正態總體中隨機抽取一個樣本,n=25,其均值`x=

50,標準差s=8。建立總體均值m

的95%的置信區間。解:已知X~N(

2),x=50,s=8,n=25,F(t)=95%查表得t=1.96總體均值的可能范圍為(50-3.136,50+3.136)1、某地種植農作物6000畝,按照隨機抽樣,調查了300畝。調查結果如下:平均畝產量為650公斤,標準差為15公斤。根據上述資料,試求:(1)利用點估計,推算農作物的總產量(2)利用區間估計,在0.9545的概率保證下估計全部農作物的平均畝產量(3)在同樣的概率保證下求這6000畝農作物的總產量的可能范圍。2、某進出口公司出口一種名茶,規定每包規格重量不低于150克,現在用不重復抽樣的方法抽取1%進行檢驗,結果如下:(1)以99.73%的概率保證估計這批茶葉平均每包重量的可能范圍(2)以同樣的概率保證估計這批茶葉包裝的合格率的可能范圍每包重量(克)包數149以下10149—15020150—15150151以上20三必要抽樣數目的確定(一)影響抽樣數目的因素影響抽樣數目的因素有:(1)被調查標志的變異程度,即總體標準差值愈大,必要抽樣數目愈多;值愈小,必要抽樣數目愈少。(2)允許誤差(極限誤差)Δ,即Δ的數值Δ值大可以少抽些樣本單位,Δ值小則要多抽一些樣本單位。Δ是調查前規定的,是根據調查目的確定的。(3)概率度tt值愈大,要求把握程度愈高,則要多抽些單位;t值愈小,要求把握程度低,則可少抽些單位。把握程度也是在抽樣之前根據抽樣的目的和要求來規定的。(4)抽樣方法在同等條件下,重置抽樣需要多抽一些單位,不重置抽樣可少抽一些樣本單位。(5)抽樣的組織方式。簡單隨機抽樣,類型隨機抽樣,等距隨機抽樣,整群隨機抽樣,階段隨機抽樣等都是抽樣的組織方式,由于采用的組織方式不同,必要抽樣數目也不相同。(二)必要抽樣數目的計算

1.重復抽樣條件下平均數的必要抽樣數目的確定例P992.重復抽樣條件下成數的必要抽樣數目的確定例P100

3.不重復抽樣條件下平均數的必要抽樣數目的確定4.不重復抽樣條件下成數的必要抽樣數目的確定

例P100—P101第六章相關與回歸分析學習目標1、掌握相關關系的概念和種類2、掌握相關分析的基本方法3、掌握一元線性回歸的基本原理和參數的最小二乘估計法4、利用回歸方程進行統計預測

分兩節來講:第一節相關關系與相關分析第二節簡單線性回歸分析

第一節相關關系與相關分析一、變量間的關系(一)函數關系設有兩個變量x和y,變量y隨變量x的變化而變化,并完全依賴于x,則稱y是x的函數,記為y=f(x),其中x稱為自變量,y稱為因變量。函數關系是一一對應的確定性關系。

函數關系的例子在價格一定的情況下,某種商品的銷售額(y)與銷售量(x)之間的關系可表示為

y=p

x(p為單價)圓的面積(S)與半徑之間的關系可表示為S=

R2

(二)相關關系特點:1、一個變量的取值不是完全由另一個(或一組)變量唯一確定。2、當變量x取某個值時,變量y的取值可能有幾個,不是一一對應關系概念:相關關系是變量之間確實存在著的數量上的相互依存關系,但關系值是不固定的。相關關系示圖

xy

相關關系的例子商品的消費量(y)與居民收入(x)之間的關系商品銷售額(y)與廣告費支出(x)之間的關系糧食畝產量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關系收入水平(y)與受教育程度(x)之間的關系父親身高(y)與子女身高(x)之間的關系二、相關關系的種類(一)按相關程度不同分1、完全相關:即函數關系2、不完全相關:研究重點3、完全不相關:即相互獨立(二)按相關的方向分1、正相關:變動方向一致。如:消費支出與工資收入投入與產出2、負相關:變動方向相反如:商品銷售額與商品流通費用率物價與消費量(三)按相關形式分:1、線性相關當變量x值發生變動時,變量y值發生大致均等的變動;或從圖形上看,觀察點的分布情況大致散布在一條直線周圍。2、非線性相關當變量x值發生變動時,變量y值也隨之發生變動,但這種變動是不均等的;或從圖形上看,觀察點的分布情況表現為各種不同的曲線形式。

(四)按涉及的變量的多少分

1、單相關:2個變量之間的相關關系2、復相關:3個或3個以上的變量之間的相關關系。可分解為多個單相關進行分析。完全正線性相關

完全負線性相關

非線性相關

正線性相關

負線性相關

不相關第二節相關表、相關圖和相關系數一相關分析:

就是對變量之間的相關關系進行分析。分析一個變量與另外一個(或一組)變量之間的相關關系的密切程度和方向的一種統計分析方法。二相關的列示方法

1、相關表:例:教材P108頁表6-2

2、相關圖:散點圖P109

3、指標計算:相關系數(線性相關條件下)三、相關系數(一)概念

相關系數是直線相關條件下說明兩個變量之間相關密切程度的統計分析指標,用“r”表示。(二)計算公式(積差法):或化簡為相關系數的取值范圍及其意義:r的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負相關

r=0,不存在線性相關關系-1.0+1.00-0.5+0.5完全負相關無線性相關完全正相關負相關程度增加正相關程度增加例1P111例2P111相關分析的不足:相關分析只能分析出變量之間是否有相關關系,相關關系的形式、方向和程度。但對于一個變量是如何隨著另一個(或一組)變量的變動而變動(即變量之間的數量變動關系)無法說明。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論