《統(tǒng)計(jì)學(xué)導(dǎo)論》配套教學(xué)課件_第1頁
《統(tǒng)計(jì)學(xué)導(dǎo)論》配套教學(xué)課件_第2頁
《統(tǒng)計(jì)學(xué)導(dǎo)論》配套教學(xué)課件_第3頁
《統(tǒng)計(jì)學(xué)導(dǎo)論》配套教學(xué)課件_第4頁
《統(tǒng)計(jì)學(xué)導(dǎo)論》配套教學(xué)課件_第5頁
已閱讀5頁,還剩620頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一節(jié)什么是統(tǒng)計(jì)一、統(tǒng)計(jì)(Statistics)的涵義統(tǒng)計(jì)是人們認(rèn)識(shí)客觀世界總體數(shù)量變動(dòng)關(guān)系和變動(dòng)規(guī)律的活動(dòng)的總稱,是人們認(rèn)識(shí)客觀世界的一種有力工具。統(tǒng)計(jì)的研究對(duì)象具有以下特點(diǎn):(一)數(shù)量性。統(tǒng)計(jì)數(shù)據(jù)是客觀事物量的反映。(二)總體性。統(tǒng)計(jì)的數(shù)量研究是對(duì)現(xiàn)象總體中各單位普遍存在的事實(shí)進(jìn)行大量觀察和綜合分析,得出反映現(xiàn)象總體的數(shù)量特征。(三)變異性。總體各單位的特征表現(xiàn)存在著差異,而且這些差異并不是事先可以預(yù)知的。1日常生活中,“統(tǒng)計(jì)”的3種含義統(tǒng)計(jì)工作(又稱統(tǒng)計(jì)實(shí)踐)是搜集、整理、分析和提供關(guān)于社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)字資料工作的總稱。英文中的統(tǒng)計(jì)statistics與“國家”同一詞根,可以說,自從有了國家,就有統(tǒng)計(jì)實(shí)踐活動(dòng)。統(tǒng)計(jì)數(shù)據(jù)是統(tǒng)計(jì)實(shí)踐活動(dòng)的成果。如:經(jīng)濟(jì)增長速度、價(jià)格指數(shù)等。對(duì)統(tǒng)計(jì)數(shù)據(jù)要求:客觀性、準(zhǔn)確性和及時(shí)性。統(tǒng)計(jì)學(xué)是研究如何測(cè)定、收集、整理、歸納和分析反映客觀現(xiàn)象總體數(shù)量的數(shù)據(jù),以便給出正確認(rèn)識(shí)的方法論科學(xué)。統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)實(shí)踐活動(dòng)的關(guān)系是理論與實(shí)踐的關(guān)系,理論源于實(shí)踐,理論又高于實(shí)踐,反過來又指導(dǎo)實(shí)踐

2二、統(tǒng)計(jì)研究的基本環(huán)節(jié)3統(tǒng)計(jì)設(shè)計(jì)收集數(shù)據(jù)整理與分析資料積累開發(fā)應(yīng)用統(tǒng)計(jì)學(xué)理論與相關(guān)實(shí)質(zhì)性學(xué)科理論描述統(tǒng)計(jì)推斷統(tǒng)計(jì)統(tǒng)計(jì)調(diào)查、實(shí)驗(yàn)統(tǒng)計(jì)研究的全過程包括以下基本環(huán)節(jié):(一)統(tǒng)計(jì)設(shè)計(jì)根據(jù)所要研究問題的性質(zhì),在有關(guān)學(xué)科理論的指導(dǎo)下,制定統(tǒng)計(jì)指標(biāo)、指標(biāo)體系和統(tǒng)計(jì)分類,給出統(tǒng)一的定義、標(biāo)準(zhǔn)。同時(shí)提出收集、整理和分析數(shù)據(jù)的方案和工作進(jìn)度等。搞好統(tǒng)計(jì)設(shè)計(jì)不僅要有統(tǒng)計(jì)學(xué)的一般理論和方法為指導(dǎo),而且還要求設(shè)計(jì)者對(duì)所要研究的問題本身具有深刻的認(rèn)識(shí)和相關(guān)的學(xué)科知識(shí)。(二)收集數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)的收集有兩種基本方法。對(duì)于大多數(shù)自然科學(xué)和工程技術(shù)研究來說,有可能通過有控制的科學(xué)實(shí)驗(yàn)去取得數(shù)據(jù),這時(shí)可以采用實(shí)驗(yàn)法。對(duì)于社會(huì)經(jīng)濟(jì)現(xiàn)象來說,一般無法進(jìn)行重復(fù)實(shí)驗(yàn),要取得有關(guān)數(shù)據(jù)就必須進(jìn)行調(diào)查觀察。4(三)整理與分析運(yùn)用的方法包括:描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。描述統(tǒng)計(jì)是指對(duì)采集的數(shù)據(jù)進(jìn)行登記、審核、整理、歸類,在此基礎(chǔ)上進(jìn)一步計(jì)算出各種能反映總體數(shù)量特征的綜合指標(biāo),并用圖表的形式表示經(jīng)過歸納分析而得到的各種有用的統(tǒng)計(jì)信息。推斷統(tǒng)計(jì)是在對(duì)樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,利用一定的方法根據(jù)樣本數(shù)據(jù)去估計(jì)或檢驗(yàn)總體的數(shù)量特征。推斷統(tǒng)計(jì)是現(xiàn)代統(tǒng)計(jì)學(xué)的主要內(nèi)容。(四)統(tǒng)計(jì)資料的積累、開發(fā)與應(yīng)用對(duì)于已經(jīng)公布的統(tǒng)計(jì)資料需要加以積累,同時(shí)還可以進(jìn)行進(jìn)一步的加工,結(jié)合相關(guān)的實(shí)質(zhì)性學(xué)科的理論知識(shí)去進(jìn)行分析和利用。如何更好地將統(tǒng)計(jì)數(shù)據(jù)和統(tǒng)計(jì)方法應(yīng)用于各自的研究領(lǐng)域是應(yīng)用統(tǒng)計(jì)學(xué)研究的一個(gè)重要方面。5

第二節(jié)統(tǒng)計(jì)學(xué)的種類及其性質(zhì)

一、統(tǒng)計(jì)學(xué)的產(chǎn)生與發(fā)展(一)政治算術(shù)學(xué)派最早的統(tǒng)計(jì)學(xué)源于17世紀(jì)英國的政治算術(shù)。其代表人物是威廉.配第(WilliamPatty,1623—1687年)。威廉·佩第在《政治算術(shù)》(1676年)一書中,寫到:本書“不用比較級(jí)、最高級(jí)進(jìn)行思辨或議論,而是用數(shù)字……來表達(dá)自己想說的問題……借以考察在自然中有可見的根據(jù)的原因。”政治算術(shù)學(xué)派主張用大量觀察和數(shù)量分析等方法對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行研究的主張,為統(tǒng)計(jì)學(xué)的發(fā)展開辟了廣闊的前景。(二)國勢(shì)學(xué)派最早使用“統(tǒng)計(jì)學(xué)”這一術(shù)語的是德國國勢(shì)學(xué)派的阿亨瓦爾(G.Achenwall,1719-1772)。國勢(shì)學(xué)派雖然創(chuàng)造了統(tǒng)計(jì)學(xué)這一名詞,但他們主要使用文字記述的方法對(duì)國情國力進(jìn)行研究,其學(xué)科內(nèi)容與現(xiàn)代統(tǒng)計(jì)學(xué)有較大的差別。6(三)社會(huì)統(tǒng)計(jì)學(xué)派1850年,德國的統(tǒng)計(jì)學(xué)家克尼斯(K.G.A.knies)發(fā)表了題為《獨(dú)立科學(xué)的統(tǒng)計(jì)學(xué)》的論文,提出統(tǒng)計(jì)學(xué)是一門獨(dú)立的社會(huì)科學(xué),是一門對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行數(shù)量對(duì)比分析的科學(xué),他主張以“國家論”作為國勢(shì)學(xué)的科學(xué)命名,而以“統(tǒng)計(jì)學(xué)”作為“政治算術(shù)”的科學(xué)命名。

在德國、日本和前蘇聯(lián),社會(huì)統(tǒng)計(jì)學(xué)派都曾有相當(dāng)大的影響。各國學(xué)者在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)的設(shè)定與計(jì)算、指數(shù)的編制、資料的收集與整理、統(tǒng)計(jì)調(diào)查的組織和實(shí)施、經(jīng)濟(jì)社會(huì)的數(shù)量分析和預(yù)測(cè)等方面做出的貢獻(xiàn)已成為現(xiàn)代統(tǒng)計(jì)學(xué)的重要組成部分。例如,“恩格爾系數(shù)”,至今仍為人們廣泛使用。國民收入和國內(nèi)生產(chǎn)總值的核算方法被稱為“20世紀(jì)最偉大的發(fā)明之一。”7(四)數(shù)理統(tǒng)計(jì)學(xué)派

創(chuàng)始人是比利時(shí)統(tǒng)計(jì)學(xué)家凱特勒(AdolpheQuetelet,1796—1874年)。他所著的代表作《概率論書簡》、《社會(huì)物理學(xué)》等將概率論和統(tǒng)計(jì)方法引入社會(huì)經(jīng)濟(jì)方面的研究。在學(xué)科性質(zhì)上,凱特勒認(rèn)為統(tǒng)計(jì)學(xué)是一門既研究社會(huì)現(xiàn)象又研究自然現(xiàn)象的方法論科學(xué)。從19世紀(jì)中葉到20世紀(jì)中葉,數(shù)理統(tǒng)計(jì)學(xué)得到迅速發(fā)展。英國生物學(xué)家高爾頓提出并闡述了“相關(guān)”的概念;皮爾遜提出了計(jì)算復(fù)相關(guān)和偏相關(guān)的方法。戈塞特建立了“小樣本理論”,即所謂的“t分布”;費(fèi)歇樣本相關(guān)系數(shù)的分布、方差分析、實(shí)驗(yàn)設(shè)計(jì)等方面的研究中做出了重要貢獻(xiàn)。到20世紀(jì)中期,數(shù)理統(tǒng)計(jì)學(xué)的基本框架已經(jīng)形成。數(shù)理統(tǒng)計(jì)學(xué)派成為英美等國統(tǒng)計(jì)學(xué)界的主流。8二、理論統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)歷經(jīng)300多年的發(fā)展,統(tǒng)計(jì)學(xué)目前已經(jīng)成為橫跨社會(huì)科學(xué)和自然科學(xué)領(lǐng)域的多科性的科學(xué)。

“統(tǒng)計(jì)學(xué)是有關(guān)如何測(cè)定、收集和分析反映客觀現(xiàn)象總體數(shù)量的數(shù)據(jù),以便給出正確認(rèn)識(shí)的方法論科學(xué)。”從橫向看,各種統(tǒng)計(jì)學(xué)都具有上述共同點(diǎn),因而能夠形成一個(gè)學(xué)科“家族”。從縱向看,統(tǒng)計(jì)學(xué)方法應(yīng)用于各種實(shí)質(zhì)性科學(xué),同它們相結(jié)合,產(chǎn)生了一系列專門領(lǐng)域的統(tǒng)計(jì)學(xué)。由此可見,現(xiàn)代統(tǒng)計(jì)學(xué)可以分為兩大類:一類是以抽象的數(shù)量為研究對(duì)象,研究一般的收集數(shù)據(jù)、整理數(shù)據(jù)和分析數(shù)據(jù)方法的理論統(tǒng)計(jì)學(xué)。另一類是以各個(gè)不同領(lǐng)域的具體數(shù)量為研究對(duì)象的應(yīng)用統(tǒng)計(jì)學(xué)。9圖1-2統(tǒng)計(jì)學(xué)學(xué)科體系經(jīng)濟(jì)學(xué)社會(huì)學(xué)教育學(xué)其他社科物理學(xué)生物學(xué)醫(yī)學(xué)其他理工農(nóng)經(jīng)濟(jì)統(tǒng)計(jì)社會(huì)統(tǒng)計(jì)教育統(tǒng)計(jì)其他社科統(tǒng)計(jì)統(tǒng)計(jì)學(xué)物理統(tǒng)計(jì)生物統(tǒng)計(jì)醫(yī)藥統(tǒng)計(jì)其他理工農(nóng)統(tǒng)計(jì)10理論統(tǒng)計(jì)學(xué)把研究對(duì)象一般化、抽象化,以數(shù)學(xué)中的概率論為基礎(chǔ),從純理論的角度,對(duì)統(tǒng)計(jì)方法加以推導(dǎo)論證,其中心內(nèi)容是以歸納方法研究隨機(jī)變量的一般規(guī)律。理論統(tǒng)計(jì)學(xué)的特點(diǎn)是計(jì)量不計(jì)質(zhì),它具有通用方法論的理學(xué)性質(zhì)。應(yīng)用統(tǒng)計(jì)學(xué)是有具體對(duì)象的方法論。所謂應(yīng)用既包括一般統(tǒng)計(jì)方法的應(yīng)用,更包括各自領(lǐng)域?qū)嵸|(zhì)性科學(xué)理論的應(yīng)用。應(yīng)用統(tǒng)計(jì)學(xué)從所研究的領(lǐng)域或?qū)iT問題出發(fā),視研究對(duì)象的性質(zhì)采用適當(dāng)?shù)闹笜?biāo)體系和統(tǒng)計(jì)方法,解決所需研究的問題。應(yīng)用統(tǒng)計(jì)學(xué)不僅要進(jìn)行定量分析,還需要進(jìn)行定性分析。所以應(yīng)用統(tǒng)計(jì)學(xué)通常具有邊緣交叉和復(fù)合型學(xué)科的性質(zhì)。理論統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)總是互相促進(jìn),共同提高的。理論統(tǒng)計(jì)的研究為應(yīng)用統(tǒng)計(jì)提供方法論基礎(chǔ),應(yīng)用統(tǒng)計(jì)學(xué)在對(duì)統(tǒng)計(jì)方法的實(shí)際應(yīng)用中,又常常會(huì)對(duì)理論統(tǒng)計(jì)學(xué)提出新的問題,開拓理論統(tǒng)計(jì)學(xué)的研究領(lǐng)域。11社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)是一門以社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量方面為特定研究對(duì)象的應(yīng)用統(tǒng)計(jì)學(xué)。要在社會(huì)經(jīng)濟(jì)領(lǐng)域應(yīng)用統(tǒng)計(jì)方法,必須解決如何科學(xué)地測(cè)定社會(huì)經(jīng)濟(jì)現(xiàn)象即如何科學(xué)地設(shè)置指標(biāo)的問題。要對(duì)社會(huì)經(jīng)濟(jì)問題進(jìn)行統(tǒng)計(jì)分析,也必須以有關(guān)的經(jīng)濟(jì)與社會(huì)理論為指導(dǎo)。因此,社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)的特點(diǎn)是在質(zhì)與量的緊密聯(lián)系中,研究事物的數(shù)量特征和數(shù)量表現(xiàn)。由于社會(huì)經(jīng)濟(jì)現(xiàn)象所具有的復(fù)雜性和特殊性,社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)不僅要應(yīng)用一般的統(tǒng)計(jì)方法,而且還需要研究自己獨(dú)特的方法,如核算的方法、綜合評(píng)價(jià)的方法等等。通過社會(huì)經(jīng)濟(jì)統(tǒng)計(jì),國家可以準(zhǔn)確、及時(shí)、全面、系統(tǒng)地掌握國民經(jīng)濟(jì)和社會(huì)發(fā)展情況,對(duì)國民經(jīng)濟(jì)和社會(huì)運(yùn)行監(jiān)督和預(yù)警,為宏觀調(diào)控和決策提供依據(jù)。企業(yè)可以及時(shí)了解商品市場(chǎng)和要素市場(chǎng)運(yùn)行的狀況和企業(yè)自身的經(jīng)營動(dòng)態(tài),為企業(yè)營銷決策、投資理財(cái)提供參考。12二、統(tǒng)計(jì)學(xué)與有關(guān)學(xué)科的聯(lián)系與區(qū)別

數(shù)學(xué)與統(tǒng)計(jì)學(xué)。數(shù)學(xué)與統(tǒng)計(jì)學(xué)都是研究數(shù)量規(guī)律的,都要利用各種公式進(jìn)行運(yùn)算。數(shù)學(xué)中的概率論,為統(tǒng)計(jì)學(xué)提供了數(shù)量分析的理論基礎(chǔ)。統(tǒng)計(jì)學(xué)中的理論統(tǒng)計(jì)學(xué)以抽象的數(shù)量為研究對(duì)象,其大部分內(nèi)容也可以看作是數(shù)學(xué)的分支。統(tǒng)計(jì)學(xué)與數(shù)學(xué)的區(qū)別。從研究對(duì)象看,數(shù)學(xué)以最一般的形式研究數(shù)量的聯(lián)系和空間形式。統(tǒng)計(jì)學(xué)特別是應(yīng)用統(tǒng)計(jì)學(xué)則總是與客觀的對(duì)象聯(lián)系在一起的。從研究方法看,數(shù)學(xué)主要是邏輯推理和演繹論證的方法。而統(tǒng)計(jì)本質(zhì)上是歸納的方法。統(tǒng)計(jì)學(xué)家特別是應(yīng)用統(tǒng)計(jì)學(xué)家需要深入實(shí)際,進(jìn)行調(diào)查或?qū)嶒?yàn)去取得數(shù)據(jù),研究時(shí)不僅要運(yùn)用統(tǒng)計(jì)的方法,而且還要掌握某一專門領(lǐng)域的知識(shí)。13統(tǒng)計(jì)學(xué)與經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)與相關(guān)的實(shí)質(zhì)性學(xué)科如經(jīng)濟(jì)學(xué)等,有密切的聯(lián)系。統(tǒng)計(jì)學(xué)是開展經(jīng)濟(jì)研究不可或缺的重要工具。通過統(tǒng)計(jì)的實(shí)證研究,可以幫助人們認(rèn)識(shí)有關(guān)的數(shù)量規(guī)律,同時(shí)檢驗(yàn)經(jīng)濟(jì)學(xué)理論的真實(shí)性和完善程度。獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的學(xué)者三分之二以上與統(tǒng)計(jì)有關(guān)。經(jīng)濟(jì)學(xué)等實(shí)質(zhì)性學(xué)科對(duì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)起著重要的指導(dǎo)作用。不僅統(tǒng)計(jì)指標(biāo)的設(shè)定離不開實(shí)質(zhì)性學(xué)科的指導(dǎo),而且應(yīng)用統(tǒng)計(jì)方法也在很大的程度上受所研究對(duì)象性質(zhì)的影響。統(tǒng)計(jì)學(xué)與相關(guān)實(shí)質(zhì)性學(xué)科的區(qū)別。實(shí)質(zhì)性學(xué)科研究該領(lǐng)域現(xiàn)象的本質(zhì)關(guān)系并對(duì)有關(guān)規(guī)律作出合理的解釋和論證。而統(tǒng)計(jì)學(xué)只是為實(shí)質(zhì)性學(xué)科研究和認(rèn)識(shí)數(shù)量規(guī)律提供專門的方法和工具,并不直接對(duì)規(guī)律產(chǎn)生的原因和機(jī)理作進(jìn)一步的分析。14第三節(jié)統(tǒng)計(jì)學(xué)的基本概念一、總體與總體單位統(tǒng)計(jì)總體是根據(jù)一定目的確定的所要研究的事物的全體。它是由客觀存在的、具有某種共同性質(zhì)的許多個(gè)別事物構(gòu)成的整體。例如要研究全國城鎮(zhèn)居民的收支情況,就以全國城鎮(zhèn)居民作為一個(gè)總體。。同質(zhì)性是確定統(tǒng)計(jì)總體的基本標(biāo)準(zhǔn),它是根據(jù)統(tǒng)計(jì)的研究目的而定的。研究目的不同,則所確定的總體也不同,其同質(zhì)性的意義也隨之變化。例如,研究城鎮(zhèn)居民貧困戶的生活狀況,那么,貧困線下的城鎮(zhèn)居民戶則構(gòu)成了統(tǒng)計(jì)總體,貧困線下的城鎮(zhèn)居民戶是同質(zhì)的,而貧困線上的城鎮(zhèn)居民戶是非同質(zhì)的。統(tǒng)計(jì)總體還應(yīng)具備大量性。統(tǒng)計(jì)總體應(yīng)該由足夠數(shù)量的同質(zhì)性單位構(gòu)成。15總體單位(簡稱單位)是組成總體的各個(gè)個(gè)體。根據(jù)研究目的的不同,單位可以是人、物、機(jī)構(gòu)等實(shí)物單位,也可以是一種現(xiàn)象或活動(dòng)過程等非實(shí)物單位。總體和單位的概念是相對(duì)而言的,隨研究目的不同,總體范圍不同而變化。同一個(gè)研究對(duì)象,在一種情況下為總體,但在另一種情況下又可能變成單位。根據(jù)總體所包含的單位數(shù)量,總體可以分為有限總體和無限總體兩類。有限總體是由有限量的單位構(gòu)成的總體。當(dāng)總體單位數(shù)難以確定,其數(shù)量可能是無限時(shí),便構(gòu)成無限總體。16二、樣本當(dāng)總體單位數(shù)量很多甚至無限時(shí),不必要或不可能對(duì)構(gòu)成總體的所有單位都進(jìn)行調(diào)查。這時(shí),需要采用一定的方式,從由作為研究對(duì)象的事物全體構(gòu)成的總體(又稱母體)中,抽取一部分單位,作為總體的代表加以研究。這種由總體的部分單位組成的集合稱為樣本(又稱子樣)。樣本也由一定數(shù)量的單位構(gòu)成的,樣本所包含的總體單位數(shù)稱為樣本容量。三、標(biāo)志總體各單位普遍具有的屬性或特征稱為標(biāo)志。例如每個(gè)工人都具有性別、工種、文化程度、技術(shù)等級(jí)、年齡、工齡、工資等屬性和特征,這些就是工人作為總體單位的標(biāo)志。17標(biāo)志分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志兩種。品質(zhì)標(biāo)志表明單位屬性方面的特征,品質(zhì)標(biāo)志的表現(xiàn)只能用文字、語言來描述如工人的性別。數(shù)量標(biāo)志表明單位數(shù)量方面的特征,可以用數(shù)值來表現(xiàn),如年齡。如果一個(gè)總體中各單位有關(guān)標(biāo)志的具體表現(xiàn)都相同,稱之為不變標(biāo)志。例如在工人這一總體中,職業(yè)是不變標(biāo)志。在一個(gè)總體中,當(dāng)一個(gè)標(biāo)志在各單位的具體表現(xiàn)有可能不同時(shí),這個(gè)標(biāo)志便稱為變異標(biāo)志。例如各人的工齡可能表現(xiàn)不同,因而是可變標(biāo)志。一個(gè)總體至少要有一個(gè)不變標(biāo)志,才能夠使各單位結(jié)合成一個(gè)總體。不變標(biāo)志是總體同質(zhì)性的基礎(chǔ)。作為總體,同時(shí)必須存在變異標(biāo)志,這表示所研究的現(xiàn)象在各單位之間存在著差異,才需要進(jìn)行統(tǒng)計(jì)研究。18四、統(tǒng)計(jì)指標(biāo)與指標(biāo)體系統(tǒng)計(jì)指標(biāo)是反映統(tǒng)計(jì)總體數(shù)量特征的概念和數(shù)值。如2002年我國國內(nèi)生產(chǎn)總值104790.6億元。統(tǒng)計(jì)指標(biāo)由兩項(xiàng)基本要素構(gòu)成,即指標(biāo)的概念(名稱)和指標(biāo)的取值。指標(biāo)的概念(名稱)是對(duì)所研究現(xiàn)象本質(zhì)的抽象概括,也是對(duì)總體數(shù)量特征的質(zhì)的規(guī)定性。確定統(tǒng)計(jì)指標(biāo)必須有一定的理論依據(jù),使之與社會(huì)經(jīng)濟(jì)或科學(xué)技術(shù)的范疇相吻合。同時(shí),又必須對(duì)理論范疇和計(jì)算口徑加以具體化。指標(biāo)的數(shù)值反映所研究現(xiàn)象在具體時(shí)間、地點(diǎn)、條件下的規(guī)模和水平。在觀察指標(biāo)數(shù)值時(shí),必須了解其具體的時(shí)間狀態(tài)、空間范圍、計(jì)量單位、計(jì)量方法等限定,同時(shí)注意由于上述條件的變化而引起數(shù)值的可比性問題。19指標(biāo)與標(biāo)志的關(guān)系標(biāo)志反映總體單位的屬性和特征,而指標(biāo)則反映總體的數(shù)量特征。標(biāo)志和指標(biāo)的關(guān)系是個(gè)別和整體的關(guān)系。需要通過對(duì)各單位標(biāo)志的具體表現(xiàn)進(jìn)行匯總和計(jì)算才能得到相應(yīng)的指標(biāo)。由于總體和單位的概念會(huì)隨著研究目的不同而變化,因此指標(biāo)與標(biāo)志的概念也是相對(duì)而言的。例如,如果所要研究的是全國工業(yè)企業(yè)的情況,則各企業(yè)的職工人數(shù)、固定資產(chǎn)、工業(yè)增加值等都是總體單位(即各個(gè)企業(yè))的標(biāo)志,而如果研究目的變成研究某一企業(yè)的職工狀況,則該企業(yè)變成一個(gè)總體,企業(yè)職工人數(shù)變成了統(tǒng)計(jì)指標(biāo),每個(gè)職工的文化程度、技術(shù)等級(jí)、性別、年齡等就成為標(biāo)志。20統(tǒng)計(jì)指標(biāo)可以分為數(shù)量指標(biāo)和質(zhì)量指標(biāo)。凡是反映現(xiàn)象總規(guī)模、總水平的統(tǒng)計(jì)指標(biāo)稱為數(shù)量指標(biāo)。例如人口總數(shù)、企業(yè)總數(shù)、商品進(jìn)出口總額等等,這些指標(biāo)反映現(xiàn)象或過程的總規(guī)模和水平,所以也稱為總量指標(biāo),用絕對(duì)數(shù)來表示。凡是反映現(xiàn)象相對(duì)水平和工作質(zhì)量的統(tǒng)計(jì)指標(biāo)稱為質(zhì)量指標(biāo),例如職工平均工資、人口密度、工人出勤率等等。質(zhì)量指標(biāo)是總量指標(biāo)的派生指標(biāo),用相對(duì)數(shù)或平均數(shù)來表示,以反映現(xiàn)象之間的內(nèi)在聯(lián)系和對(duì)比關(guān)系。統(tǒng)計(jì)指標(biāo)體系是由一系列相互聯(lián)系的統(tǒng)計(jì)指標(biāo)所組成的有機(jī)整體。用以反映所研究現(xiàn)象各方面相互依存相互制約的關(guān)系。例如,工業(yè)企業(yè)統(tǒng)計(jì)指標(biāo)體系。21五、統(tǒng)計(jì)數(shù)據(jù)(一)變量與變量值說明現(xiàn)象的某一數(shù)量特征的概念也被稱為變量,變量的具體取值是變量值,統(tǒng)計(jì)數(shù)據(jù)就是統(tǒng)計(jì)變量的具體表現(xiàn)。例如,固定資產(chǎn)是一個(gè)變量,各企業(yè)固定資產(chǎn)的具體數(shù)值是變量值。為了區(qū)別,在本書中,凡是變量均用大寫的英文字母表示,而變量值則用小寫英文字母表示。連續(xù)型變量是指變量的取值在數(shù)軸上連續(xù)不斷,無法一一列舉,即在一個(gè)區(qū)間內(nèi)可以取任意實(shí)數(shù)值。例如,氣象上的溫度、濕度,零件的尺寸等。離散型變量是指變量的其取值是整數(shù)值,可以一一列舉。例如,企業(yè)數(shù),職工人數(shù)等。22確定性變量是受確定性因素影響的變量,即影響變量值變化的因素是明確的,是可解釋和可控制的。隨機(jī)變量則是受許多微小的不確定因素(又稱隨機(jī)因素)影響的變量。變量的取值無法事先確定。社會(huì)經(jīng)濟(jì)現(xiàn)象既有確定性變量也有隨機(jī)變量。統(tǒng)計(jì)學(xué)所研究的主要是隨機(jī)變量。(二)數(shù)據(jù)的計(jì)量尺度統(tǒng)計(jì)數(shù)據(jù)是總體單位標(biāo)志或統(tǒng)計(jì)指標(biāo)的具體數(shù)量表現(xiàn)。根據(jù)對(duì)研究對(duì)象計(jì)量的不同精確程度,人們將計(jì)量尺度由低到高、由粗略到精確分為四個(gè)層次:定類尺度、定序尺度、定距尺度和定比尺度。231.定類尺度是按照客觀現(xiàn)象的某種屬性對(duì)其進(jìn)行分類。這一場(chǎng)合的所使用的數(shù)值只是作為各種分類的代碼,并不反映各類的優(yōu)劣、量的大小或順序。例如,人口按性別分為男女,用“1”表示男性,用“0”表示女性。定類尺度的主要數(shù)學(xué)特征是“=”或“≠”。在統(tǒng)計(jì)處理中,對(duì)于不同的類別,雖然可以計(jì)算單位數(shù),但它不能表明第一類的一個(gè)單位可以相當(dāng)于第二類的幾個(gè)單位。2.定序尺度是對(duì)客觀現(xiàn)象各類之間的等級(jí)差或順序差的一種測(cè)度。利用定序尺度不僅可以將研究對(duì)象分成不同的類別,而且還可以反映各類的優(yōu)劣、量的大小或順序。例如,學(xué)生成績可以分為優(yōu)、良、中、及格和不及格等五類。在這里,定序尺度雖然無法表明一個(gè)優(yōu)等于幾個(gè)良,但卻能確切地表明優(yōu)高于良,良又高于中……。定序尺度的主要數(shù)學(xué)特征是“<”或“>”。243.定距尺度是對(duì)現(xiàn)象類別或次序之間間距的測(cè)度。定距尺度不但可以用數(shù)表示現(xiàn)象各類別的不同和順序大小的差異,而且可以用確切的數(shù)值反映現(xiàn)象之間在量方面的差異。定距尺度使用的計(jì)量單位一般為實(shí)物單位(自然或物理)或者價(jià)值單位。定距尺度的主要數(shù)學(xué)特征是“+”或“–”。統(tǒng)計(jì)中的總量指標(biāo)就是運(yùn)用定距尺度計(jì)量的。4.定比尺度。定比尺度是在定距尺度的基礎(chǔ)上,確定相應(yīng)的比較基數(shù),然后將兩種相關(guān)的數(shù)加以對(duì)比而形成相對(duì)數(shù)(或平均數(shù)),用于反映現(xiàn)象的結(jié)構(gòu)、比重、速度、密度等數(shù)量關(guān)系。例如,將一個(gè)企業(yè)創(chuàng)造的增加值與該企業(yè)的職工人數(shù)對(duì)比,計(jì)算全員勞動(dòng)生產(chǎn)率,以此反映該企業(yè)的生產(chǎn)效率。定比尺度的主要數(shù)學(xué)特征是“×”或“÷”。25(三)數(shù)據(jù)的類型

橫截面數(shù)據(jù)又稱為靜態(tài)數(shù)據(jù),它是指在同一時(shí)間對(duì)同一總體內(nèi)不同單位的數(shù)量進(jìn)行觀察而獲得的數(shù)據(jù)。時(shí)間序列數(shù)據(jù)又稱為動(dòng)態(tài)數(shù)據(jù),它是指在不同時(shí)間對(duì)同一總體的數(shù)量表現(xiàn)進(jìn)行觀察而獲得的數(shù)據(jù)。例如,2005年全國各省市自治區(qū)的國內(nèi)生產(chǎn)總值就屬于橫截面數(shù)據(jù)。而“十五”期間我國歷年的國內(nèi)生產(chǎn)總值就屬于時(shí)間序列數(shù)據(jù)。26(四)數(shù)據(jù)的表現(xiàn)形式

絕對(duì)數(shù)。現(xiàn)象的規(guī)模、水平一般以絕對(duì)數(shù)形式表現(xiàn)。絕對(duì)數(shù)的計(jì)量單位一般為實(shí)物單位或價(jià)值單位,有時(shí)也采用復(fù)合單位。實(shí)物單位可以是自然計(jì)量單位,也可以是物理計(jì)量單位,如人口數(shù)用人計(jì)量,機(jī)器數(shù)用臺(tái)計(jì)量,對(duì)于一些化工產(chǎn)品和燃料,常常還折合成標(biāo)準(zhǔn)實(shí)物單位計(jì)量。復(fù)合計(jì)量單位是由兩種或兩種以上計(jì)量單位復(fù)合而成的,如以“噸公里”為貨物周轉(zhuǎn)量的計(jì)量單位,以“千瓦時(shí)”為用電量的計(jì)量單位。相對(duì)數(shù)。相對(duì)數(shù)由2個(gè)互相聯(lián)系的數(shù)值對(duì)比求得。常用的相對(duì)數(shù)包括:結(jié)構(gòu)相對(duì)數(shù)、動(dòng)態(tài)相對(duì)數(shù)、比較相對(duì)數(shù)、強(qiáng)度相對(duì)數(shù)、利用程度相對(duì)數(shù)、計(jì)劃完成相對(duì)數(shù)等。關(guān)于這些相對(duì)數(shù)的含義及其計(jì)算,本書將在第十章作詳細(xì)介紹。平均數(shù)。平均數(shù)反映現(xiàn)象總體的一般水平或分布的集中趨勢(shì)。關(guān)于這部分的內(nèi)容,本書將在第三章作詳細(xì)介紹。27管理統(tǒng)計(jì)學(xué)第二章第二章統(tǒng)計(jì)數(shù)據(jù)的搜集、整理與顯示

第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的搜集第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的顯示29第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的搜集

一、統(tǒng)計(jì)數(shù)據(jù)的搜集方法1.統(tǒng)計(jì)數(shù)據(jù)搜集的概念根據(jù)統(tǒng)計(jì)研究預(yù)定的目的和任務(wù),運(yùn)用科學(xué)的方法與手段,有計(jì)劃、有組織地向客觀實(shí)際采集數(shù)據(jù)的過程從統(tǒng)計(jì)工作過程的階段性看,統(tǒng)計(jì)數(shù)據(jù)的搜集處于統(tǒng)計(jì)工作過程的基礎(chǔ)階段。

2.統(tǒng)計(jì)數(shù)據(jù)搜集的方式一種是直接向調(diào)查對(duì)象搜集反映調(diào)查單位的統(tǒng)計(jì)數(shù)據(jù)(或稱原始資料);另一種是搜集已經(jīng)加工、整理過的、說明總體現(xiàn)象的數(shù)據(jù)(一般稱為二手資料)。

3.統(tǒng)計(jì)數(shù)據(jù)的分類按其性質(zhì)不同分為調(diào)查數(shù)據(jù)和試驗(yàn)數(shù)據(jù)

4.統(tǒng)計(jì)數(shù)據(jù)的搜集方法對(duì)于調(diào)查數(shù)據(jù)的搜集,通常稱為統(tǒng)計(jì)調(diào)查。搜集的是調(diào)查對(duì)象的原始資料,常用的方法有直接觀察法、報(bào)告法(通訊法)、采訪法、實(shí)驗(yàn)調(diào)查設(shè)計(jì)等。30二、統(tǒng)計(jì)調(diào)查方式常用的統(tǒng)計(jì)調(diào)查方式1.普查2.抽樣調(diào)查3.重點(diǎn)調(diào)查

4.統(tǒng)計(jì)報(bào)表制度311.普查普查:是專門組織的一種全面調(diào)查,它主要是用以搜集某些不能或不宜用定期報(bào)表搜集的統(tǒng)計(jì)資料。對(duì)國情國力的調(diào)查一般采用普查。普查的特點(diǎn):〈一〉是一種非經(jīng)常性的全面調(diào)查;〈二〉比任何一種調(diào)查形式更能掌握大量、詳細(xì)、全面的統(tǒng)計(jì)資料。322.抽樣調(diào)查

抽樣調(diào)查:是一種非全面調(diào)查,抽樣調(diào)查可以分為概率抽樣和非概率抽樣。概率抽樣是按隨機(jī)原則從調(diào)查對(duì)象中抽取一部分單位作為樣本進(jìn)行觀察,然后根據(jù)樣本數(shù)據(jù)去推算調(diào)查對(duì)象的總體特征。

概率抽樣的特點(diǎn):〈一〉樣本單位按隨機(jī)原則抽取,排除了主觀因素對(duì)選樣的影響。〈二〉根據(jù)部分調(diào)查的實(shí)際資料對(duì)調(diào)查對(duì)象總體的數(shù)量特征作出估計(jì)。〈三〉抽樣誤差可以事先計(jì)算并加以控制。抽樣調(diào)查的適用場(chǎng)合:

〈一〉不可能或不必要進(jìn)行全面調(diào)查的社會(huì)現(xiàn)象,采用抽樣調(diào)查;〈二〉對(duì)普查資料進(jìn)行必要的修正。333.重點(diǎn)調(diào)查

重點(diǎn)調(diào)查:在調(diào)查對(duì)象中,只選擇一部分重點(diǎn)單位進(jìn)行的非全面調(diào)查。重點(diǎn)單位:它們?cè)谒芯楷F(xiàn)象的標(biāo)志總量中卻占有絕大的比重,在總體中具有舉足輕重的作用。對(duì)這些單位進(jìn)行調(diào)查,能夠從數(shù)量上反映整個(gè)總體在該標(biāo)志總量方面的基本情況。特點(diǎn):可以了解較詳細(xì)的情況,但無法對(duì)現(xiàn)象總體的數(shù)量特征作出準(zhǔn)確的推算,也無法測(cè)算調(diào)查誤差。適用場(chǎng)合:當(dāng)調(diào)查任務(wù)只要求掌握基本情況,而部分單位又能比較集中地反映研究的項(xiàng)目,宜采用重點(diǎn)調(diào)查。344.統(tǒng)計(jì)報(bào)表制度

統(tǒng)計(jì)報(bào)表制度:依照國家有關(guān)法規(guī),自上而下地統(tǒng)一布置,以一定的原始記錄為依據(jù),按照統(tǒng)一的表式,統(tǒng)一的指標(biāo)項(xiàng)目,統(tǒng)一的報(bào)送時(shí)間和報(bào)送程序,自下而上地逐級(jí)地定期提供統(tǒng)計(jì)資料的一種調(diào)查方式。

統(tǒng)計(jì)報(bào)表的主要特點(diǎn):〈一〉報(bào)表資料的來源是建立在各個(gè)基層單位的原始記的基礎(chǔ)上;〈二〉由于統(tǒng)計(jì)報(bào)表是逐級(jí)上報(bào)和匯總的,各級(jí)領(lǐng)導(dǎo)部門能獲得管轄范圍內(nèi)的報(bào)表資料;〈三〉是一種經(jīng)常性的(連續(xù)性)調(diào)查,調(diào)查項(xiàng)目相對(duì)穩(wěn)定,有利于積累資料,并進(jìn)行動(dòng)態(tài)對(duì)比分析。35三、統(tǒng)計(jì)調(diào)查體系

統(tǒng)計(jì)調(diào)查體系:一個(gè)國家開展統(tǒng)計(jì)調(diào)查方法和制度的總稱。

我國的統(tǒng)計(jì)調(diào)查體系:建立以必要的周期性的普查為基礎(chǔ),經(jīng)常性的抽樣調(diào)查為主體,同時(shí)輔之以重點(diǎn)調(diào)查、科學(xué)推算和部分全面報(bào)表綜合運(yùn)用的統(tǒng)計(jì)調(diào)查方法體系。36四、統(tǒng)計(jì)調(diào)查方案的設(shè)計(jì)

〈一〉明確調(diào)查目的。

〈二〉確定調(diào)查對(duì)象和調(diào)查單位。調(diào)查對(duì)象,是指需要調(diào)查的現(xiàn)象總體。調(diào)查單位,是指所要調(diào)查的具體單位。報(bào)告單位亦稱填報(bào)單位,它是負(fù)責(zé)向上報(bào)告調(diào)查內(nèi)容、提交統(tǒng)計(jì)資料的單位。報(bào)告單位一般是在行政上、經(jīng)濟(jì)上具有一定獨(dú)立性的單位。

〈三〉設(shè)計(jì)調(diào)查項(xiàng)目。

〈四〉設(shè)計(jì)調(diào)查表格和問卷37〈五〉確定調(diào)查時(shí)間。調(diào)查時(shí)間是指調(diào)查資料所屬的時(shí)間,在統(tǒng)計(jì)調(diào)查中,如果所調(diào)查的是時(shí)期現(xiàn)象,就要明確規(guī)定調(diào)查資料所反映的起止日期。如果所要調(diào)查的是時(shí)點(diǎn)現(xiàn)象,調(diào)查時(shí)間就是規(guī)定的統(tǒng)一標(biāo)準(zhǔn)時(shí)點(diǎn)。調(diào)查期限是進(jìn)行調(diào)查工作的時(shí)限,包括搜集資料和報(bào)送資料的工作所需的時(shí)間。

〈六〉組織實(shí)施調(diào)查計(jì)劃。

〈七〉調(diào)查報(bào)告的撰寫。38五、二手資料的主要來源渠道1.統(tǒng)計(jì)年鑒2.有關(guān)期刊3.有關(guān)網(wǎng)站39第二節(jié)

統(tǒng)計(jì)數(shù)據(jù)的整理

一、數(shù)據(jù)整理概述

1.?dāng)?shù)據(jù)整理的含義:對(duì)統(tǒng)計(jì)調(diào)查所搜集到的各種數(shù)據(jù)進(jìn)行分類和匯總,又稱為匯總性整理。2.統(tǒng)計(jì)數(shù)據(jù)整理的內(nèi)容:(1)如何對(duì)所要研究的總體進(jìn)行統(tǒng)計(jì)分組;(2)確定描述總體數(shù)量特征的統(tǒng)計(jì)指標(biāo)體系。40二、統(tǒng)計(jì)分組基本理論

1.統(tǒng)計(jì)分組的概念根據(jù)統(tǒng)計(jì)研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)標(biāo)志(或幾個(gè)標(biāo)志)把被研究的總體劃分為若干個(gè)不同性質(zhì)的組,稱為統(tǒng)計(jì)分組。統(tǒng)計(jì)分組標(biāo)志:品質(zhì)標(biāo)志或數(shù)量標(biāo)志2.分組的性質(zhì)兼有分和合雙重含義,對(duì)于現(xiàn)象總體,是“分”,對(duì)于單位,是“合”。3.統(tǒng)計(jì)分組的種類(1)按分組標(biāo)志的多少,分為簡單分組和復(fù)合分組(2)按分組的標(biāo)志的性質(zhì)不同,分為品質(zhì)分組(或稱屬性分組)和數(shù)量分組(或稱變量分組)。41三、統(tǒng)計(jì)分組的原則和方法

1.統(tǒng)計(jì)分組的原則:窮盡原則:使總體中的每一個(gè)單位都應(yīng)有組可歸,或者說各分組的空間足以容納總體所有的單位。互斥原則:就是在特定的分組標(biāo)志下,總體中的任何一個(gè)單位的只能歸屬于某一組,而不能同時(shí)或可能歸屬于幾個(gè)組。2.統(tǒng)計(jì)分組的方法(1)品質(zhì)分組:按品質(zhì)標(biāo)志分組(2)數(shù)量分組:按數(shù)量標(biāo)志分組(A)單項(xiàng)式分組與組距式分組(B)間斷組距式分組和連續(xù)組距式分組“上限在不內(nèi)”原則:凡是總體某一個(gè)單位的變量值是相鄰兩組的界限值,這一個(gè)單位歸入作為下限值的那一組內(nèi)。(C)等距分組與異距分組423.組距式分組的相關(guān)概念(1)組距連續(xù)組距分組的組距=本組上限–本組下限間斷式組距且等距分組的條件下:組距=本組上限–前組上限或=本組下限–前組下限 或=本組上限–本組下限+1(2)組數(shù)(3)(4)開口組的組距與組中值43四、頻數(shù)分布1.頻數(shù)分布的基本理論(1)頻數(shù)分布的定義(2)分布數(shù)列的兩個(gè)要素總體按某標(biāo)志所分的組,若總體按數(shù)量標(biāo)志分組,分組標(biāo)志在各組有不同的數(shù)量表現(xiàn),形成標(biāo)志值數(shù)列,亦稱變量,一般用x表示;各組所出現(xiàn)的單位數(shù),即頻數(shù),亦稱次數(shù),用f表示。442.變量數(shù)列的編制方法3.相關(guān)的概念:(1)頻率

fi:第i組頻數(shù)(2)頻率的性質(zhì)(A);(B)。

(3)頻數(shù)密度與頻率密度:(A)頻數(shù)密度=頻數(shù)/組距 (2.9)(B)頻率密度=頻率/組距 (2.10)45五、累計(jì)頻數(shù)與累計(jì)頻率1.向上累計(jì)頻數(shù)(或頻率)分布2.向下累計(jì)頻數(shù)(或頻率)分布46

第三節(jié)

統(tǒng)計(jì)數(shù)據(jù)的顯示一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的定義和結(jié)構(gòu)(1)統(tǒng)計(jì)表的定義(2)統(tǒng)計(jì)表的結(jié)構(gòu)(A)從表式上看,表格包括總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題和指標(biāo)數(shù)值四個(gè)部分。(B)從內(nèi)容上看,統(tǒng)計(jì)表由主詞欄和賓詞欄兩個(gè)部分組成。472.統(tǒng)計(jì)表的分類

(1)按主詞的結(jié)構(gòu)分類,根據(jù)主詞是否分組和分組的程度,分為簡單表、分組表和復(fù)合表。(2)按賓詞設(shè)計(jì)分類,可分為賓詞簡單排列、分組平行排列和分組層疊排列等三種。

3.統(tǒng)計(jì)表的設(shè)計(jì)

(1)開口式(2)標(biāo)題(3)合計(jì)攔(4)數(shù)據(jù)(5)計(jì)量單位(6)注釋或資料來源。48

二、統(tǒng)計(jì)圖

1.直方圖2.折線圖3.曲線圖4.累計(jì)曲線圖洛倫茨曲線圖基尼系數(shù),用以衡量收入分配的平等與否。

49三、頻(次)數(shù)分布圖的類型1.鐘型分布

鐘型分布示意圖

50(Ⅰ)(Ⅱ)(Ⅲ)2.U型分布圖2-7U型分布示意圖51

102030405060708050403020100死亡率(‰)年齡3.J型分布J型分布示意圖

52正J型圖反J型圖管理統(tǒng)計(jì)學(xué)第三章第三章數(shù)據(jù)分布特征的描述第一節(jié)統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定第二節(jié)統(tǒng)計(jì)變量離散程度的測(cè)定第三節(jié)變量分布的偏度與峰度3-54第一節(jié)統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定一、測(cè)定集中趨勢(shì)的指標(biāo)及其作用二、數(shù)值平均數(shù)三、眾數(shù)與中位數(shù)3-55一、測(cè)定集中趨勢(shì)的指標(biāo)及其作用集中趨勢(shì)(Centraltendency)較大和較小的觀測(cè)值出現(xiàn)的頻率比較低,大多數(shù)觀測(cè)值密集分布在中心附近,使得全部數(shù)據(jù)呈現(xiàn)出向中心聚集或靠攏的態(tài)勢(shì)。3-56測(cè)度集中趨勢(shì)的指標(biāo)有兩大類:數(shù)值平均數(shù)——是根據(jù)全部數(shù)據(jù)計(jì)算得到的代表值,主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)及幾何平均數(shù);位置代表值——根據(jù)數(shù)據(jù)所處位置直接觀察、或根據(jù)與特定位置有關(guān)的部分?jǐn)?shù)據(jù)來確定的代表值,主要有眾數(shù)和中位數(shù)。測(cè)定集中趨勢(shì)指標(biāo)的作用1.反映變量分布的集中趨勢(shì)和一般水平。如用平均工資了解職工工資分布的中心,反映職工工資的一般水平。2.可用來比較同一現(xiàn)象在不同空間或不同階段的發(fā)展水平。不受總體規(guī)模大小的影響,在一定程度上使偶然因素的影響相互抵消。3.可用來分析現(xiàn)象之間的依存關(guān)系。如研究勞動(dòng)者的文化程度與收入的關(guān)系4.平均指標(biāo)也是統(tǒng)計(jì)推斷中的一個(gè)重要統(tǒng)計(jì)量,是進(jìn)行統(tǒng)計(jì)推斷的基礎(chǔ)。

3-57二、數(shù)值平均數(shù)(一)算術(shù)平均數(shù)(均值)一組數(shù)據(jù)的總和除以這組數(shù)據(jù)的項(xiàng)數(shù)所得的結(jié)果;最常用的數(shù)值平均數(shù)。

1.簡單算術(shù)平均數(shù)把每項(xiàng)數(shù)據(jù)直接加總后除以它們的項(xiàng)數(shù)。通常用于對(duì)未分組的數(shù)據(jù)計(jì)算算術(shù)平均數(shù)。計(jì)算公式:3-58例3-1分組數(shù)據(jù)不能簡單平均!因?yàn)楦鹘M變量值的次數(shù)不等!3-59分組表3-2年齡人數(shù)(人)xf2242510305501合計(jì)20表3-1男性女性2222222225252525252525252525303030305030解:采用簡單算術(shù)平均法計(jì)算,即全體隊(duì)員的平均年齡為(單位:周歲):若采用簡單平均:2.加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)的計(jì)算公式:3-60正確的計(jì)算是:加權(quán)—為了體現(xiàn)各變量值輕重不同的影響作用,對(duì)各個(gè)變量值賦予不盡相同的權(quán)數(shù)(fi

).權(quán)數(shù)(fi

,也稱權(quán)重)權(quán)數(shù)——指在計(jì)算總體平均數(shù)或綜合水平的過程中對(duì)各個(gè)數(shù)據(jù)起著權(quán)衡輕重作用的變量。可以是絕對(duì)數(shù)形式,也可以是比重形式(如頻率)來表示。事實(shí)上比重權(quán)數(shù)更能夠直接表明權(quán)數(shù)的權(quán)衡輕重作用的實(shí)質(zhì)。當(dāng)權(quán)數(shù)完全相等(f1=f2=…=fn)時(shí),加權(quán)算術(shù)平均數(shù)就成了簡單算術(shù)平均數(shù)。3-613.由組距數(shù)列計(jì)算算術(shù)平均數(shù)

要點(diǎn):各組變量值用組中值來代表。假定條件是各組內(nèi)數(shù)據(jù)呈均勻分布或?qū)ΨQ分布。計(jì)算結(jié)果是近似值.3-62表3-3節(jié)能燈泡的使用壽命的分組數(shù)據(jù)

使用壽命(小時(shí))

組中值(x)數(shù)量(f)Xf

頻率(f/Σf)(Xf/Σf)1000以下900218000.020181000-12001100888000.080881200-1400130016208000.1602081400-1600150035525000.3505251600-1800170023391000.2303911800-2000190012228000.1202282000以上2100484000.04084合計(jì)——1001542001.0001542解:平均使用壽命為:4.對(duì)相對(duì)數(shù)求算術(shù)平均數(shù)由于各個(gè)相對(duì)數(shù)的對(duì)比基礎(chǔ)不同,采用簡單算術(shù)平均通常不合理,需要加權(quán)。3-63表3-4企業(yè)流通費(fèi)用率(%)商品銷售額(萬元)流通費(fèi)用(萬元)甲161600256乙104750475丙124000480合計(jì)11.70048103501211權(quán)數(shù)的選擇必須符合該相對(duì)數(shù)本身的計(jì)算公式。權(quán)數(shù)通常為該相對(duì)數(shù)的分母指標(biāo)。5.算術(shù)平均數(shù)的主要數(shù)學(xué)性質(zhì)(1)算術(shù)平均數(shù)與變量值個(gè)數(shù)的乘積等于各個(gè)變量值的總和。3-64(2)各變量值與算術(shù)平均數(shù)的離差之總和等于零。(3)各變量值與算術(shù)平均數(shù)的離差平方之總和為最小。(二)調(diào)和平均數(shù)(Harmonicmean)調(diào)和平均數(shù)也稱為倒數(shù)平均數(shù)。各變量值的倒數(shù)(1/xi)的算術(shù)平均數(shù)的倒數(shù).其計(jì)算公式為:3-65(續(xù))社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中所應(yīng)用的調(diào)和平均數(shù)通常是加權(quán)算術(shù)平均數(shù)的變形,已知各組變量值xi和(xifi)而缺乏fi時(shí),加權(quán)算術(shù)平均數(shù)通常可變形為調(diào)和平均數(shù)形式來計(jì)算。【例3-4】解:3-66(三)幾何平均數(shù)(Geometricmean)幾何平均數(shù)—n個(gè)變量值連乘積的n次方根。簡單幾何平均數(shù)3-67加權(quán)幾何平均數(shù)適用于各個(gè)變量值之間存在連乘積關(guān)系的場(chǎng)合。主要用于計(jì)算現(xiàn)象的平均發(fā)展速度,也適用于對(duì)某些具有環(huán)比性質(zhì)的比率求平均.

【例3-5】某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。本月該企業(yè)各加工工序的合格率分別為88%、85%、90%、92%、96%,試求這五道工序的平均合格率。解:本例中各工序的合格率具有環(huán)比的性質(zhì),企業(yè)產(chǎn)品的總合格率等于各工序合格率之連乘積。所以,所求的平均合格率應(yīng)為:3-68三、眾數(shù)與中位數(shù)(一)眾數(shù)(Mode)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多、頻率最高的變量值,常用M0表示。如表3-2中年齡的眾數(shù)值MO=25。眾數(shù)代表的是最常見、最普遍的狀況,是對(duì)現(xiàn)象集中趨勢(shì)的度量。可用來測(cè)度定性變量的集中趨勢(shì);銷售量最大的產(chǎn)品顏色是“白色”,則有M0=“白色”可以度量定量變量的集中趨勢(shì)。從分布曲線的角度看,眾數(shù)就是變量分布曲線的最高峰所對(duì)應(yīng)的變量值。3-69xMOf(x)組距數(shù)列中眾數(shù)的確定先找到眾數(shù)組。在等距數(shù)列中,眾數(shù)組就是次數(shù)最多的組;在異距數(shù)列中,眾數(shù)組應(yīng)是頻數(shù)密度最大的組。根據(jù)眾數(shù)組與其相鄰兩組的次數(shù)差來推算。其近似公式為:3-70下限公式:上限公式:Mo(二)中位數(shù)(Median)中位數(shù)是將數(shù)據(jù)由小到大排列后位置居中的數(shù)值。3-71由未分組數(shù)據(jù)計(jì)算中位數(shù)若數(shù)據(jù)項(xiàng)數(shù)是奇數(shù),則正好位于中間的數(shù)值就是中位數(shù);如5人收入為:1200,1450,1500,1600,2000元,則收入的中位數(shù)Me=1500。若數(shù)據(jù)項(xiàng)數(shù)是偶數(shù),則取居中兩個(gè)數(shù)值的平均數(shù)為中位數(shù).如6人收入為:1200,1450,1500,1600,1800,2000元,則收入的中位數(shù)Me=1550。xMef(x)50%50%由組距數(shù)據(jù)計(jì)算中位數(shù)先確定中位數(shù)組,即中間位置(用Σf/2來計(jì)算)所在的組。假定中位數(shù)組內(nèi)次數(shù)均勻分布(次數(shù)與變量值的區(qū)間大小成比例),近似推算中位數(shù)的值。計(jì)算公式為:3-72下限公式:上限公式:四分位數(shù)、十分位數(shù)和百分位數(shù)四分位數(shù)是將數(shù)據(jù)由小到大排序后,位于全部數(shù)據(jù)1/4位置上的數(shù)值。十分位數(shù)是將數(shù)據(jù)由小到大排序后,位于全部數(shù)據(jù)1/10位置上的數(shù)值。百分位數(shù)是將數(shù)據(jù)由小到大排序后,位于全部數(shù)據(jù)1/100位置上的數(shù)值。中位數(shù)也就是第二個(gè)四分位數(shù)、第五個(gè)十分位數(shù)、第五十個(gè)百分位數(shù)。分位數(shù)與其它指標(biāo)結(jié)合,可以更詳細(xì)地反映數(shù)據(jù)的分布特征。3-73箱線圖(boxplot)箱線圖由一組數(shù)據(jù)的最小值(xmin)、第一四分位數(shù)(Q1)、中位數(shù)(Me)、第三四分位數(shù)(Q3)、最大值(xmax)等五個(gè)數(shù)值來繪成。利用箱線圖可以觀察數(shù)據(jù)分布的范圍、中心位置和對(duì)稱性等特征,還可以進(jìn)行多組數(shù)據(jù)分布的比較。3-74xminQ1MeQ3

xmax(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的比較1.算術(shù)平均數(shù)綜合反映了全部數(shù)據(jù)的信息,眾數(shù)和中位數(shù)由數(shù)據(jù)分布的特定位置所確定。2.算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在而且具有惟一性,但計(jì)算和應(yīng)用眾數(shù)有兩個(gè)前提條件:(1)數(shù)據(jù)項(xiàng)數(shù)眾多;(2)數(shù)據(jù)具有明顯的集中趨勢(shì)。3.算術(shù)平均數(shù)只能用于定量(數(shù)值型)數(shù)據(jù),中位數(shù)適用于定序數(shù)據(jù)和定量數(shù)據(jù),眾數(shù)適用于所有形式(類型、計(jì)量層次)的數(shù)據(jù)3-75(續(xù))4.算術(shù)平均數(shù)要受數(shù)據(jù)中極端值的影響。而眾數(shù)和中位數(shù)都不受極端值的影響。為了排除極端值的干擾,可計(jì)算切尾均值,即去掉數(shù)據(jù)中最大和最小的若干項(xiàng)數(shù)值后計(jì)算的均值.切尾均值是將均值與中位數(shù)取長補(bǔ)短的結(jié)果。5.算術(shù)平均數(shù)可以推算總體的有關(guān)總量指標(biāo),而中位數(shù)和眾數(shù)則不宜用作此類推算。3-76算術(shù)平均數(shù)和眾數(shù)、中位數(shù)的數(shù)量關(guān)系在對(duì)稱分布中,三者相等.即:均值=Me=Mo;3-77x<Me<Mox=Me=MoMo

>Me>x在左偏分布中,一般有:均值<Me<Mo在右偏分布中,一般有:Mo<Me<均值。皮爾生經(jīng)驗(yàn)公式:在輕微偏態(tài)時(shí),三者的近似關(guān)系:第二節(jié)統(tǒng)計(jì)變量離散程度的測(cè)定一、測(cè)定離散程度的指標(biāo)及其作用二、極差、四分位差和平均差三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)五、異眾比率3-78一則笑話如果你一只腳放在攝氏1度的水里,另一只腳放在攝氏79度的水里,平均水溫40度,你一定感覺很舒服?顯然,只了解變量的集中趨勢(shì)是不夠的!3-79一、測(cè)定離散程度的指標(biāo)及其作用1.說明數(shù)據(jù)的分散程度,反映變量的穩(wěn)定性、均衡性。數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。2.衡量平均數(shù)的代表性。離散程度越大,平均數(shù)的代表性就越小。3.統(tǒng)計(jì)推斷的重要依據(jù)判別統(tǒng)計(jì)推斷前提條件是否成立,衡量推斷效果好壞的重要尺度。3-80二、極差、四分位差和平均差(一)極差(Range)極差是一組數(shù)據(jù)的最大值(xmax)與最小值(xmin)之差,通常用R表示。對(duì)于總體數(shù)據(jù)而言,極差也就是變量變化的范圍或幅度大小,故也稱為全距。組距數(shù)列中,極差≈最高組的上限-最低組的下限。優(yōu)缺點(diǎn):計(jì)算簡便、含義直觀、容易理解。它未考慮數(shù)據(jù)的中間分布情況,不能充分說明全部數(shù)據(jù)的差異程度。3-81(二)四分位差第3四分位數(shù)(Q3)與第1四分位數(shù)(Q1)之差,常用Qd表示。計(jì)算公式為:實(shí)質(zhì)上是兩端各去掉四分之一的數(shù)據(jù)以后的極差,表示占全部數(shù)據(jù)一半的中間數(shù)據(jù)的離散程度。四分位差越大,表示數(shù)據(jù)離散程度越大。是在一定程度上對(duì)極差的一種改進(jìn),避免了極端值的干擾。但它對(duì)數(shù)據(jù)差異的反映仍然是不充分的。四分位差是一種順序統(tǒng)計(jì)量,適用于定序數(shù)據(jù)和定量數(shù)據(jù)。尤其是當(dāng)用中位數(shù)來測(cè)度數(shù)據(jù)集中趨勢(shì)時(shí).3-82(三)平均差(AverageDeviation)平均差——各個(gè)數(shù)據(jù)與其均值的離差絕對(duì)值的算術(shù)平均數(shù),反映各個(gè)數(shù)據(jù)與其均值的平均差距,通常以A.D表示。計(jì)算公式為:未分組數(shù)據(jù):3-83平均差含義清晰,能全面地反映數(shù)據(jù)的離散程度。但取離差絕對(duì)值進(jìn)行平均,數(shù)學(xué)處理上不夠方便,在數(shù)學(xué)性質(zhì)上也不是最優(yōu)的。已分組數(shù)據(jù):三、方差和標(biāo)準(zhǔn)差1.方差(Variance)的概念和計(jì)算方差是各個(gè)數(shù)據(jù)與其均值的離差平方的算術(shù)平均數(shù).總體方差(σ2)的計(jì)算公式為:未分組數(shù)據(jù):3-84分組數(shù)據(jù):樣本方差(通常用S2表示)分母應(yīng)為(n-1)。標(biāo)準(zhǔn)差(standardDeviation)標(biāo)準(zhǔn)差——方差的算術(shù)平方根。總體標(biāo)準(zhǔn)差一般用σ表示。其計(jì)算公式為:未分組數(shù)據(jù):3-85分組數(shù)據(jù):標(biāo)準(zhǔn)差比方差更容易理解。在社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)分析中,標(biāo)準(zhǔn)差比方差的應(yīng)用更為普遍,經(jīng)常被用作測(cè)度數(shù)據(jù)與均值差距的標(biāo)準(zhǔn)尺度。樣本標(biāo)準(zhǔn)差(S)分母應(yīng)為(n-1)。【例3-9】計(jì)算平均差和方差、標(biāo)準(zhǔn)差3-86使用壽命(小時(shí))

組中值(x)試驗(yàn)數(shù)量(只)f

頻率(f/Σf)(x-1542)|x-1542|f(X-1542)2*f1000以下90020.020-64212848243281000-1200110080.080-442353615629121200160-24238729370241400-16001500350.350-42147061740160023015836345741721800-20001900120.120358429615379682000以上210040.04055822321245456合計(jì)——1001.000——

2032467436002.方差的主要數(shù)學(xué)性質(zhì)(3)分組條件下,總體的方差等于組間方差與各組方差平均數(shù)之和。3-87(1)常數(shù)的方差等于零。a為常數(shù),則(2)變量的線性函數(shù)的方差等于變量系數(shù)的平方乘以變量的方差。設(shè)a,b為常數(shù),y=a+bx,則有:組間方差各組方差平均數(shù)3.標(biāo)準(zhǔn)化值(Z-score)標(biāo)準(zhǔn)化值或標(biāo)準(zhǔn)得分也稱為Z值。對(duì)于來自不同均值和標(biāo)準(zhǔn)差的個(gè)體的數(shù)據(jù),往往不能直接對(duì)比。這就需要將它們轉(zhuǎn)化為同一規(guī)格、尺度的數(shù)據(jù)后再比較。標(biāo)準(zhǔn)化值實(shí)際上是將不同均值和標(biāo)準(zhǔn)差的總體都轉(zhuǎn)換為均值為0、標(biāo)準(zhǔn)差為1的總體,將各個(gè)體的數(shù)據(jù)轉(zhuǎn)換為它在其總體中的相對(duì)位置。3-88【例3-10】解:由于兩次考試成績的均值和標(biāo)準(zhǔn)差不同,每個(gè)學(xué)生兩次考試的成績不宜直接比較。利用標(biāo)準(zhǔn)化值進(jìn)行對(duì)比,表明第二次考試的成績更好一些。3-89假定某班學(xué)生先后兩個(gè)兩次進(jìn)行了難度不同的綜合考試,第一次考試成績的均值和標(biāo)準(zhǔn)差分別為80分和10分,而第二次考試成績的均值和標(biāo)準(zhǔn)差分別為70分和7分。張三第一、二次考試的成績分別為92分和80分,那么全班相比較而言,他哪一次考試的成績更好呢?4.對(duì)稱鐘形分布中的3σ法則3σ

法則——關(guān)于鐘形分布的一個(gè)近似的或經(jīng)驗(yàn)的法則:變量值落在[-3σ,+3σ]范圍以外的情況極為少見。因此通常將落在區(qū)間[-3σ,+3σ]之外的數(shù)據(jù)稱為異常數(shù)據(jù)或稱為離群點(diǎn)。3-90x99.73%68.27%95.45%四、離散系數(shù)前面的各變異指標(biāo)都是有計(jì)量單位的,它們的數(shù)值大小不僅取決于數(shù)據(jù)的離散程度,還要受數(shù)據(jù)本身水平高低和計(jì)量單位的影響。對(duì)不同變量(或不同數(shù)據(jù)組)的離散程度進(jìn)行比較時(shí),只有當(dāng)它們的平均水平和計(jì)量單位都相同時(shí),才能利用上述變異指標(biāo)來分析;否則,須利用離散系數(shù)來比較它們的離散程度。例如,哪個(gè)變量的差異較大:體重,還是身高?例如,體重的差異哪個(gè)較大:父親,還是嬰兒?父親:平均體重=70kg,標(biāo)準(zhǔn)差=5kg

嬰兒:5kg,1kg3-91四、離散系數(shù)離散系數(shù)是極差、四分位差、平均差或標(biāo)準(zhǔn)差等變異指標(biāo)與算術(shù)平均數(shù)的比率,以相對(duì)數(shù)的形式表示變異程度。將極差與算術(shù)平均數(shù)對(duì)比得到極差系數(shù),將平均差與算術(shù)平均數(shù)對(duì)比得到平均差系數(shù)。最常用的離散系數(shù)是就標(biāo)準(zhǔn)差來計(jì)算的,稱之為標(biāo)準(zhǔn)差系數(shù):離散系數(shù)大,說明數(shù)據(jù)的離散程度大,其平均數(shù)的代表性就差;反之亦然.3-92五、異眾比率異眾比率是指非眾數(shù)值的次數(shù)之和在總次數(shù)中所占比重,其公式為:3-93主要用于衡量一組數(shù)據(jù)以眾數(shù)為分布中心的集中程度,即衡量眾數(shù)代表一組數(shù)據(jù)一般水平的代表性。其值越小,數(shù)據(jù)集中程度越高,眾數(shù)代表性越大.【例3-12】規(guī)格的異眾比率顏色的異眾比率:第三節(jié)變量分布的偏度與峰度一、矩(動(dòng)差)二、偏度(Skewness)三、峰度(Kurtosis)3-94一、矩(動(dòng)差)矩(動(dòng)差)——一系列刻畫數(shù)據(jù)分布特征的指標(biāo)的統(tǒng)稱。變量值與數(shù)值a之離差的K次方的平均數(shù)稱為變量x關(guān)于a的K階矩,即:3-95K階原點(diǎn)矩(當(dāng)a=0時(shí))是數(shù)據(jù)的K次方的平均數(shù).一階原點(diǎn)矩即算術(shù)平均數(shù);二階原點(diǎn)矩即平方平均數(shù)。

K階中心矩矩(當(dāng)a=均值時(shí))是以均值為中心計(jì)算的離差K次方的平均數(shù)k=1時(shí),稱為一階中心矩,它恒等于0,即m1=0;k=2時(shí),稱為二階中心矩,也就是方差,即m2=σ2。

二、偏度(Skewness)偏度——指數(shù)據(jù)分布的不對(duì)稱程度或偏斜程度。以對(duì)稱分布為標(biāo)準(zhǔn)來區(qū)分偏態(tài)分布又分左偏(負(fù)偏)和右偏(正偏).3-96左偏分布(負(fù)偏)右偏分布(正偏)偏態(tài)的測(cè)度方法3-97-30+3

極左偏態(tài)對(duì)稱分布極右偏態(tài)一般有:(一)由均值與眾數(shù)(中位數(shù))之間的關(guān)系求偏態(tài)系數(shù):(二)由三個(gè)四分位數(shù)之間的關(guān)系求偏態(tài)系數(shù)3-98值域:-1Sk1

極左偏態(tài)對(duì)稱分布極右偏態(tài)-10+1

偏度系數(shù)(三)利用3階中心矩來計(jì)算偏度系數(shù)。測(cè)定偏度最常用的方法原理:若分布不對(duì)稱,則3階中心矩不為0。不對(duì)此程度愈嚴(yán)重,3階中心矩的絕對(duì)值愈大。為消除量綱的影響,可除以σ3。3-990

對(duì)稱分布左偏分布

右偏分布三、峰度(Kurtosis)峰度——是指變量的集中程度和分布曲線的陡峭(或平坦)的程度。對(duì)峰度的度量通常以正態(tài)分布曲線為比較標(biāo)準(zhǔn),分為正態(tài)峰度、尖頂峰度和平頂峰度.3-100平頂分布尖峰分布尖頂峰度的分布曲線比正態(tài)分布曲線更加尖峭、更高更窄;平頂峰度的分布曲線比正態(tài)分配曲線更為平緩、更低更扁平。峰度系數(shù)原理:分布曲線的尖峭程度與偶數(shù)階中心矩的數(shù)值大小有直接關(guān)系。以四階中心矩m4為基礎(chǔ),為了消除量綱的影響,再除以標(biāo)準(zhǔn)差的四次方σ4所得到的相對(duì)數(shù)即可衡量峰度。3-101當(dāng)K=0時(shí),分布曲線為正態(tài)曲線;當(dāng)K>0時(shí),為尖頂曲線,表示數(shù)據(jù)比正態(tài)分布更集中在均值附近;K的數(shù)值越大,則變量分布曲線之頂端越尖峭;當(dāng)K<0時(shí),為平頂曲線,表示數(shù)據(jù)比正態(tài)分布更分散;K的數(shù)值越小,則變量分布曲線之頂端越平坦。對(duì)于正態(tài)分布曲線有:m4/σ4=3,故峰度系數(shù)為:【例3-13】根據(jù)表3-3的數(shù)據(jù),計(jì)算使用壽命分布的偏度系數(shù)和峰度系數(shù)。解:3-102計(jì)算結(jié)果表明,偏度系數(shù)幾乎為0,峰度系數(shù)略小于0,說明該產(chǎn)品使用壽命的分布十分接近對(duì)稱分布,分布曲線頂峰略比正態(tài)分布平坦一些。總的說來,該產(chǎn)品的使用壽命的分布非常接近正態(tài)分布。本章小結(jié)測(cè)度集中趨勢(shì)的各指標(biāo)的含義、計(jì)算方法、特點(diǎn)和應(yīng)用場(chǎng)合測(cè)度離散程度的各指標(biāo)的含義、計(jì)算方法、特點(diǎn)和應(yīng)用場(chǎng)合偏度與峰度的含義和測(cè)度方法利用Excel計(jì)算描述統(tǒng)計(jì)量3-103第五章抽樣分布與參數(shù)估計(jì)第一節(jié)抽樣的基本概念與數(shù)學(xué)原理第二節(jié)抽樣分布第三節(jié)參數(shù)估計(jì)第四節(jié)樣本容量的確定第五節(jié)EXCEL在參數(shù)估計(jì)中的應(yīng)用

5-104第一節(jié)抽樣的基本概念與數(shù)學(xué)原理一、有關(guān)抽樣的基本概念二、大數(shù)定理與中心極限定理5-105一、有關(guān)抽樣的基本概念(一)樣本容量與樣本個(gè)數(shù)

1.樣本容量。樣本是從總體中抽出的部分單位的集合,這個(gè)集合的大小稱為樣本容量,一般用n表示,它表明一個(gè)樣本中所包含的單位數(shù)。一般地,樣本單位數(shù)大于30個(gè)的樣本稱為大樣本,不超過30個(gè)的樣本稱為小樣本。

2.樣本個(gè)數(shù)。樣本個(gè)數(shù)又稱樣本可能數(shù)目,它是指從一個(gè)總體中可能抽取多少個(gè)樣本。5-106(二)總體參數(shù)與樣本統(tǒng)計(jì)量

1.總體參數(shù)。總體分布的數(shù)量特征就是總體的參數(shù),也是抽樣統(tǒng)計(jì)推斷的對(duì)象。常見的總體參數(shù)有:總體的平均數(shù)指標(biāo),總體成數(shù)(比例)指標(biāo),總體分布的方差、標(biāo)準(zhǔn)差等等。它們都是反映總體分布特征的重要指標(biāo)。

5-1072.樣本統(tǒng)計(jì)量。樣本統(tǒng)計(jì)量是樣本的一個(gè)函數(shù)。它們是隨機(jī)變量。我們利用統(tǒng)計(jì)量來估計(jì)和推斷總體的有關(guān)參數(shù)。常見的樣本統(tǒng)計(jì)量有:樣本平均數(shù),樣本比例,樣本的方差、標(biāo)準(zhǔn)差。5-108(三)概率抽樣及其組織形式所謂概率抽樣,就是要求對(duì)總體的每一次觀察(每一次抽取)都是一次隨機(jī)試驗(yàn),并且有和總體相同的分布。按這樣的要求對(duì)總體觀測(cè)(抽取)n次,可得到容量為n的樣本。5-1095-1105-111(四)放回抽樣與不放回抽樣5-1125-113(五)抽樣分布從總體中可以隨機(jī)地抽取許多樣本,由每一個(gè)樣本都可以計(jì)算樣本統(tǒng)計(jì)量的觀測(cè)值,所有可能的樣本觀測(cè)值及其所對(duì)應(yīng)的概率便是所謂的抽樣分布。因此,抽樣分布也可以稱為樣本統(tǒng)計(jì)量的概率分布。抽樣分布可能是精確地服從某種已知分布(所謂已知分布,例如我們?cè)诘谒恼陆榻B過的各種常見分布),也可能是以某種已知分布為極限分布。在實(shí)際應(yīng)用中,后者更為多見。5-1145-1155-116第二次抽取可能被抽中的人員12345678910第一次抽取可能被抽中的人員11,1(1)1,2(1.5)1,3(2)1,4(2.5)1,5(3)1,6(3.5)1,7(4)1,8(4.5)1,9(5)1,10(5.5)22,1(1.5)2,2(2)2,3(2.5)2,4(3)2,5(3.5)2,6(4)2,7(4.5)2,8(5)2,9(5.5)2,10(6)33,1(2)3,2(2.5)3,3(3)3,4(3.5)3,5(4)3,6(4.5)3,7(5)3,8(5.5)3,9(6)3,10(6.5)44,1(2.5)4,2(3)4,3(3.5)4,4(4)4,5(4.5)4,6(5)4,7(5.5)4,8(6)4,9(6.5)4,10(7)55,1(3)5,2(3.5)5,3(4)5,4(4.5)5,5(5)5,6(5.5)5,7(6)5,8(6.5)5,9(7)5,10(7.5)66,1(3.5)6,2(4)6,3(4.5)6,4(5)6,5(5.5)6,6(6)6,7(6.5)6,8(7)6,9(7.5)6,10(8)77,1(4)7,2(4.5)7,3(5)7,4(5.5)7,5(6)7,6(6.5)7,7(7)7,8(7.5)7,9(8)7,10(8.5)88,1(4.5)8,2(5)8,3(5.5)8,4(6)8,5(6.5)8,6(7)8,7(7.5)8,8(8)8,9(8.5)8,10(9)99,1(5)9,2(5.5)9,3(6)9,4(6.5)9,5(7)9,6(7.5)9,7(8)9,8(8.5)9,9(9)9,10(9.5)1010,1(5.5)10,2(6)10,3(6.5)10,4(7)10,5(7.5)10,6(8)10,7(8.5)10,8(9)10,9(9.5)10,10(10)5-117表5-3 10人中有放回抽二人的全部可能樣本表5-4 任職年限樣本均值分布數(shù)列5-1185-119二、大數(shù)定理與中心極限定理5-120

大數(shù)定理表明:盡管個(gè)別現(xiàn)象受偶然因素影響,有各自不同的表現(xiàn)。但是,對(duì)總體的大量觀察后進(jìn)行平均,就能使偶然因素的影響相互抵消,消除由個(gè)別偶然因素引起的極端性影響,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律。5-1215-1225-123

從正態(tài)分布的再生定理可以看出,只要總體變量服從正態(tài)分布,則從中抽取的樣本,不管n是多少,樣本平均數(shù)都服從正態(tài)分布。但是在客觀實(shí)際中,總體并非都是正態(tài)分布。對(duì)于從非正態(tài)分布的總體中抽取的樣本平均數(shù)的分布問題,需要由中心極限定理來解決。5-1245-125第二節(jié)抽樣分布一、樣本平均數(shù)的抽樣分布二、樣本比例的抽樣分布5-126一、樣本平均數(shù)的抽樣分布(一)樣本平均數(shù)的期望值與方差5-1275-1285-1295-130(二)樣本平均數(shù)的分布規(guī)律5-1315-1325-133二、樣本比例的抽樣分布(一)樣本比例的期望值與方差5-1345-1355-1365-137(二)樣本比例的分布規(guī)律5-1385-139表5-5 用正態(tài)分布來近似時(shí)對(duì)樣本量的要求總體參數(shù)0.500.450.400.350.300.250.200.150.101-0.500.550.600.650.700.750.800.850.90樣本量至少為n3637384043485771100(三)樣本方差的抽樣分布5-1405-141第三節(jié)參數(shù)估計(jì)一、參數(shù)估計(jì)概述二、總體均值的估計(jì)三、總體比例的估計(jì)四、總體方差的估計(jì)5-142一、參數(shù)估計(jì)概述(一)參數(shù)估計(jì)的定義與種類所謂參數(shù)估計(jì),就是用樣本統(tǒng)計(jì)量去估計(jì)總體的未知參數(shù)(或參數(shù)的函數(shù))。例如,估計(jì)總體均值,估計(jì)總體比例和總體方差等等。參數(shù)估計(jì)有兩種基本形式:點(diǎn)估計(jì)和區(qū)間估計(jì)。前者是用一個(gè)數(shù)值作為未知參數(shù)θ的估計(jì)值,后者則是給出具體的上限和下限,把θ包括在這個(gè)區(qū)間內(nèi)。下面分別介紹點(diǎn)估計(jì)與區(qū)間估計(jì)的有關(guān)概念。5-143(二)點(diǎn)估計(jì)點(diǎn)估計(jì),主要有矩估計(jì)法和最大似然估計(jì)法。矩估計(jì)法是用樣本矩去估計(jì)總體矩(或是用樣本矩的函數(shù)去估計(jì)總體矩的相應(yīng)函數(shù))的一種估計(jì)方法,由此獲得的估計(jì)量稱作矩估計(jì)量;最大似然估計(jì)法是把待估計(jì)的總體參數(shù)看作一個(gè)可以取不同數(shù)值的變量,計(jì)算當(dāng)總體參數(shù)取上述不同數(shù)值的時(shí)候,發(fā)生我們當(dāng)前所得到的樣本觀測(cè)值的不同概率,總體參數(shù)取哪一個(gè)數(shù)值的時(shí)候這種概率最大,便把這個(gè)數(shù)值作為對(duì)總體參數(shù)的估計(jì)結(jié)果。5-144(三)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)5-1452.有效性。又稱最小方差性。5-1464.充分性。估計(jì)量包含了樣本中關(guān)于θ的全部信息。(四)區(qū)間估計(jì)與估計(jì)的精度和可靠性5-1475-1485-149二、總體均值的估計(jì)5-1505-1515-1525-1535-1545-1555-156(二)總體方差σ2未知的情形5-1575-1582.區(qū)間估計(jì)5-1595-160【例5-4】在例5-3中,若總體方差未知,但通過抽取的6個(gè)樣本測(cè)得的樣本方差為0.0025,試在0.95的置信度下,求該產(chǎn)品直徑的均值置信區(qū)間。5-161三、總體比例的估計(jì)5-1625-1635-164三、總體方差的估計(jì)5-1655-166(二)區(qū)間估計(jì)5-167第四節(jié)樣本容量的確定一、問題的提出二、估計(jì)總體均值時(shí)樣本容量的確定三、估計(jì)總體比例時(shí)樣本容量的確定四、使用上述公式應(yīng)注意的問題5-168

由前面的論述,我們已知參數(shù)估計(jì)中的精度要求與可靠性要求常常是一對(duì)矛盾,但是,通過增加樣本容量n有可能降低樣本平均數(shù)的標(biāo)準(zhǔn)差,從而實(shí)現(xiàn)既保證一定的估計(jì)精度,又具有較高的置信度的目的。這時(shí),需要考慮在給定的置信度與極限誤差的前提下,樣本容量n究竟取多大合適?這就是所謂樣本容量的確定問題。5-169一、問題的提出二、估計(jì)總體均值時(shí)樣本容量的確定5-1705-1715-172三、估計(jì)總體比例時(shí)樣本容量的確定5-173四、使用上述公式應(yīng)注意的問題1.計(jì)算樣本容量時(shí),總體的方差與成數(shù)常常是未知的,這時(shí)可用有關(guān)資料替代:一是用歷史資料已有的方差與成數(shù)代替;二是在進(jìn)行正式抽樣調(diào)查前進(jìn)行幾次試驗(yàn)性調(diào)查,用試驗(yàn)中方差的最大值代替總體方差;三是比例方差在完全缺乏資料的情況下,就用比例方差的最大可能值0.25代替。5-1742.如果進(jìn)行一次抽樣調(diào)查,需要同時(shí)估計(jì)總體均值與比例,可用上面的公式同時(shí)計(jì)算出兩個(gè)樣本容量,取其中較大的結(jié)果,同時(shí)滿足兩方面的需要。

5-1753.上面的公式計(jì)算結(jié)果如果帶小數(shù),這時(shí)樣本容量不按四舍五入法則取整數(shù),取比這個(gè)數(shù)大的最小整數(shù)代替。例如計(jì)算得到:n=56.03,那么,樣本容量取57,而不是56。5-1765-1775-1785-1795-180第五節(jié)Excel在參數(shù)估計(jì)中的應(yīng)用【例5-9】用Excel完成本章思考與練習(xí)計(jì)算題的第1題。解:操作步驟如下。

1.構(gòu)造工作表。如圖5-3所示,A、B列為原始輸入數(shù)據(jù),A2:A16存放的是關(guān)于最大飛行速度的數(shù)據(jù),圖中未完全顯示出來。C、D列為計(jì)算結(jié)果,分別在C2、D2單元格存放置信下限和上限。

5-1812.定義變量名。將A列命名為“x”,將B2單元格命名為“置信水平”。

3.計(jì)算置信上、下限。分別在C2、D2中輸入如下的公式:

=AVERAGE(x)-TINV(1-置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x))=AVERAGE(x)+TINV(1-置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x))5-1825-183本章小結(jié)5-1845.所謂估計(jì)就是構(gòu)造適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量,來充當(dāng)總體參數(shù)的估計(jì)量。好的統(tǒng)計(jì)量的理想性質(zhì)包括:無偏性、有效性、一致性和充分性。

6.估計(jì)包括點(diǎn)估計(jì)與區(qū)間估計(jì)。

7.在給定的置信度與極限誤差的前提下,樣本容量n可利用極限誤差、臨界值與抽樣標(biāo)準(zhǔn)差三者間的數(shù)量關(guān)系去計(jì)算。

8.在Excel中可使用各種函數(shù)按照有關(guān)公式實(shí)現(xiàn)區(qū)間估計(jì)的運(yùn)算。5-185第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原理第二節(jié)總體均值的假設(shè)檢驗(yàn)第三節(jié)總體比例的假設(shè)檢驗(yàn)第四節(jié)單因子方差分析第五節(jié)雙因子方差分析第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用6-186第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)二、原假設(shè)與備擇假設(shè)三、檢驗(yàn)統(tǒng)計(jì)量四、顯著性水平、P-值與臨界值五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-187一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N(μ,σ2)。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作。現(xiàn)從生產(chǎn)線抽取簡單隨機(jī)樣本n=100袋,測(cè)得其平均重量為=149.8克,樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線的裝袋凈重的期望值是否為150克(即問生產(chǎn)線是否處于控制狀態(tài))?6-188

所謂假設(shè)檢驗(yàn),就是事先對(duì)總體的參數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用抽取的樣本信息來判斷這個(gè)假設(shè)(原假設(shè))是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異,所以假設(shè)檢驗(yàn)又被稱為顯著性檢驗(yàn)。6-189

一個(gè)完整的假設(shè)檢驗(yàn)過程,包括以下幾個(gè)步驟:(1)提出假設(shè);(2)構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值;(3)規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則;(4)做出判斷。6-190二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示,通常是設(shè)定總體參數(shù)等于某值,或服從某個(gè)分布函數(shù)等;備擇假設(shè)是與原假設(shè)互相排斥的假設(shè),原假設(shè)與備擇假設(shè)不可能同時(shí)成立。所謂假設(shè)檢驗(yàn)問題實(shí)質(zhì)上就是要判斷H0是否正確,若拒絕原假設(shè)H0

,則意味著接受備擇假設(shè)H1

。如在例6-1中,我們可以提出兩個(gè)假設(shè):假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒有顯著差異,記為;假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異,記為。6-191三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量,就是根據(jù)所抽取的樣本計(jì)算的用于檢驗(yàn)原假設(shè)是否成立的隨機(jī)變量。檢驗(yàn)統(tǒng)計(jì)量中應(yīng)當(dāng)含有所要檢驗(yàn)的總體參數(shù),以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計(jì)量的觀測(cè)結(jié)果。檢驗(yàn)統(tǒng)計(jì)量還應(yīng)該在“H0成立”的前提下有已知的分布,從而便于計(jì)算出現(xiàn)某種特定的觀測(cè)結(jié)果的概率。6-1926-1936-194四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生,可以不予考慮。在假設(shè)檢驗(yàn)中,我們做出判斷時(shí)所依據(jù)的邏輯是:如果在原假設(shè)正確的前提下,檢驗(yàn)統(tǒng)計(jì)量的樣本觀測(cè)值的出現(xiàn)屬于小概率事件,那么可以認(rèn)為原假設(shè)不可信,從而否定它,轉(zhuǎn)而接受備擇假設(shè)。6-195至于小概率的標(biāo)準(zhǔn)是多大?這要根據(jù)實(shí)際問題而定。假設(shè)檢驗(yàn)中,稱這一標(biāo)準(zhǔn)為顯著性水平,用來表示α,在應(yīng)用中,通常取α=0.01,α=0.05。一般來說,犯第一類錯(cuò)誤可能造成的損失越大,α的取值應(yīng)當(dāng)越小。對(duì)假設(shè)檢驗(yàn)問題做出判斷可依據(jù)兩種規(guī)則:一是P-值規(guī)則;二是臨界值規(guī)則。6-196(一)P-值規(guī)則所謂P-值,實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(大于或小于)具體樣本觀測(cè)值的概率。如果P-值小于所給定的顯著性水平,則認(rèn)為原假設(shè)不太可能成立;如果P-值大于所給定的標(biāo)準(zhǔn),則認(rèn)為沒有充分的證據(jù)否定原假設(shè)。6-197【例6-3】假定,根據(jù)例6-2的結(jié)果,計(jì)算該問題的P-值,并做出判斷。解:查標(biāo)準(zhǔn)正態(tài)概率表,當(dāng)z=2.29時(shí),陰影面積為0.9890,尾部面積為1–0.9890=0.011,由對(duì)稱性可知,當(dāng)z=–2.29時(shí),左側(cè)面積為0.011。

0.011≤α/2=0.0250.011這個(gè)數(shù)字意味著,假若我們反復(fù)抽取n=100的樣本,在100個(gè)樣本中僅有可能出現(xiàn)一個(gè)使檢驗(yàn)統(tǒng)計(jì)量等于或小于–2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平,所以,可以判斷μ=150的假定是錯(cuò)誤的,也就是說,根據(jù)觀測(cè)的樣本,有理由表明總體的與150克的差異是顯著存在的。6-198(二)臨界值規(guī)則假設(shè)檢驗(yàn)中,還有另外一種做出結(jié)論的方法:根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)(它是概率密度曲線的尾部面積)查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,稱作臨界值,直接用檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值與臨界

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論