從樣本統(tǒng)計(jì)量估計(jì)整體參數(shù)_第1頁
從樣本統(tǒng)計(jì)量估計(jì)整體參數(shù)_第2頁
從樣本統(tǒng)計(jì)量估計(jì)整體參數(shù)_第3頁
從樣本統(tǒng)計(jì)量估計(jì)整體參數(shù)_第4頁
從樣本統(tǒng)計(jì)量估計(jì)整體參數(shù)_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章

從樣本統(tǒng)量估計(jì)整體數(shù)學(xué)習(xí)要點(diǎn)第一節(jié)第二節(jié)第三節(jié)

總體均數(shù)的估計(jì)第四節(jié)其總體參數(shù)的估計(jì)本章小結(jié)學(xué)習(xí)要點(diǎn)掌握推斷統(tǒng)計(jì)的內(nèi)容和前提條件理解統(tǒng)計(jì)估計(jì)的原理,掌握統(tǒng)計(jì)估計(jì)的方法能夠運(yùn)用總體均數(shù)估計(jì)的方法解決實(shí)際問題第一節(jié)

點(diǎn)估計(jì)當(dāng)總休平均數(shù)或比例未知時(shí)們可以直接把樣本平均數(shù)或比例用作它的估計(jì)值于樣本統(tǒng)計(jì)量為數(shù)軸上的一個(gè)點(diǎn),所以稱“估計(jì)”??茖W(xué)研究不僅需要對(duì)事物特征作出一般性的描述更根據(jù)樣本提供的信息去推測(cè)相應(yīng)總體的情況,統(tǒng)計(jì)內(nèi)容中的推斷統(tǒng)計(jì)則是專門研究如何用樣本去推斷總體的方法。一、

什么是推斷統(tǒng)計(jì)一般情況下本計(jì)量是不會(huì)相應(yīng)的總體參數(shù)完全相同的者少都會(huì)有一定的差距,但是如果用無限多個(gè)樣本的統(tǒng)計(jì)量來估計(jì)總體參數(shù),平均估計(jì)誤差將會(huì)等于0具有這一特征的統(tǒng)計(jì)量就無偏估計(jì)值。例如,用樣本平均數(shù)估計(jì)總體平均數(shù)時(shí),總會(huì)有些誤差,在有些樣本中,它可能會(huì)大于總體平均數(shù)在一些樣中它又可能會(huì)小于總體平均數(shù)且于不同的樣本估計(jì)誤差的大小也是不同的無限多個(gè)樣本平均數(shù)的平均估計(jì)誤差為句話說,樣本平均數(shù)的平均數(shù)將會(huì)等于總體平均數(shù)。推斷統(tǒng)計(jì)就是指由樣本資料去推測(cè)相應(yīng)總體情況的理論與方法。也就是由部分推全體,/

22N2r由已知推未知的過程。推斷統(tǒng)計(jì)根據(jù)推測(cè)的性質(zhì)不同而分為參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩方面數(shù)parameter)就是用樣本去估計(jì)相應(yīng)總體的狀況,其體方法有點(diǎn)估計(jì)和區(qū)間估計(jì)。假設(shè)檢(hypothesistest的要用途是對(duì)出現(xiàn)差異的兩個(gè)或多個(gè)現(xiàn)象或事物進(jìn)行真實(shí)性情況的檢驗(yàn)又統(tǒng)計(jì)檢(statistical驗(yàn)中又根據(jù)是否需要依賴于對(duì)總體分布態(tài)和總體參數(shù)檢驗(yàn)的假設(shè)而分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)檢驗(yàn)法在檢驗(yàn)時(shí)對(duì)總體分布和總體參數(shù)(,)所要求,而非參檢驗(yàn)法在檢驗(yàn)時(shí)則不依賴于總體的分布形態(tài)和總體參數(shù)的情況。參數(shù)檢驗(yàn)法主要有Z檢驗(yàn)、t檢、F檢和q檢等,非數(shù)檢驗(yàn)test主要有驗(yàn)、符檢驗(yàn)法、符號(hào)等級(jí)檢驗(yàn)法、秩和檢驗(yàn)、中位數(shù)檢驗(yàn)等。二、統(tǒng)計(jì)推斷的基本問題沒有系統(tǒng)學(xué)過統(tǒng)計(jì)學(xué)的人往往有一種誤解為只要搜集了數(shù)據(jù)資料可用統(tǒng)計(jì)方法來處理數(shù)據(jù)。殊不知統(tǒng)計(jì)學(xué)是建立在概率論基礎(chǔ)上的,而概率論是專門研究隨機(jī)事件的。因此在統(tǒng)計(jì)推斷之前必須考你所獲得的資料是否能夠用統(tǒng)計(jì)的方法來分析常行統(tǒng)計(jì)推斷時(shí)應(yīng)首先考慮以下三個(gè)方面的問題。一是關(guān)于統(tǒng)計(jì)推斷的基本前提計(jì)斷的前提是隨機(jī)抽樣此我們利用樣本統(tǒng)計(jì)量進(jìn)行總體推斷時(shí)首要了解樣的方式即解樣本是如何得來的,是隨機(jī)抽取的,還是人為抽取的隨抽樣的均等和獨(dú)立性免了入樣個(gè)體只來自總體的某一部分而也就避免了樣本的偏倚性??梢哉f,樣本的抽取直接關(guān)系著統(tǒng)計(jì)研究結(jié)果的科學(xué)性。二是樣本的規(guī)模與樣本的代表性樣究需要有一定的樣本規(guī)模樣要具有代表性也需要有一定的樣本規(guī)模來保證少抽樣誤差般來說其條件相同的情況下,樣本越小抽的誤差越大;樣越大樣誤差就越小當(dāng)樣本增至包括總體的全部個(gè)體(即),抽樣的誤差為0因此,只要條件允許,盡可能地采用大樣本,以增強(qiáng)樣本對(duì)總體的代表性和可靠性注意的樣本規(guī)模和樣本代表性是建立在隨機(jī)抽樣基礎(chǔ)之上的,否則即使樣本再大也是無意義的。三是統(tǒng)計(jì)推斷的錯(cuò)誤要有一定限度計(jì)推斷是在特定的時(shí)間間和條件下得出的結(jié)論加抽樣誤差的影響在用本推測(cè)總體時(shí)總會(huì)犯一定的錯(cuò)誤種誤在統(tǒng)計(jì)推斷中是不可避免的也允許的不這種錯(cuò)誤要有一定的限度過一定限度的錯(cuò)誤是不允許的。統(tǒng)計(jì)推斷中允許犯錯(cuò)誤的限度是用小概率事件來表示。第二節(jié)

區(qū)間估計(jì)一、參數(shù)估計(jì)的定義所謂參數(shù)估計(jì)就是根據(jù)樣本統(tǒng)計(jì)量去估計(jì)相應(yīng)總體的參數(shù)我們可以根據(jù)樣本均數(shù)(

X

)去估計(jì)總體的均數(shù)(據(jù)樣本方差()估計(jì)總體方差(

據(jù)樣本的相關(guān)系數(shù)()去估計(jì)總體相系數(shù)()等等。/

XX二、參數(shù)估計(jì)的方法參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種如學(xué)區(qū)期末時(shí)抽取所管轄的小學(xué)四年級(jí)的數(shù)學(xué)測(cè)驗(yàn)成績(jī)求得平均分分標(biāo)差10分于一個(gè)管理者認(rèn)為全區(qū)四年級(jí)的學(xué)平均分可能是70分另一個(gè)管理者則認(rèn)為全區(qū)四年數(shù)學(xué)平均分可能性在65~75之間因前者是用數(shù)軸上的一點(diǎn)做估計(jì)為估計(jì)者是用數(shù)軸上的一段距離做估計(jì)區(qū)間估計(jì)。(一)點(diǎn)估計(jì)點(diǎn)估計(jì)(pointestimation)是在參數(shù)估計(jì)中直接以樣本的統(tǒng)計(jì)量(數(shù)軸上的一個(gè)點(diǎn))作為總體參數(shù)的估計(jì)值。譬如用樣本統(tǒng)計(jì)量:X,、r等作為總體參數(shù)、、的估計(jì)值。但是作為良好點(diǎn)估計(jì)的統(tǒng)計(jì)量必須具備一定的前提條件。1.無偏性用統(tǒng)計(jì)量估計(jì)總體參數(shù)必然會(huì)存在一定的誤差,而恰好相等的情形是極少見的。當(dāng)然,無偏性并不是說沒有一點(diǎn)誤差,而是要求用各個(gè)樣本的統(tǒng)計(jì)量作為估計(jì)值時(shí),其偏差為0,即

這時(shí)的統(tǒng)計(jì)量被稱為無偏估計(jì)量(

estimator譬如,根據(jù)中心極限定二有

,即樣本均數(shù)的均數(shù)是總體均數(shù)的無偏估計(jì)量即我們可以用樣本均數(shù)的均數(shù)作為總體均數(shù)的點(diǎn)估計(jì)值設(shè)我們從某市四個(gè)區(qū)的六歲男童中隨機(jī)抽取四個(gè)樣本每樣本測(cè)量其身高的平均數(shù),再求得四個(gè)樣本均數(shù)的均數(shù)為公分,并此值作為該市所有X六歲男孩的平均身高就是一個(gè)點(diǎn)估計(jì)。如果,大于0或于0,那么這時(shí)的統(tǒng)計(jì)量就為有偏估計(jì)量。作為總體參數(shù)的良好估計(jì)值是應(yīng)當(dāng)具備無偏性的。當(dāng)樣本容量足夠大的時(shí)候本均數(shù)或樣本標(biāo)準(zhǔn)差作為總體相應(yīng)參數(shù)的估計(jì)量都可視S為無偏估計(jì)量。正因?yàn)槿绱?,在大樣本統(tǒng)計(jì)分析中,常用樣本標(biāo)準(zhǔn)差(

n

)去代替總體標(biāo)準(zhǔn)差(總分布呈正態(tài),中數(shù)也是總體均數(shù)的偏估計(jì)量。然而由于抽樣誤差的普遍存在們能期待一次樣就能對(duì)總體參數(shù)作出精確的估計(jì)之估計(jì)不能給出估計(jì)誤差及其可靠性有關(guān)信息,因此采用點(diǎn)估計(jì)時(shí)應(yīng)特別注意樣本統(tǒng)計(jì)量所具有的特性。2.一致性總體參數(shù)的估計(jì)量隨樣本容量的無限增大當(dāng)能越來越接近它所估計(jì)的總體參數(shù)如正態(tài)總體的總體均數(shù)為

準(zhǔn)為果X是從總體中隨機(jī)抽取樣本獲得的平均數(shù),其容量為當(dāng)N→時(shí),X→

樣本統(tǒng)計(jì)量的均數(shù)X就總體參數(shù)

的一個(gè)估計(jì)值,或者說與

是一致的。3.有效性當(dāng)總體參數(shù)的無偏估計(jì)量不止一個(gè)統(tǒng)計(jì)量,則分析無偏估計(jì)量的變異大小的情況。無偏估計(jì)量變異性小,有效性高;無偏估計(jì)量變異性大的,則有效性較低。例如作為總體均數(shù)

的估計(jì)值來說樣均數(shù)中數(shù)和數(shù)等是無偏估計(jì)量這時(shí)選誰/

XMoXMo作為估計(jì)值最恰當(dāng)則要看誰的變異性最小。在,和中有X的變異性最小,即的差最小。所以用統(tǒng)計(jì)—樣本均數(shù)作為總體參數(shù)同時(shí)說明為什么在統(tǒng)計(jì)推斷中不常使用中數(shù)和眾數(shù)。

的估計(jì)值是最佳選擇。這也4.充分性充分性是指一個(gè)容量為樣本統(tǒng)計(jì)量是否充分地反映了全部個(gè)所反映的總體信息。從,Mdn和的比中我們已知,只有在求均數(shù)時(shí)個(gè)據(jù)全部參與計(jì)算,它充分地反映所有數(shù)據(jù)所要反映的總體信息,而在計(jì)算和時(shí)有部分?jǐn)?shù)據(jù)參與計(jì)算,是用部分?jǐn)?shù)據(jù)反映的總體信息。因此平均數(shù)的充分性最高,中數(shù)和眾數(shù)的充分性較低。同理,在差異量數(shù)中方差S和準(zhǔn)差S要比平均差A(yù)D、分位差

更具有充分性。一個(gè)好的點(diǎn)估計(jì)應(yīng)當(dāng)具備以上四個(gè)條件是無論如何抽樣誤差總是存在加上點(diǎn)估計(jì)不能提供正確估計(jì)的概率所應(yīng)用時(shí)受到局限例如們只能大體上知道樣本容量比較大時(shí),多數(shù)的X靠

,但是樣本容量究竟大到什么程度多”、靠到什么程度,“多數(shù)到是多少等等都是很模糊的計(jì)的這些不足以及缺陷可以用區(qū)間估計(jì)的方法來彌補(bǔ)。第三節(jié)

總體均數(shù)的計(jì)一、均數(shù)估計(jì)的標(biāo)準(zhǔn)誤均數(shù)估計(jì)就是用樣本均數(shù)去估計(jì)總體均數(shù)。在用樣本均數(shù)()總體均數(shù)(進(jìn)行區(qū)間估計(jì)時(shí),樣本均數(shù)的標(biāo)準(zhǔn)誤(

SE

)是衡量抽樣誤差大小的重要指標(biāo),而樣本均數(shù)的抽樣分布則是進(jìn)行這種估計(jì)的理論依據(jù)。(一)標(biāo)準(zhǔn)誤的定義式——已知當(dāng)總體已時(shí),根據(jù)中心極限定理三有

SEX

X

n

因?yàn)闃?biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差成正比樣本容量的平方根成反比所以總體標(biāo)準(zhǔn)差越小標(biāo)準(zhǔn)誤越??;樣本容量越大,標(biāo)準(zhǔn)誤也越小。對(duì)于一個(gè)指定的總體來說,其總體標(biāo)準(zhǔn)差是個(gè)確定的數(shù)。因此,在實(shí)際工作中,增大樣本容量可以減小均數(shù)的標(biāo)準(zhǔn)誤,這是提高估計(jì)精度的重要手段。對(duì)于總體均數(shù)進(jìn)行估計(jì)時(shí)果已么需從總體中抽取一個(gè)容量為的隨機(jī)樣本可求出而對(duì)其區(qū)間作出估計(jì),其區(qū)間估計(jì)公式為XX

SE

(二)標(biāo)準(zhǔn)誤的近似式——未知在實(shí)際工作中體方差及總體標(biāo)準(zhǔn)差往往是未知的時(shí)們只能根據(jù)樣本的標(biāo)準(zhǔn)差/

XXXXXXX去估計(jì)總體的標(biāo)準(zhǔn)差。用樣本標(biāo)準(zhǔn)差去估計(jì)總體標(biāo)準(zhǔn)差時(shí)必須考慮其無偏估計(jì)量的問題。數(shù)理統(tǒng)計(jì)學(xué)已證明樣本標(biāo)準(zhǔn)差

n

不是總體標(biāo)準(zhǔn)差無偏估計(jì)量因此,以n作為的點(diǎn)估計(jì)是不恰當(dāng)?shù)摹5菢颖镜臒o偏標(biāo)準(zhǔn)差

S

n

卻是總體標(biāo)準(zhǔn)差

的無偏估計(jì)量,即統(tǒng)計(jì)量

S

n

抽樣分布的平均數(shù)恰好等于

。因此,這里的樣本無偏標(biāo)準(zhǔn)差定義為S

n

2

由于

S

n

的無偏估計(jì)量,且當(dāng)n一時(shí),

S

n

抽樣分布的標(biāo)準(zhǔn)誤小于

SE

,所以當(dāng)n足夠大且一定時(shí),

n

的近似程度高于。是有了樣本平均數(shù)標(biāo)準(zhǔn)誤的近似公式SE

Snn

nnSEX

nn當(dāng)總體未知時(shí),即可采用這一公式計(jì)算均數(shù)的標(biāo)準(zhǔn)誤。二、總體均數(shù)的估計(jì)方法總體均數(shù)的估計(jì)方法大致有三種以態(tài)分布理論為依據(jù)的估計(jì)法態(tài)估計(jì)法。一種是以t分理論為依據(jù)的估計(jì)方法,稱t分估計(jì)法。三是以漸近正態(tài)分布為依據(jù)的估計(jì)方法,稱近似正態(tài)估計(jì)法。三種方法適用于不同的資料形式。(一)正態(tài)估計(jì)法正態(tài)估計(jì)法適用于總體方2已的數(shù)據(jù)資料。其具體應(yīng)用情形有二,一是總體呈正態(tài)時(shí),不論樣本容量的大小,樣本均數(shù)的分布都呈正態(tài)分布。因?yàn)?,中心極限定理一指出,總體正態(tài)時(shí)體取的容量為一可能樣本的均數(shù)呈正態(tài)分布總體呈非正態(tài)時(shí),只要樣本容量大于樣均數(shù)的分布呈近似正態(tài)分布為中心極限定理一指出足夠大時(shí),無論總體分布形態(tài)如何,樣本均數(shù)的分布服從或接近正態(tài)分布。

第四節(jié)

其他總體參的估計(jì)參數(shù)估計(jì)除總體均數(shù)的估計(jì)外有體方差和標(biāo)準(zhǔn)差的估計(jì)體關(guān)系數(shù)的估計(jì)和總體比例的估計(jì)等等。這種參數(shù)估計(jì)過程大致相同,主要區(qū)別在于標(biāo)準(zhǔn)誤的計(jì)算不同。/

≤≤ZZrrr≤≤ZZrrrrr一、總體方差和總體標(biāo)準(zhǔn)差的估計(jì)(一)總體方差的估計(jì)由于樣本方差與總體方差比值的分布呈分布,所以有n2n2

≤≤

n2

2n

,或

n2

≤≤

2

2n例8-5校三學(xué)生中隨機(jī)抽10份理成績(jī)得平均分為71.2,標(biāo)

n

)為14.46。估計(jì)物理成績(jī)的方差在什么范圍之內(nèi)。1)選擇顯著性水平。設(shè)本例選

0.052)計(jì)算自由度。本例,

n3)查

2

顯著性臨界值表,確定

2

2

2

2

,本例有

2.7

19.04)代入公式,作出估計(jì)14.46

2

14.46

2

19.02.72≤≤,≤≤

9.95)結(jié)果解釋該校初三學(xué)生物理成績(jī)的方差有98%的可能會(huì)落在~901.20之或標(biāo)準(zhǔn)差會(huì)落在9.32~之,超出這一范圍的可能只有2。從這一結(jié)果看,物理成績(jī)標(biāo)準(zhǔn)差的區(qū)間較大,若增加樣本容量可縮小區(qū)間差距。(二)總體標(biāo)準(zhǔn)差的估計(jì)標(biāo)準(zhǔn)差的估計(jì)既可以采用上述總體方差估計(jì)區(qū)間的平方根以直接利用樣本標(biāo)準(zhǔn)差進(jìn)行估計(jì)。樣本標(biāo)準(zhǔn)差抽樣分布的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)誤,其公式為SE

S

(或

S

S

nn因其近似正態(tài)分布,所以總體標(biāo)準(zhǔn)差的置信區(qū)間為

1.96nnS用此法對(duì)例進(jìn)總體標(biāo)準(zhǔn)的估計(jì),則有14.46SE

14.464.47

14.461.963.238.13~20.79二、總體相關(guān)系數(shù)的估計(jì)由樣本相關(guān)系數(shù)

r

形成的分布形式較多,因此計(jì)算樣本相關(guān)系數(shù)標(biāo)準(zhǔn)誤的及置信限的方法也較為復(fù)雜。這里只介紹常用方法—Fisher的Z函分布法Fisher的Z函分布法是通過將樣本相關(guān)系數(shù)轉(zhuǎn)換為值(因的樣本分布近似正態(tài)分布以值行估計(jì),然后再將值原為值的做。這種既無需考慮樣本容量大小,也無需顧忌總體相關(guān)系數(shù)。/

rrtrrt例8-6:某教師經(jīng)研究發(fā)現(xiàn),所教班級(jí)學(xué)生55人)的學(xué)成績(jī)與物理成績(jī)的相關(guān)系數(shù)為。試以95%置信度估計(jì)全年級(jí)數(shù)學(xué)和物理的相關(guān)系數(shù)。)將

r

轉(zhuǎn)換為r函。查函轉(zhuǎn)換表,當(dāng)

r0.66

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論