醫(yī)學(xué)統(tǒng)計(jì)學(xué):第4講 參數(shù)估計(jì)_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué):第4講 參數(shù)估計(jì)_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué):第4講 參數(shù)估計(jì)_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué):第4講 參數(shù)估計(jì)_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué):第4講 參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第5章參數(shù)估計(jì)總體樣本抽取部分觀察單位 統(tǒng)計(jì)量 參 數(shù) 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷 statistical inference如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率內(nèi)容:參數(shù)估計(jì)(estimation of parameters) 包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2. 假設(shè)檢驗(yàn)(test of hypothesis)總體樣本抽取部分觀察單位 統(tǒng)計(jì)量 參 數(shù) 統(tǒng)計(jì)推斷第一節(jié)樣本均數(shù)的標(biāo)準(zhǔn)誤如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率 抽樣誤差 (sampling error) :由于個(gè)體差異導(dǎo)致的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別。一、抽樣試驗(yàn) 從正態(tài)分布總體N(

2、5.00,0.502)中,每次隨機(jī)抽取樣本含量n5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對(duì)1000份樣本的均數(shù)作直方圖。 按上述方法再做樣本含量n10、樣本含量n30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。抽樣試驗(yàn)(n=5)抽樣試驗(yàn)(n=10)抽樣試驗(yàn)(n=30)1000份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示由表可見(jiàn),從同一總體中隨機(jī)抽取樣本

3、含量n=10的若干樣本,各樣本算得的樣本均數(shù)并不等于相應(yīng)的總體均數(shù),且各樣本均數(shù)也不完全相同。這種由于隨機(jī)抽樣而造成的來(lái)自同一總體的樣本均數(shù)之間及樣本均數(shù)與相應(yīng)的總體均數(shù)之間的差異,稱(chēng)之為均數(shù)的抽樣誤差。 由于樣本均數(shù)與相應(yīng)的總體均數(shù)之間存在著差異,由數(shù)理統(tǒng)計(jì)推理可知:從正態(tài)總體中隨機(jī)抽取樣本含量為n的樣本,每抽取一個(gè)樣本可計(jì)算一個(gè)樣本均數(shù),重復(fù)1000次抽樣可得到1000個(gè)樣本均數(shù)。 這些樣本均數(shù)服從均數(shù)為 ,方差為 的正態(tài)分布.其中 為樣本均數(shù)的總體標(biāo)準(zhǔn)差,計(jì)算公式為: 為了與反映個(gè)體差異的標(biāo)準(zhǔn)差(或)相區(qū)別,樣本均數(shù)的標(biāo)準(zhǔn)差用 表示。 統(tǒng)計(jì)上通常將統(tǒng)計(jì)量(如樣本均數(shù)、樣本率p等)的標(biāo)準(zhǔn)差

4、稱(chēng)為標(biāo)準(zhǔn)誤(standard error,SE)。所以,樣本均數(shù)的標(biāo)準(zhǔn)差 又稱(chēng)為樣本均數(shù)的標(biāo)準(zhǔn)誤,是反映樣本均數(shù)抽樣誤差大小的指標(biāo)。 特點(diǎn): 的大小與總體標(biāo)準(zhǔn)差成正比,與樣本含量的平方根成反比。即當(dāng)樣本含量n一定時(shí),標(biāo)準(zhǔn)差越大,即樣本的個(gè)體差異越大,標(biāo)準(zhǔn)誤就越大,樣本均數(shù)的抽樣誤差就越大;標(biāo)準(zhǔn)差越小,標(biāo)準(zhǔn)誤就越小,即樣本均數(shù)抽樣誤差就越小。 當(dāng) 一定時(shí),n越大,總體標(biāo)準(zhǔn)誤就越小;n越小,總體標(biāo)準(zhǔn)誤就越大。故影響抽樣誤差大小的主要因素是樣本含量。作為總體參數(shù)(常數(shù))通常是未知的,因而,在實(shí)際工作中常用樣本標(biāo)準(zhǔn)差S來(lái)估計(jì)。二、總體均數(shù)的估計(jì) (一) 總體均數(shù)的點(diǎn)估計(jì)(point estimatio

5、n)與區(qū)間估計(jì)參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量 直接估計(jì) 總體參數(shù)區(qū)間估計(jì):在一定可信度(Confidence level) 下,同時(shí)考慮抽樣誤差 統(tǒng)計(jì)學(xué)中的統(tǒng)計(jì)推斷包括兩個(gè)重要的方面:一是利用樣本統(tǒng)計(jì)量的信息對(duì)相應(yīng)總體參數(shù)值做出推斷,如用樣本均數(shù)估計(jì)總體均數(shù),用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差等,稱(chēng)之為點(diǎn)估計(jì)。另一個(gè)是利用樣本統(tǒng)計(jì)量來(lái)推斷我們是否接受一個(gè)事先的假設(shè),稱(chēng)之為假設(shè)檢驗(yàn)。本章只討論參數(shù)估計(jì),假設(shè)檢驗(yàn)將在下一章中討論。而參數(shù)估計(jì)又分為點(diǎn)估計(jì)與區(qū)間估計(jì)。 1.點(diǎn)估計(jì) 總體均數(shù)的點(diǎn)估計(jì)(point estimation)就是用樣本均數(shù)來(lái)直接地估計(jì)總體均數(shù),這種方法比較簡(jiǎn)單,由于沒(méi)有考慮到抽樣誤差

6、,只適合大樣本資料的統(tǒng)計(jì)推斷。 按預(yù)先給定的概率(1)所確定的包含未知總體參數(shù)的一個(gè)范圍。 總體均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1)所確定的包含未知總體均數(shù)的一個(gè)范圍。 如給定=0.05,該范圍稱(chēng)為參數(shù)的95%可信區(qū)間或置信區(qū)間; 如給定=0.01,該范圍稱(chēng)為參數(shù)的99%可信區(qū)間或置信區(qū)間。2區(qū)間估計(jì)(interval estimation):總體均數(shù)可信區(qū)間的計(jì)算 總體均數(shù)可信區(qū)間的計(jì)算需考慮:(1)總體標(biāo)準(zhǔn)差是否已知, (2)樣本含量n的大小通常有兩類(lèi)方法:(1)t分布法 (2)u分布法 1. 單一總體均數(shù)的可信區(qū)間 例 某地抽取正常成年人200名,測(cè)得其血清膽固醇的均數(shù)為3.64 mm

7、ol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計(jì)該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。 故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47, 3.81)mmolL。 例 為了解氨甲喋呤(MTX)對(duì)外周血IL-2水平的影響,某醫(yī)生將61名哮喘患者隨機(jī)分為兩組。其中對(duì)照組29例( ),采用安慰劑;實(shí)驗(yàn)組32例( ),采用小劑量氨甲喋呤(MTX)進(jìn)行治療。測(cè)得對(duì)照組治療前IL-2的均數(shù)為20.10 IU/ml ( ),標(biāo)準(zhǔn)差為7.02 IU/ml ( );試驗(yàn)組治療前IL-2的均數(shù)為16.89 IU/ml ( ),標(biāo)準(zhǔn)差為8.46 IU/ml ( )。問(wèn)兩組治療前基線(xiàn)的IL-2總體均

8、數(shù)相差有多大? 第一步: 可信區(qū)間的確切涵義 1. 95%的可信區(qū)間的理解:(1)所要估計(jì)的總體參數(shù)有95%的可能在我們所估計(jì)的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機(jī)抽取100個(gè)樣本,可算得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個(gè)均數(shù)的可信區(qū)間,平均約有95個(gè)可信區(qū)間包含了總體均數(shù) 。 2.可信區(qū)間的兩個(gè)要素(1)準(zhǔn)確度:用可信度(1)表示:即區(qū)間包含總體均數(shù)的理論概率大小 。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好 。(2)精確度:即區(qū)間的寬度 區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好 。 當(dāng)n確定時(shí),上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會(huì)變寬),勢(shì)必降低可信區(qū)間的實(shí)際應(yīng)用價(jià)值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用。 在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。 第二節(jié) 率的標(biāo)準(zhǔn)誤一、率的抽樣誤差與標(biāo)準(zhǔn)誤 由于抽樣造成的樣本率之間及樣本率與總體率之間的差別稱(chēng)為率的抽樣誤差。 率的抽樣誤差大小可由率的標(biāo)準(zhǔn)誤來(lái)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論