




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章第二章 統計量、參數估計與區間估計統計量、參數估計與區間估計 分析測試都采取抽樣檢驗,通過樣本測試對總體的分析測試都采取抽樣檢驗,通過樣本測試對總體的某個或某些特征進行估計與作出推斷。某個或某些特征進行估計與作出推斷。 統計推斷統計推斷: : 參數估計、假設檢驗參數估計、假設檢驗 參數估計:參數估計:隨機變量分布函數已知,須通過樣本值隨機變量分布函數已知,須通過樣本值估計分布的參數估計分布的參數 假設檢驗:假設檢驗:假設隨機變量分布具有某種函數分布形假設隨機變量分布具有某種函數分布形式式, 根據樣本值通過檢驗分布參數來推斷其假設是否正根據樣本值通過檢驗分布參數來推斷其假設是否正確。確。
2、已知隨機變量分布函數為正態分布,而表已知隨機變量分布函數為正態分布,而表示其分布特性的參數有示其分布特性的參數有、2,為總體的參數。,為總體的參數。確定了確定了、2,就可以預測,就可以預測和估計任何測量值和估計任何測量值落在某一區間的概率,了解總體分布的基本落在某一區間的概率,了解總體分布的基本特征。特征。參數的點估計參數的點估計 實際分析測試中,對樣本進行的是有限次的實際分析測試中,對樣本進行的是有限次的測定,只能得到樣本的平均值測定,只能得到樣本的平均值 和樣本方差和樣本方差s2,那么,能否用樣本平均值那么,能否用樣本平均值 和樣本方差和樣本方差s2來分別來分別估計總體均值估計總體均值和總
3、體方差和總體方差2,如果理論上證明,如果理論上證明是可行的,就可將求總體均值是可行的,就可將求總體均值和總體方差和總體方差2簡簡化為求樣本的平均值化為求樣本的平均值 和樣本方差和樣本方差s2。 xxx所以,所以,參數估計是根據樣本數據估計總體參參數估計是根據樣本數據估計總體參數的值,如估計總體均值、總體方差,稱為數的值,如估計總體均值、總體方差,稱為參數的點估計。參數的點估計。估計值不正好等于待估參數,估計值不正好等于待估參數,而只是其近似值。而只是其近似值。參數的區間估計參數的區間估計 它包括參數存在的區間,同時也給出此區它包括參數存在的區間,同時也給出此區間包含待估參數真值的概率,常以置信
4、區間的間包含待估參數真值的概率,常以置信區間的形式給出形式給出 。 第一節第一節 加和號和期望值的運算加和號和期望值的運算一、加和號的運算一、加和號的運算1. 2. , 或或 3.4. xxxxmnnnmnmii.1xxxxnnii2222112.niiniixx1212nniixxxx 2112212).()(xxxxni5. 6. (a為常數)為常數)7. ( 當樣本一定,當樣本一定, 為常數)為常數) 即即nnyxyxyxyxii.2211xaxaii naaxnx xinx1xxxxiiinnn1)1(xixnx9. 10. ( 即一組隨機樣本值對于樣本平均值的偏差的加即一組隨機樣本值
5、對于樣本平均值的偏差的加和等于零。和等于零。 ) naxaxii)(0)(xnxxxiixnxnnxii1二、期望值及其運算二、期望值及其運算1.定義定義 對于一個測量值來說,其期望值就是總體的平對于一個測量值來說,其期望值就是總體的平均值(在無系統誤差時)均值(在無系統誤差時)。 期望值就是理想值期望值就是理想值-真值。即我們并不期望在一次給真值。即我們并不期望在一次給定的試驗中,定的試驗中, 會取它的期望值,然而在大量的試驗會取它的期望值,然而在大量的試驗中,我們可合理地預料,中,我們可合理地預料, 的平均值將在的平均值將在 的期望的期望值的附近。值的附近。2. 2. 表示符號表示符號 :
6、 ,對于方差對于方差2( )表示)表示3. 3. 運算規則運算規則(1) a 為常數,為常數, ;xxxaa(2) 若若 是隨機變量的隨機樣本值是隨機變量的隨機樣本值 總體均值總體均值(3) (4)(5) xixix xni122222)(1)()()()(iiiixnxxxxx axaxaxa xixin (6) 證明:證明:(7)若)若 和和 是兩個互相獨立的隨機變量是兩個互相獨立的隨機變量 ,如如: 即對于相互獨立的隨機變量,各變量之和(或差)即對于相互獨立的隨機變量,各變量之和(或差)的期望值,都等于各變量的期望值之和的期望值,都等于各變量的期望值之和(或差或差)。)()222222x
7、axxaaxaxax()(xaxa222)(xyyxyxyxxy(8) (9) 平均值的方差,等于各別測量值的方差的平均值的方差,等于各別測量值的方差的 )()()()(2222xnxxxii)1)(.1)(1)(1)()(222222222xnxnnxnxnnxxii(n1(10) 證明:證明:由于由于隨機變量相對于它們的平均值的偏差的加和等于隨機變量相對于它們的平均值的偏差的加和等于零零。所以所以:)()2)(2)()()()(22222222(yyxxyyxxyyxxyyxxyyxxyxyxyxyxyx0)(xx)0)(1)(xinx)()()(222yxyx)()()(222yxyx(
8、11)證明:證明: 上式上式 若若 則則222)()((xaxax()()(2)()()(2)()()()(2222222xaxxxaxxxaxxxaxxxaxxaxxxax0)(xx2222)()((xaxxaxx0a222)(xxx整理得:整理得: 又又 由上式得:由上式得: 22222)()nnxxxxxii(2() xiSnnSxxi22()()Sxnxi22)()(222)(1)xnxxnii(222)(1)xxiinxnS(222)(xxx 由上可見。由上可見。S是由平均值計算出來的。但是由平均值計算出來的。但通常并不是有限小數,絕大多數都按數字修約通常并不是有限小數,絕大多數都按
9、數字修約規則獲得的近似值,于是各偏差也都是近似值,規則獲得的近似值,于是各偏差也都是近似值,其平方再加和,會把舍入誤差累積起來,使其平方再加和,會把舍入誤差累積起來,使 S、s2、s受影響。為了消除上述弊病,同時為了計受影響。為了消除上述弊病,同時為了計算機編程方便起見,算機編程方便起見,可由樣本值按上式直可由樣本值按上式直接求出方差和接求出方差和S、s2、s 。第二節第二節 統計量統計量一一 、統計量、統計量 1.定義定義 將樣本值經過加工運算得到的將樣本值經過加工運算得到的樣本函數值,稱為統計量。樣本函數值,稱為統計量。 它可以把關于總體的有用信息更明確更集它可以把關于總體的有用信息更明確
10、更集中地反映出來中地反映出來, 如如 、R、s2、s、S 等,這些等,這些數值都是由隨機變量的隨機樣本值數值都是由隨機變量的隨機樣本值 得到得到的。所以,統計量也是隨機變量。的。所以,統計量也是隨機變量。 2. 作用作用 利用統計量可以對被測物理量的利用統計量可以對被測物理量的數值作出統計意義的推斷數值作出統計意義的推斷 xxi 選定一個概率(置信概率),并在真值選定一個概率(置信概率),并在真值統計量的兩邊,各定出一個界限(置信限),統計量的兩邊,各定出一個界限(置信限),由此畫出的區間由此畫出的區間置信區間,然后才能斷置信區間,然后才能斷然說,然說,這個區間包含真值在內的概率是多少,這個區
11、間包含真值在內的概率是多少,這叫做區間估計這叫做區間估計 而被推斷出物理量真值的而被推斷出物理量真值的某個統計量叫某個統計量叫做參數的點估計做參數的點估計。例如,樣本平均值。例如,樣本平均值 作為作為總體均值總體均值的估計值,記做的估計值,記做 。 x二、一些統計量的計算二、一些統計量的計算1.平均值平均值 簡化計算法簡化計算法-編碼變換(大的變小,小數變整編碼變換(大的變小,小數變整數)數)(1) (2) (3) ( 表示一個數表示一個數) 注意:注意:當測定精密度好,可多保留一位;當當測定精密度好,可多保留一位;當離散度大時,位數與測量值相同或少一位。離散度大時,位數與測量值相同或少一位。
12、 xnxi1aaxxiiixnx1axx2. 差方和(離差平方和)差方和(離差平方和) 方差方差 標準差標準差 2)(xSxi12nSs1nSsS S的計算方法:的計算方法:(1) 由樣本值直接求由樣本值直接求:利用簡化計算法利用簡化計算法 與與 的關系:的關系: 22)(1xxiinSS)(axbxiiS各樣本值同減去一個數各樣本值同減去一個數 a a,其差方和不變,其差方和不變 令令 則則 axxiiaxxSxxaxaxxxSiii222)()()()(SxnxSii22)(1各樣本值同乘以一個數各樣本值同乘以一個數 b b,其差方和增大,其差方和增大 b b2 2倍倍 令令 iibxx
13、xbx SbxxbxbbxxxSiii22222)()()(2bSS例例21 用用K2Cr2O7法測定某赤鐵礦中鐵的含量,數法測定某赤鐵礦中鐵的含量,數據如下:據如下: 66.64, 66.56, 66.65, 66.62, 66.63計算方法的精密度。計算方法的精密度。解:解: 編碼公式編碼公式: %1001%100 xnSxsRSDix2ixxi100)60.66(iixx66.6466.5666.6566.6266.634-4523101616254970 (2)先計算平均值)先計算平均值 ,再由,再由 ,求,求 S。005.0501002S%053. 0%10062.664005. 0
14、%1001xnSRSDx2)(xSxi62.661051060.6610560.6622ixx50105170)(1222iixnxS習題 某標準水樣中氯化物含量為某標準水樣中氯化物含量為110 mg/L,銀含量法測,銀含量法測定定5次的結果分別為次的結果分別為112,115,114,113,115 mg/L。(1)計算平均值的絕對誤差和相對誤差)計算平均值的絕對誤差和相對誤差 ;(2)計算樣本的差方和、方差、標準偏差和相對標)計算樣本的差方和、方差、標準偏差和相對標準偏差。準偏差。第三節第三節 參數的點估計參數的點估計一、參數的點估計一、參數的點估計 點估計:點估計:用樣本的統計量作為總體參
15、數的估計值,用樣本的統計量作為總體參數的估計值,叫做總體參數的點估計。叫做總體參數的點估計。 表示測定值集中趨勢的參數表示測定值集中趨勢的參數: : 均值、中位值等,均值、中位值等, 表示測定值離散特性表示測定值離散特性: : 算術平均偏差、極差、方算術平均偏差、極差、方差和標準差。差和標準差。 xx 22ss二、參數二、參數的點估計值的點估計值1 .算術平均值算術平均值 (指各測量值的方差都相等的等精度(指各測量值的方差都相等的等精度的測量)的測量)(1 1) 平均值平均值 是總體均值是總體均值的無偏估計量的無偏估計量,這是,這是因為參數因為參數的估計量的期望值等于被估參數,即的估計量的期望
16、值等于被估參數,即 無偏估計量是說由測定值計算的估計值無偏估計量是說由測定值計算的估計值 離被估離被估參數參數很近,由不同樣本得到的估計值很近,由不同樣本得到的估計值 在被估參數在被估參數附近波動。附近波動。xxnxnxnxii111xxx(2) 是出現概率最大的值是出現概率最大的值p23 在正態總體中,隨機抽出容量為在正態總體中,隨機抽出容量為 的樣本,獨立的樣本,獨立進行測定,得到進行測定,得到 個測定值個測定值 測定值測定值 出出現的概率現的概率 是指隨機變量出現在是指隨機變量出現在 區間的概率(即具有各種大小偏差的樣本值出現的概區間的概率(即具有各種大小偏差的樣本值出現的概率)。率)。
17、 eFaixi2(2121)nxixxinnxxx ,21iFx 假設最佳值為假設最佳值為 ,則,則 為各次測量值所為各次測量值所對應的誤差對應的誤差 由于由于各次測量值獨立進行各次測量值獨立進行 ,所以在,所以在 次測定中,次測定中,總總概率概率 F 為:為:exxxaaannxxxFFFFn(222212)()()212121)()()()( naaxi),(),(),(21axaxaxn而在一組測量中,最佳值或最可信賴值乃是當總而在一組測量中,最佳值或最可信賴值乃是當總概率概率P最大時所求出的那個值。最大時所求出的那個值。由指數關系可知,由指數關系可知,當當 F 最大時最大時,則,則 為
18、最小,亦即在一組測量值中各偏差的平方和最為最小,亦即在一組測量值中各偏差的平方和最小,而小,而S為極小值為極小值的條件:的條件: 222221)()()(axaxaxaxin(當當S最小,最小, 算術平均值算術平均值0dadS022daSd0)(2)( 2)( 2)( 221 aaaadadSxxxxinndaSd2222222 00)(0)(2naxaxaxiiixnai1由此可得結論由此可得結論(最小二乘法原理最小二乘法原理): 在一組等精度測量中,在一組等精度測量中, 為其最佳值或最為其最佳值或最可信賴值;可信賴值; 各測量值與各測量值與 的偏差的平方和為最小的偏差的平方和為最小 由正態
19、分布圖形也可看出,由于正態分布概率密度由正態分布圖形也可看出,由于正態分布概率密度函數曲線對函數曲線對對稱,各測定值對真值對稱,各測定值對真值的偏差有正有負,的偏差有正有負,正負偏差出現的機會相同。當對測定數據進行算術平正負偏差出現的機會相同。當對測定數據進行算術平均后,一部分正負誤差相互抵消,因此,用均后,一部分正負誤差相互抵消,因此,用 來估來估計計偏差會更小。偏差會更小。xxx(3 3)在一組測量值中,測定值對算術平均值)在一組測量值中,測定值對算術平均值的偏差之和為零的偏差之和為零 由上可見,算術平均值充分利用了樣本測定所由上可見,算術平均值充分利用了樣本測定所提供的全部信息,在等精度
20、的測定中,是提供的全部信息,在等精度的測定中,是出現出現概率最大,偏差平方和最小的值,因而是最可概率最大,偏差平方和最小的值,因而是最可信賴的。算術平均值是信賴的。算術平均值是的無偏估計量,用它的無偏估計量,用它來估計來估計是最有效的。是最有效的。0)(1xnxnxnxxxinii)1(xnnnxi2. 加權平均值加權平均值 設有設有m組精度分別為組精度分別為S1、S2、 Sm的不等精度的平的不等精度的平均值均值 (不同的人、不同的室、或一(不同的人、不同的室、或一個人用不同的方法測定同一試樣)被測定量個人用不同的方法測定同一試樣)被測定量的最佳的最佳值或最佳估計值是樣本測定值的加權平均值值或
21、最佳估計值是樣本測定值的加權平均值 : ( 表示表示 ) 式中式中 權數與測定值的方差成反比權數與測定值的方差成反比 。wxwxwxiiiwxiixwsix121swiimxxx、21wx 權重權重 : 表示某個精度測定值在樣本平均值中所表示某個精度測定值在樣本平均值中所占的地位、比例或貢獻,即表示測量值可信賴程度的占的地位、比例或貢獻,即表示測量值可信賴程度的數值。數值。 可見,測量值的可信賴程度與標準差有關,標準差可見,測量值的可信賴程度與標準差有關,標準差愈小其可信賴程度愈大,因而其權愈大。正態分布的愈小其可信賴程度愈大,因而其權愈大。正態分布的條件下,給于較大權數的測定值必定是最可信賴
22、值,條件下,給于較大權數的測定值必定是最可信賴值,即誤差最小,概率最大的測定值。即誤差最小,概率最大的測定值。21swiiwi加權平均值的特性加權平均值的特性: :(1) 不等精度測定中,不等精度測定中, 是總體均值是總體均值的無的無偏估計量偏估計量 wxwxwwxwxiiiiiw(2) 在不等精度測量中,在不等精度測量中, 是出現概率最是出現概率最大的值大的值 (3) 對于精密度對于精密度S相同,但測量次數不同的幾相同,但測量次數不同的幾組測量值,各組測量值組測量值,各組測量值 平均值的精密度不同,平均值的精密度不同,所以所以 (權數測定次數)(權數測定次數)nxnxiiiwwx 在等精度的
23、測定條件下,各測定值的權相在等精度的測定條件下,各測定值的權相同,則加權平均值等于算術平均值,這是不同,則加權平均值等于算術平均值,這是不等精度測定的一種特殊情況,即無論是等精等精度測定的一種特殊情況,即無論是等精度還是不等精度的測量,都可用加權平均值度還是不等精度的測量,都可用加權平均值表示測定結果。表示測定結果。xxnxxwxiiiiw1 例例 22 某一實驗室三個分析人員分別用某一實驗室三個分析人員分別用光譜法、原子吸收法和化學法測定耐火材料中光譜法、原子吸收法和化學法測定耐火材料中的的CaO ,測定結果分別為,測定結果分別為(%):1.65,1.67,1.70,標準差分別為,標準差分別
24、為0.043,0.024,0.020 ,問該,問該實驗室應如何報分析結果?實驗室應如何報分析結果? 例例 22 某一實驗室三個分析人員分別用光譜法、某一實驗室三個分析人員分別用光譜法、原子吸收法和化學法測定耐火材料中的原子吸收法和化學法測定耐火材料中的CaO ,測定結,測定結果分別為果分別為(%):1.65,1.67,1.70,標準差分別為,標準差分別為0.043,0.024,0.020 ,問該實驗室應如何報分析結果?,問該實驗室應如何報分析結果?解解 : 這是一組不等精度的測量,應用加權平均值報分這是一組不等精度的測量,應用加權平均值報分析結果析結果68. 1)020. 0(1)024. 0
25、(1)043. 0(1)020. 0(70. 1)024. 0(67. 1)043. 0(65. 1122222222ssxwxwiiiiiiwx 三、總體方差三、總體方差 2 2及總體標準差及總體標準差 的點估計的點估計 1. 參數參數2和和的點估計的點估計 常用樣本的方差常用樣本的方差 s2(單次測定方差)和樣本(單次測定方差)和樣本的標準差的標準差s作為總體方差作為總體方差2和總體標準差和總體標準差的點的點估計值。估計值。 上式表明,樣本方差上式表明,樣本方差S2和標準差和標準差S分別是分別是總體方差總體方差2和標準差和標準差的無偏估計量。的無偏估計量。 22ss證明:證明: 即樣本的方
26、差是總體方差的無即樣本的方差是總體方差的無偏估計量偏估計量上式中:上式中:)()(11)(1)1)1)1)11)()(111)(22222222222xxnnnxnnxnnxnnxnnxnxnxnnxxsiiii()(22xs222)()()(xnxxxii證明:證明: 222222)()(2)()()( 2)()()(xxxxxxxxxxxxiiiiii(22)()(:xnx其中2)(2)( 2)( 2)()( 2)(2xnnxnxnxxxxxxiii222222)()()()(2)()(xnxxnxnxxxiii(222)()(xnxxxii S2 表示在等精度測定條件下單次測定的方差,表
27、示在等精度測定條件下單次測定的方差,其統計含義是,其統計含義是,在多次測定中平均在每次測定上在多次測定中平均在每次測定上的方差,即方差的統計平均值。的方差,即方差的統計平均值。單次測定的方差單次測定的方差不是一次測定的方差,因一次測定不能求方差。不是一次測定的方差,因一次測定不能求方差。 S2 是是總體方差總體方差2 的無偏估計量,以的無偏估計量,以2為其期望值。為其期望值。 當當 很大時,用很大時,用2 與與 S2 估計測定精度,其差別很估計測定精度,其差別很小(比如,小(比如, ,差別只有,差別只有2)。但分析測定)。但分析測定中,通常只有少數幾次測定,應用中,通常只有少數幾次測定,應用2
28、的無偏估計量的無偏估計量S2來估計測量數據的精密度。來估計測量數據的精密度。n50n 當測定是分當測定是分m組進行的,總的測定方差由組進行的,總的測定方差由m組的方組的方差共同決定。當各組測定次數相等時,單次測定的方差共同決定。當各組測定次數相等時,單次測定的方差按差按并合方差公式并合方差公式計算。并合方差計算。并合方差式中式中 是第是第 組第組第 次測定值,次測定值, 是第是第 組測定的平組測定的平均值,均值, 是第是第 組的測定值的數目,組的測定值的數目, 是第是第 組測組測定的方差。定的方差。 當各組測定值的數目不相同時,則用加權平均值當各組測定值的數目不相同時,則用加權平均值求并合方差
29、。加權并合方差的計算公式是:求并合方差。加權并合方差的計算公式是:msnmxxsmiimiinjij121212) 1()(xijijiniisi2iix 式中,稱為式中,稱為自由度自由度,是指獨立變量的數目,在這里表,是指獨立變量的數目,在這里表示差方和中獨立項的數目。作為各組差方和的權值。示差方和中獨立項的數目。作為各組差方和的權值。 樣本方差樣本方差 S2 充分利用了測定所提供的全部信息,充分利用了測定所提供的全部信息,是總體方差是總體方差2的無偏估計值,而且在的無偏估計值,而且在2的無偏估計量的無偏估計量中中, S2是最優的,所以方差和標準差應用最廣。是最優的,所以方差和標準差應用最廣
30、。miimiiimiimiinjijfsfmnxxs11211212)(2. 樣本方差的自由度樣本方差的自由度 在樣本方差和樣本標準差的計算中,我們將各測在樣本方差和樣本標準差的計算中,我們將各測量值對于樣本平均值量值對于樣本平均值 的偏差的平方取平均時,所的偏差的平方取平均時,所用的分母并不是樣本容量用的分母并不是樣本容量 n,而是自由度,而是自由度 。何謂自由度?何謂自由度? f:一個關系式中獨立項的數目一個關系式中獨立項的數目 樣本值的線性約束關系式樣本值的線性約束關系式x1 nfxnxi10 xnxi 由于由于 屬于同一樣本的并具有平均屬于同一樣本的并具有平均值值 ,則由,則由 到到
31、都可以自由取值,當都可以自由取值,當的值取定以后,輪到的值取定以后,輪到 取值時,它就不可能自由了,取值時,它就不可能自由了,它要受到上述關系式的制約,即它要受到上述關系式的制約,即 的取值一定使得的取值一定使得 式成立,否則,樣本平均式成立,否則,樣本平均 值值 就不就不再是確定的。再是確定的。 所以,雖然樣本有所以,雖然樣本有 個獨立的隨機變量,但在差個獨立的隨機變量,但在差方和中的獨立項的數目,實際上只有方和中的獨立項的數目,實際上只有 ,即,即自由自由度為度為 。 xnxxx,21x1xn 1121,nxxxxnxn0 xnxixn1n1n 換言之,對于換言之,對于 ,因為差方,因為差
32、方和的計算式中需要計算平均值和的計算式中需要計算平均值 ,用掉,用掉了一個自由度,故樣本容量為了一個自由度,故樣本容量為 的一組樣的一組樣本,其自由度為本,其自由度為 。1)(22nxxsixn1 nf3. 樣本平均值的標準差樣本平均值的標準差 當用樣本平均值當用樣本平均值 估計總體均值估計總體均值( ),其),其標準差又有多大?換句話說,樣本平均值的精度是不標準差又有多大?換句話說,樣本平均值的精度是不是比個別測量值的精度要好一些?如何衡量?是比個別測量值的精度要好一些?如何衡量? 設一組等精度的測量值設一組等精度的測量值 ,樣本的平均,樣本的平均值為值為 ,樣本的方差是,樣本的方差是 ,由
33、定義可知,由定義可知xnxnxnnxxxnxxnni1.11.2121sxxxxs2nxxx,21而單次測量值而單次測量值 的方差均的方差均為為S2(等等精度精度),根據誤差傳遞公式,則平均值的標準差根據誤差傳遞公式,則平均值的標準差 : sx2nssnnsnsnsnsxxxsxxxsxxxsnnx222222222222212)1()1(.)1()1()(.)()(21nssx22nssxnxxx,21 上述表示,當單次測定的方差不變時,上述表示,當單次測定的方差不變時,平均平均值的方差值的方差 隨測定次數的增加而減小,但減隨測定次數的增加而減小,但減小的速度隨測定次數增加而減慢。小的速度隨
34、測定次數增加而減慢。將上式變將上式變換換 , 以以 對對 作圖,得作圖,得 曲線,曲線,其均值標準差與測定次數的關系如圖所示。其均值標準差與測定次數的關系如圖所示。 nssx22nssxsx2nssx1ssxnssxn 所以,要使樣本的均值反映結果的可靠性,必須所以,要使樣本的均值反映結果的可靠性,必須一般平行測定一般平行測定35次次標樣定標時標樣定標時n=56次次建立分析方法(以建立分析方法(以RSD表示精密度),則表示精密度),則n=11次。求檢出限次。求檢出限 DL,一般,一般n=11次。當次。當 , 隨隨n的增加變化不大的增加變化不大 10nsx可見在可見在 時,增加測定次數是減小均值
35、標準差有效時,增加測定次數是減小均值標準差有效的方法之一。當的方法之一。當 愈大,愈大, ,平均值,平均值 的精度上的精度上升,升, 愈靠近愈靠近;當;當 則則 , ,因此,因此,當樣本容量愈大,我們愈能肯定樣本平均值當樣本容量愈大,我們愈能肯定樣本平均值 是總體均是總體均值的一個好的估計。當值的一個好的估計。當 ,均值標準差隨測定次數,均值標準差隨測定次數的增加減小很慢,的增加減小很慢, 變化趨于平穩,尤其是變化趨于平穩,尤其是 后,后, 基本不變,此時,借增加測定次數減小基本不變,此時,借增加測定次數減小均值標準差是不可取的。均值標準差是不可取的。ssx5nssxssxxxnx0sx5n1
36、0nnx總結:總結:單次測定結果單次測定結果 ,平均值,平均值 ,但,但平均值的標準差平均值的標準差 比個別測定值的標準差比個別測定值的標準差S小,只小,只相當于相當于S 的的 ,可見平均值的精度要好,從其分布,可見平均值的精度要好,從其分布來看也可知,來看也可知, 是是的最可信賴值的最可信賴值。4.4.樣本標準偏差的標準差樣本標準偏差的標準差 在處理數據時,在處理數據時,S的有效數字位數通常較少(的有效數字位數通常較少(12位),這里也存在一個精密度問題。可以用樣本標位),這里也存在一個精密度問題。可以用樣本標準差準差S的標準差的標準差 來表征來表征 S 的精密度。的精密度。xixsxn1s
37、sx可見,可見, 與樣本容量與樣本容量n有關,當有關,當n愈大,愈大, 則則 愈小,愈小,n,則,則 0,則,則S。一般,。一般,n50,S 取一位有效數字(最多兩位)。取一位有效數字(最多兩位)。nss2ss第四節第四節 估計量好壞的評選標準估計量好壞的評選標準 用不同的估計方法得到的估計值是不同的,用不同的估計方法得到的估計值是不同的,這就提出了兩個問題:這就提出了兩個問題:(1) 對一個參數的許多可能的估計值中,究對一個參數的許多可能的估計值中,究竟選擇哪一個估計值為好?評選的標準是什么竟選擇哪一個估計值為好?評選的標準是什么(2) 這類估計的可靠性有多大?這類估計的可靠性有多大?評選的
38、標準:評選的標準:無偏性、一致性、有效性無偏性、一致性、有效性和充分性。和充分性。 一、無偏性一、無偏性 無偏性:無偏性:估計值能在待估參數的真值估計值能在待估參數的真值附近擺動。附近擺動。 無偏估計量:無偏估計量:估計量的期望值應等于估計量的期望值應等于待估參數待估參數 xixs2S 二、一致性二、一致性 一致性:一致性: 隨著樣本容量的增大,估計值與待估參隨著樣本容量的增大,估計值與待估參數接近的可能性就愈大(無限靠近于真值)。數接近的可能性就愈大(無限靠近于真值)。 當當 n 當當 n 用容量較大的樣本比容量較小的樣本作出的估計值用容量較大的樣本比容量較小的樣本作出的估計值更精確。更精確
39、。nxxixx22s22s 三、有效性三、有效性 方差愈小,則估計量接近待估參數的概率方差愈小,則估計量接近待估參數的概率愈大,因此,在諸多無偏估計量中,方差愈愈大,因此,在諸多無偏估計量中,方差愈小的估計量,即為較好的無偏估計量小的估計量,即為較好的無偏估計量有有效性。效性。具有最小方差的無偏估計量稱為有效具有最小方差的無偏估計量稱為有效估計量。估計量。 對于正態分布的隨機變量來說,方差對于正態分布的隨機變量來說,方差2愈小,愈小,分布就愈窄,隨機變量在期望值分布就愈窄,隨機變量在期望值左右擺動的左右擺動的幅度愈小,測定結果的精密度愈好。幅度愈小,測定結果的精密度愈好。對于樣本對于樣本容量為
40、容量為 的一組樣本來說,平均值的一組樣本來說,平均值 的方差的方差 比個別測量值比個別測量值 的方差的方差 要小,故平均值要小,故平均值 比用單次測定值比用單次測定值 作作為總體均值為總體均值的估計量更有效。的估計量更有效。 最佳效估計量最佳效估計量nxns2xis2xxix四、充分性四、充分性 充分性:充分性: 充分利用樣本信息對待估參數充分利用樣本信息對待估參數作出估計。作出估計。 和和 都是充分利用了每個樣本值所提都是充分利用了每個樣本值所提供的信息,因此,它們都具有充分性。供的信息,因此,它們都具有充分性。 綜上所述,綜上所述, 和和 具有上述四種特性,是具有上述四種特性,是和和2的最
41、好點估計值。的最好點估計值。xs2xs2第五節第五節 區間估計和分析結果的表達區間估計和分析結果的表達 分析測定的目的,就是由樣本測定的算術平分析測定的目的,就是由樣本測定的算術平均值來估計總體均值,算術平均值越接近于真均值來估計總體均值,算術平均值越接近于真值(近似程度),說明由算術平均值來估計總值(近似程度),說明由算術平均值來估計總體均值就越準確。體均值就越準確。 確定測定值的允許范圍的問題,在統計上就確定測定值的允許范圍的問題,在統計上就是區間估計問題。是區間估計問題。 一、置信水平和置信區間一、置信水平和置信區間1. 置信度置信度 表示人們所作判斷的把握性程度表示人們所作判斷的把握性
42、程度 例例23 標準鋼樣的含磷量為標準鋼樣的含磷量為0.079,方法測定的總體標準差方法測定的總體標準差0.002。現用此。現用此方法對鋼樣進行測定,預測一下測定結果。方法對鋼樣進行測定,預測一下測定結果。要求:要求: (1)單次測定值在)單次測定值在 0.0790.004 范圍內(范圍內(2),在此判斷的置信度),在此判斷的置信度(2)為)為 95.46,則,則a 95.46 。 (2)單次測定值在)單次測定值在 0.0790.002 范圍范圍內(內(),則),則 a 68.28 。 (3)若)若4次測定的平均值在次測定的平均值在 0.0790.002 范圍內(范圍內( ),),a = 95
43、.46% 。4s2. 置信度的雙重含義置信度的雙重含義置信度:置信水平,置信概率置信度:置信水平,置信概率置信區間:在一定的置信水平下,包含樣品真值的區置信區間:在一定的置信水平下,包含樣品真值的區間范圍間范圍 。3. 置信水平和置信區間的選擇置信水平和置信區間的選擇置信區間和置信水平由下列關系:置信區間和置信水平由下列關系: 置信區間置信區間 置信水平置信水平 判斷判斷 寬寬 高高 無意義無意義 窄(窄(0.67) 低(低(50) 準確度較高,準確度較高, 但失誤但失誤較多較多 統計意義上的推斷,通常不把置信水平定統計意義上的推斷,通常不把置信水平定為為100。將置信水平的高低定得合適,可能
44、使。將置信水平的高低定得合適,可能使置信區間的寬度足夠小,而置信水平又很高。置信區間的寬度足夠小,而置信水平又很高。一般,人們判斷若有一般,人們判斷若有9090或或9595的把握性,就的把握性,就認為此判斷基本正確。認為此判斷基本正確。 分析化學中,一般置信水平取分析化學中,一般置信水平取95%,此時,此時,置信區間為置信區間為 1.96,可記為,可記為1.96 ( a=95%, u=1.96 )二、總體均值二、總體均值的區間估計的區間估計置信區間:置信區間:在一定的概率下所估計的總體參數在一定的概率下所估計的總體參數存在的區間,稱為置信區間。存在的區間,稱為置信區間。區間估計:區間估計:在已
45、求得估計值的條件下對待估在已求得估計值的條件下對待估參數存在的區間作出估計,稱為區間估計參數存在的區間作出估計,稱為區間估計。 已知已知 , , ,測測量值量值 和算術平均值和算術平均值 均遵從正態分布均遵從正態分布 N(,2)或)或 N(, ),或標準正態分布),或標準正態分布 N(0,1),由此可以估計),由此可以估計落在某一區間的落在某一區間的概率,或反過來可以在一定概率下估計概率,或反過來可以在一定概率下估計的區的區間的大小。間的大小。x22snsx22xixn21. 由樣本值對由樣本值對進行區間估計進行區間估計若總體標準差若總體標準差是已知的常數,試判斷下列兩是已知的常數,試判斷下列
46、兩式的含義:式的含義:(1)(2) a=95%uxuuxux兩式的意義:兩式的意義: (1)式是用)式是用來判斷來判斷 在什么范圍內,其含在什么范圍內,其含義義是一個隨機變量出現在指定期間是一個隨機變量出現在指定期間( )內及這一事件的概率。是用)內及這一事件的概率。是用對對 的預測的預測。uxuuxx(2)式是用)式是用 來判斷來判斷所在的范圍。其含義是所在的范圍。其含義是寬度一定而中心值作隨機變動的區間寬度一定而中心值作隨機變動的區間( ),其中含有一恒定值),其中含有一恒定值(真值)(真值)以及這一事件的概率。是用以及這一事件的概率。是用 對真值對真值的估計的估計。如圖示:如圖示: ux
47、uxuxxx 由圖可見,圖中每一條垂直線的中心代表測定由圖可見,圖中每一條垂直線的中心代表測定值值 ,兩端箭頭表示區間(,兩端箭頭表示區間( )的范圍。對)的范圍。對于每一測量結果來說,垂直線可能與水平線相交于每一測量結果來說,垂直線可能與水平線相交或不相交,而或不相交,而關于關于的置信區間問題,也就是相的置信區間問題,也就是相交的可能性(置信水平)與垂直線長度(置信區交的可能性(置信水平)與垂直線長度(置信區間的寬度)之間的關系。若以間的寬度)之間的關系。若以 估計估計,只要,只要 在在 內,則內,則一定落在一定落在 內,內, 落落在在 內的概率和內的概率和落在落在 內的概率一內的概率一致(
48、相同致(相同) ) 。 uxxuuxuuxxxxi所以所以的區間估計的區間估計:以測定值為中心,在一定的置以測定值為中心,在一定的置信水平上給出的信水平上給出的的范圍。的范圍。 表示方法:表示方法: 當當 u=1 a=68.26% u=2 a=95.44% u=3 a=99.73% ux2. 用樣本的平均值用樣本的平均值 對對進行區間估計進行區間估計 當對樣本進行當對樣本進行n次測量,對樣本容量為次測量,對樣本容量為n的分的分析數據進行統計處理,可求得析數據進行統計處理,可求得 和和 ,即,即可將以上估計量代入上式得:可將以上估計量代入上式得: xsxxnssxuxnuxx (1)如果)如果已
49、知已知 對于其標準正態分布,對于其標準正態分布,N(0,1),), ( )xnxuxu),(2nN 顯著性水平顯著性水平1置信水平置信水平, ,即測量數據即測量數據落在區間以外的可能性(概率)。落在區間以外的可能性(概率)。置信水平置信水平: :nuxa1)(2211a(2) 如果如果是未知的(有限次的測量)是未知的(有限次的測量) 用小樣本測定得到的標準差估計值用小樣本測定得到的標準差估計值s代替代替來進行來進行的區間估計,偏差較大,其分布應遵從另一種分布的區間估計,偏差較大,其分布應遵從另一種分布 t 分布,應用分布,應用 t 分布則可以得到分布則可以得到的較精確的區間的較精確的區間估計。估計。 t 分布:分布:若若 ,是由遵從正態分布,是由遵從正態分布N(,2)的總體中隨機抽取的樣本值,統計量:)的總體中隨機抽取的樣本值,統計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《摔跤吧!爸爸》觀后感匯編15篇
- 海水淡化工程規劃設計方案(僅供參考)
- 中學時代教案課件設計規范
- 廣東省四會中學、廣信中學2023-2024學年高二上學期第二次月考數學含解析
- 重慶海聯職業技術學院《中國現當代文學作品》2023-2024學年第二學期期末試卷
- 山西工程職業學院《制藥分離工程》2023-2024學年第二學期期末試卷
- 桂林學院《新營銷概論》2023-2024學年第二學期期末試卷
- 陜西學前師范學院《數字孿生與智能設計》2023-2024學年第二學期期末試卷
- 重慶信息技術職業學院《員工招聘與測評》2023-2024學年第二學期期末試卷
- 西安思源學院《企業價值創造實戰》2023-2024學年第二學期期末試卷
- 《智慧化工園區系統運維管理要求》
- 第3章通風空調工程3.1通風工程3.2空調工程57課件講解
- 公益事業對外捐贈管理辦法
- 拓撲磁體研究-洞察分析
- 2025年江蘇南京林業大學招聘專職輔導員15人(第二批)高頻重點提升(共500題)附帶答案詳解
- 2025年濟南鐵路局招聘筆試參考題庫含答案解析
- 藥品養護管理制度
- 《西方經濟學(本)》形考任務(1-6)試題答案解析
- 產后出血介入手術護理
- 《消防應急疏散培訓》課件
- 國家安全反對邪教
評論
0/150
提交評論