




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章 城市供水量的預測模型 插值與擬合算法2.1 城市供水量的預測問題2.1.1 實際問題與背景為了節約能源和水源,某供水公司需要根據日供水量記錄估計未來一時間段(未來一天或一周)的用水量,以便安排未來(該時間段)的生產調度計劃。現有某城市7年用水量的歷史記錄,記錄中給出了日期、每日用水量(噸/日)。如何充分地利用這些數據建立數學模型,預測2007年1月份城市的用水量,以制定相應的供水計劃和生產調度計劃。表2.1.1 某城市7年日常用水量歷史記錄(萬噸/日)日期20000101200001022006123020061231日用水量122.1790128.2410150.40168148.2
2、064表2.1.2 2000-2006年1月城市的總用水量(萬噸/日)年份2000200120022003200420052006用水量40324141860254429698664374852443523444505427445176993利用這些數據,可以采用時間序列、灰色預測等方法建立數學模型來預測2007年1月份該城市的用水量。如果能建立該城市的日用水量隨時間變化的函數關系,則用該函數來進行預測非常方便。但是這一函數關系的解析表達式是沒辦法求出來的,那么能否根據歷史數據求出該函數的近似函數呢?根據未知函數的已有數據信息求出其近似函數的常用方法有插值法和數據擬合。本章將介紹插值法和數據擬
3、合,并用這兩種方法對該城市的供水量進行預測。2.2 求未知函數近似表達式的插值法2.2.1 求函數近似表達式的必要性一般地,在某個實際問題中,雖然可以斷定所考慮的函數在區間上存在且連續,但卻難以找到它的解析表達式,只能通過實驗和觀測得到該函數在有限個點上的函數值(即一張函數表)。顯然,要利用這張函數表來分析函數的性態,甚至直接求出其它一些點上的函數值是非常困難的。在有些情況下,雖然可以給出函數的解析表達式,但由于結構相當復雜,使用起來很不方便。面對這些情況,希望根據所得函數表(或結構復雜的解析表達式),構造某個簡單函數作為未知函數的近似。插值法是解決此類問題的一種常用的經典方法,它不僅直接廣泛
4、地應用于生產實際和科學研究中,而且也是進一步學習數值計算的基礎。定義2.2.1 設函數在區間上連續,且在個不同的點上分別取值,在一個性質優良、便于計算的函數類中,求一簡單函數,使 (2.2.1)而在其它點上作為的近似。稱區間為插值區間,點為插值節點,稱(2.2.1)為的插值條件,稱函數類為插值函數類,稱為函數在節點處的插值函數。求插值函數的方法稱為插值法。插值函數類的取法不同,所求得的插值函數逼近的效果就不同,它的選擇取決于使用上的需要。常用的有代數多項式、三角多項式和有理函數等。當選用代數多項式作為插值函數時,相應的插值問題就稱為多項式插值。這里主要介紹多項式插值。在多項式插值中,求一次數不
5、超過的代數多項式 (2.2.2)使 (2.2.3)其中為實數。滿足插值條件(2.2.3)的多項式(2.2.2),稱為函數的次插值多項式。次插值多項式的幾何意義:過曲線上的個點作一條次代數曲線作為曲線的近似,如圖2.2.1所示。圖2.2.1 插值多項式的幾何直觀圖2.2.2 插值多項式的存在唯一性由插值條件(2.2.3)知,的系數滿足線性方程組: (2.2.4)由線性代數知,線性方程組的系數行列式是階范德蒙(Vandermonde)行列式,且 因是區間上的不同點,上式右端乘積中的每一個因子,于是系數行列式不等于0,即方程組(2.2.4)的解存在且唯一。從而得出插值多項式的存在唯一性定理。定理2.
6、2.1 若插值節點互不相同,則滿足插值條件(2.2.3)的次插值多項式(2.2.2)存在且唯一。2.3 求插值多項式的Lagrange(拉格朗日)法在上一節里,插值多項式存在唯一性的證明過程不僅指出了滿足差值條件的次插值多項式是存在唯一性的,而且也提供了插值多項式的一種求法,即通過解線性方程組(2.2.4)來確定其系數。但是,當未知數個數多時,這種做法的計算工作量大,不便于實際應用。Lagrange基于用簡單插值問題的插值函數表示一般的插值函數思想,給出一種求插值函數的簡便方法Lagrange插值法。2.3.1 Lagrange插值基函數先考慮簡單的插值問題:對節點中任意一點做一次多項式使它在
7、該點上取值為1,而在其余點上取值為零, 即滿足插值條件 (2.3.1)(2.3.1)表明個點都是次多項式的零點,故可設,其中為待定系數,由條件可得故 (2.3.2)對應于每一節點都能求出一個滿足插值條件(2.3.1)的次插值多項式(2.3.2),這樣,由(2.3.2)式可以求出個次插值多項式。容易看出,這組多項式僅與節點的取法有關,稱它們為在個節點上的次基本插值多項式或次插值基函數,即Lagrange插值基函數。2.3.2 Lagrange(拉格朗日)插值多項式利用Lagrange插值基函數立即可以寫出滿足插值條件(2.2.3)的次插值多項式 (2.3.3)事實上,由于每個插值基函數都是次多項
8、式,故其線性組合(2.3.3)必是不高于次的多項式,同時,根據條件(2.2.1)容易驗證多項式(2.3.3)在節點處的值為,因此,它就是待求的次插值多項式。形如(2.3.3)的插值多項式稱為Lagrange插值多項式,記為 (2.3.4)令,由(2.3.4)即得兩點插值公式 (2.3.5)即 (2.3.6)這是一個線性函數,用線性函數近似代替函數,在幾何上就是通過曲線上兩點做一直線近似代替曲線,如見圖2.3.1所示,故兩點插值又稱線性插值。圖2.3.1 線性插值的幾何直觀圖令,由(2.3.4)可得常用的三點插值公式: (2.3.7)這是一個二次函數,用二次函數近似代替函數,在幾何上就是通過曲線
9、上的三點作一拋物線,近似地代替曲線,如圖2.3.1所示,故稱為三點插值或二次插值,也稱為拋物線插值。圖2.3.2二次插值的幾何直觀圖例2.3.1 已知分別用線性插值和拋物線插值求的值。解 因為115在100和121之間,故取節點,相應地有,于是,由線性插值公式(2.3.5)可得故用線性插值求得的近似值為:同理,用拋物線插值公式(2.3.7)所求得的近似值為:將所得結果與的精確值相比較,可以看出拋物線插值的精確度較好。為了便于上機計算,我們常將拉格朗日插值多項式(2.3.4)改寫成公式(2.3.8)的對稱形式 (2.3.8)可用二重循環來完成值的計算,先通過內循環,即先固定,令從0到累乘求得 ,
10、然后再通過外循環,即令從0到,累加得出插值結果。2.3.3 插值余項在插值區間上用插值多項式近似代替,除了在插值節點上沒有誤差以外,在其他點上一般有誤差。若記則就是用近似代替時所產生的截斷誤差,稱為插值多項式的余項。關于插值多項式的誤差有定理2.3.1的估計式。定理2.3.1 設在區間上有直到階導數,為區間上個互異的節點,為滿足條件: 的次插值多項式,則對于任何有 (2.3.9)其中且依賴于。證明 由插值條件知,即插值節點都是的零點,故可設 (2.3.10)其中為待定函數。下面求,對區間上異于的任意一點作輔助函數:不難看出具有如下特點(1) (2.3.11)(2)在上有直到階導數,且 (2.3
11、.12)等式(2.3.11)表明在上至少有個互異的零點,根據羅爾(Rolle)定理,在的兩個零點之間,至少有一個零點,因此,在內至少有個互異的零點,對再應用羅爾定理,推得在內至少有個互異的零點。繼續上述討論,可推得在內至少有一個零點,若記為,則,于是由(2.3.12)式得將它代入(2.3.10)即得(2.3.9)。對于,(2.3.9)顯然成立。例2.3.2 在例2.3.1中分別用線性插值和拋物插值計算了近似值,試估計它們的截斷誤差。解 用線性插值求的近似值,其截斷誤差由插值余項公式(2.3.9)知現在,故當用拋物插值求的近似值時,其截斷誤差為將代入,即得2.3.4 插值誤差的事后估計法 在許多
12、情況下,要直接應用余項公式(2.3.9)來估計誤差是很困難的,下面將以線性插值為例,介紹另一種估計誤差的方法。設且為已知,若將用兩點做線性插值求得的近似值為,用兩點作線性插值所求得的近似值記為,則由余項公式(2.3.9)知:假設在區間中變化不大,將上面兩式相除,即得近似式即 (2.3.13)近似式(2.3.13)表明,可以通過兩個結果的偏差來估計插值誤差,這種直接利用計算結果來估計誤差的方法,稱為事后估計法。在例2.3.1中,用做節點,算得的近似值為,同樣,用做節點,可算得的另一近似值。通過(2.3.13)可以估計出插值的誤差為:2.4 求插值多項式的Newton法拉格朗日插值法通過求出拉格朗
13、日基函數而方便地表示插值多項式,但是當增加節點時,所有的基函數都需重新計算,因此其計算過程不具繼承性。由線性代數可知,任何一個不高于次的多項式,都可表示成函數的線性組合,即可將滿足插值條件 的次多項式寫成形式其中為待定系數。這種形式的插值多項式稱為牛頓Newton插值多項式,把它記成,即 (2.4.1)因此,牛頓插值多項式是插值多項式的另一種表示形式。在牛頓插值多項式中要用到的差分與差商等概念,與數值計算的其它方面有著密切的關系。2.4.1 向前差分與Newton向前插值公式 設函數在等距節點處的函數值為已知,其中是正常數,稱為步長,稱兩個相鄰點和處函數值之差 為函數在點處以為步長的一階向前差
14、分簡稱一階差分,記,即于是,函數在各節點處的一階差分依次為又稱一階差分的差分為二階差分。一般地,定義函數在點處的階差分為:為了便于計算與應用,通常采用表格形式計算差分,如表2.4.1所示。表2.4.1 差分計算表在等距節點情況下,可以利用差分表示牛頓插值多項式2.4.1 的系數,并將所得公式加以簡化。事實上,由插值條件即可得。再由插值條件可得:由插值條件可得:一般地,由插值條件可得于是,滿足插值條件的插值多項式為:令,并注意到則牛頓插值多項式可簡化為 (2.4.2)這個用向前差分表示的插值多項式,稱為牛頓向前插值公式,簡稱前插公式。它適用于計算附近的函數值。由插值余項公式(2.3.9),可得前
15、插公式的余項為: (2.4.3)例2.4.1 從給定的正弦函數表出發計算,并估計截斷誤差。表2.4.2 的函數及差分表0.10.099830.098840.096850.093900.085210.09001-0.00199-0.00295-0.00389-0.00480-0.00091-0.00094-0.000940.20.198670.30.295520.40.389420.50.479430.60.56464解 因為0.12介于0.1與0.2之間,故取,此時,為求,構造差分表2.4.2。若用線性插值求的近似值,則由前插公式(2.4.2)立即可得用二次插值得:用三次插值得:因與很接近,且
16、由差分表2.4.2可以看出,三階差分接近于常數(即接近于零),故取作為的近似值,此時由余項公式(2.4.3)可知其截斷誤差為:2.4.2 向后差分與Newton(牛頓)向后插值公式在等距節點下,除了向前差分外,還可引入向后差分和中心差分,其定義和記號分別如下:在點處以為步長的一階向后差分和階向后差分分別為:在點處以為步長的一階中心差分和階中心差分分別為:其中,各階向后差分與中心差分的計算,可通過構造向后差分表與中心差分表來完成。利用向后差分,可簡化牛頓插值多項式(2.4.1),導出與牛頓前插公式(2.4.2)類似的公式。事實上,若將節點的排列次序看作,那么2.4.1)可寫成:根據插值條件得到用
17、向后差分表示的插值多項式: (2.4.4)其中t<0,插值多項式(2.4.4)稱為牛頓向后插值公式,簡稱后插公式。它適用于計算附近的函數值。由插值余項公式(2.3.9),可寫出后插公式的余項為: (2.4.5)例2.4.2 已知函數表如表2.4.2,計算,并估算其截斷誤差。解 因為0.58位于表尾附近,故用后插公式(2.4.4)計算的近似值。一般的,為了計算函數在處的各階向后差分,應構造向后差分表。但由向前差分與向后差分的定義可以看出,對同一函數表來說,構造出來的向后差分表與向前差分表在數據上完全相同。因此,表2.4.2中用下劃線標出的各數依次給出了在處的函數值和向后差分值。因三階向后差
18、分接近于常數,故用三次插值進行計算,且,于是由牛頓向后插值公式(2.4.4)得:因為在整個計算中,只用到四個點上的函數值,固由余項公式(2.4.5)知其截斷誤差為:2.4.3 差商與牛頓基本插值多項式 當插值節點非等距分布時,就不能用差分來簡化牛頓插值多項式,此時可用差商這個新概念來解決。設函數在一串互異的點上的值依次為稱函數值之差 與自變量之差的比值為函數關于 點的一階差商,記作例2.4.3 。稱一階差商的差為函數關于點的二階差商,記作。例2.4.4 。一般地,可通過函數的階差商定義的階差商如下:差商計算也可采用表格形式(稱為差商表)進行,如表2.4.3所示。表2.4.3 差商計算表 一階差
19、商 二階差商 三階差商 差商具有下列重要性質(證明略):(1)函數的階差商可由函數值的線性組合表示,且(2)差商具有對稱性,即任意調換節點的次序,不影響差商的值。例如(3)當在包含節點的某個區間上存在時,在 之間必有一點,使(4)在等距節點 情況下,可同時引入階差分與差商,且有下面關系:引入差商的概念后,可利用差商表示牛頓插值多項式(2.4.1)的系數。事實上,從插值條件出發,可以像確定前插公式中的系數那樣,逐步地確定(2.4.1)中的系數故滿足插值條件的次插值多項式為: (2.4.6)(2.4.6)稱為牛頓基本插值多項式,常用來計算非等距節點上的函數值。例2.4.5 試用牛頓基本差值多項式按
20、例1要求重新計算的近似值。解 先構造差商表一階差商二階差商100100.047619-0.000094121110.04347814412由上表可以看出牛頓基本插值多項式(2.4.6)中各系數依次為:故用線性插值所得的近似值為:用拋物插值所求得的近似值為:所得結果與例2.4.1一致。比較例2.4.1和例2.4.5的計算過程可以看出,與拉格朗日插值多項式相比較,牛頓插值多項式在增加節點時不需要重新計算前面的各項,只需在后面增加相應的項,即牛頓插值法具有很好的繼承性。由差值多項式的存在唯一性定理知,滿足同一組插值條件的拉格朗日多項式(2.3.4)與牛頓基本插值多項式(2.4.6)是同一多項式。因此
21、,余項公式(2.3.9)也適用于牛頓插值。但是在實際計算中,有時也用差商表示的余項公式: (2.4.7)來估計截斷誤差(證明略)注意 上式中的階差商與的值有關,故不能準確地計算出的精確值,只能對它做估計。例2.4.6 當四階差商變化不大時,可用近似代替2.5 求插值多項式的改進算法2.5.1 分段低次插值例2.3.2、例2.4.1表明適當地提高插值多項式的次數,有可能提高插值的精度。但是決不可由此得出結論,認為插值多項式的次數越高越好。例2.5.1 對函數先以為節點作五次插值多項式,再以為節點作十次插值多項式,并將曲線描繪在同一坐標系中,如圖2.5.1所示。可以看出,雖然在局部范圍中,例如在區
22、間中,比較好地逼近,但從整體上看,并非處處都比較好地逼近,尤其是在區間的端點附近。進一步的分析表明,當增大時,該函數在等距節點下的高次插值多項式 ,在兩端會發生激烈的振蕩。這種現象稱為龍格(Runge)現象。這表明,在大范圍內使用高次插值,逼近的效果可能不理想。另一方面,插值誤差除來自截斷誤差外,還來自初始數據的誤差和計算過程中的舍入誤差。插值次數越高,計算工作越大,積累誤差也可能越大。圖2.5.1 多次插值的比較圖因此,在實際計算中,常用分段低次插值進行計算,即把整個插值區間分成若干小區間,在每個小區間上進行低次插值。例2.5.2 當給定個點上的函數值后,若要計算點處函數的近似值,可先選取兩
23、個節點使,然后在小區間上作線性插值,即得 (2.5.1)這種分段低次插值叫分段線性插值。在幾何上就是用折線代替曲線,如圖2.5.2所示。故分段線性插值又稱折線插值。圖2.5.2 折線插值幾何直觀圖類似地,為求的近似值,也可選取距點最近的三個節點進行二次插值,即取 (2.5.2)這種分段低次插值叫分段二次插值。在幾何上就是用分段拋物線代替曲線,故分段二次插值又稱分段拋物插值。為了保證是距點最近的三個節點,(2.5.2)中的可通過下面方法確定:2.5.2 三次樣條插值分段低次插值雖然具有計算簡單、穩定性好、收斂性有保證且易在計算機上實現等優點,但它只能保證各小段曲線在連接點上的連續性,卻不能保證整
24、條曲線的光滑性,這就不能滿足某些工程技術上的要求。自六十年代開始,由于航空、造船等工程設計的需要而發展起來的所謂樣條(Spline)的插值方法,既保留了分段低次插值多項式的各種優點,又提高了插值函數的光滑性。今天,樣條插值方法已成為數值逼近的一個極其重要的分支,在許多領域里得到越來越廣泛的應用。本節介紹應用最廣泛且具有二階連續導數的三次樣條插值函數。三次樣條插值函數的定義對于給定的函數表其中,若函數滿足:(1)在每個子區間上是不高于三次的多項式;(2)在上連續;(3)滿足插值條件 ;則稱為函數關于節點的三次樣條插值函數。邊界條件問題的提出與類型單靠一張函數表是不能完全確定一個三次樣條插值函數的
25、。事實上,由條件(1)知,三次樣條插值函數是一個分段三次多項式,若用表示它在第個子區間上的表達式,則形如:這里有四個待定系數。子區間共有個,確定需要確定個待定系數。另一方面,要求分段三次多項式及其導數在整個插值區間上連續,只要在各子區間的端點連續即可。故由條件(2),(3)可得待定系數應滿足的個方程為: (2.5.3)由此可以看出,要確定個待定系數還缺少兩個條件,這兩個條件通常在插值區間的邊界點處給出,稱為邊界條件。邊界條件的類型很多,常見的有:(1)給定一階導數值,稱為第一種邊界條件;(2)給定二階導數值,稱為第二種邊界條件,特別地,稱為自然邊界條件,滿足自然邊界條件的三次樣條插值函數稱為自
26、然樣條插值函數。(3)當是周期為的函數時,則要求及其導數都是以為周期的函數,相應的邊界條件稱為第三種邊界條件或周期邊界條件:。三次樣條插值函數的求法 雖然可以利用方程組(2.5.3)和邊界條件求出所有待定系數,從而得到三次樣條插值函數在各個子區間的表達式。但是,這種做法的計算工作量大,不便于實際應用。下面介紹一種簡便的方法。設在節點處的二階導數為因為在子區間上是不高于三次的多項式,其二階導數必是線性函數(或常數)。于是,有記則有連續積分兩次得: (2.5.3)其中為積分常數。利用插值條件易得, 將它們代入(2.5.3),整理得 (2.5.4)綜合以上討論可知,只要確定,這個值,就可定出三次樣條
27、插值函數。為了求出,利用一階導函數在子區間連接點上連續的條件即 (2.5.5)得 (2.5.6)故 (2.5.7)將(2.5.6)中的改為,即得在子區間上的表達式,并由此得 (2.5.8)將(2.5.7)、(2.5.8)代入(2.5.5)整理后得兩邊同乘以,即得方程組若記 (2.5.9)則所得方程組可簡寫成即 (2.5.10)這是一個含有個未知數、個方程的線性方程組。要確定的值,還需用到邊界條件。在第(1)種邊界條件下,由于和已知,可以得到包含另外兩個線性方程。由(2.5.6)知,在子區間上的導數為:故由條件立即可得即 (2.5.11)同理,由條件,可得 (2.5.12)將(2.5.10)、(
28、2.5.11)、(2.5.12)合在一起,即得確定的線性方程組: (2.5.13)其中 (2.5.14)在第(2)種邊界條件下,由,已知,在方程組(2.5.14)中實際上只包含有個未知數,并且可以改寫成: (2.5.15)在第(3)種邊界條件下,由,直接可得 (2.5.16)由條件可得注意到和,上式整理后得:若記則所得方程可簡寫成: (2.5.17)將(2.5.10)(2.5.16)(2.5.17)合在一起,即得確定的線形方程組: (2.5.18)利用線性代數知識,可以證明方程組(2.5.13)、(2.5.15)及(2.5.18)的系數矩陣都是非奇異的,從而都有唯一確定的解。針對不同的邊界條件
29、,解相應的方程組(2.5.13)、(2.5.15)或(2.5.18),求出的值,將它們代入(2.5.4),就可以得到在各子區間上的表達式。綜上分析,有如下定理定理2.5.1 對于給定的函數表,滿足第一、第二和第三種邊界條件的三次樣條插值函數是存在且唯一的。三次樣條插值函數的求解過程在下面的例子中給出了詳細的說明。例2.5.3 已知函數的函數值如下-1.50120.125-119在區間上求三次樣條插值函數,使它滿足邊界條件:解 先根據給定數據和邊界條件算出,寫出確定的線性方程組。在本例中,給出的是第一種邊界條件,確定的線性方程組,形如(2.5.13)。由所給函數表知:于是由的算式(2.5.9)知
30、:由第一種邊界條件下與的計算公式(2.5.14)知:故確定與的方程組為: (2.5.19)解此方程組得到在各節點上的值為:,將代入(2.5.4),即得在各子區間上的表達式。由(2.5.4)知,在上的表達式為:在本例中,將代入,整理后得,同理可得:故所求三次樣條插值函數為:上述求三次樣條插值函數的方法,其基本思路和特點是:先利用一階導數在內節點上的連續性以及邊界條件,列出確定二階導數的線性方程組(在力學上稱為三彎矩方程組),并由此解出,然后用來表達。通過別的途徑也可求三次樣條插值函數。例如,可以先利用二階導數在內節點上的連續性以及邊界條件,列出確定一階導數的線性方程組(在力學上稱為三轉角方程組)
31、,并由此解出,然后用來表達。在有些情況下,這種表達方法與前者相比較,使用起來更方便。讀者可以參閱相關書籍,在此不贅述。2.6 求函數近似表達式的擬合法在科學實驗和生產實踐中,經常要從一組實驗數據出發,尋求函數的一個近似表達式(稱為經驗公式)。從幾何上,就是希望根據給出的個點,求曲線的一條近似曲線。這就是曲線擬合的問題。 多項式插值雖然在一定程度上解決了由函數表求函數的近似表達式問題,但用它來解決這里提出的問題,有明顯缺陷。 首先,實驗提供的數據通常帶有測試誤差。如要求近似曲線嚴格地通過所給的每個數據點,就會使曲線保持原有的測試誤差。當個別數據的誤差較大時,插值效果顯然是不理想的。 其次,由實驗
32、提供的數據往往較多(即較大),用插值法得到的近似表達式,明顯地缺乏實用價值。因此,怎樣從給定的一組數據出發,在某個函數類中尋求一個“最好”的函數來擬合這組數據,是一個值得討論的問題。 隨著擬合效果“好”、“壞”標準的不同,解決此類問題的方法也不同。這里介紹一種最常用的曲線擬合方法,即最小二乘法。2.6.1 曲線擬合的最小二乘法如前所述,在一般情況下,我們不能要求近似曲線嚴格地通過所有數據點,亦不能要求所有擬合曲線函數在處的偏差(亦稱殘差)都嚴格地趨于零。但是,為了使近似曲線盡量反映所給數據點的變化趨勢,要求都較小還是必要的。達到這一目標的途徑很多,常見的有:(1)選取,使偏差絕對值之和最小,即
33、 (2.6.1)(2)選取,使偏差最大,絕對值最小,即 (2.6.2)(3)選取,使偏差平方和最小,即 (2.6.3)為了方便計算、分析與應用,我們較多地根據“偏差平方和最小”的原則(稱為最小二乘原則)來選取擬合曲線。按最小二乘原則選擇擬合曲線的方法,稱為最小二乘法。本章要著重討論的線性最小二乘問題,其基本提法是:對于給定數據表要求在某個函數類(其中)中尋求一個函數 (2.6.4)使滿足條件 (2.6.5)式中,是函數類中任一函數。 滿足關系式(2.6.5)的函數,稱為上述最小二乘問題的最小二乘解 。由此可知,用最小二乘法解決實際問題包含兩個基本環節:先根據所給數據點的變化趨勢與問題的實際背景
34、確定函數類,即確定所具有的形式;然后按最小二乘法原則(2.6.3)求取最小二乘解,即確定其系數。 由最小二乘解(2.6.4)應滿足條件(2.6.5)知,點是多元函數的極小值點,從而滿足方程組:,即,亦即若對任意的函數和,引入記號 (2.6.6)則上述方程組可以表示成寫成矩陣形式即 (2.6.7)方程組(2.6.7)稱為法方程組。事實上,最小二乘法的法方程可以用下面的方法形成。在中,當時,令,即得方程組將其寫成矩陣形式令 ,則方程組可寫為將方程兩邊同時乘以,則可得到這就是最小二乘法的法方程(2.6.7)。當線性無關時,可以證明它有唯一解并且相應的函數(2.6.4)就是滿足條件(2.6.5)的最小
35、二乘解。定理2.6.1 對任意給定的一組實驗數據(其中互異),在函數類(線性無關)中,存在唯一的函數使得關系式(2.6.5)成立,并且其系數可以通過解方程組(2.6.7)得到。作為曲線擬合的一種常用的情況,若討論的是代數多項式擬合,即取,則由(2.6.6)知:故相應的法方程組為: (2.6.8)下面通過兩個具體的例子來說明用最小二乘法解決實際的問題的具體步驟與某些技巧。例2.6.1 某種鋁合金的含鋁量為,其熔解溫度為,由實驗測得與的數據如表2.6.1左邊三列。使用最小二乘法建立與之間的經驗公式。解 根據前面的討論,解決問題的過程如下: (1)將表中給出的數據點描繪在坐標紙上,如圖2.6.1所示
36、。 圖2.6.1 數據的散點圖(2)確定擬合曲線的形式。由圖2.6.1可以看出,六個點位于一條直線的附近,故可以選用線性函數(直線)來擬合這組實驗數據,即令 (2.6.9)其中為待定常數。(3)建立法方程組。由于問題歸結為一次多項式擬合問題,故由(2.6.8)知,相應的法方程組形如:經過計算(表2.6.1)即得確定待定系數的法方程組: (2.6.10)(4)解法方程組(2.6.10)得:代入(2.6.9)即得經驗公式: (2.6.11)表2.6.1 多項式擬合法方程系數計算表i136.91811361.616678.9246.71972180.899199.9363.72354057.6914
37、969.5477.82706052.8421006.0584.02837056.0023772.0687.52927656.2525550.0396.6145828365.28101176.3所得經驗公式能否較好地反映客觀規律,還需通過實踐來檢驗。由(2.6.11)式算出的函數值(稱為擬合值)與實際值有一定的偏差,見表2.6.2。由表2.6.2可以看出,偏差的平方和其平方根(稱為均方誤差)在一定程度上反映了所得經驗公式的好壞。同時,由表2.6.2還可以看出,最大偏差為 。表2.6.2 擬合偏差分析表i12345636.946.763.777.884.087.5177.78199.67237.6
38、4269.13282.98290.80181197235270283292-3.222.672.64-0.87-0.02-1.2010.377.136.970.760.00041.4426.6704 如果認為這樣的誤差是允許的話,就可以用經驗公式(2.6.11)來計算含鋁量在之間的溶解度。否則,就要用改變函數類型或者增加實驗數據等方法來建立新的經驗公式。例2.6.2 在某化學反應里,測得生成物的濃度與時間的數據見表2.6.3,試用最小二乘法建立與的經驗公式 。表2.6.3 相應時間的濃度數據表i123456784.006.408.008.809.229.509.709.869101112131
39、4151610.0010.2010.3210.4210.5010.5510.5810.60解 將已知數據點描述在坐標紙上,得散點圖2.6.2。圖2.6.2 數據的散點圖由圖2.6.2及問題的物理背景可以看出,擬合曲線應具下列特點: (1)曲線隨著的增加而上升,但上升速度由快到慢。(2)當時,反應還未開始,即;當時,趨于某一常數。故曲線應通過原點(或者當時以原點為極限點),且有一條水平漸近線。 具有上述特點的曲線很多。選用不同的數學模型,可以獲得不同的擬合曲線與經驗公式。 下面提供兩種方案:方案1 設想是雙曲線型的,并且具有形式 (2.6.12)此時,若直接按最小二乘法原則去確定參數和, 則問題
40、歸結為求二元函數 (2.6.13)的極小點,這將導致求解非線性方程組:給計算帶來了麻煩。可通過變量替換來將它轉化為關于待定參數的線性形函數。為此,將(2.6.12)改寫成于是,若引入新變量則(2.6.12)式就是同時,由題中所給數據表2.6.3可以算出新的數據表2.6.4。這樣,問題就歸結為:根據數據表2.6.4,求形如的最小二乘解。參照例2.6.1的做法,解方程組,即得。代入(2.6.12) ,即得經驗公式 (2.6.14)表2.6.4 算出數據表i123161.000000.500000.333330.062500.250000.156250.125000.09434方案2 設想具有指數形
41、式 (2.6.15)為了求參數和時,避免求解一個非線形方程組,對上式兩邊取對數,此時,若引入新變量并記,則上式就是又由表2.6.3可算出新的數據表2.6.5。表2.6.5 算出數據表i123161.000000.500000.333330.062501.386291.856302.079442.36085于是將問題歸為:根據數據表2.6.5,求形如的最小二乘解。參照方案1,寫出相應的法方程組并解之,即得于是故得另一個經驗公式 (2.6.16) 將兩個不同的經驗公式(2.6.14)和(2.6.16) 的均方誤差和最大偏差進行比較,見表2.6.6。從均方誤差與最大偏差這兩個不同角度看,后者均優于前
42、者。因此,在解決實際問題時,常常要經過反復分析,多次選擇,計算與比較,才能獲得好的數學模型。表 2.6.6 不同經驗公式的誤差比較表經驗公式均方誤差最大偏差(3.9)式(3.11) 式下面以常用的多項式擬合為例,說明最小二乘法在計算機上實現的步驟。設有一組實驗數據,今要用最小二乘法求一次多項式曲線來擬合這組數據。顯然,求的實質就是要確定其系數。 由前面討論可知,問題可歸結為建立和求解法方程組(2.6.8)。為了便于編制程序并減少工作量,引入矩陣則法方程組(2.6.8)的系數矩陣(用表示)和右端向量(用表示)分別為: 。2.6.2 加權最小二乘法在實際問題中測得的所有實驗數據,并不是總是等精度、
43、等地位的。顯然,對于精度較高或地位較重要(這應根據具體情況來判定)的那些數據,應當給予較大的權。在這種情況下,求給定數據的擬合曲線,就要采用加權最小二乘法。用加權最小二乘法進行曲線擬合的要求與原則:對于給定的一組實驗數據,要求在某個函數類中,尋求一個函數使其中為函數類中任一函數;是一列正數,稱為權,它的大小反映了數據地位的強弱。顯然,求的問題可歸結為求多元函數:的極小點。采用最小二乘解的求法,仍可得法方程組(2.6.7),但其中,。作為特例,如果選用的擬合曲線為,那么相應的法方程組為 (2.6.17)例2.6.3 已知一組實驗數據及權如表2.6.7。若與之間有線性關系,試用最小二乘法確定系數和
44、。表2.6.7 實驗數據表i1234142712124682112840解 因為擬合曲線為一次多項式曲線(直線),故相應的法方程組如(2.6.17)。將表中各已知數據代入,即得方程組解之得2.6.3 利用正交函數作最小二乘法擬合在前幾節,雖然從原則上解決了最小二乘意義下的曲線擬合問題,但在實際計算中,由于當較大,例如,法方程組往往是病態的,因而給求解工作帶來了一定困難。近年來,產生了許多解決這一困難的新方法。本節將簡要介紹利用正交函數作最小二乘擬合的基本原理,以及利用正交多項式擬合的一種行之有效的方法。 對于和權,若一組函數滿足條件: (2.6.18)則稱是關于點集帶權的正交函數族。特別,當都
45、是多項式時,就稱是關于點集 帶權的一組正交多項式。如果在提到正交函數或正交多項式時,沒有提到權,就意味著權都是1。若所考慮的函數類中的基函數是關于給定點集和權的正交函數族,則由條件(2.6.18)知,在法方程組(2.6.7)的系數矩陣中,非對角線上元素,此時法方程組簡化為: (2.6.19)只要由此解出就可得到最小二乘法解: (2.6.20)由條件(2.6.18) ,知,故易解方程組(2.6.19),且有: (2.6.21)這樣就避免了求解病態方程組。若函數類的基函數是關于給定點集和權的正交函數族,則可以直接由(2.6.21)式算出待定參數,進而寫出最小二乘解(2.6.20)。因此,問題歸結為
46、對給定的函數類,尋求一組由正交函數族組成的基函數的問題。構造正交函數組的方法很多。下面以多項式為例,介紹一種具體的方法。這種做法是以下述定理為基礎的。定理2.6.2 對于給定的點集和權利用遞推公式: (2.6.22) (2.6.23) (2.6.24)構造的函數族是關于點集和權的一組正交多項式,且是次多項式,其最高次項的系數為1。例2.6.4 已知一組實驗數據如表2.6.8,試用最小二乘法求一條二次擬合曲線。表2.6.8 實驗數據表i1234560.00.91.93.03.95.00.010.030.050.080.0110.0解 采用邊構造正交多項式邊求最小二乘解系數的順序來求擬合曲線。由公
47、式(2.6.22)及(2.6.21)立即可得:,由公式(2.6.23)、(2.6.22)及(2.6.21)依次可得:;由公式(2.6.23), (2.6.22)、 (2.6.24)及(2.6.21)依次可得:;故所求擬合曲線為:2.7 城市供水量預測的簡單方法2.7.1 供水量增長率估計與數值微分供水量的增長率就是供水量函數的導數,因此,要估計供水量的增長率就需要求出供水量函數的導數。用供水量近似函數的導數作為其導數的近似估計是自然的想法。作為多項式插值的應用,本節介紹兩種求函數導數近似值的方法。2.7.2 利用插值多項式求導數若函數在節點處的函數值已知,就可作的次插值多項式,并用近似代替,即
48、 (2.7.1)由于是多項式,容易求導數,故對應于的每一個插值多項式,就易建立一個數值微分公式,這樣建立起來的數值微分公式,統稱為插值型微分公式。必須注意,即使與的近似程度非常好,導數與 在某些點上的差別仍舊可能很大,因而,在應用數值微分公式時,要重視對誤差的分析。由插值余項公式(2.3.9)知 (2.7.2)由于式中是未知函數,故時,無法利用上式誤差作出估計。但是,如果我們限定求某個節點處的導數值,那么(2.7.2)右端第二項之值應為零,此時有若將它寫成帶余項的數值微分公式,即 (2.7.3)其中在之間。該式右端由兩部分,即導數的近似值和相應的截斷誤差組成。由(2.7.3),當時,插值節點為
49、,記,得帶余式的兩點公式 (2.7.4)前一公式的實質是用在處的向前差商作為的近似值,后一公式則是用在處的向后差商作為的近似值。 當且節點為時,由(2.7.3)可得帶余項的三點公式: (2.7.5)中間一個公式的實質是用在處的中心差商作為的近似值,它與前后兩公式相比較,其優越性是顯然的。 用插值多項式作為的近似函數,還可建立高階的數值微分公式。例2.7.1 帶余式的二階三點公式 (2.7.6)2.7.3 利用三次樣條插值函數求導由三次樣條插值函數知,對于給定函數表和適當的邊界條件,可以寫出三次樣條插值公式,并用近似代替,即,由于是一個分段三次多項式,在各子區間上容易求出導數,故可建立數值微分公式 (2.7.7) (2.7.8)利用函數在節點上的函數值和邊界條件,構造三次樣條插值公式,并用它來計算和在下列點:處的近似值。計算結果見表2.7.1。表2.7.1 近似值與準確值比較表近似值準確值-1.000.038460.0740.038460.07639-0.920.045130.093690.045130.09367-0.840.053650.12090.053650.1209-0.760.064760.15940.064770.1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息系統監理師2025年考前沖刺試題及答案
- 稀土金屬加工質量改進項目策劃與實施技巧考核試卷
- 微生物肥料在促進作物對養分脅迫適應性的生理響應研究考核試卷
- 釀造企業產品創新考核試卷
- 管理學與行政結合試題及答案
- 嵌入式系統開發的商業機遇試題及答案
- 行政組織的變革策略探討試題及答案
- 全面關注公路工程考試的發展趨勢試題及答案
- 信息系統監理師高級課程介紹試題及答案
- 嵌入式系統高效遠程控制試題及答案
- 市售紅花藥材質量評價研究 論文
- 腫瘤科運用PDCA循環提高疼痛評估的規范率品管圈成果匯報
- 管道安全檢查表
- 心理劇比賽點評金句
- 校園網站的設計與實現-畢業論文
- 石油石化職業技能鑒定操作試題集-輸氣工中級
- 辦公樓工程臨時用電專項施工方案
- GB/T 18705-2002裝飾用焊接不銹鋼管
- 課件 京劇傳統戲 課件-2022-2023學年高中音樂人音版(2019)必修音樂鑒賞
- 福克斯降級教程在這個界面這里可以看到
- 安全管理人員紅頭任命文件
評論
0/150
提交評論