




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
擬合與插值鄒戰勇廣東商學院數學與計算科學學院E-mail:yong_china@126.com1引言
在解決實際問題的生產(或工程)實踐和科學實驗過程中,通常需要通過研究某些變量之間的函數關系來幫助我們認識事物的內在規律和本質屬性,而這些變量之間的未知函數關系又常常隱含在從試驗、觀測得到的一組數據之中。因此,能否根據一組試驗觀測數據找到變量之間相對準確的函數關系就成為解決實際問題的關鍵。例如在工程實踐和科學實驗中,常常需要從一組試驗觀測數據之中找到自變量x與因變量y之間的函數關系,一般可用一個近似函數y=f(x)來表示。函數y=f(x)的產生辦法因觀測數據和要求不同而異,通常可采用數據擬合與函數插值兩種辦法來實現。21.擬合模型
對于情況較復雜的實際問題,可直接使用數據組建模,尋找簡單的因果變量之間的數量關系,從而對未知的情形作預報。這樣組建的模型為擬合模型。擬合模型的組建主要是處理好觀測數據的誤差,使用數學表達式從數量上近似因果變量之間的關系。擬合模型的組建是通過對有關變量的觀測數據的觀察、分析和選擇恰當的數學表達方式得到的,擬合模型組建的實質是數據擬合的精度和數學表達式簡化程度間的一個折中。折中方案的選擇將取決于實際問題的需要。
31.2擬合模型的分類1.2.1直線擬合
假設所給數據點i=1,2,……N的分布大致成一條直線,雖然我們并不要求所作的擬合直線嚴格地通過所有的數據點,但總希望它盡可能地從所給數據點附近通過,就是說,要求近似成立,i=1,2,……N。這里,數據點數目通常遠大于待定系數的數目即N>>2,因此,擬合直線的構造,本質上是個解超定方程組的代數問題。4設i=1,2,……N
表示按擬合直線求得的近似值,一般地說,它不同于實測值,兩者之差稱殘差。顯然,殘差的大小是衡量擬合好壞的重要標志,具體地說,我們可以采用下列三種準則:(1)使殘差的最大絕對值為最小:(2)使殘差的絕對值之和最小:(3)使殘差的平方和為最小:分析以上三種準則,(1)、(2)兩種提法比較自然,但由于含有絕對值運算不方便于實際應用,而基于(3)來選取擬合曲線的方法稱曲線擬合的最小二乘法。5
對于給定的數據點直線擬合問題可用數學語言描述如下:,求作一次式使總誤差最小。6
有時候所給出數據點用直線擬合不合適,這時可考慮用多項式擬合,而多項式擬合也是多項式運算的一個重要組成部分,在工程應用及科研工作中都得到了廣泛的應用。
用數學語言描述如下:
對于給定的一組數據,,尋求m次多項式()
使總誤差為最小。
1.2.2曲線擬合7
1.2.3分段擬合和觀察數據修勻
提高擬合多項式的次數不一定能改善逼近效果,實際計算時常用不同的低次多項式去擬合不同的分段,這種方法稱分段擬合。
設已給一批實測數據,由于實測方法、實驗環境等一些
外界因素的影響,不可避免地會產生隨機干擾和誤差。我們
自然希望根據數據分布的總趨勢去剔除觀察數據中的偶然誤
差,這就是所謂的數據修勻(或稱數據平滑)問題。81.3數學軟件Matlab求解
專用的擬合函數polyfit.
Polyfit(x,y,n)x,y為擬合數據,n為擬合多項式的階數。x-1-0.75-0.5-0.250250.50.751y-0.22090.32950.88261.43922.00032056453.13343.70614.2836例題:(1)給出下表數據,試用最小二乘法求一次和二次擬合多項式。9(2)如何預報人口的增長
人口的增長是當前世界上引起普遍關注的問題,并且我們會發現在不同的刊物預報同一時間的人口數字不相同,這顯然是由于用了不同的人口模型計算的結果。
例如:1949年—1994年我國人口數據資料如下:
年份xi1949195419591964196919741979198419891994人口數yi
5.46.06.77.08.19.19.810.311.311.8建模分析我國人口增長的規律,預報1999年我國人口數。10
介紹兩個簡單模型
模型一:假設:人口隨時間線性地增加11
擬合的精度:
Q=
ei^2=
(yi-a-bxi)^2,誤差平方和。模型:y=–1.93+0.146x 觀測值的模型:
yi=a+bxi+ei,i=1,…,n
模型:y=a+bx要使Q最小,可以算出:a=–1.93,b=0.14612
模型二:指數增長模型
用Matlab軟件計算得:
a=2.33,b=0.0179
即:13程序如下:
x=[1949195419591964196919741979198419891994];
y=[5.46.06.77.08.19.19.810.311.311.8];
a=polyfit(x,y,1);
x1=[1949:10:1994];
y1=a(2)+a(1)*x1;
b=polyfit(x,log(y),1);
y2=exp(b(2))*exp(b(1)*x1);
plot(x,y,'*')
holdon
plot(x1,y1,'--r')
holdon
plot(x1,y2,'-k')
legend('原曲線','模型一曲線','模型二曲線')14程序執行后得到下面圖形15結論的比較如下表:年份xi1949195419591964196919741979198419891994人口數yi5.466.778.19.19.810.311.311.8模型一值5.245.976.77.438.168.99.6210.3611.0911.82誤差0.160.030-0.43-0.060.20.18-0.060.01-0.02模型二值5.556.066.627.237.98.649.4410.3111.2612.31誤差-0.15-0.060.08-0.230.20.460.36-0.01-0.13-0.5116
人口的增長是受到很多因素(移民問題、人口的平均壽命、老齡化問題、性別比例問題、生育模式問題等等)影響的,要使人口預報特別是長期預報更好地符合實際情況,必須考慮諸多方面的因素,進行修改模型。結果分析:模型I2005年13.43億,2010年14.16億Q1=0.2915<0.7437=Q2.線性模型更適合中國人口的增長。2.預報:1999年線性預報12.55億,指數預報13.43億
(1999年實際人口12.59億)3.人口白皮書:2005年13.3億,2010年14億模型II2005年14.94億,2010年16.33億172、插值(多項式插值、代數插值)當數據量不夠,需要補充,且認定已有數據可信時,通常利用函數插值方法。2.1插值與插值函數已知由
(可能未知或非常復雜)產生的一批離散數據
,且n個互異插值節點
,在插值區間內尋找一個相對簡單的函數,使其滿足下列插值條件:
再利用已求得的計算任一非插值節點的近值
,這就是插值。其中稱為插值函數,稱為被插函數。
18實際問題當中碰到的函數是各種各樣的,有的表達式很復雜,有的甚至給不出數學的式子,只提供了一些離散數據,例如,某些點上的函數值和導數值。由于問題的復雜性,直接研究函數可能很困難。面對這樣的情況,一個很自然的想法是,設法將所考察的函數“簡單化”,就是說,構造某個簡單函數作為的近似,然后通過處理獲得關于的結果。如果要求近似函數取給定的離散數據,則稱之為的插值的函數。192.2插值方法選用不同類型的插值函數,逼近的效果就不同,一般有:拉格朗日插值(lagrange插值)、牛頓插值(Newton)、分段線性插值、埃爾米特插值(Hermite插值)及(三次)樣條插值等等。2.2.1拉格朗日(Lagrange)插值求作n次多項式,使滿足條件這就是Lagrange插值。點稱為插值節點。用幾何語言來表述這類插值,就是通過曲線上給定的n+1個點,求作一條n次代數曲線作為的近似。20例題:給出下面的數值表,用Larange插值計算的近似值。
x0.40.50.60.70.8y-0.91629-0.69315-0.51083-0.35668-0.22314在Matlab命令窗口中輸入:x=[0.4:0.1:0.8];y=[-0.916291-0.693147-0.510826-0.356675-0.223144];lagrange(x,y,0.54)ans=-0.6161說明:同“精確解”比較起來,誤差還是可以接受的,特別是在工程應用中。21Lagrange插值會發生Runge現象上面根據區間[a,b]上給出的節點做插值函數近似值,一般總認為的次數越高逼近的精度越好,但是事實并非如此,下面給出了一個等距節點插值多項式不收斂的例子。給出函數為,它在區間[-5,5]上各導數存在,但是在此區間上取n個節點構造的Lagrange插值多項式在全區間內并非都收斂的,而且分散得很厲害。看如下例子:22例題取n,用Lagrange插值進行插值計算。在Matlab命令窗口中輸入:x=[-5:1:5];y=1./(1+x.^2);x0=[-5:0.1:5];y0=lagrange(x,y,x0);y1=1./(1+x0.^2);plot(x0,y0,'--r')holdonplot(x0,y1,'-b')legend('拉格朗日插值曲線,'原曲線')y2=interp1(x,y,x0);plot(x0,y2,'*m')legend('拉格朗日插值曲線','原曲線','分段插值曲線')23Runge現象的產生24一維線性插值解決Runge現象發生25用分段線性插值可能有時精度要差一些,但是不會出現不收斂的現象,這在實際計算中很重要,因此分段線性插值在實際科研和工程計算中應用也是很廣泛的。2.2.2分段線性插值
作分段線性插值的目的在于克服Lagrange插值方法可能發生的不收斂性缺點。所謂分段線性插值就是利用每兩個相鄰插值節點作線性插值,即可得如下分段線性插值函數:其中
26特點:插值函數序列具有一致收斂性,克服了高次Lagrange插值方法的缺點,故可通過增加插值節點的方法提高其插值精度。但存在于節點處不光滑、插值精度低的缺點。所謂分段線性插值就是通過插值點用折線段連接起來逼近原曲線,這也是計算機繪制圖形的基本原理。Matlab實現:實現分段線性插值不需要編制函數程序,它自身提供了內部的功能函數interp1(一維插值)interp2(二維)interp3(三維)interpn(n維)
對節點(x,y)插值,求插值點的函數值。x節點向量值,y對應的節點函數值。如果y矩陣,則插值對y每一列進行,若y和y1的長度值超出x或xi的長度,則返回NaN.27method指定插值的算法,默認為線性算法。其值可為:‘nearest’線性最近項插值‘linear’線性插值‘spline’立方樣條插值‘cubic’立方插值2.2.3Hermite插值不少實際問題中不但要求在節點上函數值相等,而且還要求它的導數值也相等,甚至要求高階導數值也相等,滿足這一要求的插值多項式就是Hermite插值多項式。282.2.4三次樣條插值
三次樣條插值的目的在于克服Lagrange插值的不收斂性和提高分段線性插值函數在節點處的光滑性。所謂三次樣條插值方法就是在滿足下列條件:
a.
b.在每個子區間上是三次多項式的三次樣條函數中尋找滿足如下插值條件:
一半形如等邊界條件的插值函數的方法。29以函數,為例,用三種不同的插值方法進行比較。程序如下:x=[-5:1:5];y=1./(1+x.^2);x0=[-5:0.1:5];y0=lagrange(x,y,x0);y1=1./(1+x0.^2);y2=interp1(x,y,x0,'spline');y3=interp1(x,y,x0);plot(x0,y1,'-b',x0,y0,'--r',x0,y2,'xk',x0,y3,'-y');legend(‘原曲線’,‘拉格朗日插值曲線’,‘三次樣條插值曲線’,‘分段線性插值曲線')30圖形如下:31
上面介紹的分段線性插值,其總體光滑程度不夠。在數學上,光滑程度的定量描述是函數(曲線)的k階導數存在且連續,則稱該曲線具有k階光滑性。自然,階數越高光滑程度越好。分段線性插值具有零階光滑性,也就是不光滑;分段三次埃爾米特插值具有一階光滑性。三次樣條插值就是較低次數的多項式而達到較高階光滑性的方法。32問題1:已知某湖泊的地圖邊界的測量數據如下表,計算此湖泊面積?
x(km)257.59152028.53033.540y(km)22222527403030343634y(km)2230355010099110110115117x(km)44.55056.5606168.576.580.59496y(km)4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 評論化學教學課件
- 老舍《貓》教學課件
- 城郊荒地改造方案(3篇)
- 建筑圍墻銷售方案(3篇)
- 水池應急處理方案(3篇)
- 木材大棚搭建方案(3篇)
- 巢湖學院《中國古代文獻學》2023-2024學年第二學期期末試卷
- 浙江舟山群島新區旅游與健康職業學院《有機結構分析》2023-2024學年第二學期期末試卷
- 黑龍江三江美術職業學院《音樂心理學》2023-2024學年第二學期期末試卷
- 車位開盤規劃方案(3篇)
- 材料力學知到智慧樹期末考試答案題庫2025年遼寧工程技術大學
- 敦煌文化介紹課件
- 2025貴州中考:歷史必考知識點
- 肝硬化門靜脈高壓癥食管、胃底靜脈曲張破裂出血診治專家共識2025解讀
- 2025年重癥醫學科ICU護理標準化建設計劃
- 公司掛名法人免責協議書
- 2025年南通市通大全過程工程咨詢有限公司招聘筆試參考題庫附帶答案詳解
- 玉石國際貿易買賣合同8篇
- GB 45549-2025石墨和螢石單位產品能源消耗限額
- 建筑合同變更補充協議
- SL631水利水電工程單元工程施工質量驗收標準第4部分:堤防與河道整治工程
評論
0/150
提交評論