數據分析建模方法課件_第1頁
數據分析建模方法課件_第2頁
數據分析建模方法課件_第3頁
數據分析建模方法課件_第4頁
數據分析建模方法課件_第5頁
已閱讀5頁,還剩37頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章數據分析建模方法(下)*在建立數學模型的過程中,經常需要建立變量之間的關系.*由于對研究對象的內部機理不甚了解,不能通過合理的假設,或根據物理定律、原理,經過機理分析法而得到.問題解決思路第七章數據分析建模方法(下)*在建立數學模型的過程1*選擇適當的數學式對變量間的關系進行擬合.*通過對數據充分觀察和分析,獲得數據所含信息;*揭示變量間的內在聯系;xoy*借助于由實驗或測量得到的一批離散數據.*選擇適當的數學式對變量間的關系進行擬合.*通過對數據充分觀2兩類變量關系

確定性關系確定的函數關系相關關系存在相依關系,但未達到相互確定的程度.兩類數據已知規律(函數)的測試數據(在特定時間點或距離上的數據)呈現隨機性的數據,可看成具有某種概率分布的隨機樣本值.兩類變量關系確定性關系確定的函數關系相關關系存在相依3針對兩種不同類型的數據,有不同的建立模型方法:1.

數據擬合法(適用于第一類數據)基本思想

已知函數y=f(x)的一組測試數據(xi,

yi),(i=1,2,…,n),尋求一個函數ψ(x),使ψ(x)對上述測試數據的誤差較小,即ψ(xi)≈yi,于是可以用ψ(x)來近似替代f(x).常用的數據擬合方法:一般插值法、最小二乘法、樣條函數光順法等.針對兩種不同類型的數據,有不同的建立模型方法:1.4插值法的基本思想

尋找

f(x)的近似替代函數φ(x),在插值節點xi上滿足

φ(xi)=yi,(i=1,2,…,n),其余點用φ(x)近似替代f(x),稱φ(x)為f(x)的插值函數.插值法的基本思想尋找f(x)的近似替代函數其余5最小二乘法基本思想尋找f(x)的近似替代函數φ(x),使2.隨機分析方法對于隨機數據進行擬合,可用統計學中的回歸分析方法或時間序列分析方法.二.經驗模型的建立

以上兩種建模方法都是建立在對數據進行充分分析的基礎上.最小二乘法基本思想尋找f(x)的近似替代2.6

尋找或選擇適當的函數擬合變量之間的關系(函數關系或回歸關系)是重要的環節.一般步驟1)繪制數據散布圖;

2)分析數據散布圖;

3)選擇函數關系形式.

1)

通過分析數據散布圖可以獲得對變量間關系的感性認識,形成初步的看法,以便于對問題做進一步的分析.見p156尋找或選擇適當的函數擬合變量之間的關系一般步驟1)繪7氮施肥量N

-土豆產量數據散布圖氮施肥量N-土豆產量數據散布圖8磷施肥量

-土豆產量數據散布圖磷施肥量-土豆產量數據散布圖92)分析數據散布圖;

對數據散布圖進行分析,可以分析出變量的關系是:1)線性的還是非線性的?2)有無周期性?3)呈現何種變化趨勢?變化率如何?…,等等有用的初步結論.2)分析數據散布圖;對數據散布圖進行分析,可以分析出10例1建立一個簡潔的函數關系式來描述某個地區人的身高和體重的對應關系,數據見表7.4(p156).曲線特征是體重W隨身高H的增長而單調增長,但可以觀察到是非線性增長.身高-體重數據散布圖例1建立一個簡潔的函數關系式來描述曲線特征11練習試分析以下問題1.氮施肥量N、磷施肥量P關于土豆產量的數據散布圖(P153例7.1.1).2.海浪潮高度x

隨時間t

的數據散布圖.練習試分析以下問題1.氮施肥量N、磷施肥量P關于123)選擇函數關系形式

1.形式盡可能簡潔,盡可能線性化;原則2.依據實際問題的精度要求,合乎實際規律.

續例7.2.1

選擇冪函數W=,描述身高體重關系.優點

此函數可以線性化.兩邊取對數,有3)選擇函數關系形式1.形式盡可能簡潔,盡可能線性化;13

變換為線性函數

例7.2.2

可選二次函數

注:其中b0=y(0)=15.18.

描述氮肥施肥量與土豆產量間的變量關系.關于磷肥施肥量和土豆產量的變量關系可選擇威布爾模型:變換為線性函數例7.2.2可選二次函數注:其中14合理性?3.

y是單調升函數.

也可以選擇S

函數:

合理性?3.y是單調升函數.也可以選擇S函數:15S函數也滿足:

3.y是單調升函數;

哪個模型更好?分析S模型所含參數更少,另外若令可得線性模型S函數也滿足:3.y是單調升函數;哪個模型更好?16

重要定理(維爾斯脫拉斯)若函數f(x)在有限閉區間上連續,則存在一個多項式序列{Pn(x)}在有限閉區間[a,b]上一致收斂于f(x).稱f(x)在[a,b]上可由多項式函數逼近.

例6.2.3估計供水塔的水流量試用以下數據估計任意時刻(包括水泵正在輸水的時間內)從水塔流出的流量f(t),并估計一天的總用水量.重要定理(維爾斯脫拉斯)若函數f(x)在有限閉17時間(秒)水位(0.01英尺)時間(秒)水位(英尺)03175466363350331631104995332606635305453936316710619299457254308713937294760574301217921289264554292721240285068535284225223279571854276728543275275021269732284269779254水泵開動35932水泵開動82649水泵開動39332水泵開動859683475394353550899533397433183445923703340時間(秒)水位(0.01英尺)時間(秒)18某小鎮某天水塔水位散布圖

某小鎮某天水塔水位散布圖19思考為什么考慮用多項式函數?有什么優點?假設水位高度(或水塔的水容量)是連續變化的.可以選擇n次多項式Pn(x)來近似描述水位隨時間的變化規律.問題歸結為選擇足夠大的n及估計各個系數值.思考為什么考慮用多項式函數?有什么優點?假設水位20參見電子科技大學《概率統計》p228“非線性交調的頻率設計”問題.參見電子科技大學《概率統計》p228“非線性交調的頻率設計21第七章數據分析建模方法(下)*在建立數學模型的過程中,經常需要建立變量之間的關系.*由于對研究對象的內部機理不甚了解,不能通過合理的假設,或根據物理定律、原理,經過機理分析法而得到.問題解決思路第七章數據分析建模方法(下)*在建立數學模型的過程22*選擇適當的數學式對變量間的關系進行擬合.*通過對數據充分觀察和分析,獲得數據所含信息;*揭示變量間的內在聯系;xoy*借助于由實驗或測量得到的一批離散數據.*選擇適當的數學式對變量間的關系進行擬合.*通過對數據充分觀23兩類變量關系

確定性關系確定的函數關系相關關系存在相依關系,但未達到相互確定的程度.兩類數據已知規律(函數)的測試數據(在特定時間點或距離上的數據)呈現隨機性的數據,可看成具有某種概率分布的隨機樣本值.兩類變量關系確定性關系確定的函數關系相關關系存在相依24針對兩種不同類型的數據,有不同的建立模型方法:1.

數據擬合法(適用于第一類數據)基本思想

已知函數y=f(x)的一組測試數據(xi,

yi),(i=1,2,…,n),尋求一個函數ψ(x),使ψ(x)對上述測試數據的誤差較小,即ψ(xi)≈yi,于是可以用ψ(x)來近似替代f(x).常用的數據擬合方法:一般插值法、最小二乘法、樣條函數光順法等.針對兩種不同類型的數據,有不同的建立模型方法:1.25插值法的基本思想

尋找

f(x)的近似替代函數φ(x),在插值節點xi上滿足

φ(xi)=yi,(i=1,2,…,n),其余點用φ(x)近似替代f(x),稱φ(x)為f(x)的插值函數.插值法的基本思想尋找f(x)的近似替代函數其余26最小二乘法基本思想尋找f(x)的近似替代函數φ(x),使2.隨機分析方法對于隨機數據進行擬合,可用統計學中的回歸分析方法或時間序列分析方法.二.經驗模型的建立

以上兩種建模方法都是建立在對數據進行充分分析的基礎上.最小二乘法基本思想尋找f(x)的近似替代2.27

尋找或選擇適當的函數擬合變量之間的關系(函數關系或回歸關系)是重要的環節.一般步驟1)繪制數據散布圖;

2)分析數據散布圖;

3)選擇函數關系形式.

1)

通過分析數據散布圖可以獲得對變量間關系的感性認識,形成初步的看法,以便于對問題做進一步的分析.見p156尋找或選擇適當的函數擬合變量之間的關系一般步驟1)繪28氮施肥量N

-土豆產量數據散布圖氮施肥量N-土豆產量數據散布圖29磷施肥量

-土豆產量數據散布圖磷施肥量-土豆產量數據散布圖302)分析數據散布圖;

對數據散布圖進行分析,可以分析出變量的關系是:1)線性的還是非線性的?2)有無周期性?3)呈現何種變化趨勢?變化率如何?…,等等有用的初步結論.2)分析數據散布圖;對數據散布圖進行分析,可以分析出31例1建立一個簡潔的函數關系式來描述某個地區人的身高和體重的對應關系,數據見表7.4(p156).曲線特征是體重W隨身高H的增長而單調增長,但可以觀察到是非線性增長.身高-體重數據散布圖例1建立一個簡潔的函數關系式來描述曲線特征32練習試分析以下問題1.氮施肥量N、磷施肥量P關于土豆產量的數據散布圖(P153例7.1.1).2.海浪潮高度x

隨時間t

的數據散布圖.練習試分析以下問題1.氮施肥量N、磷施肥量P關于333)選擇函數關系形式

1.形式盡可能簡潔,盡可能線性化;原則2.依據實際問題的精度要求,合乎實際規律.

續例7.2.1

選擇冪函數W=,描述身高體重關系.優點

此函數可以線性化.兩邊取對數,有3)選擇函數關系形式1.形式盡可能簡潔,盡可能線性化;34

變換為線性函數

例7.2.2

可選二次函數

注:其中b0=y(0)=15.18.

描述氮肥施肥量與土豆產量間的變量關系.關于磷肥施肥量和土豆產量的變量關系可選擇威布爾模型:變換為線性函數例7.2.2可選二次函數注:其中35合理性?3.

y是單調升函數.

也可以選擇S

函數:

合理性?3.y是單調升函數.也可以選擇S函數:36S函數也滿足:

3.y是單調升函數;

哪個模型更好?分析S模型所含參數更少,另外若令可得線性模型S函數也滿足:3.y是單調升函數;哪個模型更好?37

重要定理(維爾斯脫拉斯)若函數f(x)在有限閉區間上連續,則存在一個多項式序列{Pn(x)}在有限閉區間[a,b]上一致收斂于f(x).稱f(x)在[a,b]上可由多項式函數逼近.

例6.2.3估計供水塔的水流量試用以下數據估計任意時刻(包括水泵正在輸水的時間內)從水塔流出的流量f(t),并估計一天的總用水量.重要定理(維爾斯脫拉斯)若函數f(x)在有限閉38時間(秒)水位(0.01英尺)時間(秒)水位(英尺)031754663633503316311049953326066353054539363167106192994572543087139372947605743012179212892645542927212402850

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論