數學建模舉例_第1頁
數學建模舉例_第2頁
數學建模舉例_第3頁
數學建模舉例_第4頁
數學建模舉例_第5頁
已閱讀5頁,還剩13頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、10.1牙膏的銷售量某大型牙膏制造企業為了更好地拓展產品市場,有效地管理庫存,公司董事會要求銷售部門根據市場調查,找出公司生產的牙膏銷售量與銷售價格、廣告投入等之間的關系,從而預測出在不同價格和廣告費用下的銷售量。為此,銷售部的研究人員收集了過去30個銷售周期(每個銷售周期為4周)公司生產的牙膏的銷售量、銷售價格、投入的廣告費用,以及同期其它廠家生產的同類牙膏的市場平均銷售價格,見表1-1(其中價格差指其它廠家平均價格與公司銷售價格之差)。試根據這些數據建立一個數學模型,分析牙膏銷售量與其它因素的關系,為制訂價格策略和廣告投入策略提供數量依據表1-1 牙膏銷售量與銷售價格、廣告費用等

2、數據銷售周期公司銷售價格(元)其他廠家平均價格(元)價格差(元)廣告費用(百萬元)銷售量(百萬支)13.853.80-0.055.57.3823.754.000.256.758.5133.704.300.607.259.5243.603.700.005.507.5053.603.850.257.009.3363.63.800.206.508.2873.63.750.156.758.7583.83.850.055.257.8793.83.65-0.155.257.10103.854.000.156.008.00113.904.100.206.507.89123.904.000.106.258.1

3、5133.704.100.407.009.10143.754.200.456.908.86153.754.100.356.808.90163.804.100.306.808.87173.704.200.507.109.26183.804.300.507.009.00193.704.100.406.808.75203.803.75-0.056.507.95213.803.75-0.056.257.65223.753.65-0.106.007.27233.703.900.206.508.00243.553.650.107.008.50253.604.100.506.808.75263.704.25

4、0.606.809.21273.753.65-0.056.508.27283.753.750.005.757.67293.803.850.055.807.93303.704.250.556.809.26一、 問題重述根據過去30個銷售周期(每個銷售周期為4周)公司生產的牙膏的銷售量、銷售價格、投入的廣告費用,以及同期其它廠家生產的同類牙膏的市場平均銷售價格,見表1-1。根據這些數據建立一個數學模型,分析牙膏銷售量與其它因素的關系,為制訂價格策略和廣告投入策略提供數量依據二、 問題分析由于牙膏是生活必需品,對大多屬顧客來說,在購買同類產品的牙膏是更多地會在意不同品牌之間的價格差異,而不是它們的價

5、格本身。因此,在研究各個因素對銷量的影響時,用價格差代替公司銷售價格和其他廠家平均價格更為合適。三、 模型假設1. 畫出牙膏銷售量與價格差,公司投入的廣告費用的散點圖2. 由散點圖確定兩個函數模型,再由這兩個函數模型解出回歸模型3. 對模型進行改進,添加新的條件確定更好的回歸模型系數,得到新的回歸模型4. 對模型進一步改進,確定最終的模型四、 符號約定牙膏銷售量為y,其他廠家平均價格和公司銷售價格之差(價格差)為x1,公司投入的廣告費用為x2,其他廠家平均價格和公司銷售價格分別為x3和x4,x1=x3-x4。基于上面的分析,我們僅利用1x和2x來建立y的預測模型。五、 模型的建立和求解1. 基

6、本模型利用表1-1的數據用matlab作出y與x1的散點圖(圖1-1),y與x2的散點圖(圖1-2)代碼如下:x1=-0.05 0.25 0.6 0 0.25 0.2 0.15 0.05 -0.15 0.15 0.2 0.1 0.4 0.45 0.35 0.3 0.5 0.5 0.4 -0.05 -0.05 -0.1 0.2 0.1 0.5 0.6 -0.05 0 0.05 0.55;x2=5.5 6.75 7.25 5.5 7 6.5 6.75 5.25 5.25 6 6.5 6.25 7 6.9 6.8 6.8 7.1 7 6.8 6.5 6.25 6 6.5 7 6.8 6.8 6.5

7、5.75 5.8 6.8;y=7.38 8.51 9.52 7.5 9.33 8.28 8.75 7.87 7.1 8 7.89 8.15 9.1 8.86 8.9 8.87 9.26 9 8.75 7.95 7.65 7.27 8 8.5 8.75 9.21 8.27 7.67 7.93 9.26;A1=polyfit(x1,y,1);yy1=polyval(A1,x1);A2=polyfit(x2,y,2);x5=5:0.05:7.25;yy2=polyval(A2,x5);subplot(1,2,1);plot(x1,y,'o',x1,yy1);title('圖1

8、 y對x1的散點圖');subplot(1,2,2);plot(x2,y,'o',x5,yy2);title('圖2 y對x2的散點圖');圖(1-1)與圖(1-2)從圖1可以發現,隨著1x的增加,y的值有比較明顯的線性增長趨勢,圖中的直線是用線性模型:(1)擬合的(其中是隨機誤差)。而在圖2中,當x2增大時,y有向上彎曲增加的趨勢,圖中的曲線是用二次函數模型:(2)綜合上面的分析,結合模型(1)和(2)建立如下的回歸模型:(3)(3)式右端的x1和x2稱為回歸變量(自變量),是給定價格差x1,廣告費用x2時,牙膏銷售量y的平均值,其中的參數稱為回歸系數

9、,由表1-1的數據估計,影響y的其他因素作用都包含在隨機誤差中。如果模型選擇合適,應該大致服從值為0的正態分布。2. 模型求解在剛剛運行的代碼后面,繼續使用regress工具求解,代碼為:x6=ones(30,1) x1' x2' (x2.2)'b,bint,r,rint,stats=regress(y',x6,0.05)運行結果如圖(1-3)得到模型(3)的回歸系數估計值及其置信區間(置信水平=0.05)、檢驗統計量,F,p,得結果見表1-2,參數參數估計值參數置信區間17.32445.7282,28.92061.30700.6829,1.9311-3.695

10、6-7.4989,0.10770.34860.0379,0.6594=0.9054 F=82.9409 p<0.0001 =0.0490表1-2 模型(3)計算結果圖(1-3)3. 結果分析表1-2顯示,=0.9054指因變量y(銷售量)的90.54%可由模型決定,F值遠遠超過F檢驗的臨界值,P遠小于,因而模型(3)整體來看是可用的表1-2的回歸系數中的置信區間包含零點,表示回歸變量(對因變量y的影響)是不太顯著的,但由于是顯著的,我們仍將留在模型中4. 銷售量預測將回歸系數的估計值帶入模型(3),即可預測公司未來某個銷售周期牙膏的銷售量y,預測值記為,得到模型(3)的預測方程:(4)只

11、需要知道該銷售周期的價格差x1和投入的廣告費用x2,就可以計算預測值。5. 模型改進模型(3)中回歸變量x1和x2對因變量y的影響是相互獨立的,即牙膏銷售量y的均值與廣告費用x2的二次關系由回歸系數和確定,而不依賴于價格差x1,同樣的,y的均值與x1的線性關系由回歸系數確定,而不依賴于x2。根據直覺和經驗可以猜想,x1和x2之間的交互作用會對y有影響,不妨簡單地用x1,x2的乘積代表它們的相互作用,于是將模型(3)增加一項,得到:(5)在這個模型中,y的均值與2x的二次關系為,由系數確定,并依賴于價格差x1。在上述運行程序后繼續輸入代碼:x7=ones(30,1) x1' x2'

12、; (x2.2)' (x1.*x2)'b,bint,r,rint,stats=regress(y',x7,0.05);b,bint,stats結果見圖(1-4)圖(1-4)計算結果即為表1-3參數參數估計值參數置信區間29.113313.7013,44.525211.13421.9778,20.2906-7.6080-12.6932,-2.52280.67120.2538,1.0887-1.4777-2.8518,-0.1037=0.9209 F=72.7771 P<0.0001 =0.0426表1-3 模型(5)計算結果表3與表2的結果相比,有所提高,說明模型(

13、5)比模型(3)有所進步。并且,所有參數的置信區間,特別是X1,X2的交互作用項X1X2的系數的置信區間不包含零點,所以有理由相信模型(5)比模型(3)更符合實際。在保持廣告費用x2=6.5百萬元不變的條件下,分別對模型(3)和(5)中牙膏銷售量的均值 與價格差x1的關系作圖,見圖1-5和圖1-6,代碼為:yy3=17.3244+1.307*x1+(-3.6956)*6.5+0.3486*6.5*6.5;plot(x1,yy3);grid onfigure(2)yy4=29.1133+11.1342*x1+(-7.608*6.5)+0.6712*6.5*6.5+(-1.4777)*6.5*x1

14、;plot(x1,yy4);grid on圖1-5圖1-6在保持價格差x1=0.2元不變的條件下,分別對模型(3)和(5)中牙膏銷售量的均值與廣告費用x2的關系作圖,見圖1-7和圖1-8,代碼如下:figure(3)yy5=17.3244+1.307*0.2+(-3.6956)*x2+0.3486*x2.*x2;bb=polyfit(x2,yy5,2);xx5=5.25:0.05:7.25;yy51=polyval(bb,xx5);plot(xx5,yy51);grid on;figure(4)yy6=29.1133+11.1342*0.2+(-7.608*x2)+0.6712*x2.*x2+

15、(-1.4777)*x2*0.2;bb=polyfit(x2,yy6,2);xx6=5.25:0.05:7.25;yy61=polyval(bb,xx6);plot(xx6,yy61);grid on;圖1-7圖1-86. 模型的進一步改進完全二次多項式模型:與1x和2x的完全二次多項式模型 (6)相比,模型(5)只少項,我們不妨增加這一項,建立模型(10)。這樣做的好處之一是MATLAB統計工具箱有直接的命令rstool求解,并且以交互式畫面給出y的估計值和預測空間。代碼為:x=x1' x2'rstool(x,y','quadratic')結

16、果為圖1-9圖1-9點擊Export,可以得到模型(6)的回歸系數估計值為 =( )=(32.0984,14.7436,-8.6367,-2.1038,1.1074,0.7594)所以回歸模型為:Y=32.0984+14.7436*x1-8.6367*x2-2.1038*x1*x2+1.1074+0.759410.2軟件開發人員的薪金一家技術公司人事部門欲建立模型研究薪金與資歷、管理責任、教育程度的關系,分析人事策略的合理性,作為新聘用人員薪金的參考。為此,研究人員收集了46名軟件開發人員的檔案資料,如表2-1,其中資歷一列指從事專業工作的年數,管理一列中1表示管理人員,0表示非管理人員,教育

17、一列中1表示中學程度,2表示大學程度,3表示更高程度(研究生)表2-1 軟件開發人員的薪金與資歷、管理責任、教育程度的關系編號薪金資歷管理教育0113876111021160810303187011130411283102051176710306208722120711772202081053520109121952031012313302111497531112213713121319800313141141740115202634131613231403171288440218132455021913677503201596551121123666012221352613231383960

18、22422884612251697871126148038022717404811282218481329135488013014467100131159421002322317410133323780101234254101112351486111013616882120237241701213381599013013926330131240179491402412568515134227837161243188381602441748316014519207170246193642001一、 問題重述研究人員收集了46名軟件開發人員的檔案資料,以這資料建立模型研究薪金與資歷、管理責任、教育

19、程度的關系,分析人事策略的合理性,作為新聘用人員薪金的參考二、 問題分析按照常識,薪金自然隨著資歷(年)的增長而增加,管理人員的薪金應高于非管理人員,教育程度越高薪金也越高三、 模型假設1. 建立薪金與資歷,管理責任,教育程度之間的多元線性回歸模型2. 利用matlab的統計工具箱計算回歸系數及置信區間3. 在上述模型中增加管理與教育的交互項,建立新的回歸模型4. 利用matlab的統計工具箱計算回歸系數及置信區間并與上面結果比較得出結論四、 符號約定對于問題,在符合題意并且與實際情況較吻合的情況下,薪金記作y,資歷(年)記作x1,為了表示是否非管理人員,定義x2=1,管理人員 &0,

20、 其它 ,為了表示3種教育程度,定義x3=1,中學 &0, 其它 ,x4=1,大學 &0, 其它 ,這樣,中學用x3=1,x4=0來表示,大學用x3=0,x4=1表示,研究生則用x3=0,x4=0表示。五、 模型的建立與求解1. 基本模型根據假設,薪金y與資歷x1,管理責任x2,教育程度x3,x4之間的多元線性回歸方程為:y=a0+a1x1+a2x2+a3x3+a4x4+ (1)2. 模型求解直接利用matlab統計工具箱中的命令regress求解回歸系數估計值及其置信區間(置信水平=0.05)、檢驗統計量,F,p,代碼為:x1=1 1 1 1&#

21、160;1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 1

22、7 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1&#

23、160;1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 

24、1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1

25、60;0 1 0 0 1 1 0 1 1 0 1 0'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 159

26、65 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19346'x0=ones

27、(46,1); x=x0 x1 x2 x3 x4;b,bint,r,rint,stats=regress(y,x,0.05);x0=ones(46,1); x=x0 x1 x2 x3 x4;b,bint,r,rint,stats=regress(y,x,0.05);b=vpa(b,8)bint=vpa(bint,8)stats=vpa(stats,8)結果如圖2-1圖(2-1)即模型(1)的計算結果是表2-2參數參數估計值參數置信區間a01103210258,11807a1546484,608a

28、268836248,7517a3-2994-3826,-2162a4148-636,931=0.957 F=226 p<0.0001 =1.057*106表2-2 模型(1)計算結果3. 結果分析 從表2-2知=0.975,即因變量(薪金)的95.7%可由模型確定,F值遠遠超過F的檢驗的臨界值,p遠小于,因而模型(1)從整體來看是可用的。比如,利用模型可以估計(或預測)一個大學畢業,有2年資歷,費管理人員的薪金為: y1=a0+a1*x1+a2*x2+a3*x3+a4*x4+=12272   模型中各個回歸系數的含義可初步解釋如下:x1的系數為54

29、6,說明資歷增加1年薪金增長546 ;x2的系數為6883,說明管理人員薪金多6883 ;x3的系數為-2994,說明中學程度薪金比更高的少2994 ;x4的系數為148,說明大學程度薪金比更高的多148 ,但是應該注意到a4置信區間包含零點,說明這個系數的解釋不可靠的。 需要指出,以上解釋是就平均值來說,并且,一個因素改變引起的因變量的變化量,都是在其他因素不變的條件下成立的。4. 進一步的討論a4的置信區間包含零點,說明基本模型(1)存在缺點。為了尋找改進的方向,常用殘差分析方法(殘差指薪金的實際值y與用模型估計的薪金y1之差,是模型(1)

30、中隨機誤差的估計值,這里用了一個符號)。我們將影響因素分成資歷與管理-教育組合兩類,管理-教育組合的定義如表三:組合123456管理010101教育112233表2-3 管理-教育組合 為了對殘差進行分析,下面用matlab繪圖,代碼為:x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1 3 6 4 4 1 3 6 1 4 3 6 4 3 1 3 1'b,bint,r,rint,stats=regress(y,x,0.05);subplot(2,2,1);plot(x1,r,'r+');

31、title('模型(1)隨機誤差與x1的關系');subplot(2,2,2);plot(x5,r,'b+');title('模型(1)隨機誤差與x2-x3,x4組合間的關系');結果如圖2-2圖(2-2)從圖1看,殘差大概分成3個水平,這是由于6種管理教育組合混合在一起,在模型中未被正確反映的結果,、;從圖2看,對于前4個管理教育組合,殘差或者全為正,或者全為負,也表明管理教育組合在模型中處理不當。 在模型(1)中國管理責任和教育程度是分別起作用的,事實上,二者可能起著交互作用,如大學程度的管理人員的薪金會比二者分別的薪金制和高一點。

32、 以上分析提醒我們,應在基本模型(1)中增加管理x2與教育x3,x4的交互項,建立新的回歸模型。5. 更好的模型增加x2與x3,x4的交互項后,模型記作y=a0+a1*x1+a2*x2+a3*x3+a4*x4+a5*x2*x3+a6*x3*x2+(2)輸入代碼:x0=ones(46,1);x=x0 x1 x2 x3 x4 x2.*x3 x2.*x4;b,bint,r,rint,stats=regress(y,x,0.05);b=vpa(b,8)bint=vpa(bint,8)stats=vpa(stats,8) 運

33、行結果如圖2-3圖(2-3)即模型(2)的計算結果是表2-4參數參數估計值參數置信區間a01120411044,11363a1497486,508a270486841,7255a3-1727-1939,7255a4-348-545,-152a5-3071-3372,-2769a618361571,2101=0.9988 F=5545 P<0.0001 =3.0047*104表2-4 模型(2)計算結果由表四可知,模型(2)的和F值都比模型(1)有所改進,并且所有回歸系數的置信區間都不含零點,表明模型(2)是完全可用的。再與模型(1)類似,做殘差分析圖,程序為:subplot(2,2,1)

34、;plot(x1,r,'r+');title('模型(2)隨機誤差與x1的關系');subplot(2,2,2);plot(x5,r,'b+');title('模型(2)隨機誤差與x2-x3,x4組合間的關系');結果為圖2-4圖(2-4)如圖可以看出,已經消除了圖2-2中的不正常現象,這也說明了模型(2)的適用性。6. 去掉異常數據,進一步優化模型:圖2-4中還可以發現一些異常點:具有10年資歷,大學程度的管理人員(從表2-1中可以查出是33號),他的實際薪資明顯低于模型的預估值,也明顯低于與他有類似經歷的其他人的薪金,這可能是

35、由于我們未知的原因造成的,為了使個別的數據不致影響整個模型,應將這個異常數據去掉,對模型(2)重新估計回歸系數得到結果如表2-5參數參數估計值參數置信區間a01120011139,11261a1498494,503a270416962,7120a3-1737-1818,-1656a4-356-431,-281a5-3056-3171,-2942a619971894,2100=0.9988 F=36701P<0.0001 =4.347*103表2-5 模型(2)去掉異常數據后的計算結果殘差分析圖代碼為:x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6

36、 6 6 6 7 8 8 8 8 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 0 0 1 0 1 0 1 1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 0 1 0 0 1 1 0 1 1 0 1 0'x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論