




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
【原創】R語言股票回歸、時間序列分析報告論文附代碼數據【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第1頁。摘要:主要思路為了準確的估計股票價格,了解股票的一般規律,更好的為資本市場提供參考意見和幫助股民進行投資股票作出正確的決策,本文從股票價格指數與整個經濟環境角度出發,采用多元回歸分析方法,應用月度時間序列數據,通過選取綜合反映股票市場上所有公司股票價格整體水平的指標建立了線性回歸模型,得出了股票價格趨勢變動的影響因素.關鍵詞:回歸模型;指數模型;股票價格;預測一、引言主要思路為了準確的估計股票價格,本文從股票價格指數與整個經濟環境角度出發,采用多元回歸分析方法,應用月度時間序列數據建立了線性回歸模型,具體分析步驟:關系分析基于以上原理,為大致了解股票價格與諸因素之間的關系,先分別繪制股票價格與各個因素之間的散點圖,并分析它們之間的關系.股價用上證A股指數來表示,這樣可以減少人為因素對股票價格的影響,盡量將注意力集中在我們假設選用的自變量上.我們采用的數據是2012年和2015年上半年的月度數據,分析影響我國股市趨勢的因素。之所以選取2012年和2015年7月的統計資料是基于以下兩點考慮:中國股市發展時間較短,采用年度數據會因為樣本量太小而使得回歸分析失去意義;數據取得的存在較大難度,因季度數據不全而只能選取月度數據.因此選取2012年和2015年7月份月度數據作為樣本.指數平滑時間序列預測模型選擇多項式回歸模型3.1變量選取通過向前向后逐步迭代回歸模型篩選出顯著性較強的變量進行回歸建模。3.2顯著性檢驗根據F值和p值統計量來判斷模型是否具有顯著的統計意義。3.3擬合預測使用得到的模型對實際數據進行擬合和預測。4.分析得出結論得出各個自變量之間的關系,以及它們對因變量的影響極其經濟意義。【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第2頁。獲取2012年1月到2015年7月的上證指數數據,貨幣供應量,消費價格指數人民幣美元匯率和存款利率數據
繪制變量之間的散點圖plot(data)par(mfrow=c(2,2))
plot(美元匯率,上證指數數據)
plot(人民幣存款利率,上證指數數據)【原創】R【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第3頁。三、指數平滑時間序列模型預測表示時間序列JanFebMarAprMayJunJul
2012263.67019.925240.655131.620245.665368.020
2013-51.615-156.54569.235-46.705-329.040-181.635-2.555
2014-65.53587.56579.20037.740-157.900-118.65559.360
2015-50.230142.300-11.580-25.71047.830-92.995-115.865
AugSepOctNovDec
2012-130.350-216.610125.145163.41544.480
2013145.3105.895236.40597.135-142.555
2014-176.755-108.775-71.05532.655-149.320
2015【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第4頁。利用HoltWinters函數預測:p.hw<-forecast.HoltWinters(m.hw,h=24)h=24表示預測24個值
【原創】R【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第5頁。四、進行多元回歸模型并進行分析summary(lmmod)顯示回歸結果
Call:
lm(formula=y~x1+x2+x3+x4,data=data)
Residuals:
Min1QMedian3QMax
-543.94-90.091.69113.01500.68
Coefficients:
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)-3.457e+049.319e+03-3.7100.000661***
x13.325e-031.369e-032.4300.019950*
x21.341e+012.663e+010.5030.617562
x34.787e+011.400e+013.4200.001511**
x47.870e+023.380e+022.3280.025322*
---
Signif.codes:0'***'0.001'**'0.01'*'0.05'.'0.1''1
Residualstandarderror:246.5on38degreesoffreedom
【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第6頁。回歸結果分析從輸出結果可以看出,回歸方程為,變量和的統計量的估計值分別為-3.457e+04,3.325e-03,1.341e+01,4.787e+01和7.870e+02,除了x2以外由對應的值都比顯著性水平0.05小,可得兩個偏回歸系p數在顯著性水平0.05下均顯著不為零。進一步地剩余方差的估計值,f統計量的估計值為8.783,由對應的p值4.012e-05說明,回歸方程是顯著的。可決系數R,修正的可決系數R為0.48左右說明方程的擬合效果較好。擬合效果圖形展示以上證指數的原始數據作為x軸,回歸擬合值為軸作圖,在xy面上的點用直線連接見圖1。"貨幣供應量數據","居民消費價格指數","美元匯率","人民幣存款利率"之間原始圖和擬合值的關系散點圖【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第7頁。par(mfrow=c(2,2))
plot(貨幣供應量數據,【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第7頁。plot(人民幣存款利率,上證指數數據,type="l")
lines(人民幣存款利率,fitted(lmmod),col="red")置信區間與預測區間:置信區間是給定自變量值后,由回歸方程得到的的預測值(實0y際上是的平均值)的置信區間;預測區間是實際值的置信區間,在這里稱為預測區間。0y0y預測區間要比置信區間稍大,命令與顯示結果如下predict(lmmod,int="c")fitlwrupr
12475.2422251.5062698.979
22499.7752292.2382707.313
32577.0192407.6312746.407
42591.8862430.2492753.522
52587.0352430.3702743.701
62693.3362533.4062853.266
72700.1742534.9392865.409
82721.1342574.9722867.296
92739.6532604.0152875.291
【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第8頁。382292.4622133.9362450.987
392431.0192261.3072600.730
402353.4662189.9582516.974
412428.7892234.3662623.211
422359.7942122.2602597.327
432165.2941879.1122451.475predict(lmmod,int="p")fitlwrupr
12475.2421928.3523022.133
22499.7751959.3093040.241
32577.0192050.0243104.014
42591.8862067.3313116.441
52587.0352063.9913110.080
。。。392431.0191903.9202958.118
402353.4661828.3312878.601
412428.7891893.2222964.355
422359.7941807.1152912.473
432165.2941590.0272740.560殘差分析:殘差分析可以對回歸模型的假設條件即隨機誤差項是否獨立同分布進行檢驗,同時還可以找出離群點。命令語句為plot(lm.1),顯示結果如下par(mfrow=c(2,2))
plot(lmmod)【原創】R【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第9頁。左上圖是擬合值與殘差的散點圖,從圖上可以發現,除去第6個離群點外,所有點基本上是隨機地分散在縱坐標值為-1和+1的兩條平行線之間,這說明隨機誤差項具有同方差性;左下圖是擬合值與殘差的標準差的散點圖,其意義與上面類似;右上圖表明隨機誤差項是服從正態分布的,其原因是正態Q-Q圖近似地可以看成一條直線;右下圖的CooK距離圖進一步證實第6個觀測值是一個離群點,它對回歸方程的影響是比較大的,要根據具體問題,討論出現這一觀測值的實際背景。逐步回歸優化使用逐步回歸法建立“最優”的回歸方程Start:AIC=478.32
y~x1+x2+x3+x4
DfSumofSqRSSAIC
-x21154012324529476.61
<none>2309128478.32
-x413293902638518482.05
-x113587082667836482.53
-x317105763019704487.86
Step:AIC=476.61
【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第10頁。y~x1+x3+x4
DfSumofSqRSSAIC
<none>2324529476.61
+x21154012309128478.32【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第10頁。summary(stepmod)查看模型參數與結果
Call:
lm(formula=y~x1+x3+x4,data=data)
Residuals:
Min1QMedian3QMax
-539.93-107.079.65100.96471.56
Coefficients:
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)-3.669e+048.237e+03-4.4546.9e-05***
x13.792e-039.977e-043.8000.000495***
x35.228e+011.081e+014.8352.1e-05***
x48.928e+022.621e+023.4060.001542**
---
Signif.codes:0'***'0.001'**'0.01'*'0.05'.'0.1''1
Residualstandarderror:244.1on39degreesoffreedom
MultipleR-squared:0.4769,AdjustedR-squared:0.4367
F-statistic:11.85on3and39DF,p-value:1.17e-05上面用“逐步向前向后回歸法”,通過軟件分析建立“最優”回歸方程。向后回歸法就是建立包含全部因子的回歸方程,通過回歸系數的檢驗,從回歸方程中逐個剔除不顯著的因子,直到留在方程中的因子都是顯著的。五、結論本文首先通過繪制上證指數與諸影響因素(貨幣供應量,居民消費價格指數,人民幣兌美元匯率,人民幣短期存款利率)之間的散點圖和計算它們之間的相關系數,可知上證指數與諸因素之間存在比較明顯的非線性關系,因此,為簡化問題,通過R軟件,采用逐步進入法剔除了不顯著的自變量—居民消費價格指數、人民幣短期存款利率和人民幣兌美元匯率,并建立了多元回歸模型.利用所得模型可對股票價格的因素進行探討.研究表明,上證指數和貨幣供應量與人民幣短期存款利率并不存在長期的穩定關系]8[.因此,這里只使用此模型對我國股票市場作出粗略的線性估計.我們猜測只是由于影響股票價格的因素復雜,如公司的經營狀況,股民的投資心理等等,并最終反映在投資決策和投資行為上來]9[,表現在上證指數的高低.此外,股票市場是【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第11頁。一個動態的過程,投資者作為金融產品的需求者與供應者,通過交易量的調整來表達對價格水平的意見.因此,股票價格變動與人民幣兌美元匯率之間也存在一定的關系。當然,值得注意的是,股票價格并不是由上述因素來決定,【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第11頁。Code:獲取數據及預處理獲取2012年1月到2015年7月的上證指數數據,貨幣供應量,消費價格指數人民幣美元匯率和存款利率數據y=c(1931.3,2194.97,2214.895,2455.55,2587.17,2832.835,3200.855,3070.505,2853.895,2979.04,3142.455,3186.935,3135.32,2978.775,3048.01,3001.305,2672.265,2490.63,2488.075,2633.385,2639.28,2875.685,2972.82,2830.265,2764.73,2852.295,2931.495,2969.235,2811.335,2692.68,2752.04,2575.285,2466.51,2395.455,2428.11,2278.79,2228.56,2370.86,2359.28,2333.57,2381.4,2288.405,2172.54);上證指數數據,2012.1——2015.7?x1=c(496135.31,506708.07,530626.71,540481.21,548263.51,568916.20,573102.85,576698.95,585405.34,586643.29,594604.72,610224.52,625606.29,636072.26,649947.46,656561.72,663351.37,673921.72,674051.48,687506.92,696471.5,【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第12頁。763409.22,780820.85,772923.65,780852.30,787406.20,816829.25,825493.94,851590.90,855898.89,867171.42,895565.50,889604.04,900048.77,924991.20,919072.40);貨幣供應量數據,2012.1——2015.7?x2=c(98.3,98.4,98.8,98.5,98.6,98.3,98.2,98.8,99.2,99.5,100.6,101.9,101.5,102.7,102.4,102.8,103.1,102.9,103.3,103.5,103.6,104.4,105.1,104.6,104.9,104.9,105.4,105.3,105.5,106.4,106.5,106.2,106.1,105.5,104.2,104.1,104.5,103.2,103.6,103.4,103,102.2,101.8);居民消費價格指數2012.1——2015.7?x3=c(683.82,683.57,683.41,683.12,682.45,683.32,683.20,683.22,682.89,682.75,682.71,682.79,682.76,682.70,682.64,682.62,682.74,681.65,677.75,679.01,674.62,667.32,665.58,665.15,660.27,658.31,656.62,652.92,649.88,647.78,646.14,640.9,638.33,635.66,634.08,632.81,631.68,630,630.81,629.66,630.62,631.78,632.35);人民幣100外幣兌美元匯率2012.1——2015.7?x4=c(17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,19.1,19.1,22.5,22.5,26,26,28.5,28.5,28.5,31,31,31,31,31,31,31,31,31,31,31,28.5,26)/10;人民幣存款利率2012.1——2015.7?將數據合并data=cbind(y,x1,x2,x3,x4)data=as.data.frame(data)給變量名賦值attach(data)colnames(data)=c("上證指數數據","貨幣供應量數據","居民消費價格指數","美元匯率","人民幣存款利率")繪制變量之間的散點圖【原創】【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第13頁。plot(data)par(mfrow=c(2,2))plot(貨幣供應量數據,上證指數數據)plot(居民消費價格指數,上證指數數據)plot(美元匯率,上證指數數據)plot(人民幣存款利率,上證指數數據)表示時間序列library(xts)上證指數數據=ts(上證指數數據,start=c(2012,1),frequency=12)plot.ts(上證指數數據)diff(上證指數數據)計算相鄰觀察值之差b<-rollmean(上證指數數據,12)12是移動平均的期數。lines(b)利用HoltWinters函數預測:library(forecast)m.hw<-HoltWinters(上證指數數據)p.hw<-forecast.HoltWinters(m.hw,h=24)h=24表示預測24個值plot(p.hw)進行多元回歸模型并進行分析lmmod=lm(y~x1+x2+x3+x4,data=data)summary(lmmod)顯示回歸結果【原創】【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第14頁。Call:lm(formula=y~x1+x2+x3+x4,data=data)Residuals:Min1QMedian3QMax-543.94-90.091.69113.01500.68Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)-3.457e+049.319e+03-3.7100.000661***x13.325e-031.369e-032.4300.019950*x21.341e+012.663e+010.5030.617562x34.787e+011.400e+013.4200.001511**x47.870e+023.380e+022.3280.025322*---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:246.5on38degreesoffreedomMultipleR-squared:0.4804,AdjustedR-squared:0.4257F-statistic:8.783on4and38DF,p-value:4.012e-05回歸結果分析從輸出結果可以看出,回歸方程為,變量和的統計量的估計值分別為-3.457e+04,3.325e-03,1.341e+01,4.787e+01和7.870e+02,除了x2以外由對應的值都比顯著性水平0.05小,可得兩個偏回歸系p數在顯著性水平0.05下均顯著不為零。進一步地剩余方差的估計值,f統計量的估計值為8.783,由對應的p【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第15頁。值4.012e-05說明,回歸方程是顯著的。可決系數【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第15頁。擬合效果圖形展示以上證指數的原始數據作為x軸,回歸擬合值為軸作圖,在xy面上的點用直線連接見圖1。plot(y,fitted(lmmod),type="l")"貨幣供應量數據","居民消費價格指數","美元匯率","人民幣存款利率"之間原始圖和擬合值的關系散點圖par(mfrow=c(2,2))plot(貨幣供應量數據,上證指數數據,type="l")lines(貨幣供應量數據,fitted(lmmod),col="red")plot(居民消費價格指數,上證指數數據,type="l")lines(居民消費價格指數,fitted(lmmod),col="red")plot(美元匯率,上證指數數據,type="l")lines(美元匯率,fitted(lmmod),col="red")plot(人民幣存款利率,上證指數數據,type="l")lines(人民幣存款利率,fitted(lmmod),col="red")置信區間與預測區間:predict(lmmod,int="c")fitlwrupr12475.2422251.5062698.97922499.7752292.2382707.31332577.0192407.6312746.407【原創】R【原創】R語言股票回歸、時間序列分析報告論文附代碼數據全文共17頁,當前為第16頁。52587.0352430.3702743.701.....422359.7942122.2602597.327432165.2941879.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工現場項目管理制度
- 南寧市學校安全管理制度
- 無息住房貸款管理制度
- 日常消毒球館管理制度
- 景區演出安全管理制度
- 一次性醫療用品管理制度
- 夷陵區村級財務管理制度
- 日本設備維修管理制度
- 員工培訓等安全管理制度
- 博物館臨聘人員管理制度
- 2024年首屆全國“紅旗杯”班組長大賽考試題庫800題(含答案)
- JT-T-891-2014道路車輛清障救援操作規范
- 基于3D打印技術的個性化正畸矯治器設計
- 國際化競爭格局下的動漫游戲行業發展策略
- 河南省鄭州市中原區2023-2024學年八年級下學期期末歷史試卷
- GB/T 44087-2024北斗三號區域短報文通信用戶終端技術要求與測試方法
- GB/T 43868-2024電化學儲能電站啟動驗收規程
- 資本論在中國智慧樹知到期末考試答案2024年
- 傳染病預防控制工作方案醫院
- 金融工程學智慧樹知到期末考試答案2024年
- 《口腔醫學技術》課件-嵌體的牙體預備
評論
0/150
提交評論