《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第10章 多元線性回歸_第1頁(yè)
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第10章 多元線性回歸_第2頁(yè)
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第10章 多元線性回歸_第3頁(yè)
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第10章 多元線性回歸_第4頁(yè)
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第10章 多元線性回歸_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第10章

多元線性回歸1第10章多元線性回歸——目錄10.1多元線性回歸模型及其參數(shù)估計(jì)10.2多元線性回歸模型的評(píng)估10.3多重共線性10.4一般線性模型10.5定類(lèi)自變量10.6變量選擇與逐步回歸10.7利用回歸模型進(jìn)行預(yù)測(cè)10.8利用回歸模型進(jìn)行因果分析2

310.1多元線性回歸模型及其參數(shù)估計(jì)4

10.1多元線性回歸模型及其參數(shù)估計(jì)

10.1多元線性回歸模型及其參數(shù)估計(jì)

10.1多元線性回歸模型及其參數(shù)估計(jì)7例:某運(yùn)輸公司的主要業(yè)務(wù)是為它的周邊地區(qū)運(yùn)送貨物。為了制定最佳的工作計(jì)劃,公司的管理者希望估計(jì)出他們的司機(jī)每天行駛的時(shí)間。公司的管理人員認(rèn)為,貨車(chē)行駛的里程數(shù)和運(yùn)送貨物的次數(shù)都會(huì)影響到司機(jī)的行駛時(shí)間。經(jīng)過(guò)統(tǒng)計(jì),他們得到的數(shù)據(jù)如表10-1所示。表10-1運(yùn)輸公司貨車(chē)的行駛里程數(shù)、運(yùn)送貨物次數(shù)與行駛時(shí)間10.1多元線性回歸模型及其參數(shù)估計(jì)運(yùn)輸任務(wù)行駛里程(公里)運(yùn)送貨物次數(shù)行駛時(shí)間(小時(shí))15024.6524513.05332.523437.523.954013.165013.257251245103523.25810.1多元線性回歸模型及其參數(shù)估計(jì)模型平方和自由度均方F顯著性回歸4.87722.43938.034殘差.4497.064

總計(jì)5.3269

表10-2

方差分析表910.1多元線性回歸模型及其參數(shù)估計(jì)

模型未標(biāo)準(zhǔn)化系數(shù)B

標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)化系數(shù)Beta

t

顯著性共線性統(tǒng)計(jì)容差VIF(常量)-.499.470

-1.063.323

行駛里程.062.010.6866.216.000.9901.010運(yùn)送貨物次數(shù).897.164.6025.458.001.9901.010表10-3運(yùn)輸公司貨車(chē)行駛時(shí)間的二元回歸模型的參數(shù)估計(jì)和檢驗(yàn)回歸系數(shù)的解釋?zhuān)?/p>

在控制其他變量不變的情況下,每增加一單位的行駛里程,行駛時(shí)間增加0.062單位;同理在控制其他變量如行駛里程不變的情況下,每增加一單位運(yùn)送貨物次數(shù),行駛時(shí)間增加0.897單位。1010.2多元線性回歸模型的評(píng)估在多元線性回歸模型中,我們同樣可以定義總平方和(SST)、回歸平方和(SSR)和殘差平方和(SSE

)。具體的形式分別為:與一元線性回歸模型一致,SST、SSR和SSE滿(mǎn)足:

1110.2多元線性回歸模型的評(píng)估

1210.2多元線性回歸模型的評(píng)估

1310.2多元線性回歸模型的評(píng)估14

10.2多元線性回歸模型的評(píng)估

15,10.2多元線性回歸模型的評(píng)估

1610.3多重共線性

1710.3多重共線性一般線性模型(generallinearmodel,GLM):描述一個(gè)因變量與多個(gè)自變量之間的線性關(guān)系的方程模型,對(duì)于含有

個(gè)自變量的模型其一般形式為:

稱(chēng)為截距參數(shù),稱(chēng)為斜率參數(shù),變量表示誤差項(xiàng)或干擾項(xiàng)。自變量并不僅僅是單個(gè)變量本身,它可以是關(guān)于觀測(cè)變量的函數(shù),如,。1810.4一般線性模型

含單變量多項(xiàng)式的模型是指:自變量只能取關(guān)于某個(gè)自變量的一階或多階函數(shù)。1910.4.1含單變量多項(xiàng)式的模型

令,化為一般線性模式:對(duì)于模型:只是關(guān)于自變量的一階函數(shù),而與其他自變量無(wú)關(guān)。

對(duì)于模型:

是交互作用項(xiàng)。

2010.4.2含交互項(xiàng)的模型例:為加強(qiáng)國(guó)內(nèi)青少年的體育鍛煉活動(dòng),助使其具有一個(gè)健康的身體和強(qiáng)健的體魄,各大高校紛紛開(kāi)展了有獎(jiǎng)競(jìng)跑的夏季“夜跑”活動(dòng),對(duì)于參加夜跑的學(xué)生當(dāng)天即可抽取豐厚大獎(jiǎng)。現(xiàn)考慮某高校每晚參加夜跑活動(dòng)的學(xué)生人數(shù),經(jīng)過(guò)調(diào)查發(fā)現(xiàn),影響參加夜跑活動(dòng)人數(shù)的主要因素有兩個(gè):天氣的溫度、獎(jiǎng)品的價(jià)值。記錄一個(gè)月(30天)的參加夜跑的人數(shù)得到數(shù)據(jù)見(jiàn)表10-3,試建立一般線性模型,并分析自變量之間是否存在交互作用。2110.4.2含交互項(xiàng)的模型當(dāng)天溫度/℃獎(jiǎng)品價(jià)值/元參加人數(shù)/人當(dāng)天溫度/℃獎(jiǎng)品價(jià)值/元參加人數(shù)/人1520080155001121720091165001181920012018500182202001212150020822200142215002102320014422500215232001452450023924200149245002482520015225500250262001562550025328200165295002753020017230500286332001863250029334200185355002813620018837500272解:設(shè)參加人數(shù)為因變量,當(dāng)天溫度和獎(jiǎng)品價(jià)值分別為自變量。當(dāng)分別取200元、500元時(shí),考慮對(duì)

的影響:22解:從圖中可以看出獎(jiǎng)品價(jià)值設(shè)為500元比獎(jiǎng)品價(jià)值設(shè)為200元能吸引更多的學(xué)生來(lái)參加本次夜跑活動(dòng),且不同獎(jiǎng)品夠吸引的人數(shù)之差依賴(lài)于當(dāng)天的溫度。這種觀測(cè)結(jié)果也就間接性的說(shuō)明了當(dāng)天溫度和獎(jiǎng)品價(jià)值之間的潛在的交互作用。10.4.2含交互項(xiàng)的模型23建立模型:10.4.2含交互項(xiàng)的模型變量替換,得:交互項(xiàng)“溫度和價(jià)值”的顯著性是0.038,交互項(xiàng)的影響是顯著的。結(jié)論:當(dāng)天溫度和獎(jiǎng)品價(jià)值之間的交互作用對(duì)參加人數(shù)的影響是顯著的,即當(dāng)天溫度對(duì)參加人數(shù)的影響依賴(lài)于獎(jiǎng)品價(jià)值。表10-7模型的參數(shù)估計(jì)和檢驗(yàn)?zāi)P头菢?biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計(jì)標(biāo)準(zhǔn)誤差容忍度VIF(常量)當(dāng)天溫度(℃)獎(jiǎng)品價(jià)值(元)溫度和價(jià)值8.88139.635

.224.824

3.2721.541.3332.123.043.1496.720.061.102.151.600.554.05817.299.009.004.6342.190.038.04422.915設(shè)勞動(dòng)人員年薪為因變量(萬(wàn)元),接受教育年數(shù)為自變量(年),建立模型:2410.4.3變量的對(duì)數(shù)變換工資的變化量為:

工資的比例變化為:期望結(jié)果:每增加一年的教育,工資增長(zhǎng)的比例是不變的,而不應(yīng)是工資的增長(zhǎng)量是不變的。為了得到工資比例變化近似為常數(shù)的模型,對(duì)因變量取對(duì)數(shù):2510.4.3變量的對(duì)數(shù)變換工資的比例近似變化為:若樣本回歸方程為:(常數(shù))

此時(shí)對(duì)方程的解釋為:每多接受一年的教育,工資會(huì)增加約。當(dāng)變化較小時(shí):對(duì)自變量進(jìn)行對(duì)數(shù)變換:2610.4.3變量的對(duì)數(shù)變換何時(shí)取對(duì)數(shù)?使用對(duì)數(shù)線性模型的經(jīng)驗(yàn)法則:使用對(duì)數(shù)時(shí),變量不能取0或者負(fù)值。對(duì)于錢(qián)、人數(shù)、產(chǎn)品數(shù)等大的正整數(shù),通??梢匀?duì)數(shù)。以年度量的單位,通常以原有形式出現(xiàn),例如年齡、工作年限、教育年數(shù)等。在回歸模型中,除了需要考慮定量因素對(duì)因變量的影響,一些定性因素對(duì)因變量的影響往往也不可以忽略。例如,研究影響二手車(chē)價(jià)格的因素時(shí),里程表計(jì)數(shù)可以作為一個(gè)定量自變量,而銷(xiāo)售商認(rèn)為顏色也是影響二手車(chē)價(jià)格的一個(gè)因素,這時(shí)需要將二手車(chē)的顏色作為一個(gè)定性自變量引入模型之中。2710.5定性自變量

2810.5定性自變量——在模型中引入定性變量

對(duì)于更復(fù)雜的定性變量,記定性變量的水平數(shù)為k,那么需要定義k-1個(gè)虛擬變量。例如,在研究某品牌電腦在各商店的銷(xiāo)售數(shù)量時(shí),管理人員認(rèn)為付款方式也是影響銷(xiāo)售數(shù)量的一個(gè)重要因素。因?yàn)橛鞋F(xiàn)金支付、刷卡支付、移動(dòng)支付三種付款方式,所以需要定義2個(gè)虛擬變量。每個(gè)虛擬變量被定義為如下形式,2910.5定性自變量——在模型中引入定性變量

付款方式現(xiàn)金支付10刷卡支付01移動(dòng)支付00

在回歸模型中引入定性變量有多種方式,各種方式對(duì)回歸模型的影響不同。為了直觀地闡釋定類(lèi)變量不同的引入方式對(duì)回歸模型的影響,接下來(lái)以決定小時(shí)工資的基本模型

進(jìn)行說(shuō)明(y:工資,x1:教育水平)。30

10.5定性自變量——含有定性變量的回歸(1)引入定性變量此時(shí)定性變量的不同取值改變的是模型的截距項(xiàng),體現(xiàn)了性別和婚姻狀況對(duì)小時(shí)工資的影響。將x2(性別)和x3(婚姻狀況)引入基本模型(2)定性變量之間的交互作用3110.5定性自變量——含有定性變量的回歸此時(shí)含有交互作用的定性變量的不同取值改變的也是模型的截距項(xiàng),體現(xiàn)了性別和婚姻狀況對(duì)小時(shí)工資的影響。將性別和婚姻狀況的交互項(xiàng)x2x3引入模型32

10.5定性自變量——含有定性變量的回歸(3)定性變量與非定性變量的交互作用此時(shí)定性變量的不同取值不僅改變了模型的截距項(xiàng),還改變了模型的斜率項(xiàng),體現(xiàn)了性別在受教育回報(bào)上的差異。將教育水平和性別的交互項(xiàng)x1x2引入模型33例:中國(guó)進(jìn)出口貿(mào)易總額數(shù)據(jù)(1950-1984)見(jiàn)表10-5-2。試檢驗(yàn)改革開(kāi)放前后該時(shí)間序列的斜率是否發(fā)生變化。(數(shù)據(jù)見(jiàn)表10-6中國(guó)進(jìn)出口貿(mào)易總額數(shù)據(jù)(1950-1984))解:由于年份數(shù)據(jù)值較大,首先將其處理為時(shí)間x1列。定義虛擬變量x2如下:以時(shí)間x1為自變量,進(jìn)出口貿(mào)易總額y為因變量,為了檢驗(yàn)改革開(kāi)放前后該時(shí)間序列的斜率是否發(fā)生變化,同時(shí)引入虛擬變量x2及其與時(shí)間的交互項(xiàng)x1x2。

10.5定性自變量3410.5定性自變量統(tǒng)計(jì)軟件輸出的結(jié)果如表10-10和表10-11所示:表10-12模型的參數(shù)估計(jì)和檢驗(yàn)表10-11方差分析表

由上式可知,斜率項(xiàng)和截距項(xiàng)都發(fā)生了變化;于是得出結(jié)論:改革開(kāi)放前后該時(shí)間序列的斜率發(fā)生了變化。因?yàn)楦飨禂?shù)的估計(jì)值通過(guò)檢驗(yàn),所以估計(jì)結(jié)果如下:

向前選擇(forwardselection):從模型沒(méi)有自變量開(kāi)始,逐個(gè)選入自變量。步驟如下:對(duì)于因變量y的k個(gè)自變量分別建立一元線性回歸模型,對(duì)于這k個(gè)模型分別計(jì)算F統(tǒng)計(jì)量,將擁有最大且顯著F統(tǒng)計(jì)量的模型的自變量選入模型;對(duì)剩余的k-1個(gè)自變量分別加入模型,計(jì)算F統(tǒng)計(jì)量,選擇使F統(tǒng)計(jì)量最大且顯著的自變量進(jìn)入模型;反復(fù)以上過(guò)程,直到自變量均無(wú)統(tǒng)計(jì)顯著性。35

10.6變量選擇與逐步回歸——向前選擇向后剔除(backwardelimination):與向前選擇法相反,從自變量全部進(jìn)入模型開(kāi)始,逐個(gè)剔除自變量。步驟如下:將所有k個(gè)自變量加入模型進(jìn)行擬合,然后建立k個(gè)剔除一個(gè)自變量的回歸模型,每個(gè)模型都含有k-1個(gè)自變量。計(jì)算k個(gè)模型的SSE,選擇F統(tǒng)計(jì)量最小且不顯著的自變量進(jìn)行剔除;建立k-1個(gè)回歸模型,每個(gè)模型中有k-2個(gè)自變量,比較每個(gè)模型增大的SSE值,選擇F統(tǒng)計(jì)量最小且不顯著的自變量進(jìn)行剔除;反復(fù)以上過(guò)程,直到刪除任何自變量SSE均有顯著變化為止。36

10.6變量選擇與逐步回歸——向后剔除逐步回歸(stepwiseregression):綜合了向前選擇和向后剔除兩種方法進(jìn)行自變量的選擇。步驟如下:前兩步與向前選擇相同,但是在加入一個(gè)自變量之后,要對(duì)之前所有自變量進(jìn)行考察,確定是否需要剔除變量。如果在增加了一個(gè)自變量后,之前的某個(gè)自變量對(duì)模型的作用不再顯著,則需要剔除變量;反復(fù)進(jìn)行這個(gè)過(guò)程,不斷增加變量和剔除變量,直到增加變量不會(huì)導(dǎo)致SSE顯著減小為止。37

10.6變量選擇與逐步回歸——逐步回歸38例:城鎮(zhèn)居民的平均工資受多種因素的影響,如教育水平、直接投資、基礎(chǔ)設(shè)施、外資開(kāi)放度、第三產(chǎn)業(yè)增量,等等。為分析平均工資的影響因素,選取2016年31個(gè)省市的國(guó)家統(tǒng)計(jì)數(shù)據(jù),如右表所示,用逐步回歸法建立回歸方程。省市編號(hào)平均工資教育水平直接投資基礎(chǔ)設(shè)施外資開(kāi)放度產(chǎn)業(yè)結(jié)構(gòu)11199280.03474276.29540.07731.18430.80232863050.04173751.94970.09730.74580.56443553340.0208742.50880.03680.22720.41544537050.0260680.42190.03400.28340.55455610670.021866.74410.01040.18550.43786560150.02882574.16280.03840.76190.51557560980.0295620.24280.02720.26070.42458524350.024672.33150.01310.27470.540491199350.026719014.30860.07892.81810.697810715740.027821651.13470.02730.72280.500011733260.02275000.71630.02550.72890.509912591020.0235874.80690.03010.22730.410513619730.02473917.76860.02640.98400.428814561360.0282773.12360.02400.37400.419715625390.02525477.53760.03500.41940.466816495050.02483288.67060.03350.19910.417817598310.0305707.07120.02210.27480.439418582410.0226416.94020.02220.21160.463719723260.021731237.70830.02341.48030.520120578780.0207646.92800.02200.24480.395621616630.0255479.93510.02950.65630.542522655450.03032214.05790.02530.31310.481323639260.02192074.23920.00950.31490.472324662790.019420.19620.01870.12830.446725604500.017032.37730.00940.27640.4668261032320.01340.00610.00070.20500.526727596370.03671434.37150.02240.30690.423528575750.02211.70410.00900.28870.514129665890.01280.27550.00320.17100.428130655700.021729.71430.01960.20550.454031637390.016412.99010.00350.15280.451210.6變量選擇與逐步回歸——逐步回歸3910.6變量選擇與逐步回歸——逐步回歸解:由統(tǒng)計(jì)軟件輸出的逐步回歸結(jié)果如下各表所示模型標(biāo)準(zhǔn)估算的錯(cuò)誤1.795.632.61910778.995表10-15

模型概要模型已輸入變量已除去變量方法1產(chǎn)業(yè)結(jié)構(gòu).步進(jìn)(準(zhǔn)則:進(jìn)入的概率F<=.050,刪除的概率F>=.100)。表10-14變量的進(jìn)入和移出模型平方和df均值差值FSig.1回歸5790869774.07115790869774.07149.841.000b殘差3369415317.34829116186735.081

總計(jì)9160285091.41930

表10-16方差分析表4010.6變量選擇與逐步回歸——逐步回歸解:由統(tǒng)計(jì)軟件輸出的逐步回歸結(jié)果如下各表所示根據(jù)以上的回歸結(jié)果,該模型最終的估計(jì)方程為:

模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.標(biāo)準(zhǔn)誤差1(常量)-12372.86911410.429

-1.084.287產(chǎn)業(yè)結(jié)構(gòu)162636.32223036.894.7957.060.000表10-17模型的參數(shù)估計(jì)和檢驗(yàn)?zāi)P蛅Sig.偏相關(guān)共線性統(tǒng)計(jì)容忍度1教育水平-.128-1.073.292-.199.889直接投資.1211.012.320.188.890基礎(chǔ)設(shè)施.080.543.591.102.606外資開(kāi)放度.2621.789.084.320.551表10-18模型移出變量41例:在此沿用上例,對(duì)城鎮(zhèn)居民的平均工資進(jìn)行預(yù)測(cè),統(tǒng)計(jì)軟件的輸出結(jié)果如右表所示10.7利用回歸模型進(jìn)行預(yù)測(cè)省市編號(hào)平均工資點(diǎn)估計(jì)值置信下界置信上界預(yù)測(cè)下界預(yù)測(cè)上界1119928118113.78102790.02133437.5491265.64144961.9228630579412.7674066.9384758.5956728.34102097.1835533455179.3949941.6760417.1032520.2077838.5745370577811.3172765.4882857.1455195.71100426.9156106758834.6854220.2063449.1536311.3981357.9665601571459.0167295.4575622.5749023.7793894.2675609856672.6251707.3061637.9334074.8479270.3985243575518.9470855.5580182.3352985.5898052.299119935101113.8290471.35111756.2976633.89125593.76107157468939.9564941.3772938.5346534.7491345.17117332670548.8666459.1474638.5848127.2092970.52125910254382.6248990.9959774.2631687.3777077.88136197357365.1052518.1962212.0034793.0579937.15145613655893.5150788.8260998.1933264.7078522.31156253963540.6559455.2467626.0541119.7785961.52164950555579.1850416.5560741.8232937.2478221.13175983159082.0754503.9963660.1636566.2281597.93185824163049.1258926.3267171.9140621.4085476.83197232672210.7467974.7876446.7149761.9594659.54205787851972.4746084.5557860.3929154.2274790.72216166375858.9071142.7480575.0653314.5698403.24226554565902.9361930.3669875.5043502.3488303.52236392664446.7260417.9468475.5042036.1086857.34246627960281.5455867.6464695.4337798.4982764.58256045063544.8459459.7367629.9441124.0285965.652610323273289.4368932.6177646.2450817.5195761.34275963756497.6951501.6461493.7533893.1579102.24285757571231.9167088.2275375.6048800.3493663.47296658957254.0852388.5662119.6034678.0379830.14306557061464.5457191.0365738.0639008.6383920.45316373961004.8556679.4765330.2338539.0283470.69城鎮(zhèn)居民平均工資預(yù)測(cè)表42點(diǎn)估計(jì)值表示給定自變量值的條件下對(duì)應(yīng)的因變量的預(yù)測(cè)值,例如,第31組數(shù)據(jù)實(shí)際平均工資為63739,利用回歸方程預(yù)測(cè)的平均工資為61004.85;置信下界和置信上界表示平均值的置信區(qū)間的下界和上界,預(yù)測(cè)下界和預(yù)測(cè)上界表示個(gè)別值的預(yù)測(cè)區(qū)間的下界和上界,例如,實(shí)際工資為63739的省市,均值95%的置信區(qū)間為[56679.47,65330.23],個(gè)體預(yù)測(cè)95%的預(yù)測(cè)區(qū)間為[38539.02,83470.69]。10.7利用回歸模型進(jìn)行預(yù)測(cè)43回歸系數(shù)的進(jìn)一步解釋偏效應(yīng)(partialeffect)是指在其他自變量保持不變條件下,某自變量(解釋變量)對(duì)因變量(被解釋變量)的效應(yīng)。在獲取樣本時(shí),我們很少能夠奢侈到限制某些變量使其保持不變。多元回歸分析的作用在于,盡管不能在其他條件保持不變的情況下收集數(shù)據(jù),但它提供的系數(shù)仍然可以做其他條件不變的解釋。多元回歸使我們?cè)趯?duì)自變量的值不施加限制的情況下,能有效地模擬施加限制時(shí)的情況。使得我們能夠在非實(shí)驗(yàn)的環(huán)境中,去做自然科學(xué)家在受控實(shí)驗(yàn)室中所能做的事情:保持其他因素不變。10.8利用回歸模型進(jìn)行因果分析44

10.8利用回歸模型進(jìn)行因果分析2018年9月30日上映的由莊文強(qiáng)執(zhí)導(dǎo)的犯罪動(dòng)作電影《無(wú)雙》,贏得了口碑、票房的雙豐收2017年7月27日,由吳京執(zhí)導(dǎo)的動(dòng)作類(lèi)電影《戰(zhàn)狼2》,更是霸屏各類(lèi)網(wǎng)站頭條,以56.8億元雄踞國(guó)產(chǎn)片電影榜首2017年8月上映的由王寶強(qiáng)執(zhí)導(dǎo)的處女作《大鬧天竺》,未播先火,王寶強(qiáng),岳云鵬,柳巖,王祖藍(lán),劉昊然,黃渤等都是票房號(hào)召力演員,最終卻爛尾收?qǐng)鏊坪豕饪繌V告、明星、導(dǎo)演就可以吸金的時(shí)代已不復(fù)存在,互聯(lián)網(wǎng)的發(fā)展,社會(huì)化網(wǎng)絡(luò)的普及(微信、微博)使得觀眾評(píng)價(jià)信息更快速地傳播,其作用也日益彰顯。為此,研究觀眾評(píng)價(jià)如何影響電影票房及其趨勢(shì)是一個(gè)亟需解決的問(wèn)題,對(duì)制片方以及出品方更具有直接的現(xiàn)實(shí)意義。45中國(guó)電影票房案例分析—案例背景本案例以中國(guó)2011-2017年豆瓣上映的1246部電影為樣本,運(yùn)用多元線性回歸模型,分析觀眾評(píng)價(jià)對(duì)電影票房的作用及其變化趨勢(shì)。模型包括電影票房、評(píng)分、票價(jià)和移動(dòng)網(wǎng)民數(shù)量等13個(gè)變量。46變量描述數(shù)據(jù)來(lái)源票房電影i的總票房藝恩數(shù)據(jù)庫(kù)評(píng)分電影i的豆瓣評(píng)分豆瓣網(wǎng)移動(dòng)網(wǎng)民數(shù)量對(duì)應(yīng)年份移動(dòng)網(wǎng)民數(shù)量中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心首映日票房電影i的首映日票房藝恩數(shù)據(jù)庫(kù)首映日排座數(shù)電影i的首映日排座數(shù)藝恩數(shù)據(jù)庫(kù)票價(jià)電影i的平均票價(jià)藝恩數(shù)據(jù)庫(kù)電影時(shí)長(zhǎng)電影i的播出時(shí)長(zhǎng)豆瓣網(wǎng)明星影響力虛擬變量,至少有一位明星在福布斯中國(guó)名人榜則為1福布斯中國(guó)名人榜發(fā)行商虛擬變量,屬于中國(guó)十大發(fā)行商則為1藝恩數(shù)據(jù)庫(kù)假期虛擬變量,電影i在假期上映則為1豆瓣網(wǎng)續(xù)集虛擬變量,電影i為續(xù)集電影則為1豆瓣網(wǎng)國(guó)外電影虛擬變量,電影i為國(guó)外制片則為1豆瓣網(wǎng)上映年份虛擬變量,電影i在當(dāng)年上映年份則為1豆瓣網(wǎng)中國(guó)電影票房案例分析—數(shù)據(jù)及其說(shuō)明為了概括性地描述數(shù)據(jù)的特征,對(duì)本案例的連續(xù)變量進(jìn)行了描述性統(tǒng)計(jì)。票房、首映日票房、首映日排座數(shù)以及電影時(shí)長(zhǎng)的波動(dòng)性較大。因此對(duì)以上變量進(jìn)行取對(duì)數(shù)處理(ln),這不僅使數(shù)據(jù)變得平滑同時(shí)易消除異方差的問(wèn)題。47變量個(gè)數(shù)最小值最大值均值標(biāo)準(zhǔn)差票價(jià)(元)12466.0047.0030.254.01票房(萬(wàn)元)12461.10567877.409677.0829690.13首映日票房(萬(wàn)元)12460.0235600.001080.762686.21首映日排座數(shù)(個(gè))1246867199455371652593.792662311.37電影時(shí)長(zhǎng)(分鐘)12467315397.9511.98評(píng)分12462.109.104.581.48移動(dòng)網(wǎng)民數(shù)量(千萬(wàn))12463.567.535.721.26中國(guó)電影票房案例分析—數(shù)據(jù)及其說(shuō)明使用本章所學(xué)的內(nèi)容,對(duì)2011-2017年1246部豆瓣上映的電影進(jìn)行多元線性回歸分析,主要實(shí)現(xiàn)兩個(gè)目的:對(duì)數(shù)據(jù)中的因變量“票房”與自變量“評(píng)分”、“移動(dòng)網(wǎng)民數(shù)量”、“首映日票房”和“首映日排座數(shù)”等進(jìn)行回歸分析,刻畫(huà)觀眾評(píng)價(jià)等因素對(duì)電影票房的影響作用。在多元線性回歸方程中加入觀眾評(píng)價(jià)與移動(dòng)網(wǎng)民數(shù)量、首映日票房、首映日排座數(shù)的交互項(xiàng),分析網(wǎng)民數(shù)量、首映日票房、首映日排座數(shù)對(duì)觀眾評(píng)價(jià)的票房影響力的調(diào)節(jié)作用。48中國(guó)電影票房案例分析—數(shù)據(jù)分析使用SPSS來(lái)分析上述問(wèn)題,統(tǒng)計(jì)軟件輸出的結(jié)果如表10-21所示表10-21(a)模型匯總表10-21(b)方差分析49模型平方和自由度均方F顯著性1回歸7298.86615486.5911180.970.000殘差506.79312300.412

總計(jì)7805.6591245

因變量:電影票房模型R

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論