大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 田青 第5-10章 包含虛擬變量的回歸模型 -空間計(jì)量分析模型_第1頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 田青 第5-10章 包含虛擬變量的回歸模型 -空間計(jì)量分析模型_第2頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 田青 第5-10章 包含虛擬變量的回歸模型 -空間計(jì)量分析模型_第3頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 田青 第5-10章 包含虛擬變量的回歸模型 -空間計(jì)量分析模型_第4頁(yè)
大數(shù)據(jù)計(jì)量經(jīng)濟(jì)分析 課件 田青 第5-10章 包含虛擬變量的回歸模型 -空間計(jì)量分析模型_第5頁(yè)
已閱讀5頁(yè),還剩357頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5章包含虛擬變量的回歸模型12第5章包含虛擬變量的回歸模型本章主要內(nèi)容虛擬變量概述虛擬變量的引入(加法、乘法、混合方式)虛擬變量的特殊應(yīng)用虛擬變量引入的綜合案例5.1虛擬變量概述345.1.1虛擬變量的概念和作用1.虛擬變量的概念:變量分為兩類:

一類是數(shù)值變量或定量變量,比如收入、產(chǎn)量、價(jià)格、重量、身高、成本等。另一類是定性變量或虛擬變量,比如性別、種族、民族、婚姻狀況、政治面貌等。定性變量通常表示具備或不具備某種性質(zhì),它與定量變量一樣可用于回歸分析。把定性變量“定量化”的一個(gè)方法是建立人工變量,并賦值0或1。

我們把這種只能取值為0或1的人工變量稱為虛擬變量或啞變量,并用符號(hào)D表示。把賦值為0的一類稱為基準(zhǔn)類。55.1.1虛擬變量的概念和作用2.引入虛擬變量的作用:(1)描述和測(cè)量定性因素或?qū)傩砸蛩貙?duì)因變量的影響。例如性別、受教育程度對(duì)工資的影響,季節(jié)對(duì)冷飲銷售量的影響等。(2)提高模型的精度。將虛擬變量引入模型與分組回歸相比,相當(dāng)于將不同屬性的樣本合并,擴(kuò)大了樣本容量,增加了自由度,從而降低誤差方差。(3)分離異常因素的影響。由于某些突發(fā)因素的存在,例如戰(zhàn)爭(zhēng)的爆發(fā),地震、洪水等自然災(zāi)害的發(fā)生,這些突發(fā)的事件可能會(huì)使原本比較穩(wěn)定的經(jīng)濟(jì)關(guān)系產(chǎn)生比較大的變化,可以通過(guò)設(shè)置虛擬變量,將異常數(shù)據(jù)作為一個(gè)特殊的定性因素,來(lái)量化異常因素的影響。65.1.2虛擬變量的設(shè)置原則若定性因素有m個(gè)相互排斥的類型或?qū)傩郧夷P陀薪鼐囗?xiàng)時(shí),只能引入m-1個(gè)虛擬變量,否則虛擬變量和截距項(xiàng)之間會(huì)產(chǎn)生完全共線性;若模型中沒(méi)有截距項(xiàng),則可以引入m個(gè)虛擬變量。例如:已知冷飲的銷售量Y除受k種定量變量的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個(gè)虛擬變量即可。5.2虛擬變量的引入785.2.1加法方式加法方式是指在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中直接加入適當(dāng)?shù)奶摂M變量,此時(shí)的虛擬自變量和其他自變量是相加關(guān)系。加法方式引入虛擬變量,會(huì)改變模型的截距系數(shù)。95.2.1加法方式【例5-1二分類定性變量的加法引入】設(shè)居民人均消費(fèi)函數(shù)為:其中,Yi為第i個(gè)家庭的人均消費(fèi)支出,Xi為第i個(gè)家庭的人均可支配收入。為了將城鎮(zhèn)家庭和農(nóng)村家庭對(duì)人均消費(fèi)支出的影響反映到上述模型中,需要引入?yún)^(qū)分城鎮(zhèn)農(nóng)村家庭的虛擬變量,具體設(shè)置如下:此時(shí),家庭人均消費(fèi)函數(shù)為:105.2.1加法方式【例5-1二分類定性變量的加法引入】農(nóng)村家庭的人均消費(fèi)支出為:城鎮(zhèn)家庭的人均消費(fèi)支出為:

115.2.1加法方式【例5-1二分類定性變量的加法引入】從幾何意義上看(圖5-1),假定α>0,則兩個(gè)函數(shù)有相同的斜率,但是有不同的截距。這意味著,城鎮(zhèn)家庭和農(nóng)村家庭的人均消費(fèi)支出對(duì)人均可支配收入的變化率是一樣的,但兩者的平均消費(fèi)水平相差α,我們把α叫做差別截距系數(shù)。

125.2.1加法方式【例5-2多分類定性變量的加法引入】設(shè)職工薪金模型為:其中,Yi為第i個(gè)職工的年薪,Xi為第i個(gè)職工的工齡。為了將學(xué)歷對(duì)職工薪金的影響反映到上述模型中,需要引入?yún)^(qū)分學(xué)歷的虛擬變量,假設(shè)學(xué)歷分為專科、本科、研究生三個(gè)層次,根據(jù)虛擬變量設(shè)置的原則,應(yīng)該設(shè)置兩個(gè)虛擬變量,具體如下:此時(shí),職工薪金模型為:135.2.1加法方式【例5-2多分類定性變量的加法引入】在的初始假定下,可以分別得到專科生、本科生和研究生的平均年薪函數(shù):專科生:本科生:研究生:假定α2>α1

,其幾何意義如圖:145.2.1加法方式【例5-2多分類定性變量的加法引入】

從圖5-2中可以看出,三個(gè)函數(shù)有相同的斜率,但是有不同的截距。這意味著,專科生、本科生、研究生的年薪對(duì)工齡的變化率是一樣的,但三者的平均年薪水平不同。155.2.1加法方式【例5-3多個(gè)定性變量的加法引入】

在例5-2的基礎(chǔ)上,我們?cè)僖氡硎拘詣e的虛擬變量D3:則職工薪金的回歸模型:在的初始假定下,可以分別得到不同學(xué)歷、不同性別的平均年薪函數(shù):165.2.1加法方式【例5-3多個(gè)定性變量的加法引入】專科學(xué)歷女職工的平均年薪:本科學(xué)歷女職工的平均年薪:本科學(xué)歷男職工的平均年薪:研究生學(xué)歷女職工的平均年薪:研究生學(xué)歷男職工的平均年薪:

專科學(xué)歷男職工的平均年薪:在本例中,以專科學(xué)歷女職工為基準(zhǔn)類別,并假設(shè)各類職工的年薪函數(shù)只是截距不同,年薪對(duì)工齡的變化率相同,即各個(gè)模型的斜率相同。175.2.2乘法方式以乘法方式引入虛擬變量,是指在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,將虛擬變量與其他自變量的乘積作為新的自變量引入,以表示模型中斜率系數(shù)的差異。以乘法方式引入虛擬變量,可以對(duì)因素間的交互影響進(jìn)行分析,可以檢驗(yàn)經(jīng)濟(jì)結(jié)構(gòu)的變化,從而提高模型對(duì)現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象的描述精度。185.2.2乘法方式【例5-4二分類定性變量的乘法引入】

沿用例5-1,家庭人均消費(fèi)函數(shù)為:在的假定下,農(nóng)村家庭的人均消費(fèi)支出為:城鎮(zhèn)家庭的人均消費(fèi)支出為:195.2.2乘法方式【例5-4二分類定性變量的乘法引入】從幾何意義上看(圖5-3),假定α1>0,則兩個(gè)函數(shù)有相同的截距,但是有不同的斜率。這意味著,城鎮(zhèn)家庭和農(nóng)村家庭的人均消費(fèi)支出對(duì)人均可支配收入的變化率是不同的,農(nóng)村家庭的邊際消費(fèi)傾向?yàn)棣?,城鎮(zhèn)家庭的邊際消費(fèi)傾向?yàn)棣?+α1,兩者相差α1,我們把α1叫做差別斜率系數(shù)。205.2.2乘法方式【例5-5多分類定性變量的乘法引入】沿用例5-2職工薪金的例子,如果不同學(xué)歷的職工隨著工齡增加,年薪的增加速度不同,則應(yīng)采用乘法方式將表示學(xué)歷的虛擬變量引入模型。此時(shí),職工薪金模型為:

在的初始假定下,可以分別得到專科生、本科生和研究生的平均年薪函數(shù):專科生:本科生:研究生:假定α2>α1

,其幾何意義如圖:215.2.2乘法方式【例5-5多分類定性變量的乘法引入】

從圖5-4中可以看出,三個(gè)函數(shù)有相同的截距,但有不同的斜率。這意味著,專科生、本科生、研究生的年薪對(duì)工齡的變化率是不一樣的。225.2.3加法和乘法混合方式

加法和乘法混合方式是指在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,把虛擬變量以及虛擬變量與其他自變量的乘積同時(shí)引入,這種引入方式既能改變模型的截距,又能改變模型的斜率。235.2.3加法和乘法混合方式【例5-6二分類定性變量的混合引入】

沿用例5-1,家庭人均消費(fèi)函數(shù)為:在的假定下,農(nóng)村家庭的人均消費(fèi)支出為:城鎮(zhèn)家庭的人均消費(fèi)支出為:245.2.3加法和乘法混合方式【例5-6二分類定性變量的混合引入】從幾何意義上看(圖5-5),假定α1>0,α2>0,則兩個(gè)函數(shù)既有不同的斜率,又有不同的截距。這意味著,城鎮(zhèn)家庭和農(nóng)村家庭的自發(fā)消費(fèi)支出和邊際消費(fèi)傾向都不同。255.2.3加法和乘法混合方式【例5-7多分類定性變量的混合引入】沿用例5-2職工薪金的例子,如果不同學(xué)歷的職工隨著工齡增加,年薪的增加速度不同,則應(yīng)采用混合方式將表示學(xué)歷的虛擬變量引入模型。此時(shí),職工薪金模型為:

在的初始假定下,可以分別得到專科生、本科生和研究生的平均年薪函數(shù):專科生:本科生:研究生:假定α2>α1>0

,α4>α3>0其幾何意義如圖:265.2.3加法和乘法混合方式【例5-7多分類定性變量的混合引入】

從圖5-6中可以看出,三個(gè)函數(shù)既有不同的截距,又有不同的斜率。這意味著,專科生、本科生、研究生的初始年薪不同,年薪對(duì)工齡的變化率也不同。5.3虛擬變量的特殊應(yīng)用27285.3.1模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)

在同一個(gè)總體中,利用不同的樣本數(shù)據(jù)估計(jì)同一形式的計(jì)量模型,可能會(huì)得到不同的估計(jì)結(jié)果。如果估計(jì)的參數(shù)之間存在著顯著差異,則稱模型結(jié)構(gòu)是不穩(wěn)定的,反之,則稱模型是穩(wěn)定的。

模型結(jié)構(gòu)的穩(wěn)定性檢驗(yàn)一方面可以分析模型結(jié)構(gòu)對(duì)樣本變化的敏感性,如多重共線性檢驗(yàn);另一方面,可以比較兩個(gè)模型之間的差異,即分析模型結(jié)構(gòu)是否發(fā)生了顯著變化。295.3.1模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)【例5-8我國(guó)改革開(kāi)放前后儲(chǔ)蓄函數(shù)的變化】1.改革開(kāi)放前:其中,為第t年的儲(chǔ)蓄總額,為第t年的收入總額。2.改革開(kāi)放后:305.3.1模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)【例5-8我國(guó)改革開(kāi)放前后儲(chǔ)蓄函數(shù)的變化】如果分別對(duì)兩模型在不同的時(shí)間區(qū)間內(nèi)回歸,可能得到以下四種結(jié)果:(1)且,即兩個(gè)回歸相同,稱為重合回歸。(2)但,即兩個(gè)回歸斜率相同,截距不同,稱為平行回歸。(3)但,即兩個(gè)回歸截距相同,斜率不同,稱為共點(diǎn)回歸。(4)且,即兩個(gè)回歸截距和斜率都不相同,稱為相異回歸。以上四種情形可以用圖示法描述,具體見(jiàn)圖5-7。315.3.1模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)

325.3.1模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)【例5-8我國(guó)改革開(kāi)放前后儲(chǔ)蓄函數(shù)的變化】利用一些特殊的統(tǒng)計(jì)檢驗(yàn),如鄒至莊檢驗(yàn),可以檢驗(yàn)?zāi)P偷慕Y(jié)構(gòu)穩(wěn)定性,也可以通過(guò)在模型中引入虛擬變量來(lái)解決這個(gè)問(wèn)題。具體方法如下:將本例中改革開(kāi)放前和改革開(kāi)放后的樣本合并,并設(shè)置虛擬變量:模型設(shè)置為:335.3.1模型結(jié)構(gòu)穩(wěn)定性檢驗(yàn)【例5-8我國(guó)改革開(kāi)放前后儲(chǔ)蓄函數(shù)的變化】在的假定下,改革開(kāi)放前的平均儲(chǔ)蓄函數(shù)為:改革開(kāi)放后的平均儲(chǔ)蓄函數(shù)為:

很顯然,本例中采用加法和乘法混合的方式引入虛擬變量,α1和α2分別是差別截距系數(shù)和差別斜率系數(shù),分別代表改革開(kāi)放前后儲(chǔ)蓄函數(shù)截距和斜率的差異。可以通過(guò)t檢驗(yàn)對(duì)α1和α2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),從而判斷改革前后儲(chǔ)蓄函數(shù)是否存在顯著差異,檢驗(yàn)經(jīng)濟(jì)結(jié)構(gòu)是否穩(wěn)定。345.3.2分段線性回歸

在經(jīng)濟(jì)關(guān)系中常有這樣的情況:當(dāng)自變量X的值達(dá)到某水平之前,與因變量Y之間存在某種線性關(guān)系;當(dāng)自變量X的值達(dá)到或超過(guò)以后,與因變量的關(guān)系就會(huì)發(fā)生變化。為了區(qū)分不同階段的截距和斜率,可以利用虛擬變量進(jìn)行分段線性回歸。355.3.2分段線性回歸【例5-9獎(jiǎng)金與銷售額的比例關(guān)系】某公司為了激勵(lì)銷售人員,按其銷售額的一定比例計(jì)提獎(jiǎng)金,但是銷售額在某一目標(biāo)水平以下和以上時(shí)計(jì)提比例不同,需要分段進(jìn)行回歸。則獎(jiǎng)金Y與銷售額X之間的關(guān)系式可以統(tǒng)一表示為:(1)當(dāng)銷售額低于時(shí),(2)當(dāng)銷售額高于時(shí),365.3.2分段線性回歸從圖5-8可以看出,兩段回歸的截距和斜率都不相同,β1是第一段回歸直線的斜率,β1+β2是第二段回歸直線的斜率。只要檢驗(yàn)β2的統(tǒng)計(jì)顯著性,就可以判斷在所設(shè)定的臨界水平處是否存在著“突變”。另外,分段回歸可以由兩段推廣到k段,設(shè)置k-1個(gè)虛擬變量即可。

375.3.2分段線性回歸【例5-10經(jīng)濟(jì)發(fā)展對(duì)就業(yè)的作用分析】年份國(guó)內(nèi)生產(chǎn)總值(X)/億元就業(yè)總?cè)藬?shù)(Y)/萬(wàn)人年份國(guó)內(nèi)生產(chǎn)總值(X)/億元就業(yè)總?cè)藬?shù)(Y)/萬(wàn)人199018872.964749200313742273736199122005.665491200416184074264199227194.5661522005187318.974647199335673.2668082006219438.574798199448637.5674552007270092.375321199561339.9680652008319244.675564199671813.6689502009348517.775828199779715698202010412119.376105199885195.5706372011487940.276420199990564.4713942012538580767042000100280.1720852013592963.2769772001110863.1727972014643563.1772532002121717.4732802015688858.277451385.3.2分段線性回歸

395.3.2分段線性回歸

405.3.2分段線性回歸

圖5-10國(guó)內(nèi)生產(chǎn)總值對(duì)就業(yè)影響的回歸結(jié)果根據(jù)圖5-10得到模型回歸結(jié)果:415.3.2分段線性回歸

425.3.3交互效應(yīng)分析

在實(shí)際的經(jīng)濟(jì)活動(dòng)中,兩個(gè)定性變量對(duì)因變量的影響可能存在一定的交互作用,即一個(gè)自變量的邊際效應(yīng)有時(shí)可能要依賴于另一個(gè)自變量。為描述這種交互作用,可以把兩個(gè)虛擬變量的乘積引入模型。435.3.3交互效應(yīng)分析【例5-11性別和學(xué)歷的交互作用分析】445.3.3交互效應(yīng)分析【例5-11性別和學(xué)歷的交互作用分析】455.3.3交互效應(yīng)分析【例5-11性別和學(xué)歷的交互作用分析】5.4虛擬變量引入的綜合案例46475.4虛擬變量引入的綜合案例1.變量與數(shù)據(jù)

變量名變量定義具體說(shuō)明被解釋變量收入平均月收入解釋變量工齡參加工作年限職位1:經(jīng)理;0:非經(jīng)理學(xué)歷1:本科及以上(含本科);0:本科以下485.4虛擬變量引入的綜合案例2.虛擬變量的加法引入——D1495.4虛擬變量引入的綜合案例2.虛擬變量的加法引入——D1505.4虛擬變量引入的綜合案例2.虛擬變量的加法引入——D1

和D2515.4虛擬變量引入的綜合案例2.虛擬變量的加法引入——D1

和D2從模型的估計(jì)結(jié)果可以看出,表明模型的總體線性關(guān)系顯著成立X、D1和D2參數(shù)估計(jì)量的t值均大于臨界值,表明各自變量的斜率系數(shù)在5%顯著水平下顯著不為零,即三個(gè)自變量對(duì)個(gè)人收入都有顯著影響。在職位和學(xué)歷不變的條件下,工齡每增加一年,個(gè)人收入平均增加548.785元;在其他條件不變的情況下,經(jīng)理比非經(jīng)理的收入平均高6859.495元,本科以上學(xué)歷的個(gè)人比本科以下的收入平均高3089.068元。525.4虛擬變量引入的綜合案例3.虛擬變量的乘法引入——D1

535.4虛擬變量引入的綜合案例3.虛擬變量的乘法引入——D1

從估計(jì)結(jié)果可以看出,,表明模型的總體線性關(guān)系顯著成立。X和D1X參數(shù)估計(jì)量的t值均大于臨界值,表明各自變量的斜率系數(shù)在5%顯著水平下顯著不為零,即兩個(gè)自變量對(duì)個(gè)人收入都有顯著影響。自變量的斜率系數(shù)顯著不為零,說(shuō)明經(jīng)理與非經(jīng)理的工齡對(duì)收入的變化率是不一樣的,經(jīng)理的收入增加速度比非經(jīng)理平均高742.330元。545.4虛擬變量引入的綜合案例3.虛擬變量的乘法引入——D1

和D2555.4虛擬變量引入的綜合案例3.虛擬變量的乘法引入——D1

和D2從估計(jì)結(jié)果可以看出,模型的總體線性關(guān)系顯著成立。X和D1X參數(shù)估計(jì)量在5%顯著水平下顯著不為零,自變量D2X的斜率系數(shù)在10%顯著水平下顯著不為零,即三個(gè)自變量對(duì)個(gè)人收入都有顯著影響。自變量D1X的斜率系數(shù)顯著不為零,說(shuō)明不同職位的個(gè)人,其工齡對(duì)收入的變化率是不一樣的,經(jīng)理的年收入增加速度比非經(jīng)理平均高682.771元;自變量D2X的斜率系數(shù)顯著不為零,說(shuō)明不同學(xué)歷的個(gè)人,其工齡對(duì)收入的變化率也是不一樣的,本科以上的個(gè)人年收入增加速度比本科以下的平均高151.865元。565.4虛擬變量引入的綜合案例4.虛擬變量的混合引入——D1

575.4虛擬變量引入的綜合案例4.虛擬變量的混合引入——D1

從估計(jì)結(jié)果可以看出模型的總體線性關(guān)系顯著成立。X、D1和D1X參數(shù)估計(jì)量的t值均大于臨界值,表明各自變量的斜率系數(shù)在5%顯著水平下顯著不為零,即三個(gè)自變量對(duì)個(gè)人收入都有顯著影響。自變量D1和D1X的斜率系數(shù)都顯著不為零,說(shuō)明虛擬變量不僅對(duì)收入的平均值有顯著影響,對(duì)收入隨工齡的變化率也有顯著影響。在其他條件不變的情況下,經(jīng)理比非經(jīng)理的收入平均高5501.771元,經(jīng)理的收入增加速度比非經(jīng)理平均高222.740元。585.4虛擬變量引入的綜合案例5.虛擬變量的交互效應(yīng)——D1*

D2

595.4虛擬變量引入的綜合案例5.虛擬變量的交互效應(yīng)——D1*

D2

從估計(jì)結(jié)果可以看出模型的總體線性關(guān)系顯著成立。變量的t值均大于臨界值,表明各自變量的斜率系數(shù)在5%顯著水平下顯著不為零,即四個(gè)自變量對(duì)個(gè)人收入都有顯著影響。自變量D1*D2的斜率系數(shù)顯著不為零,說(shuō)明虛擬變量D1和D2之間存在交互效應(yīng)。605.4虛擬變量引入的綜合案例

交互影響結(jié)果分析表:職位學(xué)歷估計(jì)方程非經(jīng)理:

本科以下:

本科以上:

經(jīng)理:

本科以下:

本科以上:

第6章離散與受限因變量模型6162第6章離散與受限因變量模型本章主要內(nèi)容線性概率模型Logit模型Probit模型Tobit模型6.1線性概率模型63646.1.1線性概率模型的定義對(duì)于二元選擇問(wèn)題,一種最簡(jiǎn)單的分析方法是不加任何特殊處理而直接使用普通線性回歸模型的設(shè)定:是取值為0或1的虛擬因變量,一般設(shè)為:對(duì)模型兩邊取條件期望得:656.1.1線性概率模型的定義

的條件分布如表所示:的條件期望值為:

取值概率10在線性概率模型中,只能取兩個(gè)值,0或1,所以不能把斜率系數(shù)解釋為X的單位變動(dòng)引起Y的條件均值的變化,可以解釋為X單位變動(dòng)引起的Y=1概率的變化。以為例,說(shuō)明每增加一個(gè)單位,則第一種選擇發(fā)生的概率增加0.05。666.1.2線性概率模型的估計(jì)1.隨機(jī)誤差項(xiàng)是非正態(tài)分布的線性概率模型中的隨機(jī)誤差項(xiàng)不服從正態(tài)分布,對(duì)參數(shù)估計(jì)并不產(chǎn)生影響,OLS法本身并不要求服從正態(tài)分布,即OLS估計(jì)量在非正態(tài)分布條件下依然是最優(yōu)線性無(wú)偏估計(jì)量。服從二項(xiàng)分布676.1.2線性概率模型的估計(jì)2.隨機(jī)誤差項(xiàng)存在異方差性隨機(jī)誤差項(xiàng)的方差是的條件期望的函數(shù),是異方差的。此時(shí),OLS估計(jì)量將不再是最小方差的,統(tǒng)計(jì)檢驗(yàn)也是不可靠的。要消除異方差的影響,可使用加權(quán)最小二乘法進(jìn)行參數(shù)估計(jì)。686.1.2線性概率模型的估計(jì)3.無(wú)法保證Y的估計(jì)值介于0和1之間

線性概率模型的不能保證在0和1之間,可能大于1,也可能小于0。這是線性概率模型用OLS法估計(jì)存在的核心問(wèn)題之一。696.1.2線性概率模型的估計(jì)【例6-1基于線性概率模型的員工離職影響因素分析】1.變量介紹

變量名變量定義具體說(shuō)明因變量是否離職1:離職;0:未離職

自變量年齡年齡出差頻率1:經(jīng)常出差;0:很少出差距離單位與住處之間的實(shí)際距離(公里)

工作滿意度從1到4,1代表滿意程度最低,4代表滿意程度最高

婚否1:已婚;0:未婚706.1.2線性概率模型的估計(jì)2.模型構(gòu)建

本例的因變量label只有離職和未離職兩種結(jié)果,可以構(gòu)建線性概率模型,具體形式為:3.參數(shù)估計(jì)與假設(shè)檢驗(yàn)716.1.2線性概率模型的估計(jì)

從估計(jì)結(jié)果可以看出,所有自變量參數(shù)估計(jì)量的t值均大于臨界值,表明各自變量的斜率系數(shù)在5%顯著水平下顯著不為零,即職工年齡、出差頻率、單位與住處之間的距離、工作滿意度和婚姻狀況等因素對(duì)離職的概率都有顯著影響。在其他條件不變的情況下,年齡每增加1歲,離職概率平均下降0.007;經(jīng)常出差的職工離職概率比不經(jīng)常出差的職工平均高出0.070;單位與住處之間的距離每增加1公里,離職概率平均增加0.004;工作滿意度每提高一個(gè)級(jí)別,離職概率平均下降0.042;已婚職工的離職概率比未婚職工平均低0.060。6.2Logit模型7273由于線性概率模型存在一些問(wèn)題,希望能找到一種變換方法,(1)使解釋變量xi所對(duì)應(yīng)的所有預(yù)測(cè)值(概率值)都落在(0,1)之間。(2)同時(shí)對(duì)于所有的xi,當(dāng)xi增加時(shí),希望yi也單調(diào)增加或單調(diào)減少。顯然累積概率分布函數(shù)F(zi)能滿足這樣的要求。采用累積正態(tài)概率分布函數(shù)的模型稱作Probit模型。用正態(tài)分布的累積概率作為Probit模型的預(yù)測(cè)概率。另外logistic函數(shù)也能滿足這樣的要求。采用logistic函數(shù)的模型稱作logit模型。74756.2.1Logit模型的基本形式Logit模型是一個(gè)離散選擇模型,主要用來(lái)解決分類問(wèn)題。該模型的因變量是取值為0或1的二元變量,自變量沒(méi)有限制,虛擬變量或連續(xù)變量均可。其采用的是Logistic概率分布函數(shù),基本形式為:其中,,F(xiàn)(?)為logistic累積概率分布函數(shù),其分布規(guī)律如圖6-2所示。7677786.2.2Logit模型的估計(jì)由于Logit模型屬于非線性模型,我們不能用普通最小二乘法對(duì)其進(jìn)行估計(jì),一般用極大似然估計(jì)法。極大似然估計(jì)法的基本思想是希望通過(guò)確定模型的參數(shù)使該模型產(chǎn)生已知樣本的概率最大。

主要步驟如下:(1)依據(jù)對(duì)隨機(jī)誤差項(xiàng)的統(tǒng)計(jì)分布假定,計(jì)算單個(gè)樣本的概率密度;(2)將所有樣本的概率密度累乘得到樣本的似然函數(shù);(3)將似然函數(shù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換,從而得到對(duì)數(shù)似然函數(shù);(4)將對(duì)數(shù)似然函數(shù)最大化,求得參數(shù)的極大似然估計(jì)值。796.2.3Logit模型的邊際效應(yīng)邊際效應(yīng)是指自變量變動(dòng)一個(gè)單位對(duì)因變量的影響。與線性概率模型不同,Logit模型中的系數(shù)β并不直接代表自變量X對(duì)于的邊際效應(yīng),而只代表X對(duì)于概率比對(duì)數(shù)的邊際效應(yīng)。806.2.4Logit模型的假設(shè)檢驗(yàn)1.擬合優(yōu)度檢驗(yàn)用樣本的擬合似然值來(lái)對(duì)模型的擬合優(yōu)度進(jìn)行比較。為了區(qū)別于通常的擬合優(yōu)度R2,我們稱樣本的擬合似然值為準(zhǔn)R2

,在stata軟件給出的估計(jì)結(jié)果中記為PseudoR2

。準(zhǔn)準(zhǔn)R2可以作為檢驗(yàn)?zāi)P蛿M合優(yōu)度的統(tǒng)計(jì)量,準(zhǔn)R2越接近于1,模型的擬合效果越好。816.2.4Logit模型的假設(shè)檢驗(yàn)2.總體顯著性檢驗(yàn)似然比檢驗(yàn)類似于檢驗(yàn)?zāi)P驼w顯著性的F檢驗(yàn),原假設(shè)為全部解釋變量的系數(shù)均為0,即檢驗(yàn)的似然比統(tǒng)計(jì)量LR為:

LR較大,表明L與L0的差距較大,傾向于拒絕原假設(shè)而接受模型整體顯著的備擇假設(shè)。826.2.4Logit模型的假設(shè)檢驗(yàn)【例6-2基于logit模型的員工離職影響因素分析】1.模型構(gòu)建本例的因變量label只有離職和未離職兩種結(jié)果,符合logit模型應(yīng)用條件,具體形式為:836.2.4Logit模型的假設(shè)檢驗(yàn)2.參數(shù)估計(jì)846.2.4Logit模型的假設(shè)檢驗(yàn)2.參數(shù)估計(jì)從估計(jì)結(jié)果可以看出,,表明方程總體上是顯著的。各參數(shù)估計(jì)量的z值均大于臨界值1.96,表明各個(gè)自變量的斜率系數(shù)在5%的顯著性水平下都顯著不為零,即職工年齡、出差頻率、單位與住處之間的距離、工作滿意度和婚姻狀況等因素對(duì)離職的概率都有顯著影響。856.2.4Logit模型的假設(shè)檢驗(yàn)3.邊際效應(yīng)(1)平均邊際效應(yīng):.margins,dydx(*)

對(duì)于平均邊際效應(yīng)的解釋與線性概率模型的系數(shù)類似,即在其他條件不變的情況下,年齡每增加1歲,離職概率平均下降0.008;經(jīng)常出差的職工離職概率比不經(jīng)常出差的職工平均高出0.065;單位與住處之間的距離每增加1公里,離職概率平均增加0.004;工作滿意度每提高一個(gè)級(jí)別,離職概率平均下降0.041;已婚職工的離職概率比未婚職工平均低0.061。866.2.4Logit模型的假設(shè)檢驗(yàn)3.邊際效應(yīng)(2)均值邊際效應(yīng):.margins,dydx(*)atmeans

876.2.4Logit模型的假設(shè)檢驗(yàn)3.邊際效應(yīng)(3)特定取值的邊際效應(yīng):.margins,dydx(age)at(age=35)

886.2.4Logit模型的假設(shè)檢驗(yàn)4.預(yù)測(cè)準(zhǔn)確率.estatclas

896.2.4Logit模型的假設(shè)檢驗(yàn)4.預(yù)測(cè)準(zhǔn)確率在圖中,“D”和“~D”是實(shí)際值,“D”表示label!=0(正例),即離職;“~D”表示label=0(負(fù)例),即未離職。“+”和“-”表示預(yù)測(cè)值,“+”表示預(yù)測(cè)的離職概率大于等于0.5,即離職;“-”表示預(yù)測(cè)的離職概率小于0.5,即未離職。在本例中,這兩種情況對(duì)應(yīng)的樣本數(shù)分別為5和921,所以預(yù)測(cè)準(zhǔn)確率為(5+921)/1100=84.18%。圖中的“Sensitivity”(靈敏度)是指正確預(yù)測(cè)的正例數(shù)在實(shí)際正例數(shù)中的比例;“Specificity”(特異性)是指指正確預(yù)測(cè)的負(fù)例數(shù)在實(shí)際負(fù)例數(shù)中的比例;“Positivepredictivevalue”(正例命中率)是指正確預(yù)測(cè)的正例數(shù)在預(yù)測(cè)正例中的比例;“Negativepredictivevalue”(負(fù)例命中率)是指正確預(yù)測(cè)的負(fù)例數(shù)在預(yù)測(cè)負(fù)例中的比例。

6.3Probit模型90916.3.1Probit模型的基本形式Probit模型也叫概率單位模型,與Logit模型一樣,該模型也是離散選擇模型,其被解釋變量是取值為0或1的二元變量,解釋變量沒(méi)有限制,虛擬變量或連續(xù)變量均可。該模型采用的是累積標(biāo)準(zhǔn)正態(tài)分布函數(shù),基本形式為:其中,,為累積標(biāo)準(zhǔn)正態(tài)分布函數(shù)。926.3.1Probit模型的基本形式累積標(biāo)準(zhǔn)正態(tài)分布曲線和logistic曲線很相似,兩條曲線都是在p=0.5處有拐點(diǎn),即斜率在p=0.5時(shí)最大,在累積分布兩個(gè)尾端的斜率逐漸減小。因此,Probit曲線和Logit曲線也很相似,但Logit曲線在兩個(gè)尾部要比Probit曲線厚。曲線對(duì)比如圖6-9所示。936.3.2Probit模型的估計(jì)Probit模型與Logit模型一樣,屬于非線性模型。非線性模型不能用最小二乘法對(duì)其進(jìn)行估計(jì),比較常用的是極大似然估計(jì)。實(shí)際的運(yùn)算過(guò)程中會(huì)發(fā)現(xiàn),通常無(wú)法得到參數(shù)的確切解。因此需要運(yùn)用最大似然法的非線性估計(jì)牛頓迭代法來(lái)求解參數(shù)。946.3.3Probit模型的邊際效應(yīng)在Probit模型中,斜率系數(shù)βj必須乘以概率密度函數(shù)以后才表示

的邊際效應(yīng)。Probit模型對(duì)邊際效應(yīng)的估計(jì)值會(huì)隨概率區(qū)間的變化而變化,這也是該模型相對(duì)于線性概率模型的一大優(yōu)勢(shì)。956.3.3Probit模型的邊際效應(yīng)【例6-3基于Probit模型的員工離職影響因素分析】1.模型構(gòu)建本例的因變量label只有離職和未離職兩種結(jié)果,符合Probit模型應(yīng)用條件,具體形式為:其中,966.3.3Probit模型的邊際效應(yīng)2.參數(shù)估計(jì)

方程總體上是顯著的。除了截距項(xiàng)以外,各參數(shù)估計(jì)量的z值均大于臨界值1.96,表明各個(gè)自變量的斜率系數(shù)在5%的顯著性水平下都顯著不為零,即職工年齡、出差頻率、單位與住處之間的距離、工作滿意度和婚姻狀況等因素對(duì)離職的概率都有顯著影響。976.3.3Probit模型的邊際效應(yīng)3.邊際效應(yīng)

986.3.3Probit模型的邊際效應(yīng)4.預(yù)測(cè)準(zhǔn)確率在本例中,實(shí)際值和預(yù)測(cè)值均為“離職”的樣本數(shù)為2,實(shí)際值和預(yù)測(cè)值均為“未離職”的樣本數(shù)是922,所以預(yù)測(cè)準(zhǔn)確率為(2+922)/1100=84.00%。

996.3.3Probit模型的邊際效應(yīng)5.Logit模型和Probit模型對(duì)比

變量Logit模型Probit模型回歸系數(shù)平均邊際效應(yīng)回歸系數(shù)平均邊際效應(yīng)-0.0597-0.0075-0.0299-0.00680.51550.06480.26580.06060.03250.00410.01720.0039-0.3243-0.0407-0.1761-0.0402-0.4852-0.0610-0.2565-0.0585預(yù)測(cè)準(zhǔn)確率84.18%84.00%準(zhǔn)0.080.07586.4Tobit模型1001016.4.1截取數(shù)據(jù)與斷尾數(shù)據(jù)

Tobit模型屬于受限因變量模型,受限因變量所對(duì)應(yīng)的數(shù)據(jù)由于受到主觀或客觀的限制而無(wú)法完整地反映該變量的真實(shí)總體分布。主要包括斷尾(truncated)數(shù)據(jù)和截取(censored)數(shù)據(jù)。斷尾數(shù)據(jù)是指數(shù)據(jù)的頭部或尾部由于主觀或客觀原因不能進(jìn)入樣本。采集數(shù)據(jù)時(shí),如果只收集大于或者是小于某個(gè)閾值的數(shù)據(jù),而丟失了那些處于閾值之外的數(shù)據(jù),此時(shí)收集的數(shù)據(jù)就是斷尾數(shù)據(jù)。截取數(shù)據(jù)存在一個(gè)取樣的閾值,當(dāng)變量的真實(shí)值低于或超過(guò)該閾值時(shí),數(shù)據(jù)雖然不會(huì)被刪除出樣本,但是它會(huì)變?yōu)殚撝档娜≈刀菢颖镜恼鎸?shí)取值。1026.4.2Tobit模型的基本形式經(jīng)典的Tobit模型是JamesTobin在分析家庭耐用品支出情況時(shí)對(duì)Probit回歸進(jìn)行的一種推廣(Tobit一詞源自Tobin’sProbit),其后又被擴(kuò)展成多種情況。標(biāo)準(zhǔn)的Tobit回歸模型如下:(6.4.1)其中,被稱為潛變量,并且滿足經(jīng)典線性模型假定;是被截取后的被解釋變量;樣本觀測(cè)值以0為界,凡小于0的都截取為0,大于0的則為實(shí)際值。1036.4.2Tobit模型的基本形式Tobit模型是截取數(shù)據(jù)模型的一種特殊情況,即截取下限為0,低于0的因變量取值均被截取為0。對(duì)于更一般的情況,我們可以在任意有限點(diǎn)的左邊和右邊截取,即

其中,α和b代表截取點(diǎn),是常數(shù)。1046.4.3Tobit模型的估計(jì)估計(jì)Tobit模型的最佳方法是極大似然估計(jì)。由于模型中因變量的取值存在分段問(wèn)題,首先需要計(jì)算因變量在不同取值范圍的概率密度函數(shù)。Tobit模型的估計(jì)實(shí)質(zhì)上依賴于其背后潛變量模型的正態(tài)性與同方差性假定。1056.4.4Tobit模型的邊際效應(yīng)與Logit模型和Probit模型一樣,Tobit模型也是非線性模型,估計(jì)量β無(wú)法直接作為被解釋變量Y的邊際效應(yīng),但可以作為潛變量的邊際效應(yīng),因?yàn)橛墒剑?.4.1)可得:即β與潛變量是線性關(guān)系。1066.4.4Tobit模型的邊際效應(yīng)【例6-4商業(yè)醫(yī)療保險(xiǎn)支出影響因素分析】1.變量介紹1076.4.4Tobit模型的邊際效應(yīng)2.模型構(gòu)建本例中的因變量是商業(yè)醫(yī)療保險(xiǎn)支出,雖然商業(yè)醫(yī)療保險(xiǎn)支出的總體分布于一個(gè)很大的正數(shù)范圍內(nèi),但是有相當(dāng)數(shù)量的個(gè)人商業(yè)醫(yī)療保險(xiǎn)支出為0,相當(dāng)于在處存在左邊截取,符合Tobit模型的應(yīng)用條件,構(gòu)建如下模型:1086.4.4Tobit模型的邊際效應(yīng)3.參數(shù)估計(jì)1096.4.4Tobit模型的邊際效應(yīng)3.參數(shù)估計(jì)第7章計(jì)數(shù)模型110111第7章計(jì)數(shù)模型本章主要內(nèi)容泊松回歸模型負(fù)二項(xiàng)回歸模型零膨脹回歸模型計(jì)數(shù)模型綜合示例大數(shù)據(jù)計(jì)量分析案例——在線評(píng)論有用性的影響因素分析7.1泊松回歸模型1121137.1.1泊松回歸模型在計(jì)量分析建模的過(guò)程中,有些因變量只能取非負(fù)整數(shù),即0,1,2,…,比如,病人看病的次數(shù)、企業(yè)申請(qǐng)專利的個(gè)數(shù)、獲得的投票個(gè)數(shù)等。對(duì)于這一類計(jì)數(shù)數(shù)據(jù),常使用“泊松回歸”(Poissonregression)。對(duì)個(gè)體i,記因變量為,假設(shè)觀察值來(lái)自參數(shù)為的泊松分布:

其中,為“泊松分布到達(dá)率”,表示事件發(fā)生的平均次數(shù),由自變量所決定。1147.1.1泊松回歸模型泊松分布的重要性質(zhì)是泊松分布的均值和方差都等于泊松分布到達(dá)率,即:

為了保證非負(fù),假設(shè)的條件期望函數(shù)為:

樣本的似然函數(shù)為:

通過(guò)極大似然法(MLE)可得1157.1.1泊松回歸模型泊松回歸的Stata命令為:.poissonyx1x2x3,rirr.poissonyx1x2x3,rexposure(x1).poissonyx1x2x3,roffset(x1)其中,選項(xiàng)“r”表示使用穩(wěn)健標(biāo)準(zhǔn)差;選項(xiàng)“irr”表示顯示發(fā)生率比;選項(xiàng)“exposure(x1)”表示把ln(x1)作為自變量,并令其系數(shù)為1;選項(xiàng)“offset(x1)”表示把x1作為自變量,并令其系數(shù)為1。1167.1.2泊松回歸模型示例本例選取的數(shù)據(jù)集為轟炸機(jī)打擊及破壞目標(biāo)個(gè)數(shù)數(shù)據(jù)集。因變量y為轟炸機(jī)所打擊并破壞的目標(biāo)個(gè)數(shù),為虛擬變量,表示轟炸機(jī)類型,A-4轟炸機(jī)為0,而A-6轟炸機(jī)為1;為炸彈負(fù)重;為機(jī)組人員飛行經(jīng)驗(yàn)積累的總月數(shù),詳細(xì)數(shù)據(jù)集如表7-1所示:1177.1.2泊松回歸模型示例

1187.1.2泊松回歸模型示例

.summarizey.taby

y的均值為1.533,方差為3.154(即1.7762),方差與均值較為接近,因而考慮選擇用泊松回歸模型進(jìn)行分析。1197.1.2泊松回歸模型示例

.poissonyx1x2x3,r由估計(jì)結(jié)果可以看出,自變量和的系數(shù)不顯著,而x2的系數(shù)在5%的顯著性水平下顯著。準(zhǔn)R^2為0.269,模型擬合效果較好。針對(duì)x1進(jìn)行分析,其為虛擬變量,而A-6轟炸機(jī)從機(jī)型上大于A-4轟炸機(jī),故炸彈載重量應(yīng)大于A-4轟炸機(jī),同時(shí)會(huì)攜帶更多機(jī)乘人員,與x2

,x3有較強(qiáng)的多重共線性。1207.1.2泊松回歸模型示例

.corrx1x2x3x1與x2的相關(guān)系數(shù)為0.71。利用逐步回歸法篩選變量,最終選取單變量x2進(jìn)行回歸。1217.1.2泊松回歸模型示例

.poissonyx2,r

從估計(jì)結(jié)果可以看出,盡管模型的擬合優(yōu)度略有下降(準(zhǔn)R^2為0.229),但自變量x2的系數(shù)顯著。進(jìn)一步分析有,炸彈負(fù)重,即x2每增加一個(gè)單位,轟炸機(jī)所破壞的目標(biāo)個(gè)數(shù)的均值為原來(lái)的倍。7.2負(fù)二項(xiàng)回歸模型1221237.2.1負(fù)二項(xiàng)回歸模型如果因變量的方差明顯大于均值,即存在“過(guò)度分散”,而如果因變量的方差明顯小于均值,則存在“散布不足”

。當(dāng)存在過(guò)度分散情形時(shí),在條件期望函數(shù)的對(duì)數(shù)表達(dá)式中加入一項(xiàng),即:其中,隨機(jī)變量表示條件期望函數(shù)中的不可觀測(cè)部分或個(gè)體的異質(zhì)性,則:假設(shè)

,則可證明服從負(fù)二項(xiàng)分布,然后進(jìn)行MLE估計(jì),這稱為“負(fù)二項(xiàng)回歸”(Negativebinomialregression)。

1247.2.1負(fù)二項(xiàng)回歸模型負(fù)二項(xiàng)分布的概率密度函數(shù)為:負(fù)二項(xiàng)回歸模型的條件期望和條件方差分別為:α為“過(guò)度分散參數(shù)”。1257.2.1負(fù)二項(xiàng)回歸模型負(fù)二項(xiàng)回歸的Stata命令為:.nbregyx1x2x3,rexposure(x1).nbregyx1x2x3,roffset(x1)其中,選項(xiàng)“r”表示使用穩(wěn)健標(biāo)準(zhǔn)差;選項(xiàng)“exposure(x1)”表示把ln(x1)作為自變量,并令其系數(shù)為1;選項(xiàng)“offset(x1)”表示把x1作為自變量,并令其系數(shù)為1。1267.2.2負(fù)二項(xiàng)回歸模型示例本例選取的是學(xué)生缺勤情況的數(shù)據(jù)集,該數(shù)據(jù)集中包含以下變量:daysabs(學(xué)生缺勤天數(shù)),math(學(xué)生的數(shù)學(xué)成績(jī))和虛擬變量prog(學(xué)生參與的培養(yǎng)項(xiàng)目,取值為1,2和3),共314個(gè)樣本。部分?jǐn)?shù)據(jù)如表7-2所示。idmathdaysabsprog10016432100227421003202210041632…………1277.2.2負(fù)二項(xiàng)回歸模型示例.summarizedaysabs,detail從圖中可以看出,因變量daysabs的方差(49.519)遠(yuǎn)大于均值(5.955),故考慮使用負(fù)二項(xiàng)回歸模型進(jìn)行分析。1287.2.2負(fù)二項(xiàng)回歸模型示例.histogramdaysabs,discretefreq1297.2.2負(fù)二項(xiàng)回歸模型示例.nbregdaysabsmathg1307.2.2負(fù)二項(xiàng)回歸模型示例從圖中可以看出,模型整體顯著(LRchi-square=61.69,p<0.01),模型的準(zhǔn)R^2為0.0344。自變量math的系數(shù)顯著(β=-0.006,p=0.017)。與參照組(prog=1)相比,prog=2和prog=3時(shí),系數(shù)均顯著。alpha的95%的置信區(qū)間為[0.7916,1.1844],且LR檢驗(yàn)的p值<0.01,故可在5%的顯著性水平上拒絕“alpha=0”的原假設(shè),即認(rèn)為負(fù)二項(xiàng)回歸比泊松回歸更適用。1317.2.2負(fù)二項(xiàng)回歸模型示例.nbregdaysabsmathg,irr如圖所示,prog=2和prog=3時(shí)的發(fā)生率比分別是參照組,即prog=1時(shí)發(fā)生率比的0.64和0.28。數(shù)學(xué)成績(jī)(math)每增加一個(gè)單位,學(xué)生缺勤的次數(shù)為原來(lái)的0.99,即隨著數(shù)學(xué)成績(jī)的增加,學(xué)生的缺勤次數(shù)會(huì)降低。7.3零膨脹回歸模型1321337.3.1零膨脹回歸模型簡(jiǎn)介在實(shí)際問(wèn)題中,還經(jīng)常會(huì)出現(xiàn)計(jì)數(shù)數(shù)據(jù)中含有大量的“0”值的現(xiàn)象,這會(huì)超出泊松回歸或負(fù)二項(xiàng)回歸模型的預(yù)測(cè)能力。因此,當(dāng)計(jì)數(shù)數(shù)據(jù)中含有大量的“0”時(shí),應(yīng)考慮使用零膨脹模型(即“零膨脹泊松回歸”或“零膨脹負(fù)二項(xiàng)回歸”)。零膨脹模型認(rèn)為計(jì)數(shù)數(shù)據(jù)中隨機(jī)變量取值的“0”來(lái)自于兩部分:一部分隨機(jī)變量的取值只為0,此時(shí)的0稱為“結(jié)構(gòu)零”;另一部分隨機(jī)變量的取值來(lái)自一個(gè)離散分布,此時(shí)的0稱為“抽樣零”。1347.3.1零膨脹回歸模型簡(jiǎn)介零膨脹回歸的Stata命令為:.zipyx1x2x3,inflate(varlist)forcevuong(零膨脹泊松回歸).zinbyx1x2x3,inflate(varlist)forcevuong(零膨脹負(fù)二項(xiàng)回歸)1357.3.2零膨脹回歸模型示例本例選取的為對(duì)游玩者在國(guó)家公園中釣魚情況的調(diào)查數(shù)據(jù),該數(shù)據(jù)集中共有250個(gè)樣本,包括如下變量:count(釣魚條數(shù)),camper(同游者中是否有野營(yíng)者,取值為0或1),child(被調(diào)查者在游玩中攜帶的孩子的個(gè)數(shù))及persons(含被調(diào)查者在內(nèi)的同游者的人數(shù))。countcamperpersonschild001001211010301300031…………1367.3.2零膨脹回歸模型示例首先,查看一下四個(gè)變量的統(tǒng)計(jì)特征:.summarizecountchildpersonscamper1377.3.2零膨脹回歸模型示例本例以count為因變量,在Stata中輸入如下命令來(lái)查看因變量取值的分布情況.histogramcount,discretefreq1387.3.2零膨脹回歸模型示例.zipcountchildcamper,inflate(persons)forcevuong1397.3.2零膨脹回歸模型示例從圖可以看出,模型整體顯著(LRchi-square=187.85,p<0.01)。自變量child對(duì)因變量count的影響為負(fù)向且顯著,自變量camper對(duì)因變量count的影響為正向且顯著。Vuong統(tǒng)計(jì)量的值為3.57(p<0.01),故拒絕泊松回歸,應(yīng)該使用零膨脹泊松回歸。在本例中,因變量的方差遠(yuǎn)大于均值,故進(jìn)一步考慮使用零膨脹負(fù)二項(xiàng)回歸。.zinbcountchildcamper,inflate(persons)forcevuong1407.3.2零膨脹回歸模型示例

7.4計(jì)數(shù)模型綜合示例1411427.4計(jì)數(shù)模型綜合示例該數(shù)據(jù)集包含以下變量:Daysabs(學(xué)生缺勤的天數(shù)),Male(是否為男性,1為男性,0為女性)和Langarts(語(yǔ)言課程成績(jī))。部分樣本數(shù)據(jù)如表7-4所示。DaysabsMaleLangarts4142.450862043.5665713048.41482………1437.4計(jì)數(shù)模型綜合示例直方圖更加直觀地展示了因變量的分布情況。.histogramdaysabs,discretefrequency1447.4計(jì)數(shù)模型綜合示例因變量為計(jì)數(shù)變量,但為了對(duì)照,所以先進(jìn)行線性回歸,結(jié)果如圖所示。.regdaysabsmalelangarts,r1457.4計(jì)數(shù)模型綜合示例下面進(jìn)行泊松回歸,并計(jì)算穩(wěn)健標(biāo)準(zhǔn)差,結(jié)果如圖所示:.poissondaysabsmalelangarts,r1467.4計(jì)數(shù)模型綜合示例為便于對(duì)泊松回歸和線性回歸的系數(shù)進(jìn)行比較,計(jì)算泊松回歸的平均邊際效應(yīng),結(jié)果如圖7-18所示:.margins,dydx(*)從圖7-18可知,泊松回歸的平均邊際效應(yīng)與線性回歸的系數(shù)很接近。1477.4計(jì)數(shù)模型綜合示例為便于解釋系數(shù),下面計(jì)算泊松回歸的發(fā)生率比(IRR).poissondaysabsmalelangarts,rirr1487.4計(jì)數(shù)模型綜合示例使用泊松回歸的前提之一是因變量的均值與方差相等,為此考察因變量daysabs的統(tǒng)計(jì)特征。.sumdaysabs,detail從圖可以看出,因變量的方差遠(yuǎn)遠(yuǎn)大于其均值,存在“過(guò)度分散”現(xiàn)象,因此,下面進(jìn)行負(fù)二項(xiàng)回歸。1497.4計(jì)數(shù)模型綜合示例.nbregdaysabsmalelangarts,ralpha的95%的置信區(qū)間為[1.077,1.543],故可在5%的顯著性水平上拒絕“alpha=0”的原假設(shè),即認(rèn)為負(fù)二項(xiàng)回歸比泊松回歸更適用。1507.4計(jì)數(shù)模型綜合示例由于因變量取0值的較多,故考慮采用零膨脹泊松回歸。.zipdaysabsmalelangarts,inf(_cons)forcevuong從圖可以看出,Vuong統(tǒng)計(jì)量的值為5.49,顯著,故拒絕泊松回歸,應(yīng)該使用零膨脹泊松回歸。1517.4計(jì)數(shù)模型綜合示例進(jìn)行零膨脹負(fù)二項(xiàng)回歸。.zinbdaysabsmalelangarts,inf(_cons)forcevuong1527.4計(jì)數(shù)模型綜合示例從圖可以看出,alpha的95%的置信區(qū)間為[1.069,1.554],故可在5%的顯著性水平上拒絕“alpha=0”的原假設(shè),即認(rèn)為負(fù)二項(xiàng)回歸比泊松回歸更適用。而Vuong統(tǒng)計(jì)量的值為負(fù)數(shù),故拒絕零膨脹負(fù)二項(xiàng)回歸,認(rèn)為應(yīng)該使用標(biāo)準(zhǔn)的負(fù)二項(xiàng)回歸。

綜上,在各種模型設(shè)定中,本例更傾向于使用負(fù)二項(xiàng)回歸模型。7.5大數(shù)據(jù)計(jì)量分析案例——在線評(píng)論有用性的影響因素分析1531547.5.1

案例背景隨著在線評(píng)論的普及,消費(fèi)者可以很容易地在網(wǎng)上找到各種產(chǎn)品或服務(wù)的評(píng)論信息來(lái)幫助他們做出購(gòu)買決策,但這也帶來(lái)了另一個(gè)嚴(yán)重的問(wèn)題,即信息過(guò)載。評(píng)論數(shù)量過(guò)多、垃圾評(píng)論和虛假評(píng)論等使消費(fèi)者很難從在線評(píng)論中找到對(duì)他們的決策有幫助的信息。

鑒于有用評(píng)論對(duì)消費(fèi)者和網(wǎng)站的重要性,本案例將對(duì)影響在線評(píng)論有用性的因素進(jìn)行分析。1557.5.2

數(shù)據(jù)收集與預(yù)處理本案例采用自行開(kāi)發(fā)的爬蟲(chóng)工具在2016年6月抓取了某在線旅游平臺(tái)上所有位于北京的酒店的在線評(píng)論數(shù)據(jù),基本覆蓋了抓取點(diǎn)之前北京市537家酒店,共計(jì)1048575條評(píng)論。抓取的數(shù)據(jù)包括每一條評(píng)論的星級(jí)評(píng)分、評(píng)論正文、發(fā)表時(shí)間、評(píng)論者ID和有用投票數(shù)等,還抓取了每一家酒店的名稱、成立年份、總的評(píng)論數(shù)量、平均星級(jí)等數(shù)據(jù)。1567.5.2

數(shù)據(jù)收集與預(yù)處理為了保證研究的有效性,首先剔除了評(píng)論的星級(jí)評(píng)分為0的樣本以及缺少評(píng)論正文內(nèi)容的樣本;其次,去掉非中文攥寫的評(píng)論樣本;再次,由于近期的評(píng)論沒(méi)有足夠的時(shí)間來(lái)累積有用投票數(shù),故剔除了在數(shù)據(jù)抓取日期前兩個(gè)月內(nèi)發(fā)表的評(píng)論,最終共計(jì)保留805277條有效的在線評(píng)論。對(duì)評(píng)論的文本內(nèi)容,首先使用NLPIR分詞工具(/)對(duì)中文文本進(jìn)行分詞,然后使用臺(tái)灣大學(xué)情感詞典和Hownet情感詞典識(shí)別評(píng)論中出現(xiàn)的正面情感詞匯和負(fù)面情感詞匯。1577.5.2

數(shù)據(jù)收集與預(yù)處理

1587.5.2

數(shù)據(jù)收集與預(yù)處理

變量類別變量名稱測(cè)度指標(biāo)因變量在線評(píng)論有用性(helpfulvotes)在線評(píng)論的累積有用投票數(shù)自變量評(píng)分不一致性(rating_incons)每條評(píng)論的星級(jí)評(píng)分和酒店的平均星級(jí)之間差值的絕對(duì)值評(píng)論的長(zhǎng)度(comments_len)評(píng)論全文的字?jǐn)?shù)平均句子長(zhǎng)度(avg_words)評(píng)論中所有句子的長(zhǎng)度的平均值評(píng)論發(fā)表天數(shù)(edays)抓取日期和評(píng)論發(fā)表日期之差平均星級(jí)(avgrating)酒店的平均星級(jí),取值為1-5調(diào)節(jié)變量產(chǎn)品的評(píng)論總量(total_comments)每個(gè)酒店累積的評(píng)論的個(gè)數(shù)正面情感強(qiáng)度(pos_per)正面情感詞匯的個(gè)數(shù)/總詞匯個(gè)數(shù)負(fù)面情感強(qiáng)度(neg_per)負(fù)面情感詞匯的個(gè)數(shù)/總詞匯個(gè)數(shù)1597.5.2

數(shù)據(jù)收集與預(yù)處理

首先,在Stata命令窗口中輸入如下命令,得到模型中各變量的描述性統(tǒng)計(jì).sumhelpfulvotesrating_inconstotal_commentspos_perneg_percomments_lenavg_wordsedaysavgrating1607.5.2

數(shù)據(jù)收集與預(yù)處理

接著看一下因變量的分布,在Stata命令窗口中輸入如下命令:.tabhelpfulvotes靠前部分結(jié)果如圖所示:可以看出,本案例中的因變量在線評(píng)論有用性是一個(gè)計(jì)數(shù)變量。從其分布來(lái)看,在數(shù)據(jù)集91.60%的樣本中,因變量的取值為0值,且因變量的均值為0.165,方差為0.859,存在零值過(guò)多且過(guò)度分散的問(wèn)題。因此,選用零膨脹負(fù)二項(xiàng)回歸模型更為合適。1617.5.2

數(shù)據(jù)收集與預(yù)處理

1627.5.3

模型估計(jì)

為了去除各變量取值量綱的影響,在回歸前,首先對(duì)產(chǎn)品的評(píng)論總量(total_comments),評(píng)論長(zhǎng)度(comments_len),平均句子長(zhǎng)度(avg_words)和評(píng)論發(fā)表天數(shù)(edays)四個(gè)變量取其自然對(duì)數(shù),分別用lntotal_comments,lncomments_len,lnavg_words和lnedays表示。在Stata中輸入如下命令:.genlntotal_comments=ln(total_comments).genlncomments_len=ln(comments_len).genlnavg_words=ln(avg_words).genlnedays=ln(edays)1637.5.3

模型估計(jì)

為了檢驗(yàn)產(chǎn)品的評(píng)論總量這一連續(xù)型變量的調(diào)節(jié)作用,本案例遵循已有研究將自變量評(píng)分不一致性和調(diào)節(jié)變量產(chǎn)品的評(píng)論總量以及正、負(fù)情感強(qiáng)度做了去中心化處理,在Stata中輸入如下命令,去中心化后的變量用rating_incons1,lntotal_comments1,pos_per1和neg_per1來(lái)表示。.centerrating_incons,generate(rating_incons1).centerlntotal_comments,generate(lntotal_comments1).centerpos_per,generate(pos_per1).centerneg_per,generate(neg_per1)計(jì)算自變量與調(diào)節(jié)變量的交叉項(xiàng),在Stata命令窗口中輸入如下命令:.genincons_num=rating_incons1*lntotal_comments1.genincons_pos=rating_incons1*pos_per1.genincons_neg=rating_incons1*neg_per11647.5.3

模型估計(jì)

本案例采用分層回歸的方法來(lái)檢驗(yàn)自變量的主效應(yīng)和產(chǎn)品的評(píng)論總量以及正、負(fù)情感強(qiáng)度的調(diào)節(jié)效應(yīng)。在零膨脹負(fù)二項(xiàng)回歸的第一步,本案例選用的是logit模型,并選取了rating_incons1,lntotal_comments1,lnedays,lncomments_len,lnavg_words和avgrating這五個(gè)變量作為會(huì)影響一條評(píng)論是否會(huì)被消費(fèi)者閱讀的自變量。首先僅將除rating_incons1外的自變量加入到回歸模型中,即X包括lncomments_len,lnavg_words,lnedays和avgrating四個(gè)控制變量,得到模型1。在Stata中輸入如下命令,模型1的估計(jì)結(jié)果如圖所示。.zinbhelpfulvoteslncomments_lenlnavg_wordslnedaysavgrating,inflate(rating_incons1lntotal_comments1lnedayslncomments_lenlnavg_wordsavgrating)forcevuong1657.5.3

模型估計(jì)

1667.5.3

模型估計(jì)

然后再將自變量rating_incons1和調(diào)節(jié)變量加入模型中進(jìn)行回歸,即X包括自變量rating_incons1,lntotal_comments1,pos_per1和neg_per1三個(gè)調(diào)節(jié)變量,以及l(fā)ncomments_len,lnavg_words,lnedays和avgrating四個(gè)變量,得到模型2。在Stata中輸入如下命令,對(duì)模型2進(jìn)行估計(jì):.zinbhelpfulvotesrating_incons1lntotal_comments1pos_per1neg_per1lncomments_lenlnavg_wordslnedaysavgrating,inflate(rating_incons1lntotal_comments1lnedayslncomments_lenlnavg_wordsavgrating)forcevuong1677.5.3

模型估計(jì)

1687.5.3

模型估計(jì)

最后再將自變量rating_incons1和調(diào)節(jié)變量的交叉項(xiàng)加入模型,即在模型2的基礎(chǔ)上,在X中加入incons_num,incons_pos和incons_neg三個(gè)交叉項(xiàng),得到模型3。在Stata中輸入如下命令,對(duì)模型3進(jìn)行估計(jì):.zinbhelpfulvotesrating_incons1lntotal_comments1pos_per1neg_per1incons_numincons_posincons_neglncomments_lenlnavg_wordslnedaysavgrating,inflate(rating_incons1lntotal_comments1lnedayslncomments_lenlnavg_wordsavgrating)forcevuong1697.5.3

模型估計(jì)

1707.5.4

結(jié)果分析

1717.5.4

結(jié)果分析

1727.5.4

結(jié)果分析

模型3的估計(jì)結(jié)果表明,四個(gè)自變量,即評(píng)論的長(zhǎng)度(comments_len)、平均句子長(zhǎng)度(avg_words)、評(píng)論發(fā)表天數(shù)(edays)和平均星級(jí)(avgrating)對(duì)因變量的影響都是正向且顯著的。自變量評(píng)分不一致性(rating_incons)會(huì)負(fù)向影響因變量評(píng)論有用投票數(shù),回歸系數(shù)為-0.217,即評(píng)論評(píng)分與酒店的星級(jí)評(píng)分間的不一致性越高,評(píng)論獲得的有用投票數(shù)越少。

模型3中評(píng)分不一致性與產(chǎn)品的評(píng)論總量的交叉項(xiàng)的系數(shù)為-0.031,即產(chǎn)品的總評(píng)論量越高,評(píng)分不一致性對(duì)在線評(píng)論有用性的負(fù)向影響越大;評(píng)分不一致性與評(píng)論的正面情感強(qiáng)度的交叉項(xiàng)的系數(shù)為-0.504,說(shuō)明正面情感強(qiáng)度也強(qiáng)化了評(píng)分不一致性對(duì)因變量的負(fù)向影響。而評(píng)分不一致性與評(píng)論的負(fù)面情感強(qiáng)度的交叉項(xiàng)的系數(shù)為0.627,說(shuō)明負(fù)面情感強(qiáng)度弱化了評(píng)分不一致性對(duì)因變量的負(fù)向影響,即評(píng)論的負(fù)面情感強(qiáng)度越強(qiáng),評(píng)分不一致性對(duì)因變量的負(fù)向影響越弱。第8章高維數(shù)據(jù)的套索回歸模型173174第8章高維數(shù)據(jù)的套索回歸模型本章主要內(nèi)容高維數(shù)據(jù)與正則化方法套索回歸模型超參數(shù)的設(shè)定模型估計(jì)與評(píng)估案例分析8.1高維數(shù)據(jù)與正則化方法1751768.1.1高維數(shù)據(jù)問(wèn)題1.維度災(zāi)難高維數(shù)據(jù)的顯著特性之一是樣本點(diǎn)在高維空間的分布常常具有稀疏性,特征變量越多,樣本密度往往越小。高維空間中的數(shù)據(jù)分布是稀疏的,這導(dǎo)致基于大樣本理論的一些統(tǒng)計(jì)方法是失效的,比如核方法、近鄰法等,因?yàn)檫@些方法的隱含假設(shè)是,空間中每一個(gè)樣本點(diǎn)附近有足夠多的樣本點(diǎn)。高維數(shù)據(jù)呈現(xiàn)出的空間分布的稀疏性更傾向于中心區(qū)域稀疏。基于歐幾里得距離、馬氏距離、曼哈頓距離這些距離度量的分類算法在高維空間中很難實(shí)現(xiàn)。這也就是所謂的維度災(zāi)難。1778.1.1高維數(shù)據(jù)問(wèn)題2.多重共線性高維數(shù)據(jù)的另一個(gè)表現(xiàn)是多重共線性。為了獲得更全面的信息,模型中往往會(huì)引入過(guò)多的解釋變量或原始變量的數(shù)學(xué)變形,這一方面增加了數(shù)據(jù)收集的難度和成本投入,另一方面也會(huì)引發(fā)自變量間的信息重疊(多重共線)。1788.1.1高維數(shù)據(jù)問(wèn)題3.過(guò)度擬合對(duì)于高維數(shù)據(jù),建立回歸也很容易出現(xiàn)過(guò)度擬合現(xiàn)象。回歸模型的擬合優(yōu)度會(huì)隨著解釋變量個(gè)數(shù)的增加而遞增,至少是不減的。對(duì)于高維數(shù)據(jù),過(guò)多的解釋變量會(huì)使傳統(tǒng)的OLS回歸在外推預(yù)測(cè)時(shí)表現(xiàn)較差,盡管樣本內(nèi)的擬合效果看似很好。1798.1.1高維數(shù)據(jù)問(wèn)題3.過(guò)度擬合模型的期望測(cè)試誤差是體現(xiàn)模型預(yù)測(cè)能力的指標(biāo)。通常在模型過(guò)于簡(jiǎn)單時(shí)(欠擬合),模型的測(cè)試誤差偏高,但是隨著模型復(fù)雜度的增加,測(cè)試誤差先下降然后轉(zhuǎn)而升高。不論是欠擬合還是過(guò)擬合,模型的外推預(yù)測(cè)能力都比較差。1808.1.2正則化方法正則化方法又稱為壓縮估計(jì)方法,通過(guò)調(diào)節(jié)懲罰項(xiàng)來(lái)對(duì)膨脹的參數(shù)估計(jì)系數(shù)進(jìn)行規(guī)制和壓縮。例如嶺回歸(RidgeRegression)和套索回歸,在損失函數(shù)上附加不同的懲罰項(xiàng)從而尋求模型的稀疏表達(dá)。

通過(guò)構(gòu)造一個(gè)基于模型復(fù)雜度的懲罰函數(shù),即加上一個(gè)對(duì)參數(shù)的約束項(xiàng),也叫做正則化項(xiàng),可以將變量的系數(shù)進(jìn)行調(diào)整或縮小使某些回歸系數(shù)變?yōu)榱悖M(jìn)而達(dá)到變量選擇的目的,降低模型復(fù)雜度。1818.1.2正則化方法嶺回歸由Hoerl和Kennard在1970年提出,目的是解決傳統(tǒng)回歸的多重共線性問(wèn)題。多重共線性是高維回歸的常見(jiàn)問(wèn)題,嶺回歸在求解方面具有唯一解,同時(shí)能降低方差以及緩解過(guò)擬合,因而是高維回歸的有效解決方法。但在變量選擇方面,嶺回歸存在局限,它一般不能把系數(shù)壓縮到零,因而也就無(wú)法實(shí)現(xiàn)變量選擇。8.2套索回歸模型1821838.2套索回歸模型套索回歸能同時(shí)進(jìn)行變量選擇和壓縮估計(jì),很好地解決了變量選擇與模型解釋的問(wèn)題,旨在降低模型復(fù)雜度和不穩(wěn)定程度,增強(qiáng)回歸模型的可解釋性和回歸準(zhǔn)確性。所謂“套索”(Lasso),指套馬的套索,形象地展現(xiàn)出套索回歸的收縮功能。1848.2套索回歸模型套索回歸可以看作一個(gè)以殘差平方和(RSS)為目標(biāo)函數(shù),以懲罰項(xiàng)為約束的優(yōu)化問(wèn)題。在追求RSS最小化的目標(biāo)下加入L1范數(shù)懲罰項(xiàng),即回歸系數(shù)絕對(duì)值之和作為懲罰項(xiàng),也稱為絕對(duì)值收縮。等價(jià)地有以下形式:subjecttosubjectto1858.2套索回歸模型上式中,控制參數(shù)t與λ一一對(duì)應(yīng),控制模型的復(fù)雜程度。t值越大,約束越松,相對(duì)約束越接近于1,越近似于OLS估計(jì)結(jié)果。反之,如果t值越小,約束越緊,相對(duì)約束越接近于0,模型就越稀疏。所以,t值太大(對(duì)變量進(jìn)入模型太放松)可能會(huì)傾向于過(guò)擬合(不僅擬合了數(shù)據(jù)中的信息,同時(shí)也擬合了數(shù)據(jù)中的噪聲),而t值太小可能又會(huì)使模型丟失太多信息(欠擬合),這兩種情況都會(huì)使測(cè)試誤差偏大。1868.2套索回歸模型

對(duì)于更高維度的變量,約束區(qū)域由正方形變?yōu)楦呔S立方體,等值橢圓線變?yōu)楦呔S球體。變量維數(shù)越高,套索回歸估計(jì)值越容易相切在坐標(biāo)軸上(高維立方體的頂點(diǎn)),變量篩選作用越強(qiáng)。8.3超參數(shù)的設(shè)定1871888.3超參數(shù)的設(shè)定

λ是控制模型復(fù)雜程度的重要參數(shù),不同的λ取值,可以得到不同的回歸系數(shù)估計(jì)值。當(dāng)λ=0時(shí),不存在懲罰項(xiàng),故此時(shí)套索回歸與最小二乘法的結(jié)果等價(jià),當(dāng)λ趨于無(wú)窮時(shí),由于懲罰力度過(guò)大,所有變量系數(shù)均被壓縮為零。因此,確定一個(gè)合適的λ值很重要,套索回歸模型通常使用交叉驗(yàn)證法(CrossValidation)確定λ的最優(yōu)解,進(jìn)而得到最優(yōu)模型。

交叉驗(yàn)證法可以虛擬增加數(shù)據(jù)樣本,減少因訓(xùn)練集的變動(dòng)所導(dǎo)致的學(xué)習(xí)性能變化,解決了數(shù)據(jù)擾動(dòng)所造成的影響。同時(shí)交叉驗(yàn)證法中模型的預(yù)測(cè)是所有數(shù)據(jù)訓(xùn)練結(jié)果的平均值,也解決了偏差的問(wèn)題。1898.3超參數(shù)的設(shè)定以k折交叉驗(yàn)證為例,具體做法是:將數(shù)據(jù)集Q劃分為k個(gè)大小相近的子集。每次將其中的k-1個(gè)子集的并集作為訓(xùn)練集,將剩余子集作為測(cè)試集,這樣就得到k組訓(xùn)練集/測(cè)試集,形成k次預(yù)測(cè)結(jié)果,最終得到的測(cè)試誤差為k次測(cè)試結(jié)果的平均值,評(píng)估結(jié)果的穩(wěn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論