




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、市場研究的數據分析方法市場研究的數據分析方法第一節第一節 線性回歸分析線性回歸分析 一、線性回歸方程的基本模型一、線性回歸方程的基本模型 線性回歸方程從樣本資料出發,一般利用最小二乘法,根據回歸直線與樣本數據點在垂直方向上的偏離程度最低的原則,進行回歸方程的參數的求解。 線性回歸分析是考察變量之間的數量關系變化規律,它通過一定的數學表達式-回歸方程,來描述這種關系,以確定一個或幾個變量的變化對另一個變量的影響程度,為預測提供數學依據。1、一元線性回歸模型、一元線性回歸模型模型是: 式中:為被解釋變量(因變量);為解釋變量(自變量),是隨機誤差項,i為觀測值下標,n為樣本容量, 與 是待估參數,
2、稱 為回歸常數,為回歸系數。ii10ixyyx01012、多元回歸模型、多元回歸模型 多元線性回歸模型中自變量的個數在2個以上,模型的一般形式為: i=1,2n 其中, 為被解釋變量(因變量), 為解釋變量(自變量), 是隨機誤差項,i為觀測值下標,n為樣本容量, 為k+1個待估參數, 為回歸常數, 稱為回歸系數。ikiki22i 110ix.xxyyk21x,.,x ,xk210,.,k21,.,0在應用線性回歸模型時,必須滿足以下假設:在應用線性回歸模型時,必須滿足以下假設: (1)解釋變量 是確定性變量,而且解釋變量之間不相關。 (2)隨機誤差項具有0均值和同方差。 (3)隨機誤差項在不
3、同樣本點之間是獨立的,不存在序列相關。 (4)隨機誤差限于解釋變量之間不相關。 (5)隨機誤差項服從0均值和同方差的正態分布。k21x,.,x ,x二、線性回歸方程的統計檢驗二、線性回歸方程的統計檢驗 1、回歸方程擬合優度檢驗 2、回歸方程的顯著性檢驗 3、回歸系數顯著性檢驗 三、回歸分析假設條件的檢驗三、回歸分析假設條件的檢驗 1、殘差分析 2、多重共線性 3、誤差項的序列相關 四、線性回歸分析的基本步驟四、線性回歸分析的基本步驟1、確定回歸中的自變量和因變量。2、從收集到樣本資料出發確定自變量和因變量之間的數學關系,即建立回歸方程。3、對回歸方程進行各種統計檢驗。4、利用回歸方程進行預測。
4、 例:checkers pizza公司是休斯敦附近westbury鎮上僅有的從事比薩餅送貨業務的兩家公司之一,其直接競爭對手是歐文公司,提供相同的產品與服務。另外麥當勞也是它的一個重要競爭者。在過去的24個月中,該公司的銷售量(q)、價格(p),小鎮上居民的人均收入(m),歐文公司產品的價格(p歐文)以及麥當勞產品的價格(p麥當勞)。假定下個月公司產品價格為9.05,人均收入為26614元,歐文公司產品的價格10.2元,麥當勞產品的價格為1.15元,請預測該公司下個月的銷售量。五、實例分析五、實例分析 首先checkers pizza公司根據資料估計下面的線性需求方程的參數: 式中: q比薩餅
5、的銷量; p比薩餅的價格 m小鎮居民的人均收入 p歐文歐文公司產品的價格 p麥當勞麥當勞產品的價格下面是spss11.0的輸出結果:m mo od de el l s su um mm ma ar ry y.985a.970.96434.70896model1rr squareadjusted rsquarestd. error ofthe estimatepredictors: (constant), p麥當勞, p歐文, m, pa. a an no ov va ab b736912.314184228.078152.923.000a22889.523191204.712759801.83
6、23regressionresidualtotalmodel1sum ofsquaresdfmean squarefsig.predictors: (constant), p麥當勞, p歐文, m, pa. dependent variable: qb. c co oe ef ff fi ic ci ie en nt ts sa a-343.784414.076-.830.417-195.89511.041-1.037-17.743.0007.472e-02.010.4057.359.000174.40331.712.2325.500.00081.05722.166.1663.657.002(
7、constant)pmp歐文p麥當勞model1bstd. errorunstandardizedcoefficientsbetastandardizedcoefficientstsig.dependent variable: qa. 從上面的輸出結果可以看出,模型可以解釋97%的比薩餅銷售量的變化;模型整體非常顯著,f統計的相伴概率值p=0.000;四個參數b、c、d、e非常顯著,t統計的相伴概率值p都遠小于0.01。 所以,回歸方程為: 該公司下一個月比薩餅的銷量為; 第二節第二節 判別分析判別分析 一、判別分析法的基本思想一、判別分析法的基本思想 判別分析包括以下兩步: 1、分析和解釋各
8、類指標之間存在的差異,并建立判別函數。 2、以第一步的分析結果為依據,將對那些未知分類屬性的案例進行判別分類。二、判別分析基本模型與統計術語二、判別分析基本模型與統計術語 (一)假設條件1、每一個類別都取自一個多元正態總體的樣本2、所有正態總體的協方差矩陣或相關矩陣都相等 (二)基本模型 1、先驗概率 2、后驗概率 3、判別系數4、結構系數 5、分組的矩心 6、判別力指數7、殘余判別力 (三)統計術語(三)統計術語三、分析的基本步驟三、分析的基本步驟 判別分析一般都是通過現成的統計軟件進行分析。一般而言,利用統計軟件的判別分析具體包括以下步驟:確定研究確定研究的問題的問題獲取判別分獲取判別分析
9、的數據析的數據進行判別進行判別分析分析評價和解釋評價和解釋分析結果分析結果 某公司生產一新產品,該公司在新產品末大量上市以前,進行了一次市場調查。公司將新產品寄給十五個代理商,并附意見調查表,要求對該產品給予評估并說明是否愿意購買。評估的因素有:式樣、包裝及耐久性。評分用10分制,高分表示特性良好,低分則較差。其中有三位代理商沒有表明自己的購買意愿。 那么這些代理商是屬于“非購買組”還是“購買組”? 四、實例分析四、實例分析 以下是spss11.0的部分輸出結果: s st ta an nd da ar rd di iz ze ed d c ca an no on ni ic ca al l
10、d di is sc cr ri im mi in na an nt tf fu un nc ct ti io on n c co oe ef ff fi ic ci ie en nt ts s.910.083.254式樣包裝耐久性1function 表中,式樣 、包裝和耐用性的標準化系數分別為0.91、0.083、0.254。因而,式樣是最重要的判別變量,其次是“耐用性”,最后是包裝。c ca as se ew wi is se e s st ta at ti is st ti ic cs s11.50011.000.4542.00017.8772.15511.4201.969.6512.0
11、317.548.67411.16411.0001.9352.00024.4522.87211.6481.991.2082.0099.5951.02411.9251.999.0092.00113.3131.57511.9691.998.0012.00212.3581.44211.3911.963.7362.0377.269.62322.6181.989.2491.0119.336-1.57522.7601.995.0941.00510.550-1.76722.1311.7212.2811.2794.177-.56322.57211.000.3191.00016.962-2.63822.08011
12、.0003.0641.00028.136-3.823ungrouped2.3871.962.7481.0387.230-1.208ungrouped1.6481.991.2082.0099.5951.024ungrouped2.7991.996.0651.00410.885-1.81811.66331.0001.5842.00018.18911.8003.9611.0062.0397.39811.17831.0004.9102.00031.80011.2473.9644.1422.03610.72412*.0003.97485.9341.02693.19411.8623.996.7482.00
13、411.65511.6463.9451.6602.0557.36222.9343.984.4281.0168.69822.0623.9467.3201.05413.04221*.09131.0006.4572.00021.79022.57431.0001.9941.00017.42822.02731.0009.2081.00045.539case number123456789101112131415123456789101112originalcross-validatedaactual grouppredictedgrouppdfp(dd | g=g)p(g=g | d=d)squared
14、mahalanobisdistance tocentroidhighest groupgroupp(g=g | d=d)squaredmahalanobisdistance tocentroidsecond highest groupfunction 1discriminantscoresfor the original data, squared mahalanobis distance is based on canonical functions.for the cross-validated data, squared mahalanobis distance is based on
15、observations.misclassified case*. cross validation is done only for those cases in the analysis. in cross validation, each case is classified by the functions derived from all cases other than thatcase.a. 表中最大概率組一欄是判別分析得出的組別。13、15號代理商屬于“非購買組”,14號代理商屬于“購買組”。 第三節第三節 聚類分析聚類分析一、聚類分析的基本思想一、聚類分析的基本思想 聚類分析
16、(又稱數字分類學)是新近發展起來的一種研究分類問題的多元統計分析方法。 樣品聚類是對事件進行聚類,或是說對觀測量進行聚類,是對反映被觀測對象的特征的變量值進行分類。 變量聚類則是當反映事物特點的變量很多時,根據所研究的問題選擇部分變量對事物的某一方面進行研究的聚類方法。二、距離與相似系數二、距離與相似系數 (一)常用的距離指標有 1、歐式距離 2、歐式距離的平方 3、曼哈頓距離 4、切比雪夫距離 (二)常用的相似系數指標主要有 1、余弦系數 2、皮爾遜相關系數 (三)定類數據的距離 1、卡方距離 2、法方距離 三、聚類方法三、聚類方法 1層次聚類法 2迭代聚類法 四、聚類分析的主要步驟四、聚類
17、分析的主要步驟 確定研究的問題計算相似性聚類聚類結果的解釋和證實 某家具公司為了對市場進行的細分,對購買家具的顧客進行了一次市場調查。這次調查的指標有:喜愛的款式(老式為1,新式為2),圖案(素式為1,格字為2,花紋為3);顏色(藍色為1,黃色為2,紅色為3,綠色為4)。調查樣本為30人。 五、實例分析:五、實例分析:顧客式樣圖案顏色12 3 456 789101112131415161718192021222324252627282930112 212121212121121221212212121 3 2 3 3 1 2 1 3 2 1 3 2 3 1 2 2 3 2 1 3 2 3 2
18、3 1 3 1 1 3 21 24323241143224324143432142243 根據聚類結果,這30名顧客分為3類,可以較好的反映這些顧客對家具的偏好類型: 第一類: 1,9,13,17,24 第二類:2,3,4,5, 6,7,8,11,12,15,16,18,20,21,22,23,26,28,29,30 第三類: 10,14,19,25,27 第四節第四節 因子分析因子分析一、因子分析的基本思想一、因子分析的基本思想 因子分析是一項多元統計分析技術,其主要目的就是簡化數據。它通過研究眾多變量之間的內部依賴關系,探求觀測數據中的基本結構,并用少數幾個假想變量來表示基本的數據結果。這
19、些假設變量是不可觀測的,通常稱為因子。它們反映了原來眾多的觀測變量所代表的主要信息,并能解釋這些觀測變量之間的相互依存關系。 二、因子分析的數學模型和相關統計量二、因子分析的數學模型和相關統計量 (一) 數學模型 (二)相關統計量 1、因子載荷 2、共同度 3、因子的貢獻 4、巴特利特球體檢驗 5、kmo指數 三、因子分析的基本步驟三、因子分析的基本步驟1、確定研究變量。2、計算所有變量的相關矩陣。3、構造因子變量。4、因子旋轉。5、計算因子得分。四、實例分析四、實例分析 某公司為了了解消費者對牛肉、色、羊肉、豬肉及雞等五種肉類食物的偏好傾向,進行了一次市場調查。請10位消費者對這五種肉類進行
20、評分。評分采用十分制,分數越高表示越喜歡。調查結果列于下表。試用因子分析方法研究影響消費者選擇食物的因素。 r ro ot ta at te ed d c co om mp po on ne en nt t m ma at tr ri ix xa a.791 .736-.393-.649-.211-.184.761.127.715雞魚牛肉豬肉羊肉12componentextraction method: principal component analysis. rotation method: varimax with kaiser normalization.rotation conver
21、ged in 3 iterations.a. 上表是spss11.0輸出的旋轉后的因子載荷矩陣。我們可以依此推斷兩個公共因子的含義。從表中的數據來看,雞、魚、牛肉在第一公共因子的因子載荷值較高,而在第二公共因子的因子載荷值較低,故第一公共因子反映雞、魚、牛肉的公共特性。第一公共因子可能代表脂肪少。而羊肉、豬肉在第二公共因子的因子載荷值較高,在第一公共因子的因子載荷值較低,這說明第二公共因子反映羊肉、豬肉的公共特性,第二公共因子可能代表價格。因而我們可以認為脂肪和價格是決定消費者肉類消費的主要因素。第五節第五節 對應分析對應分析 一、對應分析的基本思想一、對應分析的基本思想 對應分析,又稱為相應
22、分析,是在r型和q型因子分析基礎上,發展起來的一種多元相依的變量統計分析技術。它通過分析由定性變量構成的交互匯總表來揭示變量間的關系。當以變量的一系列類別以及這些類別的分布圖來描述變量之間的聯系時,使用這一分析技術可以揭示同一變量的各個類別之間的差異以及不同變量各個類別之間的對應關系。 二、有關統計術語與資料格式二、有關統計術語與資料格式(一)統計術語 1、列聯表 2、主成分 3、慣量和特征值 4、卡方、似然比卡方、曼圖漢斯澤魯卡方、法系數、列聯系數(二) 數據格式三、分析的步驟三、分析的步驟 1、 確定研究的內容 2、 獲取分析資料 3、 對列聯表作對應分析 4、 解釋結果意義 5、 評價分
23、析結果四、實例分析四、實例分析 某公司進行一次市場調查,得到轎車特征于一些用戶特征的數據。如有: 轎車大小(大、中、小)、轎車類型(家用型、跑車、商用車)、 收入(一份收入、雙份收入)、狀態(已婚、已婚有孩子、未婚、未婚有孩子)、房子(租房、買房)等數據。現請分析它們之間的聯系。dimension 11.51.0.50.0-.5-1.0dimension 22.01.51.0.50.0-.5-1.0-1.5nhomenmaritnincomentypensize租房買房未婚有孩子未婚已婚有孩子已婚雙份收入一份收入商用車跑車家用車大型中型小型 1、已婚有孩子、家用車和中型車相關性較大。 2、已婚
24、和雙份收入有聯系,已婚、已婚有孩子和買房也有一定的聯系。 3、未婚、一份收入和租房之間關系緊密。 4、跑車與小型車之間也有關系。從對應圖可以推斷出下面一些結論:從對應圖可以推斷出下面一些結論:,我們在進行市場細分、制定營銷戰略方面可以充分利用這些信息。例如:面向已婚家庭應重點推銷中型家用車。而那些未婚、一份收入、租房的消費者,因其經濟條件方面的原因,他們難以成為轎車消費的目標顧客群。另外現沒有適合雙份收入、已婚的消費者的車型,應考慮開發新車型滿足他們的需求。第六節第六節 多維偏好分析多維偏好分析一、主成分分析法簡介一、主成分分析法簡介 (一)主成分分析的基本思想 主成分分析法就是將原來眾多具有
25、一定相關性的指標(如p個指標),重新組合成一組新的相互無關的綜合指標來代替原來的指標。 (二)主成分分析的數學模型 (三)主要統計術語 1、偏好評分 2、特征值或慣量二、分析的基本步驟二、分析的基本步驟 1、確定研究的問題 2、資料的收集 3、主成分分析 4、偏好圖并解釋結果意義 三、實例分析三、實例分析 某心理學期刊作了一項市場調查,以了解自己刊物與現有的其它心理學刊物的相對定位。他們挑選10種心理學刊物,請39個專業心理學家根據他們對這些刊物的偏好按1-10的量表評分,其中“1”代表低評價,“10”代表高評價。 利用spss categories princals過程的“非線性”主成分分析
26、方法對上表的資料進行分析,部分結果如下: 這些刊物表現為以下分組:1)一個“硬”組,包括jexp,pmet,mvbr,japp,或許bull 2)一個“發展”組,包括jedp,hude 2、成份加載圖表: 箭頭指向相同的心理學家的偏好相似。如,圖形左上方的“d”組的發展和教育心理學家偏好教育心理學雜志和人類發展兩種期刊。其它組心理學家的偏好也很明顯,都集中指向其研究方向的期刊。 3、雙圖: 4、模型總結 最后結果說明,總的擬合情況好:二維順序方案占總方差的大約82%。 第七節第七節 多維尺度法多維尺度法 一、多維尺度法的基本介紹一、多維尺度法的基本介紹 具體主要包括兩步: (1)初步圖形結構的構造。 (2)初步圖形結構的修改。二、統計術語與數據格式二、統計術語與數據格式 (一)統計術語 1、接近程度 2、空間圖 3、克魯斯卡系數 4、殘差 (二)數據格式 多維尺度法輸入的數據
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 影像科病理管理制度
- 心外科流程管理制度
- 快檢室設備管理制度
- 總公司貨運管理制度
- 總經理預約管理制度
- 慈善會培訓管理制度
- 戰略部部門管理制度
- 排放瓦斯油管理制度
- 接種證查驗管理制度
- 收支結余率管理制度
- 江西省九江市2023–2024學年八年級下學期期末考試道德與法治試題(無答案)
- 小學語文部編版六年級下冊全冊閱讀知識點(分單元課時編排)
- JBT 2231.3-2011 往復活塞壓縮機零部件 第3部分:薄壁軸瓦
- 2024-2030年中國果醬行業市場規模調研及前景趨勢預測報告
- 2024中車大連機車車輛限公司招聘高校畢業生170人高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 2023年中移動家庭網關終端技術規范
- 2024年湖南省公安廳機關警務輔助人員招聘筆試參考題庫附帶答案詳解
- 2021年4月自考03200預防醫學二試題及答案含解析
- (新版)光伏產業技能競賽理論試題庫及答案(濃縮500題)
- 青春期的婦科知識講座
- 中考語文二輪專題復習《詩歌賞析之情感把握復習》公開課一等獎創新教學設計
評論
0/150
提交評論