




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九章
資料的整理與分析
中國礦業大學管理學院學習目標理解數據控制和檢測的重要性掌握數據錄入的過程及其方法學習將調查數據表格化的方法學會建立和解釋交叉列表(橫列表)掌握統計分析的基本技巧一、資料整理確認和編輯編碼數據錄入數據清理1.確認確認的目的是盡可能確保每份問卷都是有效問卷。有效是指訪談是否按適當的方式進行,訪問員有沒有作假。確認被調查者是否真正接受了調查?被調查者是否符合抽樣條件?確認調查是否按要求的方式進行?確認調查是完整?其他方面的問題。2、編輯:現場編輯現場編輯(fieldediting)就是初步編輯,其主要任務是發現資料出非常明顯的遺漏和錯誤,幫助控制和管理實地調查隊伍,應在問卷實施后盡快執行,以便問卷能在調查員解散之前得到校正。1問卷填寫是否完整,有無漏答的問題2檢查每份問卷是否按規定填寫,字跡是否
清楚。3相關問題是否產生矛盾,不一致的現象,
“其他”選項說明是否填寫清楚4開放式問題是否都有詳細的文字記錄5若發現問卷漏答、矛盾、不合邏輯的問題
超過5題,該份問卷應該作廢。2、編輯:辦公室編輯辦公室編輯(in-houseediting)現場編輯的工作最后歸結到復查和訪問上,辦公室的編輯工作最后歸結到對查出的問題如何處理上。主要問題:不完整答卷:①大面積無回答;②個別問題無回答;③相當多的問卷對同一個問題無回答。明顯的錯誤答案:指那些前后不一致的答案,或答非所問的答案。3.編碼編碼是對一個問題的不同回答進行分組和確定數字代碼的過程。大多數問卷中的大多數問題是封閉式問題,并且已經預先編碼。
開放式和半開放式問題的編碼列出答案合并答案設置編碼輸入如編碼
你為什么最喜歡喝彭城啤酒?
1口感好2比較清淡3我喜歡這種口味4大家都喝這種品牌5市場上這種啤酒最暢銷6不知道7朋友們都喝這種啤酒8價格便宜9因為它是新品牌10它是徐州人自己的啤酒11它的口味不如別的啤酒重12平時在商店購買方便13沒什么特殊的理由14我無所謂15大多數人都喝它16說不出來17我喜歡彭城啤酒這個品牌答案歸類要點回答項分好的數字編碼喜歡這種口味1,2,3,11
1價格因素8
2從眾因素4,5,7,15
3購買方便12
4不知道6,13,14,16
5區域因素10
6品牌喜好9,17
74.數據錄入與清理數據錄入:p239對錄入數據的審核二、應用于市場調研的統計分析類型描述分析Descriptiveanalysis推理分析Inferentialanalysis差別分析
Differencesanalysis聯合分析Associativeanalysis預測分析Predictiveanalysis描述分析DescriptiveanalysisCertainmeasuressuchasthemean,mode,standarddeviationorrangeareformofdescriptiveanalysis作用數據抽象與減縮方法次數分布,算術平均數,中位數,眾數,標準差與全距(極差)推理分析Inferentialanalysis作用確定總體參數,進行假設檢驗例估計總體數值方法參數估計,假設檢驗,顯著差異檢驗差別分析
Differencesanalysis作用確定兩組間所存在的差異是否顯著例一個樣本中的兩個均值之間的差異是否顯著方法差異檢驗,方差分析聯合分析Associativeanalysis作用確定現象間的關系例確定兩個變量間是否存在相互關系,如顧客滿意度與企業形象方法相關分析方法,交叉表
預測分析Predictiveanalysis作用基于統計模型的預測例根據一個變量的數值來預測另一個變量的數值方法時間數列分析,回歸分析1.頻數分布有時營銷調研人員需要了解有關單個變量的信息本品牌的使用者中有多少稱得上是品牌忠誠者?有多少個顧客對新產品很熟悉?多少比較熟悉?有多少顧客對飯菜的口味滿意?多少不滿意?頻數分布:了解對一個變量選擇不同取值的調查對象數量。對一個變量的頻數分布會產生頻數、百分比、累積百分比幾個數據。頻數分布作用:有助于明確未回答者的多少,同時也能顯示不合格答案的多少;可以檢驗奇異值和極端值;根據頻數分布可以劃出各種統計圖形。頻數分布頻數分布所想購買的戶型頻數百分比有效百分比累積百分比一室一廳一衛32.132.192.19兩室一廳一衛3927.6628.4730.66兩室兩廳一衛128.518.7639.42兩室兩廳兩衛96.386.5745.99三室一廳一衛3222.7023.3669.34三室一廳兩衛1510.6410.9580.29三室兩廳一衛42.842.9283.21三室兩廳兩衛107.097.3090.51四室兩廳兩衛10.710.7391.24措層21.421.4692.70越層21.421.4694.16其他85.675.84100.00Total13797.16100.00Missing42.84Total141100.00
頻數分布2.描述性統計分析
集中趨勢統計指標均值/平均數(mean)眾數(mode)中位數(median)離散程度指標全距/極差(range)方差(variance)和標準差(standarddeviation)平均數反映總體分布的集中趨勢;反映總體現象的共性特征;是總體分布的重要數量特征值;平均數的局限性一個身高180的不會游泳的人想涉水過河,已知河的平均深度為1米,此人是否過河?為什么?某人想購買一臺冰箱,現有如下信息:
冰箱品牌AB平均使用年限1010最多使用年限2012最少使用年限28陳述總平均平均值差別有無錄象機是必需品4.65.64.11.6目前錄象機價格太貴5.34.16.1-1.9國產錄象機質量尚可3.94.23.70.5樣本大小500185315例:人們對與錄象機有關的問題的看法眾數M眾數是出現最頻繁的數值,是分布中的高峰。無眾數
數據: 10.3 4.9 8.9 11.7 6.3 7.7一個眾數
數據: 6.3 4.9 8.9 6.3 4.9
4.9一個以上的眾數
數據: 21 28
28 41 43
43中位數中位數是指把所有數據按照升序或降序排列后居中的數值。如果數據為奇數項,中位數是中間位置的數值如果數據為偶數項,中位數是中間位置兩個數值的平均數中位數數據:10.3 4.9 8.9 11.7 6.3 7.7順序:4.9 6.3 7.7
8.9 10.3 11.7位置:1 2 3
4 5 6當總體單位數n為奇數時當總體單位數n為偶數時小故事:騙人的“平均數”M:吉斯莫先生有一個小工廠,生產超級小玩意兒。M:管理人員由吉斯莫先生、他的弟弟、六個親戚組成。工作人員由5個領工和10個工人組成。工廠經營得很順利,現在需要一個新工人。M:現在吉斯莫先生正在接見薩姆,談工作問題。吉斯莫:我們這里報酬不錯。平均薪金是每周300元。你在學徒期間每周得75元,不過很快就可以加工資。騙人的“平均數”M:薩姆工作了幾天之后,要求見廠長。薩姆;你欺騙我!我已經找其他工人核對過了,沒有一個人的工資超過每周100元。平均工資怎么可能是一周300元呢?吉斯莫:啊,薩姆,不要激動。平均工資是300元。我要向你證明這一點。吉斯莫:這是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六個親戚每人得250元,五個領工每人得200元,10個工人每人100元。總共是每周6900元,付給23個人,對吧?騙人的“平均數”薩姆:對,對,對!你是對的,平均工資是每周300元。可你還是蒙騙了我。吉斯莫;我不同意!你實在是不明白。我已經把工資列了個表,并告訴了你,工資的中位數是200元,可這不是平均工資,而是中等工資。薩姆:每周100元又是怎么回事呢?吉斯莫:那稱為眾數,是大多數人掙的工資。吉斯莫:老弟,你的問題是出在你不懂平均數、中位數和眾數之間的區別。薩姆:好,現在我可懂了。我……我辭職!離散程度指標:①全距測量的是數據的分散程度,就是樣本中最大值與最小值之差。全距直接到奇異值的影響反映標志值的變動范圍全距計算簡便,易于理解,應用普遍。全距的計算:全距=最大標志值-最小標志值離散程度指標:②標準差標準差是各單位標志值與其平均數的離差平方的算術平均數的平方根,它表示每個標志值與平均數的平均距離。例子教育程度均值中位數眾數方差全距初中1.151.001.000.492.00高中/技校1.231.001.000.582.00中專1.481.001.001.044.00大專1.791.001.001.525.00大學本科或以上2.051.001.001.905.00Total1.471.001.001.165.00各種統計數量適用的情況尺度類別尺度順序尺度等距尺度與比率尺度集中趨勢眾數中位數均值離散趨勢頻率或百分比分布累計百分率分布標準差,全距3.橫列表(交叉列表)分析需要研究的問題:品牌忠誠者中有多少是男性?對新產品的熟悉程度與年齡和教育水平有關嗎?產品的擁有狀況與收入的高低有關嗎?產品的使用量與對戶外活動的興趣有關嗎?3.橫列表(交叉列表)分析1)橫列表分析的意義:
橫列表分析就是同時將兩個或兩個以上的變量,按照一定的順序排列在一張表中,從中分析變量間的關系,得出科學的結論橫列表分析及其結果很容易接受和理解;許多市場研究項目的數據處理分析可以依賴其得到解決;通過一系列的橫列表分析,可以深入分析和認識復雜的事物或現象;清楚明確的解釋能使調研結果很快成為經營管理措施的有力依據;橫列表中變量(因素)的選擇例:某保險公司對影響保險戶開車事故率的因素進行調查,并對各種因素進行橫列表分析。有無事故百分比%有39無61樣本量(人)17800有無事故男女有4434無5666樣本量(人)9320848039%的保險戶在開車時出現過事故。男性在開車時出現事故的百分比高于女性。距離事故男(%)女(%)>1萬KM≤1萬KM>1萬KM≤1萬KM有49275027無51735073樣本量(人)7170215024306050事故率與駕駛距離成正比而與性別無關。選擇和確定橫列表分析中的變量,包括其內容和數量,應根據調研項目的特征而異。
橫列表使用成功取決于研究者選擇關鍵變量以及根據這些因素組成橫列表的能力。在簡單的事實收集研究中,要考慮的因素已在調研要求中明確列出,只不過把資料按需要的形式組合。例:家庭收入水平與攝像機的擁有率。在描述性研究中,研究者有較大的自由度來選擇因素,表中所需因素取決于委托人的要求和研究者直觀的探索。在探索性研究中,可憑直覺選擇所有的用于橫列表的因素。例:影
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年全球及中國外延片檢測系統行業頭部企業市場占有率及排名調研報告
- 2025-2030年中國四耳接線盒項目投資可行性研究分析報告
- 2024年全球及中國商業養老服務中心行業頭部企業市場占有率及排名調研報告
- 洪洞格賓石籠施工方案
- 2025年海上風電場工程項目可行性研究報告
- 進度分析報告示例
- 證券知識培訓課件
- 中國制傘市場深度調查及發展前景研究預測報告
- 2025年中國彈性水泥防水涂料行業市場發展前景及發展趨勢與投資戰略研究報告
- 股權轉讓合同
- 2025年04月中國熱帶農業科學院橡膠研究所第一批公開招聘16人(第1號)筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- GB/T 27030-2025合格評定第三方符合性標志的通用要求
- 口腔科人員應急替代方案
- 高中幾何光學基礎知識
- 2025抽水蓄能電站風險評估導則
- 2025年礦井維修鉗工(高級)職業技能鑒定參考試題庫(含答案)
- 2025年湖南省郴州市中考一模道德與法治試卷(含答案)
- 肺癌放射治療進展
- 2025年中國融通文化教育集團有限公司招聘筆試參考題庫含答案解析
- 2025年山東省安全員-C證考試(專職安全員)題庫及答案
- 2025年廈門大學嘉庚學院圖書館員招考高頻重點模擬試卷提升(共500題附帶答案詳解)
評論
0/150
提交評論