抽樣設計課件_第1頁
抽樣設計課件_第2頁
抽樣設計課件_第3頁
抽樣設計課件_第4頁
抽樣設計課件_第5頁
已閱讀5頁,還剩53頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三講

樣本設計SAMPLEDESIGN

抽樣的基本概念

定義目標總體非概率樣本設計概率樣本設計樣本量的的確定不回答問題內容提要【案例】誰會是下一任美國總統?在社會科學研究中,美國大選前的民意測驗對抽樣方法的發展起到了重要的推動作用。《文摘》雜志于1936年進行的總統選舉結果預測就是一個經典的例子。為了預測1936年美國總統選舉結果,《文摘》開展了一項龐大的民意測驗,向從電話號碼簿和車牌登記名單中抽取的1000萬人郵寄了問卷,收回了240萬份問卷。該調查結果預測共和黨候選人蘭登(Landon)將以57%對43%擊敗民主黨候選人羅斯福,但實際結果是蘭登以38%對62%敗北。這項耗資巨大的調查使該雜志因資金困難和名譽掃地而破產。這個案例告訴了我們什么?來源:

抽樣(sampling)是根據一定的規則和程序,從研究總體中抽取其中的一部分樣本的過程。

總體(population)

指的是享有一些共同特征、構成某項研究對象的所有個體的集合,代表總體某些特征的統計指標叫參數(parameters)。

樣本(sample)

是從總體中選出來的一部份成員,樣本特征叫統計量(statistics),可用來對總體參數進行推斷。一、抽樣的基本概念抽查與普查的適用條件你覺得汽車碰撞試驗的有效性如何?標準抽查普查預算時間總體規模特征差異抽樣誤差成本非抽樣誤差成本測量的性質對個案的關注小短大小低高破壞性是大長小大高低非破壞性否抽樣過程確定抽樣框架選擇抽樣方法確定樣本規模抽取樣本定義總體二、定義目標總體目標總體(targetpopulation)

是某項研究所要推論的所有個體的集合,是通過研究要對其進行描述和推論的總體。抽樣總體(samplingpopulation)

是從中實際抽取樣本的所有個體的集合,通常依據抽樣框架來加以定義。應該根據內容、范圍和時間三重標準定義目標總體。討論:目標總體的確定假如鳳凰網要進行一項SUV品牌美譽度調查,請問:應當如何定義調查的目標總體與抽樣總體?確定抽樣框架抽樣框架(samplingframe)是抽樣總體的可操作性定義,由一份完整的名單或一組用于識別目標總體的文字說明組成。在編制抽樣框架時常見的問題如下:遺漏-遺漏部分樣本單位;聚堆-缺乏個體樣本單位信息;重復-同一樣本單位重復出現;混雜-抽樣框架中包括部分非樣本總體成員。過濾問題為了確定某一個體是否屬于抽樣總體,常有必要使用過濾問題。除了某項研究的特殊要求以外,營銷研究通常要求研究對象:過去3個月內沒有接受任何產品或廣告調查;本人及家庭成員不在有關的公司工作?!纠看笾谐鞘信詼p肥品市場分層研究:目標總體目標總體:2003年中國大中城市女性減肥品的現有消費者和潛在消費者抽樣總體:十個代表城市中,A公司銷售人員在其產品銷售終端可以接觸到的年齡在20-50周歲之間的女性減肥品現有消費者和潛在消費者狗糧市場需求調查的目標總體?抽樣方法三、選擇抽樣方法非概率抽樣概率抽樣便捷抽樣判斷抽樣配額抽樣滾雪球抽樣系統抽樣分層抽樣整群抽樣其它

簡單隨機抽樣非概率樣本設計非概率樣本設計(nonprobabilitysampledesign)依賴于研究人員的個人判斷而非隨機原則選擇樣本個體,事先并不確定每個樣本單位被抽中的概率。這種樣本設計往往無法排除研究人員偏好對抽樣的影響,也無法準確估算樣本估計值的抽樣誤差。該方法通常用于下列情況:樣本量很小時;探索性研究或研究的初始階段;目標總體成員很少或很難尋找;無法采用概率樣本時。非概率樣本的種類便捷樣本(conveniencesample)-選擇容易接觸的個體作為調查研究對象;主觀樣本(judgmentalsample)-根據研究者的判斷,選擇"有代表性"或"典型性"的樣本單位;定額樣本(quotasample)-將總體分層并確定每層應抽取的樣本量,讓調查員根據定額抽樣;滾雪球樣本(snowballsample)-先抽取少量的樣本,然后通過滾雪球的方式擴大。(1)獨立控制配額抽樣是根據調查總體的不同特性,對具有某個特性的調查樣本分別規定分配數額,而不規定必須同時具有兩種或兩種以上特性的樣本數額。因此,調查員就有比較大的自由去選擇總體中的樣本。優點:簡單易行,調查員選擇余地較大;缺點:調查員可能圖一時方便,選擇樣本過于偏向某一組別,從而影響樣本的代表性。月收入人數300元以下20301~600元50601~900元70900元以上60合計200年齡人數30歲以下4030~40歲6040~50歲7050歲以上30合計200性別人數男100女100合計200例:某市進行空調器消費需求調查,確定樣本量200名,選擇消費者收入、年齡、性別三個標準分類。其各個標準樣本配額比例及配額數如表。(2)交叉控制配額抽樣對每一個控制特性所需分配的樣本數都做具體規定,調查員必須按規定在總體中抽取調查單位,由于各個特性都同時得到了控制,從而克服了獨立控制配額抽樣的缺點,提高了樣本的代表性。300元以下301-600元601-900元900元以上合計男女男女男女男女30歲以下225577664030~40歲332061016116040~50歲101341273307050歲以上5225833230合計208302037331339200入戶調查的抽樣過程1、建立抽樣框(家庭抽樣)2、確定抽樣對象(戶內抽樣)【例】大中城市女性減肥品市場分層研究:抽樣方法抽樣方法:配額抽樣樣本城市:北京、廣州、深圳、昆明、貴陽、重慶、成都、沈陽、烏魯木齊、濟南樣本總量:每個城市100份,共1000份配額:實行現有和潛在消費者配額,城市配額,甄選問卷對抽樣配額進行控制。概率樣本設計概率樣本設計(probabilitysampledesign)采取隨機的辦法,排除研究人員主觀因素的干擾,使樣本總體中的每一個成員都有一個事先確定好抽中概率。簡單隨機抽樣系統抽樣分層抽樣整群抽樣簡單隨機抽樣簡單隨機抽樣(simplerandomsampling)

是最基本的概率抽樣方法。該抽樣方法保證每一抽樣單位都有相同的非零抽中概率,并給出總體參數的自加權估計值。若總體為N,樣本量為n,則每一抽樣單位的抽中概率:p=n/N隨機數表是將0-9十個數字用完全隨機順序排列編成的表。

28465335749213452067421520578090043628192664371555012664985671497258435789642754如要從94家上市公司中抽取12家作為調查樣本,可將94家公司由1至94編號,然后從隨機數表的任一行一列作為起點,如從第二排第三列的數組起從上而下、自左而右抽取,則順序取得的樣本號為:42、28、26、43、35、15、19、64、57、74、20、26、89、92系統抽樣系統抽樣(systematicsampling)是隨機抽取第一個樣本單位,然后每隔k個單位抽取一個。系統抽樣時每個樣本單位抽中的概率相同,為1/k,通過系統抽樣也可獲得總體參數的自加權估計值。討論:什么時候應避免采用系統抽樣?按標志排序計算抽樣距離抽選樣本例:某地區有居民110戶,采用系統抽樣法抽選11戶。①將總體單位進行編號,即從1至110號;②確定抽樣距離=③確定起抽號數:從1——10號中隨機抽取,如2;④確定被抽取的單位:2,12,22,32,42,……,102。系統抽樣舉例分層抽樣分層抽樣(stratifiedsampling)時將總體按某些重要特征分為數個層,然后用簡單隨機抽樣或系統抽樣的辦法從每層中抽取一定數量的樣本。比例分層抽樣非比例分層抽樣如果某校有1000名本科生,400名普通碩士生和600名MBA學生,若要比較不同類別學生對教學的滿意度,請問:應采用哪種抽樣方法?總體滿意度應如何計算?即按各層中的單位數占總體的比例分配各層樣本量。ni表示第i層要抽取的樣本數;Ni表示第i層目標總體數;N表示目標總體數;n表示要抽取的樣本總數。例如:某公司要預測某地區家用電器的潛在用戶,這種商品的消費同收入水平有關,因而以家庭收入為分層基礎。已知總體單位數為20000戶,已確定的樣本數為200戶。家庭收入分為高、中、低三層,其中高收入層2000戶,中收入層6000戶,低收入層12000戶。則:高收入層要調查的戶數為:(1)比例分層抽樣(2)最佳分層抽樣(牛曼分層抽樣)根據各層樣本的標準差的大小,調整各層的樣本數目。即考慮各層在總體中所占的比例,又考慮到各層標準差的差異程度,有利于降低各層的差異,以提高樣本的可信程度。式中:Si表示第i層的標準差;m表示所分層數目;xij表示第i層第j個樣本的觀察值。例如:在上例中則:結果對比分析:高收入層增加了30戶,中收入層增加了40戶,低收入層減少了70戶。購買電器與收入成正比,高收入層相對大于低收入層,更加吻合,提高了準確性。(3)分層最低成本抽樣(德明分層抽樣或經濟抽樣)分層抽樣小結:適用于總體單位數較多,情況復雜,且單位之間差異較大的調查對象。其不足表現在須對總體單位的情況有較多了解。兼顧了各層的差異程度與調查費用整群抽樣整群抽樣(clustersampling)是將總體分為不同的群組,然后隨機抽取一定數量的群組作為樣本。整群抽樣可分為:一級整群抽樣-在抽中群組中抽取所有個體;二級整群抽樣-在抽中群組中抽取部分個體。多級抽樣-將總體分為多級群組,逐級抽樣。區域抽樣(areasampling)區域抽樣(areasampling)

就是在地圖上將一個城市劃分為不同的區域并依次編號,然后隨機地抽取部分區域作為樣本。如果對抽中區域的全部住戶進行調查,則為一級區域抽樣;如果在抽中區域只隨機抽一部分住戶作為樣本,則為二級區域調查。也可以將一個城市劃分為不同區域,再將每個抽中區域進一步劃分為不同小區,最后以住戶為最終抽樣單位,進行多級區域抽樣?!纠可虾6址績r格調查抽樣方法的選擇抽樣方法的選擇取決于:研究所處的階段和數據的用途;總體內部的同質性;時間、經費和人力;數據收集的方法;其它實際考慮。四、樣本量的確定確定樣本量的方法可分為兩大類:經驗方法:根據業界常規來確定樣本的大小統計學方法:根據統計公式計算樣本量(只適合概率樣本)表2市場研究中常用的樣本量確定樣本量的統計學方法對于概率樣本可用統計公式計算所需樣本。這時樣本量與下列因素有關:樣本設計類型;要求的精度(D);總體內部的同質性(S);分組的詳細程度。樣本容量的確定1.調查誤差調查誤差是指調查的結果和客觀實際情況的出入和差數,一般有兩種誤差存在:即非抽樣誤差和抽樣誤差。總體特征抽樣誤差樣本結果系統性誤差(非抽樣誤差)非抽樣誤差應答者誤差管理誤差不回應誤差樣本選擇誤差訪問員誤差故意答錯誤解而答錯數據處理誤差測量工具誤差反應偏差3.抽樣誤差(Randomsamplingerror)抽樣誤差:單純由于不同的隨機樣本計算出的不同指標所產生的誤差。只能通過增加樣本量來縮小抽樣誤差,而無法避免這類誤差。影響抽樣誤差的因素:總體單位標志變異程度。總體的方差越大,抽樣誤差就越大;反之,則抽樣誤差越小。抽取的樣本量。抽樣單位數越多,抽樣誤差就越??;反之,抽樣誤差就越大。抽樣調查的組織方式。抽樣誤差的計算重復抽樣平均數成數不重復抽樣平均數成數修正系數估計均值時樣本量的確定對于簡單隨機抽樣:1.確定允許誤差D, d=±$5.002.確定置信水平CL, CL=95%3.確定與置信水平相應的z值, z=1.964.確定總體的標準差s, s=555.計算所需樣本量n, n=s2z2/d2=4656.當樣本量超過總體的5%時,nc=nN/(N+n-1)估計比例時樣本量的確定對于簡單隨機抽樣:1.確定允許誤差D, d=±.052.確定置信水平CL, CL=95%3.確定與置信水平相應的z值, z=1.964.估計總體的發生率P, P=0.64?5.計算所需樣本量n, n=P(1-P)z2/d2=3556.當樣本量超過總體的5%時,nc=nN/(N+n-1)(3)示例某地區共有居民25萬戶,據第二手資料分析,高、中、低收入戶分別為5萬、15萬、5萬,標準差分別為300、200、100,現欲研究該地區家庭月消費水平。根據小樣本調查得知,月消費水平的標準差為200。試問:若要求在95%的置信度下,家庭月收入水平的置信區間為真實家庭月消費水平的30元范圍內,采用不重復抽樣,應調查多少戶家庭?各收入戶應抽取多少戶?(回收率R=90%,設計效應系數D=1)。解:確定總樣本數確定高、中、低樣本數表3同時估計多個參數時樣本量的確定

最終樣本量?

樣本量的調整確定了所需的樣本量后,還要根據以下因素,調整要抽取的樣本量:發生率:樣本總體中符合條件的百分比完成率:完成訪談的合格對象的百分比提高回答率的方法五、不回答問題減少拒絕減少撲空預約激勵物資刺激問卷設計追蹤回訪由于撲空或拒答導致的不回答問題,不僅減少了有效樣本數,還可能導致樣本偏差。為拒答做修正抽查無回答者替代趨勢分析加權推算學生調研項目市場營銷老師給他們的學生布置了一項任務:想出一種新產品的創意,然后對此進行市場調研。學生們可以使用任何一種看起來可行的調研方法,但是在設計他們一手調研計劃之前,希望學生們進行二手調研。大多數學生發現,想出產品創意很有趣,但市場調研卻很困難。另一方面,他們很珍惜把自己的一些想法付諸行動的機會。共計有42項關于新產品的創意,但是有些在技術上不可行,或不能獲利。然而,有一些想法卻是可行的。無論如何,作業是有關調研的。而不是產品的技術設計,因此產品的可行性或其他因素與調研無關。學生進行了必要的二手調研,然后設計了自己的一手調研計劃。大多數使用問卷調研方法,少數使用群組,極少數使用了深入面談、觀察、實驗或其他技術。在某種程度上讓學生自行想辦法,目的是讓學生從自己的錯誤中發現市場調研的陷阱。在大多數情況下,學生竭力想獲得相當好的調研結果,但是很明顯,他們中的一些人犯有嚴重的錯誤。結果表明,問卷調查是導致更多困難的調研方法之一。除了設計問卷的問題外,大多數學生犯了最基本的抽樣錯誤,以下是一些摘自學生書面報告的實例。對下述每一個案例,你認為:抽樣方法存在哪些錯誤?學生們應該做什么?你能做哪些額外的調研去修正抽樣誤差或使它們的影響最小。我們星期六上午在街頭攔截行人,做了一個購物者的隨機抽樣。(新型購物筐)為了探明年輕人的觀點,我們訪問了大學的23名自愿者。(廣播電臺)我們調查了10名女士和10名男士。喜歡該產品的女士比男士多20%左右,60歲以上的人,有60%以上喜歡該產品??傆?,40%的調查對象喜歡該產品。(園藝用具)對100個調查對象的電話調研表明,32%的調查對象將會購買屋頂密封帆布。遺憾的是,進一步的調查顯示,8個人是家中成年的孩子而不是房屋的主人。(應急屋頂密封帆布)我們在調查中碰到的主要問題是大多數人太忙,沒有時間停下來接受我們的訪問,無論如何,最終我們的努力完成了70份有效的問卷。(銀行服務)在托兒所進行了調研。在母親接孩子的時候,我們給她們分發了問卷,我們將在第二天收回問卷。不幸的是,我們只收回了一半問卷,但這足以使我們得出某些結論。焦點小組的結果好多了,但仍然有很多明顯的問題。我們的小組有6個男孩和2個女孩組成,年齡在18-20歲之間。我們向他們展示了產品的模型,并要求他們對模型進行評論。一開始,他們好像說的并不是很多,但經過一些鼓勵后,他們便開始自由地討論了。(汽車真空吸塵器)當我們向他們展示產品時,他們中的大多數人感到很迷惑。一組有6個家庭主婦,所有的人都來自在早上聚在一起喝咖啡的朋友群體。(割草機安全裝置)我們組常常偏離主題。我們有一個具有代表性的樣本,其中有三個青少年(一個男生和兩個女生),兩個中年人和三個退休的老年人。(地毯清潔裝置)作業1.如果中國聯通委托你開展一項3G個人用戶的服務需求調查,請確定:a.目標總體和抽樣總體?b.抽樣單位和抽樣框架?d.你會考慮采用哪種抽樣方法?2.假如估計有某種服務需求的顧客比例可能為70%,回答率大約為60%,要求有95%的把握保證誤差不超過3個百分點,請計算需要抽取的合格樣本量。參考文獻馬爾霍特拉著,涂平等譯:《市場營銷研究—應用導向》,第5版,第11-12章,電子工業出版社,2009。巴比著,邱澤奇譯:《社會研究方法》,第11版,第7章,華夏出版社,2009。Churchill,Jr.,GilbertA.,TomJ.Brown:BasicMarketingResearch,7thedition,Chapter

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論