




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章統(tǒng)計(jì)學(xué)統(tǒng)計(jì)數(shù)據(jù)的收集第1頁,課件共144頁,創(chuàng)作于2023年2月數(shù)據(jù)的計(jì)量與類型第二章統(tǒng)計(jì)數(shù)據(jù)的收集數(shù)據(jù)的計(jì)量尺度(對研究對象計(jì)量的不同精確程度):定類尺度定序尺度定距尺度定比尺度第2頁,課件共144頁,創(chuàng)作于2023年2月數(shù)據(jù)的計(jì)量與類型第二章統(tǒng)計(jì)數(shù)據(jù)的收集數(shù)據(jù)的類型定性數(shù)據(jù)
定量數(shù)據(jù)
變量變量值
連續(xù)變量
離散變量第3頁,課件共144頁,創(chuàng)作于2023年2月數(shù)據(jù)的計(jì)量與類型第二章統(tǒng)計(jì)數(shù)據(jù)的收集絕對數(shù)、相對數(shù)數(shù)據(jù)的表現(xiàn)形式第4頁,課件共144頁,創(chuàng)作于2023年2月統(tǒng)計(jì)數(shù)據(jù)的收集第二章統(tǒng)計(jì)數(shù)據(jù)的收集產(chǎn)生/收集數(shù)據(jù)
Producing/collectingdata二手?jǐn)?shù)據(jù):圖書館、互聯(lián)網(wǎng)一手?jǐn)?shù)據(jù):觀察observation試驗(yàn)experiment第5頁,課件共144頁,創(chuàng)作于2023年2月“數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!”他不耐煩地喊道,“我不能做無米之炊。”——SherlockHolmes
(歇洛克.福爾摩斯)第6頁,課件共144頁,創(chuàng)作于2023年2月內(nèi)容提要
原始數(shù)據(jù)來源壞樣本與好樣本真實(shí)世界中的抽樣調(diào)查實(shí)驗(yàn)面面觀真實(shí)世界中的實(shí)驗(yàn)數(shù)據(jù)倫理度量數(shù)字合不合理?第7頁,課件共144頁,創(chuàng)作于2023年2月第一節(jié)原始數(shù)據(jù)來源
WhereDoDataComeFrom?觀察研究Observationalstudies試驗(yàn)/實(shí)驗(yàn)Experiments第8頁,課件共144頁,創(chuàng)作于2023年2月觀察研究
ObservationalStudies在只觀測不干擾的情形下收集信息JaneGoodall在坦桑尼亞的岡貝國家公園觀察野生黑猩猩行為:是否素食動物?食物中肉類的比重?多久獵食一次?單獨(dú)或集體行動?多少只一起行動?只有雄性還是雌、雄都有?通常無法進(jìn)行試驗(yàn)技術(shù)或道德原因第9頁,課件共144頁,創(chuàng)作于2023年2月例2-1:高壓線會讓兒童得白血病嗎?電流產(chǎn)生磁場,所以生活在有電環(huán)境里,會使人暴露在磁場。住在高壓線附近,會增加這種暴露程度。實(shí)驗(yàn)室中的研究顯示,強(qiáng)烈磁場會干擾活細(xì)胞。但是住在高壓電線附近,接觸到較弱的磁場,影響又如何?有些數(shù)據(jù)顯示,似乎住在這些地方的兒童,會有較多的人患上屬于血癌的白血病。我們不能安排孩子去暴露在磁場下來做試驗(yàn)。而要較多和較少暴露在磁場下的兒童罹患白血病的比例也有點(diǎn)困難,因?yàn)榘籽『芎币姡揖幼∥恢贸舜艌霰┞冻潭炔煌猓部赡苡性S多其它差異。第10頁,課件共144頁,創(chuàng)作于2023年2月例2-1(續(xù))
:高壓線會讓兒童得白血病嗎?可行的方法是從已經(jīng)得了白血病得兒童著手,把他們和未得病的兒童比較。我們可以檢視許多可能的原因,例如食物、殺蟲劑、飲水、磁場等等,看看有白血病和無白血病的兒童,在這些項(xiàng)目中,有哪些不同。在這些大規(guī)模研究中,有一些顯示似乎應(yīng)對磁場作進(jìn)一步研究。有人花了5年和$500萬,對磁場作了極為仔細(xì)的研究。研究者比較了638個白血病患兒和620個非患兒。他們到這些兒童家里,在其臥房、其它房間及房子的第11頁,課件共144頁,創(chuàng)作于2023年2月例2-1(續(xù))
:高壓線會讓兒童得白血病嗎?前門處都測量了磁場強(qiáng)度。不僅對兒童住家附近的高壓電線資料作了記錄,還對兒童母親在懷孕時住處附近的高壓電線資料作了記錄。結(jié)論是,除了巧合之外,并沒有證據(jù)顯示磁場和兒童白血病有相關(guān)關(guān)系。Source:DavidS.Moore,Statistics:ConceptsandControversies,5thEd.,2001第12頁,課件共144頁,創(chuàng)作于2023年2月數(shù)據(jù)來源
WhereDoDataComeFrom?總體
我們想研究的
對象全體樣本普查(census)試圖取得總體中每個個體的信息抽樣調(diào)查(samplesurvey)是從某個特定的總體中抽取樣本,根據(jù)樣本提供的信息做出關(guān)于總體的結(jié)論第13頁,課件共144頁,創(chuàng)作于2023年2月抽樣調(diào)查
SampleSurvey總體是我們想研究的對象全體若我們想要了解關(guān)于全國大專學(xué)生的信息,那么全國大專生就是我們的總體,即使抽樣時受限制只能在一所大學(xué)里進(jìn)行,總體仍然不變。要想從樣本中得出什么結(jié)論來,必須知道樣本代表的總體是什么樣本只包括我們?nèi)〉眯畔⒌哪切﹤€體你不必吃完整頭牛,才知道肉是老的。第14頁,課件共144頁,創(chuàng)作于2023年2月普查
Census普查(census)是試圖把整個總體納入樣本的抽樣調(diào)查中國的5次人口普查:53、64、82、90、2000美國從1790開始,每10年
做一次的人口普查(憲法規(guī)定)第15頁,課件共144頁,創(chuàng)作于2023年2月抽樣調(diào)查vs.普查普查需要耗費(fèi)大量人力、財(cái)力、物力&時間負(fù)得起費(fèi)用,也擔(dān)不起時間——如中CPS每月失業(yè)統(tǒng)計(jì)如用普查,就
要等下年而非下月知道結(jié)果在一些調(diào)查中樣本將被毀壞
而無法通過普查煙花、燈絲測試第16頁,課件共144頁,創(chuàng)作于2023年2月抽樣調(diào)查vs.普查(續(xù))適當(dāng)確定的小規(guī)模樣本能提供比普查更精確的數(shù)據(jù)清點(diǎn)零件庫存時與其叫一個不耐煩的職員,不如精心安排的抽樣來得準(zhǔn)確但有些時候只能依靠普查需要詳細(xì)的地方數(shù)據(jù):如美國人口普查一個功能就是為選區(qū)劃分提供依據(jù)第17頁,課件共144頁,創(chuàng)作于2023年2月例2-2:一次“以整個總體為樣本”的企圖美國人口普查局的經(jīng)歷告訴我們,普查只能“試圖”把整個總體納入樣本。普查局估計(jì),1990年的人口普查漏掉了1.8%的全國人口。漏掉的人口中包括黑人的族裔的4.6%,且大多住在內(nèi)陸(innercities)。即使由政府強(qiáng)大資源作后盾,普查也無法達(dá)到完美無瑕。第18頁,課件共144頁,創(chuàng)作于2023年2月試驗(yàn)
Experiments試驗(yàn)(experiment)時會刻意對某些個體(處理組)加上某項(xiàng)處理(treatment),以期能觀察其反應(yīng),并結(jié)果與對照組(control)做比較阿斯匹林能降低心臟病的風(fēng)險嗎?僅靠觀察還不夠——還要施加某項(xiàng)處理如果除了處理這一點(diǎn)外,處理組與對照組完全相同,則兩組的反應(yīng)差別就很可能歸因于處理的效果第19頁,課件共144頁,創(chuàng)作于2023年2月試驗(yàn)(續(xù))
Experiments然而,如果處理組還有其它因素不同于對照組,則這些因素的影響就與處理的效果相混淆為了保證處理組與對照組相同,調(diào)研者隨機(jī)將試驗(yàn)對象分到處理組與對照組——隨機(jī)對照試驗(yàn)只要有可能,給對照組一種性質(zhì)中性但看上去很像處理的安慰劑在雙盲試驗(yàn)中,試驗(yàn)對象不知道自己在對照組還是處理組,那些評估反應(yīng)的人也不知道,這樣就防止了反應(yīng)中或是評估中的有偏第20頁,課件共144頁,創(chuàng)作于2023年2月例2-3:職業(yè)培訓(xùn)政策有否助益?一些失業(yè)人員會參加政府組織的職業(yè)培訓(xùn),來提高自己的工作技能。但這項(xiàng)政策是否真的有幫助,是不是應(yīng)該將所有失業(yè)人員都納入這一計(jì)劃?僅靠觀察研究無法告訴我們這項(xiàng)政策的效果:僅僅對比參加和未參加就業(yè)培訓(xùn)的人,觀察其后來的就業(yè)和收入,所下的結(jié)論未必正確。因?yàn)樗麄冊染涂赡艽嬖谠S多差別(如:已受過較多的教育、價值觀和
動機(jī)不同)…一些失業(yè)人員會參加政府組織的職業(yè)培訓(xùn),來提高自己的工作技能。但這項(xiàng)政策是否真的有幫助,是不是應(yīng)該將所有失業(yè)人員都納入這一計(jì)劃?僅靠觀察研究無法告訴我們這項(xiàng)政策的效果:僅僅對比參加和未參加就業(yè)培訓(xùn)的人,觀察其后來的就業(yè)和收入,所下的結(jié)論未必正確。因?yàn)樗麄冊染涂赡艽嬖谠S多差別(如:已受過較多的教育、價值觀和
動機(jī)不同)…第21頁,課件共144頁,創(chuàng)作于2023年2月例2-3(續(xù))
:職業(yè)培訓(xùn)政策有否助益?一些失業(yè)人員會參加政府組織的職業(yè)培訓(xùn),來提高自己的工作技能。但這項(xiàng)政策是否真的有幫助,是不是應(yīng)該將所有失業(yè)人員都納入這一計(jì)劃?僅靠觀察研究無法告訴我們這項(xiàng)政策的效果:僅僅對比參加和未參加就業(yè)培訓(xùn)的人,觀察其后來的就業(yè)和收入,所下的結(jié)論未必正確。因?yàn)樗麄冊染涂赡艽嬖谠S多差別(如:已受過較多的教育、價值觀和
動機(jī)不同)…精心設(shè)計(jì)的試驗(yàn)?zāi)軒椭覀兓卮疬@一問題。在失業(yè)人員中,選擇兩組相似的人(年齡、教育程度、婚姻與子女等方面),要求其中一組參加就業(yè)培訓(xùn),但是對另一組不提供這一計(jì)劃。若干年后,比較兩組人的收入以及工作記錄,就可以看出,要求參加就業(yè)培訓(xùn)是否有預(yù)期的成效。
Source:DavidS.Moore,Statistics:ConceptsandControversies,5thEd.,2001第22頁,課件共144頁,創(chuàng)作于2023年2月觀察vs.試驗(yàn)觀測的原則是:“觀測,但別干擾”JaneGoodall在觀察黑猩猩時,曾設(shè)立食物補(bǔ)給站,讓黑猩猩能在那里吃到香蕉。后來她承認(rèn)該做法錯了,可能導(dǎo)致黑猩猩行為的改變試驗(yàn)則存心改變行為,目的是要了解特定行為/處理(treatment)是否會引起某種反應(yīng)—是否存在“因果關(guān)系(cause&effect)”第23頁,課件共144頁,創(chuàng)作于2023年2月第二節(jié)好樣本與壞樣本第24頁,課件共144頁,創(chuàng)作于2023年2月有偏Biased如果統(tǒng)計(jì)問題的設(shè)計(jì)使得結(jié)果總是往某個方向偏,我們就稱這個設(shè)計(jì)是有偏的(Biased)。第25頁,課件共144頁,創(chuàng)作于2023年2月兩種有偏的抽樣方法
BiasedSamplingMethods方便抽樣conveniencesampling從總體抽樣時,選取最容易取得的個體自發(fā)回應(yīng)樣本voluntaryresponsesample自動對某一普遍呼吁(generalappeal)產(chǎn)生回應(yīng)而形成的樣本,如寫信回應(yīng)(write-in)或電話回應(yīng)(call-in)意見調(diào)查第26頁,課件共144頁,創(chuàng)作于2023年2月例2-4:給己方便,給人方便設(shè)想我每周提供給你所在公司幾箱橙子。你通過對每個箱子抽樣來檢查橙子的質(zhì)量。很容易你會只檢查每一箱頂上的幾個橙子,但這不能作為整箱橙子的代表,因?yàn)榈撞康某茸痈赡茉谶\(yùn)輸中受損。并且,如果我知道你的抽樣方法,我就會把爛的橙子放在底部而把好的放在上面讓你檢查。若你只檢查表面,那么你的抽樣結(jié)果就是有偏的——樣本橙對于其所要代表的總體橙來說,質(zhì)量偏好。第27頁,課件共144頁,創(chuàng)作于2023年2月例2-5:購物中心訪談
InterviewingattheMall生產(chǎn)商和廣告商常借助購物中心訪談來收集有關(guān)消費(fèi)者行為和廣告效力的信息。這種消費(fèi)者樣本既快速、又便宜。但在購物中心接觸到的人并不能充分代表總體人口。例如,這些人更富有、更多為青少年或退休人士。并且,采訪者傾向于從顧客群中選擇外表整潔、和善的個人。購物中心的樣本是有偏的:對總體的某一部分人過分代表(over-represent),對其它人則代表不足(under-represent)。來自該方便樣本的觀點(diǎn),可能和總體的觀點(diǎn)大相徑庭。第28頁,課件共144頁,創(chuàng)作于2023年2月例2-6:寫信回應(yīng)意見調(diào)查專欄作家AnnLanders有一次問她的讀者:“如果可以重來一次,你還要孩子嗎?”她接到近1萬份答復(fù),其中將近70%說:“不要!”難道70%的父母都后悔有了孩子嗎?當(dāng)然不是。這是個自發(fā)性回應(yīng)樣本。通常對某個議題有強(qiáng)烈感覺的人,尤其有負(fù)面感覺的,比較會不嫌麻煩地去回應(yīng)。Landers的意見調(diào)查結(jié)果是有高度偏差的:她的樣本中,寧愿不要孩子的父母百分比,遠(yuǎn)大于全體父母中寧愿不要孩子的百分比。第29頁,課件共144頁,創(chuàng)作于2023年2月例2-7:寫信給美國國會假設(shè)你是美國某國會議員的幕僚,這位議員正在考慮一項(xiàng)法案,該法案會對老人療養(yǎng)院的服務(wù),提供政府資助的保險。你的報(bào)告指出,一共收到1128封針對此法案的來信,其中871封反對此項(xiàng)法案。國會議員說:“真沒想至我的選區(qū)當(dāng)中,大部分人都反對這個法案。我還以為會有很多人贊成。”你相信大部分的選民都反對這個法案嗎?你會怎么向國會議員解釋這件事牽涉到的統(tǒng)計(jì)問題?(自發(fā)性回應(yīng)樣本對總體的代表性可能不夠。)第30頁,課件共144頁,創(chuàng)作于2023年2月人為選擇導(dǎo)致有偏上述兩種抽樣方法之所以有偏,是因?yàn)槠渲屑尤肓巳藶檫x擇(humanchoice)方便樣本:加入了取樣者的偏好自發(fā)回應(yīng)樣本:加入了被取樣者的意志統(tǒng)計(jì)學(xué)家開出的糾偏處方:利用不牽涉人為選擇的“機(jī)遇”(impersonalchance)來選取樣本——隨機(jī)抽樣第31頁,課件共144頁,創(chuàng)作于2023年2月簡單隨機(jī)抽樣
Simplerandomsampling用機(jī)會選出的樣本,是讓每個個體都有同樣的中選機(jī)會,來消除人為偏向第32頁,課件共144頁,創(chuàng)作于2023年2月例2-8:一個簡單隨機(jī)抽樣的例子——抽簽選代表ChoosingNamesfromabox從全班50人中選5人…光榮而艱巨的任務(wù):打掃教室意外之喜:免費(fèi)觀賞進(jìn)口大片由于“人人不甘落后而又名額有限”:將50個名字分別寫在同樣大小的紙條上,放入盒中搖勻(總體)從中抽出5張,就得到一個簡單隨機(jī)樣本:不僅每個人中選機(jī)會相同,且每個可能的樣本(任5張)被抽中的機(jī)會都相同第33頁,課件共144頁,創(chuàng)作于2023年2月隨機(jī)選樣的最簡單的辦法:抽簽選取
該方法選出的樣本不加入“人意”——無取樣者的個人偏好、也無回應(yīng)者的主動加入;而是“天意”——不論班干/普通同學(xué)、團(tuán)員/非團(tuán)員、男生/女生、“乖”學(xué)生/“怪”學(xué)生……,每個人被選進(jìn)樣本的機(jī)會相等第34頁,課件共144頁,創(chuàng)作于2023年2月簡單隨機(jī)樣本
SimpleRandomSample,SRS大小為n的簡單隨機(jī)樣本是一個有n個個體的樣本,其選取的方法,是使得總體中任一組n個個體,都有相等的中選機(jī)會樣本容量第35頁,課件共144頁,創(chuàng)作于2023年2月至少方法是公平的上述定義并未描述某一具體樣本,而是描述選擇樣本的方法——一種使任一大小為n的可能樣本,都有同樣的機(jī)會被選中的方法其內(nèi)在思想是:首先方法必須公平第36頁,課件共144頁,創(chuàng)作于2023年2月隨機(jī)數(shù)表
TableofRandomDigits是一連串的0、1、2、3、4、5、6、7、8、9這些數(shù)字,且滿足以下兩個條件:表中任一位置數(shù)字為0-9中任何一個數(shù)字的概率相同。不同位置的數(shù)字之間是獨(dú)立的。也就是說,知道表中某一部分是些什么數(shù)字,不會提供給你任何關(guān)于其他部分是些什么數(shù)字的信息。第37頁,課件共144頁,創(chuàng)作于2023年2月隨機(jī)數(shù)表的生成想象如下過程——請一位助理(電腦):把數(shù)字0-9放在一個盒子內(nèi)混勻任意抽出一個數(shù)字,記下來再放回?zé)o限重復(fù)步驟1、2:混勻、抽取、記錄、放回……19223950340575628713……為方便查閱,對隨機(jī)數(shù)字又進(jìn)行分組分行,得到隨機(jī)數(shù)表。實(shí)際上行和列并沒有特別意義,該表只是一長串具有前述兩個特性的隨機(jī)數(shù)字而已第38頁,課件共144頁,創(chuàng)作于2023年2月例2-9:用隨機(jī)數(shù)表選SRS王女士的小型律師事務(wù)所共有30家客戶。王女士想選擇其中5家進(jìn)行深入拜訪,以找到提高客戶滿意度的辦法。為了避免人為選擇的有偏,她選了一個大小為5的簡單隨機(jī)樣本(SRS):步驟1:編號(Label)給每家客戶一個數(shù)字編號,數(shù)字位數(shù)應(yīng)盡可能少。30家客戶要只需用到兩位數(shù),因此我們使用:01,02,03,…,29,30對每家客戶進(jìn)行編號。客戶名單及編號如下:用00-29亦可第39頁,課件共144頁,創(chuàng)作于2023年2月例2-9(續(xù)一)01安利 09惠爾康 17馬士基 25沃爾馬02寶島眼鏡 10華美 18麥當(dāng)勞 26廈工機(jī)械03寶姿時裝 11建發(fā) 19閩客隆 27廈新電子04戴爾 12金鷺 20平安保險 28興業(yè)銀行05古龍罐頭 13柯達(dá) 21三圈日化 29悅?cè)A酒店06光合作用 14肯德基 22舒友餐飲 30鐘愛一生07國貿(mào) 15林德 23松下音響08匯豐 16鷺發(fā) 24太古可樂第40頁,課件共144頁,創(chuàng)作于2023年2月例2-9(續(xù)二)步驟2:查表(Table)從“隨機(jī)數(shù)表”任一處開始,讀取兩個一組的隨機(jī)數(shù)。假設(shè)我們從第130行開始:6905164817871740951784534064898720197245該行的前10個“兩位數(shù)組(two-digitgroups)”為:69051648178717409517王女士客戶的編號為01-30,所以讀表
時將忽略除此以外的編號。我們所遇到的
頭5個在01-30之內(nèi)編號就是我們所要選取
的樣本。第41頁,課件共144頁,創(chuàng)作于2023年2月例2-9(續(xù)三)從130行每兩個一組依次讀下來,頭10個編號有5個超過30,我們將其忽略。剩下的依次是05、16、17、17和17”,于是編號05、16、17的客戶進(jìn)入我們的樣本,忽略第2個和第3個17,因?yàn)?7已經(jīng)在樣本中了。由于未湊足5個,我們順著130行繼續(xù)讀下去(如有必要可延續(xù)到第131行),直到選出5家客戶。最后我們所選出的SRS為編號05、16、17、20、19的客戶。他們分別是:古龍罐頭、鷺發(fā)、馬士基、閩客隆、平安保險。第42頁,課件共144頁,創(chuàng)作于2023年2月用隨機(jī)數(shù)表選取SRS的兩個步驟步驟1:編號(Label)為抽樣框(samplingframe)內(nèi)的每一個個體指定一個數(shù)字編號,每個編號具有相同的數(shù)位步驟2:查表(Table)利用隨機(jī)數(shù)表隨機(jī)選號抽樣框——我們從中選取樣本的個體名單表第43頁,課件共144頁,創(chuàng)作于2023年2月用隨機(jī)數(shù)表選SRS的注意事項(xiàng)(續(xù))使用盡可能短的編號10個成員以內(nèi)的總體,1位數(shù)就夠了(0-9)11-100個成員,用2位數(shù)編號(00-99)101-1000個成員,3位數(shù)(000-999)以此類推隨機(jī)數(shù)字本身無序,任何讀取順序
都是合法的(橫讀、豎讀)忽略重復(fù)的、不存在的編號一般從1(或01、001,視需要而定)開始編號但最好是先從左到右、然后再從上到下讀第44頁,課件共144頁,創(chuàng)作于2023年2月統(tǒng)計(jì)誤差抽樣誤差samplingerrors因抽樣行為而產(chǎn)生的誤差,導(dǎo)致樣本結(jié)果與普查的結(jié)果不同非抽樣誤差Nonsamplingerrors與抽樣行為無關(guān)的誤差,即使在普查中也可能發(fā)生第45頁,課件共144頁,創(chuàng)作于2023年2月壞抽樣方法badsamplingmethod由于方便抽樣、自發(fā)回應(yīng)樣本所造成的有偏隨機(jī)抽樣誤差randomsamplingerror指樣本統(tǒng)計(jì)量與總體參數(shù)間的差距由于隨機(jī)選取樣本的偶然性所導(dǎo)致置信聲明中的誤差界限只包含這類誤差其它抽樣誤差othersamplingerrors如“涵蓋不全(undercoverage)”抽樣誤差
Samplingerrors可被避免可通過改變樣本大小加以控制同樣能導(dǎo)致有偏,造成置信聲明毫無意義第46頁,課件共144頁,創(chuàng)作于2023年2月在選樣本的過程中,總體中有某些部分未被納入選擇范圍——或者說是“抽樣框不完整(incompletesamplingframe)”抽樣前必須要有一個清單,上面列出總體所有成員,我們可以從中抽取樣本,該清單即為抽樣框(samplingframe)涵蓋不全
Undercoverage理論上,抽樣框應(yīng)當(dāng)包括總體的每一個體,但這樣的清單往往難以取得,導(dǎo)致大部分樣本多多少少會發(fā)生“涵蓋不全”第47頁,課件共144頁,創(chuàng)作于2023年2月在美國,大部分民意調(diào)查都是通過電話進(jìn)行的,但即使采用隨機(jī)抽樣的電話調(diào)查,也可能產(chǎn)生有偏的結(jié)果:以何為抽樣框?電話號簿?將遺漏所有未在電話號簿登記電話號的用戶——某些大城市,未登記的住戶超過一半——如此調(diào)查結(jié)果將嚴(yán)重有偏解決之道:隨機(jī)數(shù)字撥號(randomdigitsdialing,RDD)——可將所有電話用戶納入抽樣框例2-10:電話抽樣與涵蓋不全抽樣框就此完整了嗎?第48頁,課件共144頁,創(chuàng)作于2023年2月對于所要反映的總體(全體美國居民),該抽樣框仍無法完全涵蓋6%住戶(特別是南部、單身居民)沒有裝電話只聯(lián)絡(luò)一般住戶,住宿舍的學(xué)生、住監(jiān)獄的犯人、大部分軍人被排除在外無家可歸和住在臨時收容所的居民阿拉斯加和夏威夷的住戶因話費(fèi)太貴而不被訪問不講英語的不被訪問,一些移民家庭被排除例2-10:電話抽樣與涵蓋不全(續(xù))第49頁,課件共144頁,創(chuàng)作于2023年2月數(shù)據(jù)處理誤差processingerrors機(jī)械化工作中的誤差,如計(jì)算錯誤或?qū)⑹茉L者回答輸入電腦過程中出錯回應(yīng)誤差responseerror無回應(yīng)nonresponse提問的措辭wordingthe
questions非抽樣誤差
Nonsamplingerrors現(xiàn)代科技的應(yīng)用加上對細(xì)節(jié)的重視,可將處理誤差減至最低;技巧熟練的訪問員也可大幅減少回應(yīng)誤差,特別是在面對面訪問的時候,但對于無回應(yīng)誤差,并無簡單的辦法可以對付第50頁,課件共144頁,創(chuàng)作于2023年2月訪問員手拿的紙和筆已成為歷史現(xiàn)在的訪問員不是帶著筆記本電腦就是一邊看著屏幕一邊做電話訪問電腦軟件控制著訪問的進(jìn)程:訪問員照著屏幕提示提問,再用鍵盤輸入回復(fù);電腦自動跳過無關(guān)問題——一旦受訪者說沒有小孩,后續(xù)關(guān)于小孩的問題將不再出現(xiàn);電腦可以檢查前后答案是否一致;并且能按隨機(jī)順序提問,以避免按同樣順序問問題可能造成的有偏計(jì)算機(jī)輔助調(diào)查
Computer-assistedinterviewing第51頁,課件共144頁,創(chuàng)作于2023年2月電腦軟件同樣控制著數(shù)據(jù)的處理:保存著回答者的記錄將回答轉(zhuǎn)為數(shù)據(jù),避免了從paper到computer的轉(zhuǎn)錄過程——這曾是processingerror的一大根源電腦還可以安排電話調(diào)查的時間考慮被調(diào)查者所在時區(qū)若有人第一次接電話時表示
有意但沒有時間回答,電腦會
重約時間并提醒到時履約計(jì)算機(jī)輔助調(diào)查(續(xù))
Computer-assistedinterviewing第52頁,課件共144頁,創(chuàng)作于2023年2月受訪對象給了不正確的回答謊報(bào):年齡、收入、是否服過禁藥等敏感問題記錯:如“上周抽過幾包煙?”聽不懂問題而瞎猜:不愿顯得無知回應(yīng)誤差
Responseerror第53頁,課件共144頁,創(chuàng)作于2023年2月受訪對象被問及她/他在一定時期內(nèi)的行為時,很容易因?yàn)橛涘e而產(chǎn)生回應(yīng)誤差。美國全國健康調(diào)查曾詢問調(diào)查“去年你看過幾次病”,而后對照健康記錄發(fā)現(xiàn),人們忘記了60%他們看病的經(jīng)歷例2-11:記錯導(dǎo)致的回應(yīng)誤差人們習(xí)慣于忘記不愉快的經(jīng)歷?第54頁,課件共144頁,創(chuàng)作于2023年2月1989年,紐約市選出第一位黑人市長,維吉尼亞州選出第一位黑人州長。這兩個事件,在投標(biāo)所訪問投完票的選民時,所預(yù)測到的勝負(fù)差距,都比實(shí)際開票的差距大。因此調(diào)查機(jī)構(gòu)相當(dāng)確定,有些受訪選民因?yàn)椴辉赋姓J(rèn)投票給黑人候選人而說了謊。例2-12:種族效應(yīng)第55頁,課件共144頁,創(chuàng)作于2023年2月二戰(zhàn)期間,美國國家民意調(diào)查中心派出了兩組調(diào)查人員對一個南方城市(隨機(jī)選出?)的500名黑人進(jìn)行了提問,一組調(diào)查人員由白人組成,另一組由黑人組成問題之一是:“如果日本占領(lǐng)美國,你認(rèn)為黑人的狀況會變好還是更糟?”黑人調(diào)查組中,9%回答“變好”,白人調(diào)查組該比例只有2%。回答“更糟”的比例也不相同,黑人調(diào)查組是25%,白人調(diào)查組則是45%例2-13:投調(diào)查者所好的回答第56頁,課件共144頁,創(chuàng)作于2023年2月無法得到已被選入樣本的個體的資料聯(lián)系不上拒絕合作無回應(yīng)Nonresponse人們越來越不情愿回答問題。面對面訪問常被封閉的社區(qū)和門衛(wèi)所阻擋;電話調(diào)查則由于答錄機(jī)、來電顯示和電話推銷的泛濫而導(dǎo)致回應(yīng)率的下降第57頁,課件共144頁,創(chuàng)作于2023年2月回應(yīng)肯定將使調(diào)查結(jié)果有偏,因?yàn)椴煌后w的人有不同的回應(yīng)率:窮人比中產(chǎn)階級更難聯(lián)系上;老年人、大城市居民有更高的拒答率由無回應(yīng)造成的有偏,能輕易超越置信聲明所描述的隨機(jī)抽樣誤差無回應(yīng)造成有偏第58頁,課件共144頁,創(chuàng)作于2023年2月有人研究酒吧里的打架事件,發(fā)現(xiàn)其中有90%都是死掉的那個人先動手的。這種結(jié)果你可別相信。假如你
跟人打架把人給揍死了,
警察問你誰先動手的時
候,你會怎么回答?反
正死人也不會說話。這
也是無回應(yīng)的一種。例2-14:他先動手的!第59頁,課件共144頁,創(chuàng)作于2023年2月由政府出面的進(jìn)行的美國“當(dāng)前人口調(diào)查(CPS)”回應(yīng)率最高:只有6%~7%不回應(yīng)先登門拜訪,而后電話訪問由大學(xué)主持的社會科學(xué)研究調(diào)查“全面社會調(diào)查(GSS)”:24%不回應(yīng)率面對面在受訪者住所進(jìn)行訪談其它獨(dú)立的調(diào)查機(jī)構(gòu)(媒體、市場調(diào)查機(jī)構(gòu)、民意調(diào)查公司)不肯透露其不回應(yīng)率,但……無回應(yīng)有多糟?第60頁,課件共144頁,創(chuàng)作于2023年2月PewResearchCenter模仿了好幾家民意調(diào)查機(jī)構(gòu)的做法,為通過隨機(jī)撥號得到1000人的樣本,在剔除了傳真機(jī)號和機(jī)構(gòu)電話號之后,共需打2879個住宅電話,其中33%從來沒人接接聽電話人中,又有35%拒絕接受訪問、只有52%最終完成訪問整體無回應(yīng)比例(不接電話、不愿接受訪問、訪問未完成),占2879人中的1658人,即58%無回應(yīng)有多糟?(續(xù))第61頁,課件共144頁,創(chuàng)作于2023年2月Pew的調(diào)查,遠(yuǎn)比許多獨(dú)立調(diào)查機(jī)構(gòu)做得徹底,但仍有58%的無回應(yīng)率。據(jù)內(nèi)部人士透露,這些機(jī)構(gòu)的不回應(yīng)率常常達(dá)到初始樣本的75%~90%無回應(yīng)有多糟?(續(xù))Pew在“標(biāo)準(zhǔn)”調(diào)查的基礎(chǔ)上又進(jìn)行了一項(xiàng)“嚴(yán)格”調(diào)查:在打電話前先寄信;如沒人接則在8周內(nèi)不斷打電話;寄快件給拒絕受訪的人,所有這些做法,把不回應(yīng)率從“標(biāo)準(zhǔn)”調(diào)查的58%進(jìn)一步降到了30%。對比兩項(xiàng)調(diào)查,“標(biāo)準(zhǔn)”調(diào)查雖然有偏,但結(jié)果尚在可接受的范圍內(nèi)(個別問題仍屬例外)第62頁,課件共144頁,創(chuàng)作于2023年2月表:Pew的模擬調(diào)查結(jié)果分類電話數(shù)百分比從來沒人接電話93833接了電話卻拒絕接受訪問67824條件不合:沒有18歲以上成人或語言不通2218訪問未完成421訪問完成1,00035總計(jì)2,879100注:PewResearchCenter的調(diào)查選取了一周的不同日子、每天不同時段、每個號碼都打了5次第63頁,課件共144頁,創(chuàng)作于2023年2月無回應(yīng)率的減低訓(xùn)練以提高訪問員的技巧只要對方肯接電話,就有辦法讓其不掛斷事前寄信后續(xù)訪問(follow-up)持續(xù)訪問直到最終聯(lián)系上訓(xùn)練以提高訪問員的技巧只要對方肯接電話,就有辦法讓其不掛斷后兩種方法雖然有助于降低無回應(yīng)率,
但會延緩調(diào)查進(jìn)度,所以如果需要快速得到答案就不被采用。但即便是最嚴(yán)謹(jǐn)?shù)膶I(yè)的調(diào)查,也無法完全克服無回應(yīng)的難題——第64頁,課件共144頁,創(chuàng)作于2023年2月無回應(yīng)率的減低(續(xù))用其它個體來取代不回應(yīng)的人城市里的不回應(yīng)率比較高,若用不回應(yīng)住戶附近的其它住戶來取代,可以減低偏差給現(xiàn)有回應(yīng)加權(quán)在數(shù)據(jù)收集完成后的糾偏方法,比如:若樣本里太多女性,就給男士加權(quán)雖可減少偏差,卻會增加變異性執(zhí)行加權(quán),替統(tǒng)計(jì)學(xué)家制造了許多工作機(jī)會第65頁,課件共144頁,創(chuàng)作于2023年2月例2-15:統(tǒng)計(jì)學(xué)家的技巧蓋洛普宣布,他們訪問了解1523位美國成年人,發(fā)現(xiàn)其中有57%在過去12個月當(dāng)中買過樂透彩券。從表面上看起來,因?yàn)?523的57%是868,所以蓋洛普的樣本當(dāng)中,應(yīng)該是有868個人玩彩券。然而事實(shí)卻非如此。蓋洛普無疑曾用了某些特殊的統(tǒng)計(jì)技巧,來給實(shí)際得到的結(jié)果加權(quán);57%這個數(shù)字,是蓋洛普對于如果沒有人回應(yīng)時,所應(yīng)該得到的結(jié)果的最佳估計(jì)。第66頁,課件共144頁,創(chuàng)作于2023年2月問題的措辭
Wordingthequestions清楚而不含混把問題表達(dá)得完全清楚是出乎意料其困難中立而無誤導(dǎo)一些提問注定偏向某一答案而非其它第67頁,課件共144頁,創(chuàng)作于2023年2月例2-16:股票?家畜?有個調(diào)查問到:“是否擁有‘stock’(股票,也是家畜)?”大部分的德州牧場主人都答:“是”,可是他們擁有的,大概不是在紐約證券交易所可以買賣的那種。第68頁,課件共144頁,創(chuàng)作于2023年2月例2-17:稍改幾個字,結(jié)果大不同美國人對于政府對窮人的幫助,看法如何?只有13%的成人認(rèn)為他們花太多的錢在“幫助窮人上”,可是卻有44%的成人認(rèn)為他們花太多的錢在“社會福利”上。蘇格蘭人對于從英國獨(dú)立出來,看法如何?有51%的人贊成“蘇格蘭獨(dú)立”,但是只有34%的人支持“從聯(lián)合王國分離出來的獨(dú)立的蘇格蘭”第69頁,課件共144頁,創(chuàng)作于2023年2月例2-18:“加料”的問題是否應(yīng)該立法消除所有可能的途徑,使特殊利益團(tuán)體無法捐獻(xiàn)大筆款項(xiàng)給候選人?應(yīng)該立法來禁止利益團(tuán)體捐助競選活動?或者團(tuán)體有權(quán)捐款給所支持的候選人嗎?為防止“恐怖事件”,國安局有權(quán)監(jiān)控所有電子郵件?第70頁,課件共144頁,創(chuàng)作于2023年2月例2-18:“加料”的問題(續(xù))第一個問題是佩羅提出的,郵寄來的回答中,99%答“是”。由于是自發(fā)回應(yīng)的調(diào)查結(jié)果,所以楊克洛維奇調(diào)查公司對全國隨機(jī)樣本問了同樣的問題,結(jié)果80%答“是”。佩羅的問題簡直是要求人家答“是”,所以楊克洛維奇寫了第二個問題,用較中立的立場來提出這個議題,在問這個問題時,全國隨機(jī)樣本中只有40%贊成禁止捐款。第71頁,課件共144頁,創(chuàng)作于2023年2月思考題以下哪些是抽樣誤差的根源、哪些是非抽樣誤差的根源?解釋你的答案。受訪對象隱瞞曾用過毒品的事實(shí)記錄數(shù)據(jù)時打字錯誤要求人們填寫印在報(bào)紙上的問卷并寄回電話簿被用作樣本框打了5次電話仍聯(lián)絡(luò)不上受訪者調(diào)查員在大街上選擇行人進(jìn)行訪談第72頁,課件共144頁,創(chuàng)作于2023年2月第三節(jié)真實(shí)世界中的抽樣設(shè)計(jì)抽樣調(diào)查的思想很清楚:從總體
抽一個SRS,用樣本的統(tǒng)計(jì)量估計(jì)總體參數(shù)。但在現(xiàn)實(shí)中,常常是要對大規(guī)模的人群進(jìn)行抽樣,此時SRS顯得不切實(shí)際——難以取得完整的抽樣框(samplingframe)太過昂貴(調(diào)查成本)若樣本為一個全國范圍的SRS,則該樣本中的各成員的住址可能分散在東西南北各個角落,與之
進(jìn)行聯(lián)系花費(fèi)太高對總體信息的利用第73頁,課件共144頁,創(chuàng)作于2023年2月真實(shí)世界中的抽樣設(shè)計(jì)(續(xù))SRS主要適用以下情況:1、對調(diào)查對象的情況很少了解2、總體單位的排列沒有秩序抽到的單位比較分散時也不影響調(diào)查工作第74頁,課件共144頁,創(chuàng)作于2023年2月真實(shí)世界中的抽樣設(shè)計(jì)(續(xù))類型抽樣整群抽樣等距抽樣多階段樣本第75頁,課件共144頁,創(chuàng)作于2023年2月類型抽樣對總體各單位按一定的標(biāo)志進(jìn)行分類,然后分別從每一類中按隨機(jī)原則抽取一定的單位構(gòu)成樣本。確定各組的抽樣單位數(shù)可有:
—類型適宜抽樣
—類型比例抽樣也稱分類抽樣,分層抽樣。第76頁,課件共144頁,創(chuàng)作于2023年2月類型抽樣的作用:
利用已知的信息提高抽樣效率抽樣的組織工作比較方便掌握總體中各個子總體的情況第77頁,課件共144頁,創(chuàng)作于2023年2月例2-19:類型抽樣抽樣調(diào)查廈門市居民收入分配情況,如果歷史資料所映了高收入者、中等收入者、低收入者的比例結(jié)構(gòu),我們可以按此結(jié)構(gòu)分類分別從中按一定的比例抽取樣本。可避免樣本全來自某一收入階層所產(chǎn)生的系統(tǒng)偏差。(雖然是小概率)第78頁,課件共144頁,創(chuàng)作于2023年2月整群抽樣將總體各單位分成若干群,然后從中隨機(jī)抽取部分群,對中選的群進(jìn)行全面調(diào)查的抽樣方式。第79頁,課件共144頁,創(chuàng)作于2023年2月整群抽樣的作用當(dāng)總體缺乏所括全部總體單位的抽樣框,無法進(jìn)行抽選時(總體很大且沒有現(xiàn)成的名單)方便和節(jié)約費(fèi)用(總體單位很多,分布很廣)第80頁,課件共144頁,創(chuàng)作于2023年2月例2-20:整群抽樣調(diào)查廈門市中學(xué)生近視眼的比例有多大,就需要全市中學(xué)生的名單。第81頁,課件共144頁,創(chuàng)作于2023年2月等距抽樣將總體各單位按某一標(biāo)志進(jìn)行排列,然后按固定的間隔來抽取樣本單位的抽樣方法隨機(jī)起點(diǎn)等距抽樣半距起點(diǎn)等距抽樣對稱等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣第82頁,課件共144頁,創(chuàng)作于2023年2月等距抽樣的作用簡便易行對總體結(jié)構(gòu)有一定的了解時,可用已有的信息對總體進(jìn)行排列后采用等距抽樣,提高抽樣效率(縮小各單位間的差異程度,提高樣本代表性)第83頁,課件共144頁,創(chuàng)作于2023年2月應(yīng)避免與現(xiàn)象本身的節(jié)奏性或循環(huán)周期相重合注意:第84頁,課件共144頁,創(chuàng)作于2023年2月多階段抽樣整群抽樣和類型抽樣的綜合一個對全國范圍內(nèi)城鎮(zhèn)居民的面對面訪談的抽樣設(shè)計(jì)大致如下:階段1:從全國34個省、直轄市、自治區(qū)、特別行政區(qū)(或n個市級行政單位)中的抽取一個樣本階段2:對階段1抽出的樣本,再從其下級的行政區(qū)抽取樣本第85頁,課件共144頁,創(chuàng)作于2023年2月階段3:使用地圖(或航拍圖)作為抽樣框,
在階段2抽出的每一個行政區(qū)轄區(qū)內(nèi)選取更小
的地域(如街區(qū))樣本階段4:在階段3樣本(街區(qū))的基礎(chǔ)上,從每一街區(qū)選取住戶的樣本。派出訪問員上門調(diào)查。第86頁,課件共144頁,創(chuàng)作于2023年2月其他非全面統(tǒng)計(jì)調(diào)查重點(diǎn)調(diào)查:選取重點(diǎn)單位進(jìn)行調(diào)查典型調(diào)查:選取典型單位進(jìn)行調(diào)查第87頁,課件共144頁,創(chuàng)作于2023年2月統(tǒng)計(jì)調(diào)查的方案設(shè)計(jì)
統(tǒng)計(jì)調(diào)查要涉及成千上萬的人,工作人員,參予人員,被調(diào)查人員,統(tǒng)計(jì)調(diào)查方案是保證統(tǒng)計(jì)調(diào)查得以順利進(jìn)行的前提,也是準(zhǔn)確、及時、完整取得調(diào)查資料的重要條件。第88頁,課件共144頁,創(chuàng)作于2023年2月統(tǒng)計(jì)調(diào)查的方案設(shè)計(jì)(續(xù))確定調(diào)查目的確定調(diào)查對象和單位確定調(diào)查項(xiàng)目調(diào)查表格和問卷的設(shè)計(jì)確定調(diào)查進(jìn)間和調(diào)查期限制定調(diào)查的組織實(shí)施計(jì)劃第89頁,課件共144頁,創(chuàng)作于2023年2月確定調(diào)查目的
明確調(diào)查目的,才知道要解決什么問題,應(yīng)該搜集什么樣的資料。例,工業(yè)企業(yè),可以調(diào)查生產(chǎn)經(jīng)營狀況,可以調(diào)查職工素質(zhì),可以調(diào)查第三產(chǎn)業(yè)狀況。對大學(xué)生,強(qiáng)以調(diào)查健康狀況,也強(qiáng)以調(diào)查學(xué)習(xí)情況,還可以調(diào)查思想觀念。第90頁,課件共144頁,創(chuàng)作于2023年2月確定調(diào)查對象和單位
調(diào)查對象:根據(jù)調(diào)查目的和任務(wù)而明確的被調(diào)查總體。調(diào)查單位:組成調(diào)查總體的個體,標(biāo)志承擔(dān)者。第91頁,課件共144頁,創(chuàng)作于2023年2月例如,工業(yè)普查中,目的了解各工業(yè)企業(yè)的生產(chǎn)經(jīng)營狀況,調(diào)查對象是所有工業(yè)企業(yè),調(diào)查單位是每個工業(yè)企業(yè)。需要把工業(yè)企業(yè)與農(nóng)業(yè)、建筑業(yè)、商業(yè)、運(yùn)輸業(yè)等其他企業(yè)區(qū)分開來,劃清總體界限。例如,目的,了解城市職工家庭收支基本情況,調(diào)查對象:全部城市職工家庭,調(diào)查單位:第一戶城市職工家庭,明確城市職工和非城市職工的定義。第92頁,課件共144頁,創(chuàng)作于2023年2月報(bào)告單位:填報(bào)單位,負(fù)責(zé)上報(bào)調(diào)查資料的單位。例,工業(yè)企業(yè)普查,每個工業(yè)企業(yè)既是調(diào)查單位,又是報(bào)告單位,例,工業(yè)企業(yè)生產(chǎn)設(shè)備狀況普查,調(diào)查單位是每臺設(shè)備,報(bào)告單位是每個工業(yè)企業(yè)。報(bào)告單位是單位,調(diào)查單位:人、物、單位第93頁,課件共144頁,創(chuàng)作于2023年2月確定調(diào)查項(xiàng)目
調(diào)查項(xiàng)目:所要調(diào)查的具體內(nèi)容,完全由調(diào)查對象的性質(zhì)、調(diào)查目的和任務(wù)所決定,包括調(diào)查單位所須登記的標(biāo)志和其他有關(guān)情況,向調(diào)查單位調(diào)查什么,反映調(diào)查單位特征的標(biāo)志是多種多樣的。第94頁,課件共144頁,創(chuàng)作于2023年2月確定調(diào)查項(xiàng)目時應(yīng)注意:1、調(diào)查項(xiàng)目要少而精(實(shí)現(xiàn)調(diào)查目的)2、需要和可能原則(只列入能夠得到確定答案的項(xiàng))3、解釋的統(tǒng)一性4、項(xiàng)目之間的銜接性,項(xiàng)目之間的聯(lián)系,時間上的可比性5、可擬定“選擇”式,而非一定設(shè)計(jì)成問答式第95頁,課件共144頁,創(chuàng)作于2023年2月調(diào)查表格和問卷的設(shè)計(jì)調(diào)查表:列出調(diào)查項(xiàng)目的表格形式一覽表:許多調(diào)查單位和相應(yīng)的項(xiàng)目按次序登記在一張表格里。例,成績表單一表:一張表格只登記一個調(diào)查單位。例,學(xué)生登記表第96頁,課件共144頁,創(chuàng)作于2023年2月確定調(diào)查時間和調(diào)查期限
調(diào)查時間:調(diào)查資料所屬的時點(diǎn)和時期調(diào)查時限:調(diào)查工作進(jìn)行的起訖時間第97頁,課件共144頁,創(chuàng)作于2023年2月制定調(diào)查的組織實(shí)施計(jì)劃
(調(diào)查工作是有組織、有計(jì)劃的)調(diào)查機(jī)構(gòu)調(diào)查步驟人員及組織訓(xùn)練經(jīng)費(fèi)另,宣傳,文件,試點(diǎn)等以及調(diào)查方法,調(diào)查空間第98頁,課件共144頁,創(chuàng)作于2023年2月概率樣本的定義利用機(jī)遇抽取的樣本。我們已知哪些樣本是以及每個可能的樣本被抽中的概率是多少。分層樣本就不包括總體所有可能的樣本,即使包括在內(nèi)的樣本,被抽中的概率也未必一樣第99頁,課件共144頁,創(chuàng)作于2023年2月相信調(diào)查結(jié)果前該問的問題若調(diào)查者使用好的統(tǒng)計(jì)方法,盡可能準(zhǔn)備一個完整的抽樣框,注意提問的措辭,減少無回應(yīng),則抽樣調(diào)查確實(shí)能能提供準(zhǔn)確和有價值的信息但亦存在許多抽樣調(diào)查不能提供準(zhǔn)確的和有用的結(jié)果(尤其是那些設(shè)計(jì)好要影響公眾意見而不只是要記錄意見的調(diào)查!)。為此,在你更多關(guān)注某個抽樣調(diào)查的結(jié)果之前,有必要先問幾個問題:第100頁,課件共144頁,創(chuàng)作于2023年2月誰做的調(diào)查?總體是什么?樣本是怎樣選取的?樣本多大?回應(yīng)率是多少?用什么方式聯(lián)絡(luò)受訪者?(電話?郵寄?面對面?)調(diào)查是什么時候做的?(是不是在一個可能影響結(jié)果的事件發(fā)生之后)問題確實(shí)是怎么問的?第101頁,課件共144頁,創(chuàng)作于2023年2月但新聞編輯和播音員卻有一種壞習(xí)慣,常要刪掉這些“無聊”內(nèi)容而只報(bào)道結(jié)果。更有一些有利益集團(tuán)、新聞媒體由于本身采用了不可靠的抽樣方法,所以根本就不能回答上述問題許多民意調(diào)查、學(xué)術(shù)調(diào)研、政府負(fù)責(zé)統(tǒng)計(jì)官員在宣布抽樣調(diào)查結(jié)果時,會回答這些問題第102頁,課件共144頁,創(chuàng)作于2023年2月嚴(yán)謹(jǐn)?shù)某闃诱{(diào)查如Gallup會告訴我們真相:“除了抽樣誤差外,問題的措辭以及執(zhí)行調(diào)查時遇到的實(shí)際困難,會導(dǎo)致調(diào)查結(jié)果有偏或產(chǎn)生其它誤差”第103頁,課件共144頁,創(chuàng)作于2023年2月若某政治家、廣告人、或某個媒體宣稱某個民意調(diào)查結(jié)果卻沒有提供完整的信息,要當(dāng)心!第104頁,課件共144頁,創(chuàng)作于2023年2月第四節(jié)實(shí)驗(yàn)面面觀所有的實(shí)驗(yàn)以及許多的觀測研究,都是想要知道一個變量對另一個變量有何影響———反應(yīng)變量:用來度量研究結(jié)果的變量—解釋變量:我們認(rèn)為可以解釋或造成反應(yīng)變量變化的變量—受試對象:實(shí)驗(yàn)中所研究的個體—處理:任何加諸于受試對象的特定實(shí)驗(yàn)條件第105頁,課件共144頁,創(chuàng)作于2023年2月潛在變量:是對研究中其他變量間的關(guān)系有重要影響,卻并未被列為解釋變數(shù)的變量交叉:當(dāng)兩個變量對反應(yīng)變數(shù)的影響混在一起而無法區(qū)分時,我們稱這兩個變量是交叉的交叉的變量可以是解釋變量,也可以是潛在變量觀測研究和單軌實(shí)驗(yàn)都常常因?yàn)闈撛谧兞康慕徊鎲栴}而產(chǎn)生沒有用的數(shù)據(jù)第106頁,課件共144頁,創(chuàng)作于2023年2月例2-21:上網(wǎng)學(xué)習(xí)有一項(xiàng)關(guān)于網(wǎng)上學(xué)習(xí)的樂觀報(bào)道,報(bào)告了在佛羅里達(dá)州勞德代爾的諾瓦東南大學(xué)執(zhí)行的一項(xiàng)研究。撰寫研究結(jié)果的人聲稱,學(xué)生在網(wǎng)上學(xué)習(xí)大學(xué)部的課,和在教室里學(xué)習(xí)的學(xué)生“學(xué)得一樣好”。如果把教室的課用網(wǎng)站取代,可以替大學(xué)省錢,所以照這項(xiàng)研究結(jié)果看來,我們應(yīng)該全部上網(wǎng)第107頁,課件共144頁,創(chuàng)作于2023年2月例2-22:胃冷凍胃潰瘍似乎是一種現(xiàn)代病。“胃冷凍”是治療胃潰瘍的一種聰明療法。病人先吞下一個連接著管子且放了氣的氣球;然后就把一種經(jīng)過冷凍的溶液打入汽球中,總共打了一小時。這個療法的想法是這樣的:使胃涼下來可以減少胃酸的分泌,因此可以減輕潰瘍癥狀。一篇刊登在《美國醫(yī)學(xué)會期刊》的實(shí)驗(yàn)報(bào)告指出,胃冷凍的確緩解了潰瘍的痛苦。第108頁,課件共144頁,創(chuàng)作于2023年2月例2-22:胃冷凍(續(xù))接受治療后的病人表示比較不痛了,可否宣稱:胃冷凍使得疼痛減輕?可能只是安慰劑效應(yīng)。安慰劑是一種假的治療,沒有實(shí)質(zhì)效用。許多病人對任何治療都有正面所應(yīng),即使只是安慰劑。這種對假治療的反應(yīng),就稱為安慰劑效應(yīng)。安慰劑效應(yīng)可能是一種心理作用,起因于對醫(yī)生有信心以及預(yù)期病會治愈。第109頁,課件共144頁,創(chuàng)作于2023年2月例2-22:胃冷凍(續(xù))數(shù)年之后做了另一項(xiàng)臨床試驗(yàn),把潰瘍病人先分成兩組。一組就像前次試驗(yàn)一樣,按受胃冷凍治療;另一組按受的是安慰劑治療,也就是打入汽球的溶液溫度和體溫一樣,而不是經(jīng)過冷凍的。結(jié)果是:處理組的82位病人中,有34%病情改善,但是安慰組的確良78位病人中,也有38%有改善。這項(xiàng)實(shí)驗(yàn)和其他妥善設(shè)計(jì)的實(shí)驗(yàn),顯示胃冷凍的效應(yīng),不過是和安慰劑差不多罷了,于是從此醫(yī)生不再使用這種方法第110頁,課件共144頁,創(chuàng)作于2023年2月補(bǔ)救辦法:利用隨機(jī)化比較實(shí)驗(yàn)第111頁,課件共144頁,創(chuàng)作于2023年2月隨機(jī)化比較實(shí)驗(yàn)的邏輯用隨機(jī)化的方法將受試對象分組,避免人為指派時可能發(fā)生的系統(tǒng)性偏差所分出的各組在實(shí)施處理之前,應(yīng)該各方面都類似用“比較”確保:除了實(shí)驗(yàn)上的處理外,其他所有因素都會同樣作用在所有的組上。因此,反應(yīng)變量的差異必是處理的效用所致第112頁,課件共144頁,創(chuàng)作于2023年2月過去很多醫(yī)療方法只經(jīng)過簡單的單軌實(shí)驗(yàn)后就普遍使用了,后來經(jīng)過比較實(shí)驗(yàn),發(fā)覺不過是安慰劑罷了,這種例子不勝枚舉。目前法律規(guī)定,任何新藥必須用隨機(jī)化比較實(shí)驗(yàn)來證明其安全性和有效性。但對于其他醫(yī)療方法,比如手術(shù),就沒有這項(xiàng)規(guī)定。你可以指望新藥一定比安慰劑好,但新的手術(shù)概念就未必了,這情況就和以前的胃冷凍一樣醫(yī)學(xué)工作者通常對于隨機(jī)比較化實(shí)驗(yàn)接受得很慢第113頁,課件共144頁,創(chuàng)作于2023年2月第五節(jié)真實(shí)世界中的實(shí)驗(yàn)雙盲實(shí)驗(yàn)拒絕參加、不合作者及退出者完全隨機(jī)化設(shè)計(jì)配對設(shè)計(jì)區(qū)集設(shè)計(jì)第114頁,課件共144頁,創(chuàng)作于2023年2月強(qiáng)有效的安慰劑有一項(xiàng)研究發(fā)現(xiàn),一些禿頭男性在服用了安慰劑之后,有42%的人腦袋上的頭發(fā)保住甚至增加了。另一項(xiàng)研究對13個對野葛敏感的人說,涂在他們一只手臂上的東西是野葛,而其實(shí)那是安慰劑,但是13個人全部都起了疹子。事實(shí)上,涂在別一只手臂上的才真的是野葛,但是受試對象被告知那是無毒的——結(jié)果13個人中只有兩人起疹子。第115頁,課件共144頁,創(chuàng)作于2023年2月雙盲實(shí)驗(yàn)不論是受試對象,還是會和受試對象有互動的人,都不知道哪位受試對象按受了哪種處理(由于安慰劑的效應(yīng)如此強(qiáng),告訴受試對象他接受的是新藥抑或是安慰劑,可就有點(diǎn)笨了!!)第116頁,課件共144頁,創(chuàng)作于2023年2月禿頭實(shí)驗(yàn)中,安慰劑組42%的人保住或增加了頭發(fā),但是在使用一種新的防禿藥的那一組,有86%的人保住或增加了頭發(fā)第117頁,課件共144頁,創(chuàng)作于2023年2月拒絕參加、不合作者及退出者嚴(yán)重疾病療法實(shí)驗(yàn)中,受試對象的拒絕參加已成為嚴(yán)重問題。跟抽樣時的情況一樣,如果拒絕參加的人和愿意合作的人之間有系統(tǒng)性的差異,就可能造成偏差了。——少數(shù)族裔、女性、窮人以及老人,長期以來在臨床試驗(yàn)中的代表性都不足。很多時候都是沒人找他們參加。(現(xiàn)在法律已規(guī)定必須包括女性和少數(shù)族裔,但是拒絕參加仍是問題)第118頁,課件共144頁,創(chuàng)作于2023年2月參加試驗(yàn)卻不遵循實(shí)驗(yàn)處理的受試對象叫做不合作者。不合作者也可能造成偏差。——例如,參加新藥試驗(yàn)的艾滋病人有時會自己加上其他的治療。(有些艾滋病人把他們的藥拿去化驗(yàn),如果發(fā)覺自己不是分配到新藥組,就會退出或自己加其他的藥。這樣會造成對新藥不利的偏差)第119頁,課件共144頁,創(chuàng)作于2023年2月持續(xù)時間較長的實(shí)驗(yàn)也常常碰上退出者,也就是開始時參加實(shí)驗(yàn)卻不完成實(shí)驗(yàn)的受試對象。——如果退出的原因與實(shí)驗(yàn)無關(guān),則沒什么妨礙,只是受試人數(shù)減少罷了。如果受試者退出是因?yàn)閷δ硞€處理的反應(yīng),就可能造成偏差。——例如,一種新的減肥藥的測試第120頁,課件共144頁,創(chuàng)作于2023年2月1187位肥胖的人,先給4個星期的安慰劑,然后把不愿按時服藥的人剔除。這樣做是先把不合作者做了初步過濾,如此剩下892位受試對象。把這些人隨機(jī)指派到新藥組和安慰劑組,并為他們設(shè)計(jì)了減肥餐。此減肥計(jì)劃開始一年后,還有576位受試對象仍然繼續(xù)參與。平均來說新藥組比安慰劑組多輕了3.15公斤。計(jì)劃又進(jìn)行了一年,這一年的重點(diǎn)是保住前一年已減掉的體重不要回升。第二年結(jié)束時,還剩下403位受試對象。新藥組回升體重平均來說少了2.25公斤。結(jié)果可靠嗎?第121頁,課件共144頁,創(chuàng)作于2023年2月結(jié)論可以推廣嗎?實(shí)驗(yàn)中的處理、受試對象或者實(shí)驗(yàn)環(huán)境也許不切實(shí)際。——例:一位心理學(xué)家想研究,失敗和挫折對于一個工作小組成員間的關(guān)系有何影響。她將學(xué)生組成一隊(duì),帶他們到心理實(shí)驗(yàn)室,然后叫他們玩一種需要團(tuán)隊(duì)合作的小游戲。游戲被做了手腳,使得他們總是輸。心理學(xué)透過單向窗,觀察這些學(xué)生玩一晚上的游戲,并且記下他們的行為變化。第122頁,課件共144頁,創(chuàng)作于2023年2月在實(shí)驗(yàn)室里玩馬上就會結(jié)束且賭注很小的游戲,比起工作好幾個月開發(fā)新產(chǎn)品結(jié)果總是有問題,最后被公司放棄,可差了十萬八千里呢!——例:第三煞車燈——例:最好的醫(yī)療照顧從實(shí)驗(yàn)室的老鼠推廣到真實(shí)世界的人身上,就更難上加難了!第123頁,課件共144頁,創(chuàng)作于2023年2月完全隨機(jī)化設(shè)計(jì)
先把受試對象隨機(jī)分組,組數(shù)和處理數(shù)相同,然后對每一組施行一種處理第124頁,課件共144頁,創(chuàng)作于2023年2月配對設(shè)計(jì)先選取成對的受試對象,同一對中的兩個要盡量接近。然后隨機(jī)將二個處理分別指派給每一對當(dāng)中的兩個受試對象。有時配對設(shè)計(jì)中的“一對”,實(shí)際上只包含一個受試對象,只是分時間先后分別接受兩個處理。(可以減少對象間變異所產(chǎn)生的影響)——例:可口可樂對百事可樂第125頁,課件共144頁,創(chuàng)作于2023年2月區(qū)集設(shè)計(jì)區(qū)集:一組實(shí)驗(yàn)個體,這些個體在實(shí)驗(yàn)之前,就被認(rèn)為在會影響反應(yīng)的某些方面很類似。區(qū)集設(shè)計(jì):將個體隨機(jī)指派到各處理的這個步驟,是在每個區(qū)集里面?zhèn)€別執(zhí)行的。——男性、女性和廣告第126頁,課件共144頁,創(chuàng)作于2023年2月完全隨機(jī)化設(shè)計(jì)把所有受試對象隨機(jī)分配給所有的處理配對設(shè)計(jì)比較兩個處理,方法是把兩個處理分別給一對類似的受試對象,或者兩個處理分別給同一受試對象,但順序隨機(jī)決定區(qū)集設(shè)計(jì)先把類似的受試對象放在同一個區(qū)集,然后分別在每一個區(qū)集中隨機(jī)指派處理給各受試對象。第127頁,課件共144頁,創(chuàng)作于2023年2月第六節(jié)數(shù)據(jù)倫理產(chǎn)生數(shù)據(jù)和使用數(shù)據(jù),應(yīng)遵守誠信原則——選擇研究對象的方式有沒有偏差?——是不是只報(bào)告了部分研究對象的數(shù)據(jù)?——是不是試了好幾種統(tǒng)計(jì)分析方法,然后只報(bào)告了看起來最好的結(jié)果?——明明要用電話推銷,卻說是在做抽樣調(diào)查而對于要從人群中搜集數(shù)據(jù)的研究,還應(yīng)依照以下原則:第128頁,課件共144頁,創(chuàng)作于2023年2月1、必須設(shè)立試驗(yàn)審查委員會,負(fù)責(zé)事先審查所有的研究計(jì)劃,以保護(hù)受試對象,使受試對象免于受到可能的傷害2、在搜集資料前,研究中的每一個受試對象必須在知情且同意的情況下受試3、任何個人資料都必須保密,只有整體的統(tǒng)計(jì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 嵌入式開發(fā)項(xiàng)目管理的小技巧試題及答案
- 電動機(jī)經(jīng)營權(quán)轉(zhuǎn)讓合同書(15篇)
- 食堂承包合同協(xié)議書范本(18篇)
- 特色農(nóng)產(chǎn)品種植與銷售合同協(xié)議
- 計(jì)算機(jī)四級嵌入式項(xiàng)目經(jīng)驗(yàn)的試題及答案
- 人力資源委托咨詢服務(wù)合同協(xié)議書
- 不斷進(jìn)取計(jì)算機(jī)二級VFP試題及答案
- 法律學(xué)民法原理與實(shí)踐試題集
- 監(jiān)理師考試中的考生素養(yǎng)與個人發(fā)展研究試題及答案
- 認(rèn)真對待2025年信息系統(tǒng)監(jiān)理師考試試題及答案
- srs13a中文說明書編程手冊
- 江西省部分高中學(xué)校2024-2025學(xué)年高一下學(xué)期聯(lián)考生物試卷(原卷版+解析版)
- GB/T 10810.4-2025眼鏡鏡片第4部分:減反射膜試驗(yàn)方法
- 鋼箱梁吊裝施工專項(xiàng)方案
- 上腔靜脈綜合征護(hù)理課件
- 運(yùn)動康復(fù)專業(yè)畢業(yè)論文
- 腦卒中患者轉(zhuǎn)院時的流程要點(diǎn)
- 浙江省縣域教研聯(lián)盟2023-2024學(xué)年高二下學(xué)期學(xué)業(yè)水平模擬考試語文試題(解析版)
- 管廊施工方案
- 建筑行業(yè)安全生產(chǎn)責(zé)任制管理制度
- (八省聯(lián)考)河南省2025年高考綜合改革適應(yīng)性演練 化學(xué)試卷合集(含答案逐題解析)
評論
0/150
提交評論