應(yīng)用統(tǒng)計(jì)學(xué)第一章 一些基本概念課件_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)第一章 一些基本概念課件_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)第一章 一些基本概念課件_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)第一章 一些基本概念課件_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)第一章 一些基本概念課件_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念參考書(shū)目:1、《統(tǒng)計(jì)學(xué):基本概念與方法》吳喜之譯著,高等教育出版社2、《統(tǒng)計(jì)建模與R軟件》,薛毅編著,清華大學(xué)出版社3、《復(fù)雜數(shù)據(jù)統(tǒng)計(jì)方法——基于R的應(yīng)用》吳喜之編著,中國(guó)人民大學(xué)出版社應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念關(guān)于課程…統(tǒng)計(jì)的基本思想學(xué)會(huì)用統(tǒng)計(jì)處理問(wèn)題統(tǒng)計(jì)軟件的使用(Matlab,R,…..)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念第一章一些基本概念應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念什么是統(tǒng)計(jì)學(xué)?1.數(shù)據(jù)搜集:取得數(shù)據(jù)2.數(shù)據(jù)分析:分析數(shù)據(jù)3.數(shù)據(jù)表述:圖表展示數(shù)據(jù)4.數(shù)據(jù)解釋:結(jié)果的說(shuō)明

收集、分析、表述和解釋數(shù)據(jù)的科學(xué)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)學(xué)的作用我國(guó)著名的經(jīng)濟(jì)學(xué)家馬寅初指出“學(xué)者不能離開(kāi)統(tǒng)計(jì)而治學(xué),政治家不能離開(kāi)統(tǒng)計(jì)學(xué)而施政,事業(yè)家不能離開(kāi)統(tǒng)計(jì)而執(zhí)業(yè)”。美國(guó)著名的科幻作家威爾斯說(shuō)“對(duì)于追求效率的公民而言,統(tǒng)計(jì)思維總有一天會(huì)和讀寫(xiě)能力一樣重要”。在諾貝爾經(jīng)濟(jì)學(xué)獲獎(jiǎng)?wù)咧校?/3以上的研究成果與統(tǒng)計(jì)和定量分析有關(guān)。美國(guó)總統(tǒng)的年薪已經(jīng)達(dá)到40萬(wàn)美元,在各國(guó)元首中名列前茅,但根據(jù)美國(guó)《工作等級(jí)年鑒》一書(shū)的排名,總統(tǒng)一職并未進(jìn)入最好的職業(yè)之列。在美國(guó),最好的職業(yè)是統(tǒng)計(jì)學(xué)家。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念以歸納為主要思維方式的統(tǒng)計(jì)不是以演繹為主的數(shù)學(xué)統(tǒng)計(jì)可應(yīng)用于各個(gè)不同學(xué)科,在有些學(xué)科已經(jīng)有其特有的方法和特點(diǎn);如生物統(tǒng)計(jì)(biostatistics)、經(jīng)濟(jì)計(jì)量學(xué)(econometrics)以及目前很熱門(mén)的生物信息(bioinformation)和數(shù)據(jù)挖掘(DataMining)的方法主體都是統(tǒng)計(jì)統(tǒng)計(jì)的特點(diǎn)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)的一些例子應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念一些例子大家經(jīng)常在報(bào)刊雜志上看到類似的報(bào)道:通用汽車37%的銷售額來(lái)源于北美以外;我國(guó)失業(yè)率下降到25年來(lái)的最低點(diǎn)4%;上證指數(shù)接近2000點(diǎn)。我曾在網(wǎng)上利用“百度”搜索引擎對(duì)互聯(lián)網(wǎng)上有關(guān)網(wǎng)頁(yè)進(jìn)行搜索,得到的結(jié)果是:包含“旅游管理”這一詞匯的網(wǎng)頁(yè)高達(dá)25,500,000項(xiàng),包含“公共事業(yè)管理”這一詞匯的網(wǎng)頁(yè)有100,000,000項(xiàng)。--以上數(shù)據(jù)實(shí)際上都是通過(guò)數(shù)據(jù)收集,統(tǒng)計(jì)得來(lái)的。

生活中我們也會(huì)不自覺(jué)地用到統(tǒng)計(jì),比如說(shuō),我們可能經(jīng)常去高中同學(xué)所在的學(xué)校去玩,他給你介紹同寢室的張三,要你猜他是哪兒人,只見(jiàn)他足有一米八,身材魁梧,你可能會(huì)問(wèn):你是北方人吧?反之,你可能會(huì)認(rèn)為他是南方人。這實(shí)際是應(yīng)用了統(tǒng)計(jì)中平均值的知識(shí)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念一些例子每當(dāng)季節(jié)交替之時(shí),商場(chǎng)都要對(duì)有關(guān)商品進(jìn)行打折銷售,那么為什么商家要進(jìn)行打折銷售,它怎么才能保證打折后的利潤(rùn)不會(huì)有損失?至少是打折后的利潤(rùn)要好于不打折的利潤(rùn),那么這個(gè)折扣的度是要事先進(jìn)行分析的。

商家在銷售之前通常都會(huì)對(duì)銷售量和打折的度進(jìn)行一個(gè)簡(jiǎn)單的估計(jì),

這里所用到的就是統(tǒng)計(jì)學(xué)中的參數(shù)估計(jì)理論。有觀點(diǎn)認(rèn)為,紅樓夢(mèng)的后40回不是曹雪芹所著而是高鶚?biāo)鶎?xiě)的。在1981年,首屆國(guó)際《紅樓夢(mèng)》研討會(huì)在美國(guó)召開(kāi),威斯康星大學(xué)的陳炳藻就發(fā)表這樣的一篇論文,《從詞匯上的統(tǒng)計(jì)<紅樓夢(mèng)>作者的問(wèn)題》。他從字、詞出現(xiàn)頻率入手,通過(guò)計(jì)算機(jī)進(jìn)行統(tǒng)計(jì)分析,對(duì)《紅樓夢(mèng)》后40回系高鶚?biāo)鬟@一流行看法提出異議,認(rèn)為120回均系曹雪芹所作。這個(gè)就是利用了統(tǒng)計(jì)學(xué)中的假設(shè)推斷理論進(jìn)行分析的。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念隨著人類文明的出現(xiàn),就產(chǎn)生了最初的統(tǒng)計(jì)實(shí)踐活動(dòng)。統(tǒng)計(jì)實(shí)踐活動(dòng)隨著國(guó)家的產(chǎn)生而不斷加強(qiáng)和完善。早在四千多年前的中國(guó)夏禹王朝,為了治國(guó)治水的需要,曾進(jìn)行初步的國(guó)情統(tǒng)計(jì),查明當(dāng)時(shí)中國(guó)有人口約1355萬(wàn)人,土地約2431萬(wàn)頃,并將全國(guó)分為九州。公元前3000多年,古埃及為了建造金字塔征集經(jīng)費(fèi)、勞力,對(duì)全國(guó)的財(cái)產(chǎn)、人口進(jìn)行了數(shù)次普查。我國(guó)在春秋戰(zhàn)國(guó)時(shí)期,管仲就明確指出“不明于計(jì)數(shù),猶如無(wú)舟楫欲徑于水,險(xiǎn)也”;商鞅提出了“強(qiáng)國(guó)知十三數(shù)”,系統(tǒng)地列出了治理國(guó)家必須了解的十三項(xiàng)指標(biāo),包括人口、土地、糧食等。我國(guó)的《周易正義》中寫(xiě)到原始社會(huì):“事大,大結(jié)其繩;事小,小結(jié)其繩;結(jié)之多少,隨物眾寡”,這就是人們對(duì)社會(huì)現(xiàn)象進(jìn)行的簡(jiǎn)單的記錄和計(jì)量活動(dòng),于是產(chǎn)生了最早的統(tǒng)計(jì)萌芽。統(tǒng)計(jì)實(shí)踐的出現(xiàn)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念

1.創(chuàng)始人:海門(mén)爾·康令HermanConring(1606-1681,德國(guó))繼承者:格特弗里德·阿亨瓦爾GottfriedAchenwall(1719-1772,德國(guó))

2.他們?cè)诘聡?guó)的大學(xué)開(kāi)設(shè)了一門(mén)新課程“國(guó)勢(shì)學(xué)”,主要講述有關(guān)國(guó)情國(guó)力的系統(tǒng)知識(shí),包括土地、人口、政治、軍事、財(cái)政、貨幣、科學(xué)、藝術(shù)和宗教等。阿亨華爾首先將“國(guó)勢(shì)學(xué)”正式命名為“統(tǒng)計(jì)學(xué)”。3.但是由于他沒(méi)有將數(shù)量分析引入進(jìn)來(lái),因此“國(guó)勢(shì)學(xué)派”有“統(tǒng)計(jì)學(xué)”之名而無(wú)“統(tǒng)計(jì)學(xué)”之實(shí)。

古典統(tǒng)計(jì)學(xué)時(shí)期(17世紀(jì)中葉至18世紀(jì)末)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念近代統(tǒng)計(jì)學(xué)時(shí)期(19世紀(jì)初至20世紀(jì)初)數(shù)理統(tǒng)計(jì)學(xué)派的代表人物比利時(shí)的凱特勒博士深受拉普拉斯影響,在其《社會(huì)物理學(xué)》中將概率論引入統(tǒng)計(jì)學(xué),在生物統(tǒng)計(jì)和天文學(xué)研究中成功地運(yùn)用了二項(xiàng)分布和正態(tài)分布方法。凱特勒博士認(rèn)為要促進(jìn)科學(xué)的發(fā)展,就必須更多的應(yīng)用統(tǒng)計(jì)學(xué),大力提倡采用統(tǒng)計(jì)方法對(duì)自然現(xiàn)象和社會(huì)現(xiàn)象的規(guī)律性進(jìn)行觀察。社會(huì)統(tǒng)計(jì)學(xué)派的代表人物有克尼斯,梅爾和恩格爾等。社會(huì)統(tǒng)計(jì)學(xué)派繼承和發(fā)展了“政治算術(shù)學(xué)派”的理論體系,完善了統(tǒng)計(jì)有關(guān)描述性的分析方法,建立了較為完整的統(tǒng)計(jì)指標(biāo)方法和社會(huì)統(tǒng)計(jì)學(xué)科體系,對(duì)當(dāng)時(shí)的政府統(tǒng)計(jì)工作和統(tǒng)計(jì)學(xué)理論的推廣產(chǎn)生了積極的促進(jìn)作用★討論題恩格爾指數(shù)及其應(yīng)用?恩格爾系數(shù)(%)=食品支出總額/家庭或個(gè)人消費(fèi)支出總額×100%

國(guó)際上常常用恩格爾系數(shù)來(lái)衡量一個(gè)國(guó)家和地區(qū)人民生活水平的狀況。根據(jù)聯(lián)合國(guó)糧農(nóng)組織提出的標(biāo)準(zhǔn),恩格爾系數(shù)在59%以上為貧困,50-59%為溫飽,40-50%為小康,30-40%為富裕,低于30%為最富裕。

應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念20世紀(jì)初,大工業(yè)的發(fā)展對(duì)產(chǎn)品質(zhì)量檢驗(yàn)問(wèn)題提出了新的要求,即只抽取少量產(chǎn)品作為樣本對(duì)全部產(chǎn)品的質(zhì)量好壞作出推斷。因?yàn)榇笈慨a(chǎn)品要做全面的檢驗(yàn),既費(fèi)時(shí)、費(fèi)錢,又費(fèi)人力,加之有些產(chǎn)品質(zhì)量的檢驗(yàn)要做破壞性檢驗(yàn),全部檢驗(yàn)已不可能。1908年,英國(guó)的威廉.希利.高賽特提出了小樣本t統(tǒng)計(jì)量,利用它就可以從大量的產(chǎn)品中只抽取較小的樣本完成對(duì)全部產(chǎn)品質(zhì)量的檢驗(yàn)和推斷,這樣就使統(tǒng)計(jì)學(xué)進(jìn)入了現(xiàn)代統(tǒng)計(jì)學(xué)的新階段(主要是推斷性統(tǒng)計(jì)學(xué))。之后由費(fèi)歇爾、卡爾·皮爾遜、奈曼、瓦爾德等為代表的一代統(tǒng)計(jì)學(xué)大師,共同完成了現(xiàn)代統(tǒng)計(jì)學(xué)的理論框架,使統(tǒng)計(jì)學(xué)成為一門(mén)嚴(yán)謹(jǐn)?shù)膶W(xué)科,同時(shí)數(shù)理統(tǒng)計(jì)學(xué)逐漸成為了主流統(tǒng)計(jì)學(xué)。1950年以后,受計(jì)算機(jī)和新興科學(xué)的影響,這一時(shí)期統(tǒng)計(jì)學(xué)的研究和應(yīng)用范圍越來(lái)越廣。現(xiàn)代統(tǒng)計(jì)學(xué)的發(fā)展時(shí)期(20世紀(jì)初到現(xiàn)在)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念大數(shù)據(jù)時(shí)代應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念淘寶中的統(tǒng)計(jì)男人和女人理財(cái)消費(fèi)有什么不同?浙江和北京民眾理財(cái)習(xí)慣有何不同?天秤座和處女座誰(shuí)更愛(ài)理財(cái)……數(shù)據(jù)顯示,男性用戶對(duì)于在淘寶上買理財(cái)產(chǎn)品,總體上比女性更積極。在淘寶理財(cái)?shù)目傆脩糁校行杂脩粽急?6.3%,多于女性。在現(xiàn)有的理財(cái)用戶中,浙江人熱情最高,占據(jù)所有用戶的18%,遙遙領(lǐng)先全國(guó)。而北京用戶出手則最大氣,人均購(gòu)買理財(cái)產(chǎn)品9920元,幾乎是全部用戶人均3417元的3倍。天秤座無(wú)疑是理財(cái)意識(shí)最高的星座,該星座用戶占總用戶的21%,而金牛座則是理財(cái)意識(shí)最淡薄的星座,該星座用戶僅占總用戶的6%。不同星座的男女,在購(gòu)買金額上也是表現(xiàn)各異。男性用戶中,摩羯座出手最豪爽,人均購(gòu)買金額達(dá)到6889元,而巨蟹座出手最謹(jǐn)慎,人均購(gòu)買金額僅3001元;在女性用戶中,天蝎座出手最豪爽,人均購(gòu)買金額為7401元,而天秤座出手最謹(jǐn)慎,人均僅2400元。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念一些例子某企業(yè)開(kāi)發(fā)出一種新的化妝品,在正式投產(chǎn)之前,需要根據(jù)市場(chǎng)需求情況制定其價(jià)格和銷售策略。該企業(yè)委托某市場(chǎng)調(diào)查公司在全市200萬(wàn)戶家庭中抽取1000戶家庭試用,然后了解該化妝品的銷售前景。如何科學(xué)地從該市200萬(wàn)家庭中抽出這1000戶家庭進(jìn)行調(diào)查,并由這1000戶家庭反饋的市場(chǎng)信息科學(xué)地推斷出全市200萬(wàn)戶家庭對(duì)該化妝品的購(gòu)買意愿這一數(shù)量規(guī)律,這就需要應(yīng)用統(tǒng)計(jì)學(xué)當(dāng)中的抽樣方式的知識(shí)。更高級(jí)一點(diǎn)的統(tǒng)計(jì)理論呢,也能在我們的日常生活中反映出來(lái),我們?cè)谧鰷珪r(shí),嘗一下咸淡這個(gè)過(guò)程上升到統(tǒng)計(jì)理論的范疇,包括抽樣方法(簡(jiǎn)單隨機(jī)抽樣)、分布理論(均勻分布)、推斷理論(以樣本推總體)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念你相信統(tǒng)計(jì)結(jié)果嗎?數(shù)據(jù)可以有誤或作假統(tǒng)計(jì)方法(有意或無(wú)意)使用不當(dāng)可以誤導(dǎo)。有低級(jí)誤導(dǎo)和高級(jí)誤導(dǎo)。常識(shí)判斷和直覺(jué)是重要的應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念關(guān)于美國(guó)選舉的兩個(gè)例子(1)誰(shuí)會(huì)在1936選舉中獲勝?AlfLondon還是

F.D.R.(羅斯福)?LiteraryDigest(文摘)送出一千萬(wàn)份問(wèn)卷(返回二百四十萬(wàn)份)后,預(yù)測(cè)London會(huì)贏.而Gallop(蓋洛普)只問(wèn)了5000人說(shuō)

Roosevelt(羅斯福)會(huì)贏.最后羅斯福和蓋洛普都贏了.文摘倒閉了.應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念關(guān)于美國(guó)選舉的兩個(gè)例子(2)誰(shuí)會(huì)在1948選舉中獲勝?ThomasDewey還是HarryTruman(杜魯門(mén))?Crossley,Gallop(蓋洛普),Roper所有都預(yù)測(cè)Dewey會(huì)贏(每個(gè)機(jī)構(gòu)用了5000個(gè)問(wèn)卷).最后(包括蓋洛普)他們都輸了,而杜魯門(mén)贏了.應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)學(xué)的分類統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念一、描述統(tǒng)計(jì)

(descriptivestatistics)研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)分支內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析

目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念二、推斷統(tǒng)計(jì)

(inferentialstatistics)研究如何利用樣本數(shù)據(jù)來(lái)推斷總體特征的統(tǒng)計(jì)學(xué)分支內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶?duì)總體特征作出推斷樣本總體應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念三、理論統(tǒng)計(jì)學(xué)(Theoreticalstatistics)

和應(yīng)用統(tǒng)計(jì)學(xué)(Appliedstatistics)

根據(jù)統(tǒng)計(jì)學(xué)研究方法和統(tǒng)計(jì)方法的應(yīng)用范圍不同,統(tǒng)計(jì)學(xué)分為理論統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)。理論統(tǒng)計(jì)學(xué)主要研究統(tǒng)計(jì)學(xué)的基本原理和基本方法,研究如何將數(shù)學(xué)原理和計(jì)算機(jī)技術(shù)應(yīng)用于統(tǒng)計(jì)學(xué),發(fā)展出新的統(tǒng)計(jì)學(xué)方法和技術(shù)。應(yīng)用統(tǒng)計(jì)學(xué)主要是研究如何將統(tǒng)計(jì)學(xué)的方法和原理與實(shí)際問(wèn)題相結(jié)合,使用統(tǒng)計(jì)學(xué)的方法解決實(shí)際問(wèn)題。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)的一些做法統(tǒng)計(jì)可以指導(dǎo)我們收集數(shù)據(jù).當(dāng)擁有來(lái)自一些變量(指標(biāo))的數(shù)據(jù)或記錄,但缺乏模型來(lái)描述這些變量之間關(guān)系的情況下,可用統(tǒng)計(jì)方法建立模型.在有了一定的模型時(shí),統(tǒng)計(jì)可以確定手中數(shù)據(jù)是否令人信服地支持某種論點(diǎn).模型也用來(lái)對(duì)未來(lái)進(jìn)行預(yù)測(cè).統(tǒng)計(jì)直觀的圖表展示,可以使各個(gè)領(lǐng)域的專家容易理解應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)學(xué)的目的任何客觀事物都是必然性與偶然性的對(duì)立統(tǒng)一。同樣,任何一個(gè)數(shù)據(jù)也都是必然性與偶然性共同作用的結(jié)果。必然性反映了事物本質(zhì)的特征和聯(lián)系,是比較穩(wěn)定的,因而它決定了事物的內(nèi)在本質(zhì)是有規(guī)律可循的。偶然性則反映了改事物每個(gè)表現(xiàn)形式的差異。如果事物只有必然性一個(gè)方面的特征,事物的表現(xiàn)形式就會(huì)比較簡(jiǎn)單,就可以比較容易把握它的規(guī)律性。正是由于偶然性的存在,形成數(shù)據(jù)表現(xiàn)形式的千差萬(wàn)別。這樣,必然性的數(shù)量規(guī)律性就被掩蓋在表面的差異之中了。統(tǒng)計(jì)學(xué)的目的就是要從偶然性中探索到內(nèi)在的、本質(zhì)的數(shù)量規(guī)律。從統(tǒng)計(jì)方法上看,統(tǒng)計(jì)學(xué)提供了一系列的方法,專門(mén)用來(lái)收集數(shù)據(jù)、整理數(shù)據(jù)、顯示數(shù)據(jù)的特征,進(jìn)而分析和探索出事物總體的數(shù)量規(guī)律性。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)的內(nèi)容和需要的知識(shí)數(shù)學(xué)的幾乎所有內(nèi)容(不一定事先知道需要什么)用計(jì)算機(jī)做統(tǒng)計(jì)計(jì)算其他(對(duì)象)領(lǐng)域的知識(shí)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)和數(shù)學(xué)的區(qū)別數(shù)學(xué)思維是以演繹為主統(tǒng)計(jì)思維是以歸納為主,兼有演繹統(tǒng)計(jì)各領(lǐng)域利用幾乎所有存在的數(shù)學(xué)內(nèi)容.但統(tǒng)計(jì)本身的數(shù)學(xué)是為具體目標(biāo)服務(wù)的,自己一般不形成數(shù)學(xué)體系應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念第五節(jié)、“虛假”的統(tǒng)計(jì)學(xué)統(tǒng)計(jì)數(shù)據(jù)的有效性:白血病,環(huán)保好樣本和壞樣本:買桔子調(diào)查中的非技術(shù)因素:措辭(stock),社會(huì)文化的不同(自殺)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念案例分析(魅力)比如有兩條這樣的新聞,他們都是關(guān)于高壓電線是否會(huì)導(dǎo)致附近的兒童得白血病,它的理論是因?yàn)殡娏鲿?huì)產(chǎn)生磁場(chǎng),磁場(chǎng)往往會(huì)引起白血病,所以生活在有電的環(huán)境里,會(huì)使人暴露在磁場(chǎng)中,那么住在高壓電線附近,會(huì)增加這種暴露的程度。第一條新聞是找了一位能說(shuō)會(huì)道的母親,她的孩子得了白血病,剛好她家就在高壓電線附近,因此這位母親向觀眾介紹了在高壓電線附近是如何的危險(xiǎn)這一情況;另一條新聞呢,是國(guó)家癌癥所的一則報(bào)道,他們用了5年的時(shí)間和100萬(wàn)資金,走訪了全國(guó)十幾個(gè)省進(jìn)行高壓電線附近的兒童白血病情況的調(diào)查,最后得出結(jié)論,在白血病和暴露在高壓電線所在的磁場(chǎng)之間,找不到任何的相關(guān)關(guān)系。

那么對(duì)于這樣的兩條新聞,我想一般的觀眾都會(huì)傾向于后者,這主要的原因可能就是在于統(tǒng)計(jì)數(shù)字的魅力,人們往往對(duì)具有統(tǒng)計(jì)數(shù)字的新聞和文章都比較信服。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念案例分析(方式)某個(gè)機(jī)構(gòu)花費(fèi)了很多的資金在某一城市做一個(gè)調(diào)查,他們將城區(qū)分成兩個(gè)部分,一個(gè)上層區(qū),一個(gè)下層區(qū),分別對(duì)應(yīng)工資的高與低,目的是想了解,哪個(gè)層區(qū)的住戶更加注重資源的回收,他們所采用的度量變量就是路邊資源回收垃圾每周的重量。結(jié)果得出上層區(qū)均超過(guò)下層區(qū),由此,這個(gè)機(jī)構(gòu)得出結(jié)論認(rèn)為上層區(qū)的居民更加注重資源回收。

那么對(duì)于這樣的數(shù)據(jù)報(bào)告,我們就要表示懷疑了,事實(shí)上,這個(gè)事件的本身是跟這個(gè)機(jī)構(gòu)的分析結(jié)果不符合的。因?yàn)樯蠈訁^(qū)在丟回收箱的物品都比較重,而下層區(qū)的就比較輕,比如單拿飲料來(lái)說(shuō),上層區(qū)的多半的丟入的是玻璃瓶的酒,而下層區(qū)的丟入的多半是塑料的飲料。這樣的話,單單從重量上來(lái)比較,統(tǒng)計(jì)數(shù)據(jù)就不是那么有效了。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念案例分析(質(zhì)量)當(dāng)我們看到一則新聞和一篇統(tǒng)計(jì)報(bào)告的時(shí)候,往往不知道它的樣本是如何取得的,這樣就給文章的可信度打了折扣。樣本也有好樣本和壞樣本的區(qū)分。我們首先來(lái)看看壞樣本,比如:我們要檢查一車桔子是不是優(yōu)質(zhì)的,那么最容易的方法就是在擺在每箱最上面的桔子中抽取,然而這樣得出的結(jié)論就值得懷疑了,首先在運(yùn)送的過(guò)程中,在下部的桔子是最容易受到碰撞的,其次如果供貨商也了解這一點(diǎn)的話,把最好的桔子都放在上部,那么對(duì)于這樣的統(tǒng)計(jì)結(jié)論就沒(méi)有很大的意義。這樣的果,我們用統(tǒng)計(jì)學(xué)的術(shù)語(yǔ)來(lái)說(shuō)是,有偏的。也就是說(shuō)樣本的情況對(duì)于整個(gè)總體來(lái)說(shuō)是有偏誤的。解決方法:利用隨機(jī)抽取的形式,來(lái)消除有偏性。比如,隨機(jī)數(shù)字表,電腦隨機(jī)生成數(shù)字壞樣本還有一個(gè)特性就是它的高變異性,不過(guò)它可以利用擴(kuò)大樣本容量的方法來(lái)消除。這個(gè)我們?cè)谝院蟮恼鹿?jié)再詳細(xì)說(shuō)。可能大家對(duì)于壞樣本的有偏和變異還不是很理解,這里我講一個(gè)非常直觀的概念,就是射箭原理。偏差:意思是我們的瞄準(zhǔn)有問(wèn)題,射出的箭都往同一個(gè)方向偏離靶心:樣本值沒(méi)有以總體值為中心點(diǎn)。變異性:箭著點(diǎn)在靶上分散得很廣“重復(fù)抽樣所得結(jié)果并不接近,彼此間差異很大。有時(shí)候會(huì)出現(xiàn)低變異性,高偏差或者低偏差,高變異性的情況。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念案例分析(措辭)有一個(gè)調(diào)查機(jī)構(gòu)想做一個(gè)關(guān)于居民擁有股票的比例的問(wèn)卷調(diào)查,他在采訪中問(wèn)道:“是否擁有stock”(股票,也是家禽),結(jié)果大部分的農(nóng)場(chǎng)主的回答都是yes,可是他們實(shí)際擁有股票的卻很少。那么這樣的統(tǒng)計(jì)分析結(jié)果往往很容易迷惑到不了解數(shù)據(jù)來(lái)源的讀者。

stock=(股票,也是家禽)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念案例分析(文化)

在調(diào)查全球的自殺率問(wèn)題中,社會(huì)文化就占有很大的因素,在日本這樣的國(guó)家,有遇到恥辱就光榮自殺的傳統(tǒng),這就使得日本的自殺事件報(bào)道的比例較高,而在大部分信奉天主教的國(guó)家,他們都以自殺為恥辱,因此所公布的自殺率自然比其他的國(guó)家低很多。而隨著文化的發(fā)展,很多國(guó)家都將抑郁癥視為生理上的疾病,而不是個(gè)性上的弱點(diǎn),自殺是這種病的悲劇性結(jié)束,而不是道德瑕疵。這使得這些國(guó)家的家屬和醫(yī)生更愿意將自殺列為死因。也使著自殺率在逐年升高,這個(gè)并非真的數(shù)據(jù)在增加,而是人們的觀念發(fā)生了變化。

因此我們?cè)诳创愃七@樣的數(shù)據(jù)報(bào)表的時(shí)候,不能被數(shù)據(jù)值的外表迷惑,要弄清楚數(shù)據(jù)的來(lái)源是怎樣的,他調(diào)查的方式又是怎樣的。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念計(jì)算機(jī)的重要性由于統(tǒng)計(jì)和數(shù)據(jù)打交道,沒(méi)有計(jì)算機(jī)的發(fā)展統(tǒng)計(jì)就沒(méi)有前途.計(jì)算機(jī)和統(tǒng)計(jì)的發(fā)展相輔相成應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念

現(xiàn)實(shí)中的隨機(jī)性從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等等。但是在許多領(lǐng)域,很難用如此確定的公式或論述來(lái)描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個(gè)吸煙、喝酒、不鍛煉、而且一口長(zhǎng)葷的人可能比一個(gè)很少得病、生活習(xí)慣良好的人活得長(zhǎng)。因此,可以說(shuō),活得長(zhǎng)短是有一定隨機(jī)性的(randomness)。這種隨機(jī)性可能和人的經(jīng)歷、基因、習(xí)慣等無(wú)數(shù)說(shuō)不清的因素都有關(guān)系。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念現(xiàn)實(shí)中的規(guī)律性但是從總體來(lái)說(shuō),我國(guó)公民的平均年齡卻是非常穩(wěn)定的。而且女性的平均年齡也穩(wěn)定地比男性高幾年。這就是規(guī)律性。一個(gè)人可能活過(guò)這個(gè)平均年齡,也可能活不到這個(gè)年齡,這是隨機(jī)的。但是總體來(lái)說(shuō),平均年齡的穩(wěn)定性,卻說(shuō)明了隨機(jī)之中有規(guī)律性。這種規(guī)律就是統(tǒng)計(jì)規(guī)律。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念概率和機(jī)會(huì)你可能經(jīng)常聽(tīng)到概率(probability)這個(gè)名詞。例如在天氣預(yù)報(bào)中會(huì)提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說(shuō)來(lái),概率描述了某件事情發(fā)生的機(jī)會(huì)。顯然,這種概率不可能超過(guò)百分之百,也不可能少于百分之零。換言之,概率是在0和1之間的一個(gè)數(shù),說(shuō)明某事件發(fā)生的機(jī)會(huì)有多大。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念有些概率是無(wú)法精確推斷的比如你對(duì)別人說(shuō)你下一個(gè)周末去公園的概率是百分之八十。但你無(wú)法精確說(shuō)出為什么是百分之八十而不是百分之八十四或百分之七十八。其實(shí)你想說(shuō)的是你很可能去,但又沒(méi)有完全肯定。實(shí)際上,到了周末,你或者去,或者不去;不可能有分身術(shù)把百分之八十的你放到公園,而其余的放在別處。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念有些概率是可以估計(jì)的比如擲骰子。只要沒(méi)有人在骰子上做手腳,你得到6點(diǎn)的概率應(yīng)該是六分之一。得到其他點(diǎn)的概率也是一樣。得到6的概率或者機(jī)會(huì)是可以知道的,但擲骰子的結(jié)果還只可能是六個(gè)數(shù)目之一。這個(gè)已知的規(guī)律就反映了規(guī)律性,而得到哪個(gè)結(jié)果則反映了隨機(jī)性。如果你擲1000次骰子,那么,大約有六分之一的可能會(huì)得到6;這也是隨機(jī)性呈現(xiàn)有規(guī)律的一個(gè)體現(xiàn)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個(gè)固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,開(kāi)車后,坐在這節(jié)車廂的旅客有多少就沒(méi)準(zhǔn)了。這有隨機(jī)性。該車廂的乘客數(shù)為變量(variable)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)一個(gè)學(xué)校的注冊(cè)在校男女生比例是固定的,為常量但是,該校任意一群學(xué)生的男女生比例就不一定和全校的比例一樣了,它為變量(variable)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)當(dāng)變量按照隨機(jī)規(guī)律所取的值是數(shù)量時(shí)該變量稱為定量變量或數(shù)量變量(quantitativevariable);因?yàn)槭请S機(jī)的,也稱為隨機(jī)變量(randomvariable)。如身高體重,購(gòu)買某商品的人數(shù)等等應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)象性別,觀點(diǎn)之類的取非數(shù)量值的變量就稱為定性變量或?qū)傩宰兞炕蚍诸愖兞?qualitativevariable,或categoricalvariable)。這些定性變量也可以由定量變量來(lái)描述,如男女生的數(shù)目,持有某觀點(diǎn)的人數(shù)比例等等。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)定性變量只有用數(shù)量來(lái)描述時(shí),才有可能建立數(shù)學(xué)模型,并使用計(jì)算機(jī)來(lái)分析。數(shù)據(jù)中它們通常用啞元(dummyvariable)代表,比如性別用0、1代表,三種收入用0、1、2代表(或用字母代表)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?不同機(jī)構(gòu)調(diào)查所得到的北京收入萬(wàn)元以上市民的比例都不一樣,這是變量而這些調(diào)查產(chǎn)生一些數(shù)目,這些數(shù)目就是數(shù)據(jù)(data)數(shù)據(jù)是關(guān)于變量的觀測(cè)值。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量和數(shù)據(jù)通過(guò)數(shù)據(jù)可驗(yàn)證有關(guān)的理論或假定。比如通過(guò)抽樣調(diào)查驗(yàn)證美國(guó)選民對(duì)共和黨候選人的支持率是否超過(guò)50%通過(guò)抽樣,可以檢驗(yàn)?zāi)撑a(chǎn)品是否合格等等應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念變量之間的關(guān)系現(xiàn)實(shí)世界緊密聯(lián)系的人們想知道投資方式和經(jīng)濟(jì)效益之間的關(guān)系、旅客人數(shù)和經(jīng)濟(jì)發(fā)展之間的關(guān)系等等不討論變量之間的關(guān)系,就無(wú)從談起任何有深度的應(yīng)用,統(tǒng)計(jì)的基本概念就僅僅是擺設(shè)而已。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定量變量間的關(guān)系廣告投入和銷售之間的關(guān)系。下表(數(shù)據(jù)ads.txt)顯示了某企業(yè)的廣告投入和銷售額之間的關(guān)系(萬(wàn)元)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念橫坐標(biāo)代表廣告投入,而縱坐標(biāo)代表銷售收入。看得出有何種關(guān)系嗎?應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定量變量間的關(guān)系能否從該數(shù)據(jù)回答下面問(wèn)題:這兩個(gè)變量是否有關(guān)系?如果有,它們的關(guān)系是否顯著?這些關(guān)系是什么關(guān)系,能否用數(shù)學(xué)模型來(lái)描述?這個(gè)關(guān)系是否帶有普遍性?這個(gè)關(guān)系是不是因果關(guān)系?應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定量變量間的關(guān)系關(guān)于因果關(guān)系在可控制的試驗(yàn)中,較容易找到因果關(guān)系;比如治療方式和療效的關(guān)系等但是,一般來(lái)說(shuō),變量之間有關(guān)系這個(gè)事實(shí)并不意味著一定存在明確的因果關(guān)系。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定量變量間的關(guān)系比如,北京GDP在一年中是快速增長(zhǎng)的,而一個(gè)剛出生的巴拿馬嬰兒在這一年中的體重也是快速增長(zhǎng)的如果畫(huà)出圖來(lái),它們有類似線性的關(guān)系但它們顯然沒(méi)有因果關(guān)系應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定量變量間的關(guān)系只要有關(guān)系,即使不是因果關(guān)系也不妨礙人們利用這種關(guān)系來(lái)進(jìn)行推斷。比如利用公雞打鳴來(lái)預(yù)報(bào)太陽(yáng)升起;雖然公雞打鳴絕對(duì)不是日出的原因(雖然打鳴發(fā)生在先)應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定量變量間的關(guān)系簡(jiǎn)單的辦法(諸如畫(huà)圖)可以得到一些信息,但不一定能夠給出滿意的答案需要更多的工具和手段來(lái)進(jìn)行數(shù)值分析得到更加嚴(yán)格和精確的解答因此,需要繼續(xù)我們的課程應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定性變量間的關(guān)系例下面是對(duì)123人進(jìn)行關(guān)于某項(xiàng)政策調(diào)查所得結(jié)果的一個(gè)簡(jiǎn)單的三維表,它顯示了人們的收入和性別對(duì)該項(xiàng)政策的觀點(diǎn)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念定性變量間的關(guān)系從這個(gè)數(shù)據(jù),希望可以看出收入、性別對(duì)觀點(diǎn)是否有影響及如何影響如果要得到更加精確的結(jié)論,就要進(jìn)行進(jìn)一步的分析和計(jì)算這是后面列聯(lián)表分析或多項(xiàng)分布對(duì)數(shù)線性模型的內(nèi)容應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件現(xiàn)代生活越來(lái)越離不開(kāi)計(jì)算機(jī)了最初的計(jì)算機(jī)僅僅是為科學(xué)計(jì)算而設(shè)計(jì)和建造的統(tǒng)計(jì)是大型計(jì)算機(jī)的最早用戶,現(xiàn)在仍然是數(shù)值計(jì)算的主要用戶應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件計(jì)算機(jī)的使用,從計(jì)算機(jī)語(yǔ)言到“傻瓜式”地點(diǎn)擊鼠標(biāo)輸出結(jié)果也從數(shù)字輸出到各種可以想象得到的形式。輸入數(shù)據(jù),點(diǎn)鼠標(biāo)做一些選項(xiàng),就可得到漂亮結(jié)果但其中充滿了危險(xiǎn)的陷阱

應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件計(jì)算機(jī)無(wú)法識(shí)別你的統(tǒng)計(jì)方面的錯(cuò)誤錯(cuò)誤的方法、錯(cuò)誤的數(shù)據(jù)形式都必然輸出錯(cuò)誤的結(jié)果(雖然看上去可能很漂亮),得到大量垃圾另外,統(tǒng)計(jì)軟件輸出的結(jié)果太多、很難都理解應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件統(tǒng)計(jì)軟件的種類很多。書(shū)中僅介紹最常見(jiàn)的幾種。只要學(xué)會(huì)使用一種“傻瓜式”軟件或編程軟件,使用其他類似的軟件也不會(huì)困難;最多看看幫助和說(shuō)明即可。學(xué)習(xí)軟件的最好方式是需要時(shí)在使用中學(xué)。應(yīng)用統(tǒng)計(jì)學(xué)第一章一些基本概念統(tǒng)計(jì)軟件

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論