




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、女士品茶讀書心得學 院: 國際學院 專 業 班 級: 國際金融113班 學 生 姓 名: 霍啟超 學 號: 0114810 女士品茶讀書心得霍啟超江西財經大學國際學院國際金融專業女士品茶是當代國際著名的統計學家大衛 薩爾斯伯格的一部通俗的關于統計學原理的普及論著。本書以“女士品茶”的故事為開始,但卻并非是一本女性讀物或者關于品茶的書,而是以這位喝茶的英國女士的假設說法為起點,介
2、紹并引出了近代數理統計的開創者費歇爾,以及費歇爾為解決類似問題而發明的實驗設計法,并介紹了20世紀統計學的發展是如何變革了科學。全書總共29章,以時間、空間、事跡等相互穿插來講述發生在統計這個世界里的事件,作者在書中提到的所有科學的學科調查與決策和統計之間的關聯都是由一系列實例來說明的,他細數了二十世紀參與這場科學變革的代表性人物與事跡,通過生動有趣卻不失嚴謹的實例論述了統計學原理,并使用大量的非專業語言通俗地闡述了統計學的基本概念和方法,不僅證明了統計學是一門最嚴格、最合理的認識論和方法學,還深刻地揭示了現代統計學發展的過程,特別是那些很深刻的理論,都是從一些非常簡單實際的問題中發展起來的。
3、在書中他平緩而幽默的敘述,讓讀者飽覽統計學世界的風光,體驗這一奇妙的認知之旅,并值得留待慢慢消化與回味,非常適合統計學入門學生和大眾讀者。讀完本書,我有以下感受:一、對20世紀統計學發展的了解最初的統計學主要是在英國,而后才蔓延到世界。在這一過程中,英國濃厚的學習氛圍為統計學的發展提供了肥沃的土壤,得以孕育一批又一批優秀的統計學家,發展出多元而豐富的學說。在19世紀,科學家們相信所發生的任何事情都預先地決定于兩點:(1)宇宙的初始條件;(2)描繪其運動的數學公式。而對于預測值與觀測值之間的差異。通通歸為誤差。相信只要實驗數據越來越精確,這種誤差是可以消除的。然而,到了19 世紀末,誤差并沒有消
4、失,反倒是增加了。當測試越來越精確,誤差也越來越多。機械宇宙觀處于動搖之中,而統計模型作為一種新的范式在20世紀末期被科學家在各個領域越來越廣泛地運用。相關、勝率、風險等統計術語也滲入到大眾詞匯中。年輕的費歇爾深入研究了女士品茶問題,并得出了驚人的結論。然而,這只是他豐富的統計學說的一小部分,他對于實驗設計的研究,同樣為當代及后世的統計學家提供了借鑒。從對農業的研究,他得出結論:科學家需要從潛在試驗結果的數據模型開始工作,這是一系列數據公式,其中一些符號代表試驗中將被收集的數據,其它則代表試驗的全部結果。科學家從試驗數據開始,并計算與所考慮科學問題相應的結果。與費歇爾同樣活躍在統計學界的K
5、183;皮爾遜,在老師高爾頓的引導下,在非常完整的意義上第一個規范地闡明了“相關系數”這個概念,發現了“偏斜分布”,而他的革命所留下來的則是這樣一個觀念:科學的對象并不是不可觀測事物本身,而是數學分布函數,以描述與所觀測事物相聯系的概率。K·皮爾遜關于分布函數和參數的思想統治了20世紀的科學,并在21世紀仍保持著優勢。另外,皮爾遜最偉大的成就之一就是創造出第一個“擬合優度檢驗”。在這一時期,他不斷地深入探索,最終發明了假使優度檢驗,而這也為女士品茶這事件的判定起到了很好的輔助作用。隨后,生物期刊問世,成了統計學界的權威刊物。戈賽特所寫的一系列精彩的論文,幾乎都是發表在該刊物上,包括著
6、名的“學生的t檢驗”。這一時期也涌現出了大量杰出的統計學家,如蒂皮特、剛貝爾、耶日在各個學說蓬勃發展的時候,難免產生出分歧與矛盾。最顯著的莫過于費歇爾學派與皮爾遜學派的矛盾,兩種統計觀念的激烈碰撞。薩爾斯伯格把這種分歧的原因歸結為哲學上的分歧,他這樣寫道:“哲學上的分歧使費歇爾與K·皮爾遜在研究統計分布的方法上分道揚鑣。K·皮爾遜把統計分布視為對他所分析數據集合的真實描述。而按照費歇爾的觀點,真實分布只是一個抽象的數學公式,搜集的數據只能用來估計這個真實分布的參數。”既然所有估計都有誤差,那么費歇爾提出來的一些分析的手段,可以把這種誤差的程度降到最低,或者可以更經常地得出比
7、其他任何手段都更接近真實分布的答案。所以,在20世紀30年代,看上去是費歇爾在這場辯論中獲勝了,但到了70年代,皮爾遜學派的觀點東山再起。直到作者寫作本書時,這兩個學派的爭論仍沒有停止。所以統計學,抑或說科學的世界展示給我們的是它愛憎分明的一面,即使真理,也要經過質疑與檢驗。奈曼的置信區間也曾被人稱為“置信詭計”,貝葉斯的貝葉斯定理被稱為“貝葉斯異論”,挫折與磨難才能造就真理。正是在不斷地對矛盾的探究與發現中,在人們不斷地辯證與統一中,飛速地向前發展。另外,在人才濟濟的20世紀統計學界,即使是在二戰發生,學術飽受政治干擾與破壞的這樣艱苦的環境下,仍有許多統計學家和數學家為統計學發展孜孜不倦的辛
8、勤付出,他們仍然堅持著自己的研究,決不向困難妥協。布利斯即使是在人心惶惶的列寧格勒也醉心于他的研究,斯堪的納維亞地區、德國、法國和蘇聯的一批數學家則傾心于中心極限定理的研究,霍夫丁在白林創辦了德國數學,隨后威爾克斯、古達克、古德、加德納、圖基等一大批杰出的人物活躍在統計這一廣闊的世界。他們高度的學術犧牲精神,令人肅然起敬。在第14章中,薩爾斯伯格稱柯爾莫哥洛夫為“數學界的莫扎特”。柯爾莫哥洛夫憑借其驚人的數學才華,在數理統計與概率論方面留下了不朽的成就。他在思考了概率計算的本質之后,最后終于發現,求一個事件的概率完全就像求一個不規則形狀的面積。他把新產生的數學測試理論應用到概率的計算上。有了這
9、些工具,他就能定出一套公理,再用這些公理構建出整個概率理論。這就是柯爾莫哥洛夫的“概率論的公理化”,至今仍是學校中講授概率論時采用的唯一方法。這種方法永久性地解決了有關概率計算有效性的所有問題。雖然柯爾莫哥洛夫和他的學生在概率和統計的數學理論上有重大的貢獻,但隨著20世紀30年代斯大林肅反運動的到來,蘇聯從這場統計革命中獲益甚少,官方的觀點制約了統計學的發展。作為入門的著作,作者在每一次引入一個新的概念的時候都會有一定篇幅的背景介紹和相關奇聞異事,比如把女士品茶這個看似很簡單并且從某些角度看起來僅僅是一個很無關重要的消遣的實驗作為一個引子,并將這個例子作為一條線索貫穿了整本書,從第一章的純粹的
10、驗證這位女士的結論是否正確開始,如何在這位女士沒有區分能力的情況下設計實驗讓她無法僅憑猜測正確,如何在這位女士有區分能力的時候容忍區分出錯的概率,比如十次重復實驗之后區分對了九次的情況下是否值得我們相信這個女士是有區別能力。這些對于這個很簡單的實驗設計形象化了數理課中很多的概念化的東西,最大似然估計,假設檢驗,中心極限,大數定律。作者以非數學的語言描述出統計革命帶來的基本哲學觀念層面上的重大轉變,并超越一般的觀念介紹的層面而具體地展示給讀者某些精彩的統計研究工作是如何進行的,就這個目的而言本書是確實達到了要求,它并未說清楚很多具體工作的基本思想,也就影響了讀者對統計觀念的全部力量所能理解的深度
11、。作為一個沒有系統學習過統計學的學生來說,雖然在很多的時候我不明白這些公式是怎么推出來的,也不知道這些變量是怎么求,怎么算,但能基本上明白這些公式,這些變量的設置是要做什么用的。而書中對于真實世界的描述,我們所見的都是一個概率內發生的事情,“充滿隨即性的大自然里,真實性只存在分布函數之中”費歇爾大師把觀測的現象認為是隨即的映像,真正我們想把握的只是分布的四個參數。所以統計學具有廣泛的研究領域,不論是農、工、理、文,藝,包括精算、農學、動物學、人類學、考古學、審計學、晶體學、人口統計學、牙醫學、生態學、經濟計量學、教育學、選舉預測和策劃、工程、流行病學等,幾乎無所不包,甚至日常生活,幾乎沒有不用
12、統計學的地方,自K·皮爾遜發現偏斜分布的100多年里,統計革命不僅擴展到大多數的科學領域中,而且其許多思想已經傳播到一般的文化當中,統計是一種認知世界的方法。所以統計學是任何學科進行科學研究的工作母機,沒有統計學就沒有科學研究、沒有創新 。現實是復雜的,是絕對不可能由一個有組織的科學模型來完全描述出來的。他認為科學就是試圖模擬建立一個描述現實的模型,符合可用的數據,并且可以用來預測新實驗的結果。因為沒有任何一個模型是完全真實的,所以,數據越來越多,要求不斷地配合新的發現去修正模型以修正對現實的認知。這樣,模型因為帶有特例的直覺上難以置信的延伸,變得越來越來復雜,最終,這個模型不再適用
13、了。這時,有創新精神的人將會考慮建立一個全新的模型,一場新的革命在科學領域即將展開。統計革命就是模型變換的例子。用19世紀決定論的科學觀,牛頓物理學已經成功地描述了行星、月球、小行星和彗星等天體的運動,運動都是遵守幾個明確的運動和引力定律;在尋找化學規律方面也取得了一些成功;并且達爾文的自然選擇學說為理解進化提供了有利的依據;甚至有些人試圖將這種尋找科學規律的模型研究引入社會學、政治科學以及心理學等領域。另外統計學不僅是科學的研究方法,還是管理工作的工具。任何科學都是研究客觀規律的,規律可以在反復試驗中重復,而沒有重復的事物不是科學研究的對象。我們周圍的事物每天都在重復,太陽每天東升西落,春夏
14、秋冬四季更替,宏觀經濟每天運行,只有運行、重復,才有規律。但人不能兩次踏入同一條河,事物的每一次重復決不是前一次的克隆。統計學就是變化中研究規律的科學。而統計學政治家無法脫離統計而施政,軍事家無法脫離信息而指揮,企業家無法脫離統計而決策,任何管理工作都要做到心中有數。學好統計,是搞好任何工作的前提。日常生活中也充滿著統計的科學與藝術,所以需要學習統計。二、對統計學的認識統計學是一門研究數據的科學,任務是如何有效地收集、整理、和分析這些數據,探索數據內在的數量規律性,對所觀察的現象做出推斷或預測,直到為采取決策提供依據。統計數據的收集是取得統計數據的過程,它是進行統計分析的基礎。離開了統計數據,
15、統計方法就失去了用武之地。統計數據的整理是對統計數據的加工處理過程,目的是使統計數據系統化、條理化,符合統計分析的需要。數據整理是介于數據收集與數據分析之間的一個必要環節。在收集和整理數據后,特別需要認清數據自身特點對其進行分析。統計數據的分析是統計學的核心內容,它是通過統計描述和統計推斷的方法探索數據內在規律的過程: 第一,弄清楚要分析的數據屬于什么類型。是連續型,還是非連續型?對于連續型數值,均值具有實際意義,對于非連續性的數值,均值并不具備實際意義,而是頻數,百分比才有意義,所以,數據屬于連續型時,適用比較均值的顯著性檢驗,若是非連續型的級數類,則適用比較頻數、比例的檢驗方法;其實,數據
16、也可以根據不同情況進行靈活處理,例如:對于滿意度的衡量,可以根據不同的需求看為連續型分值,也可以看為幾個等級的級數;第二,需要了解樣本數據的分布特點,弄清楚樣本數據是否服從某一分布,對于分布明確的,可以采用參數檢驗,而不清楚分布情況的則可以采用非參數檢驗法;第三,判斷要檢驗差異的兩組樣本的關系,屬于獨立樣本,還是屬于配對樣本。獨立樣本即指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本,樣本之間相互獨立;而配對樣本可以是同一個體在前后兩種狀態下某種屬性的兩種狀態,也可以是對某事物兩個不同側面或方面的描述,兩樣本不是相互獨立,而是具有相關性。比如女士品茶第17章“當部分優
17、于總體時” 中提到: 1937 年,政府想得到有關失業率的準確數據,要在全國進行有史以來第一次嚴肅的隨機調查,同時國會授權在1937 年進行失業普查。國會通過了議案,號召失業者填寫登記卡,送到當地的郵局。那時,全國失業人口數估計在300萬到1500萬之間,依據對整個調查所作的規劃設計,普查局從郵遞線路中隨機選取2%,然而,即使按2%的比例抽樣,普查局也被這樣大量的調查問卷難住了:美國郵政服務局曾計劃幫他們把問卷分類整理,并制作了一些原始的表格。問卷在最初設計時,還希望收集被調查人口統計和工作經歷的詳細資料,但是沒有人知道該如何來處理這么大量的詳細信息。因為那時根本沒有電腦,除了用“鉛筆+紙張”
18、繪制的表格之外,唯一可指望的就是手動的機械計算器。于是,他們與耶日·奈曼取得了聯系,奈曼指出,“我們不必知道或去探討所有的細節,也不必弄清具體的關系如何”,只需為最重要的問題找到答案就行了。采納了奈曼的建議,他們拋棄了問卷中復雜而令人困惑的細節,只計算失業的人數。并且普查局作了一系列細致的分析,證實這種隨機小樣本調查的結論比起以前所用的判斷樣本要精確得多。抽樣調查是一種非全面調查,它是從全部調查研究對象中,抽選一部分單位進行調查,并據以對全部調查研究對象作出估計和推斷的一種調查方法。顯然,抽樣調查雖然是非全面調查,但它的目的在于取得反映總體情況的信息資料,因而,也可起到全面調查的作用
19、。而相對于抽樣調查,普查工作量大,花費大,組織工作復雜;其調查內容有限,易產生重復和遺漏現象;且由于工作量大而可能導致調查的精確度下降,調查質量不易控制。所以在現實生活中,抽樣調查的優越性是全面調查無法比擬的:一是質量性高。可集中力量做深入細致調查并提高調查質量。還可用于只能觀察局部單位的調查,如產品的破壞性質量檢查,農作物全面成熟前的產量實割實測等;二是經濟性好。只調查部分單位(如5,1,1 等),可節約大量人力、物力和費用開支;三是時效性強。可大大縮短調查和整理時間,較快取得調查結果;四是適應面廣。在社會經濟統計中,抽樣調查日益得到廣泛應用,如人口普查的事后質量檢查,生育率調查,農產量調查
20、,職工和農民家計調查等;五是能夠解決全面調查無法或困難解決的問題。如補充和訂正全面調查的結果,應用于生產過程中產品質量的檢查和控制,用于對總體的某種假設進行檢驗等等。在本書第11章“假設檢驗”中曾提到:“K·皮爾遜常常利用他的卡方擬合優度檢驗來證明某些數據符合某些特定的分布。在費歇爾把更精確的方法引入到數理統計之后,K·皮爾遜的方法就不再為人接受了。但問題仍然存在。為了知道應該估計哪些參數,為了確定這些參數與所研究的科學問題之間有何關系,我們必須假設該數據符合某一特定的分布。統計學家們常常會利用顯著性檢驗來證明數據符合何種分布。”在實際操作中,由于人力、物力、時間等問題,一
21、般都用抽樣調查的方法抽取一定數量的具有代表性的群體,得出樣本數據來進行研究,并對總體特征進行統計推斷,在這里面就會存在兩個問題,一是樣本的特征數量能否反映總體特征?二是兩種不同的樣本的數量標志參數是否存在差異?只有解決這兩個問題,才能正確的推斷總體特征,也才能找出不同特征群體的需求差異,這就需要統計學中的顯著性檢驗來解決。顯著性檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。 用樣本指標估計總體指標,其結論有的完全可靠,有的只有不同程度的可靠性,需要進一步加以檢驗和證實。通過檢驗,對樣本指標與假設的總體指標之間是否存在差別作出判斷,是否接受原假設。這里
22、必須明確,進行檢驗的目的不是懷疑樣本指標本身是否計算正確,而是為了分析樣本指標和總體指標之間是否存在顯著差異。從這個意義上,假設檢驗又稱為顯著性檢驗。假設檢驗是除參數估計之外的另一類重要的統計推斷問題。它的基本思想可以用小概率原理來解釋。所謂小概率原理,就是認為小概率事件在一次試驗中是幾乎不可能發生的。也就是說,對總體的某個假設是真實的,那么不利于或不能支持這一假設的事件A在一次試驗中是幾乎不可能發生的;要是在一次試驗中事件A竟然發生了,我們就有理由懷疑這一假設的真實性,拒絕這一假設。由于顯著性檢驗的功能在數據分析中的重大作用,顯著性檢驗得到了廣泛的應用。然而在應用之前,首先了解各檢驗方法的適
23、用范圍及其特點是正確使用檢驗方法的基本前提。許多統計檢驗方法的應用對總體有特殊的要求,如t檢驗要求總體符合正態分布,F檢驗要求誤差呈正態分布且各組方差整齊等等。這些常用來估計或檢驗總體參數的方法,統稱為參數統計。許多調查或實驗所得的科研數據,其總體分布未知或無法確定,這時做統計分析常常不是針對總體參數,而是針對總體的某些一般性假設(如總體分布),這類方法稱非參數統計,相應的,統計檢驗總體分為參數檢驗和非參數檢驗。在選擇參數與非參數檢驗時,首要考慮是數據的分布情況,能確定分布類型的,則可適當選用參數檢驗,參數檢驗主要包括包含的方法有:單樣本T檢驗、兩獨立樣本T檢驗、兩配對樣本T檢驗;非參數由于不
24、限制分布,統計方法簡便,適用性強,但檢驗效率較低,應用時應適當加以考慮,非參數檢驗主要涉及單樣本、兩獨立樣本、兩配對樣本、多獨立樣本、多配對樣本五個方面的非參數檢驗。不同的檢驗方法,比較的統計量是不同的。T檢驗等檢驗方法都是比較均值;卡方檢驗、K-S檢驗等比較頻數;曼惠特尼U檢驗等是對秩進行比較;符號檢驗法比較的是前后變化差值的符號。因此,只有了解各檢驗方法的基本思想及特點,才能正確選取適當的檢驗方法。其次,認清研究目的。研究目的是調研中一切實務的根本出發點,做數據分析時同樣首要考慮的是研究目的,研究目的也是數據分析的方向,但此時研究目的需要細化,具體到要通過哪些數據,得到什么信息,取得何種結
25、果。例如:希望通過對消費者購買哪些品牌的數據來得出市場占有率的信息。 具體的實際應用中,靈活運用檢驗方法是關鍵。 檢驗方法雖然有各自特點和適用范圍,但是可以對數據做稍微的處理、變化,或是換個角度分析,便可運用不同的檢驗方法;且各方法有適用范圍,當然也有它的局限性,有時需要多種檢驗方法配合使用,相互補充,才能充分地挖掘信息。例如:獨立樣本T檢驗法判斷AB產品對于抗過敏的功效評價在均值上是否有差異,而卡方檢驗可判斷他們在各評價水平上的分布有無差異,假如判斷出他們功效水平無差異之后,我們還想知道他們到底是同樣的好還是同樣的差,這時可以再使用單樣本T 檢驗對與均值評價水平相近的滿意度水平進行差異性檢驗
26、來進行定位。此外,我們還需要合理解釋檢驗結果。不僅要正確識別檢驗結果,還需要結合原始數據及實際意義,并針對研究目的來分析說明。在統計模型的數學和技術層次之外,本書花費了大量心血來表達統計革命的觀念和世界圖景的新思考。這方面貝葉斯層次模型對理解統計觀念十分重要:理論實體是統計分布,這是變化和影響的基本實體。而理論實體是實際不能直接測量的,我們只能得到它的盡可能好的估計值。作者在本書中當然默認了實在論的認識前提,集中在作者對于物理學實驗和物理學理論工作模式的理解。比如作者對混沌理論的批評,他認為混沌依然是決定論的產物,在現實中他更相信統計模型。物理學是很多套數學模型,有確定性的,如牛頓經典力學體系
27、;有概率特征的,如量子理論。用哪個模型來描述問題完全看問題處于哪個層次從而導致問題的哪個方面更為主要從而決定使用哪個模型來進行描述。混沌理論最初是在經典力學模型中發現的內在隨機性,是經典力學模型的內在性質。而后來的發展又在隨機性的量子理論模型中發現了量子混沌現象,混沌不是一個理論模型,而是模型的性質,決定論的模型和隨機性的模型都會出現,如果認為量子理論是隨機性的模型的話。但是我認為,按照統計革命的思想,量子理論算不上隨機性的模型,這個比較深層的疑問,也許后面會再談到。所以作者關于混沌的評論和將其與統計模型的比較本身就是不適當的。混沌理論與隨機性相關的另一個問題在我看來始終是一個困惑,即多體系統
28、的隨機性與少體系統的隨機性本質上如何區別,多體系統比如阿伏伽德羅常數個分子的統計行為,是統計力學處理的對象。在這種情形即使個體的行為可以精確追蹤也是沒有意義的,理論不需要對個體的了解,只需要大數統計行為就可以預言系統的宏觀性質。在經濟社會系統里統計模型的大量應用就是源于這些系統是天生的多體系統,社會學經濟學等社會科學的困難尤其是應用物理學方法進行研究的困難正在于此,物理學分析多體問題的方法還不夠。處理大數問題,自然要用統計,但是對于少體系統的內在隨機性問題就是另一種機制了,在三體問題牛頓方程組中混沌現象的發現是一種全新的模式高度非線性的效應,而不是大數效應導致的隨機性。但是這兩種機制不同的隨機
29、性的數學描述,應該完全有可能統一進行。本書涉及到許多統計觀念在現實問題中應用的例子,或者說是在用統計模型處理現實問題中引起困惑的觀念問題。比如對統計相關性的理解。最著名的例子是費歇爾對吸煙與肺癌關系的統計分析所持的態度。他認為吸煙與肺癌有關的統計分析都是站不住腳的,從分析的角度看,他的天才是令人驚異的,統計相關性一直受人詬病,原因一方面在于作者多次提到的大部分使用統計方法的人實際上并不真正理解統計方法的思想,誤用和死板硬套的情況普遍存在;另一方面也在于統計相關性的結論與因果性的關聯之間存在問題。既非充分也非必要的統計相關性意味著什么,為什么人們還是需要因果性的追尋?另外關于統計模型本性的思考,
30、最重要的問題我認為有兩個,一個是為什么它這么重要,竟能形成一個龐大的學科,這個學科的地位究竟又如何。這個問題我的理解是因為20世紀以來多體模型被普遍研究,自然需要統計學方法。作為一個學科是沒有必要的,只是數學模式的一種,借由廣泛的應用才如此受人熱捧,這樣就消解了似乎籠罩在它頭上神圣的光環。這個問題很簡單,是一個社會學的問題,只是有些內行學者喜歡抬高自己工作的意義,而很多外行也不懂,被一些富有煽動性的書籍和炙熱的感情迷惑了。另一個問題是真的問題,一個科學和思辨的問題:統計相關性與因果相關性的關系。傳統的理解,包括本書中許多統計學家也持這種觀點,即認為統計相關性是唯象的,在得到統計相關之后還需要進
31、一步分析因果性,是什么因素導致了統計相關。如果持有這個觀點,很難說是真正理解了統計革命。因果性是還原論,決定論思維的特征。一個弱化的版本是統計相關與因果相關的融合只存在統計意義上的因果性。這依然是一種經典的思維模式,可不可能本來就不存在因果性,本質上就是統計相關性?或者更學術的表述應該是是不是統計相關性是更不建構的東西?我本人傾向于做這種理解并尋找支持這種理解的東西,不去做因果性的分析,因為那本來就沒有根本的意義。另外一種可能是統計相關和因果相關是兩種并行的事物之間相關的模式,但這似乎不大可能。在這一問題的基礎上,我想是不是可以借由進一步的統計理解來推進突破還原論決定論的思維。如何才能學會整體
32、論的思維呢?自然界在哪里可以給我們提供一些啟示?本書除了費歇爾以外作者最推崇的天才就是柯爾莫哥洛夫和約翰圖克,前者的廣博才華人所共知,而后者是不可思議的高效和深刻結合的天才,強烈的好奇心和難以抑制的原創沖動。他思考了一個看起來只能存在于哲學思辨中的問題:人類思維傾向于發現模式,那么在多大程度上可以用傾向于模式的目光去檢驗數據,此基礎上發展出探索性數據分析這一套方法。作者在書的最后一章里提出了一些很困難的有關統計和概率的哲學問題,統計可以脫離概率理論嗎?概率在現實生活中是什么意義?統計理論的內在一致性問題等。作者曾說:在現代世界觀的基本假設中,哪些可能在500年后看起來是很荒謬的?三、感悟與總結
33、讀完女士品茶,我大致了解統計學發展的來龍去脈,也讓我知道為何要學統計學的原由,它不僅解除我心中對這些統計工具在應用上的疑問,而且極大的增加了我學習統計的興趣與決心。它讓我對統計的感覺不再那樣僵化,是值得我在學習統計邊學邊看的好書。對于大多數本書讀者,即統計學的外行來講,本書最大的特色在于一直從問題出發,這也是統計學強大生命力和吸引力以及面臨巨大困難挑戰的所在。對學術知識不扎實的人來說,對書中所講的公理化體系并不感到濃烈的興趣,說概率是一種非負規范的測度對于很多人來講并沒有什么意義。更多人感興趣的是統計學的廣泛應用,正如前面談到的那樣,統計涉及的領域幾乎無處不在。費歇爾在農場里倒弄統計,計量農作
34、物與氣候,雨量,殺蟲劑,肥料之間的關系,在發表了研究工作者的統計方法這一系列舉世著名的論文的同時,也改善了農業生產。戈賽特先生在吉尼斯釀造公司這樣的化學企業,通過解決測量在麥芽漿發酵是其所用的酵母數量,確定了泊松分布在現實生活中的實例和統計分布新觀念的應用,當然也解決了該公司生產上的一個重大問題。蒂皮特在投身棉花工業研究協會之后,為找出最脆弱的纖維強度,發現了極致分度也找出了最脆弱的纖維強度,提高了棉花的產量。書中還提到許多的統計學的數理統計的運用,例如,統計應用于醫學來找出同一種藥物的劑量對人的反應 , 改善藥物研究進行控制和提取新產品測試的方法;應用于第二次世界大戰 , 來測量哪種毒氣對敵人有影響;對竊聽來情報的情報進行解碼,應用邏輯和數學模型來解決用遠程轟炸機對付潛艇的最佳使用方案,為防空武器提供設計表,決定靠近前線的軍火補給站的最佳選址,甚至還要解決軍隊的食物補給問題,并由此產生了一門新的學科-運籌學;戰爭之后,由數理統計衍生而來的運籌學應用到了商業上,解決了諸如找出倉庫與銷售部門之間的最優關系,均衡有限資源,改進生產和提高產量等商務問題。還有比如書中介紹的:署名有爭議的文章原作者的鑒定方法;劃分國民經濟的不同部門用矩陣模型來進行投入產出分析;吸煙與肺癌到底是什么關系?無確定病原體的傳染病與生活習慣的關系;人類活動與生物圈破壞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自籌物業合同協議書范本
- 占地合同協議書冬至西至
- 學生自助營養快餐店創業計劃書
- 綠色企業宣傳活動策劃書
- 酒店魚池合同協議書樣本
- 2025年中國牙粉項目商業計劃書
- 夏天冰淇淋店的創業計劃書
- 數字化轉型對教育行業的教學模式變革
- 就業合同代辦協議書怎么寫
- 租賃合同要求解除協議書
- DB32/T 4880-2024民用建筑碳排放計算標準
- 浙江大學研究生導師培訓心得體會
- 勞動與社會保障專業大學生職業生涯發展
- DB11T 2335-2024 既有建筑外門窗改造及驗收技術標準
- 外研版(三起)小學英語三年級下冊Unit 1 Animal friends Get ready start up 課件
- 數碼相機-SONY索尼-α200(DSLR-A200)(快速入門指南)說明書
- 2024年中國海鮮水餃市場調查研究報告
- 模擬試卷(7)-【中職專用】2025年職教高考語文沖刺模擬卷(職教高考)解析版
- 【MOOC】成本會計學-西北農林科技大學 中國大學慕課MOOC答案
- 《反洗錢培訓》課件
- 博飛全站儀BTS-812CLA說明書
評論
0/150
提交評論