




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
醫學統計學
第一章緒論
1醫學統計學
第一章緒論
1www.xybms第一節統計學與醫學統計方法
2第一節2一.統計與統計學的定義
一.統計與統計學的定義
3一.統計與統計學的定義
一.統計與統計學的定義
什么是衛生統計學科技的迅速發展,信息的大量產生。數據作為信息的主要載體廣泛存在。面對紛亂復雜的數據世界我們該如何去認識,這就要借助統計學這個工具,在混沌中發現規律。統計學就是研究數據及其存在規律的科學。4什么是衛生統計學41.統計
是一種對客觀現象數量方面進行的調查研究活動;是收集、整理、分析、推斷、判斷等認識活動的總稱。數據匯總僅僅是統計工作的一小部分內容。51.統計
是一種對客觀現象數量方面進行的調查研究活動;5ww2.統計學作為一門學科的定義是:關于數據收集、表達和分析的普遍原理和方法。
62.統計學作為一門學科的定義是:關于數據收集、表達和分析的普3.醫學統計學
是用統計學原理和方法研究生物醫學問題的一門學科。醫學統計方法在醫學研究中的運用主要有三個方面:73.醫學統計學7www.xybms工作生活中常見的統計學問題如何判斷藥物的療效?(假設檢驗)明天是否下雨?體育彩票能否中獎?(概率論)子女為什么象父母,其強度有多大?(相關與回歸)美國的民意測驗是如何進行的?(設計,抽樣)中國的市場調查的可信性有多大?(現場調查)
統計學是對令人困惑費解的數字問題做出設想的藝術。8工作生活中常見的統計學問題如何判斷藥物的療效?(假設檢驗)8①以正確的方式收集數據,如實驗設計、調查設計等。②描述數據的統計特征,如數據化簡、統計指標的選擇與計算、統計結果的表達等。③統計分析及得出正確結論,如根據概率分布,對實驗和觀察結果存在的差異和關聯作出統計推斷。
9①以正確的方式收集數據,如實驗設計、調查設計等。9www.x二.統計學的發展簡史
10二.統計學的發展簡史
10統計計算歷史:筆、紙、算盤、對數表、乘方表、計算尺、計算器等統計發展歷史:德國數學家GUASS(1777-1855)數字計算題,表現出極高的統計計算天賦。最先提出“相關與回歸”的英國人類學家Galton,在人類學和優生學研究中萌發的統計思想,其中最重要的一個:wheneveryoucando,count。小樣本均數Student-t檢驗的發現者、英國生物統計學家Gosset(1876-1937)為了解決t檢驗的理論和應用問題,通過使用卡片進行抽樣試驗和計算統計量得出t分布曲線,成為Monte-Carlo計算方法的先行者。11統計計算歷史:筆、紙、算盤、對數表、乘方表、計算尺、計算器等現代實驗設計方法和統計分析技術的奠基者、英國生物統計學家fisher(1890-1962)在20世紀20年代撰寫的實驗設計和統計方法專著時,因不可能計算出所有小概率對應的t分布和F分布的臨界值,只好給出了a=0.05,0.01時對應的t分布和F分布的臨界值表。令他未曾想到的是這種因統計計算方法的限制而人為i設定的兩個數字,至今仍然被許多人當作小概率的唯一數量標準。因此,Fisher的同事、卡方檢驗、“Yates校正”公式的提出者Yates(1902-1994)強烈主張統計學家使用電子計算機,并說:Tobeagoodtheoeticalstatisticianonemustalsocompute,andmustthereforehavethebestcomputingaids.12現代實驗設計方法和統計分析技術的奠基者、英國生物統計學家fi20世紀20年代,英國統計學家R.A.Fisher爵士(1890-1962)創立了實驗設計方法和統計分析技術,奠定現代生物統計的基礎。1948年,英國發表了評價鏈霉素治療肺結核療效的隨機對照的臨床試驗報告,第一次采用生物統計方法進行臨床干預試驗。1948年,郭祖超教授(1912~1999)編著的《醫學與生物統計方法》,是我國第一部醫學統計方法的教科書。20世紀20年代,英國統計學家R.A.Fisher爵士將計算機用于統計計算,主要是通過統計軟件實現;SASandSPSS14141.實例
遺傳學家F.Galton爵士(1822-1911)對上千家庭父親身高和兒子身高的觀察發現遺傳的“回歸”現象1960年英國醫生Doll,Hill等發現吸煙與肺癌有關1.實例遺傳學家F.Galton爵士(1822-12.醫學論文中的統計學問題60年代到80年代,國外醫學雜志調查結果:有統計錯誤的論文20%~72%。1996年對4586篇論文統計(中華醫學會系列雜志占6.9%),數據分析方法誤用達55.7%。2.醫學論文中的統計學問題60年代到80年代,國外醫學雜志3.偽造統計數據違反科學道德1976年NewScience雜志關于科研舞弊行為的調查(1)74%的調查表反映有不正當修改數據的情況(2)17%拼湊實驗結果(3)7%憑空捏造數據(4)2%故意曲解結果3.偽造統計數據違反科學道德1976年NewSciencFancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!Fancystatisticalmethodscann1.早期
公元前3050年古埃及人為修建金字塔籌集建筑費,對全國的人口和財產進行了普查。歷史
191.早期歷史19
2.近代
19世紀,應用數學家為解決賭徒們在博彩中出現的輸贏概率問題逐漸形成和發展了概率論,從而為統計學的發展奠定了堅實的基礎。20
20
3.現代
計算機和統計軟件如SAS、SPSS的出現使統計學得到了突飛猛進的發展。213.現代21統計方法是建立在現代科學方法之上,由統計學理論指導的數據收集、表達和分析的方法,現代科學方法可以概括為以下幾點:22統計方法是建立在現代科學方法之上,由統計問題的識別與表達(發現問題、提出問題)。搜集有關資料。通過歸納得出假說:因果聯系及重要的模式。從假說作出演繹:進行實驗或收集更多的資料。推理:結果與演繹相符,假說得到加強,但不是被證明(例某地區食鹽與高血壓的關系)。23問題的識別與表達(發現問題、提出問題)。23www.xybm三.統計學的特點
醫學+數學,側重醫學,淡化數學。用數量反映質量,如平均期望壽命,解放前為35歲,現在70歲,可反映國家醫療衛生服務總體水平的提高。大量觀察+實驗數據分析→可以揭示醫學規律。
24三.統計學的特點
醫學+數學,側重醫學,淡化數學。24www
第二節
統計工作的基本步驟25
251.專業設計:選題、建立假說、確定研究對象和技術方法等→個性
2.統計設計:圍繞專業設計確定統計設類型、樣本大小、分組方法、統計分析指標及統計分析方法。
一、設計
261.專業設計:選題、建立假說、確定研究對象和技術方法等→二、收集資料
(一)資料來源第一手資料
①
經常性:統計報表(死亡登記、疫情報告等),工作記錄(病歷、化驗);②一時性:專題調查、實驗或臨床試驗。第二手資料:已公布的資料,如數據銀行、全國、全省衛生統計資料。
27二、收集資料
(一)資料來源27(二)資料要求
1.完整:觀察單位及觀察項目完整。
觀察單位:最基本的獲取數據的單元。可以是一個體,亦可以是一個單位、家庭、地區,一批樣品,一個采樣點。
28(二)資料要求
1.完整:觀察單位及觀察項目完整。
2.準確:即真實、可靠。真實是統計學的靈魂。
3.及時:即時限性。如人口普查規定調查開始日期和截止日期。292.準確:即真實、可靠。真實是統計學的靈魂。
3.及時三.整理資料
整理資料即原始數據的條理化、系統化的過程。所采取的手段→合理化分組,目的→實現專業目標。質分組:按事物的屬性或性質分組→分類變量;量分組:按數據的大小→數值變量。30三.整理資料
整理資料即原始數據的條理化、系四.分析資料
1.統計描述:用統計指標、統計圖表對資料的數量特征及分布規律進行測定和描述。2.統計推斷:用樣本信息推斷總體特征:①參數估計,②假設檢驗。31四.分析資料
1.統計描述:用統計指標、統計圖表對資料的數第三節統計資料的類型
有三種類型的資料:計量資料,計數資料,等級資料
基本概念:變量及變量值,研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。按變量值的性質可將資料分為定量資料和定性資料。32第三節統計資料的類型有三種類型的資料:計量資料,1.計量資料定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數據資料。例如:體重與身高特點:有度量衡單位多為連續性資料(通過測量得到)331.計量資料定義:通過度量衡的方法,測量每一個觀察單位的某定義:將全體觀測單位按照某種性質或特征分組,然后再分別清點各組觀察單位的個數。特點:沒有度量衡單位多為間斷性資料
(通過枚舉或記數得來)
2.計數資料34定義:將全體觀測單位按照某種性質或特征分組,然后再分別清點各定義:介于計量資料和計數資料之間的一種資料,通過半定量方法測量得到。特點:每一個觀察單位沒有確切值各組之間有性質上的差別或程度上的不同。3.等級資料353.等級資料35(三)資料的轉化(變量類型的轉化)
數值變量分類變量
36(三)資料的轉化(變量類型的轉化)
數值變量例如:測得5人的WBC(個/m3)數如下:
300060005000800012000數值變量過低正常正常正常異常分類變量若按正常3人,異常2人分組→二分類變量若按過低1人,正常3人,過高1人分組→等級資料37例如:測得5人的WBC(個/m3)數如下:37
*提示:
①多途徑;②盡量用定量指標,否則損失信息量;③定性指標可轉化為定量指標,但較粗糙。38*提示:①多途徑;38第四節統計學中的幾個基本概念1、變異2、總體與樣本3、抽樣方法4、誤差5、頻率與概率
39第四節統計學中的幾個基本概念1、變異39www.xybm1.變異
同質事物個體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。是統計學存在的基礎,從本質上說,統計學就是研究變異的科學。
401.變異40對變異的認識:
(1)自然變異的范圍是有限的,可以度量;參差不齊的測量值,通過大量重復觀測可以顯現出統計分布規律,如表1-1數據的變異特征至少有以下兩點:41對變異的認識:
(1)自然變異的范圍是有限的,可以①變異的范圍在3.2~6.2;②有明顯的統計分布規律,4.7~5.0的人數最多。根據表1-1的數據,統計上還可以進一步推論出正常成年男子紅細胞計數的正常值參考范圍。42①變異的范圍在3.2~6.2;42表1-1120名正常成年男子紅細胞計數值
84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89。算術均數=4.72,標準差=0.5743表1-1120名正常成年男子紅細胞計數值5.125.
(2)用統計的方法可以確定出所有研究對象的變異范圍,如正常成年男性的細胞數的范圍。身高范圍等等。(3)沒有變異就沒有統計,變異使統計有了用武之地。44(2)用統計的方法可以確定出所有研究對象的變異范圍4545總體:根據研究目的確定的研究對象的全體。當研究有具體而明確的指標時,總體是指該項變量植的全體。樣本:總體中有代表性的一部分。觀察單位(個體):最基本的研究單位分為有限總體和無限總體。由于調查總體的不可能性、巨大性和沒必要。對其中的一部分對象進行調查----樣本(總體與樣本的關系。舉例。)樣本選擇的原則--??樣本量(samplesize)2.總體與樣本(populationandsample)46總體:根據研究目的確定的研究對象的全體。當研究有具體而明確的populationandsample總體:根據研究目的確定的同質研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分觀察單位
populationandsample總體:根據研究目的隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。隨機抽樣《醫學統計學》課件3、抽樣方法選擇樣本的方法:概率抽樣和非概率抽樣等概率抽樣非等概率抽樣簡單隨機抽樣系統抽樣分層抽樣整群抽樣503、抽樣方法選擇樣本的方法:概率抽樣和非概率抽樣等概率抽4.誤差誤差:統計上所說的誤差泛指測量值與真值之差,樣本指標與總體指標之差。主要有以下二種:系統誤差和隨機誤差(隨機測量誤差,抽樣誤差)。(1)系統誤差:指數據搜集和測量過程中由于儀器不準確、標準不規范等原因,造成觀察結果呈傾向性的偏大或偏小,這種誤差稱為系統誤差。特點:具有累加性(2).隨機誤差:由于一些非人為的偶然因素使得結果或大或小,是不確定、不可預知的。特點:隨測量次數參加而減小。514.誤差誤差:統計上所說的誤差泛指測量值與真值之在消除了系統誤差的前提下,由于非人為的偶然因素,對于同一樣本多次測定結果不完全一樣,結果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機測量誤差。特點:沒有傾向性,多次測量計算平均值可以減小甚至消除隨機測量誤差。A、隨機測量誤差52在消除了系統誤差的前提下,由于非人為的偶然因素,對
這類誤差可以通過實驗設計和技術措施來消除或使之減少。
觀察性研究由于組間不可比性產生的系統誤差稱為偏倚(bias),如吸煙組的平均年齡大于吸煙組,兩組死亡率的差異包含年齡偏倚。53這類誤差可以通過實驗設計和技術措施來消除或使之減少。由于抽樣原因造成的樣本指標與總體指標之間的差別。特點:有抽樣抽樣誤差就不可避免。統計上可以計算并在一定范圍內控制抽樣誤差。B、抽樣誤差54B、抽樣誤差54
(1)改進抽樣方法,增加樣本的代表性。樣本量n相等的情況下:整群抽樣>單純隨機抽樣>系統抽樣>分層抽樣(2)增加樣本量n(3)選擇變異程度較小的研究指標減少抽樣誤差的方法:55減少抽樣誤5.概率(probability)與頻率
拋一枚硬幣,是否國徽面一定向上?明天的股市升還是降?某患者痊愈的可能性?這些問題的答案都不可能絕對。概念:描述隨機事件發生的可能性大小的數值,常用P來表示。大小:P的大小在0和1之間,越接近于1,說明發生的可能性越大,越接近于0,說明發生的可能性越小。統計學中的許多結論是帶有概率性質的,通常一個事件的發生小于5%,就叫小概率事件。頻率:在實際工作中,當觀察單位的例數足夠多時,可以用頻率來代替概率。頻率是概率的估計值。565.概率(probability)與頻率
拋一枚硬幣,是
1.頻率(frequency),假設在相同條件下,獨立地重復做n次試驗,A在n次試驗中出現了m次,則比值m/n稱為隨機事件A在n次試驗中出現的頻率。當試驗重復很多次時,有
P(A)≈m/n(1-1)571.頻率(frequency),假設在相同條件
2.概率又稱為機率(probability),是度量某一隨機事件A發生可能性大小的一個數值,記作P(A),0<P(A)<1。
P(A)越大,A發生的可能性越大,反之亦然。當時或時,A是必然發生或必然不發生的非隨機事件。582.概率又稱為機率(probability),是度量某一
頻率是就樣本而言的,而概率從總體的意義上說的,m/n是概率P(A)的估計值。試驗次數越多,估計越可靠。5959
3.小概率事件,通常認為是不可能發生的事件。603.小概率事件,通常認為是不可能發生的事件。60如何學習統計學
(特點:靈活、抽象)理解基本的統計原理培養統計思維能力:抽象的,邏輯推理多練習:課堂練習,課下做習題
聯系實際:閱讀文獻工作和生活實際61如何學習統計學
(特點:靈活、抽象)理解基本的統計原理61w1.某年級甲班、乙班各有男生50人。從兩個班各抽取10人測量身高,如果甲班的平均身高大于乙班,能否推論甲班所有同學的平均身高也大于乙班?為什么?2.用A,B兩種藥物分別治療一批患者。如果A藥的治愈率高于B藥,證明A藥的療效優于B藥。這種說法對嗎?為什么?3.既然觀察對比不可避免地存在偏倚,為什么不能用干預試驗取代觀察對比?思考題1.某年級甲班、乙班各有男生50人。從兩個班各抽取10人測醫學統計學
第一章緒論
63醫學統計學
第一章緒論
1www.xybms第一節統計學與醫學統計方法
64第一節2一.統計與統計學的定義
一.統計與統計學的定義
65一.統計與統計學的定義
一.統計與統計學的定義
什么是衛生統計學科技的迅速發展,信息的大量產生。數據作為信息的主要載體廣泛存在。面對紛亂復雜的數據世界我們該如何去認識,這就要借助統計學這個工具,在混沌中發現規律。統計學就是研究數據及其存在規律的科學。66什么是衛生統計學41.統計
是一種對客觀現象數量方面進行的調查研究活動;是收集、整理、分析、推斷、判斷等認識活動的總稱。數據匯總僅僅是統計工作的一小部分內容。671.統計
是一種對客觀現象數量方面進行的調查研究活動;5ww2.統計學作為一門學科的定義是:關于數據收集、表達和分析的普遍原理和方法。
682.統計學作為一門學科的定義是:關于數據收集、表達和分析的普3.醫學統計學
是用統計學原理和方法研究生物醫學問題的一門學科。醫學統計方法在醫學研究中的運用主要有三個方面:693.醫學統計學7www.xybms工作生活中常見的統計學問題如何判斷藥物的療效?(假設檢驗)明天是否下雨?體育彩票能否中獎?(概率論)子女為什么象父母,其強度有多大?(相關與回歸)美國的民意測驗是如何進行的?(設計,抽樣)中國的市場調查的可信性有多大?(現場調查)
統計學是對令人困惑費解的數字問題做出設想的藝術。70工作生活中常見的統計學問題如何判斷藥物的療效?(假設檢驗)8①以正確的方式收集數據,如實驗設計、調查設計等。②描述數據的統計特征,如數據化簡、統計指標的選擇與計算、統計結果的表達等。③統計分析及得出正確結論,如根據概率分布,對實驗和觀察結果存在的差異和關聯作出統計推斷。
71①以正確的方式收集數據,如實驗設計、調查設計等。9www.x二.統計學的發展簡史
72二.統計學的發展簡史
10統計計算歷史:筆、紙、算盤、對數表、乘方表、計算尺、計算器等統計發展歷史:德國數學家GUASS(1777-1855)數字計算題,表現出極高的統計計算天賦。最先提出“相關與回歸”的英國人類學家Galton,在人類學和優生學研究中萌發的統計思想,其中最重要的一個:wheneveryoucando,count。小樣本均數Student-t檢驗的發現者、英國生物統計學家Gosset(1876-1937)為了解決t檢驗的理論和應用問題,通過使用卡片進行抽樣試驗和計算統計量得出t分布曲線,成為Monte-Carlo計算方法的先行者。73統計計算歷史:筆、紙、算盤、對數表、乘方表、計算尺、計算器等現代實驗設計方法和統計分析技術的奠基者、英國生物統計學家fisher(1890-1962)在20世紀20年代撰寫的實驗設計和統計方法專著時,因不可能計算出所有小概率對應的t分布和F分布的臨界值,只好給出了a=0.05,0.01時對應的t分布和F分布的臨界值表。令他未曾想到的是這種因統計計算方法的限制而人為i設定的兩個數字,至今仍然被許多人當作小概率的唯一數量標準。因此,Fisher的同事、卡方檢驗、“Yates校正”公式的提出者Yates(1902-1994)強烈主張統計學家使用電子計算機,并說:Tobeagoodtheoeticalstatisticianonemustalsocompute,andmustthereforehavethebestcomputingaids.74現代實驗設計方法和統計分析技術的奠基者、英國生物統計學家fi20世紀20年代,英國統計學家R.A.Fisher爵士(1890-1962)創立了實驗設計方法和統計分析技術,奠定現代生物統計的基礎。1948年,英國發表了評價鏈霉素治療肺結核療效的隨機對照的臨床試驗報告,第一次采用生物統計方法進行臨床干預試驗。1948年,郭祖超教授(1912~1999)編著的《醫學與生物統計方法》,是我國第一部醫學統計方法的教科書。20世紀20年代,英國統計學家R.A.Fisher爵士將計算機用于統計計算,主要是通過統計軟件實現;SASandSPSS76141.實例
遺傳學家F.Galton爵士(1822-1911)對上千家庭父親身高和兒子身高的觀察發現遺傳的“回歸”現象1960年英國醫生Doll,Hill等發現吸煙與肺癌有關1.實例遺傳學家F.Galton爵士(1822-12.醫學論文中的統計學問題60年代到80年代,國外醫學雜志調查結果:有統計錯誤的論文20%~72%。1996年對4586篇論文統計(中華醫學會系列雜志占6.9%),數據分析方法誤用達55.7%。2.醫學論文中的統計學問題60年代到80年代,國外醫學雜志3.偽造統計數據違反科學道德1976年NewScience雜志關于科研舞弊行為的調查(1)74%的調查表反映有不正當修改數據的情況(2)17%拼湊實驗結果(3)7%憑空捏造數據(4)2%故意曲解結果3.偽造統計數據違反科學道德1976年NewSciencFancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!Fancystatisticalmethodscann1.早期
公元前3050年古埃及人為修建金字塔籌集建筑費,對全國的人口和財產進行了普查。歷史
811.早期歷史19
2.近代
19世紀,應用數學家為解決賭徒們在博彩中出現的輸贏概率問題逐漸形成和發展了概率論,從而為統計學的發展奠定了堅實的基礎。82
20
3.現代
計算機和統計軟件如SAS、SPSS的出現使統計學得到了突飛猛進的發展。833.現代21統計方法是建立在現代科學方法之上,由統計學理論指導的數據收集、表達和分析的方法,現代科學方法可以概括為以下幾點:84統計方法是建立在現代科學方法之上,由統計問題的識別與表達(發現問題、提出問題)。搜集有關資料。通過歸納得出假說:因果聯系及重要的模式。從假說作出演繹:進行實驗或收集更多的資料。推理:結果與演繹相符,假說得到加強,但不是被證明(例某地區食鹽與高血壓的關系)。85問題的識別與表達(發現問題、提出問題)。23www.xybm三.統計學的特點
醫學+數學,側重醫學,淡化數學。用數量反映質量,如平均期望壽命,解放前為35歲,現在70歲,可反映國家醫療衛生服務總體水平的提高。大量觀察+實驗數據分析→可以揭示醫學規律。
86三.統計學的特點
醫學+數學,側重醫學,淡化數學。24www
第二節
統計工作的基本步驟87
251.專業設計:選題、建立假說、確定研究對象和技術方法等→個性
2.統計設計:圍繞專業設計確定統計設類型、樣本大小、分組方法、統計分析指標及統計分析方法。
一、設計
881.專業設計:選題、建立假說、確定研究對象和技術方法等→二、收集資料
(一)資料來源第一手資料
①
經常性:統計報表(死亡登記、疫情報告等),工作記錄(病歷、化驗);②一時性:專題調查、實驗或臨床試驗。第二手資料:已公布的資料,如數據銀行、全國、全省衛生統計資料。
89二、收集資料
(一)資料來源27(二)資料要求
1.完整:觀察單位及觀察項目完整。
觀察單位:最基本的獲取數據的單元。可以是一個體,亦可以是一個單位、家庭、地區,一批樣品,一個采樣點。
90(二)資料要求
1.完整:觀察單位及觀察項目完整。
2.準確:即真實、可靠。真實是統計學的靈魂。
3.及時:即時限性。如人口普查規定調查開始日期和截止日期。912.準確:即真實、可靠。真實是統計學的靈魂。
3.及時三.整理資料
整理資料即原始數據的條理化、系統化的過程。所采取的手段→合理化分組,目的→實現專業目標。質分組:按事物的屬性或性質分組→分類變量;量分組:按數據的大小→數值變量。92三.整理資料
整理資料即原始數據的條理化、系四.分析資料
1.統計描述:用統計指標、統計圖表對資料的數量特征及分布規律進行測定和描述。2.統計推斷:用樣本信息推斷總體特征:①參數估計,②假設檢驗。93四.分析資料
1.統計描述:用統計指標、統計圖表對資料的數第三節統計資料的類型
有三種類型的資料:計量資料,計數資料,等級資料
基本概念:變量及變量值,研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。按變量值的性質可將資料分為定量資料和定性資料。94第三節統計資料的類型有三種類型的資料:計量資料,1.計量資料定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數據資料。例如:體重與身高特點:有度量衡單位多為連續性資料(通過測量得到)951.計量資料定義:通過度量衡的方法,測量每一個觀察單位的某定義:將全體觀測單位按照某種性質或特征分組,然后再分別清點各組觀察單位的個數。特點:沒有度量衡單位多為間斷性資料
(通過枚舉或記數得來)
2.計數資料96定義:將全體觀測單位按照某種性質或特征分組,然后再分別清點各定義:介于計量資料和計數資料之間的一種資料,通過半定量方法測量得到。特點:每一個觀察單位沒有確切值各組之間有性質上的差別或程度上的不同。3.等級資料973.等級資料35(三)資料的轉化(變量類型的轉化)
數值變量分類變量
98(三)資料的轉化(變量類型的轉化)
數值變量例如:測得5人的WBC(個/m3)數如下:
300060005000800012000數值變量過低正常正常正常異常分類變量若按正常3人,異常2人分組→二分類變量若按過低1人,正常3人,過高1人分組→等級資料99例如:測得5人的WBC(個/m3)數如下:37
*提示:
①多途徑;②盡量用定量指標,否則損失信息量;③定性指標可轉化為定量指標,但較粗糙。100*提示:①多途徑;38第四節統計學中的幾個基本概念1、變異2、總體與樣本3、抽樣方法4、誤差5、頻率與概率
101第四節統計學中的幾個基本概念1、變異39www.xybm1.變異
同質事物個體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。是統計學存在的基礎,從本質上說,統計學就是研究變異的科學。
1021.變異40對變異的認識:
(1)自然變異的范圍是有限的,可以度量;參差不齊的測量值,通過大量重復觀測可以顯現出統計分布規律,如表1-1數據的變異特征至少有以下兩點:103對變異的認識:
(1)自然變異的范圍是有限的,可以①變異的范圍在3.2~6.2;②有明顯的統計分布規律,4.7~5.0的人數最多。根據表1-1的數據,統計上還可以進一步推論出正常成年男子紅細胞計數的正常值參考范圍。104①變異的范圍在3.2~6.2;42表1-1120名正常成年男子紅細胞計數值
84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89。算術均數=4.72,標準差=0.57105表1-1120名正常成年男子紅細胞計數值5.125.
(2)用統計的方法可以確定出所有研究對象的變異范圍,如正常成年男性的細胞數的范圍。身高范圍等等。(3)沒有變異就沒有統計,變異使統計有了用武之地。106(2)用統計的方法可以確定出所有研究對象的變異范圍10745總體:根據研究目的確定的研究對象的全體。當研究有具體而明確的指標時,總體是指該項變量植的全體。樣本:總體中有代表性的一部分。觀察單位(個體):最基本的研究單位分為有限總體和無限總體。由于調查總體的不可能性、巨大性和沒必要。對其中的一部分對象進行調查----樣本(總體與樣本的關系。舉例。)樣本選擇的原則--??樣本量(samplesize)2.總體與樣本(populationandsample)108總體:根據研究目的確定的研究對象的全體。當研究有具體而明確的populationandsample總體:根據研究目的確定的同質研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分觀察單位
populationandsample總體:根據研究目的隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。隨機抽樣《醫學統計學》課件3、抽樣方法選擇樣本的方法:概率抽樣和非概率抽樣等概率抽樣非等概率抽樣簡單隨機抽樣系統抽樣分層抽樣整群抽樣1123、抽樣方法選擇樣本的方法:概率抽樣和非概率抽樣等概率抽4.誤差誤差:統計上所說的誤差泛指測量值與真值之差,樣本指標與總體指標之差。主要有以下二種:系統誤差和隨機誤差(隨機測量誤差,抽樣誤差)。(1)系統誤差:指數據搜集和測量過程中由于儀器不準確、標準不規范等原因,造成觀察結果呈傾向性的偏大或偏小,這種誤差稱為系統誤差。特點:具有累加性(2).隨機誤差:由于一些非人為的偶然因素使得結果或大或小,是不確定、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公共政策的輿論監督機制試題及答案
- 社會保障政策中的公平問題探討試題及答案
- 公共政策的倫理與道德思考試題及答案
- 網絡設計中的用戶體驗考慮與試題及答案
- 增強網絡安全防御技術與試題及答案
- 西方國家反對派與公民參與的關系試題及答案
- 天然氣水合物開采技術設備研發效率提升預研報告
- 西方政治制度與全球經濟合作試題及答案
- 軟件測試的職業技能要求試題及答案
- 西方國家對經濟政策的社會接受度試題及答案
- 醫院內虛擬病區智慧化血糖綜合管理專家共識(2025版)解讀
- 2024北京西城區三年級(下)期末數學試題及答案
- 2024-2025學北京房山區初一語文(下)期末試卷附答案解析
- 南京市事業單位專項招聘退役大學生士兵真題2024
- 土地整治與耕地保護考核試卷
- 2025年高中物理:《公式+思維導圖》三年都有用
- 2026年日歷表全年表(含農歷、周數、節假日及調休-A4紙可直接打印)-
- 2024年淄博高新區事業單位招聘退役大學生士兵筆試真題
- 拘留所建設標準(建標102-2008)
- 《電力系統最優潮流的數學模型計算案例》6100字
- 安全生產風險防控“六項機制”做法及經驗分享
評論
0/150
提交評論