




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一單元緒論
一、預防醫學概述
L定義:是醫學的一門應用學科,研究環境因素對人群健康的影響及其規律,提出改善不良環境的衛生要求和保健措施,
以達到預防疾病、增進健康,延長壽命,提高勞動生產能力的目的。
?研究因素:環境因素(自然、社會和心理環境)
?研究對象:個體和群體
?工作模式:環境-人群-健康
?研究工具:運用基礎醫學、臨床醫學、環境衛生學、衛生統計學和流行病學等學科的理論和方法來探究環境因素對人
群健康作用的影響及其規律;制定防治對策,并采取各種有效的公共衛生措施。
?研究目的:預防疾病、增進健康、延長壽命、提高人群生活質量。
2.內容
?空間:從宏觀到微觀
?時間:過去、現在和將來
?服務對象:個人、家庭、社會
?個人:從出生到死亡
具體包括:
(1)研究各種疾病和健康狀況的三間分布特點
不同的空間,時間和人群間(性別、年齡、職業)的分布特點并比較其差異。
(2)研究環境對健康的影響及其規律
改善環境中的有害因素、利用環境中的有利因素,為防制疾病,增進健康提供理論依據。
(3)研究制定增進健康、防治疾病的對策和措施,并對措施的效果加以考核和評價。
3.特點
(1)‘研究的對象包括個體和群體,工作的重點是健康人和無癥狀患者。臨床醫學面對的是單個病人,采取搶救治療措
施。
如發生傳染病疫情,預防工作者應采取:
?傳染源:病人、病原攜帶者、接觸者、動物傳染源等進行隔離、醫學觀察等
?傳播途徑:消毒、殺蟲、滅鼠
?易感人群:免疫預防、藥物預防
(2)預防醫學把環境和機體聯系在一起,作為一個系統加以研究。
例如:在克山病患者的研究中,預防醫學就是研究環境因素對克山病患者的影響。在低硒的基礎上,各種綜合因素相互
作用。
(3)預防醫學的對策和效益產生于疾病發生之前。比臨床醫學具有更大的人群健康效益。而臨床醫學的對策和效益產
生于疾病發生之后■>
(4)研究方法上注重宏觀和微觀相結合,更側重向宏觀領域發展。而臨床醫學更側重向微觀領域發展。
4.預防醫學發展簡史:三個階段
(1)個體預防:多限于個體為對象進行治療和預防,衛生學。
(2)群體預防:主要目標以防治傳染病和寄生蟲為主,是個體預防向群體預防發展的標志。第一次衛生革命,主要任
務是預防傳染病。
(3)社會預防:隨著醫學模式的轉變,將單純從生物醫學模式,擴大到生物-心理-社會醫學模式,并將三者視為一個
整體。第二次衛生革命,疾病預防的重點從傳染病轉向慢性病,主要任務是預防慢性病。
二、健康及其影響因素
1.醫學模式
(1)定義:指在不同歷史階段和科學發展水平條件下,人們對自身生命、生理、病理、治療、預防等問題的基本觀點
和看法。
(2)發展階段:五個階段
?神靈主義醫學模式:
?自然哲學醫學模式
?機械論醫學模式
?生物醫學模式
?生物-心理-社會醫學模式
(3)現代醫學模式的主要表現:四個擴大
?從治療服務擴大到預防服務
?從技術服務擴大到社會服務
?從院內服務擴大到院外服務
?從生理服務擴大到心理服務
2.健康觀:即人們對健康的看法,是在一定醫學模式基礎上人們對健康和疾病本質的認識。
?生物醫學模式:認為無病即健康。
?生物-心理-社會醫學:健康觀注重心理和社會因素對健康的影響。
?當代健康的定義:健康不僅僅是沒有疾病或虛弱,而是在身體、精神和社會適應方面均處于完好狀態。
3.影響健康的主要因素:四大類12項
(1)環境因素:自然環境、社會環境、心理環境因素。
(2)行為生活方式:消費類型、生活危害和職業危害
不健康的行為生活方式如吸煙、酗酒、不良飲食習慣和缺少體育鍛煉。
(3)醫療衛生服務:預防、治療和康復。
(4)生物遺傳因素:遺傳、成熟老化和復合內因。
研究證明:環境因素起主要作用,行為生活方式對健康影響所占的比重越來越大。
當今嚴重威脅人類健康的心腦血管病、惡性腫瘤、糖尿病、艾滋病等都與行為生活方式有密切關系。
4.健康決定因素生態學模型
三、疾病的三級預防
1.定義:一個人從健康到發病,從發病到功能障礙,其發生發展都有一定的規律。針時無病期、發病期及障礙期開展的
疾病預防,稱為疾病的三級預防。
2.三級預防
(1)第一級預防:病因預防,是在無病期針對病因或致病因素所采取的預防措施,主要是消除或減少控制各種危害健
康的因素,并采取增進健康的各種措施,以防止健康人群發病。
如針對病因明確的傳染病(預防接種)、職業病(改善勞動環境)和某些地方病(食鹽加碘預防碘缺乏病)等。
(2)第二級預防:也稱臨床前期預防,三早預防,即在疾病的臨床前期做好早發現、早診斷、早治療,以預防疾病的發
展和惡化,防止復發和轉為慢性病等。
?對于致病因素不完全明確或致病因素經過長期作用而發生的慢性病,如腫瘤、心血管疾病等。應以二級預防為重點。
?做到“三早”的根本方法:對群眾進行宣傳教育,提高醫務人員的診斷水平和采用微量、敏感的診斷方法和技術。
?第二級預防的措施:普查、高危人群篩檢、定期健康檢查等。
(3)第三級預防:又稱臨床期預防,主要是對已患病者采取各種積極有效的治療和康復措施,防止病情惡化,預防并
發癥和傷殘,促進康復,恢復勞動和生活能力。
例題:
預防醫學的研究對象是
A.個體
B.病人
C.健康人
D.群體
E.個體和群體
答案:E
現代醫學模式是
A.神靈主義醫學模式
B.自然哲學醫學模式
C.機械論醫學模式
D.生物醫學模式
E.生物-心理-社會醫學模式
答案:E
生物-心理-社會醫學模式認為
A.心身是統一的
B.心理對健康和疾病有能動作用
C.心理因素、社會因素和生物因素都影響人體健康和疾病的發生
D.在健康和疾病問題上應將人視為一個整體
E.以上都是
答案:E
一、基本概念和基本步驟
醫學統計學:運用數理統計和概率論的原理和方法,結合醫學實際,研究數據的搜集、整理和分析的一門學科。
(-)基本概念
1.變量:具有變異的數據,分為兩類:
(1)數值變量:連續變量,可測量,一般有度量衡單位,如身高、體重、血壓等。
(2)分類變量:離散,表現為互不相容的類別,如性別、血型、民族、職稱等。包括:
?無序分類變量:取值間無大小、強弱、優劣等程度之別。如性別、血型等。又分為:
?兩項分類:如性別分男、女,化驗結果分陰性、陽性等;
?多項分類:如血型分為A型、B型、AB型、0型等。
?有序分類變量:取值間有大小、強弱、優劣等程度之別。如療效可分為治愈、顯效、好轉、無效,尿蛋白化驗結果分
為-、+、++、+++等。
2.總體與樣本
(1)總體:根據研究目的確定的同質觀察單位某個變量值的全體。分:
?有限總體:在時間和空間上都能確定有限個觀察單位。
?無限總體:沒有時間和空間限制,觀察單位數是不可數的。
(2)樣本:總體中隨機抽取的、有代表性的一部分觀察單位。
3.誤差:測量值和真值的差別為誤差:包括:系統誤差;隨機誤差。
(1)系統誤差:指數據搜集和測量過程中由于儀器不準確、標準不規范等原因,造成觀察結果呈傾向性的偏大或偏小,
這種誤差稱為系統誤差.
?原因:
?儀器標準試劑未經校正和統一;
?測量者掌握尺度不同;
?測量者的某種感官障礙所導致測量結果呈傾向性偏大或偏小。
?特點:①有傾向性;②可避免。
(2)隨機誤差:由于一些非人為的偶然因素使得結果或大或小。隨測量次數增加而減小。分隨機測量誤差和抽樣誤差。
?抽樣誤差:由抽樣引起的樣本統計量與總體參數之間的差異。抽樣研究中隨機誤差就體現為抽樣誤差。
?特點:無傾向性;不可避免,但可估計大小。
?控制方法:改進抽樣方法,增強樣本的代表性。整群抽樣>單純隨機抽樣〉系統抽樣〉分層抽樣;增加樣本量;選擇
變異程度較小的研究指標。
4.資料類型
(1)計量資料:對觀察單位進行測量取得數值,具有度量衡單位。數值變量構成計量資料。如身高、體重、血壓等。
?一般有計量單位
?用平均數指標描述
(2)計數資料:先按類別匯總,然后清點各類的觀察單位數。無序分類變量構成計數資料。如性別、血型等。
?無計量單位
?用相對數指標描述
(3)等級資料:變量的不同取值間有大小、強弱、優劣等程度之別。有序分類變量構成等級資料。如療效可分為治愈、
顯效、好轉、無效。
?無計量單位
?用頻數及平均秩次描述
?有程度差異
5.概率:描述隨機事件發生的可能性大小。
(1)表示方法:P
(2)取值范圍:。?1之間
(3)意義
?P越遑近1,說明某事件發生的可能性越大;
?P越接近0,說明某事件發生的可能性越小。
(4)小概率事件:如果某隨機事件發生的概率PWO.05,表示該事件發生的可能性很小。
(二)基本步驟
(1)設計:根據研究目的,提出全面具體的計劃和要求,作為統計工作實施的依據,以便用盡可能少的人力、物力和
時間獲得準確可靠的結論。統計學設計:抽樣、樣本量、統計方法。
(2)搜集資料:及時、準確、完整。
來源:報表資料、醫療衛生機構的日常工作記錄、專題調查和實驗數據。
(3)整理資料:整理資料是把搜集到的資料進行適當的分組,把性質相同的資料歸納到一起,用表格或圖形的方式展
示出來,以反映研究對象的規律性。
(4)分析資料:通過計算有關的統計指標,對資料進行概括的、全面的描述,以及從樣本信息推斷總體特征,如估計
總體參數、進行假設檢驗。
例題:
下列資料何為計數資料
A.體重(Kg)
B.血型(A、B、0、AB)
C.身高(cm)
D.每日吸煙量(0、1?5支、6?10支、10支以上)
E.白細胞數(個/L)
答案:B
二、數值變量數據的統計描述
(一)集中趨勢指標
1.定義:描述一組觀察值的平均水平。
2.統計指標:算術均數、幾何均數和中位數。
(1)算術均數:簡稱均數。_
?表示方法:總體均數用希臘字母□表示,樣本均數用了表示。
?適用范圍:正態分布或近似正態分布資料
?計算方法:直接法(原始數據)和加權法(頻數表數據)
萬=2或受工整
?計算公式:*
(2)幾何均數(G):
?適用范圍:原始數據呈倍數關系或偏態分布資料;呈對數正態分布資料。
?計算方法:直接法和加權法
C7=kg(=--------)%G=L?g——)
?計算公式:
(3)中位數
將一組觀察值按從小到大的順序排列,位置居中的數。
?適用范圍:偏態分布;分布類型不明資料。
?計算方法
①由原始資料
排序XlWX2W…WXn
n為奇數:位次居中兩者
n為偶數:位次居中觀察值的均數
②由頻數表資料計算,關鍵找對中位數所在組段。
(4)集中趨勢指標的應用
?算術均數一正態分布或近似正態分布資料
?幾何均數一原始數據呈倍數關系或偏態分布資料?;呈對數正態分布資料。
?中位數一偏態分布或分布類型不明資料
(-)離散趨勢指標
1.定義:描述一組觀察值的變異程度。離散程度越大,集中趨勢指標代表性越差;離散程度越小,其代表性就越好。
2.統計指標:極差、四分位數間距、標準差、變異系數。
(1)極差(R):全距,一組觀察值中最大值與最小值之差。
?不穩定(受兩端值影響,與樣本量無關)
?浪費了n-2個數據的信息
(2)四分位數間距(Q):是下四分位數P25與上四分位數P75之差。中間一半數據的極差。
?用于描述偏態分布和“開口型”資料的變異程度
?較極差穩定,但仍有浪費信息的缺陷。
(3)標準差:用。表示總體標準差,用S表示樣本標準差。用于描述個體觀察值的離散程度;與均數結合描述資料的
分布情況;求參考值范圍;計算標準誤。
?離均差:總體中每個觀察值與總體均數的差。
?方差:離均差平方和除以觀察數據的個數。
?計算方法:方差的算術平方根,直學法和加權法
?計號公式:,*-I1*-1或
(4)變異系數(CV)
?定義:標準差與均數的百分比。
?適用范圍:當兩組資料單位不同或均數相差較大時。
(7K=£xt0i?4
?計算公式:X
(三)正態分布的特點、面積分布規律
L定義:頻數分布的兩種類型:對稱分布和偏態分布。偏態分布又有正偏態和負偏態。正態分布是對稱分布的一種,描
述連續型隨機變量分布,又稱Gauss分布。
2.特點
(1)在直角坐標中,正態曲線為位于x軸上方的鐘形曲線,且以X=N為對稱軸,左右對稱。
(2)正態分布有兩個參數u,。;U決定著正態曲線在x軸上的位置,稱為位置參數;。決定著正態曲線的形狀,若
口恒定,。越大,則曲線越平坦,。越小,曲線越陡峭。
(3)對應于正態分布參數口和。的不同取值,正態曲線的位置和形狀會千變萬化,但都可經標準化變換。
3.正態曲線下面積的分布規律
(1)x軸與正態曲線下面積等于1。
(2)在區間口土。上,正態曲線下的面積為68.27%;在區間U±1.96。上,正態曲線下的面積為95.00%;在區間口土
2.58。上,正態曲線下的面積為99.00%。
正態曲線下面枳的分布規律
(四)典型實例
1.比較身高和體重兩組數據變異度大小宜采用()
A.全距
B.四分位數間距
C.方差
D.變異系數
E.標準差
答案:(D)
2.中位數與四分位數間距適用于()
A.正態分布資料
B.偏態分布資料
C.正偏態資料
1),負偏態資料
E.對稱分布資料
答案:(B)
3.均數與標準差適用于()
A.正偏態分布
B.負偏態分布
C.正態分布
D.偏態分布
E.不對稱分布
分案:(C)
;均數與標準差之間的關系是()
A.標準差越小,均數代表性越大
B.標準差越小,均數代表性越小
C.均數越大,標準差越小
D.均數越大,標準差越大
E.標準差越大,均數代表性越大
答案:(A)
5.決定正態分布的參數是()
A.變異系數
B.標準差
C.標準誤
D.全距
E.組距
答案:(B)
6.X±2.58S正態曲線下的面積為()
A.68.3%
B.80.0%
C.90.0%
1).95.0%
E.99.0%
答案:(E)
7.一組變量值的標準差將()
A.隨系統誤差的增加而減小
B.隨系統誤差的減小而減小
C.隨變量值的個數n的增加而增大
D.隨變量值的個數n的增加而減小
E.隨變量值之間的變異增加而增大
答案:(E)
四、、分類變量資料的統計描述
(-)常用的相對數
兩個有聯系指標的比,是事物相對關系的指標。
1.率:為頻率強度指標,說明某現象發生的頻率或強度。常以百分率(%)、千分率(%。)、萬分率(1/萬)、十萬分
率(1/10萬)等表示。
某時期內某具象實際發生的單位數
X10OK
目時期內某現祭可解發生的總單位數
2.構成比:又稱百分比,是指事物內部各組成部分所占的比重,常以百分數表示。
舸JU內瓢象蟒單越
X1OO9C
局時嬲內拿現敏可悔貶生的不
3.相對比:又稱比,是指甲乙兩個有關指標之比,常以倍數或百分數表示。
小廊標的值
(-)注意事項
1.計算相對數時分母不宜過小
數量越多,計算的相對數越穩定,越能正確反映實際情況。
2.不能以構成比代替率
構成比說明事物內部各組成部分的比重或分布,率說明某現象發生的頻率或強度。
3.正確計算平均率
對觀察單位數不等的幾個率,不能直接相加求其平均率,應由各類合計的數據來計算。
4.作率比較時要注意資料的可比性
除了所研究的因素以外,其余的重要影響因素均應相同或相近,要在相同條件下對比。需要利用標準化法處理后才能進
行比較。
5.樣本資料的比較應作假設檢驗
對率(或構成比)進行比較必須進行假設檢驗
(三)典型實例
計算率而平均值時,應
A.將各個率直接相加來求平均值
B.依據各組合計欄的陽性數和觀察例數計算
C.先標化,再按將各個率直接相加來求平均值法計算
D.按求中位數的方法求平均值
E.以上都不對
答案:B
率的標準化的主要目的是
A.消除內部結構的影響,使合計率具有可比性
B.使率變成實際水平
C.使率在任何情況下作對比
D.使大的率變小,使小率變大
E.以上均不對
答案:A
為說明某醫院夏、秋季腸道傳染病在門診病例中的比重大小,應選用的指標是
A.率
B.構成比
C.相對比
D.均數
E.中位數
答案:B
說明兩個有關聯的同類指標的比即為
A.率
B.相對比
C.構成比
D.頻率
E.頻數
答案:B
對計數資料進行統計描述的主要指標
A.平均數
B.相對數
C.標準差
D.變異系數
E.中位數
答案:B
使用相對數時容易犯的錯誤是
A.把構成比作為相對比
B.把構成比作為率
C.把率作為相對比
D.把率作為構成比
E.把相對比作為構成比
答案:B
五、分類變量資料的統計推斷
分類變量資料的統計推斷包括總體率的估計和x2檢驗。
(-)總體率的估計
1.標準誤:表示率的抽樣誤差的大小。率的標準誤表示從總體率為P的總體中,隨機抽取含量為n的許多個樣本,所得
樣本率pi,pz……p?的離散程度。
b2,用.計算公式
柏反尹后
3.總體率的可信區間
總體率95%可信區間:p±1.96Sp;總體率99%可信區間:p±2.58SP;
滿足條件:np或n(1—p)均大于5。
(二)x,檢驗
x2檢驗常用于計數資料的統計推斷,統計量x2值的基本公式為:
「50/
A為實際觀察到的頻數;T為根據檢驗假設確定的理論頻數。x2值反映了樣本實際情況與理論總體的符合程度。如果檢
驗假設成立,x2值不會太大;反之,若A與T差距大,x2值也大,當x2值超出一定范圍,就有理由認為檢驗假設不成立。
1.兩樣本率比較的x2檢驗
四格表X2檢驗是作兩樣本率的比較,目的是推斷兩樣本率所代表的總體率是否相同。
(1)四格表資料當T25且n240時,可用x2檢驗的基本公式或四格表專用公式,X2值與界值比較,確定P值。
_(fld-Ac)、
(2)四格表資料當1<TV5,且n240時,可用四格表的連續性校正公式計算校正x?值。
(3)四格表TV1或n<40時,校正值也不恰當,可以改用四格表的確切概率法。
舉例:
某市對醫院空氣消毒監測,甲醫院65個抽樣點中52個合格,合格率80%,乙醫院53個抽樣點中22個合格,合格率41.51%,
結果見下表。問兩醫院空氣消毒合格率是否不同?
兩個樣本率比較的問題,可用x?檢驗。先將實際觀察頻數列成四格表。因每一樣本均分成合格與不合格兩類,共有2義
2格,又稱為四格表資料的x?檢驗。
兩個氣溶毒合格率鞘螟
不合格款臺汗
5213(34.2065
22(33.24)31£19.館)53
44ti3
H。:兩總體的合格率相同,均等于合計的合格率
H,:兩總體的合格率不相同
Q=0.05
根據H。,各組的合格率與合計合格率相等,據此可估計四格表中每一格的理論頻數%(T的下標R指行,C指列),計
算公式為公式:
^■C=*
式中n為急、例數,nR是第R行合計數,nc是第C列的合計數。表中各格子括號內數字是理論頻數。
基本公式:
_(52-40/時+03-24-的1+(22-33.24),+(3l-19.7Qa
K40.76~24.24~~33.24~
=18.00
四格表專用公式:
J(orf-bc^x
r=-------------------------------=1B.6O
2
自山度u=(2—1)(2—1)=1,查x?表,XO,O5(1)=7.88.x2越大P越小,本例x?=18.50>x>05⑴,P<0.05,
兩樣本率的差別有統計意義,根據實際結果可以認為甲醫院的空氣消毒合格率高于乙醫院。
2.配對資料的x2檢驗
對同一個(或同一對)觀察對象比較兩種分類方法(或兩種處理)結果有無差別。
配對設計xz檢驗計算公式為:
b+c訊六七之
b+cvto
舉例:為了解新藥的安全性,觀察了100名受試者用藥前后的谷丙轉氨酶變化,結果治前治后均升高者25名,治前治
后均正常者60名,治前升高治后正常者6名,治前正常治后升高者9名,試分析新藥效果,結果見下表。
100名受試者用藥前后的谷丙轉氨情況
治后
治蔚管詩
正第升高
正津609密
升高625S1
相0634
Ho:用藥前后的谷丙轉氨酶無變化(新藥無效)
H.:用藥前后的谷丙轉氨酶有變化(新藥有效)
檢驗水準a=0.05?
b+c<40
q—
1c'-R.2T
9+6
由X2界值表x2。?⑴=3.84,P>0.05,不拒絕Ho,尚不可認為新藥有效。
3.行X列表資料的x2檢驗
(1)用于多樣本率或多組樣本構成比的比較。
(2)行X列表x2檢驗注意事項:
?行X列表xz檢驗的T不能太小。要求所有格子的T大于1,同時1/5格子的T不能小于5。
?多組有序分類資料相比較時,若要比較各組效應的大小,宜用秩和檢驗法。
?行X列表X?檢驗,當pWa時結論為各組總體不同或不全相同,不能推論彼此間都有差別。要進一步明確結論,可用
x2分割等方法。
(三)典型實例
1.計數笳料最常用的顯著性檢驗方法是()
A.t檢驗
B.正態檢驗
C.U檢驗
D.X?檢驗
答案:(D)
J兩樣本率差別的假設檢驗,其目的是()
A.推斷兩個樣本率有無差別
B.推斷兩個總體率有無差別
C.推斷兩個樣本率和兩個總體率有無差別
D.推斷兩個樣本率和兩個總體率的差別有無統計意義
E.推斷兩個總體分布是否相同
答案:(B)
3.四格表資料中實際數和理論數分別用A和T表示,其基本公式和專用公式求xz的條件是()
A.A》5
B.T25
C.A25且T\5
D.A25且n>40
E.T25且n24。
答案:(E)
4.四格表x2檢驗的校正公式應用條件為()
A.n>40且T>5
B.n<40且T>5
C.1WT<5且n240
D.n<40且1VT<5
E.n>40且T<1
答案:(C)
六直線相關和回歸
探索兩個定量變量間的關系,常用直線回歸與相關分析。
(-)直線回歸分析的作用、回歸系數及其意義
1.直線回歸方程的建立
例2.40:某研究欲探討男性腰圍與腹腔內脂肪面積的關系,對20名男性志愿受試者測量其腰圍(cm),并采用磁共振
成像法測量其腹腔內脂肪面積(cmb,結果如表2-36所示。試建立腹腔內脂肪面積(y)和腰圍(x)的直線回歸方程。
警號(?)
181.3Q9.8
289.8SL.2
985?990.3
48T.8T6.6
5T9.Q76.f
e82.fi86.4
7gs.2W2.S
8aa.i99.fi
994.49T.8
1O90.6gg
1199.5W8.2
12W9.8129.0
1397.6LW.4
1498.9123.9
Ifi99.TU5.5
WST.283.1
W94.1T2.0
1888.GWO.O
IS101.0W5.0
3088.3t2T.f
研究兩個連續型變量之間數量上的線性依存關系的方法稱為直線回歸,它通過擬合直線回歸方程來描述兩變量間的關
系。
直線回歸方程記為:
a+瓜
式中"多表示X取某定值時,總體均數*的估計值,也稱為回歸方程的預測值;X為自變量;a為回歸直線的截距,也
稱常數項,即x=0時y的平均估計值;b為回歸直線的斜率,也稱回歸系數。
根據最小二乘法原理,可推導出a和b的計算公式。最小二乘法原理即保證各實測點距回歸直線縱向距離平方和
一2了,最小,按該原理推導出的公式如下:
4不
工3-天
1n
式中:入5
1,J分別為x和y的離均差平方和,4為x和y的離均差積和。
以例2.40說明直線回歸方程的建立步驟:
(1)由例2.40數據繪制兩變量的散點圖,發現二者有直線趨勢,可以進行直線回歸分析。
130
(
7
二
氟
@
徑
密
長
a副
BRT(??)
圖24胺底內脂腸薄預和度圖放點圖
⑵計算]'I
3>=1819.8=—=19129
工J=166534.38=190252.97中=l7AKt.42
<=^-=90.990jr=-=^-=95.645
■"
J_C^1=950778
-H
J=-£221=7293,650
JZ一
IZ▼—(-嘮U*=2006.649
(3)根據公式計算回歸系數b和截距a
2006.649
21105
950.778
a=/-bx=95.645—2,105x90.990=-963894
4.列出直線回歸方程:^=-96.3894+2.1105x
在x的實測值范圍內,任取相距較遠且易讀數的兩個x值80和90,代入方程得到相應的9值分別為72.5、93.6,連接
兩點(80,72.5)、(90,93.6),即可繪制回歸直線。
2.直線回歸系數的含義及其假設檢驗
回歸系數b的含義是自變量x改變一個單位時?,應變量y平均改變b個單位。回歸系數b>0時,表示回歸直線從左下
方走向右上方,即y隨x增大而增大:b<0時,表示回歸直線從左上方走向右下方,即y隨x增大而減小;b=0時,表示
回歸直線平行于x軸,即y與x無線性依存關系。
對于例2.40,回歸系數b=2.1105,表示男性腰圍每增加1cm,腹腔內脂肪面積平均增加2.1105cm%
無論y對x的回歸關系是否成立,總可擬合出直線回歸方程,3=?+加,但方程并不一定有統計學意義,故需要對方
程及回歸系數進行假設檢驗。
對直線回歸方程及回歸系數的假設檢驗相同,常用的假設檢驗方法有:
(1)方差分析:為了理解回歸中方差分析的基本思想,先對應變量y的離均差平方和作分解,如圖2-5所示。
圖應變■的離均是平方卻劃分示意圖
圖2-5中任一點p的縱坐標被回歸直線與均數f截成三段,即y-5=(?-?)+(y-討。由于p點是任意一實測點,若
將全部數據點均按上法處理,則有:
記作:SS&-SSM+SS城
相應的自由度關系為:U,?=u181+u我
式中:u慫=n—1,u“=l,u?E=n—2
SSa為y的總離均差平方和,表示未考慮x與y的回歸關系時y值的總變異。SS問為回歸平方和,反映了在y的總變異
中,可以用x與y的回歸關系解釋的那部分變異。
SS|rt|=b1xy—1xy2/1XX—b21xx
SS燉為殘差平方和,表示除X對y的回歸影響外,其他所有因素對y變異的影響,即在總平方和中無法用X與y的回歸
關系解釋的部分。
要分析x與y的回歸關系是否存在,可采用統計量F。
F=----=--------,%=1,=a—2
霞殘枝
式中:MS耐為回歸均方;
MS殘為殘差均方。
若F2F一響,。皿,則PWa,按所取檢驗水準,拒絕H。,接受H”故可認為x與y變量間存在直線回歸關系;若F<F?
(0H??).則P>a,按所取檢驗水準,不拒絕H。,尚不能認為x與y變量間存在直線回歸關系。
(2)t檢驗
式中:Sb為樣本回歸系數b的標準誤,S、,為回歸的剩余標準差。
例2.41:在例2.40中建立的直線回歸方程9=一96.3894+2.1105x是否成立?
①建立檢驗假設,確定檢驗水準
Ho:B=0,即腹腔內脂肪面積與腰圍之間無直線回歸關系
H,:B#0,即腹腔內脂肪面積與腰圍之間有直線回歸關系
a=0.05
②計算檢驗統計量
/?==GTTT=Ijp=7293.650
碗=4235.100
?=.―一=3058L549
工型最您理J加
耳網》/%3058.549/18
將上述結果列出方差分析表2-37。
表2-3720名男性腹腔內脂肪面積和腰圍直線回歸系數假設檢驗的方差分析表
變異舞《SS0KSP
回歸4296.1001429&.WO34.924<0.01
超3068.64918109.919
融期72SS.66019
③確定P值,作出推斷
按ui=1,u2=u及=n—2=18,查F界值表,F”(“,?2>=Fo.oi<i,i?>=8.28,得PVO.01,按a=0.05水準拒絕Ho,接
受H“回歸方程有統計學意義,可以認為腹腔內脂肪面積與腰圍之間有直線回歸關系。
如對本例做t檢驗,貝lj
,5-0b2.1105
S.木國小0:549>20~2)亞通§
由u=n—2=18,查t界值表,得PV0.001,按a=0.05水準,拒絕%,回歸方程有統計學意義,結論同上。
可以驗證,討=F,因此,同一資料回歸系數的t檢驗與方差分析等價。
3.直線回歸的應用及應注意的問題
(1)應用
①直線回歸方程可用來描述兩定量變量間數量依存變化的關系。
②利用回歸方程進行預測預報:這是回歸方程的重要應用之一。
③利用回歸方程進行統計控制:統計控制是利用回歸方程進行逆估計。
(2)應注意的問題
①作回歸分析要有實際意義,不能把毫無關聯的兩種現象作回歸分析,必須對兩種現象間的內在聯系有所認識。
②直線同歸分析前應繪制散點圖。只有散點圖呈現直線趨勢時,兩變量呈直線回歸關系的假定才有依據。
③兩變量間存在直線關系時,不一定表明彼此之間就存在因果關系,有可能是依存關系,或僅僅是表面上.的伴隨關系。
④直線回歸分析的應用條件為:應變量與自變量關系為線性、誤差服從正態分布、各觀測值獨立等。
⑤直線回歸分析中反映自變量對應變量數量上影響大小的統計量是回歸系數b,而不是假設檢驗的P值。
⑥應用直線回歸方程進行預測時,自變量一般不應超出樣本實測值的取值范圍。
(二)直線相關分析的用途、相關系數及其意義
直線相關又稱簡單相關用于描述兩個變量之間線性相關程度。
1.直線相關的分類
(1)正相關:兩個變量x與y,絕大多數x與y同時增大或同時減小,并且x和Y呈直線變化趨勢,稱這種伴隨同時增
大或同時減小的直線變化趨勢為正相關。
(2)負相關:如果兩個研究指標之間的變化關系是相反的,X增大而Y呈下降變化趨勢,這種X與Y的反方向伴隨直線
變化趨勢稱為負相關。
2.直線相關系數
直線相關是指兩個隨機變量之間呈直線趨勢的關系。相關系數用于描述具有直線關系的兩變量x,y間的相互關系,也
稱Pearson積矩相關系數,說明具有直線關系的兩變量間的相關方向與密切程度。樣本相關系數用r表示,計算式為:
_________工沖一0符0負,嘉_______
一瘧爐-0刀Miy-0?㈤
(1)相關系數r意義
描述兩個變量間直線關系密切程度和相關方向的統計指標。r沒有單位,取值范圍為-lWrWl。兩變量相關的方向用r
的正負號表示,即r>0表示正相關;rVO表示負相關。相關系數r的絕對值大小表示相關的密切程度,|r|越接近1,表示
兩變量間相關關系密切程度越高。|r|=1表示完全相關,r=0表示無直線相關關系,稱零相關。
(2)相關系數r的計算
例2.42:根據例2.40資料,試估計男性腰圍和腹腔內脂肪面積的相關系數r。
本例L*=950.778,1,,=7293.650,l“=2006.649,代入公式:
.2006.M9
ras--yZ-s,-y1—=0.762
^50778x7293650
(3)直線相關系數的假設檢驗
假定從總體相關系數P=0的總體中隨機抽樣,由于存在抽樣誤差,所得樣本相關系數r不一定為零。因此,求得樣本
相關系數r后,需進行總體相關系數P是否為零的假設檢驗。常用的方法有t檢驗和查表法。
r—0
2
式中:S,為樣本相關系數r的標準誤。
亦可按u=n-2,查r界值表,得到P值,結論與t檢驗相同。
例2.40資料中,男性腰圍和腹腔內脂肪面積相關系數r的t檢驗步驟如下:
建立檢驗假設,確定檢驗水準
Ho:P=0,即男性腰圍和腹腔內脂肪面積無直線相關關系
H,:PAO,即男性腰圍和腹腔內脂肪面積有直線相關關系
a=0.05
計算檢驗統計量
本例,n=20,r=0.762,代入公式:
0762=4992
-8.70
20-2
0=20-2=18
確定P值,作出推斷
查t界值表,得PV0.001,按a=0.05水準,拒絕H。,接受H”可認為男性腰圍和腹腔內脂肪面積有直線相關關系。
此外,以r=0.762,u=20—2=18,直接查r界值表,得PV0.001,結論同前。
應用直線相關應注意的問題:①進行相關分析前應先繪制散點圖,從散點圖能直觀地看出兩變量間有無直線趨勢并發現
可能的異常點;②直線相關分析的統計推斷要求兩個隨機變量均服從正態分布;③出現異常點時慎用相關;④相關關系不一
定是因果關系;⑤分層資料不可盲目合并,將無相關性的兩樣本合并后可能造成相關的假象,或者將原本具有相關性的分層
資料合并后無相關性。
二140-112=28
=140-112=28
1=
'0x7+2x6+3x5^-4x34-5x44-6x2+7x1)-
=85-112=—27
確定P值,作出推斷
以n=7,r,的絕對值查”界值表,得0.002VPV0.005,按a=0.05水準,拒絕H。,接受乩,可認為當地水中含碘量與
單純性甲狀腺腫患病率有負相關關系。
七統計表和統計圖
(一)、統計表
按照被說明事物指標的分組情況,統計表分為簡單表和組合表。簡單表只按?個特征或指標分組;組合表將兩個或兩個
以上特征或指標結合起來分組。
1.制表的基本原則
統計表的制表原則首先是重點突出,即?張表一般只表達?個中心內容,盡量避免把過多的內容放在同一張表里;其次,
統計表要層次清楚,即標目的安排及分組符合邏輯,便于分析比較;最后,統計表應簡單明了,文字、數字和線條都應盡量
從簡,如表2-39。統計表的制表原則具體體現在:
柄皿i年食物中呈性的E炯分布
月皆中毒超fcCH)
312LO9
34.01
3423.L3
10r2322LH
葡147100.00
(1).標題:高度概括表的主要內容,應包括表號、研究的時間、地點和研究內容,置于表的正上方。
(2).標目:分為橫標目和縱標目,分別說明表格每行和每列內容的涵義。注意標明指標的單位。
(3).線條:多采用3條線,即頂線、底線、縱標目下橫線。部分表格可在多重縱標目間用短橫線分隔,其他豎線和斜
線一概省去。
(4).數字:用阿拉伯數字表示。同一指標小數位數應一致,位次對齊。表內不留空項。無數字用“一”表示,缺失數
字用“…”表示,數值為0者記為“0”。
2.制表注意事項
(1).統計表結構完整,標題高度概括,標目設置恰當,計算指標能反映被研究事物的實質。
(2).表中數字要準確,數字區內不能插入文字,也不列備注項,必須說明者用“*”號等標明,在表下方備注說明。
(二)、統計圖
1.制圖的基本要求
制統計圖時,應根據資料性質和分析正確選用統計圖。除圓圖外,一般用直角坐標系的第一象限作為圖域(制圖空間)。
繪制圖形應注意準確、美觀和清晰。具體要求如下:
(1).標題:應高度概括資料的時間、地點和主要內容,一般放在圖的正下方,并加圖號。
(2).標目:分為橫標目和縱標目,分別表示橫軸和縱軸的涵義,一般有度量衡單位。
(3).刻度:指在橫軸和縱軸上的坐標尺度。刻度數值按從小到大的順序排列,橫軸由左向右,縱軸山下向上。縱橫軸
的比例一般5:7或7:5為宜。
(4).圖例:說明統計圖中各種圖形所代表的事物。當統計圖用不同線條和顏色表示不同事物的指標時,通常需要附圖
例加以說明。
2統計圖的正確選擇及其注意事項
(1).條圖:用相同寬度的直條長短表示相互獨立的統計指標的數值大小和它們之間的對比關系。指標既可以是絕對數,
也可以是相對數。常用的條圖有:①單式條圖:具有一個統計指標,一個分組因素,如圖2-6;②復式條圖:具有一個統計
指標,兩個或兩個以上的分組因素,如圖2-7。
陽某地JW彳年工粒泊化率統金色眸《r電七■率
繪制條圖時應注意:①直條尺度必須從0開始,且等距;②各直條的寬度相等。
(2).圓圖:又稱餅圖。以圓的總面積表示事物的全部,將其分割成若干個扇面表示事物內部各構成部分所占的比重,
適于描述分類變量各類別所占的構成比,如圖2-8?
映2-8某地2O0S年男性的死因構成
繪制圓圖時應注意:圓內各部分事物一般以時鐘12點位置作始點,順時針方向按一定順序排列。
(3).線圖:用線段升降來表示數值變化,適用于描述某統計量隨另一連續型數值變量變化而變化的趨勢。通常橫軸是
時間或其他連續型變量,縱軸是統計指標。如果橫軸和縱軸都是算術尺度,稱普通線圖:橫軸是算術尺度,縱軸是對數尺度,
稱半對數線圖。
如圖2-9為普通線圖,反映某地1996?2005年農村和城市惡性腫瘤死亡率隨時間變化而變化的趨勢;圖2-10為相應的
半對數線圖,反映死亡率隨時間變化而變化的相對趨勢。
繪制線圖時應注意:①普通線圖縱軸一般以0點作起點,否則需作特殊標記或說明;②不同指標或組別可以用不同線段,
如實線、虛線等表示;③各測定值標記點間用直線連接,不可修勻成光滑曲線。
一
冬
:
.'
£
S旅
益T
門小
]航疝
W
c:sfe
向5f
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 探討機電工程中的智能設備試題及答案
- 天然氣水合物(可燃冰)開采技術地質勘探技術發展現狀預研報告
- 數字化轉型制造業數據治理與數據治理風險管理報告
- 智慧港口自動化裝卸設備在冷鏈物流中的應用與發展趨勢報告
- 公共政策實施中的利益博弈與決策分析試題及答案
- 西方政治制度與歷史記憶的政治功能試題及答案
- 掌握西方政治制度核心知識試題及答案
- 西方國家的法治與民主關系試題及答案
- 干細胞治療在神經系統疾病中的應用現狀與2025臨床應用挑戰報告
- 大數據背景下的公共政策分析試題及答案
- 2025屆陜西省高三新高考全真模擬政治試題(原卷版+解析版)
- 南京2025年南京市市場監督管理局所屬事業單位招聘編外筆試歷年參考題庫附帶答案詳解
- 2025貴州中考:政治必考知識點
- 心率變異性與情緒狀態的相關性-洞察闡釋
- 新質生產力下產教協同下的智能會計人才培養模式研究
- 2025-2030中國再生纖維行業市場發展現狀及競爭策略與投資前景研究報告
- 2025屆湖北省示范中學高考沖刺押題(最后一卷)英語試卷含答案
- 智能機器人技術下的智慧校園建設
- 華電煤業集團有限公司招標管理辦法
- 江蘇連云港歷年中考作文題與審題指導(2003-2024)
- 2025-2030中國風水機構行業運行狀況與企業經營形勢分析研究報告
評論
0/150
提交評論