




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2012高教社杯全國大學生數學建模競賽承 諾 書我們仔細閱讀了中國大學生數學建模競賽的競賽規則.我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網上咨詢等)與隊外的任何人(包括指導教師)研究、討論與賽題有關的問題。我們知道,抄襲別人的成果是違反競賽規則的, 如果引用別人的成果或其他公開的資料(包括網上查到的資料),必須按照規定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴格遵守競賽規則,以保證競賽的公正、公平性。如有違反競賽規則的行為,我們將受到嚴肅處理。我們授權全國大學生數學建模競賽組委會,可將我們的論文以任何形式進行公開展示(包括進行網上公示,
2、在書籍、期刊和其他媒體進行正式或非正式發表等)。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): C 我們的參賽報名號為(如果賽區設置報名號的話): 所屬學校(請填寫完整的全名): (隱去論文作者相關信息等) 日期: 2012 年 9 月 10 日賽區評閱編號(由賽區組委會評閱前進行編號):2012高教社杯全國大學生數學建模競賽編 號 專 用 頁賽區評閱編號(由賽區組委會評閱前進行編號):賽區評閱記錄(可供賽區評閱時使用):評閱人評分備注全國統一編號(由賽區組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進行編號):腦卒中發病環境因素分析及干預摘 要:腦卒中逐漸威脅人們的生活,
3、本文主要針對腦卒中發病病例信息和受病環境因素進行統計分析,從實際數據結果加深對腦卒中的認識,旨在對腦卒中加以預防。針對問題一,先主要借助于EXCEL編程及篩選功能、MATLAB輔助編程對附件數據進行錯誤修復及標準化處理,得到20072010年期間有效數據的發病年、月、日,然后在EXCEL中分別按性別、年齡、職業、時間(包括年、月、日)四個字段對發病人數進行統計,并以圖、表的形式予以展示,最后總結出腦卒中患者男女性別比為1.17:1、集中患病年齡段為7180歲、高危職業為農民、存在一定季節性等結論,該問屬于一般的數據統計分析模型。針對問題二,先對患者按照天來統計四年每天的發病人數(共1461條數
4、據),再將氣象數據與發病人數按天進行關聯構成新的源數據,同時計算每天的氣壓差、溫差,最后以發病率為因變量,以平均氣壓、最高氣壓、最低氣壓、氣壓差、平均溫度、最高溫度、最低溫度、溫度差、平均濕度、最低濕度10個特征為自變量進行多元線性回歸,其步驟是先畫因變量與自變量的散點圖觀測它們的關系,再利用SPSS軟件統計所有變量之間的相關性,最后進行多元逐步回歸分析。結果表明:發病率與這10個指標的相關性并不大,但整體上與最低氣壓、最高溫度和溫差呈正相關、與平均濕度和氣壓差成負相關;發病率與平均濕度直接線性相關,逐步回歸的模型為,且模型檢驗為F=7.555、Sig.=0.006,表明該模型通過顯著性檢驗;
5、再次以平均濕度為因變量,以氣壓和溫度為自變量進行逐步回歸發現,平均濕度受溫差、平均氣壓影響,這間接地對腦卒中發病率產生影響。針對問題三,通過查閱資料文獻得到腦卒中高危人群的重要特征和關鍵指標、主要誘發因素,并結合問題一和問題二中的相關結論對腦卒中高危人群進行了預警和干預建議。最后,本文對模型進行了檢驗及評價分析,用20072010年的發病數據進行回代檢驗,兩者絕對距離小于1的比例為86%。同時,本文的分析可以推廣應用到其它疾病、農作物收成等受環境、氣候影響的分析及預警評估中。關鍵詞:腦卒中,環境因素,統計分析,多元線性回歸,逐步回歸,顯著性檢驗,預警,回代檢驗一、 問題重述隨著社會的發展,人們
6、生活水平不斷提高,但與此同時,伴隨著城市化進程加快,人口密度加大,生活節奏加快和膳食結構改變等不良現象,一些嚴重威脅人們身體健康的疾病發生,心腦血管疾病以其高死亡率而越來越引起人們的關注。其中腦卒中(俗稱腦中風,包括腦出血、蛛網膜下腔出血和腦梗塞,腦出血和蛛網膜下腔出血均屬心腦血管疾病)是目前威脅人類生命的嚴重疾病之一,目前對腦卒中尚無特效治療方法或令人滿意的治療效果,因此積極預防尤為重要。隨著人們對預防疾病和保證健康生活方式的重視,氣候變化對人類健康的影響也倍受關注,國內外許多研究表明氣象要素的變化對心腦血管疾病有著重要影響。因此研究氣象要素與心腦血管疾病之間的關系對于防病和治病具有重要的現
7、實意義。腦卒中的發生是一個漫長的過程,一旦得病就很難逆轉。對腦卒中的發病環境因素進行分析,其目的是為了進行疾病的風險評估,對腦卒中高危人群能夠及時采取干預措施,也讓尚未得病的健康人,或者亞健康人了解自己得腦卒中風險程度,進行自我保護。同時,通過數據模型的建立,掌握疾病發病率的規律,對于衛生行政部門和醫療機構合理調配醫務力量、改善就診治療環境、配置床位和醫療藥物等都具有實際的指導意義。數據(見Appendix-C1)來源于中國某城市各家醫院2007年1月至2010年12月的腦卒中發病病例信息以及相應期間當地的逐日氣象資料(Appendix-C2)。請建立數學模型,解決如下問題:問題一:根據病人基
8、本信息,對發病人群進行統計描述。問題二:建立數學模型研究腦卒中發病率與氣溫、氣壓、相對濕度間的關系。問題三:查閱和搜集文獻中有關腦卒中高危人群的重要特征和關鍵指標,結合問題一、問題二中所得結論,對高危人群提出預警和干預的建議方案。二、 問題分析本文主要目標是要分析腦卒中受發病環境因素的影響關系以及對應的預防措施,其總體研究方法是通過對現有數據進行統計規律分析,找出腦卒中的發病率與環境因素(溫度、濕度、大氣壓)的關系描述,并通過查詢資料文獻了解腦卒中高危人群的重要特征及常見的預防腦卒中的預防措施,最后再結合第一問和第二問分析的結果對高危人群提出預警和干預的建議方案,旨在提高對腦卒中的防護能力。鑒
9、于此目的,針對本文具體3個問題,可以進行如下分析:2.1 針對問題一的分析本問題主要根據附件(Appendix-C1)中四個文件中的腦卒中發病病例信息進行相關統計分析,這些病例信息指標主要有性別、年齡、職業、發病時間、診斷時間,為了對發病人群進行統計描述,本文主要從以下幾點進行考慮:1. 按性別統計,包括總人數、主要集中年齡段、高危職業名稱、發病與診斷時間的間隔(判斷該病的潛伏性);2. 按年齡段統計,包括該年齡段內的性別、人數、比例、高危職業、發病與診斷時間的間隔;3. 按職業統計,包括該職業內的發病人的性別、集中年齡段、發病與診斷時間的間隔;4. 分別按發病年、月統計(發病年月和診斷年月基
10、本一致),包括性別、年齡段、高危職業等。但是從附件數據中發現,在“Time of incidence (發病時間)”和“Report time (診斷報告時間)”中存在不同的時間格式以及錯誤(如: # 或空格),因此在對數據進行統計分析前,需要首先對數據進行修復,根據一定修復原則將一些明顯的錯誤信息(如發病時間為5008/7/31、診斷報告時間為27/09/2008情況下,很明顯5008應該是2008)。同時,從附件數據中易發現,部分診斷時間沒有數據,而且診斷時間比較混亂,錯誤比較多,因此本文將不對診斷報告時間進行分析,進而也將不統計發病與診斷時間的間隔。最后在修復完成后的基礎上按上述思想進行
11、腦卒中的發病信息統計,其統計的工具主要是EXCEL,利用EXCEL豐富的公式編輯、篩選、繪圖、統計等功能進行處理。2.2 針對問題二的分析本問題欲研究腦卒中發病率與氣溫、氣壓、相對濕度間的關系,主要需要注意以下幾點:1. 在第一問已修復的數據基礎上進行發病率統計,主要統計方法是通過EXCEL的篩選功能和編寫程序統計出在20072010年期間每一天的發病人數,進而可以計算出按天及按月的發病率;2. 對附件(Appendix-C2)中數據文件進行整理及統計計算,先按天統計20072010年期間每一天的氣象信息(溫度、濕度、大氣壓),并計算出每一天的溫度差、氣壓差,再按月分別統計這四年中的8種指標(
12、平均氣壓、最高氣壓、最低氣壓、平均溫度、最高溫度、最低溫度、平均濕度、最低濕度)每月的各個平均值、最大值、最小值;3. 將1和2統計或計算的數據進行一一關聯,構造后續分析的數組。從上面的統計數據可以看出,該問是一個多元統計問題1,即分析腦卒中發病率與溫度、濕度、大氣壓的各種指標的關系,主要分析思想如下:1. 先整體按天(20072012年共1461天)分析,分析過程為: 在EXCEL中畫出發病率與各個統計指標的散點圖,從直觀上尋求發病率與它們是否有明顯的規律(如線性相關); 利用SPSS統計軟件對所有數據進行相關性分析,分析兩兩之間的相關性; 利用SPSS軟件進行多元線性回歸,分析回歸結果是否
13、通過顯著性檢驗; 由于某些變量之間存在非常大的互相關(如溫度之間的三個指標互相關系數都比較大),因此需要對多個變量進行篩選,可用的方法為多元線性逐步回歸法(可以借助于SPSS統計軟件中的逐步回歸選項或MATLAB中的stepwise逐步回歸工具箱); 如果不存在前面操作沒有求出發病率與溫度、濕度、大氣壓的相關表達式,則繼續按后續方法進行分析處理;2. 然后按照每月或季節的數據進行類似分析;3. 按照溫度、濕度、大氣壓三類進行單因素相關性分析,先選擇其中兩個特征變化很小或在一個指定范圍內變化的數據,對發病率與第三個指標進行相關性分析,通過此方法進行單因素分析。整個過程需要做大量的統計分析,包括繪
14、圖及數據歸納整理,主要工具有EXCEL、SPSS、MATLAB。2.3 針對問題三的分析本問題首先要通過資料文獻了解腦卒中高危人群的重要特征和關鍵指標、腦卒中的主要誘發因素、常見的預防措施、已有的某些地區對腦卒中發病的統計信息和規律,根據這些信息最大化地提取關于腦卒中發病的指標,再結合問題一、問題二中所得結論,可以根據所查到的關鍵指標、氣象信息、時間序列進行預測模型的建立,如多指標影響因素的多元線性或非線性回歸、神經網絡預測模型、時間序列預測等等,最后對高危人群提出預警和干預的建議方案。三、 模型假設及符號說明3.1 基本假設1. 假設附件中的數據除空格、R#等本身有誤外其它數據是合理可靠的。
15、2. 假設附件數據中每一位病人都屬于不同的人。3. 假設除環境因素(溫度、濕度、大氣壓)外,影響腦卒中發病的其他因素保持不變。4. 假設當地人口不發生較大的變動,死亡率與出生率相近。5. 假設20072010數據四年間,沒有發生重大自然災害。6. 假設當地醫療環境相當,數據代表整個城市數據,數據具有代表性。3.2 符號說明:某天(月或其它統計范圍)的年發病率:某天(月或其它統計范圍)的發病人數:某年的總發病人數:自變數個數:因變數:自變數:各個自變數對依變數的各自效應;:自效應的集合3.3 基本定義發病率: 式(1)四、 模型建立及求解4.1 針對問題一的模型建立及求解由問題分析可知,這屬于多
16、信息變量的統計描述模型,該問題主要是對腦卒中發病者信息進行統計描述,其方法是分別對腦卒中患者病歷信息性別、年齡、職業、發病時間進行統計,全部操作在EXCEL中進行。4.1.1 附件數據的修復處理由于附件中的患者病例信息有許多格式錯誤及信息不完整,在進行統計描述前,有必要對數據做修復處理,本文的修復過程及方法如下:1. 年齡(Age)字段中存在大于110歲(如799)、0歲的信息,本文處理方法為將區間1 110之間的數據作為有效值,其余的全視為該患者年齡信息缺失。2. 職業(Occupation)字段中存在1-8之外的數據(如9、工等異常),可能是數據錄入錯誤,也可能是還有其它類的職業沒在附件中
17、說明,本文處理方法為將1-8之外的數據視為其他職業段。3. 發病時間(Time of incidence)字段存在日期格式錯誤(如15-06-2008、20080620等)或與EXCEL標準時間格式(如2007/1/1)不統一,需要對時間數據進行修復及標準化處理,處理原則有以下幾點: 類似“2009-0-24”的數據丟失了月份信息,此類數據認為是錯誤數據,不統計在20072010期間內; 類似“發病時間為5008/7/31、診斷報告時間為27/09/2008”存在明顯錯誤的數據,5008應該修復成2008; 類似“31/12/2009”的數據不是EXCEL標準的時間格式,為了便于在EXCEL中
18、快速按年、月、日進行統計分析,有必要對非標準的日期數據進行標準化處理,其方法可以通過在一單元格中進行編寫公式進行字符串處理,假設“31/12/2009”所在的單元格為“D2”,則計算標準化的日期格式(2009/12/31)的公式為“=DATE(RIGHT(D2,4),MID(D2,4,2),LEFT(D2,2)”; 類似“發病時間為20110/05/09、診斷報告時間為2010-08-08”的數據,直接視為無效數據; 類似“2009/0/24”的數據也視為無效數據。4.1.2 腦卒中患者信息統計分析通過上述數據修復過程后,將得到標準格式的腦卒中患者信息數據,現按照模型分析的思路對腦卒中病例信息
19、進行統計描述,其核心方法是在EXCEL中利用“COUNTIF”函數對某條件進行篩選后統計患者人數、及“COUNTIFS”函數對多重條件進行篩選后統計患者人數,具體操作界面截圖見附錄B-1。4.1.2.1 按性別統計對男女性別分別進行篩選,以年為單位,將四年的數據信息進行統計,20072010年按性別的腦卒中發病人數統計如表1所示,20072010年男女患病人數統計圖如圖1所示。表1 20072010年按性別的腦卒中發病人數統計表性別年統計人數附件總數據2007-2010年總2007 2008 2009 2010男3338533367730210384519810483女285262850659
20、40865948059102丟失信息121201200男女比1.17:11.17:11.23:11.20:11.08:11.15:1圖1 20072010年男女患病人數統計圖從表1及圖1可以看出,2007年男女患者之比達1.23:1,男性比女性更容易患腦卒中這類疾病,可能原因有以下幾點:一是男性高血壓多于女性;二是男性吸煙與飲酒者多于女性;三是男性從事體力勞動較多,突然用力可能誘發中風。4.1.2.2 按職業統計按職業字段進行篩選得到20072010年各職業患病人數統計數據如表2所示。表2 20072010年各職業患病人數統計表20072010年按職業統計數據職業發病人數性別編號名稱男女1農民
21、2975014644150842工人4856310817453退休人員6646412625174教師216163535漁民6643236醫務人員9065257職工7355132208離退人它或缺失其它或缺失1777595248268從表中看出農民患病人數為29750,屬于較多人群,為高危職業,而醫務人員等明顯較低,這與工作強度相關。圖2 20072010年各職業患病人數統計圖可以得出結論:經濟收入較高的人群較收入低的人群腦卒中發病率低,戶外重體力勞動者發病率較高。4.1.2.3 按年齡統計針對職業統計中,退休人員所占比例較大說明與年齡有關,對年齡進行篩選,將年齡分為各
22、個階段,統計出每年中不同年齡段的患病人數,以2007-2008年為例進行如表3所示的描述,各年詳細數據見附錄A-1。表3 2007-2008年各年齡段內患病人數統計表20072008患病人數男女患病人數男女1-101710750153511-20743149521-3035161957322531-4015596592351736241-5061437424086556629851-601861113572625471514103361-7030691784128546692803186471-8048422678216466483496314781-902309105112583549160
23、9193691-1001705711324982167101-110330422其他1267650251213圖3 20072010年各年齡階段的患病人數圖由圖3可見,患病人數隨年齡的增加而增加,上升速度以50到60上升較快,61歲以上的人群腦卒中的高發群體,集中年齡段在71-80歲之間,說明腦卒中以老年人居多,且腦卒中患者呈年輕化的趨勢。進一步按照各年齡段,對男女患者發病人數的進行區分,可得圖4所示。圖4 20072010四年期間各年齡階段男女患病人數圖可見,男女高峰年齡段一致;男性在4171歲之間,患病人數明顯高于女性;71歲以后患病明顯回落,且低于女性發病人數,可知男性發病早于女性,同時
24、這現象可能是由于高齡組死亡率持續增高所致。但無論男女,構成隨著年齡增加而增加,這與其在年齡發病相符。4.1.2.4 按時間統計按年份對發病人數進行統計,得到發病人數統計圖如圖5所示。圖5 腦卒中患者按年的統計人數分布從上圖可以看出,附件總數據為61923條,但20072010間有效的數據為61885條,本文做的統計描述均是針對20072010期間內。按月份對發病人數進行統計,得到發病人數統計表如表4所示。表4 20072010年各月患病人數統計表月份07年發病人數08年發病人數09年發病人數10年發病人數2007-2010年總發病人數193518278721760539427321961848
25、1487502831019191883017245491410691758860169953865107217768761882560661032151779316104952710141500931175752028119713669341680517791221127282916324954101374146175917185312111208137866415654815121369132180710714568圖6 2007-2010年總發病人數隨月份的變化曲線從20072010年逐年腦卒中發病人數的月分布發現,該病以春節多發,高峰出現在35月,1月為次高峰,69月發病較為平緩,12月
26、出現低谷期。由此可見發病存在一定的季節差異,腦卒中春季高于其他季節,而夏、秋、冬三季發病差異不大。利用EXCEL中的“COUNTIFS”函數對腦卒中病例數據進行多重篩選統計患者數量,得到20072010四年每天的發病人數,其曲線如圖7所示。圖7 2007-2010年總發病人數隨天的變化曲線根據式(1)求出20072010四年內每天的發病率,其發病率隨時間的變化曲線如圖8所示。圖8 2007-2010年發病率隨天的變化曲線從圖7和圖8可以看出,20072010四年內每天發病人數變化不大,每天的發病率基本保持不變。但是如果按天進行統計分析,每天的隨機誤差容易對結果造成影響,再每月的均值作為統計對象
27、進行分析,四年內每月的發病率百分比曲線如圖9所示。圖9 2007-2010年發病率隨月的變化曲線從圖9可以看出,月發病率隨時間呈周期性波動,具有一定的季節性。4.1.2.5 重要結論(1) 腦卒中的發病有年集中趨勢,更呈增長趨勢;(2) 發病存在時間差異,春節為高發季,1月為高峰月;(3) 患者人數男性多于女性,性別比重為1.17:1; (4) 工作性質對腦卒中發病有直接影響,農民為高危職業;(5) 腦卒中發病處于老年階段,集中年齡段為7180,且逐年呈年輕化發展。4.2 針對問題二的模型建立及求解由問題分析可知,問題二屬于一個多元統計分析模型,目標是研究因變量發病率與自變量溫度(包括平均溫度
28、、最高溫度、最低溫度、溫度差)、濕度(包括平均濕度、最低濕度)、氣壓(平均氣壓、最高氣壓、最低氣壓、氣壓差)之間的關系,本文主要從多元線性或非線性回歸模型上進行分析。4.2.1 數據歸納與統計附件(Appendix-C2)中的數據已經給出了2007-2010年每天對應的氣象數據,可以在這基礎上對氣象數據進行進一步細化:(1)計算每天的氣壓差與溫差,最終得到20072010年期間每一天的氣象特征信息平均氣壓、最高氣壓、最低氣壓、氣壓差、平均溫度、最高溫度、最低溫度、溫度差、平均濕度、最低濕度等10個特征變量;(2)按月份統計所有數據中每月的最大值及最小值情況。最后將第一問進行統計出的發病率情況與
29、氣象數據信息進行一一關聯,得到最終待分析的數據集,其數據形式如表5所示。表5 數據歸納統計形式按天統計時間發病人數發病率發病率千分比平均氣壓最高氣壓最低氣壓平均溫度最高溫度最低溫度平均濕度最低濕度氣壓差溫度差2007/1/1980.0074017.400694761025.11028.51023.38.19.97.486715.22.52007/1/2320.0024172.416553391025.21026.71023.56.57.4684733.21.42007/1/3330.0024922.492070681026.11027.81025.156.94.286772.72.72007/
30、1/4360.0027192.718622561027.11029.21025.75.97.44.282783.53.22007/1/5340.0025682.567587981027.110291025.256.54.384763.82.24.2.2 多元回歸分析過程多元回歸分析包括多元線性回歸及多元非線性回歸,判斷方法主要通過繪制因變量與各個自變量之間的散點圖,首先直觀分析因變量與自變量的關系,如果從散點圖可以看出明顯的線性關系,那么可以考慮通過多元線性回歸進行分析;如果從散點圖并不能發現明顯的線性規律,可能是呈非線性,也可能是多個自變量之間的耦合關系的影響,需要進一步分析才能決定。4.2
31、.2.1 多元線性回歸數學模型若依變數Y同時受到m個自變數X1、X2、Xm的影響,且這m個自變數皆與Y成線性關系,則這m+1個變數的關系就形成m元線性回歸。因此,一個m元線性回歸總體的線性模型為: 式(2)其中,N(0,)。相應的,一個m元線性回歸的樣本觀察值組成為: 式(3)在一個具有n組觀察值的樣本中,第j組觀察值(j=1,2,n)可表示為(x1j,x2j,xmj,yj),便是M=(m+1)維空間中的一個點。同理,一個m元線性回歸方程可給定為: 式(4)式(3)中,b0是x1、x2、xm都為0時y的點估計值;b1是by1·23m的簡寫,它是在x2,x3,xm皆保持一定時,x1每增
32、加一個單位對y的效應,稱為x2,x3,xm不變(取常量)時x1對y的偏回歸系數(partial regression coefficient);b2是by2·13m的簡寫,它是在x1,x3,xm皆保持一定時,x2每增加一個單位對y的效應,稱為x1,x3,xm不變(取常量)時x2對y的偏回歸系數;依此類推,b3是x3對y的偏回歸系數;bm是xm對y的偏回歸系數。在多元回歸系統中,b0一般很難確定其專業意義,它僅是調節回歸響應面的一個參數;bi(i=1,2,m)表示了各個自變數xi對依變數y的各自效應,而則是這些各自效應的集合,代表著所有自變數對依變數的綜合效應。多元線性回歸模型的求解可
33、以直接通過SPSS軟件和MATLAB相應的工具求解。4.2.2.2 按天的數據分析顯然,本文中的因變量Y為腦卒中發病人數或發病率或發病率千分比,自變量X有平均氣壓、最高氣壓、最低氣壓、氣壓差、平均溫度、最高溫度、最低溫度、溫度差、平均濕度、最低濕度等10個變量,首先按照每天的統計數據進行多元線性回歸分析。(1)觀測發病率與自變量的散點圖以平均氣壓為例,繪制發病率千分比與平均氣壓的散點圖如圖10所示。圖10 2007-2010年每天發病率千分比與平均氣壓間的散點圖從該圖可以看出發病率與平均氣壓并沒有明顯的線性變化關系,可能原因是發病率與平均氣壓的相關性不強,也可能是受其它自變量耦合關系的影響,因
34、為要分析發病率與平均氣壓的關系必須要在其它指標保持不變或變化很小范圍內研究才具有可靠性,因此需要進一步分析。(2)所有變量兩兩相關性分析將表5所示的數據導入SPSS軟件中【1】,進行變量之間的相關性分析,所得結果如表6所示。表6 發病率與10個自變量之間的相關性統計發病率千分比平均氣壓Pearson 相關性-.001顯著性(雙側).965N1461最高氣壓Pearson 相關性-.003顯著性(雙側).910N1461最低氣壓Pearson 相關性.001顯著性(雙側).968N1461平均溫度Pearson 相關性.006顯著性(雙側).834N1461最高溫度Pearson 相關性.009
35、顯著性(雙側).742N1461最低溫度Pearson 相關性.001顯著性(雙側).977N1461平均濕度Pearson 相關性-.072顯著性(雙側).006N1461最低濕度Pearson 相關性-.028顯著性(雙側).290N1461氣壓差Pearson 相關性-.015顯著性(雙側).554N1461溫度差Pearson 相關性.024顯著性(雙側).368N1461從表6可以看出,發病率只與平均濕度能通過顯著性檢驗(<0.05),且相關系數都非常低,但總體上發病率與最低氣壓呈正相關、與最高溫度成正相關、與平均濕度成負相關、與溫差呈正相關、與氣壓差呈負相關。(3)逐步回歸分
36、析從(1)和(2)分析可知發病率從單因素上講,它與其它自變量的相關性非常小,且無規律可行,需要進行多因素分析,可以通過多元線性回歸進行嘗試。但是,部分自變量之間又存在很強的相關性,如關于溫度的四個指標之間的相關系都大于0.9,因此發病率肯定不是所有這10個特征變量的函數表達式,因此本文采用逐步回歸法進行分析。逐步回歸分析的基本原理為:在建立多元回歸方程的過程中,按偏相關系數的大小次序將自變量逐個引入方程,對引入方程中的每個自變量偏相關系數進行統計檢驗,效應顯著的自變量留在回歸方程內,循此繼續遴選下一個自變量。如果效應不顯著,停止引入新自變量。由于新自變量的引入,原已引入方程中的自變量由于變量之
37、間的相互作用其效應有可能變得不顯著者,經統計檢驗確證后要隨時從方程中剔除,只保留效應顯著的自變量,直至不再引入和剔除自變量為止,從而得到最優的回歸方程。對于本文中的逐步回歸分析仍借助于SPSS軟件的“回歸”功能進行分析,設定顯著性水平為0.05,逐步回歸的模型檢驗為F=7.555,Sig.=0.006,具體結果如下:表7 逐步回歸模型結果模型非標準化系數標準系數tSig.B標準 誤差試用版1(常量)3.022.10528.741.000平均濕度-.004.001-.072-2.749.006圖11 逐步回歸的Student化殘差圖從表7可以看出,所計算的參數的顯著性水平Sig.均小于0.05,
38、表示計算回歸模型通過了顯著性檢驗,且標準誤差也比較小;從圖11也可以看出殘差圖基本落在-2.5 2.5內,表明回歸模型較好,該逐步回歸的多元線性模型為: 式(5)其中代表發病率千分比,代表平均濕度,這也說明發病率與平均濕度條件直接相關。(4)氣象變量間的相關性分析由于濕度與溫度、氣壓密切相關,腦卒中發病率雖然與溫度、氣壓沒有直接關聯度,但溫度和氣壓因素卻影響濕度參數,因此以平均濕度為因變量,以平均氣壓、最高氣壓、最低氣壓、氣壓差、平均溫度、最高溫度、最低溫度、溫度差8個特征為自變量進行逐步回歸分析,通過已有數據分析平均濕度與溫度、氣壓因素的函數關系。具體分析方法與前面一致,分析結果如下:表8
39、平均濕度與溫度、氣壓的逐步回歸模型結果模型非標準化系數標準系數tSig.B標準 誤差試用版1(常量)84.455.837100.939.000溫度差-1.796.102-.419-17.605.0002(常量)448.22735.59412.593.000溫度差-1.768.099-.412-17.931.000平均氣壓-.358.035-.235-10.223.000從表8可以看出濕度與溫度、壓強的線性關系具有兩種模型:模型1: 式(6)模型2: 式(7)其中,代表平均濕度,代表溫度差,代表平均氣壓,這說明平均濕度與溫度差和平均氣壓相關。4.2.2.3 按月或季度的數據分析根據表5所示的數據
40、,很容易統計出每月或季度的數據,其中,每月(季)的發病率=每月(季)的發病總人數/該年的發病總人數,每月的氣象數據為該月的平均值或最大最小值,關于發病率與氣象環境關系的分析方法與前面所描述的過程基本一致。4.3 針對問題三的求解4.3.1 腦卒中高危人群的重要特征和關鍵指標4.3.1.1重要特征根據腦動脈狹窄和閉塞后,神經功能障礙的輕重和癥狀持續時間,分三種類型:(1)短暫性腦缺血發作頸內動脈缺血表現為,突然肢體運動和感覺障礙、失語,單眼短暫失明等,少有意識障礙。椎動脈缺血表現為,眩暈、耳鳴、聽力障礙、復視、步態不穩和吞咽困難等。癥狀持續時間短,可反復發作,甚至一天數次或數十次。可自行緩解,不
41、留后遺癥。腦內無明顯梗死灶。(2)可逆性缺血性神經功能障礙(RIND)與TIA基本相同,但神經功能障礙持續時間超過24小時,有的病人可達數天或數十天,最后逐漸完全恢復。腦部可有小的梗死灶,大部分為可逆性病變。(3)完全性卒中(CS)癥狀較TIA和RIND嚴重,不斷惡化,常有意識障礙。腦部出現明顯的梗死灶。神經功能障礙長期不能恢復,完全性卒中又可分為輕、中、重三型。4.3.1.2關鍵指標腦卒中關鍵指標主要有:職業為農民或工人,年齡在71-80歲之間,并患有基礎性疾病(高血壓、糖尿病等)。4.3.2 腦卒中的主要誘發因素腦卒中的主要誘發原因有:(1)具有不良生活方式高危人群的飲食結構不良,多鹽、油
42、膩;體力活動不足;愛吸煙飲酒。(2)患有基礎性疾病高血壓:患高血壓史在腦卒中住院病例中,有80%以上的病例有高血壓病史,其中腦梗塞82.66%,腦出血80.27%有高血壓史心梗、房顫心梗、房顫是引起腦中風的一個獨立的強有力的危險因素,與健康人相比,增加腦中風危險度5倍以上,尤其是老年人房顫相當多。糖尿病明顯增加缺血性腦中風發生率,單純糖尿病者,嚴格控制血糖可減少微血管病變,減緩動脈硬化,從而減少腦中風。(3)職業性質的影響;文化程度高的病人自我護理能力強,這可能由于文化程度高的病人,具有更好的學習理解能力,能更好地查閱書籍、報紙、文化程度高的病人更容易接受治療、康復計劃。(4)年齡階段因素中風
43、發生最常見的基本條件就是動脈硬化,隨著年齡的增長,生理變化和多種病理性因素相互作用使動脈硬化逐漸產生。(5)男女性別差異一是男性高血壓多于女性;二是男性吸煙與飲酒者多于女性;三是男性從事體力勞動較多,突然用力可能誘發中風。(6)季節性差異腦卒中病人因其機體代謝差,肢體功能活動障礙而活動減少,神經傳遞障礙使溫痛覺減弱或消失,患側血液循環較健側差,與季節氣溫相關。4.3.3 對高危人群的預警和干預建議(一)結合問題一:針對1:高危群眾發病有年集中趨勢,并逐年增長;建議1:(1)舒緩壓力:隨著社會經濟快速發展,社會各階層壓力過大,社會經濟的發展直接影響人們的心理狀態,這便是該病集中年患病的體現;文獻
44、報道【5】血管疾病的發生與生活事件密切相關,在緊張和過多應激環境中,應激反應可通過垂體引起交感神經興奮和腎上腺皮質激素增加,使血管強烈收縮血壓突然升高而致腦出血。所以減少疾病,應保持身心愉悅,舒緩壓力較為重要因素。 (2)合理飲食結構:飲食對身體,當今快節奏的快餐生活方式嚴重影響了我們的飲食結構,這也是疾病逐年增長的因素。為此建議平日應多攝入低鹽低脂類食物,減少油脂攝入,改善血脂異常,改掉不良飲食習慣,因為肥胖與超重均為缺血性中風的危險因素。針對2:男性比女性更易患病建議2:(1)戒煙:日常生活中男性一般要吸煙及大量酗酒,而尼古丁可刺激神經系統增快心率及脈率,血管收縮,血壓升高長期的血管收縮和
45、血液循環減慢,可使血中膽固醇、低密度脂蛋白沉積于動脈壁,導致動脈硬化【8】。(2)戒酒:酒精具有增壓作用,每日酒精攝入量超過78g的重度飲酒者的高血壓患病率是沒有飲酒的2倍,酒量與血壓水平呈明顯的劑量依賴關系。小量飲酒有保護作用,大量飲酒可增加危險性【10】。針對3:工作性質影響發病建議3:(1)學會適當休息:即文化程度高的病人自我護理能力強。這可能由于文化程度高的病人,具有更好的學習理解能力,能更好地查閱書籍、報紙、文化程度高的病人更容易接受治療、康復計劃。(2)增強自身學習能力。針對4:腦卒中處于老年階段;建議4:(1)每天運動30分鐘降低4成患病幾率:適當的運動會減少糖尿病【13】在于運
46、動能加速對攝入熱量的消耗,這樣可以將糖份積極轉化為有力量的肌肉。每天堅持30 分鐘的運動就可以降低患糖尿病的風險35%40%。(2)提高自我護理能力:腦卒中病人的自我護理能力受到年齡的影響,年齡增長帶給病人的是神經功能缺損程度的加重和致殘率增加,從而護理能力與年齡呈負相關【14】。(二)結合問題二:問題2針對氣溫、氣壓、相對濕度等氣候因素進行的干預建議;針對1:氣溫腦卒中病人因其機體代謝差,肢體功能活動障礙而活動減少,神經傳遞障礙使溫痛覺減弱或消失,患側血液循環較健側差,室溫要求高。建議1:(1)季節交替時期注意預防;(2)注意保暖防寒,早晚適量添衣,而在白天活動時不要穿戴太多,以防出汗多反而
47、受涼;(3)流感時期可佩掛防感冒香袋,預防感冒發病。針對2:氣壓;低氣壓使各種過敏原和空氣污染物、粉塵等刺激物不容易向高處擴散,而易于向低處散落吸入呼吸道,而且氣壓聚然降低可使支氣管粘膜上的細小血管擴張,氣管分泌物增加,支氣管管腔變得狹窄容易誘發哮喘。研究發現平均氣壓偏低(840907hpa)或偏高(926971hpa)時,呼吸系統疾病發病率高。建議2:(1)注意口腔,鼻的清理,保持呼吸通暢;(2)平時要加強體質鍛煉,多進行戶外活動;(3)注意營養均衡, 對食欲不振患兒要注意脾胃調理; (4)勤洗手,養成良好的衛生習慣【12】。針對3:相對濕度;濕度過高,蒸發減少,抑制出汗,使病人感到潮濕憋悶
48、。濕度過低,室內空氣干燥,人體水分蒸發增加,引起干渴、咽痛、鼻衄等癥狀,對呼吸及氣管切開者尤為不利。建議3:(1)當濕度低時多喝水補充人體水分;(2)保持室內空氣流通,每天至少通風半小時以上。五、 模型檢驗由于第一問和第三問都不涉及到模型檢驗,因此模型檢驗主要針對第二問。本文第二問的模型是多元線性回歸模型,所用的回歸方法是逐步自回歸法,該模型的檢驗方法為將用20072010年的發病數據按照式(5)進行回代檢驗,計算回代結果與原來統計的發病率千分比數據的絕對距離,在總共1461條數據中,絕對距離小于1的有1257條數據,所占比例為86%,表明該模型較為合理。六、 模型評價6.1 模型優點1、本文
49、模型比較注重數據的處理和存儲方式,以表格、圖形形式呈現,大大提高了查詢效率。2、論文給出了大量圖形,條分縷析,雖直觀易懂,但推理嚴謹,深入淺出,結果準確。模型可操作性強,推廣應用起來也很方便。6.2 模型缺點與改進1、在建模與編程過程中,使用的數據只是現實數據的一種近似,因而得出的結果可能與現實情況有一定的差距。 2、腦卒中的發病受多種因素綜合作用的影響,包括不可抗力事件,這些自然災害和社會重大事件均會對人民的身心乃至腦血管意外的發生產生影響。雖然樣本較大,但是時間不夠長,對揭示規律有其局限性,有待今后更進一步的觀察研究。3、數據不知地區等準確位置,無法得到更多較為精確的相關氣象,節氣等相關信
50、息。4、在前面的統計過程中都是在理想條件下進行的,實際上,還有人口遷移、經濟景氣變動、死亡率變動等因素對腦卒中的影響。模型還有諸多變量因素在內。考慮以上因素進行模型的建立。七、 模型改進及推廣7.1 問題二的多元統計分析模型改進本文僅僅做了多元線性回歸,但從以上分析過程可以看出,發病率與氣象環境因素的線性相關性并不特別明顯,需要對數據進行合理統計,找出發病率與環境因素的關系,該模型具有一定的局限性。模型改進可以從以下幾個方面改進:1、查閱資料考慮多元非線性回歸方法;2、氣象環境指標的進一步細化統計,如考慮溫度與濕度比、最高溫度與最低濕度一起統計等;3、針對多變量的選擇問題,可以考慮主成分分析法、因子分析、典型相關分析等方法1。7.2 推廣及應用本文中的多元統計分析模型可以推廣到任一有關某變量與其它多因素的相關關系,如冠心病、心臟病等疾病受環境、氣象因素的影響分析,更加貼近生活,為我們的日常生活服務。參考文獻1 于秀林,任雪松
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 僑聯黨建共建協議書
- 委托物流運輸合同協議書
- 車牌買賣合同協議書
- 鋅鋼管訂購合同協議
- 房產協議約定歸屬協議書
- 給錢和解協議書
- 欠款抵房子協議書
- 廣發證券合同協議書
- 淀粉膠采購合同協議
- 附加條件買賣協議書
- 2024版工程項目結算協議書范本
- 新時代勞動教育教程(高校勞動教育課程)全套教學課件
- 北京市某低溫熱水地板輻射采暖工程設計 畢業設計
- 懂設備原理會維護保養
- 英語中考專題復習-短文填空
- 機加工車間培訓計劃
- 城市社區青少年犯罪預防的社會工作
- St完整版本.-Mary's-醫院睡眠問卷
- 25第11課第三框《違約侵權要承擔民事責任》
- 青少年短跑項目訓練指導手冊
- 2023-2024學年四川省成都市武侯區四年級英語第二學期期中教學質量檢測模擬試題含答案
評論
0/150
提交評論