




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
天津大學2010屆本科生畢業設計(論文)PAGE1一.原始依據(包括設計或論文的工作基礎、研究條件、應用環境、工作目的等。)1.工作基礎:作者已經學習過《概率論基礎》和《數理統計》,因此具備了研究該課題的前提條件。此外,作者對R軟件操作及算法學習了解,作者還擁有查閱文獻的能力,也為該課題的研究提供了便利條件。2.研究條件:在數據模擬方面,作者應用統計軟件R;理論方面借鑒于圖書館豐富的館藏書籍與數據庫資源。以上研究條件現均已具備。3.應用環境:概率論與數理統計在企業管理等方面的應用越來越廣泛,在指導人們經濟決策等方面也發揮著重大作用。利用概率統計理論可以提高企業的經濟效益。在實際經營中。許多量之間存在某中密切聯系,根據數理統計原理,可以根據往年資料或市場信息,通過對社會經濟現象之間客觀存在的因果關系及其變化趨勢進行線性回歸分析預測,從而得出未來的數量狀況4.工作目的:本課題所涉及到的內容,雖然國內外已有一些機構和團隊在研究并取得了一定的成果,但是效果并不是特別理想,有待于進一步改進。本課題的研究有助于國內外相關技術研究,為此盡一份自己的薄力。二、參考文獻[1].AmanUllah,DavidEAGiles(1997).HandbookofAppliesStatistics,SouthernMethodistUniversity.MarcelDekker,Inc.pp.507-553.,D.FHendery(1993)Co-integration,Error-Correction,andtheEconometricAnalysisofNon-stationaryData.OxfordUniversityPressoxford.[3].P.heyman.M.J.Sobel(1990)HandbooksinOperationsResearchandManagementSciencrVol.2.ATOCHASTICMODELS.StateUniversityosNewYorkatStonyBrook[4]徐國祥.管理統計學[M].上海:上海財經大學出版社,1995:39-54.[5]財政部司.企業財務風險管理[M].北京:經濟科學出版社,2004:16-21.[6]茆詩松,程依明,濮曉龍.概率論與數理統計教程[M].北京:高等教育出版社,2004.三、設計(研究)內容和要求(包括設計或研究內容、主要指標與技術參數,并根據課題性質對學生提出具體要求。)企業產品完工之后,必須對產品進行質量檢驗,對產品數量較多的企業來說不可能逐件檢查,而采取概率論中的重復試驗用頻率逼近概率這一思想可對合格率情況進行有效的預測分析.另外。現代企業生產經常會或多或少地有風險性.因而通過各有關因素的未來狀況及其發生的概率來計算出各個方案的期望值,并將它作為評價優劣的標準來進行決策.建立回歸模型,根據預測對象與相關因素數據結構的變化特征,選擇合適的數學表達式,并確定模型的參數估計值,對回歸預測模型進行分析評價.通過定性判斷或統計方法對預測模型的適用性和精確度進行評價。主要指標及技術參數:理解參數回歸方法發展與區別;深入研究分參數估計理論,形成自己的觀點和看法;利用R軟件進行數據分析,使所得結果盡量反映現實水平。具體要求:1.基礎理論知識要牢固,對于參數估計方法進行透徹了解。2.要大量瀏覽相關內容的文獻,以現有的成果為基礎。3.理論推導要嚴謹,保證其正確性的前提下,努力實現創新與突破。4.培養獨立思考的習慣,鍛煉分析問題、解決問題的能力,開發創新潛力,掌握科技論文的寫作規范。指導教師(簽字)年月日(內容包括:課題的來源及意義,國內外發展狀況,本課題的研究目標、研究內容、研究方法、研究手段和進度安排,實驗方案的可行性分析和已具備的實驗條件以及主要參考文獻等。)課題的來源及意義隨著改革的不斷深化和商品經濟的大力發展,對經濟現象不僅要做質的論證,性的分析,還要注意對經濟和經濟管理進行量的研究.這對我們更好地掌握經濟政策和經濟政策分析、決策是十分重要的.近幾年來,我國的經濟學界和經濟部門越來越意識到用數學方法來解決經濟中問題的重要性,正在探索經濟問題應用數學的規律.實踐證明,數學是對經濟和經濟管理問題進行量的研究的有效工具,為經濟預測和決策提供了新的手段,有助于提高經濟管理水平和效益.概率論與數理統計在企業管理等方面的應用越來越廣泛,在指導人們經濟決策等方面也發揮著重大作用。充分利用概率統計理論可以提高企業的經濟效益。概率選擇在解決管理當中的不確定問題顯示出了重要作用,并滲透到現代管理領域的各個角落。現代管理包括計劃、組織、協調、控制與領導五大職能,而每一職能都有相應的概率選擇的應用范疇。通過在各領域中應用的典型實例,可以驗證概率選擇在現代管理應用中的作用與有效性在企業產品完工之后,必須對產品進行質量檢驗,對產品數量較多的企業來說不可能逐件檢查,而采取概率論中的重復試驗用頻率逼近概率這一思想可對合格率情況進行有效的預測分析.另外。現代企業生產經常會或多或少地有風險性.因而通過各有關因素的未來狀況及其發生的概率來計算出各個方案的期望值,并將它作為評價優劣的標準來進行決策本文將利用R軟件幫助我們解決問題,R軟件適用于概率統計分析,對數據進行現行回歸分析以及方差分析,構造模型,揭示問題的具體形式和規律性。幫助我們進行數據分析,解決實際問題,對結果分析,預測,評價。二.國內外發展狀況決策理論是1939年由統計學家瓦特作為假設檢驗和參數估計等經典的統計理論提出的。對于決策的制定包括四個步驟:找出指定決策的目標;找到可行方案;對諸多方案進行抉擇;對已選擇的方案進行評價。但是隨著信息公司和咨詢公司的出現,如果在決策時又進行某種試驗和調查得到了關于狀態的補充信息和附加信息,就可以對先驗概率加以修正而得到后驗概率。這種概率既概括了原先的知識和經驗,又吸收了當時試驗和調查的信息,可以更準確地決策,提高決策的期望收益,將概率論和數理統計應用于風險決策,使風險的分析與處理發生質的飛躍。三.課題研究目標通過對數據的分析觀察,利用軟件對數據進行觀測研究分析建立模型,對結果進行線性回歸分析,提出新的改進方法,提高企業管理效率。四.課題研究內容1.介紹常用方法,其中常用方法示例。,利用軟件對數據進行方差,期望分析。3.對結果進行評價五.課題研究方法第一步,理論介紹.對當前各種方法的理論進行介紹。第二步,理論分析.對預測對象的特征與預測對象有關的因素進行分析確定預測對象的主要影響因素,并研究起變化的預測現象的影響.第三步,收集數據.建立回歸模型,根據預測對象與相關因素數據結構的變化特征,選擇合適的數學表達式,并確定模型的參數估計值.第四步,對回歸預測模型進行分析評價.通過定性判斷或統計方法對預測模型的適用性和精確度進行評價.六.課題研究手段看書.看論文.上網查閱國內外相關領域資料,綜合分析現有優秀團隊學者所做工作優缺點,提出可行性的改進研究分析。通過軟件編寫程序進行數據分析,期望的結果分析研究,驗證其解決問題的有效性。七.可行性分析本文主要利用R軟件對數據進行線性回歸分析。國內外已有許多學者利用樹立同理只是對風險決策進行研究。從而對本文的的研究提供了理論上的支持。本人在大學期間應經學習了數理統計課程,并且可以熟練使用R軟件,加之前輩們的研究,為本課題的研究及完成提供了支持和保證。進度安排。2009年12月25日-2010年2與28日查閱相關資料2010年3月1日-2010年3月15日翻譯外文資料,課題報告的完成2010年3月16日-2010年4月20日理論分析和系統總體設計2010年4月21題-2010年5月13日系統實現2010年5月14日-2010年5月31日撰寫畢業論文2010年6月1日-2010年6月18日修改論文,畢業答辯九.具備實驗條件算法編寫所需軟件R軟件可查找的數據庫及網絡相關文獻資料主要參考文獻.Emst,M.,Paulus,M.P.NeurobiologyofDecisionMaking:aSelectiveReviewFromaNeurocognitiveandClinicalPerspective[J].BiologicalPsychiatry,2005,58(8):597–604.[3]梁之舜.概率論及數理統計(上)[M].北京:高等教育出版社,1983.83-98[4]陳萍.概率與統計方法在企業管理中的應用分析[J].商場現代化,2008(9).[5]趙恒峰.風險問關系的研究及其在風險原理中的應用.科技原理,1996.17(4)[6]李少斌.經濟管理中的教學方法[M].武漢工業大學出版社.1995.[7]魏宗舒.概率論與教理統計[M].高等教育出版社,1982.選題是否合適:是□否□課題能否實現:能□不能□指導教師(簽字)年月日選題是否合適:是□否□課題能否實現:能□不能□審題小組組長(簽字)年月日摘要人類在從事經濟、政治活動中面臨各種風險。國際貿易的全過程一般來說是比較復雜和漫長的,因此存在的風險也比較多,如信用風險、外匯風險、運輸風險、投標風險、制造風險、政治風險等。面對這些風險,決策者需要一種理論作為指導.數理統計是研究大量隨機現象統計規律性的的數學學科,數理統計就是研究如何以有效的方法,整理和分析受到隨機性影響的數據,以對所考察的問題作出判斷或者預測,直至為采取決策和行動提供依據和建議。本文介紹了風險決策理論的產生發展,以及數理統計在風險決策中的應用。基于1991年到1997年某保險公司保費收入數據,用回歸和方差分析方法,進行科學預測,從而進行最后決策。關鍵詞:數理統計;風險決策ABSTRACTHumanbeingsengagedineconomicandpoliticalactivitiesofvariousrisks.Thewholeprocessofinternationaltradeisgenerallymorecomplicatedandlengthy,sothere'smorerisk,suchascreditrisk,foreignexchangerisk,transportrisk,biddingrisks,manufacturingrisks,politicalrisks.Thefaceoftheserisks,policymakersneedatheoryasaguide.Statisticsisanabundanceofstatisticalregularityofrandomphenomenamathematics,statisticsisastudyofhoweffectivewaytocollateandanalyzethedatabytherandomeffectstostudyontheissueofjudgeorforecast,decisionsandactionstobetakentoprovideevidenceandrecommendations.Thisarticledescribestheemergenceofriskdecision-makingtheorydevelopment,andmathematicalstatisticsintheriskofDecision.Basedonainsurancepremiumincomedatain1991and1997data,usingregressionandvarianceanalysis,scientificprediction,andthusthefinaldecision.Keywords:Statistics;Riskdecision天津大學2010屆本科生畢業設計(論文)PAGE1目錄TOC\o"1-3"\h\u16471第一章文獻綜述 1271391.1研究背景及意義 1179141.2國內外發展狀況 1146091.21國外發展狀況 1217651.22國內發展狀況 2171341.3研究內容及目標 239931.4論文的組織結構 24948第二章數理統計及風險決策理論 310542.1風險的概念及特征 3210562.1.1決策的概念 323122.1.2決策的種類 3146152.13決策中的三個基本概念 3173782.1.4決策的原則 4189562.2數理統計常用理論模型 475822.2.1線性模型概念 491282.2.2線性回歸模型 5139472.2.3一元線性回歸分析 7229452.2.4方差分析模型 11158712.3貝葉斯方法 1117767第三章線性回歸分析方法的應用 16306773.1引言 1651313.2模型的建立及方法分析 16155073.3總結和結論 2017519第四章總結 2132176參考文獻 22外文資料中文譯文致謝第一章文獻綜述1.1研究背景及意義生活中到處都是目標沖突。人們的行為充滿了矛盾、不確定性和不一致性。我們經常會面對種種吸引人的選擇,作出后果無法預料的決定……所有的主管都曾面臨過這種進退兩難的境地:選擇集權式組織還是分散式組織,全球化還是本地化,大而全還是小而精,尋求代理商還是自己培養業務員,緩慢蛻變還是迅速變革,在國內還是國外生產,競爭還是合作,聯盟還是獨立但是,矛盾也讓人們的行為條件變得更優越,矛盾的本質就是自由。由于矛盾的存在,情況隨時會改變,達成目標可能會有多種路徑,有時候還會有互相競爭的目標可供選擇。在這種競爭環境中,管理階層知道,他們不能放棄任何一個選擇,必須每天尋找新的平衡,依據新的條件作出決定。這就是所謂的“決策”—放眼未知的未來,確定行動的方向。斯沃琪(Swatch)前CEO弗里茨·阿曼(FritzAmmann)曾說過:“管理階層作決策的時間,通常和決策內容的規模與重要性成反比。”決策并不是要你接受某事,而是有意識地使你傾向于某一方決策的前提就是不確定性。如果你相信自己,對自己的分析能力沒有任何懷疑,你也就不會懷疑自己的選擇。而后,你就會對行為的結果做一個大致的估算,并確定該如何實施。解決問題的過程對你來說也許易如反掌,但這并不是決策。只有當情況模糊不定、方向不明,而且你對所有的備選方案都充滿疑惑時,你所做的決定才叫決策。決策需要耗費精力,因為每一種方案看起來都很合理,你不是在對錯之間做出選擇,而是在“硬幣的正反面之間”做出選擇。做決策時,你肯定會受到來自決策相反方的阻力。那些想逃避阻力的人,我們稱之為“決策的弱者”。在很多企業里,人們總是設法逃避做決策,因為做出錯誤決策的后果,往往比不做決策的后果嚴重得多。數理統計方法在經濟領域中的一個重要方法就是抽樣調查,在經濟學中,早在20實際20至30年代,時間序列分析方法就曾經用于市場預測,現在一系列的統計方法,從回歸分析到隨即過程分析,都在經濟,質量管理,風險決策有了重大的應用,始終離不開數理統計方法的應用。近半個世紀以來。數理統計在風險決策中的應用有了較大發展,計算機的廣泛應用對數理統計的發展產生了重要影響,沒有現代電子計算機,就沒有現在統計學應用,許多重要統計方法應用都涉及大量的計算,通過計算機模擬,可以使某些復雜的精確分布得到有實用意義的解。1.2國內外發展狀況國外發展狀況近幾十年來,數理統計,風險決策理論在國內外得到了迅猛的發展,應用于在工農業生產。醫藥衛生與生物學方方面,自然科學,社會經濟管理等方面,尤其在風險決策方面發展迅猛。國外關于數理統計的技術研究以及應用的文章相對較多。研究了線性統計模型,Varshney對多元Bayes決策中的Minimax方法作出了深入的研究。約翰·馮·紐曼和奧斯卡·摩根斯坦提出預期效用理論在不確定情況下可能得到各種結果的效用的加權平均數,對風險決策進行評價。國外對數理統計風險決策的研究不僅僅限制在技術應用層面上,他們對于數理統計實際應用理論的完善也作出了重大貢獻。國內發展狀況國外關于數理統計分析的研究趨于成熟,而國內關于數理統計分析的研究總體相對偏少,且多停留在應用層面上,羅思江,吳立新利用方差分析行稻作栽培試驗安排和分析,將能揭示栽培措施與產量、質量、成本之間的關系,韓新煥,吳靜利用貝葉斯條件概率決策模型選擇最優策略做風險決策。徐凌宇,石綏祥利用Neyman-Pearson決策準則做海洋風暴潮預報。吳志安,張旭紅應用假設檢驗判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法檢測結構混凝土強度中的應用。研究內容及目標本論文介紹了數理統計及風險決策的主要體系及其內容,分析了數理統計理論應用到風險決策的主要方面。通過本部分的研究,筆者希望讀者能夠對數理統計理論在風險決策中的應用有個基本的認識,并對其整個理論體系有些初步的把握。數理統計理論在風險決策中有著重要的應用,工廠生產數量和市場需求有著十分顯著的影響。本文以取自某保險公司數據為基礎,用數理統計的方法作了細致的分析。雖然樣本量較少,但這種分析仍然有一些現實意義。1.4論文的組織結構第一章詳細討論了論文的研究背景及研究意義。論述了課題的來源和國內外發展現狀,闡述了論文的研究內容和研究目標,并對論文的組織結構予以討論。第二章重點分析了數理統計風險決策理論體系,介紹集中梳理數理統計應用方法,以及基于理論的若干模型。第三章是本文的實證部分,用數理統計的方法對來自某保險公司收入,對未來收入及賠款進行預測。第四章對整篇文章進行了總結。數理統計及風險決策理論風險的概念及特征決策的概念為了實現特定的目標,根據客觀的可能性,在占有一定信息和經驗的基礎上,借助一定的工具、技巧和方法,對影響未來目標實現的諸因素進行準確的計算和判斷選優后,對未來行動做出決定決策概念有狹義和廣義之分。狹義的決策概念專指決策者對行動方案的最終選擇,即通常所說的最終“拍板”。廣義的決策概念是把決策理解為決策者制訂、選擇、實施行動方案的整個過程。根據決策人所掌握的信息的程度不同,決策問題可以分為三類:(1)確定性決策:有一個備擇方案時即為確定性決策;(2)風險決策:未來各種狀態出現的可能性大小可以用概率表示出來;(3)不確定決策:不知道客觀狀態出現的概率的條件下進行決策。風險決策屬于不確定性決策范疇。經濟學研究中引用概率概念把風險決策定義為:風險決策是概率己知的不確定性決策。決策的種類從不同的角度分類有:按決策問題所處的條件分為確定性決策、不確定型決策和對抗型決策;按問題的性質分為程序化決策和非程序化決策;按決策涉及的范圍分為總體決策和局部決策;按決策過程是否運用數學模型來輔助決策分為定性決策和定量決策;按決策目標的數量分為單目標決策和多目標決策;按決策的整體構成分為單階段決策和多階段決策。決策中的三個基本概念決策函數概念:對于一個推斷問題的回答,即作出一個判斷,與取得的樣本有關,所謂判決函數就是指一個樣本空間上,取值于判決空間的函數。若選定了判決函數,得到的樣本為則所采取的判決就是損失函數概念:對于每個統計推斷問題,總存在存在不同的判決,因此需要評價判決的好壞,并選擇一個依賴于參數和判決的函數,他表示當參數真值,而采取的判決為損失函數,他是定義在上的非負函數,稱為損失函數。風險函數概念:由于判決依賴于,因此對判決函數,相應的損失函數是一個隨機變量,我們不能根據某個樣本觀測值所采取的判決的損失來衡量的好壞平均損失是一個合理的度量,記稱為風險函數。決策的目標是要找出一個決策方案,使其對各個自然狀態風險值均為最小。應用中,常常對確定一個概率分布,并使其平均的風險值達到最小,其中:決策的原則決策的公理概念:決策的公理是所有理智健全的決策者都能接受或承認的基本原理,是許許多多決策者長期決策實踐經驗的總結決策的原則做出正確的決策應遵循的三條原則可行性原則;經濟性原則;合理性原則。數理統計常用理論模型線性模型概念變量關系有兩種基本類型:一種只要知道自變量取值所取的值,因變量y取值唯一確定,這種變量之間的確定性關系稱之為函數關系。另一種是因變量y的取值與自變量的取之有關,這種變量間關系稱之為相關關系。由于影響因變量y的因素很多,且由于認識水平有限即客觀條件限制,人們只能考慮其中一部分的。其他未被控制考慮的因素,由于未被控制,不可避免對因變量y產生隨即影響,因此應當是一個隨機變量。其分布由自變量的取值及隨機誤差所確定。假設一邊兩與個自變量之間存在簡單線性關系其中為一個隨機變量。進一步假設對自變量的n組不同取值,得到因變量的n次觀測,則通過上式有關系式成立或寫成矩陣形式為其中這里表示隨機誤差向量,滿足,稱模型為線性模型記作這里Y表示變量y的n次觀測量組成的列向量,稱為觀測向量。X是k個自變量在n次觀測中的取值,對于不同類型的線性模型,的取值有不同的特征,但都是可以控制的。當取值可以任意選定時,我們總是希望找到某種更好的選擇。使由之產生的模型在進行統計推斷的時候可能得到更好的較好的結果,這是實驗設計問題,還假定n次觀測量相互獨立,具有公共方差,此時,這里可以是未知參數。他也是模型中的位置參數,成為誤差方差。對的不同取值,可得到不同的線性模型,當他們是表示隨機離散或者連續隨機變量的一組取值時,模型是線性回歸模型。若只取0,1兩值,則為方差分析模型。線性回歸模型當變量間存在相關關系時,我們特別關心因變量y的取值的平均,即在給定的條件下,隨機變量y的數學期望,記作此時,因變量y與自變量之間的相關關系可以表示為這里忍讓表示為隨機誤差上式成為y關于的回歸。因此我們可以把隨機變量的取值分解為兩部分,一部分是y對自變量取值的依賴關系,它反映了y取值的平均趨勢,這是相關關系的主要部分。另一部分是隨機誤差的大小,加入不能限制回歸函數的類型,企圖從的任意函數中找到一個能反映y的數學模型的變化規律是困難的。因此從被研究問題的物理方面,技術方面等來確定回歸函數的類型。回歸函數可以實現性的,也可以是非線性的。但是對于線性回歸中回歸函數是參數的線性回歸。是最簡單且最重要的情況。在理論上有比較深入的討論和一般的結果。也是非線性回歸的基礎。因此我們只考慮稱為理論線性回歸模型。由隨機誤差在線性模型中的地位可見,他的概率性質決定了模型的性質。根據回歸函數的意義,自然有。關于變量的n次觀測,我們假定各次觀測所受的隨機影響程度相同。且任意兩次觀測的誤差不相關。這種假定在一般情況下是合理的。稱之為Gauss-Markov條件這里如那樣的隨機誤差向量且,為了不引進更多符號。以后有時候表示一個隨機變量,有時候表示為一個隨機向量。由模型的意義,這樣我們可以得到線性回歸模型,稱之為常數項。稱為回歸函數,表示自變量的改變時對y的影響大小。在某些問題當中,我們還假設滿足正態條件其中,也是線性回歸模型中的重要參數。為n階單位陣。為了對未知參數進行估計或者研究其他有關的統計推斷問題,需進行試驗,設做了n次試驗。第i次試驗的觀測值為,稱為第i個試驗點。以后我們假定試驗總數n不小于線性回歸模型包含的未知參數個數,且設計矩陣X是列滿秩的,即一元線性回歸分析一元線性回歸模型設隨機變量與普通變量間存在相關關系,且假設對于的每一個取值有其中都不是不依賴于的未知參數。記則對做這樣的正態假設,相當于假設其中未知參數都是不依賴于稱為一元線性回歸模型,其中稱為回歸系數。因變量兩部分組成,一部分是的線性函數另一部分是隨機誤差,是人不可控制的。下面的任務是對的估計、參數的最小二乘估計取的個不全相同的取值,作次獨立試驗,得到樣本和樣本觀測值把樣本觀測值代入得,而使到最小為原則對未知參數和的估計稱為未知參數和的最小二乘估計,估計值記為和這時候稱為關于的經驗回歸方程,簡稱回歸方程。其圖象稱為回歸直線下面求未知參數的最小二乘估計極值點有得方程組解方程組得唯一解中的和為未知參數的最小二乘估計量回歸方程也可寫成這表明,關于樣本值的回歸直線通過散點圖的幾何中心。為了計算上的方便,我們引入記號這樣,的估計值可寫成的估計由于記稱為處的殘差。平方和稱為殘差平方和。為了計算,將做如下分解再由得的另一個分解式相應的統計量為可以證明于是即這樣就得到了的無偏估計量線性假設的顯著性檢驗在以上的討論中,我們假定關于的回歸函數具有形式在處理實際問題時,是否為的線性函數,首先要根據有關專業知識和實踐來判斷,其次就要根據實際觀察得到的數據運用假設檢驗的方法來判斷。這就是說,求得的線性回歸方程是否具有實用價值,一般來說,需要經過假設檢驗才能確定。若線性假設符合實際,則不應為零,因為若則就不依賴于了。因此,我們需要檢驗假設用檢驗法來進行檢驗,可以證明由和得到與相互獨立,故有即且即得的拒絕域為此處為顯著性水平。當假設被拒絕時,認為回歸效果是顯著的,反之,就認為回歸效果不顯著。回歸效果不顯著的原因可能有如下幾種:(1)影響的取值,除了及隨機誤差外還有其它不可忽略的因素;(2)不是的線性函數,而是其它形式的函數;(3)與不存在關系。2.2.4方差分析模型方差分析作為分析數據的一種重要工具,是數理統計的基本方法。同回歸分析一樣,方差分析也是研究一些因子與某個指標的相關關系,研究哪些因子對指標是顯著的,哪些因子對指標的影響不顯著,但他們是也有不同,首先,在回歸分析中,自變量一般是取連續值的數量因子,而方差分析中的自變量,有時是一種屬性因子,其次,回歸分析的目的在于找出自變量與因變量之間關系的數學表達式,一般需要做相當多次試驗,但如果只是為了弄清自變量對因變量的影響是否顯著,則可以按照預定的計劃,只作少數的試驗,就可以用方差分析的方法做出判斷,另外,回歸分析的設計矩陣,一般如所要求,是列滿秩的,但在方差分析中,設計矩陣中的元素只是表示某一效應在某次試驗中的有無,通常只取0,1兩個值,設計矩陣常常是降秩的,因而對實驗的設計有一定的要求,從某種意義來說,方差分析中的問題比回歸分析復雜些,只是選擇適當的設計矩陣,才能順利的計算,分析,解釋方差分析所考慮的問題。貝葉斯方法雖然在一批被估產品而言,不合格產品率是一個未知常數,但是如果這種產品已經生產了很多批,各批不合格率自然不盡相同,所以從長遠看可以吧作為一個隨機變量,需要估計的這批產品不合格率,相當于隨機變量的一個抽樣值,根據過去的經驗,對已有了認識,能夠用數學形式表示為服從上的一個概率分布,這是在對這批產品進行抽樣觀測以前就已得到的分布,稱為先驗分布,樣本的分布,則是隨機變量取值時的條件分布。判決函數的風險函數,應看成,是的函數,仍為隨機變量。所以關于平均。稱為判決函數在先驗分布下的貝葉斯風險。如果和都有連續性分布,則可寫為其中是和聯合密度函數。當和均為離散型分布時有如果判決函數對任意的有則稱是最優的。這個準則叫做貝葉斯準則。如果所考慮的判斷問題是求的點估計,則稱滿足條件條件的判決函數為的貝葉斯估計。這里需指出,貝葉斯估計依賴于先驗分布的對于不同的,的貝葉斯估計可以是不同的由貝葉斯公式有因此其中是的邊緣分布密度,是給定時的條件分布密度稱為的后驗分布由可知后驗分布綜合了先驗信息與樣本中關于的信息。是先驗認識在得到樣本后的一個變化。給予后驗分布的有關的統計推斷將會得到不同程度的改進。由可以得到如果記它表示在給定樣本條件下,采取判決造成的平均損失,稱為在給定樣本時,判決函數的后驗風險,類似地,對離散型情況,后驗風險為所以的貝葉斯估計依賴于總體分布組先驗分布和損失函數,對此我們無法給出一般結果,但取平方損失函數,則是有以下定理:在平方損失函數下的貝葉斯估計就是后驗分布的均值,即考慮參數假設問題當損失函數取為式判決函數的風險函數為特別當原假設,備抉擇都是簡單假設檢驗時,風險函數為當簡單假設檢驗問題,參數空間僅包含兩個點所以先驗分布是一個簡單的兩點分布,記為。當損失函數取值為一個檢驗函數的貝葉斯風險為所謂貝葉斯檢驗就是貝葉斯風險達到最小檢驗函數,它一定是似然比檢驗。對簡單假設檢驗問題,如果取損失函數那么在先驗分布下的貝葉斯檢驗為似然比檢驗如果所考慮的問題是參數的區間估計問題,則相應的貝葉斯解和Minimax解分別被稱為貝葉斯區間估計和Minimax區間估計,在經典的區間估計理論中,參數是一個通常的未知常數,沒有任何隨機性,因此區間包含的概率為這句話的意思是指隨機區間內的概率為而不是指作為一個隨機變量落在區間內的概率為,但是貝葉斯學派也把看成具有一定分布的隨機變量,任然采用的記號,把表示在得到樣本觀測值后的后驗分布那么使得成立的稱為在先驗分布下的水平為的貝葉斯置信下界,雖然在形式上,與經典的置信下界相似,但水平的意義不同。第三章線性回歸分析方法的應用引言本章是該論文的實證分析部分,舉例說明,主要是利用數理統計的中的回歸方法研究1991到1997年的某保險公司數據。本章首先建立模型并對研究方法進行比較分析,然后對于該組數據進行描述分析,利用R軟件計算數理統計數據的結果并得到結論。模型的建立及方法分析回歸回歸分析是研究變量與變量之間的依賴關系的方法,它試圖通過統計資料,來判斷某些變量之間是否存在相關關系,相關的密切程度,或近似地確定它們之間的數量關系。計算機在保險領域的應用,使得回歸分析應用子保險經營不再是一項復雜工程。回歸模型的建立,可用于保險經濟預測,預測業務的發展趨勢,它改變了過去那種全憑經驗進行估計的傳統預測方法,提高了預測的準確性,避免了由純定性分析造成的水份大、數據不準等弊病,還可以提高期望值的準確性,如賠款的預測可以幫助確定給付準備金提存的數量例1預測保費收入年度1991199219931994199519961997保費收入100165185262318400445現在預測該公司19971998年保費收入通過作散點圖看出,可以用一元線性回歸預測。為了計算方便起見,可設那么1997年和1998年為由于于是可代入公式得參數所得的樣本回歸線為由此回歸線17791998年的保費收入的預測值可計算如下(萬元)(萬元)至于決定系數也易計算出說明樣本回歸線對實際保費收入的變差的解釋能力為98.78%,即保費收入與時間變量之間存在十分近似線性的關系。當然,由于存在隨機干擾因素,預測不可能絕對準確,因此,有必要求出實際值的置信區間。查分布表可知所以的實際值將以95%的置信度落在的范圍內即在452.96(萬元)至550.76(萬元)R軟件運行程序為x<-c(-3,-2,-1,0,1,2,3)y<-c(104,162,188,264,320,400,442)plot(x,y)syy<-var(y)*6x1<-x-mean(x)y1<-y-mean(y)sxx<-var(x)*6b1<-sxy/sxx;b0<-mean(y)-b1*mean(x)########決定系數r2<-sxy^2/(sxx*syy)####sigma'sestimatorsig2<-(syy-b1*sxy)/(7-2)b1b0r2sig例2某保險公司各年的保費收入及賠款支出年度1991199219931994199519961997保費收入11826236051277511851890保費支出4881151984單位萬元若預計年的保費收入為2000萬元,試預測年賠款支出為多少?對于賠款的預測,可采用兩種方式(1)是認為賠款是隨年度變化的。(2)是賠款是隨保費收入變化的。下面我們將分別以上述兩種方式來預測賠款,然后再分析哪種方式合理些。利用時間預測賠款設相應的賠款為根據R軟件做出散點圖所以不難計算出和的估計值所以樣本回歸線為于是我們就可以算出1998年的賠款預測值(萬元)樣本決定系數利用保費收入預測賠款設保費收入變量賠款變量代入公式計算估計參數和所以樣本回歸線為總結和結論上面,以兩種不同方式預測了1998年的賠款支出,結果相差不多,若考慮到置信區間,我們便會發現這兩種方式對本例都是可行的。但不難知道,賠款支出與保費收入之間必然存在密切關系,雖然賠款支出也可能受到年度變化的影響,但應該說保費收入是影響賠款支出更直接的因素。而從計算看,按時間預測所求出的樣本決定系數大于按保費收人預測的樣本決定系數我們一般應按保費收入來預測賠款支出。之所以按時間預測也得出了相當好的結果,那是由于保費收入與賠款支出都有隨年度增長的趨勢。如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年護士執業資格考試題及答案
- 內蒙古自治區烏蘭察布市集寧區第二中學2024-2025學年高一下學期4月月考 數學試題(含解析)
- 本溪初二語文考試題目及答案
- 招生直播測試題及答案
- 網絡管理軟件應用分析試題及答案
- 計算機三級軟件測試在公共政策評估中的作用試題及答案
- 軟考網絡工程師常見考題預測試題及答案
- 西方政治考試的難點與突破口試題及答案
- 如何規劃信息系統項目管理師的復習時間試題及答案
- 公共政策在生態保護中的重要性試題及答案
- 2025年生態環境保護知識測試題及答案
- 道路監控系統培訓課件
- 2025年湖北省新高考信息卷(三)物理試題及答題
- 2025-2030年力控玩具項目投資價值分析報告
- 基于學校區域文化優勢背景下的小學水墨畫教學研究
- 設備欠款協議書范本
- 機柜租賃合同協議
- 2025年2月22日四川省公務員面試真題及答案解析(行政執法崗)
- 造價項目時效管理制度
- 腹腔鏡手術術后腹脹護理
- 泥水平衡-沉井-頂管及沉井施工方案
評論
0/150
提交評論