




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一、記錄學原理期末考試試題類型及結構1、單項選擇題:30分。考核對基本概念的理解和計算方法的應用。2、判斷題:10分。考核對基本理論、基本概念的記憶和理解。3、簡答題:30分。考核對基本概念、基本理論、基本方法的理解和掌握情況。4、計算題:30分。考核對基本計算方法的理解、掌握限度及綜合應用能力。二、期末考試形式及答題時限期末考試形式為閉卷筆試;答題時限為90分鐘;可以攜帶計算器。三、各章復習內容期末復習資料:教材、學習指導書習題、作業第一章記錄總論理解記錄學的含義答:收集、解決、分析、解釋數據并從數據中得出結論的科學(收集數據:取得數據;解決數據:整理與圖表展示;分析數據:運用記錄方法分析數據;數據解釋:結果的說明;得到結論:從數據分析中得出客觀結論)第二章數據的搜集數據的來源答:(1)數據的間接來源:系統外部的數據(記錄部門和政府部門公布的有關資料,如各類記錄年鑒、各類經濟信息中心、信息征詢機構、專業調查機構等提供的數據、各類專業期刊、報紙、書籍所提供的資料、各種會議,如博覽會、展銷會、交易會及專業性、學術性研討會上交流的有關資料、從互聯網或圖書館查閱到的相關資料)系統內部的數據(業務資料,如與業務經營活動有關的各種單據,記錄、經營活動過程中的各種記錄報表、各種財務,會計核算和分析資料等)(2)數據的直接來源(原始數據)調查數據實驗數據收集數據的基本方法:調查的數據(自填式、面訪式、電話式);實驗的數據抽樣誤差:由于抽樣的隨機性所帶來的誤差;所有樣本也許的結果與總體真值之間的平均性差異;影響抽樣誤差的大小的因素(樣本量的大小、總體的變異性)重點:數據來源、數據搜集方法、抽樣誤差數據的圖表展示重點:熟悉條形圖、直方圖、餅圖、環形圖、箱線圖、線圖等1.對分類數據和順序數據重要是作分類整理;對數值型數據則重要是作分組整理2.適合于低層次數據的整理和顯示方法也適合于高層次的數據;但適合于高層次數據的整理和顯示方法并不適合于低層次的數據3.分類數據的圖示—條形圖:用寬度相同的條形的高度或長短來表達各類別數據的圖形;有單式條形圖、復式條形圖等形式;重要用于反映分類數據的頻數分布,繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖4.分類數據的圖示—帕累托圖:按各類別數據出現的頻數多少排序后繪制的柱形圖;重要用于展示分類數據的分布5.分類數據的圖示—餅圖:也稱圓形圖,是用圓形及圓內扇形的角度來表達數值大小的圖形;重要用于表達樣本或總體中各組成部分所占的比例,用于研究結構性問題;繪制圓形圖時,樣本或總體中各部分所占的比例用圓內的各個扇形角度表達,這些扇形的中心角度,按各部分數據比例乘以360度擬定。6.環形圖:中間有一個“空洞”,樣本或總體中的每一部分數據用環中的一段表達;與餅圖類似,但又有區別(餅圖只能顯示一個總體各部分所占的比例;環形圖則可以同時繪制多個樣本或總體的數據系列,每一個樣本或總體的數據系列為一個環);用于結構比較研究;用于展示分類和順序數據7.數值型數據A組距分組:將變量值的一個區間作為一組;適合于連續變量;適合于變量值較多的情況;需要遵循“不重不漏”的原則;可采用等距分組,也可采用不等距分組B直方圖:用于展示分組數據分布的一種圖形;用矩形的寬度和高度來表達頻數分布(本質上是用矩形的面積來表達頻數分布);在直角坐標中,用橫軸表達數據分組,縱軸表達頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖。C直方圖與條形圖的區別:條形圖是用條形的長度(橫置時)表達各類別頻數的多少,其寬度(表達類別)則是固定的;直方圖是用面積表達各組頻數的多少,矩形的高度表達每一組的頻數或比例,寬度則表達各組的組距,其高度與寬度均故意義;直方圖的各矩形通常是連續排列,條形圖則是分開排列;條形圖重要用于展示分類數據,直方圖則重要用于展示數值型數據。D未分組數據—莖葉圖:用于顯示未分組的原始數據的分布;由“莖”和“葉”兩部分構成,其圖形是由數字組成的;以該組數據的高位數值作樹莖,低位數字作樹葉;樹葉上只保存最后一位數字;莖葉圖類似于橫置的直方圖,但又有區別(直方圖可觀測一組數據的分布狀況,但沒有給出具體的數值、莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,保存了原始數據的信息、直方圖合用于大批量數據,莖葉圖合用于小批量數據)E未分組數據—箱線圖:用于顯示未分組的原始數據的分布;由一組數據的5個特性值繪制而成,它由一個箱子和兩條線段組成;繪制方法(一方面找出一組數據的5個特性值,即最大值、最小值、中位數Me和兩個四分位數(下四分位數QL和上四分位數QU)連接兩個四分位數畫出箱子,再將兩個極值點與箱子相連接)F時間序列數據—線圖:表達時間序列數據趨勢的圖形;時間一般繪在橫軸,數據繪在縱軸;圖形的長寬比例大體為10:7第四章數據的概括性度量(計算章節)重點:眾數、中位數、分位數、平均數、方差(計算);自由度、偏態、峰態等1.離中趨勢:數據分布的另一個重要特性;反映各變量值遠離其中心值的限度(離散限度);從另一個側面說明了集中趨勢測度值的代表限度;不同類型的數據有不同的離散限度測度值。
2.自由度:自由度是指數據個數與附加給獨立的觀測值的約束或限制的個數之差;從字面涵義來看,自由度是指一組數據中可以自由取值的個數;當樣本數據的個數為n時,若樣本平均數擬定后,則附加給n個觀測值的約束個數就是1個,因此只有n-1個數據可以自由取值,其中必有一個數據不能自由取值;按著這一邏輯,假如對n個觀測值附加的約束個數為k個,自由度則為n-k3.偏態:記錄學家Pearson于1895年初次提出;數據分布偏斜限度的測度;偏態系數=0為對稱分布、偏態系數>0為右偏分布、偏態系數<0為左偏分布、偏態系數大于1或小于-1,被稱為高度偏態分布;偏態系數在0.5~1或-1~-0.5之間,被認為是中檔偏態分布;偏態系數越接近0,偏斜限度就越低。4.峰態:記錄學家Pearson于192023初次提出;數據分布扁平限度的測度;峰態系數=0扁平峰度適中、峰態系數<0為扁平分布、峰態系數>0為尖峰分布。第五章概率與概率分布重點:概率的性質、概率的加法法則、條件概率與獨立事件、盼望、方差、正態分布加法公式P(A∪B)=P(A)+P(B)-P(A∩B)乘積公式:P(AB)=P(B)P(A|B),或P(AB)=P(A)P(B|A)獨立公式:P(AB)=P(A)·P(B)(1)概率的性質非負性對任意事件A,有0P(A)1規范性必然事件的概率為1;不也許事件的概率為0。即P()=1;P()=0可加性若A與B互斥,則P(A∪B)=P(A)+P(B)推廣到多個兩兩互斥事件A1,A2,…,An,有P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)(2)條件概率:在事件B已經發生的條件下,求事件A發生的概率,稱這種概率為事件B發生條件下事件A發生的條件概率,記為P(A|B)=P(AB)P(B)事件的獨立性:一個事件的發生與否并不影響另一個事件發生的概率,則稱兩個事件獨立;若事件A與B獨立,則P(B|A)=P(B),P(A|B)=P(A);此時概率的乘法公式可簡化為P(AB)=P(A)·P(B)推廣到n個獨立事件,有P(A1A2…An)=P(A1)P(A2)…P(An)離散型隨機變量的數學盼望:在離散型隨機變量X的一切也許取值的完備組中,各也許取值xi與其取相相應的概率pi乘積之和;描述離散型隨機變量取值的集中限度;計算公式為離散型隨機變量的方差:隨機變量X的每一個取值與盼望值的離差平方和的數學盼望,記為D(X);描述離散型隨機變量取值的分散限度;計算公式為正態分布函數的性質:概率密度函數在x的上方,即f(x)>0;正態曲線的最高點在均值,它也是分布的中位數和眾數;正態分布是一個分布族,每一特定正態分布通過均值和標準差來區分。決定了圖形的中心位置,決定曲線的平緩限度,即寬度;曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相交;正態曲線下的總面積等于1;隨機變量的概率由曲線下的面積給出(描述連續型隨機變量的最重要的分布)第六章記錄量及其抽樣分布重點:?記錄量,c2分布,t分布,F分布記錄量:設X1,X2,…,Xn是從總體X中抽取的容量為n的一個樣本,假如由此樣本構造一個函數T(X1,X2,…,Xn),不依賴于任何未知參數,則稱函數T(X1,X2,…,Xn)是一個記錄量(樣本均值、樣本比例、樣本方差等都是記錄量)記錄量是樣本的一個函數;記錄量是記錄推斷的基礎2分布:由阿貝(Abbe)于1863年一方面給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和192023推導出來;分布的變量值始終為正;分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱;盼望為:E(2)=n,方差為:D(2)=2n(n為自由度)t分布:高塞特(W.S.Gosset)于192023在一篇以“Student”(學生)為筆名的論文中初次提出;t分布是類似正態分布的一種對稱分布,它通常要比正態分布平坦和分散;一個特定的分布依賴于稱之為自由度的參數。隨著自由度的增大,分布也逐漸趨于正態分布。F分布:由記錄學家費希爾(R.A.Fisher)提出的,以其姓氏的第一個字母來命名。中心極限定理:從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當n充足大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態分布。?第七章參數估計重點:置信區間置信水平:將構造置信區間的環節反復很多次,置信區間包含總體參數真值的次數所占的比例稱為置信水平;表達為(1-a)%(a為是總體參數未在區間內的比例)常用的置信水平值有99%,95%,90%(相應的a為0.01,0.05,0.10)置信區間:由樣本記錄量所構造的總體參數的估計區間稱為置信區間;記錄學家在某種限度上確信這個區間會包含真正的總體參數,所以給它取名為置信區間;用一個具體的樣本所構造的區間是一個特定的區間,我們無法知道這個樣本所產生的區間是否包含總體參數的真值我們只能是希望這個區間是大量包含總體參數真值的區間中的一個,但它也也許是少數幾個不包含參數真值的區間中的一個;總體參數以一定的概率落在這一區間的表述是錯誤的常用置信水平Za/2值置信水平Aa/2Za/290%0.10.051.64595%0.050.0251.9699%0.010.0052.58第八章假設檢查重點:原假設、備擇假設、假設檢查的流程、均值檢查等原假設:待檢查的假設,又稱“0假設”;研究者想收集證據予以反對的假設;總是有等號=,£或3表達為H0(H0:m=某一數值;指定為=號,即£或3;例如,H0:m=3190(克))備擇假設:與原假設對立的假設,也稱“研究假設”;研究者想收集證據予以支持的假設總是有不等號:1,<或>表達為H1H1:m<某一數值,或m>某一數值例如,H1:m<3910(克),或m>3910(克)。假設檢查中的兩類錯誤:1.?第一類錯誤(棄真錯誤)原假設為真時拒絕原假設;會產生一系列后果;第一類錯誤的概率為a;被稱為顯著性水平2.?第二類錯誤(取偽錯誤);原假設為假時接受原假設;第二類錯誤的概率為b(Beta)假設檢查的流程:提出假設、擬定適當的檢查記錄量、規定顯著性水平、計算檢查記錄量的值、做出記錄決策。顯著性水平a:1.是一個概率值;原假設為真時,拒絕原假設的概率;被稱為抽樣分布的拒絕域;表達為a(alpha);常用的a值有0.01,0.05,0.10;由研究者事先擬定總體均值的檢查:(選擇題:已知-Z記錄量;未知-T記錄量)第九章分類數據分析重點:列聯表、相關系數列聯表:由兩個以上的變量交叉分類的頻數分布表;行變量的類別用r表達,ri表達第i個類別;列變量的類別用c表達,cj表達第j個類別;每種組合的觀測頻數用fij表達;表中列出了行變量和列變量的所有也許的組合,所以稱為列聯表;一個r行c列的列聯表稱為rc列聯表列聯表中的相關測量:品質相關-對品質數據(分類和順序數據)之間相關限度的測度;列聯表相關測量的記錄量重要有(相關系數、列聯相關系數、V相關系數)相關系數:測度22列聯表中數據相關限度;對于22列聯表,系數的值在0~1之間列聯相關系數:C的取值范圍是0C<1;C=0表白列聯表中的兩個變量獨立;C的數值大小取決于列聯表的行數和列數,并隨行數和列數的增大而增大;根據不同行和列的列聯表計算的列聯系數不便于比較V相關系數:V的取值范圍是0V1;V=0表白列聯表中的兩個變量獨立;V=1表白列聯表中的兩個變量完全相關;不同行和列的列聯表計算的列聯系數不便于比較;當列聯表中有一維為2,min[(r-1),(c-1)]=1,此時V=關于小單元頻數有兩條準則:假如只有兩個單元,每個單元的盼望頻數必須大于或等于5;倘若有兩個以上的單元,假如百分之二十的單元盼望頻數小于5,則不能用2檢查。第10章方差分析重點:單因素方差分析表(基本結構)(說出每一環節的意思)單因素方差分析分析環節提出假設:一般提法(H0:m1=m2=…=mk自變量對因變量沒有顯著影響;H1:m1,m2,…,mk不全相等自變量對因變量有顯著影響注意:拒絕原假設,只表白至少有兩個總體的均值不相等,并不意味著所有的均值都不相等)構造檢查的記錄量:計算各樣本的均值、計算所有觀測值的總均值、計算各誤差平方和(總平方和SST、組間平方和SSA、組內平方和SSESST=SSA+SSE)、計算記錄量(MSA=SSA/k-1MSE=SSE/n-kF=MSA/MSE~F)記錄決策:假如原假設成立,則表白沒有系統誤差,組間方差MSA與組內方差MSE的比值差異就不會太大。若F>Fa則拒絕原假設HO結論:表白有顯著差異第11章一元線性回歸重點:相關系數、回歸方程相關系數:度量變量之間關系強度的一個記錄量;對兩個變量之間線性相關強度的度量稱為簡樸相關系數;若相關系數是根據總體所有數據計算的,稱為總體相關系數,記為;若是根據樣本數據計算的,則稱為樣本相關系數,簡稱為相關系數,記為r相關系數的性質:r的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負正相關r=0,不存在線性相關關系-1r<0,為負相關0<r1,為正相關|r|越趨于1表達關系越強;|r|越趨于0表達關系越弱回歸方程:描述y的平均值或盼望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下E(y)=0+1x方程的圖示是一條直線,也稱為直線回歸方程0是回歸直線在y軸上的截距,是當x=0時y的盼望值1是直線的斜率,稱為回歸系數,表達當x每變動一個單位時,y的平均變動值第12章多元線性回歸重點:多重共線性、回歸方程多重共線性:回歸模型中兩個或兩個以上的自變量彼此相關;多重共線性帶來的問題有:也許會使回歸的結果導致混亂,甚至會把分析引入歧途;也許對參數估計值的正負號產生影響,特別是各回歸系數的正負號有也許同預期的正負號相反多重共線性情況:模型中各對自變量之間顯著相關;當模型的線性關系(F檢查)顯著時,幾乎所有回歸系數的t檢查卻不顯著;回歸系數的正負號與預期的相反第13章時間序
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編版語文一年級下冊課程調整計劃
- 2025年山東省決勝新物理高二下期末復習檢測試題含解析
- 2025屆湖南省道縣第二中學物理高一第二學期期末達標測試試題含解析
- 江西省贛州市于都二中2025屆高一物理第二學期期末學業質量監測試題含解析
- 高校心理健康支持系統計劃
- 2025年六年級信息技術閩教版教學方案計劃
- 小學體育單元比賽計劃
- 四川省成都市溫江區2024年八上數學期末質量跟蹤監視試題含解析
- 廣東省廣州三中學2024-2025學年九上化學期末教學質量檢測模擬試題含解析
- 達州市重點中學2024-2025學年化學九年級第一學期期末學業質量監測模擬試題含解析
- (高清版)DG∕TJ 08-507-2018 高強混凝土抗壓強度無損檢測技術標準
- 2024年鐵嶺市三支一扶考試真題
- 2024版機電工程施工質量標準化數字模型圖集
- 電力行業安全隱患案例警示教育心得體會
- 廣東省2025年中考英語模擬試卷試題及答案詳解
- 2023年3月26日安徽省中小學新任教師公開招聘《小學語文》試題及答案
- 小學一年級下冊數學口算題卡及口算天天練
- 2025新高考數學核心母題400道(教師版)
- 特種設備事故應急處置
- 高端SPA會所的內外環境設計藝術與實踐
- 廣告牌的施工方案
評論
0/150
提交評論