統計學復習概念重點-賈俊平(匯編)_第1頁
統計學復習概念重點-賈俊平(匯編)_第2頁
統計學復習概念重點-賈俊平(匯編)_第3頁
統計學復習概念重點-賈俊平(匯編)_第4頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精品文檔簡單樣nkxiM i f i本平均xi1xi 1數nn幾何平nGmn x1x2xnnxi均數i1異眾比Vrf if m1f m率f if i簡單加nkxixM ix f i權i1i1平均差 M dnM dn簡單樣nnx) 2x) 2本方差2(xi( xi標準方 si 1si1n1n1差kx) 2加權樣2(M ifi本方差i1sn1加權樣kx) 2(M if i本標準si1差n12判定系2SSR?y)R( yi數SST( yiy)2相關系數檢驗trn 2 t( n 2)的統計1 r 2量標準分zixix 離散vss數s系數x指數平滑法預Ft 1Yt (1) Ft測移動平Yt k 1Yt

2、k 2Yt 1均法預 Ft 1Ytk測總體均值的置信區間(正態總體, 已知)xz 2xz 2s t總體均值的置信區間(nn未知,大樣本)p(1p)2n總體比例的置信區間p z2nn1N總體方差的置信區間( n 1)s22( n 1)s222212估計總體均值時的樣本容n( z2 ) 22量E 2估計總體比例時的樣本容(z2 ) 2(1 )量nE2總體均值 檢驗 的統 計量 zx0 zx0 tx0(正態總體,已知)/ns/ns /nzp0總體比例檢驗的統計量0 (10 )n總體方差檢驗的統計量2( n1)s220拉氏I pp1q0q1 p0帕I qp1 q1pq1 p1p0q0qq0 p1q0

3、p0 氏p0 q1加權加 權平均平 均p1q1p1I p指p0 q0指 數1數I qp0銷 售p qp11 1銷p0 q0p1q1p0售為權p0q0 為權估計標準se( yi?yi )2SSEMSE誤差n2n2線性關系SSR1 F (n 2) MSA=SSA/k-1Yt 檢 驗 的 統FSSE n2計量MSE=SSE/n-k精品文檔精品文檔?環比增Yi回歸系數ti t(n2)相關系數YiY0Yi檢驗的統s?1長率Gi1GiiYi 1Y0Y0計的統計定基trn2量 t( n 2)1 r 2Y1Y2YnYn平均預測n平均增G11誤差(YiFi)YiFi長率nY1YnnY0平均絕對MEi 1Y01n

4、MAD預測誤差nYinFi ) 2年度化GA)m n1均方預測(Yi增長率(誤差MSEi1Yi1n平均百YiFi100簡單平均1Y21t分比預MPEYiFt 1(Y1Yt )Yi測誤差n法預測tt i1精品文檔精品文檔統計學:收集處理分析解釋數據并從數據中得出結論的科學。1. 描述統計:研究數據收集處理匯總圖表描述概括與分析等統計方法。2. 推斷統計:研究如何利用樣本數據來推斷總體特征的統計方法。3. 分類數據:只能歸于某一類別的非數字型數據。4. 順序數據:只能歸于某一有序類別的非數字型數據。5. 數值型數據:按數字尺度測量的觀察值。6. 觀測數據:通過調查或觀測而收集到的數據。7. 實驗數

5、據:在實驗中控制實驗對象而收集到的數據。8. 截面數據:在相同或近似相同的時間點上收集的數據。9. 時間序列數據:在不同時間上收集到的數據,這類數據按時間順序收集到的。10. 抽樣調查: 從總體中隨機抽取一部分單位作為樣本進行調查,根據樣本調查結果來推斷總體特征的數據收集方法。11. 普查: 為特定目的而專門組織的全面調查。12. 總體:包含所研究的全部個體(數據)的集合。13. 樣本:從總體中抽取的一部分元素的集合。14. 樣本容量:也稱樣本量,是構成樣本的元素數目。15. 參數:用來描述總體特征的概括性數字度量。16. 統計量:用來描述樣本特征的概括性數字度量。17. 變量:說明現象某種特

6、征的概念。18. 分類變量:說明事物類別的一個名稱。19. 順序變量:說明事物有序類別的一個名稱。20. 數值型變量:說明事物數字特征的一個名稱。21. 離散型變量:只能取可數值的變量。22. 連續型變量:可以在一個或多個區間中取任何值的變量。23. 調查數據:通過調查方法獲得的數據24. 實驗數據:通過實驗方法獲得的數據25. 概率抽樣:隨機抽樣,遵循隨機原則進行的抽樣,總體中每個單位都有一定的機會被選入樣本。26. 非概率抽樣:不隨機,根據研究目的對數據的要求,采用某種方式從總體中抽出部分單位對其實施調查。27. 簡單隨機抽樣:從包括總體的 N 個單位的抽樣框中隨機,一個個抽取 n 個單位

7、作為樣本,每單位等概論。28. 抽樣框: 用于抽選樣本的總體單位信息,是概率抽樣中所不可缺29. 分層抽樣:將抽樣單位按某種特征或某種規則劃分為不同的層,然后從不同層中獨立、隨機地抽取樣本。30. 整群抽樣:總體中若干單位合并為組,群,抽樣時直接抽取群,然后對中選群中的所有單位全部實施調查。31. 系統抽樣:總體中所有單位按順序排列,在規定范圍內隨機抽取一單位作為初始單位,然后按事先規則確定其它樣本單位。32. 多階段抽樣:首先抽取群,再進一步抽樣,從選中的群中抽取出若干個單位進行計查,二階段抽樣。33. 方便抽樣:依據方便原則,自行確定入抽樣本的單位。34. 判段抽樣:研究人員根據經驗,判斷

8、研究對象的了解,有目的選擇一些單位作為樣本。35. 自愿樣本:被調查者自愿參加,成為樣本中一分子,向調查人員提供有關信息36. 滾雪球抽樣:對稀少群體調查中,首選選擇一組調查單位,調查后,請他們提供另外屬于研究總體的調查對象,調查人員根據所提供的線索,進行此后調查。37. 配額抽樣:將總體中所有單位按一定的標志分若干類,然后每類采用方便抽樣或判斷抽樣的方案選取樣本單位。38. 自填式:沒有調查員協助,被調查者自已填寫,完成調查問卷。39. 面訪式:面對面,調查員提問,被調查者回答。精品文檔精品文檔40. 電話式:打電話方式調查。41. 抽樣誤差:由于抽樣的隨機性引起的樣本結果與總體真值之的誤差

9、。42. 非抽樣誤差:相對抽樣誤差而言,除抽樣誤差之外的,由于其它原因引起的樣本觀察結果與總體真值之間的差異。43. 抽樣框誤差:統計推論的錯誤是由于抽樣框不完善造成的44. 頻數: 落在某一特定類別或組中的數據個數。45. 頻數分布: 各個類別及其相應的頻數形成的分布。46. 比例: 一個樣本(或總體)中各個部分的數據占全部數據比值。47. 比率: 一個樣本(或總體)中各不同類別數據之間的比值。48. 累積頻數:將各有序類別或組的頻數逐級累加起來得到的頻數。49. 累積頻率或累積百分比:將有序類別或組百分比逐級累加起來。50. 數據分組:根據統計研究需要,將原始數據按某種標準化分成不同的組別

10、,。51. 組距是一個組的上限與下限的差52. 組距分組是將全部變量依次劃分為若干個區間,將這一區間的變量值作為一組。53. 等距分組,在組距分組時,如果各組的組距相等。54. 組中值下限值 +上限值 /2 上下限的中間值55. 直方圖:用矩形的寬度和高度(即面積)來表示頻數分布的圖形。56. 莖葉圖:由莖和葉兩部分組成的、反應原始數據分布的圖形。57. 箱線圖:由一組數據的最大值、最小值、中位數和兩個四分位數5 個特征值繪制而成的、反應原始數據分布圖形。58. 集中趨勢:指一組數據向某一中心值靠攏的程度,反映一組數據中心點的位置所在。59. 眾數: 一組數據中出現頻數最多的數值60. 中位數

11、: 一組數據排序后處于中間位置上的數值。61. 四分位數: 一組數據排序后處在 25%和 75%位置上的數值。62. 平均數 :又稱均值,是全部數據的算術平均值63. 簡單平均數:未經分組數據計算的平均數稱為簡單平均數。根據分組。 。加權平均數。64. 幾何平均數:是 n 個變量值乘積的 n 次方根。常用于比例數據的平均。65. 異眾比率:指非眾數組的頻數占總頻數的比例 .66. 四分位差: 75%位置上的四分位數與 25%位置上的四分位數之差。順序數據。67. 極差: 也稱全距,一組數據的最大值與最小值之差。68. 平均差:也稱平均絕對離差,它是各變量值與其平均數離差的絕對值的平均數。69.

12、 方差: 各數據與其平均數離差平方的平均數。70. 標準差: 方差的平方根。71. 標準分數: 也稱標準化值或 z 分數,某個數據與其平均數的離差除以標準差后的值。72. 離散系數: 一組數據的標準差與其相應的平均數之比。73. 偏態:對數據分布對稱性的測度。測度偏態的統計量偏態系數 。74. 偏態系數:對數據分布不對稱性的度量值。75. 峰態:對數據分布平峰或尖峰程度的測度,測度峰態的統計量則是峰態系數。76. 峰態系數:對數據分布峰態的度量值。77. 隨機事件:在同一組條件下,每次試驗可能出現也可能不出現的事件,也叫偶然事件78. 必然事件:在同一組條件下,每次試驗一定出現的事件。79.

13、不可能事件:在同一組條件下,每次試驗一定不出現的事件。80. 基本事件:如果一個事件不能分解成兩個或更多個事件,則這個事件稱為基本事件。81. 概率: 對事件發生的可能性大小的度量值。82. 主觀概率:對一些無法重復的試驗,確定其結果的概率只能根據經驗,人為確定這個事件的概率。83. 條件概率:當某事件 B 已發生,求事件 A 發生的概率,稱為事件 B 發生條件下事件 A 發生的條件概率。84. 獨立事件: 兩個事件中不論哪一個事件發生與否并不影響另一個事件發生的概率。精品文檔精品文檔85. 隨機變量: 事先不能確定其取值的變量。86. 離散型隨機變量: 只能取有限個值的隨機變量。87. 連續

14、型隨機變量 :可以取一個或多個區間中任何值的隨機變量。88. 期望值、數學期望 :隨機變量的平均取值,各可能值與對應概率乘積之和。89. 方差: 隨機變量的每一取值與期望值的離差平方的期望值。90. 泊松分布:用來描述在一指定時間范圍內或在指定的面積或體積之內某一事件出現的個數的分布。91. 概率密度函數:對連續型隨機變量用函數 f(x) 來表示。大于等于 0,全積分為 192. 統計量: 對樣本特征的某個概括性度量,是樣本的函數。93. 充分統計量:統計量加工過程中一點信息都不損失的統計量通常稱為充分統計量。94. 抽樣分布: 樣本統計量的概率分布,是由樣本統計量的所有可能取值形成相對頻數分

15、布。95. 漸近分布:當 n 比較大時,用極限分布作為抽樣分布的一種近似,這種極限分布常稱為96. 自由度:獨立變量的個數。97. 估計量 :用來估計總體參數的統計量的名稱98. 估計值: 估計總體參數時計算出來的估計量的具體數值99. 點估計: 用樣本估計量 的取值直接作為總體參數 的估計值100. 區間估計: 在點估計的基礎上,給出總體參數估計的一個估計區間,該區間通常由樣本統計量加減估計誤差組成101. 置信區間: 由樣本統計量構造出的總體參數在一定置信水平下的估計區間。102. 置信水平: 也稱為置信度或置信系數,在重復構造的總體參數的多個置信區間中包含總體參數真值的次數所占的比例。1

16、03. 無偏性: 估計量抽樣分布的期望值等于被估計的總體參數104. 有效性: 對同一總體參數的兩個無偏估計量,有更小標準差的估計量更有效。105. 一致性: 隨著樣本量的增大,估計量的值越來越接近總體參數。106. 獨立樣本: 一個樣本中的元素與另一個樣本中的元素相互獨立。107. 匹配樣本: 又稱配對數據,一個樣本中的數據與另一個樣本中的數據相對應。108. 假設檢驗: 先對總體參數提出某種假設,然后利用樣本信息判斷假設是否成立的過程。109.原假設: 也稱零假設,是研究者想收集證據予以反對的假設,用H 0表示。110.111.備擇假設: 也稱研究假設,是研究者想收集證據予以支持的假設,用

17、H 1 或 H a 表示。112.113.第類錯誤: 原假設正確時拒絕原假設,犯第類錯誤概率記。114.第類錯誤: 當原假設為錯誤時沒有拒絕原假設,犯第類錯誤的概率通常記為。115.顯著性水平: 假設檢驗中發生第類錯誤的概率,記為。116.117. 小概率原理: 進行假設檢驗利用,指發生概率很小的隨機事件在一次試驗中是幾乎不可能發生的。118.119. 檢驗統計量:根據樣本觀測結果計算得到的,并據以對原假設和備擇假設做出決策的某個樣本統計量120. 拒絕域:能夠拒絕原假設的檢驗統計量的所有可能取值的集合。121. 臨界值:根據給定的顯著性水平確定的拒絕域的邊界值。122.123. P 值:也稱

18、觀察到的顯著性水平,如果原假設 H 0 是正確的,那么所得的樣本結果出現實際觀測結果或更極端結果出現的概率。 P 值很小說明發生概率很小,拒絕原假設, P 越小,拒絕原假設的理由就越充分。雙側 P<0.025 單側 p<0.05 拒絕原假設。124.125. 單側檢驗:也稱單尾檢驗,是指備擇假設具有特定的方向性,并含有符號“ >”或“ <”的假設精品文檔精品文檔檢驗。126.雙側檢驗:也稱雙尾檢驗,是指備擇假設沒有特定的方向性,并含有符號“”的假設檢驗。127. 列聯表:由兩個以上的變量進行交叉分類的頻數分布表。128. 條件分布、頻數:列聯表中的觀察值分布稱為條件分布

19、,每個具體觀察值就是條件頻數。129. 擬合優度檢驗:如果樣本是從總體的不同類別中分別抽取,研究目的是對不同類別的目標量之間是否存在顯著性差異進行檢驗,我們就把它稱為擬合優度檢驗或一致性檢驗。130.131. 獨立性檢驗:判斷兩個分類變量之間是否存在聯系的問題,兩組或多組的資料是否相互關聯,如果不關聯,就稱為獨立。這類問題的處理稱為獨立性檢驗。132.133. 方差分析: 通過檢驗各總體均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。134.135. 因素:也稱因子,是方差分析中所要檢驗的對象。136.137. 處理:因素的不同表現稱為水平或處理138. 組內誤差:來自水平內部的數

20、據誤差。139. 組間誤差:來自不同水平之間的數據誤差。140. 總平方和:反映全部數據誤差大小的平方和,記為SST。自變量效應加殘差效應。 n-1141. 組內平方和:反映組內誤差大小的平方和,記為SSE。殘差變量,殘差效應 ;n-k142. 組間平方和:反映組間誤差大小的平方和,記為SSA。自變量效應或因子效應 ;k-1143. 單因素方差分析:只涉及一個分類型自變量的方差分析。144. 組內方差:組內平方和除以相應的自由度。145. 組間方差:組間平方和除以相應的自由度。146. 雙因素方差分析:方差分析中涉及兩個分類型自變量時,稱為147. 試驗:收集樣本數據的過程148. 試驗設計:

21、收集樣本數據的計劃149. 完全隨機化設計:將 k 種處理隨機地指派給試驗單元的設計。150. 處理指可控制的因素的各個水平151. 試驗單元:接受處理的對象或實體稱為試驗單元或抽樣單元。152. 隨機化區組設計:先按一定規則將試驗單元劃分為若干同質組,區組,然后再將各種處理隨機地指派給各個區組。153. 因子設計:考慮兩個因素搭配的試驗設計稱為因子設計。154. 函數關系:設兩變量 x,y ,變量 y 隨 x 一起變化,并完全依賴于 x,當變量 x 取某數值時, y 依確定關系取相應的值,則稱 y 是 x 的函數,記為 y=f(x).155. 相關關系: 變量之間存在的不確定的數量關系。15

22、6. 相關分析: 分析變量之間是否存在相關關系,明確其相關關系的類型,計算其相關關系的密切程度的統計分析方法157. 相關系數: 是根據樣本數據計算的度量兩個變量之間線性關系強度的統計量。158. 回歸模型: 描述因變量 y 如何依賴于自變量 x 和誤差項 的方程。159. 回歸方程: 描述因變量 y 的期望值如何依賴于自變量 x 的方程。160. 估計的回歸方程:用樣本統計量代替回歸方程中的未知參數,根據樣本數據求出的回歸方程的估計。161. 因變量、自變量:被預測或被解釋的變量稱為因變量,用來預測或用來解釋因變量的一個或多個變量稱為自變量。162.最小二乘法: 也稱最小平方法,使因變量的觀

23、察值yi 與估計值 y?i 之間的離差平方和達到最小來求得?的方法。0 和1精品文檔精品文檔163. 回歸平方和: y 的總變差中由于 x 與 y 之間的線性關系引起的 y 的變化部分, 它是可以由回歸直線來解釋的 yi 變差部分。164. 殘差平方和:除了 x 對 y 的線性影響之外的其它因素對 y 變差的作用,是不能由回歸直線解釋的 yi 的變差部分。165. 判定系數: 回歸平方和占總平方和的比例,記為 R2166. 估計量的標準誤差:均方殘差( MSE)的平方根,用 se 來表示。實際意義反映了用估計的回歸方程預測因變量 y 時的預測誤差的大小。越小,各觀測點的代表性就越好,預測越準確

24、,從另一個角度說明了回歸直線的擬合優度。167. 平均值的點估計: 利用估計的回歸方程,對于 x 的一個特定值 x0 ,求出 y 的平均值的一個估計值 E( y0 ) 。168. 個別值的估計值: 利用估計的回歸方程,對于 x 的一個特定值 x0 ,求出 y 的一個個別值的估計值 y?0 。169. 平均值的置信區間估計: 對 x 的一個給定值 x0 ,求出 y 的平均值的區間估計。170. 個別值的預測區間估計: 對 x 的一個給定值 x0 ,求出 y 的一個個別值的區間估計。171.殘差:因變量的觀測值yi 與根據估計的回歸方程求出的預測值yi 之差,用 e 表示。172. 標準化殘差:殘

25、差除以它的標準差后得到的數值用Ze 表示。173. 異常值:在散點圖中,如果某一個點與其它點所呈現的趨勢不相吻合174. 有影響的觀測值:如果某一個點或某一些觀測值對回歸的結果有強烈的影響,那么該觀測值或這些觀測值就是 175. 多元線性回歸模型:描述因變量 y 如何依賴于自變量 x1, x2, , xk 和誤差項 的方程。176. 多元線性回歸方程:描述 y 的期望值如何依賴于 x1, x2, ,xk 的方程。177. 估計的多元線性回歸方程:根據樣本數據得到的多元線性回歸方程的估計。178. 多重判定系數:在多元回歸中,回歸平方和占總平方和的比例。179. 修正的多重判定系數:用模型中自變

26、量的個數和樣本量進行調整的多重判定系數,記為Ra2 。180. 多重共線性:當回歸模型中兩個或兩個以上的變量彼此相關時,則稱回歸模型中存在181. 虛擬變量:變量的取值本身用文字來描述,要把它們放進回歸模型,必須先將其文字型數據用數字代碼來表示,這種代碼化的定性自變量稱為虛擬變量。182. 時間序列: 同一現象在不同時間上的相繼觀察值排列而成的序列。183. 平穩序列: 基本上不存在趨勢的序列。184. 非平穩序列: 包含趨勢性、季節性或周期性的序列。185. 趨勢:也稱長期趨勢,指時間序列在長時期內呈現出某種持續向上或持續下降的變動。186. 季節性: 季節變動,是指時間序列在一年內重復出現的周期性波動。187. 周期性: 循環波動,是指時間序列中呈現出的圍繞長期趨勢的一種波浪形或振蕩式變動。188. 隨機性: 不規則波動,是指時間序列中除去趨勢、周期性和季節性之后的偶然性波動。189.增長率: 也稱增長速度,是指時間序列中報告期觀察值與基期觀察值之比減1 后的結果,用 %表示。190.環比增長率:報告期觀察值與前一時期觀察值之比減1,說明現象逐期增長變化的程度。191.定基增長率: 報告期觀察值與某一固定時期觀察值之比減1,說

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論