第2章 數據的組織與表達.ppt_第1頁
第2章 數據的組織與表達.ppt_第2頁
第2章 數據的組織與表達.ppt_第3頁
第2章 數據的組織與表達.ppt_第4頁
第2章 數據的組織與表達.ppt_第5頁
已閱讀5頁,還剩34頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第2章數據的組織與表達 ArrangementandPresentationofData Section2 1DataandDataType數據與數據類型 一 原始數據的組織 資料以電子表格 spreadsheet 方式記錄 包括個體 Individual 一筆數據所描述的對象 object 電子表格中輸入在一行 及變量 Variable 描述任何一個個體的特征 一個變量對不同的個體取不同的數值 value 電子表格中輸入在一列 一 數量性狀資料數量性狀 quantitativetrait 的度量有計數和量測兩種方式 其所得變數不同 1 不連續性或間斷性變數 discontinuousordiscretevariable 指用計數方法獲得的數據 2 連續性變數 continuousvariable 指稱量 度量或測量方法所得到的數據 其各個觀察值并不限于整數 在兩個數值之間可以有微量數值差異的第三個數值存在 二 試驗資料的性質與分類 二 質量性狀資料質量性狀 qualitativetrait 指能觀察而不能量測的狀即屬性性狀 如花藥 子粒 穎殼等器官的顏色 芒的有無 絨毛的有無等 要從這類性狀獲得數量資料 可采用下列兩種方法 統計次數法于一定總體或樣本內 統計其具有某個性狀的個體數目及具有不同性狀的個體數目 按類別計其次數或相對次數 2 給分法給予每類性狀以相對數量的方法 二 試驗資料的性質與分類 Section2 2次數分布表 表1100個麥穗的每穗小穗數 一 間斷性變數資料的整理 表2100個麥穗每穗小穗數的次數分布表 從表2中看到 一堆雜亂的原始資料表 經初步整理后 就可了解資料的大致情況 另外 經過整理的資料也便于進一步的分析 每穗小穗數在15 20的范圍內變動 把所有觀察值按每穗小穗數多少加以歸類 共分為6組 組與組間相差為1小穗 稱為組距 這樣可得表2形式的次數分布表 一 間斷性變數資料的整理 二 連續性變數資料的整理 表3140行水稻產量 單位 克 具體步驟 1 數據排序 sort 首先對數據按從小到大排列 升序 或從大到小排列 降序 2 求極差 range 所有數據中的最大觀察值和最小觀察值的差數 稱為極差 亦即整個樣本的變異幅度 從表3中查到最大觀察值為254g 最小觀察值為75g 極差為254 75 179g 二 連續性變數資料的整理 3 確定組數和組距 classinterval 根據極差分為若干組 每組的距離相等 稱為組距 在確定組數和組距時應考慮 1 觀察值個數的多少 2 極差的大小 3 便于計算 4 能反映出資料的真實面貌等方面 樣本大小 即樣本內包含觀察值的個數的多少 與組數多少的關系可參照表4來確定 二 連續性變數資料的整理 表4樣本容量與組數多少的關系 組數確定后 還須確定組距 組距 極差 組數 以表3中140行水稻產量為例 樣本內觀察值的個數為140 查表4可分為8 16組 假定分為12組 則組距為179 12 14 9g 為分組方便起見 可以15g作為組距 二 連續性變數資料的整理 4 選定組限 classlimit 和組中點值 組值 classvalue 以表3中140行水稻產量為例 選定第一組的中點值為75g 與最小觀察值75g相等 則第二組的中點值為75 15 90g 余類推 各組的中點值選定后 就可以求得各組組限 每組有兩個組限 數值小的稱為下限 lowerlimit 數值大的稱為上限 upperlimit 上述資料中 第一組的下限為該組中點值減去1 2組距 即75 15 2 67 5g 上限為中點值加1 2組距 即75 15 2 82 5g 故第一組的組限為67 5 82 5g 按照此法計算其余各組的組限 二 連續性變數資料的整理 5 把原始資料的各個觀察值按分組數列的各組組限歸組可按原始資料中各觀察值的次序 逐個把數值歸于各組 待全部觀察值歸組后 即可求得各組的次數 制成一個次數分布表 例如表3中第一個觀察值177應歸于表5中第8組 組限為172 5 187 5 第二個觀察值149應歸于第6組 組限為142 5 157 5 依次把140個觀察值都進行歸組 即可制成140行水稻產量的次數分布表 表5 二 連續性變數資料的整理 表5140行水稻的次數分布 注 前面提到分為12組 但由于第一組的中點值接近于最小觀察值 故第一組的下限小于最小觀察值 實際上差不多增加了1 2組 這樣也使最后一組的中點值接近于最大值 又增加了1 2組 故實際的組數比原來確定的要多一個組 為13組 二 連續性變數資料的整理 三 屬性變數資料的整理 屬性變數的資料 也可以用類似次數分布的方法來整理 在整理前 把資料按各種質量性狀進行分類 分類數等于組數 然后根據各個體在質量屬性上的具體表現 分別歸入相應的組中 即可得到屬性分布的規律性認識 例如 某水稻雜種第二代植株米粒性狀的分離情況 歸于表6 表6水稻雜種二代植株米粒性狀的分離情況 Section2 3次數分布圖 一 方柱形圖 方柱形圖 histogram 適用于表示連續性變數的次數分布 現以表3的140行水稻產量的次數分布表為例加以說明 即成方柱形次數分布圖1 二 多邊形圖 多邊形圖 polygon 也是表示連續性變數資料的一種普通的方法 且在同一圖上可比較兩組以上的資料 仍以140行水稻產量次數分布為例 所成圖形即為次數多邊形圖 圖2 三 條形圖 條形圖 bar 適用于間斷性變數和屬性變數資料 用以表示這些變數的次數分布狀況 一般其橫軸標出間斷的中點值或分類性狀 縱軸標出次數 現以表6水稻雜種第二代米粒性狀的分離情況為例 可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖 圖3 圖3水稻F2代米粒性狀分離條形圖 四 餅圖 餅圖 pie 適用于間斷性變數和屬性變數資料 用以表示這些變數中各種屬性或各種間斷性數據觀察值在總觀察個數中的百分比 如圖4中白米糯稻在F2群體中占8 白米非糯 紅米糯稻和紅米非糯分別占17 21 和54 Section2 4平均數 一 平均數的意義和種類 平均數的意義 平均數 average 是數據的代表值 表示資料中觀察值的中心位置 并且可作為資料的代表而與另一組資料相比較 借以明確二者之間相差的情況 平均數的種類 1 算術平均數一個數量資料中各個觀察值的總和除以觀察值個數所得的商數 稱為算術平均數 arithmeticmean 記作 因其應用廣泛 常簡稱平均數或均數 mean 均數的大小決定于樣本的各觀察值 2 中數將資料內所有觀察值從大到小排序 居中間位置的觀察值稱為中數 median 計作Md 如觀察值個數為偶數 則以中間二個觀察值的算術平均數為中數 一 平均數的意義和種類 3 眾數資料中最常見的一數 或次數最多一組的中點值 稱為眾數 mode 計作MO 如棉花纖維檢驗時所用的主體長度即為眾數 4 幾何平均數如有n個觀察值 其相乘積開n次方 即為幾何平均數 geometricmean 用G代表 一 平均數的意義和種類 二 算術平均數的計算方法 若樣本較小 即資料包含的觀察值個數不多 可直接計算平均數 設一個含有n個觀察值的樣本 其各個觀察值為x1 x2 x3 xn 則算術平均數由下式算得 若樣本較大 且已進行了分組 可采用加權法計算算術平均數 即用組中點值代表該組出現的觀測值以計算平均數 其公式為 其中yi為第i組中點值 fi為第i組變數出現次數 例1 在水稻品種比較試驗中 湘矮早四號的5個小區產量分別為20 0 19 0 21 0 17 5 18 5kg 求該品種的小區平均產量 例2 利用表5資料計算平均每行水稻產量 若采用直接法 157 47 因此 兩者的結果十分相近 二 算術平均數的計算方法 三 總體平均數 總體平均數用來代表 它同樣具有算術平均數所具有的特性 上式Xi代表各個觀察值 N代表有限總體所包含的個體數 表示總體內各個觀察值的總和 Section2 5變異數 一 極差 極差 range 又稱全距 記作R 是資料中最大觀察值與最小觀察值的差數 表7兩個小麥品種的每穗小穗數 甲品種R 23 13 10 乙品種R 20 16 4 兩品種的平均同為18 但甲品種的極差大 平均數的代表性差 乙品種的極差小 平均數代表性好 二 方差 離均差平方和 簡稱平方和 SS 樣本SS 總體SS 均方或方差 variance 樣本均方 meansquare 總體方差 樣本均方是總體方差的無偏估計值 三 標準差 一 標準差的定義樣本標準差 總體標準差 樣本標準差是總體標準差的估計值 二 自由度 樣本n 1稱為自由度 記作DF 其具體數值則常用表示 統計意義 是指樣本內獨立而能自由變動的離均差個數 三 標準差 三 標準差的計算方法 1 直接法 例3 設某一水稻單株粒重的樣本有5個觀察值 以克為單位 其數為2 8 7 5 4 三 標準差 2 矯正數法 其中項稱為矯正數 記作C 在上例中 將有關數字代入即有 三 標準差 3 加權法若樣本較大 已生成次數分布表 可采用加權法計算標準差 其公式為 三 標準差 例4 利用表5的次數分布資料計算每行水稻產量的標準差 若采用直接法 其標準差s 36 23 g 由此可見 直接法和加權法的結果是很相近的 三 標準差 四 變異系數 變異系數 co

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論