農業信息技術chapter3農業數據庫系統_第1頁
農業信息技術chapter3農業數據庫系統_第2頁
農業信息技術chapter3農業數據庫系統_第3頁
農業信息技術chapter3農業數據庫系統_第4頁
農業信息技術chapter3農業數據庫系統_第5頁
已閱讀5頁,還剩72頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、農業信息技術第三章農農業數數據庫系系統3數據庫系系統概述述農業數據據庫建設設農業管理理信息系系統農業數據據處理與與統計分分析第一節數據庫系系統概述述一、數據據庫系統統的構成成與特點點二、數據據庫管理理系統三、數據據庫中的的數據模模型四、數據據庫設計計第一節數據庫系系統概述述一、數據據庫系統統的構成成與特點點(一)數數據管理理與數據據庫系統統數據管理理技術是是指對數數據進行行分類、編碼、存儲、檢索和和維護,它是數數據處理理的中心心問題。數據管理理技術經經歷了人人工管理理、文件件系統、數據庫庫系統、高級數數據庫等等發展階階段。數據庫系系統(databasesystems)是計算算機應用用系統中中一

2、種專專門管理理數據資資源的系系統,由由數據庫庫、數據據庫管理理系統和和用戶應應用三部部分組成成。第一節數據庫系系統概述述數據庫(database,DB)是按照照數據結結構來組組織、存存儲和管管理數據據的倉庫庫。詳細講,數據庫庫是長期期存儲在在計算機機內、與與應用彼彼此獨立立的、以以一定的的組織方方式存儲儲在一起起的、彼彼此相互互關聯的的、具有有較少冗冗余的、能被多多個用戶戶共享的的數據集集合。數據庫類類型多樣樣,有最最簡單的的存儲各各種數據據的表格格,也有有存儲海海量數據據的大型型數據庫庫系統,有文字字型、數數字型、圖像型型和聲音音型等不不同數據據形式。多媒體數數據庫(MultimediaDa

3、taBase,MDB)能提供供圖像、文本、聲音等等信息的的全方位位“立體體化”的的服務方方式。一、數據據庫系統統的構成成與特點點(一)數數據管理理與數據據庫系統統第一節數據庫系系統概述述一、數據據庫系統統的構成成與特點點(一)數數據管理理與數據據庫系統統分類標準類 別用戶數量單用戶數據庫 多用戶數據庫數據類型和表現形式文獻型數據庫 數值型數據庫 事實型數據庫文本型數據庫 它們的結合型數據庫數據存諸介質類型磁帶數據庫 硬盤數據庫 光盤數據庫數據結構和存取方法關系型數據庫 層次型數據庫 網絡型數據庫數據存放地點集中式數據庫 分布式數據庫第一節數據庫系系統概述述一、數據據庫系統統的構成成與特點點(一

4、)數數據管理理與數據據庫系統統數據庫是是為獲取取數據而而設計,而數據據倉庫是是為分析析數據而而設計。數據倉庫庫(Data warehouse,DW)是決策策支持系系統和聯聯機分析析應用數數據源的的結構化化數據環環境,是是一個面面向主題題的、集集成的、相對穩穩定的、反映歷歷史變化化的數據據集合,用于支支持管理理決策。數據倉庫庫系統是是一個信信息提供供平臺,包含數數據獲取取(Data Acquisition)、數據據存儲(Data Storage)、數據據訪問(Data Access)三個關關鍵部分分,為用用戶提供供各種手手段從數數據中獲獲取信息息和知識識。第一節數據庫系系統概述述(二)數數據庫系

5、系統的構構成一、數據據庫系統統的構成成與特點點數據庫系系統簡圖圖數據庫用戶 軟件 硬件 終端用戶戶應用程序序員數據庫管管理員數據庫管管理系統統DBMS存儲數據據庫運行DBMS(包括操作作系統)的硬件資資源第一節數據庫系系統概述述(二)數數據庫系系統的構構成一、數據據庫系統統的構成成與特點點數據庫系系統的4個組成部部分構成成了一個個復雜的的層次系系統第一節數據庫系系統概述述(三)數數據庫系系統的特特點一、數據據庫系統統的構成成與特點點(1)數據的的結構化化(2)數據共共享性好好(3)數據獨獨立性好好(4)用戶接接口簡單單(4)系統運運行可靠靠(5)能夠重重組數據據(6)基于某某種數據據模型,能夠

6、充充分描述述數據間間的內在在聯系第一節數據庫系系統概述述二、數據據庫管理理系統數據庫管管理系統統(Data BaseManagementSystem,DBMS)是一種種操縱和和管理數數據庫的的大型軟軟件,用用于建立立、使用用和維護護數據庫庫,對數數據庫進進行統一一的管理理和控制制,以保保證數據據庫的安安全性和和完整性性。用戶通過過DBMS訪問數據據庫中的的數據,數據庫庫管理員員也通過過DBMS進行數據據庫的維維護工作作。第一節數據庫系系統概述述二、數據據庫管理理系統(一)數數據庫管管理系統統的功能能(1)數據定定義功能能(2)數據存存取功能能(3)數據庫庫運行管管理功能能(4)數據庫庫建立和和

7、維護功功能(5)數據庫庫的傳輸輸第一節數據庫系系統概述述二、數據據庫管理理系統(二)數數據庫管管理系統統的層次次結構根據處理理對象的的不同,數據庫庫管理系系統的層層次結構構由高級級到低級級依次為為應用層語言翻譯譯處理層層數據存取取層數據存儲儲層操作系統統第一節數據庫系系統概述述(三)常常用的數數據庫管管理系統統二、數據據庫管理理系統(1)Oracle(2)MicrosoftSQL Server(3)MicrosoftAccess第一節數據庫系系統概述述三、數據據庫中的的數據模模型在數據庫庫中用數數據模型型(data model)來抽象象、表示示和處理理現實世世界中的的數據和和信息。數據模型型是

8、指描描述反映映客觀事事物的數數據及其其聯系。按照應用用層次,數據模模型分為為概念數數據模型型、邏輯輯數據模模型和物物理數據據模型等等三類。第一節數據庫系系統概述述三、數據據庫中的的數據模模型(一)概概念模型型概念數據據模型也也稱信息息模型,它是按按用戶的的觀點來來對數據據和信息息建模,主要用用于數據據庫設計計。是現實世世界到機機器世界界的一個個中間層層次,是是數據庫庫設計的的有力工工具。它它不依賴賴于某個個DBMS支持的數數據模型型,同時時又可以以轉換為為某一DBMS支持的特特定數據據模型。概念模型型的特點點是:具具有較強強的語義義表達能能力,能能夠方便便、直接接地表達達應用中中的各種種語義知

9、知識;簡簡單、清清晰、易易于用戶戶理解,是用戶戶與數據據設計人人員之間間進行交交流的語語言。第一節數據庫系系統概述述三、數據據庫中的的數據模模型(一)概概念模型型1.信息世界界中的基基本概念念2.概念模型型的表示示方法(1)實體(2)屬性(3)鍵(4)域(5)實體型型(6)實體集集(7)關聯E-R方法稱為為實體-聯系方法法(Entity-Relationship Approach),該方方法能夠夠方便、準確地地表示出出上述信信息世界界中常用用的概念念,它用用E-R圖來描述述現實世世界的概概念模型型。E-R方法也稱稱為E-R模型,它它是概念念模型常常用的方方法。此外,還還有擴充充的E-R模型、面

10、面向對象象模型及及謂詞模模型等。第一節數據庫系系統概述述三、數據據庫中的的數據模模型(二)數數據模型型邏輯數據據模型又又被簡稱稱為數據據模型,主要包包括網狀狀模型,層次模模型,關關系模型型等,它它是按計計算機系系統的觀觀點對數數據建模模,主要要用于DBMS的實現。層次模型型、網狀狀模型是是早期的的數據模模型。通通常把它它們稱為為格式化化數據模模型,因因為它們們是屬于于以“圖圖論”為為基礎的的表示方方式。關關系模型型是用“二維表表”(或或稱關系系)來表表示數據據之間的的聯系。第一節數據庫系系統概述述三、數據據庫中的的數據模模型(二)數數據模型型1.層次模型型層次數據據模型實實質上是是一種有有根結

11、點點的定向向有序樹樹(在數數學中“樹”被被定義為為一個無無回的連連通圖),即用用“樹”結構表表示實體體集之間間的關聯聯,其中中實體集集(用矩矩形框表表示)為為結點,而樹中中各結點點之間的的連線表表示它們們之間的的關聯。根據“樹樹”結構構的特點點,建立立數據的的層次模模型需要要滿足下下列兩個個條件:有且且僅有一一個結點點無“父父”結點點稱為根根結點;其他他數據記記錄有且且只有一一個“父父”結點點。按照照層次模模型建立立的數據據庫系統統稱為層層次模型型數據庫庫系統,其典型型代表是是管理信信息系統統(Management Information System,MIS)。第一節數據庫系系統概述述三、數

12、據據庫中的的數據模模型(二)數數據模型型1.層次模型型不能很好好的表示示兩個以以上實體體型之間間的復雜雜關聯和和實體型型之間多多對多關關聯優點數據模型型簡單對具有一一對多的的層次關關系描述述自然、直觀,容易理理解性能優于于關系模模型,不不低于網網狀模型型層次數據據模型提提供了良良好的完完整性支支持缺點第一節數據庫系系統概述述三、數據據庫中的的數據模模型(二)數數據模型型2.網狀模型型能很好地地解決了了實體間間復雜關關系的表表達問題題有致命的的弱點,即當需需求擴展展時,對對原有數數據結構構及應用用程序的的修改會會產生嚴嚴重的后后果網狀模型型的特點點:可以以有一個個以上的的結點無無“父”;至少少有

13、一個個結點有有多于一一個的“父”按照網狀狀數據結結構建立立的數據據庫系統統稱為網網狀數據據庫系統統,其典典型代表表是DBTG(Data BaseTaskGroup)用數學方方法可將將網狀數數據結構構轉化為為層次數數據結構構第一節數據庫系系統概述述三、數據據庫中的的數據模模型(二)數數據模型型3.關系模型型關系模型型是以人人們經常常使用的的二維表表格形式式來表示示實體本本身及其其相互之之間的關關聯,它它以關系系理論為為堅實的的基礎,是經典典數據模模型中建建模能力力最強的的一種,對于各各種類型型數據聯聯系都可可描述,成為當當今實用用數據庫庫系統的的主流。在關系模模型中,把數據據看成一一個二維維表格

14、,每個二二維表格格就是一一個關系系,由多多列和多多行組成成,每列列描述實實體的一一個屬性性,每行行描述一一個具體體實體。對于一個個表示關關系的二二維表格格,其最最基本的的要求是是,不允允許表中中再有表表。第一節數據庫系系統概述述三、數據據庫中的的數據模模型(二)數數據模型型3.關系模型型一個關系系稱為一一個數據據庫,若若干個數數據庫可可以構成成一個數數據庫系系統。在關系數數據庫中中,對數數據的操操作幾乎乎全部建建立在一一個或多多個關系系表格上上,通過過對這些些關系表表格的分分類、合合并、連連接或選選取等運運算來實實現數據據的管理理。由關系數數據結構構組成的的數據庫庫系統被被稱為關關系數據據庫系

15、統統。第一節數據庫系系統概述述三、數據據庫中的的數據模模型(二)數數據模型型3.關系模型型優點缺點 數據據結構簡簡單 具有有很高的的數據獨獨立性 可以以直接描描述多對對多的關關聯 有堅堅實的理理論基礎礎當數據庫庫很大時時,查找找滿足特特定關系系的數據據費時,對空間間關系無無法滿足足。第一節數據庫系系統概述述四、數據據庫設計計(一)數數據庫設設計的步步驟第一節數據庫系系統概述述(二)概概念結構構設計四、數據據庫設計計概念模型型是對實實際應用用對象形形象而又又具體的的描述概念結構構設計要要借助于于某種方方便又直直觀的描描述工具具。E-R圖提供了了表示實實體型、屬性和和關聯的的方法(如圖):實體型屬

16、性關聯某校教學學管理數數據庫的的E-R圖E-R圖中的關關系連線線上的“1”、“0”,表示實實體的最最小基數數,菱形形框內的的數字表表示的是是最大基基數。“1”,表示在在關聯中中這一側側必須存存在一個個實體,“0”表示實體體可以不不存在。第一節數據庫系系統概述述(三)關關系數據據庫設計計四、數據據庫設計計關系數據據庫就是是依據關關系模型型建立的的數據庫庫。將E-R數據模型型轉化為為關系模模型的過過程,可可分為以以下3個步驟:將用E-R圖描述的的數據庫庫概念模模型轉化化一組關關系模式式根據關系系型數據據庫規范范化理論論對這組組關系模模式進行行規范化化處理根據數據據庫的完完整性和和一致性性要求以以及

17、系統統查詢效效率要求求,對所所得模式式進行優優化第二節農農業數數據庫建建設一、農業業數據庫庫的類型型二、國外外農業數數據庫三、中國國農業數數據庫第二節農農業數數據庫建建設一、農業業數據庫庫的類型型農業資源源數據庫庫地理資源源數據庫庫種質資源源數據庫庫基因資源源數據庫庫人力資源源數據庫庫農業技術術數據庫庫農業統計計數據庫庫企業與產產品數據據庫生產信息息統計數數據庫農業氣象象資料數數據庫農業生產產數據庫庫農業企業業與產品品數據庫庫農業市場場信息數數據庫農業政策策法規數數據庫農業科技技文獻數數據庫第二節農農業數數據庫建建設二、國外外農業數數據庫(一)國國外數據據庫發展展概況國外的數數據庫建建設起步步

18、較早,在20世紀60年代中期期,美國國就開始始了數據據庫方面面的建設設;70年代中期期,歐洲洲各國和和日本相相繼建立立和發展展了本國國的數據據庫;到了80年代后期期,數據據庫聯機機檢索系系統開始始在經濟濟發達國國家興起起,這時時出現了了光盤數數據庫。隨后,伴伴隨計算算機技術術及互聯聯網的快快速發展展,農業業數據庫庫的發展展除了在在光盤數數據庫、網絡在在線數據據庫等方方面不斷斷發展壯壯大以外外,各國國農業信信息網絡絡系統也也在不斷斷涌現。目前,國國際上最最著名的的農業數數據庫系系統是CABI、AGRICOLA、AGRIS三大數據據庫。第二節農農業數數據庫建建設二、國外外農業數數據庫(二)國國外農

19、業業文摘數數據庫1.CAB Abstracts2.AGRICOLA3.AGRIS4.FSTA5.Pest-Bank6.BIOSIS Previews7.TROPAG &RURAL8.ZoologicalRecords9.DerwentBiotechnology Abstracts10.FOODLINE11.WilsonBiological &Agricultural Index12.PollutionandToxicology13.ASFA第二節農農業數數據庫建建設二、國外外農業數數據庫(三)國國外農業業全文數數據庫1.EBSCO全文數據據庫2.ScienceDirect電子期刊刊數據庫庫3.

20、ProQuest博碩士論論文全文文數據庫庫4.AnnualReviews電子期刊刊5.Blackwell出版社電電子期刊刊6.SpringerLink(Springer出版社電電子期刊刊數據庫庫)7.ProQuest生物和農農業全文文期刊數數據庫8.BioOne全文數據據庫9.Nature系列電子子期刊10.ASABETechnical Library11.Taylor &Francis農業百科科全文數數據庫12.OECD農業與食食品數據據庫和電電子圖書書資源13.CABIPublishing Journals(Your Journals OVID)14.Taylor &FrancisJour

21、nalsOnline三、中國國農業數數據庫第二節農農業數數據庫建建設(一)中中國農業業數據庫庫建設概概況經過了70年代的起起步、80年代上半半期的普普及階段段后,從從1987年進入數數據庫的的提高階階段,到到現在數數據庫的的建設已已進入快快速發展展的時代代。中國國農業信信息方面面的數據據庫建設設不斷發發展進步步,經歷歷了從題題錄文獻獻庫到全全文庫,從光盤盤庫到網網絡庫的的發展。主要問題題是:(1)農業數數據庫數數量不足足,規模模不大,覆蓋面面不廣,信息不不全,質質量不高高,利用用率低。(2)缺乏統統籌規劃劃,重復復建設現現象嚴重重,標準準化和規規范化較較低,封封閉現象象嚴重,兼容性性和共享享性

22、差。(3)數據庫庫內容以以文摘型型、題錄錄型為主主,而全全文數據據庫、多多媒體數數據庫比比重較低低。(4)數據庫庫建設和和管理不不規范,重建設設輕維護護,重形形式輕功功能,重重硬件輕輕軟件。三、中國國農業數數據庫第二節農農業數數據庫建建設(二)綜綜合性農農業數據據庫1.中國農業業科技文文獻數據據庫2.中國期刊刊全文數數據庫3.中文科技技期刊數數據庫4.全國報刊刊索引數數據庫(三)典典型農業業專題數數據庫1.中國作物物種質資資源數據據庫(CGRIS)2.中國農業業科學數數據中心心(agridata)3.熱帶農業業數據庫庫4.中國土壤壤數據庫庫5.資源環境境遙感數數據庫6.中國西南南藥用植植物資源

23、源數據庫庫7.中國經濟濟植物資資源數據據庫第三節農農業管管理信息息系統一、農業業管理信信息系統統的類型型二、農業業管理信信息系統統的構成成與開發發流程三、農業業管理信信息系統統的設計計與實現現第三節農農業管管理信息息系統一、農業業管理信信息系統統的類型型土地資源源信息系系統土壤資源源信息系系統水資源信信息系統統農業氣候候資源信信息系統統肥料資源源信息系系統農業種質質資源信信息系統統第三節農農業管管理信息息系統二、農業業管理信信息系統統的構成成與開發發流程農業管理理信息系系統AMIS是一個GIS專題信息息系統,由計算算機硬件件、計算算機軟件件、數據據、應用用模型和和系統組組織管理理者組成成農業管

24、理理信息系系統構成成框圖示示例第三節農農業管管理信息息系統二、農業業管理信信息系統統的構成成與開發發流程農業管理理信息系系統開發發過程包包括可行行性研究究、系統統分析、系統總總體方案案設計、系統技技術方案案分析、系統實實施、系系統評價價與維護護等6個階段第三節農農業管管理信息息系統三、農業業管理信信息系統統的設計計與實現現1.系統分析析(1)用戶類類型與需需求分析析(2)可行性性分析2.系統設計計系統功能能設計軟硬件選選擇3.系統應用用設計4.系統的組組織實現現農業管理理信息系系統基本本功能框框圖第四節農農業數數據處理理與統計計分析一、數據據處理與與統計軟軟件簡介介二、數據據處理軟軟件中數數據

25、文件件的基本本結構三、SAS程序簡介介四、用SAS進行數據據分析實實例第四節農農業數數據處理理與統計計分析一、數據據處理與與統計軟軟件簡介介類型功能軟件例舉文本編輯類使用基本文本格式創建和編輯文本文件,用于數據的錄入和管理EditPlus、EmEditor、UltraEdit等電子表格類數據的錄入和管理、基本的數據分析、簡單的圖表制作等Microsoft Office Excel 2003、WPS Office 2005金山表格等統計分析類數據訪問和錄入、數據管理、數據挖掘和分析、數據呈現等SAS、SPSS、STATA、Minitab、S-Plus、DPS等第四節農農業數數據處理理與統計計分析

26、一、數據據處理與與統計軟軟件簡介介SAS(StatisticalAnalysisSystem)是美國國SAS軟件研究究所研制制的一套套用于數數據分析析與決策策支持的的大型集集成式模模塊化軟軟件包,能夠完完成以數數據為中中心的四四大任務務:數據訪問問、數據據管理、數據分分析和數數據呈現現,廣泛泛應用于于政府行行政管理理、科研研、教育育、生產產和金融融等不同同領域。SAS系統中提提供的主主要分析析功能包包括統計計分析、經濟計計量分析析、時間間序列分分析、決決策分析析、財務務分析和和全面質質量管理理工具等等。SAS系統的功功能特點點:(1)模塊式式結構、把數據據管理和和數據分分析融為為一體;(2)數

27、據接接口豐富富;(3)語言編編程能力力強;(4)統計分分析方法法豐富,使用簡簡單。(一)SAS第四節農農業數數據處理理與統計計分析一、數據據處理與與統計軟軟件簡介介SPSS(StatisticalPackage fortheSocial Science)社會科學學統計軟軟件包是是美國SPSS公司開發發。SPSS forWindows是一個組組合式軟軟件包,集數據據整理、分析功功能于一一身。使使用Windows的窗口方方式展示示各種管管理和分分析數據據方法的的功能,使用對對話框展展示出各各種功能能選擇項項,分析析結果清清晰、直直觀、易易學易用用,可以以直接讀讀取EXCEL及DBF數據文件件。SP

28、SS的基本功功能包括括數據管管理、統統計分析析、圖表表分析、輸出管管理等等等。SPSS的主要缺缺點在于于它很難難與一般般辦公軟軟件如Office等直接兼兼容,在在撰寫報報告時往往往要用用電子表表格軟件件及專業業制圖軟軟件來重重新繪制制相關圖圖表;SPSS統計分析析功能與與SAS相比仍有有一定欠欠缺,但但由于操操作簡單單,已經經在我國國的社會會科學、自然科科學的各各個領域域發揮了了巨大作作用。(二)SPSS第四節農農業數數據處理理與統計計分析一、數據據處理與與統計軟軟件簡介介Stata最初由美美國計算算機資源源中心(ComputerResourceCenter)研制,現在為為Stata公司的產產

29、品,其其最新版版本為10.0版。Stata和SAS、SPSS一起,被被稱為新新的三大大權威統統計軟件件。Stata突出特點點是短小小精悍、功能強強大,包包含全部部的統計計分析、數據管管理和繪繪圖等功功能,其其統計分分析功能能極為全全面。Stata在分析時時將數據據全部讀讀入內存存,在計計算全部部完成后后才和磁磁盤交換換數據,因此運運算速度度極快。(三)Stata第四節農農業數數據處理理與統計計分析一、數據據處理與與統計軟軟件簡介介Stata的操作方方式以命命令行程序為為主,輔輔以菜單單操作系系統,其其命令語語句簡潔潔明快,命令設設置條理理性好,用戶極極易上手手。Stata的用戶接接口非常常簡潔

30、,數據格格式簡單單,分析析結果輸輸出簡潔潔明快,易于閱閱讀。Stata的另一個個特點是是他的許許多高級級統計模模塊均是是編程人人員用其其宏語言言寫成的的程序文文件(ADO文件),這些文文件可以以自行修修改、添添加和下下載。用用戶可隨隨時到Stata網站尋找找并下載載最新的的升級文文件。Stata已經在科科研、教教育領域域得到了了廣泛應應用,聯聯合國世世界衛生生組織(WHO)已將Stata作為主要要的統計計分析工工作軟件件。(三)Stata第四節農農業數數據處理理與統計計分析一、數據據處理與與統計軟軟件簡介介DPS是我國浙浙江大學學研制的的具有自自主知識識產權的的統計分分析軟件件。從20世紀90

31、年代開始始,DPS軟件功能能不斷擴擴充,不不斷地完完成了數數學生態態、生物物測定、地理統統計、遺遺傳育種種、生存存分析、水文頻頻率分析析、量表表分析、質量控控制圖、ROC曲線分析析等內容容,已成成為21世紀初期期國內統統計分析析功能最最全的軟軟件包。(四)DPS第四節農農業數數據處理理與統計計分析二、數據據處理軟軟件中數數據文件件的基本本結構統計分析析軟件對對數據文文件的組組織和管管理類似似于數據據庫管理理軟件可以形象象地將數數據集、數據文文件、數數據表等等看作一一個“表表”其中每一一行代表表一條信信息或一一個對象象,SAS中稱作觀觀測(Observation),SPSS中稱作事事件(Case

32、),這相相當于數數據庫中中的記錄錄(Record)如某一個個樣本、某一個個品種;每每一個觀觀測或事事件均有有相同數數量的列列,每一一列代表表一個變變量(Variable),每一一個變量量均表達達了單條條信息或或對象某某一方面面的屬性性,就相相當于數數據庫中中的字段段,如每每一個品品種均有有5個性狀,這5個性狀就就是5個變量。第四節農農業數數據處理理與統計計分析二、數據據處理軟軟件中數數據文件件的基本本結構例如,有有10個小麥品品系的株株高和千千粒重數數據如表表1所示。在在建立數數據文件件時,我我們不能能直接按按表1中的排列列填入數數據表,而應該該將每一一個品系系占一行行,株高高和千粒粒重分別別

33、占一列列。即:品系9702977498459832987699459979001200340067株高(cm)78798676828190738280千粒重(g)35434150423839434137VarHeightWeight970278359774794300678037至于變量量的名稱稱,不同同的統計計軟件對對變量名名稱的設設置方法法不同。一般情況況下,變變量的名名稱可以以用英文文縮寫或或漢語拼拼音,長長度不超超過8個字符,大小寫寫具有同同樣的功功效。為便于各各種軟件件之間的的數據交交換,不不推薦使使用漢字字作為變變量名稱稱。第四節農農業數數據處理理與統計計分析二、數據據處理軟軟件中

34、數數據文件件的基本本結構有時原始始數據與與表的形形式差距距較大,這就需需要一定定的方法法構造便便于進行行數據分分析的數數據結構構。培養液盆 號123123123生長量5035 45 5055 55 8565 72 5535 40 45 60 45 60 70 70 40 30 40 50 50 65 90 80 68 354050455055856573TreatPotRepeatGrowthA1150A1255A1340A1435A2135A2235C2380C2465C3172C3270C3368C3473如在溫室室內以3種培養液液培養某某作物,每種3盆,每盆盆4株,一個個月后測測定其株株

35、高生長長量(mm),每盆盆測定4株,得結結果見表表。第四節農農業數數據處理理與統計計分析二、數據據處理軟軟件中數數據文件件的基本本結構統計分析析軟件具具有較好好的辨識識和處理理缺失數數據的功功能。如果原始始數據中中某些變變量存在在缺失值值,在建建立數據據表時應應該給以以恰當的的標識,在SAS、SPSS等常用統統計軟件件中用英英文點號號“”表表示缺失失數據,不能簡簡單地將將缺失寫寫成0。例如,計計算5名學生的的的選修修課成績績,原始始數據如如表所示示NO.NameEnglishAgronomyComputerStatisticsChinese4張三76858998508李四.6769899813

36、王五87.964924劉六459078.8927趙七67.91第四節農農業數數據處理理與統計計分析三、SAS程序簡介介(一)SAS數據步SAS數據步就就是把原原始數據據作為輸輸入,建建立SAS數據集,為過程程步準備備數據。建立SAS數據集有有多種途途徑,下下面只介介紹在編編輯(editor)窗口直直接建立立數據集集的方法法。數據步的的語句和和結構為為:DATA數據集名名;INPUT變量列表表;CARDS;數據塊;RUN;第四節農農業數數據處理理與統計計分析(二)SAS過程步三、SAS程序簡介介SAS過程步用用來調用用系統提提供的標標準過程程和統計計分析過過程,對對指定的的SAS數據集進進行處理

37、理,并將將結果輸輸出到OUTPUT窗口。一個過程程步是一一個功能能程序模模塊,調調用不同同的過程程可實現現用不同同方法對對數據進進行分析析。SAS過程步的的一般形形式為:PROC過程名選選擇項項;其他相關關過程步步語句;RUN;第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例(一)t測驗和方方差分析析1)用MEANS過程作t測驗1.t測驗例如:某某小小麥良種種的千粒粒重0=34g,現自外外地引入入一高產產品種,在8個小區種種植,得得其千粒粒重(g)為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問新引引入品種種的千粒粒重與當當地良種種有無

38、顯顯著差異異?第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例(一)t測驗和方方差分析析2)用TTEST過程程作t測測驗1.t測驗例如:調調查某生生產隊每每畝30萬苗和35萬苗的稻稻田各5塊,得30萬苗畝產產量(斤斤)分別別為:800,840,870,920,850;35萬苗畝產產量(斤斤)分別別為:900,880,890,890,840。試測驗驗兩種畝畝產量的的差異顯顯著性。第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實

39、實例(一)t測驗和方方差分析析2.方差分析析研究6種氮肥施施用法對對小麥的的效應(下表),每種種施肥法法種5盆小麥,完全隨隨機設計計,最后后測定它它們的含含氮量(mg)。試作作方差分分析。(1)單向分分組資料料的方差差分析舉舉例12345612.914.012.610.514.614.012.313.8 3.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.413.7第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例(一)t測驗和方方差分析析2.方差分析析有一小麥麥品

40、種比比較試驗驗,共有有8個品種,其中A是標準品品種,采采用隨機機區組設設計,重重復3次,小區區計產面面積200平方尺,其產量量見表,試作方方差分析析。(2)兩向分分組資料料的方差差分析舉舉例區 組品 種ABCDEFGHI10.910.810.110.09.3II9.112.312.510.713.910.611.510.4III12.214.010.510.116.811.814.114.4第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例(二)相相關和回回歸分析析1.相關分析析一些夏季季害蟲盛盛發期的的早遲和和春季溫溫度高低低有關。已測定定3月下旬至至

41、4月中旬旬旬平均溫溫度累積積值(x,單位:旬.度)和一一代三化化螟蛾盛盛發期(y,以5月10日為0)的數據據(下表表)。試試計算x和y的相關系系數。X累積溫35.534.131.740.336.840.231.739.244.2Y盛發期12169273139-1累積溫和和一代三三化螟蛾蛾盛發期期的關系系數據第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例(二)相相關和回回歸分析析2.線性回歸歸分析(1)線形回回歸分析析例:測測定13塊中秈南南京11號高產田田的每畝畝穗數(x1,單位:萬)、每穗粒粒數(x2)和每畝畝稻谷產產量(y,單位:斤),得結果果如下表表。試分分析每畝畝

42、穗數、每穗粒粒數和畝畝產量間間的相關關。x1x2Yx1x2Yx1x2Y26.773.4100833.864.6110331.561.1100431.359.095930.462.199233.156.099530.465.9105127.071.494534.059.8104533.958.2102233.364.5107434.664.6109730.464.11029第四節農農業數數據處理理與統計計分析四、用SAS進行數據據分析實實例(二)相相關和回回歸分析析(2)逐步回回歸分析析例:基基本建建設的規規模必須須與國家家的財力力物力相相適應,才能保保證國民民經濟穩穩步增長長。影響響基本建建設

43、規模模(y,億元)的因素素較多,根據定定性分析析結果,選擇其其主要因因素有:國民收收入使用用額(x1,億元),積累累率(x2,%),財政政收入(x3,億元),儲蓄蓄(x4,億元)。原始始數據見見下表。試用逐逐步回歸歸分析擬擬合“最最優”回回歸模型型。年份x1x2x3x4Y年份x1x2x3x4y195260721.4183.78.643.561968140921.1361.378.3113.06195372723.1222.912.390.441969153723.2526.875.9200.83195476525.5262.415.999.071970187632.9662.979.5312.55195580722.9272.019.9100.361971200834.17

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論