农业信息技术chapter3农业数据库系统_第1页
农业信息技术chapter3农业数据库系统_第2页
农业信息技术chapter3农业数据库系统_第3页
农业信息技术chapter3农业数据库系统_第4页
农业信息技术chapter3农业数据库系统_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、农业信息技术第三章农农业数数据库系系统3数据库系系统概述述农业数据据库建设设农业管理理信息系系统农业数据据处理与与统计分分析第一节数据库系系统概述述一、数据据库系统统的构成成与特点点二、数据据库管理理系统三、数据据库中的的数据模模型四、数据据库设计计第一节数据库系系统概述述一、数据据库系统统的构成成与特点点(一)数数据管理理与数据据库系统统数据管理理技术是是指对数数据进行行分类、编码、存储、检索和和维护,它是数数据处理理的中心心问题。数据管理理技术经经历了人人工管理理、文件件系统、数据库库系统、高级数数据库等等发展阶阶段。数据库系系统(databasesystems)是计算算机应用用系统中中一

2、种专专门管理理数据资资源的系系统,由由数据库库、数据据库管理理系统和和用户应应用三部部分组成成。第一节数据库系系统概述述数据库(database,DB)是按照照数据结结构来组组织、存存储和管管理数据据的仓库库。详细讲,数据库库是长期期存储在在计算机机内、与与应用彼彼此独立立的、以以一定的的组织方方式存储储在一起起的、彼彼此相互互关联的的、具有有较少冗冗余的、能被多多个用户户共享的的数据集集合。数据库类类型多样样,有最最简单的的存储各各种数据据的表格格,也有有存储海海量数据据的大型型数据库库系统,有文字字型、数数字型、图像型型和声音音型等不不同数据据形式。多媒体数数据库(MultimediaDa

3、taBase,MDB)能提供供图像、文本、声音等等信息的的全方位位“立体体化”的的服务方方式。一、数据据库系统统的构成成与特点点(一)数数据管理理与数据据库系统统第一节数据库系系统概述述一、数据据库系统统的构成成与特点点(一)数数据管理理与数据据库系统统分类标准类 别用户数量单用户数据库 多用户数据库数据类型和表现形式文献型数据库 数值型数据库 事实型数据库文本型数据库 它们的结合型数据库数据存诸介质类型磁带数据库 硬盘数据库 光盘数据库数据结构和存取方法关系型数据库 层次型数据库 网络型数据库数据存放地点集中式数据库 分布式数据库第一节数据库系系统概述述一、数据据库系统统的构成成与特点点(一

4、)数数据管理理与数据据库系统统数据库是是为获取取数据而而设计,而数据据仓库是是为分析析数据而而设计。数据仓库库(Data warehouse,DW)是决策策支持系系统和联联机分析析应用数数据源的的结构化化数据环环境,是是一个面面向主题题的、集集成的、相对稳稳定的、反映历历史变化化的数据据集合,用于支支持管理理决策。数据仓库库系统是是一个信信息提供供平台,包含数数据获取取(Data Acquisition)、数据据存储(Data Storage)、数据据访问(Data Access)三个关关键部分分,为用用户提供供各种手手段从数数据中获获取信息息和知识识。第一节数据库系系统概述述(二)数数据库系

5、系统的构构成一、数据据库系统统的构成成与特点点数据库系系统简图图数据库用户 软件 硬件 终端用户户应用程序序员数据库管管理员数据库管管理系统统DBMS存储数据据库运行DBMS(包括操作作系统)的硬件资资源第一节数据库系系统概述述(二)数数据库系系统的构构成一、数据据库系统统的构成成与特点点数据库系系统的4个组成部部分构成成了一个个复杂的的层次系系统第一节数据库系系统概述述(三)数数据库系系统的特特点一、数据据库系统统的构成成与特点点(1)数据的的结构化化(2)数据共共享性好好(3)数据独独立性好好(4)用户接接口简单单(4)系统运运行可靠靠(5)能够重重组数据据(6)基于某某种数据据模型,能够

6、充充分描述述数据间间的内在在联系第一节数据库系系统概述述二、数据据库管理理系统数据库管管理系统统(Data BaseManagementSystem,DBMS)是一种种操纵和和管理数数据库的的大型软软件,用用于建立立、使用用和维护护数据库库,对数数据库进进行统一一的管理理和控制制,以保保证数据据库的安安全性和和完整性性。用户通过过DBMS访问数据据库中的的数据,数据库库管理员员也通过过DBMS进行数据据库的维维护工作作。第一节数据库系系统概述述二、数据据库管理理系统(一)数数据库管管理系统统的功能能(1)数据定定义功能能(2)数据存存取功能能(3)数据库库运行管管理功能能(4)数据库库建立和和

7、维护功功能(5)数据库库的传输输第一节数据库系系统概述述二、数据据库管理理系统(二)数数据库管管理系统统的层次次结构根据处理理对象的的不同,数据库库管理系系统的层层次结构构由高级级到低级级依次为为应用层语言翻译译处理层层数据存取取层数据存储储层操作系统统第一节数据库系系统概述述(三)常常用的数数据库管管理系统统二、数据据库管理理系统(1)Oracle(2)MicrosoftSQL Server(3)MicrosoftAccess第一节数据库系系统概述述三、数据据库中的的数据模模型在数据库库中用数数据模型型(data model)来抽象象、表示示和处理理现实世世界中的的数据和和信息。数据模型型是

8、指描描述反映映客观事事物的数数据及其其联系。按照应用用层次,数据模模型分为为概念数数据模型型、逻辑辑数据模模型和物物理数据据模型等等三类。第一节数据库系系统概述述三、数据据库中的的数据模模型(一)概概念模型型概念数据据模型也也称信息息模型,它是按按用户的的观点来来对数据据和信息息建模,主要用用于数据据库设计计。是现实世世界到机机器世界界的一个个中间层层次,是是数据库库设计的的有力工工具。它它不依赖赖于某个个DBMS支持的数数据模型型,同时时又可以以转换为为某一DBMS支持的特特定数据据模型。概念模型型的特点点是:具具有较强强的语义义表达能能力,能能够方便便、直接接地表达达应用中中的各种种语义知

9、知识;简简单、清清晰、易易于用户户理解,是用户户与数据据设计人人员之间间进行交交流的语语言。第一节数据库系系统概述述三、数据据库中的的数据模模型(一)概概念模型型1.信息世界界中的基基本概念念2.概念模型型的表示示方法(1)实体(2)属性(3)键(4)域(5)实体型型(6)实体集集(7)关联E-R方法称为为实体-联系方法法(Entity-Relationship Approach),该方方法能够够方便、准确地地表示出出上述信信息世界界中常用用的概念念,它用用E-R图来描述述现实世世界的概概念模型型。E-R方法也称称为E-R模型,它它是概念念模型常常用的方方法。此外,还还有扩充充的E-R模型、面

10、面向对象象模型及及谓词模模型等。第一节数据库系系统概述述三、数据据库中的的数据模模型(二)数数据模型型逻辑数据据模型又又被简称称为数据据模型,主要包包括网状状模型,层次模模型,关关系模型型等,它它是按计计算机系系统的观观点对数数据建模模,主要要用于DBMS的实现。层次模型型、网状状模型是是早期的的数据模模型。通通常把它它们称为为格式化化数据模模型,因因为它们们是属于于以“图图论”为为基础的的表示方方式。关关系模型型是用“二维表表”(或或称关系系)来表表示数据据之间的的联系。第一节数据库系系统概述述三、数据据库中的的数据模模型(二)数数据模型型1.层次模型型层次数据据模型实实质上是是一种有有根结

11、点点的定向向有序树树(在数数学中“树”被被定义为为一个无无回的连连通图),即用用“树”结构表表示实体体集之间间的关联联,其中中实体集集(用矩矩形框表表示)为为结点,而树中中各结点点之间的的连线表表示它们们之间的的关联。根据“树树”结构构的特点点,建立立数据的的层次模模型需要要满足下下列两个个条件:有且且仅有一一个结点点无“父父”结点点称为根根结点;其他他数据记记录有且且只有一一个“父父”结点点。按照照层次模模型建立立的数据据库系统统称为层层次模型型数据库库系统,其典型型代表是是管理信信息系统统(Management Information System,MIS)。第一节数据库系系统概述述三、数

12、据据库中的的数据模模型(二)数数据模型型1.层次模型型不能很好好的表示示两个以以上实体体型之间间的复杂杂关联和和实体型型之间多多对多关关联优点数据模型型简单对具有一一对多的的层次关关系描述述自然、直观,容易理理解性能优于于关系模模型,不不低于网网状模型型层次数据据模型提提供了良良好的完完整性支支持缺点第一节数据库系系统概述述三、数据据库中的的数据模模型(二)数数据模型型2.网状模型型能很好地地解决了了实体间间复杂关关系的表表达问题题有致命的的弱点,即当需需求扩展展时,对对原有数数据结构构及应用用程序的的修改会会产生严严重的后后果网状模型型的特点点:可以以有一个个以上的的结点无无“父”;至少少有

13、一个个结点有有多于一一个的“父”按照网状状数据结结构建立立的数据据库系统统称为网网状数据据库系统统,其典典型代表表是DBTG(Data BaseTaskGroup)用数学方方法可将将网状数数据结构构转化为为层次数数据结构构第一节数据库系系统概述述三、数据据库中的的数据模模型(二)数数据模型型3.关系模型型关系模型型是以人人们经常常使用的的二维表表格形式式来表示示实体本本身及其其相互之之间的关关联,它它以关系系理论为为坚实的的基础,是经典典数据模模型中建建模能力力最强的的一种,对于各各种类型型数据联联系都可可描述,成为当当今实用用数据库库系统的的主流。在关系模模型中,把数据据看成一一个二维维表格

14、,每个二二维表格格就是一一个关系系,由多多列和多多行组成成,每列列描述实实体的一一个属性性,每行行描述一一个具体体实体。对于一个个表示关关系的二二维表格格,其最最基本的的要求是是,不允允许表中中再有表表。第一节数据库系系统概述述三、数据据库中的的数据模模型(二)数数据模型型3.关系模型型一个关系系称为一一个数据据库,若若干个数数据库可可以构成成一个数数据库系系统。在关系数数据库中中,对数数据的操操作几乎乎全部建建立在一一个或多多个关系系表格上上,通过过对这些些关系表表格的分分类、合合并、连连接或选选取等运运算来实实现数据据的管理理。由关系数数据结构构组成的的数据库库系统被被称为关关系数据据库系

15、统统。第一节数据库系系统概述述三、数据据库中的的数据模模型(二)数数据模型型3.关系模型型优点缺点 数据据结构简简单 具有有很高的的数据独独立性 可以以直接描描述多对对多的关关联 有坚坚实的理理论基础础当数据库库很大时时,查找找满足特特定关系系的数据据费时,对空间间关系无无法满足足。第一节数据库系系统概述述四、数据据库设计计(一)数数据库设设计的步步骤第一节数据库系系统概述述(二)概概念结构构设计四、数据据库设计计概念模型型是对实实际应用用对象形形象而又又具体的的描述概念结构构设计要要借助于于某种方方便又直直观的描描述工具具。E-R图提供了了表示实实体型、属性和和关联的的方法(如图):实体型属

16、性关联某校教学学管理数数据库的的E-R图E-R图中的关关系连线线上的“1”、“0”,表示实实体的最最小基数数,菱形形框内的的数字表表示的是是最大基基数。“1”,表示在在关联中中这一侧侧必须存存在一个个实体,“0”表示实体体可以不不存在。第一节数据库系系统概述述(三)关关系数据据库设计计四、数据据库设计计关系数据据库就是是依据关关系模型型建立的的数据库库。将E-R数据模型型转化为为关系模模型的过过程,可可分为以以下3个步骤:将用E-R图描述的的数据库库概念模模型转化化一组关关系模式式根据关系系型数据据库规范范化理论论对这组组关系模模式进行行规范化化处理根据数据据库的完完整性和和一致性性要求以以及

17、系统统查询效效率要求求,对所所得模式式进行优优化第二节农农业数数据库建建设一、农业业数据库库的类型型二、国外外农业数数据库三、中国国农业数数据库第二节农农业数数据库建建设一、农业业数据库库的类型型农业资源源数据库库地理资源源数据库库种质资源源数据库库基因资源源数据库库人力资源源数据库库农业技术术数据库库农业统计计数据库库企业与产产品数据据库生产信息息统计数数据库农业气象象资料数数据库农业生产产数据库库农业企业业与产品品数据库库农业市场场信息数数据库农业政策策法规数数据库农业科技技文献数数据库第二节农农业数数据库建建设二、国外外农业数数据库(一)国国外数据据库发展展概况国外的数数据库建建设起步步

18、较早,在20世纪60年代中期期,美国国就开始始了数据据库方面面的建设设;70年代中期期,欧洲洲各国和和日本相相继建立立和发展展了本国国的数据据库;到了80年代后期期,数据据库联机机检索系系统开始始在经济济发达国国家兴起起,这时时出现了了光盘数数据库。随后,伴伴随计算算机技术术及互联联网的快快速发展展,农业业数据库库的发展展除了在在光盘数数据库、网络在在线数据据库等方方面不断断发展壮壮大以外外,各国国农业信信息网络络系统也也在不断断涌现。目前,国国际上最最著名的的农业数数据库系系统是CABI、AGRICOLA、AGRIS三大数据据库。第二节农农业数数据库建建设二、国外外农业数数据库(二)国国外农

19、业业文摘数数据库1.CAB Abstracts2.AGRICOLA3.AGRIS4.FSTA5.Pest-Bank6.BIOSIS Previews7.TROPAG &RURAL8.ZoologicalRecords9.DerwentBiotechnology Abstracts10.FOODLINE11.WilsonBiological &Agricultural Index12.PollutionandToxicology13.ASFA第二节农农业数数据库建建设二、国外外农业数数据库(三)国国外农业业全文数数据库1.EBSCO全文数据据库2.ScienceDirect电子期刊刊数据库库3.

20、ProQuest博硕士论论文全文文数据库库4.AnnualReviews电子期刊刊5.Blackwell出版社电电子期刊刊6.SpringerLink(Springer出版社电电子期刊刊数据库库)7.ProQuest生物和农农业全文文期刊数数据库8.BioOne全文数据据库9.Nature系列电子子期刊10.ASABETechnical Library11.Taylor &Francis农业百科科全文数数据库12.OECD农业与食食品数据据库和电电子图书书资源13.CABIPublishing Journals(Your Journals OVID)14.Taylor &FrancisJour

21、nalsOnline三、中国国农业数数据库第二节农农业数数据库建建设(一)中中国农业业数据库库建设概概况经过了70年代的起起步、80年代上半半期的普普及阶段段后,从从1987年进入数数据库的的提高阶阶段,到到现在数数据库的的建设已已进入快快速发展展的时代代。中国国农业信信息方面面的数据据库建设设不断发发展进步步,经历历了从题题录文献献库到全全文库,从光盘盘库到网网络库的的发展。主要问题题是:(1)农业数数据库数数量不足足,规模模不大,覆盖面面不广,信息不不全,质质量不高高,利用用率低。(2)缺乏统统筹规划划,重复复建设现现象严重重,标准准化和规规范化较较低,封封闭现象象严重,兼容性性和共享享性

22、差。(3)数据库库内容以以文摘型型、题录录型为主主,而全全文数据据库、多多媒体数数据库比比重较低低。(4)数据库库建设和和管理不不规范,重建设设轻维护护,重形形式轻功功能,重重硬件轻轻软件。三、中国国农业数数据库第二节农农业数数据库建建设(二)综综合性农农业数据据库1.中国农业业科技文文献数据据库2.中国期刊刊全文数数据库3.中文科技技期刊数数据库4.全国报刊刊索引数数据库(三)典典型农业业专题数数据库1.中国作物物种质资资源数据据库(CGRIS)2.中国农业业科学数数据中心心(agridata)3.热带农业业数据库库4.中国土壤壤数据库库5.资源环境境遥感数数据库6.中国西南南药用植植物资源

23、源数据库库7.中国经济济植物资资源数据据库第三节农农业管管理信息息系统一、农业业管理信信息系统统的类型型二、农业业管理信信息系统统的构成成与开发发流程三、农业业管理信信息系统统的设计计与实现现第三节农农业管管理信息息系统一、农业业管理信信息系统统的类型型土地资源源信息系系统土壤资源源信息系系统水资源信信息系统统农业气候候资源信信息系统统肥料资源源信息系系统农业种质质资源信信息系统统第三节农农业管管理信息息系统二、农业业管理信信息系统统的构成成与开发发流程农业管理理信息系系统AMIS是一个GIS专题信息息系统,由计算算机硬件件、计算算机软件件、数据据、应用用模型和和系统组组织管理理者组成成农业管

24、理理信息系系统构成成框图示示例第三节农农业管管理信息息系统二、农业业管理信信息系统统的构成成与开发发流程农业管理理信息系系统开发发过程包包括可行行性研究究、系统统分析、系统总总体方案案设计、系统技技术方案案分析、系统实实施、系系统评价价与维护护等6个阶段第三节农农业管管理信息息系统三、农业业管理信信息系统统的设计计与实现现1.系统分析析(1)用户类类型与需需求分析析(2)可行性性分析2.系统设计计系统功能能设计软硬件选选择3.系统应用用设计4.系统的组组织实现现农业管理理信息系系统基本本功能框框图第四节农农业数数据处理理与统计计分析一、数据据处理与与统计软软件简介介二、数据据处理软软件中数数据

25、文件件的基本本结构三、SAS程序简介介四、用SAS进行数据据分析实实例第四节农农业数数据处理理与统计计分析一、数据据处理与与统计软软件简介介类型功能软件例举文本编辑类使用基本文本格式创建和编辑文本文件,用于数据的录入和管理EditPlus、EmEditor、UltraEdit等电子表格类数据的录入和管理、基本的数据分析、简单的图表制作等Microsoft Office Excel 2003、WPS Office 2005金山表格等统计分析类数据访问和录入、数据管理、数据挖掘和分析、数据呈现等SAS、SPSS、STATA、Minitab、S-Plus、DPS等第四节农农业数数据处理理与统计计分析

26、一、数据据处理与与统计软软件简介介SAS(StatisticalAnalysisSystem)是美国国SAS软件研究究所研制制的一套套用于数数据分析析与决策策支持的的大型集集成式模模块化软软件包,能够完完成以数数据为中中心的四四大任务务:数据访问问、数据据管理、数据分分析和数数据呈现现,广泛泛应用于于政府行行政管理理、科研研、教育育、生产产和金融融等不同同领域。SAS系统中提提供的主主要分析析功能包包括统计计分析、经济计计量分析析、时间间序列分分析、决决策分析析、财务务分析和和全面质质量管理理工具等等。SAS系统的功功能特点点:(1)模块式式结构、把数据据管理和和数据分分析融为为一体;(2)数

27、据接接口丰富富;(3)语言编编程能力力强;(4)统计分分析方法法丰富,使用简简单。(一)SAS第四节农农业数数据处理理与统计计分析一、数据据处理与与统计软软件简介介SPSS(StatisticalPackage fortheSocial Science)社会科学学统计软软件包是是美国SPSS公司开发发。SPSS forWindows是一个组组合式软软件包,集数据据整理、分析功功能于一一身。使使用Windows的窗口方方式展示示各种管管理和分分析数据据方法的的功能,使用对对话框展展示出各各种功能能选择项项,分析析结果清清晰、直直观、易易学易用用,可以以直接读读取EXCEL及DBF数据文件件。SP

28、SS的基本功功能包括括数据管管理、统统计分析析、图表表分析、输出管管理等等等。SPSS的主要缺缺点在于于它很难难与一般般办公软软件如Office等直接兼兼容,在在撰写报报告时往往往要用用电子表表格软件件及专业业制图软软件来重重新绘制制相关图图表;SPSS统计分析析功能与与SAS相比仍有有一定欠欠缺,但但由于操操作简单单,已经经在我国国的社会会科学、自然科科学的各各个领域域发挥了了巨大作作用。(二)SPSS第四节农农业数数据处理理与统计计分析一、数据据处理与与统计软软件简介介Stata最初由美美国计算算机资源源中心(ComputerResourceCenter)研制,现在为为Stata公司的产产

29、品,其其最新版版本为10.0版。Stata和SAS、SPSS一起,被被称为新新的三大大权威统统计软件件。Stata突出特点点是短小小精悍、功能强强大,包包含全部部的统计计分析、数据管管理和绘绘图等功功能,其其统计分分析功能能极为全全面。Stata在分析时时将数据据全部读读入内存存,在计计算全部部完成后后才和磁磁盘交换换数据,因此运运算速度度极快。(三)Stata第四节农农业数数据处理理与统计计分析一、数据据处理与与统计软软件简介介Stata的操作方方式以命命令行程序为为主,辅辅以菜单单操作系系统,其其命令语语句简洁洁明快,命令设设置条理理性好,用户极极易上手手。Stata的用户接接口非常常简洁

30、,数据格格式简单单,分析析结果输输出简洁洁明快,易于阅阅读。Stata的另一个个特点是是他的许许多高级级统计模模块均是是编程人人员用其其宏语言言写成的的程序文文件(ADO文件),这些文文件可以以自行修修改、添添加和下下载。用用户可随随时到Stata网站寻找找并下载载最新的的升级文文件。Stata已经在科科研、教教育领域域得到了了广泛应应用,联联合国世世界卫生生组织(WHO)已将Stata作为主要要的统计计分析工工作软件件。(三)Stata第四节农农业数数据处理理与统计计分析一、数据据处理与与统计软软件简介介DPS是我国浙浙江大学学研制的的具有自自主知识识产权的的统计分分析软件件。从20世纪90

31、年代开始始,DPS软件功能能不断扩扩充,不不断地完完成了数数学生态态、生物物测定、地理统统计、遗遗传育种种、生存存分析、水文频频率分析析、量表表分析、质量控控制图、ROC曲线分析析等内容容,已成成为21世纪初期期国内统统计分析析功能最最全的软软件包。(四)DPS第四节农农业数数据处理理与统计计分析二、数据据处理软软件中数数据文件件的基本本结构统计分析析软件对对数据文文件的组组织和管管理类似似于数据据库管理理软件可以形象象地将数数据集、数据文文件、数数据表等等看作一一个“表表”其中每一一行代表表一条信信息或一一个对象象,SAS中称作观观测(Observation),SPSS中称作事事件(Case

32、),这相相当于数数据库中中的记录录(Record)如某一个个样本、某一个个品种;每每一个观观测或事事件均有有相同数数量的列列,每一一列代表表一个变变量(Variable),每一一个变量量均表达达了单条条信息或或对象某某一方面面的属性性,就相相当于数数据库中中的字段段,如每每一个品品种均有有5个性状,这5个性状就就是5个变量。第四节农农业数数据处理理与统计计分析二、数据据处理软软件中数数据文件件的基本本结构例如,有有10个小麦品品系的株株高和千千粒重数数据如表表1所示。在在建立数数据文件件时,我我们不能能直接按按表1中的排列列填入数数据表,而应该该将每一一个品系系占一行行,株高高和千粒粒重分别别

33、占一列列。即:品系9702977498459832987699459979001200340067株高(cm)78798676828190738280千粒重(g)35434150423839434137VarHeightWeight970278359774794300678037至于变量量的名称称,不同同的统计计软件对对变量名名称的设设置方法法不同。一般情况况下,变变量的名名称可以以用英文文缩写或或汉语拼拼音,长长度不超超过8个字符,大小写写具有同同样的功功效。为便于各各种软件件之间的的数据交交换,不不推荐使使用汉字字作为变变量名称称。第四节农农业数数据处理理与统计计分析二、数据据处理软软件中

34、数数据文件件的基本本结构有时原始始数据与与表的形形式差距距较大,这就需需要一定定的方法法构造便便于进行行数据分分析的数数据结构构。培养液盆 号123123123生长量5035 45 5055 55 8565 72 5535 40 45 60 45 60 70 70 40 30 40 50 50 65 90 80 68 354050455055856573TreatPotRepeatGrowthA1150A1255A1340A1435A2135A2235C2380C2465C3172C3270C3368C3473如在温室室内以3种培养液液培养某某作物,每种3盆,每盆盆4株,一个个月后测测定其株株

35、高生长长量(mm),每盆盆测定4株,得结结果见表表。第四节农农业数数据处理理与统计计分析二、数据据处理软软件中数数据文件件的基本本结构统计分析析软件具具有较好好的辨识识和处理理缺失数数据的功功能。如果原始始数据中中某些变变量存在在缺失值值,在建建立数据据表时应应该给以以恰当的的标识,在SAS、SPSS等常用统统计软件件中用英英文点号号“”表表示缺失失数据,不能简简单地将将缺失写写成0。例如,计计算5名学生的的的选修修课成绩绩,原始始数据如如表所示示NO.NameEnglishAgronomyComputerStatisticsChinese4张三76858998508李四.6769899813

36、王五87.964924刘六459078.8927赵七67.91第四节农农业数数据处理理与统计计分析三、SAS程序简介介(一)SAS数据步SAS数据步就就是把原原始数据据作为输输入,建建立SAS数据集,为过程程步准备备数据。建立SAS数据集有有多种途途径,下下面只介介绍在编编辑(editor)窗口直直接建立立数据集集的方法法。数据步的的语句和和结构为为:DATA数据集名名;INPUT变量列表表;CARDS;数据块;RUN;第四节农农业数数据处理理与统计计分析(二)SAS过程步三、SAS程序简介介SAS过程步用用来调用用系统提提供的标标准过程程和统计计分析过过程,对对指定的的SAS数据集进进行处理

37、理,并将将结果输输出到OUTPUT窗口。一个过程程步是一一个功能能程序模模块,调调用不同同的过程程可实现现用不同同方法对对数据进进行分析析。SAS过程步的的一般形形式为:PROC过程名选选择项项;其他相关关过程步步语句;RUN;第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例(一)t测验和方方差分析析1)用MEANS过程作t测验1.t测验例如:某某小小麦良种种的千粒粒重0=34g,现自外外地引入入一高产产品种,在8个小区种种植,得得其千粒粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引引入品种种的千粒粒重与当当地良种种有无

38、显显著差异异?第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例(一)t测验和方方差分析析2)用TTEST过程程作t测测验1.t测验例如:调调查某生生产队每每亩30万苗和35万苗的稻稻田各5块,得30万苗亩产产量(斤斤)分别别为:800,840,870,920,850;35万苗亩产产量(斤斤)分别别为:900,880,890,890,840。试测验验两种亩亩产量的的差异显显著性。第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实

39、实例(一)t测验和方方差分析析2.方差分析析研究6种氮肥施施用法对对小麦的的效应(下表),每种种施肥法法种5盆小麦,完全随随机设计计,最后后测定它它们的含含氮量(mg)。试作作方差分分析。(1)单向分分组资料料的方差差分析举举例12345612.914.012.610.514.614.012.313.8 3.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.413.7第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例(一)t测验和方方差分析析2.方差分析析有一小麦麦品

40、种比比较试验验,共有有8个品种,其中A是标准品品种,采采用随机机区组设设计,重重复3次,小区区计产面面积200平方尺,其产量量见表,试作方方差分析析。(2)两向分分组资料料的方差差分析举举例区 组品 种ABCDEFGHI10.910.810.110.09.3II9.112.312.510.713.910.611.510.4III12.214.010.510.116.811.814.114.4第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例(二)相相关和回回归分析析1.相关分析析一些夏季季害虫盛盛发期的的早迟和和春季温温度高低低有关。已测定定3月下旬至至

41、4月中旬旬旬平均温温度累积积值(x,单位:旬.度)和一一代三化化螟蛾盛盛发期(y,以5月10日为0)的数据据(下表表)。试试计算x和y的相关系系数。X累积温35.534.131.740.336.840.231.739.244.2Y盛发期12169273139-1累积温和和一代三三化螟蛾蛾盛发期期的关系系数据第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例(二)相相关和回回归分析析2.线性回归归分析(1)线形回回归分析析例:测测定13块中籼南南京11号高产田田的每亩亩穗数(x1,单位:万)、每穗粒粒数(x2)和每亩亩稻谷产产量(y,单位:斤),得结果果如下表表。试分分析每亩亩

42、穗数、每穗粒粒数和亩亩产量间间的相关关。x1x2Yx1x2Yx1x2Y26.773.4100833.864.6110331.561.1100431.359.095930.462.199233.156.099530.465.9105127.071.494534.059.8104533.958.2102233.364.5107434.664.6109730.464.11029第四节农农业数数据处理理与统计计分析四、用SAS进行数据据分析实实例(二)相相关和回回归分析析(2)逐步回回归分析析例:基基本建建设的规规模必须须与国家家的财力力物力相相适应,才能保保证国民民经济稳稳步增长长。影响响基本建建设

43、规模模(y,亿元)的因素素较多,根据定定性分析析结果,选择其其主要因因素有:国民收收入使用用额(x1,亿元),积累累率(x2,%),财政政收入(x3,亿元),储蓄蓄(x4,亿元)。原始始数据见见下表。试用逐逐步回归归分析拟拟合“最最优”回回归模型型。年份x1x2x3x4Y年份x1x2x3x4y195260721.4183.78.643.561968140921.1361.378.3113.06195372723.1222.912.390.441969153723.2526.875.9200.83195476525.5262.415.999.071970187632.9662.979.5312.55195580722.9272.019.9100.361971200834.17

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论