生物统计学第一章绪论 ppt课件_第1页
生物统计学第一章绪论 ppt课件_第2页
生物统计学第一章绪论 ppt课件_第3页
生物统计学第一章绪论 ppt课件_第4页
生物统计学第一章绪论 ppt课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 生物统计学 生命科学学院 2 第一章概论 学习要求 第一 掌握生物统计学的基本概念 第二 掌握生物统计学的主要内容 第三 了解生物统计学的基本作用 第四 了解生物统计学的发展概况 第五 掌握统计学常用的术语 3 1 1 生物统计学的概念生物统计学的概念 统计学(统计学(statisticsstatistics):把数学的语):把数学的语 言引入具体的科研领域,将所研究的言引入具体的科研领域,将所研究的 问题抽象为数学问题的过程,是搜集问题抽象为数学问题的过程,是搜集 、分析和解释数据的一门科学。、分析和解释数据的一门科学。 4 1 1 生物统计学的概念生物统计学的概念 生物统计学(生物统计学(biostatisticsbiostatistics):是用数):是用数 理统计(理统计(mathematical statisticsmathematical statistics)的)的 原理和方法来分析和解释生物界各种现象原理和方法来分析和解释生物界各种现象 和试验调查资料,是研究生命过程中以样和试验调查资料,是研究生命过程中以样 本来推断总体的一门学科。本来推断总体的一门学科。 5 2 2 生物统计学的内容与作用生物统计学的内容与作用 生物统计学的基本内容生物统计学的基本内容: : 试验设计(试验设计(experimental designexperimental design) 统计分析(统计分析(statistical analysisstatistical analysis) 6 2 2 生物统计学的内容与作用生物统计学的内容与作用 生物统计学的基本内容生物统计学的基本内容: : 试验设计试验设计主要包括试验设计的基本原主要包括试验设计的基本原 则、试验设计方案的制定及常用试验则、试验设计方案的制定及常用试验 设计的方法。设计的方法。 目的要求是:降低试验误差,使我们目的要求是:降低试验误差,使我们 可以利用较少的人力、物力和时间,可以利用较少的人力、物力和时间, 获得多而可靠的数据资料。获得多而可靠的数据资料。 7 2 2 生物统计学的内容与作用生物统计学的内容与作用 统计分析统计分析主要包括数据资料的搜集、整理和主要包括数据资料的搜集、整理和 特征数的计算、统计推断、方差分析、回归特征数的计算、统计推断、方差分析、回归 及相关分析等及相关分析等 目的是认识客观事物的本质和规律性,使人目的是认识客观事物的本质和规律性,使人 们对所研究的资料做出合理的结论。们对所研究的资料做出合理的结论。 关系:关系:二者是不可分割的两部分。二者是不可分割的两部分。 试验设计须以统计分析的原理和方法为试验设计须以统计分析的原理和方法为 基础,而正确设计的试验又为统计分析提供基础,而正确设计的试验又为统计分析提供 了丰富可靠的信息,两者紧密结合推断出合了丰富可靠的信息,两者紧密结合推断出合 理的结论,不断地推动应用生物科学研究的理的结论,不断地推动应用生物科学研究的 发展。发展。 8 2 2 生物统计学的内容与作用生物统计学的内容与作用 生物统计学的基本作用生物统计学的基本作用: : 提供整理和描述数据资料的科学方法提供整理和描述数据资料的科学方法 ,确定某些性状和特性的数量特征,确定某些性状和特性的数量特征 判断试验结果的可靠性判断试验结果的可靠性 提供由样本推断总体的方法提供由样本推断总体的方法 提供试验设计的一些重要原则提供试验设计的一些重要原则 9 3 3 科学研究与科学试验科学研究与科学试验 3.1 3.1 生物学领域的科学研究生物学领域的科学研究 3.2 3.2 科学研究的基本过程和方法科学研究的基本过程和方法 10 3.1 生物学领域的科学研究 自然科学: 理论科学 实验科学 主要用推理的方法(演绎、归纳) 进行研究 主要通过周密设计的试验进行探索 科学研究是人类认识自然、改造自然、服务社会的 原动力。 11 生物学领域中所涉及的学科大多属于实验 科学。 科学试验 抽样调查 常用的研究方法: 12 一、科学研究的基本过程 1.对研究的命题形成一种认识或假说 2.根据假说涉及的内容安排相斥的试验或抽样调查 3.根据试验或调查资料进行推理,肯定或否定或修 改假说,从而形成结论。 3.2 科学研究的基本过程和方法 形成假说 试验验证 结论 13 二、科学研究的基本方法 1、选题 课题的选择决定了研究创新的潜在可能性。 选题时必须明确其意义与重要性。 理论性研究注重在未来学科发展上的重要性 。 应用性研究注重对未来生产发展的作用和潜 力。 兴趣: 14 2、文献 科学的发展是累积性的,通过对文献的了 解可以把研究者推到研究的顶层,避免 少走弯路。 选题要有文献的依据,设计研究内容和方 法更需文献的启示。 15 3、假说 假说的概念:假说是根据已知的科学事实和 科学原理,对所研究的自然现象及其规律性 提出的一种假定性的推测和说明。 构成假说的基本要素:事实基础,背景理 论对现象、规律的猜测,推导出的预言 和预见。 16 例如大陆飘移,是一个著名的假说。人们发 现,非洲西部的海岸线和南美东部的海岸线 彼此形状相吻合。对此,当时的地质学理论 ,如地球收缩说,就不能解释。1910年,德 国地球物理学家魏根纳依据已知的力学原理 、海岸形状、地质和古气候方面的有限数量 的科学材料,提出了大陆不是固定的,而是 可以飘移的假定。 17 4、假说的检验 假说的检验方法:逻辑分析和实践检验两个 步骤。 逻辑分析:判断假说的可检验性。 实践检验:分为直接检验和间接检验。 直接检验:即用观察和实验直接观测科学假 说的实质内容,以证实或否证科学假说。 间接检验:即用观察和实验观测来检验假说 基本命题所推演出来的结论或预言。通常 用逻辑推演与实践证明相结合的方式。 18 5、试验的规划与设计 围绕检验假说而开展的试验,需要全面、仔细地 规划与设计。试验所涉及的范围要覆盖假说涉及 的各个方面,以便对待检验的假说作出无遗漏的 判断。 注意:生物学试验中结果的“重演性”及比较试验中 的“唯一差异性原则”。 在试验条件相当的 情况下,重复试验 应得到相同的试验 结果。 除需要比较的因素以外,其余的因 素必须保持在同一水平。 19 4 4 统计学的发展及其学习要求统计学的发展及其学习要求 4.1 4.1 统计学的发展统计学的发展 4.2 4.2 授课计划学习要求授课计划学习要求 20 17世纪Pascal和Fermat的概率论 18世纪De Moiver、Laplace和Gauss的正态分布理论 19世纪达尔文研究生物界的连续变异;孟德尔发现性 状分离、独立分配遗传规律;Karl Pearson研究进 化问题,创建了Biometrika杂志;Glaton研究了亲 子身高的回归问题。 20世纪以来, Gosset发现了t分布 Fisher提出了方差分析、建立了试验设计的三大原理 、并提出了随机区组、拉丁方等试验设计,尤其是 1925年出版的“Statistical Methods for Reasarch Workers”形成了试验统计学较为完整的 体系。 4.1 生物统计学的发展 21 Yates、Yule等发展了一系列的试验设计。 Neyman和E.S.Pearson建立了统计推断的理论。 Snedecor建立了统计试验室并出版了 “Statistical Methods Applied to Experiment in Agriculture and Biology”。 Wald建立了序贯分析和统计决策函数的理论。 Cochran和Cox系统地归纳了试验设计和抽样方法 研究的进展,出版了“Experimental Design” 和“Sampling Technique”。 22 4.2 授课内容与学习要求 授课内容 第一章 绪论 第二章 实验资料的整理与特征数计算 第三章 概率与概率分布 第四章 统计推断 第五章 卡平方检验 第六章 方差分析 第七章 直线回归和相关 第八章 抽样原理与方法 第九章 试验设计及其统计分析 23 生物学是一门实验科学。不管你从事的是生物学 的哪一个分枝,都不可能完全脱离实验,只进行 逻辑推理。而实验所得到的结果几乎无例外地都 带有或多或少的不确定性,即实验误差。在这种 情况下不用统计学要想得到正确的结论是不可能 的。可以毫不夸张地说,作为一个实验科学工作 者,离开了统计学就寸步难行。希望大家通过这 门课程的学习,能够掌握常用的统计方法,尤其 是它们的条件,适用范围、优缺点等,从而能够 应用它们去解决实践中遇到的问题。 24 生物统计学的学习方法生物统计学的学习方法 生物统计学是数学与生物学结合的一门交叉学科,所包含的公 式很多,我们在学习中要做到: 首先要弄懂统计的基本原理和基本公式 其次要认真做好习题作业,积极参加课堂讨论,加深对公 式及统计步骤的理解,达到能熟练地应用统计方法 第三应注意培养科学的统计思维方法 第四必须联系实际,结合专业,了解统计方法的实际应用 。 25 5 5 常用统计学术语常用统计学术语 5.1 5.1 总体、个体与样本总体、个体与样本 5.2 5.2 变量与常数变量与常数 5.3 5.3 参数与统计数参数与统计数 5.4 5.4 效应与互作效应与互作 5.5 5.5 误差与错误误差与错误 5.6 5.6 准确性与精确性准确性与精确性 26 总体(population):具有相同性质的个 体所组成的集合称为总体,或述为研究 对象的全体。 个体(individual):组成总体的基本单元 称为个体。 5.1 5.1 总体、个体与样本总体、个体与样本 27 总体所包含的单元数称为总体含量(或总 体容量),常用字母N来表示。 总体可分成无限总体(infinite population )和有限总体(finite population)。 无限总体:个体极多或无限多的总体 有限总体:个体有限的总体 28 样本(sample):从总体中抽取的若干个体 所构成的集合称为样本。它作为总体的代 表,是用来估计总体一般特性的。 组成样本的每个个体叫样本单元(sample unit), 样本中个体的数目称为样本容量(sample size),也叫样本含量,用字母n来表示, 在生物学研究中,n30的样本叫大样本,n 30的样本叫小样本。 29 生物统计学的应用生物统计学的应用 1、提供整理和描述数据的科学方法 我们用教材P11表2.1的例子来说明这个问 题。 2、提供由样本推论总体的科学方法 所谓总体(Population)就是由性质相同 的个体所组成的集团。统计学上所涉及的 总体,其中的个体数(总体容量)N一般 情况下趋于无穷大。因此无法对总体进行 研究。 例如:计算总体平均数 30 这个公式十分简单,把总体中所有观察值相加,再 除以观察值个数就行了,但由于N,我们无法 完成计算。 样本(Sample):是总体的一部分。其容量用n表示 ,样本容量n一般都不是很大,因而,可以计算出 样本的平均数: 因此统计学的重要任务之一,就是用样本的结 果去推断总体的结果。 31 总体与样本的关系 样本是总体的缩影,统计分析的任务就是由样本推 断总体,因此任何试验都存在抽样问题。为使样 本正确地反映总体,抽样时必须采用随机的方法 ,即随机抽样。 随机抽样:是指总体中的每一个体者有同等的机会 被抽取,而且每次抽取时,总体中的个体成分不 变,采用这种方法得到的样本称简单随机样本, 这种抽样方法称简单随机抽样。 统计分析的核心在于由样本的信息推断总体的信息 。因此获得样本仅是一种手段,而推断总体才是 真正目的。 32 变量(variable):相同性质的事物间表现 差异性的某项特征称为变量或变数。 变量的测得值称为变量值(value of variable) 亦称为观测值(observed value)或资料( data),通常记作xi。 常数(constant):代表事物特征和性质的 数值,由变量计算而来,在一定过程中不 变化。如总体平均数、标准差等 5.2 5.2 变量与常数变量与常数 33 定量变量数量性状资料 1 可量性,又称为连续性变数资料或计量资料 指能够以测量、度量、称量等量测方法所得 的数据。与之相对应的试验资料称为可量资料。 特点:各个观测值不限于整数,即在两个数 值之间可以有微量差异的其他数值存在。而表示 这种差异的小数点位数,则因测量工具的精度不 同而定。 2 可数性,又称为间断性变数资料或计数资料 指不能用测量的方法表示,而只能用计数方 法所得的数据。与之相对应的资料称为可数资料 。 特点:各个观测值只能是整数,相邻数值间 不可能有带小数点的数存在。 34 定性变量质量性状资料 指对某种现象不能测量和计数,而只能通过 观察、分类和文字描述表示出来的性质。 与之相对应的资料称为质量性状资料。 为了获得这类性状资料的直观信息,需将其 转变成数字资料。 35 5.35.3参数和统计数参数和统计数 参数:描述总体特征的数量叫参数。一般用 希腊字母表示。参数是恒定不变的常量 ,常用希腊字母表示。如总体平均数,总 体标准差。参数是反映事物的总体规律性 的数值,科学研究的目的就在于求得对总 体参数的了解。 统计数:描述样本特征的数量叫统计数。一 般用拉丁字母表示。 统计数是估计值,根 据样本不同而不同,常用小写拉丁字母表 示,如样本平均数( x )、样本标准差(s )。 36 5.45.4效应与互作效应与互作 主效应(main effect):试验因素相对独立的 作用称为主效应,简称主效或效应(effection )。 互作效应(interaction effect):两个或两个 以上处理因素间相互作用所产生的效应,简称 互作或连应(interaction) 37 5.5 试验数据的误差和错误 观察值(observation):将每次所取样品测定的结 果称为一个观察值,记为yi。 例如:测定绵农4号小麦品种的株高,得到以下数 值(单位:cm): 90、91.5、93、89、90.8 其中的每一个数值就是一个观察值。 如果没有误差,上述观察值就不会出现差异 ,并始终保持一个恒定的值,这个值称为理论 值或真值,以表示。 38 由于误差是客观存在的,所以: 观察值真值误差 用代数式表示为: yi i 式中i代表误差,故: i yi 误差(error):观察值与真值之间的差异。 39 误差的分类: 随机误差(random error):由于试验中许多 无法控制的偶然因素所造成的观测值偏离 真值的差异。完全是偶然的,找不出确切 原因引起的误差,也称偶然性误差 (accidental error)。 特点:不可避免,无法控制。可通过增加抽 样或试验次数降低随机误差 系统误差(systematic error):有一定原因 引起的误差,也称偏差(bias)。 40 误差的分类: 系统误差(systematic error):是由于试验处 理以外的其他条件明显不一致所产生的带有 倾向性的或定向性的偏差。是有一定原因引 起的误差,也称偏差(lopsided error)。 特点:有一些相对固定的因素引起。在某种程 度上可以控制,需要精细试验 41 错误(mistake) 是指在试验过程中,人为因素所引起的差错 。 如:测量仪器校正不准 药品配制比例不当 称量不准确、数据抄错、计算错误 注意: 降低随机误差 避免系统误差 杜绝错误 42 准确性(accuracy):指在调查或试验中某一 试验指标或性状的观测值与真值接近的程度, 也称准确度 精确性(precision):指调查或试验中同一试 验指标或性状的重复观测值彼此接近程度的大 小。 特点:准确性不等于精确性,准确性反映测定值 与真值符合程度的大小,而精确性反映多次测 定值的变异程度 5.6 5.6 准确性与精确性准确性与精确性 43 下面用例子说明误差与准确性和精确性之间的关系 。 系统误差使数据偏离了其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论