第一章绪论生物统计学详解_第1页
第一章绪论生物统计学详解_第2页
第一章绪论生物统计学详解_第3页
第一章绪论生物统计学详解_第4页
第一章绪论生物统计学详解_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论生物统计学详解演示文稿本文档共35页;当前第1页;编辑于星期三\9点8分优选第一章绪论生物统计学本文档共35页;当前第2页;编辑于星期三\9点8分第一章绪论(perface)第一节什么是生物统计学第二节生物统计的作用第三节生物统计的常用术语第四节试验资料的特征数第五节建议的学习方法及参考资料本文档共35页;当前第3页;编辑于星期三\9点8分第一节什么是生物统计学(Biostatistics)生物统计学(Biostatistics)的概念生物统计是数理统计的原理和方法在生物科学研究中的应用,是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的科学。是研究生命过程中以样本推断总体的一门学科。是工具课。本文档共35页;当前第4页;编辑于星期三\9点8分第二节生物统计学作用

生物统计的作用1.提供试验或调查设计的方法。试验或调查设计主要解决合理地收集必要而有代表性资料的问题。以统计学原理为指导,进行合理的试验设计,可以使较少的人力、物力取得较多、较好的试验结果。本文档共35页;当前第5页;编辑于星期三\9点8分

2.提供整理、分析资料的方法统计学提供了整理资料、化繁为简的科学程序,它可以从众多的数据资料中,归纳出大批资料蕴藏的信息。基本方法是根据资料的特性归纳出几个特征数或将其整理成统计表、绘制成统计图。

3.判定试验结果的可靠性试验受试验因素和偶然因素的影响,一个试验结果,使又试验因素造成的还是误差造成的,要正确判断必须用统计分析的方法.本文档共35页;当前第6页;编辑于星期三\9点8分4.提供通过样本推断总体的方法。试验的目的在于认识总体规律,但总体往往庞大.5.确定事物之间的相互联系

科学试验不仅是研究事物的特征,还要研究事物间的相互关系,从而达到预测事物发展的.本文档共35页;当前第7页;编辑于星期三\9点8分第三节生物统计的常用术语

·一、总体(population)和样本(sample)

(一)根据研究目的确定的研究对象的全体称为总体,其中的一个研究单位称个体(individual)。含有有限个个体的总体称为有限总体。包含有无限多个个体的总体叫无限总体。(二)总体的一部分称为样本。样本中所包含的个体数目叫样本容量或大小(samplesize)。样本容量常记为n。通常n≤30的样本叫小样本,n>30的样本叫大样本。本文档共35页;当前第8页;编辑于星期三\9点8分

(三)统计分析的特点试验研究或调查的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。为了能可靠地从样本来推总体,要求样本具有一定的含量和代表性。只有从总体随机抽取(randomsampling)的样本才具有代表性。样本来推断总体也不可能是百分之百的正确。有很大的可靠性但有一定的错误率这是统计分析的又一特点。本文档共35页;当前第9页;编辑于星期三\9点8分二、参数与统计量(一)由总体计算的特征数叫参数(parameter),常用希腊字母表示。用μ表示总体平均数,用σ表示总体标准差。(二)由样本计算的特征数叫统计量(staistic)

,常用拉丁字母表示统计量。用表示样本平均数,用S表示样本标准差。

总体参数由相应的统计量来估计,例如用估计μ,用S估计σ等。本文档共35页;当前第10页;编辑于星期三\9点8分三、准确性与精确性

(一)准确性(accuracy)也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。(二)精确性(precision)也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。调查或试验的准确性、精确性合称为正确性。本文档共35页;当前第11页;编辑于星期三\9点8分本文档共35页;当前第12页;编辑于星期三\9点8分四、随机误差与系统误差

试验中出现的误差分为两类:随机误差(randomerror)与系统误差(systematicerror)。(一)

随机误差也叫抽样误差(samplingerror),这是由于许多无法控制的内在和外在的偶然因素所造成。随机误差带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计学上的试验误差指随机误差。本文档共35页;当前第13页;编辑于星期三\9点8分(二)系统误差也叫片面误差(lopsidederror),这是由于试验动物的品种、年龄、性别、病程等不同,饲料种类、品质、数量、管理指施相差较大,仪器不准、标准试剂未经校正,药品批次不同、药品用量以及种类不符合试验计划的要求,以及观测、记载、抄录、计算中的错误所引起。在试验中是可以避免的。系统误差影响试验的准确性。本文档共35页;当前第14页;编辑于星期三\9点8分第四节平均数、标准差与变异系数次数分布表和次数分布图,可以形象、直观地表示出资料的两个特征——集中性和离散性。为了更简单、精确地描述资料的特征,本节介绍三个统计量:平均数、标准差和变异系数。

平均数反应资料的集中性,标准差和变异系数反应资料的离散性。

本文档共35页;当前第15页;编辑于星期三\9点8分一、平均数(Mean)平均数的意义:平均数用来描述资料的集中性,即指出资料中数据集中较多的中心位置。平均数的作用:平均数是资料的代表数;常用于同类性质资料间的相互比较。平均数的种类:其中应用最为普遍的是算术平均数,此外还有几何平均数、中数、众数和调和平均数。本文档共35页;当前第16页;编辑于星期三\9点8分1、算术平均数

(Arithmeticmean)

(一)算术平均数的定义资料中各观察值的总和除以观察值的个数所得的商,称为算术平均数。在统计学中,简称为平均数或均数。用符号表示。

(二)计算方法1、直接法对样本含量较小,未分组的资料适用。本文档共35页;当前第17页;编辑于星期三\9点8分其中,(Sigma)为总和符号,表示从第一个观察值x1累加到第n个观察值xn

,若在意义上已明确时,简记为。

本文档共35页;当前第18页;编辑于星期三\9点8分关于总和符号的几个性质常数的总和等于该常数的n倍,即代数和的总和等于总和的代数和,即总和符号内的常数因子可以提取到总和符号之外,即其中C为常数;注意:在后面一些章节经常会遇到C代表一个为常量的式子(a为常数)本文档共35页;当前第19页;编辑于星期三\9点8分2、加权法

适用于已分组的资料

各组的次数fi

是权衡各组中值

xi

在资料中所占比重大小的数量,因此f被称为是x的“权”(right),加权法也由此而得名。

xi

—各组组中值;fi—各组次数;k

—分组数。本文档共35页;当前第20页;编辑于星期三\9点8分(三)平均数的基本性质

1、样本各个观察值与平均数之差的和为零,即离均差之和为零;

2、样本各观察值与平均数之差的平方和为最小,即离均差的平方和最小。本文档共35页;当前第21页;编辑于星期三\9点8分3、统计学已证明,样本平均数是总体平均数μ的无偏估计值。

对总体而言,用μ表示平均数。对于有限总体

无偏估计:当一个统计量的数学期望值等于等于相应总体参数时,称该统计量为其总体参数的无偏估计。N——有限总体所包含的个体数目。本文档共35页;当前第22页;编辑于星期三\9点8分2、几何平均数

(Geometricmean)(一)定义指n个观察值乘积的n次方根。即(二)适用条件主要应用于数据呈倍数关系或不对称分布的资料,算术平均数对这类资料的代表性差。如抗体效价(1:10,1:100,1:1000,1:10000)、增长率或生长率、动态发展速度等。(三)计算本文档共35页;当前第23页;编辑于星期三\9点8分1、应用公式计算(实际应用时常取对数)本文档共35页;当前第24页;编辑于星期三\9点8分例如,海虾养殖试验,各旬的生长速度3.0,1.51.3,1.2,1.2,1.1,1.1,求海虾的旬平均生长速度。,即海虾旬平均生长速度为1.38。

2、当资料编成次数分布表时,

—各组组中值;—各组次数;

本文档共35页;当前第25页;编辑于星期三\9点8分3、中数(median)

(一)定义将资料中所有观察值从小到大依次排列,处于中间位置的数。以表示。

(二)适用条件资料呈偏态分布或次数分布类型不明,以及一端或两端无确定数值,这种资料用中位数作为代表值比用算术平均数为好。

(三)计算方法

1、未分组资料,先将各观察值由小到大排列。

当n为奇数时,第位置的观察值即为中数,即本文档共35页;当前第26页;编辑于星期三\9点8分当n为偶数时,和位置的两个观察值之和的二分之一即为中数,即:

2、若资料已分组,并编制成了次数分布表,可利用次数分布表计算中数。其中:L——中数所在组的下限;i—组距;

f——中数所在组的次数;n—总次数;

c——小于中数所在组的累积次数。本文档共35页;当前第27页;编辑于星期三\9点8分

[例]某地区有164人因沙门氏菌食物中毒,其潜伏期资料经整理如下表,试计算中位数。潜伏期(小时)病例数f累计例数0——252512——588324——4012336——2314648——1215860——516372——1164本文档共35页;当前第28页;编辑于星期三\9点8分4、众数和调和平均数(一)众数(Mode)资料中出现次数最多的那个数或次数最多一组的组中值,记为Mo。

(二)调和平均数(HarmonicMean)指资料中各观察值倒数的平均数的倒数,用H表示。主要用于求一个过程中各部分速率的平均速率。

本文档共35页;当前第29页;编辑于星期三\9点8分对同一资料,几种主要的平均数之间的关系

算术平均数>几何平均数>调和平均数请注意:重点算术平均数。本文档共35页;当前第30页;编辑于星期三\9点8分二、标准差(Standarddeviation)

平均数是资料的代表数,其代表性强弱受资料中各观察值变异程度的影响。仅利用平均数对一个资料的统计特征作全面描述是不够的,还应引入一个能说明资料各观察值变异程度大小的统计量。用来表示资料变异程度的指标较多,常用的有极差、标准差、变异系数、方差等,其中以方差与标准差应用最为广泛。

一、标准差的引入全距(极差):只利用了资料中最大值和最小值,不能准确表达资料中各个观察值的变异程度。本文档共35页;当前第31页;编辑于星期三\9点8分

离均差可表达观察值偏离平均数的程度和性质,但由于离均差之和为零,因此它不能表示整个资料中所有观察值的总偏离程度。若用,使用起来又不方便,在统计学中未被采用。为消除离均差的负号,先将各离均差平方;再求离均差的平方之和(简称平方和,记为SS),为消除样本含量的影响以离均差的平方和除以自由度n-1。则统计量称为均方(缩写为MS),又称为样本方差,记为S2,即:本文档共35页;当前第32页;编辑于星期三\9点8分它不能表示整个资料中所有观察值的总偏离程度使用不方便,在统计学中未被采用消除离均差的负号离均差的平方之和(简称平方和,记为SS)称为均方(缩写为MS),又称为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论