生物统计 绪论学习资料_第1页
生物统计 绪论学习资料_第2页
生物统计 绪论学习资料_第3页
生物统计 绪论学习资料_第4页
生物统计 绪论学习资料_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学

(BiologyStatistic)统计遗传教研室分子生物学馆106张明明本课内容的主要安排:(1)拟合优度检验(2)回归分析(一元、多元、logistic)(3)方差分析(4)试验设计第一章生物统计学概述

总体样本统计量描述作出推断随机抽样什么是统计学?1.生物统计学概念生物统计学是以概率理论为基础,研究生命科学中随机现象规律性的应用数学科学。2.应用领域

林学、农学、医药学等等。3.研究内容

用统计方法研究生物问题。4.常用软件

SAS、SPSS、Excel、Statistic第一节、中心趋势指标常用的中心趋势指标有:算术均数、几何均数、中位数、众数,统称为平均数(average)一、算术平均数(TheArithmeticmean)简称均数(Mean)或均值,定义为所有测量值之和除以变量值个数(即,样本含量SampleSize)。反映一组呈对称分布的变量值在数量上的平均水平。(1)直接计算法

公式:举例1:试计算1,3,7,9的均数?例2:试计算1,3,3,7,7,9,9,9的均数?(2)加权法

均数的特征二、

中位数与百分位数11个大鼠存活天数:4,10,7,50,3,15,2,9,13,>60,>60平均存活天数?(一)中位数(median)是将每个变量值从小到大排列,位置居于中间的那个变量值。

存活天数2,

3,

4,7,9,10,13,15,50,>60,>60秩次1234567891011计算公式:

n为奇数时

n为偶数时

9名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,天,求其中位数。19频数表资料的中位数下限值L上限值Ui;fm中位数M中位数=4.5+0.5x[(150x50%-68)/37]=4.59中位数的特征计算时只利用了位置居中的测量值优点:对极值不敏感缺点:并非考虑到每个观测值适用于各种分布类型的资料,特别适合于:大样本偏态分布资料或者一端或两端无确切数值的资料

百分位数示意图(二)百分位数(percentile)1.直接计算法

设有n个原始数据从小到大排列,第X百分位数的计算公式为:当为带有小数位时:

当为整数时:Trunc()取整函数

对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。患者:住院天数:

(1)n=120,

,为整数:

(2),带有小数,故取整trunc(118.8)=118患者:住院天数:2.频数表法

公式:

试分别求表1.3频数表的第25、第75百分位数。P25=4.0+0.5x[(150x25%-36)/32]=4.02P75=5.0+0.5x[(150x75%-105)/22]=5.17三、几何均数(geometricmean)

可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。(1)直接法几何均数:变量对数值的算术均数的反对数。

其他对数(如自然对数)变换获得相同的几何均数例6测定10名伤寒病人血清抗体滴度分别为1:4,1:4,1:4,1:4,1:4,1:16,1:16,1:16,1:64,1:128,求其平均抗体滴度。以其滴度的倒数为原变量值,代入公式有:平均抗体滴度为:1:11(2)加权法公式:例6的血清抗体滴度资料的频数表1、几何均数适用于对数正态分布,如药物的效价、抗体的滴度、传染性疾病的潜伏期等资料。2、变量x服从对数正态分布,即表示变量lg(xi)服从正态分布。对于lg(xi),具有正态分布的所有特性。几何均数的特征四、众数(Mode)是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。例

有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,,61,61,62,62,试求众数。众数的特征1、对于某些数据而言,例如均匀分布,并不存在众数;2、对于某些数据存在两个或多于两个的众数;3、定性数据可以存在众数;众数对于进一步的统计学计算与分析不具备应用价值。58,58,58,58五、其他位置指标1、四分位数(Quartile)(三个四分位数)2、十分位数(Centile):9个十分位数3、百分位数(Percentile)99个百分位数离散与变异性指标全距四分位间距方差标准差变异系数

一、全距(Range)与绝对差全距为最大值与最小值之差,也叫极差缺点:仅利用了两个极端值。二、方差与标准差方差(Variance)也称均方差(meansquaredeviation),反映一组数据的平均离散水平。(一)样本方差为各变量值到样本均数距离的平方和除以自由度的商值,即(二)总体方差定义为样本标准差为样本方差的平方根;

总体标准差为总体方差的平方根。标准差(standarddeviation)样本标准差实用公式样本标准差的加权公式随机变量xi的标准化如果随机变量xi服从正态分布,均数和标准差分别为和s,则随机变量xi的标准化正态离差值(Standardnormaldeviation)又称为标准化得分值(StandardScores)为:三、变异系数

(coefficientofvariation)

变异系数(coefficientofvariation,CV)常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。

某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,

比较其变异度?

四、四分位数间距

(inter-quartilerange)

四分位数间距,用IQR表示:

IQR=第三四分位数:Q3

第一四分位数:Q1第三节率、比及其注意事项一、率(rate):在特定条件下,可能发生某现象的总例数中,实际发生某现象的强度或频率。构成比(Proportion,constituentratio):构成比指标用以表示事物内部某一构成成分在全部构成中所占的比例或比重。相对比(relativeratio)是由两个有关联的指标之比。二、比(ratio)第四节常用统计图介绍1.条图:单式条图和复式条图2.圆图(饼图)3.百分条图4.线图5.直方图6.概率—概率散点图(P—P概率图)7.茎叶图8.盒式图地区北非及中东西欧北美洲拉丁美洲南亚及东南亚成人感染率/%0.130.250.560.570.69复式条图例:19941998受检人数异常人数检出率%受检人数异常人数检出率%血压519558.89582386.52心率519448.48582396.70(2)圆图(饼图)用圆的总面积表示事物的全部,各个扇形的面积(圆心角的大小)表示各个部分的比重,适用于百分比资料。类别老年青年中年小孩比例/%33%15%45%7%(3)百分条图百分条图是用一个矩形的面积表示事物的全部,而用其中各段表示个构成部分。例:(4)线图(i)简单线图:一条折线或一条曲线(ii)多重线图:多条折线折线图年份结核病死亡率白喉死亡率1947150.220.11950148.016.61951141.014.01952130.011.81953110.410.7195498.26.5195572.63.9195668.02.4195754.81.3(5)直方图直方图以各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,用于表示连续性资料的频数分布。(6)概率——概率散点图(P-P概率图)是以横轴表示一个变量的经验累积分布函

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论