版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物统计学复习课第1页/共49页一、什么是统计学Statistics?统计学是收集、分析、表述和解释统计数据的科学。统计学是关于数据的科学。资料的收集就是取得统计数据。数据整理是将数据分组、归纳和汇总并将其用图表的形式表达出来。数据分析是通过统计方法研究数据,并结合实际背景阐述实际问题的特征的过程。数据解释是对分析结果进行说明。统计学分为描述统计学和推断统计学。第2页/共49页反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)
概率论
(包括分布理论、大数定律和中心极限定理等)
描述统计
(统计数据的搜集、整理、显示和分析等)总体数据
样本数据
描述统计与推断统计的关系
第3页/共49页几个基本概念总体(population)、个体(individual)与样本(sample)总体(N):一个统计问题所研究对象的全体有限总体:一个班级学生的身高无限总体:临床试验中来推断某一药品疗效高、某一棉田棉铃虫的头数个体:组成总体的每一基本单元样本(n):从总体中抽取的部分个体,用于对总体进行推断(n≤30,小样本;n>30,大样本)通过某事物的一部分(样本),来估计事物的全部(总体)特征第4页/共49页JJJJJJJ第5页/共49页几个基本概念(续)第6页/共49页几个基本概念(续)变量(variable)与观测值(observation)变量(变数):相同性质的事物表现差异性的某种特征,其表现随个体而异身高、体重、叶绿素含量、叶片形状随机变量:变量取值的变化是不可预测的变量通常记为:x,y,z,…观测值:对变量进行测量或观察所获得的数值观测值也称为:变量值(valueofvariables)、资料/数据(data)第7页/共49页二、均值和方差
:第i个观察值或变数
n:观察值或变数的个数
∑:求和符号(sigma)计算公式:第8页/共49页标准差和方差总体方差和总体标准差样本方差和样本标准差第9页/共49页三、概率与概率分布概率分布-几个概念概率函数(probabilityfunction)随机变量取某一特定值的概率函数(离散型随机变量)二项分布(对立事件)和泊松分布(出现概率较小,样本容量大)概率密度函数(probabilitydensityfunction)随机变量取某一特定值的密度函数(连续型随机变量)概率分布函数(probabilitydistributionfunction)随机变量取值小于或等于某特定值的概率第10页/共49页离散型随机变量的概率分布概率分布图第11页/共49页概率分布函数累积函数密度函数连续型随机变量的密度函数及概率分布函数x=某一特定值时,P=0第12页/共49页13若n→∞,二项分布连接线表现为一个光滑的曲线。这一曲线称之为正态分布曲线或正态概率曲线。其概率密度函数为:记做:N(
μ,σ2)第13页/共49页14由于正态曲线受μ和σ的制约,曲线随这两个参数的变化而改变。构造一个新变数,这个变数要消去μ和σ的影响。假定新变数用u来表示,则:标准正态分布的概率密度函数u变换标准正态分布u服从均数为0、标准差为1的正态分布第14页/共49页第15页/共49页16原总体样本1样本2样本n新总体n
统计量如果从容量为N的总体抽样(放回),若每次抽取容量为n的样本,那么一共可以得到Nn个样本。每个样本可以计算一个平均数,如果将这些平均数集合起来便构成一个新总体。由于每次随机抽样所得的平均数可能会存在差异,所以由平均数构成的新总体也应该有其分布,这种分布称为平均数的抽样分布。样本均值的抽样分布第16页/共49页1、样本平均数的期望值
由于不同的样本可得到不同的样本均值,因此,考察样本均值的期望就显得非常重要。用表示样本均值的期望值,表示总体均值,可证明在简单随机抽样中。2.样本平均数的标准差称为标准误。第17页/共49页t分布当总体标准差σ未知时,且样本数小于30时,以样本标准差S代替σ所得到的统计量记为t。在计算时,由于采用S来代替σ,使得t
变量不再服从标准正态分布,而是服从t分布服从自由度为n-1的t分布第18页/共49页2、t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平.df越小这种趋势越明显.df越大,t分布越趋近于标准正态分布.当n>30时,t分布与标准正态分布的区别很小;n>100时,t分布基本与标准正态分布相同;n→∞时,t分布与标准正态分布完全一致正态分布曲线与t分布曲线的比较t分布的特征1、t分布受自由度df=n-1的制约,每一个自由度都有一条t分布密度曲线第19页/共49页F分布设从一正态总体中随机抽取样本容量为n,m的两个独立样本,其样本的方差为,则定义两者的比值为F:服从自由度为n-1,m-1的F分布第20页/共49页
F分布特征1)F分布的平均数μ=1,F的取值区间为[0,+∞)2)F分布曲线的形状仅决定于df1和df2.在df1=l或2时,F分布曲线呈严重倾斜的反向J型,当df1>=3时转为左偏曲线(在平均值的左边)不同自由度下的F分布曲线第21页/共49页四、统计推断统计推断由一个样本或一糸列样本所得的结果来推断总体的特征假设检验参数估计原理:概率很小的事件在一次抽样试验中实际是几乎不可能发生的。=0.05/0.01第22页/共49页假设检验(Hypothesis)如何进行检验:样本平均数总体均数推断样本随机抽样总体第23页/共49页1、提出假设对立无效假设/零假设/检验假设备择假设/对应假设0
=
0
误差效应处理效应H0HA第24页/共49页2、确定显著水平=0.05显著水平*极显著水平**能否定H0的人为规定的概率标准称为显著水平,记作。
统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平
。P<=0.01=0.05第25页/共49页3、选定检验方法,计算检验统计量,确定概率值u=x-
x
136-126=√40=1.581P(u>1.581)=2×0.0571=0.1142
根据研究设计的类型和统计推断的目的选择使用不同的检验方法。本例:服从N(x,x2)分布。例:第26页/共49页4、作出推断结论:是否接受假设P>P<小概率原理接受H0否定HA否定H0接受HA可能正确可能错误第27页/共49页u0.05=1.64u0.01=2.33单尾检验分位数双尾检验分位数u0.05=1.96u0.01=2.5822否定区否定区否定区接受区接受区查表时,单尾概率乘以2等于双尾概率>第28页/共49页大样本平均数的假设检验--u检验小样本平均数的假设检验--t检验单样本双样本样本平均数的假设检验第29页/共49页1、总体方差σ2已知,无论n是否大于30都可采用u检验法。2、总体方差σ2未知,但n>30时,可用样本方差s2来代替总体方差σ2
,仍用u检验法。3、总体方差σ2未知,且n<30时,可用样本方差s2来代替总体方差σ2
,采用df=n-1的t检验法。应用情景:第30页/共49页试验设计成组数据平均数的比较成对数据平均数的比较分到两个组中的数据,没有关系,相互独立。两个样本平均数的假设检验将性质相同的两个样本(供试单位)配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,排除实验单位不一致对实验结果的影响。第31页/共49页1、两个总体方差σ12和σ22已知,或σ12和σ22未知,但两个样本都是大样本,即n1>30且n2>30时,用u检验法。2、两个总体方差σ12和σ22未知,且两个样本都是小样本,即n1<30且n2<30时,用t检验法。成组数据平均数的比较-应用情景成对数据平均数的比较略第32页/共49页所谓方差的同质性,就是指各个总体的方差是相同的。方差的同质性检验就是要从各样本的方差来推断其总体方差是否相同方差的同质性检验第33页/共49页五、方差分析
t检验可以判断两组数据平均数间的差异显著性对多个处理进行平均数差异显著性检验时,采用t检验法的缺点:方差:又叫均方,是标准差的平方,是表示变异的量。第34页/共49页确定各种原因在总变异中所占的重要程度。处理效应试验误差相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。xij=μ+τi+εij
(i=1,2,3…,k;j=1,2,3…,n)μ
-总体平均数τi
-处理效应εij
-试验误差xij
-是在第
i次处理下的第
j
次观测值第35页/共49页多重比较(multiplecomparisons)
要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较。即:统计上把多个平均数两两间的相互比较称为多重比较。概念五、多重比较第36页/共49页多重比较方法较多(multiplecomparisons)第37页/共49页不同离子对木聚糖酶活性的影响(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.400.801.201.602.000.000.400.600.801.001.20Na+K+
Cu2+
Mn2+水平实验指标因素***对多因素试验而言,处理就是指水平与水平的组合第38页/共49页定义:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。二因素都是固定因素二因素均为随机因素固定模型随机模型混合模型一个因素是固定因素,一个因素是随机因素二因素方差分析
三种模型在计算上类似,但在对待检验及结果解释时有所不同。第39页/共49页主效应和互作主效应(maineffect):各试验因素的相对独立作用(不同饲料的增重差异,不同品种玉米产量不同)互作、交互(interaction):某一因素在另一因素的不同水平上所产生的效应不同。第40页/共49页方差分析的基本假定正态性可加性方差同质性第41页/共49页二因素方差分析第42页/共49页六、回归与相关的概念相关变量因果关系平行关系回归分析(regressionanalysis)相关分析(correlationanalysis)一个变量的变化受到另一个变量或几个变量的制约两个以上变量之间共同受到另外因素的影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2022年大学化工与制药专业大学物理二月考试题D卷-含答案
- 石河子大学《运动营养学》2022-2023学年第一学期期末试卷
- 模范党支部申报材料(3篇)
- 石河子大学《土力学》2021-2022学年第一学期期末试卷
- 石河子大学《荷载与结构设计方法》2023-2024学年第一学期期末试卷
- 石河子大学《大数据组织与管理》2023-2024学年期末试卷
- 沈阳理工大学《娱乐空间设计》2021-2022学年第一学期期末试卷
- 沈阳理工大学《无线通信系统》2023-2024学年第一学期期末试卷
- 沈阳理工大学《汽车产品运营与组织管理》2023-2024学年第一学期期末试卷
- 沈阳理工大学《工程爆破》2022-2023学年第一学期期末试卷
- 《建筑施工技术》课后习题答案(大学期末复习资料)
- 公司环境行政处罚事件处置预案
- 广东开放大学风险投资(本2022春)-练习4答案
- DB65∕T 3253-2020 建筑消防设施质量检测评定规程
- 二年级苏教版数学上册《7的乘法口诀》教案(公开课三稿)
- (完整PPT)半导体物理与器件物理课件
- ASTM B366 B366M-20 工厂制造的变形镍和镍合金配件标准规范
- JIS G4304-2021 热轧不锈钢板材、薄板材和带材
- 2022年中级经济师-人力资源管理专业押题模拟试卷3套及答案解析
- 小学综合实践活动《认识校园植物》优秀PPT课件
- XRD在薄膜材料研究中应用
评论
0/150
提交评论