中山大学2014生物统计学考试复习_第1页
中山大学2014生物统计学考试复习_第2页
中山大学2014生物统计学考试复习_第3页
中山大学2014生物统计学考试复习_第4页
中山大学2014生物统计学考试复习_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 名词解释n 概率与概率分析相关概念n 样本统计量的抽样分布相关概念第一节 抽样与抽样分布 一. 总体、个体和样本总体(Population):调查研究的事物或现象的全体个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体样本容量(Sample size):样本中所含个体的数量二. 关于抽样方法概率抽样:根据已知的概率选取样本 1.简单随机抽样:完全随机地抽选样本 2.分层抽样:总体分成不同的“层”,在每一层内进行抽样 3.整群抽样:将一组被调查者(群)作为一个抽样单位 4.等距抽样:在样本框中每隔一定距离抽选一个被调查者非概率抽样:不是完全按随机原则

2、选取样本 1.非随机抽样:由调查人员自由选取被调查者 2.判断抽样:通过某些条件过滤来选择被调查者配额抽样:选择一群特定数目、满足特定条件的被调查者三. 样本均值的抽样分布与中心极限定理抽样分布:1.所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布2.是一种理论概率分布3.随机变量是 样本统计量样本均值, 样本比例和样本方差等4.结果来自容量相同的所有可能样本样本均值的均值(数学期望)等于总体均值样本均值的方差等于总体方差的1/n样本均值的抽样分布规律:当总体服从正态分布N(, 2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为,方差为2/n。即 N(, 2/

3、n)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时(n > 30),样本均值的抽样分布近似服从均值为、方差为2/n的正态分布 四. 样本方差的抽样分布(Pearson)设总体服从正态分布N(, 2 ), X1,X2,Xn为来自该正态总体的样本,则样本方差S2 的分布为,将称为自由度为(n-1)的卡方分布均值的标准误五. 两个样本方差比的分布(R. A. Fisher)设X1,X2,Xn1是来自于一个正态分布总体X N(1,12 )的一个样本,Y1,Y2, ,Yn2是来自正态总体YN(2, 22)的一个样本,且Xi(i=1,2,,n1),Yi(i=1,2

4、, ,n2)相互独立,则 将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布六. T 统计量的分布(Willam Sealy Gosset)设X1,X2,Xn是来自正态总体N(1, 12)的一个样本, 称为统计量,它服从自由度为n-1的t 分布n 假设检验、参数估计相关概念(例如独立样本、配对样本、 Aspin-Welch检验法、方差齐性检验)独立样本配对样本Aspin-Welch检验法 两个总体均值之差的 t 检验(12、22未知但不相等)1. 检验具有等方差的两个总体的均值2. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方

5、差未知但不相等12 223. 近似 t 检验, Aspin-Welch检验法,检验统计量 方差齐性检验n ANOVA,LSD法,随机误差和系统误差,因素和水平n ANOVA1. 检验多个总体均值是否相等§ 通过对各观察数据误差来源的分析来判断多个总体均值是否相等2.变量n 1个定类尺度的自变量 2个或多个 (k 个) 处理水平或分类n 1个定距或定比尺度的因变量3.用于分析完全随机化试验设计LSD法随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异系统误差在因素的不同水平(不同总体)下,各观察值之间的差异因素所要检验的对象称为因素或因子水平因素的具体表现称为水平n 相

6、关和回归分析及与之关联的概念例如n 总体(Population)n 所关心的所有元素的集合n 样本(Sample)n 总体的一部分n 参数(Parameter)n 总体的数字特征n 统计量(Statistic)n 样本的概括性测度值2 简答题统计数据的如何收集与整理?抽样调查1. 从总体中随机抽取一部分单位(样本)进行调查2. 目的是推断总体的未知数字特征3. 最常用的调查方式4. 具有经济性、时效性强、适应面 广、准确性高等特点抽样调查5. 从总体中随机抽取一部分单位(样本)进行调查6. 目的是推断总体的未知数字特征7. 最常用的调查方式8. 具有经济性、时效性强、适应面 广、准确性高等特点

7、重点调查和典型调查1.重点调查从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体2. 典型调查从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体统计报表1统计调查方式之一2过去曾经是我国主要的数据收集方式3按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4有各种各样的类型n统计数据的初步处理一 频数表和频数图二 整理和展示数据定序数据的整理(可计算的指标)1.累计频数:将各类别的频数 逐级累加2.累计频率:将各类别的频率 (百分比)逐级累加3.图形:累计频数分布图、环形图定类数据的整理1. 列

8、出各类别2. 计算各类别的频数3. 制作频数分布表4. 用图形显示数据(条形图和饼图)频数分布表的编制 数据类型及图示频数分布的类型n 点估计的常见方法及应用点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等n 如何区分假设检验问题?决策:双尾检验H0: m = H1: m研究:将认为研究结果是无效的说法或理论作为H0;是把希望证明的有效假设作为H1;先确立H1声明:将所作出的声明作为H0,对该说明的质疑作为H1;先确立H0除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的n 介绍两种以上多重比较方法Fisher提出的最小显著差异方法,简写为LSD,该方法可用于判断到底

9、哪些均值之间有差异n 分子生物学方差分析的作用和意义?n 数据缺失如何处理?为何要进行数据的变换?P171n 相关系数的其它计算形式n 聚类分析的思想和步骤a) 对数据进行变换;b) 定义样品间的距离(如欧氏距离)、类别之间的距离(如最短距离);c) 首先将t个样品各自视为一类:得到初始的分类G(1) (含有t类),计算t个样品两两之间的距离,它们等价于初始的类间距离,得到初始的距离矩阵D(1) ;d) 将距离最近的两类合并为一新类,得到新的分类G(2)(含有t-1类),并计算新类与其它类的类间距离,得到新的类间距离矩阵D(2) ,再按照最小距离准则并类,得到G(3)(含有t-2类)、D(3)

10、, 。直到所有样品都并成一类 ;画出谱系聚类图,决定分类的个数及各类的成员。n Stata的背景和功能,操作特点和心得3 计算题n 区间估计一 总体均值的区间估计(已知)1.假定条件总体服从正态分布,且总体方差()已知如果不是正态分布,可以由正态分布来近似 (n 30)2.使用正态分布统计量3.总体均值在1-置信水平下的置信区间为二 总体均值的区间估计(未知)1.假定条件总体方差()未知总体必须服从正态分布1. 使用 t 分布统计量2. 总体均值 m 在1-a置信水平下的置信区间为三 总体比例的区间估计1.假定条件两类结果总体服从二项分布可以由正态分布来近似1. 使用正态分布统计量2. 总体比

11、例P 的置信区间为三样本容量的确定估计总体均值时样本容量的确定1. 根据均值区间估计公式可得样本容量其中:2. 样本容量n与总体方差s2、允许误差D、可靠性系数Z之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比估计总体比例时样本容量的确定1. 根据比例区间估计公式可得样本容量其中:2. 若总体比例P未知时,可用样本比例来代替第四节 两个总体均值及两个总体比例之差的估计一. 两个总体均值之差估计(12 ,22已知)1. 假定条件两个样本是独立的随机样本两个总体都服从正态分布若不是正态分布, 可以用正态分布来近似(n130和n230)2. 两个独立样本均值之差的抽样分布服从正态分布,

12、其期望值为其标准误差为3. 使用正态分布统计量4. 两个总体均值之差1-2在1-置信水平下的置信区间为二两个总体均值之差估计(12 ,22未知,但相等)1. 假定条件两个总体都服从正态分布12 ,22未知,但相等 2. 总体方差2的联合估计量为3. 估计量x1-x2的标准差为4. 使用 t 分布统计量5. 两个总体均值之差m1-m2在1-a 置信水平下的置信区间为自由度三两个总体均值之差估计(12 ,22未知,且不相等)1.假定条件两个总体都服从正态分布s12、s22未知,且s12 ¹ s222.使用的统计量为 3. 两个总体均值之差m1-m2在1-a 置信水平下的置信区间为四两个总

13、体比例之差估计1.假定条件两个总体是独立的两个总体服从二项分布可以用正态分布来近似2.两个总体比例之差P1-P2在1-置信水平下的置信区间为第五节 正态总体方差及两正态总体方差比的区间估计一. 正态总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3. 总体方差2 的点估计量为S2,且4. 总体方差在1-a置信水平下的置信区间为二. 两个正态总体方差比的区间估计1. 比较两个总体的方差比2. 用两个样本的方差比来判断如果S12/ S22接近于1,说明两个总体方差很接近如果S12/ S22远离1,说明两个总体方差之间存在差异3. 总体方差比在1-a置信水平下的置信区间为 n

14、 一般假设检验问题的计算一. 总体方差已知时的均值检验(双尾 Z 检验)1.假定条件总体服从正态分布若不服从正态分布, 可用正态分布来近似(n³30)2.原假设为:H0: m=m0;备择假设为:H1:m ¹m03.使用Z-统计量总体方差已知时的均值检验(单尾 Z 检验)1. 假定条件 总体服从正态分布 若不服从正态分布,可以用正态分布来近似 (n³30)2.备择假设有< 或 >符号3.使用Z- 统计量二. 总体方差未知时的均值检验( t 检验)1.假定条件 总体为正态分布 如果不是正态分布, 只有轻微偏斜和大样本 (n ³30)条件下2.使用

15、t- 统计量三. 总体比例的假设检验(Z 检验)1. 假定条件 有两类结果 总体服从二项分布 可用正态分布来近似P0为假设的总体比例2. 比例检验的 Z-统计一 总体方差的检验(2 检验)1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.原假设为 H0: s2 = s02S2 样本方差; 2假设的总体方差4.检验统计量 第三节 两个正态总体的参数检验一 两个总体参数之差的抽样分布二 两个总体均值之差的Z检验(12、22已知)1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n1³30和 n2³30)2. 原假

16、设:H0: m1- m2 =0;备择假设:H1: m1- m2 ¹ 03. 检验统计量为两个总体均值之差的 t 检验(12、22未知但相等)1. 检验具有等方差的两个总体的均值2. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12=223. 检验统计量两个总体均值之差的 t 检验(12、22未知但不相等)4. 检验具有等方差的两个总体的均值5. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但不相等12 226. 近似 t 检验, Aspin-Welch检验法,检验统计量 三 假设检验中相关样本的利用两个相关(配对或匹配

17、)样本的均值检验四 两个总体比例之差的检验(配对样本的 t 检验)1.检验两个相关总体的均值 配对或匹配 重复测量 (前/后)2.利用相关样本可消除项目间的方差3.假定条件 两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近似 (n1 ³ 30 , n2 ³ 30 )统计量55 自由度df nD - 1样本均值 样本标准差两个总体比例之差的检验(Z 检验)1.假定条件 两个总体是独立的 两个总体都服从二项分布 可以用正态分布来近似2. 检验统计量n 单因素方差分析问题计算和检验提出假设l H0: m1 = m2 = mk (因素有k个水平)l H1: m1 ,m2

18、 , ,mk不全相等构造检验统计量1. 为检验H0是否成立,需确定检验的统计量 2. 构造统计量需要计算 总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系 SST = SSE + SSASSA的均方也称为组间方差,记为MSA,计算公式为SSE的均方也称为组内方差,记为MSE,计算公式为统计决策将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出接受或拒绝原假设H0的决策§ 根据给定的显著性水平a,在F分布表中查找与第一自由度df1k-1、第二自由度df2=n-k 相应的临界值 Fa § 若F>Fa ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响§ 若F£Fa ,则不能拒绝原假设H0 ,表明所检验的因素(A)对观察值没有显著影响 n 相关系数计算1.三相关系数的显著性检验1. 检验两个变量之间是否存在线性相关关系2. 等价于对相关系数 r 的检验3. 采用 t 检验4. 检验的步骤为1. 提出假设:H0:r = 0 ;H1: r ¹ 02. 计算检验的统计量: 3. 确定显著性水平a,并作出决策1. 若|t|>ta

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论