版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、-. z卫生统计学复习资料08生物技术 曾洋and林阳绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体在规律性,而随机性的数量化,是通过概率表现出来。总体:总体是根据研究目确实定的同质的观察单位的全体,更确切的说,是同质的所有观察单位*种观察值变量值的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取局部观察单位,其测量结果的集合称为样本sample。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样
2、本。抽样:从研究总体中抽取少量有代表性的个体,称为抽样。概率:概率(probability)又称几率,是度量*一随机事件A发生可能性大小的一个数值,记为PA,PA越大,说明A事件发生的可能性越大。0PA1。频率:在一样的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很屡次时PA= m/n。变量:表现出个体变异性的任何特征或属性。随机变量:随机变量random variable是指取指不能事先确定的观察结果。随机变量的具体容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的
3、概率分布。系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的*种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。随机误差:随机误差random error又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。变异:在自然状态下,个体间测量结果的差异称为变异variation。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下
4、,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。抽样误差:消除了系统误差,并将随机测量误差控制在允许围由于个体变异的存在,在抽样过程中产生的样本统计量与总体参数之间的差异。分布:随机现象的规律性通过概率来刻画,而随机事件的所有结局及对应概率的排列称为分布。定量资料的统计描述名词解释算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。众数:众数原指总体中出现时机最高的数值。样本众数则
5、是在样本中出现次数最多的数值。极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。四分位数间距:是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。标准差:是方差的正平方根,使用的量纲与原量纲一样,适用于近似正态分布的资料,大样本、小样本均可,最为常用。变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比拟,用CV表示。问答题常见的描述集中趋势的指标有哪些,概念分别是什么.答:常见的描述集中趋势的指标有算数均数、几何均数、中位数
6、和众数。概念见名解。常见的描述离散趋势的指标有哪些,概念分别是什么.答:常见的描述离散趋势的指标有极差、四分位数间距、方差、标准差和变异系数。概念见名解。定性资料的统计描述名词解释相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等。标准化法:是常用于部构成不同的两个或多个率比拟的一种方法。标准化法的根本思想就是指定一个统一标准标准人口构成比或标准人口数,按指定标准计算调整率,使之具备可比性以后再比拟,以消除由于部构成不同对总率比拟带来的影响。问答题常用的相对数指标有哪些.它们的意义和计算上有何不同.答:常用的相对数指标有:率、构成比和相比照。意义和计算
7、公式如下:率又称频率指标,说明*现象发生的频率或强度,常以100%、1000等表示。构成比又称构成指标,说明*一事物部各组成局部所占的比重或分布。常以百分数表示。比又称相比照,是A、B两个有关指标之比,说明两者的比照水平,常以倍数或百分数表示,其公式为:相比照=甲指标 / 乙指标或100%甲乙两个指标可以是绝对数、相对数或平均数等。应用相对数时应注意哪些问题.答:应用相对数时应注意的问题有: 计算相对数的分母一般不宜过小。 分析时不能以构成比代替率。 不能用构成比的动态分析代替率的动态分析。 对观察单位数不等的几个率,不能直接相加求其总率。 在比拟相对数时应注意可比性。 对样本率或构成比的比拟
8、应随机抽样,并做假设检验。应用标准化法的考前须知有哪些.答:应用标准化法时应注意的问题有:标准化法的应用围很广,其主要目的就是消除混杂因素的影响。标准化后的标准化率,已经不再反反映当时当地的实际水平,它只是表示相互比拟的资料间的相对水平。报告比拟结果时必须说明所选用的标准和理由。两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。统计表和统计图名词解释统计表:将统计资料及其指标以表格形式列出,称为统计表statistical table。狭义的统计表只表示统计指标。统计图:统计图(statistical graph)是将统计指标用几何图形表达,即以点的位置、线段的升降、直条
9、的长短或面积的大小等形式直观的表示事物间的数量关系。问答题常用统计图的定义和制图要求。名 称定 义制 图 要 求条 图用等宽直条的长短来表示相互独立的各统计指标的数值大小起点为0的等宽直条,条间距相等,按上下顺序排列。普通线图适用于连续性资料。用线段的升降来表示一事物随另一事物变化的趋势。纵横两轴均为算术尺度,相邻两点应以折线相连。图线条不宜超过3条。 半对数线图用线段的升降来表示一事物随另一事物变化的速度。横轴为算术尺度,纵轴为对数尺度。余同普通线图。圆 图以圆面积表示事物的全部,用扇形面积表示各局部的比重以圆面积为100%,将各构成比分别乘以3.6度得圆心角度数后再绘扇形面积。通常以12点
10、为始边依次绘图。直方图用矩形的面积来表示*个连续型变量的频数分布常以横轴表示连续型变量的组段要求等距,纵轴表示频数或频率,其尺度从0开场,各直条间不留空隙。散点图以点的密集程度和趋势表示两种事物间的相关关系绘制方法同线图,只是点与点之间不连接。常用概率分布名词解释正态分布:假设指标的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布normal distribution。通常用记号表示均数为,标准差为的正态分布。标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布standard normal distribution,通常记为。问答题正态概率密度曲线的位置与形状具有哪些特点.答
11、:正态概率密度曲线的位置与形状具有以下特点:关于*=对称。在*=处取得该概率密度函数的最大值,在*=处有拐点。曲线下面积为1。决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之,减小,曲线沿横轴向左移。决定曲线的形状,当恒定时,越大,数据越分散,曲线越矮胖;越小,数据越集中,曲线越瘦高。参数估计根底名词解释抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。标准误及:通常将样本统计量的标准差称为标准误。许多样本均数的标准差称为均数的标准误,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。点估计:是直接利用样本统计量的一个数值
12、来估计总体参数。区间统计:用统计量和确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。可信区间:按预先给定的概率确定的包含未知总体参数的可能围。该围称为总体参数的可信区间。它确实切含义是:可信区间包含总体参数的可能性是1-,而不是总体参数落在该围的可能性为1-。假设检验根底名词解释I型和II型错误:I型错误type I error,指拒绝了实际上成立的H0,这类弃真的错误称为I型错误,其概率大小用表示;II型错误type II error,指承受了实际上不成立的H0,这类存伪的误称为II型错误,其概率大小用表示。检验效能:1-称为检验效能power of test,它是指当两总体
13、确有差异,按规定的检验水准所能发现该差异的能力。问答题假设检验的根本步骤是什么.答:建立假设、选用单侧或双侧检验、确定检验水准;选用适当检验方法,计算统计量;确定P值并作出推断结论。假设检验与区间估计的关系式什么.答:置信区间具有假设检验的主要功能置信区间课提供假设检验没有提供的信息。置信区间在答复差异有无统计学意义的同时,还可以提示差异是否具有实际意义。假设检验比置信区间多提供的信息:假设检验可以报告确切的P值。应用假设检验需要注意的问题有哪些.答:应用检验方法必须符合其适用条件。权衡两类错误的危害以确定的大小。正确理解P值的意义,如果P,宜说差异有统计学意义。方差分析名词解释总变异:样本中
14、全部实验单位差异称为总变异。其大小可以用全部观察值的均方方差表示。组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。组变异: 各处理组部观察值大小不等,这种变异称为组变异,可用组均方表示。随机区组设计:事先将全部受试对象按自然属性分为假设干区组,原则是各区组的受试对象的特征一样或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。第九章 *2检验问答题RC列表 2 检验的考前须知1、行列表中不宜有1/5以上的理论值小于5, 也不允许有理论值小于1。如果发生上述情况,一般有两种处理
15、方法: 增大样本含量,从而期望增论值。 将理论值小于5的行和列与性质相近的邻近行或列中的实际频数合并, 期望重新计算的理论值增大。2、当多个样本率(或构成比)比拟的 2 检验结论有统计学意义,并不能判定任意两组之间的差异有统计学意义,必须用行列的分割的方法进一步作两两比拟。3、对于有序的分类变量,采用卡方检验,不能考虑数据的有序性质。第十章 基于秩次的非参数检验名词解释参数检验:但凡以特定的总体分布为前提,对未知的总体参数做推断的假设方法。非参数检验:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,故又称任意分布检验。第十一章 两变量关联性分析名词解释线性相关系数:又称Pear
16、son积矩相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标,其定义为公式:样本相关系数: 问答题相关分析应用中的应注意的问题:散点图能够使我们直观地看出两变量间有无线性关系,所以在进展相关分析前应先绘出散点图,当散点有线性趋势时,才进展相关分析。线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料。出现离群值时慎用相关。相关关系不一定是因果关系。分层资料盲目合并易出假象。第十二章 简单回归分析名词解释回归分析:研究结果变量如何随自变量变化的常用方法。回归直线的置信带:将置信区间的上下限分别连起来形成的两条弧线间的区域。最小二乘原则:每个观察点距离回归线的纵向距离
17、的平方和最小,即残差平方和最小。1-置信带的意义:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧线曲线所形成的区带,其置信度为1-。问答题线性回归模型的适用条件:因变量Y与自变量*呈线性关系。每个个体观察值之间相互独立在一定围,任意给定*值,对应的随机变量Y都服从正态分布在一定围,不同的*值所对应的随机变量Y的方差相等。公式回归方程 : =a+b* b= a=b方差分析=bt检验注意:对同一资料作总体系数是否为0的假设检验,方差分析和t检验是等价的,并且有 的关系。三总体回归系数的置信区间 四决定系数 回归平方和与总离均差平方和之比,记为第十四章 实验设计实验设计的根本要素:受试
18、对象、处理因素、实验效应。小题实验设计的根本原则:对照、随机化、重复。小题常用的实验设计方案:完全随机设计、配对设计、随机区组设计、拉丁方设计、穿插设 计、析因设计、嵌套设计、正交设计名词解释处理因素(被试因素):根据研究目确定的欲施加或欲观察的、并能引起受试对象直接或间接效应的因素,简称处理或因素(factor)。是根据研究目确实定的主要因素,处理因素在整个实验中应始终要保持不变。非处理因素:与处理因素可能同时存在的能使受试对象产生效应的非研究因素。非处理因素常常会干扰研究因素的观察与分析,因此又称为干扰因素或混杂因素(confounder)。问答题受试对象应满足三个根本条件:一是对处理因素敏感;二是特异性,即不受非处理因素干扰;三是反响必须稳定。 影响样本含量估计的因素1.第一类错误的大小:越小所需样本含量愈多;2.检验效能(1)或第二类错误的大小:检验效能愈大,第二类错误的概率愈小,所需样本含量愈多。3.容许误差:容许误差愈大,所需样本含量愈小。4.总体标准差或总体概率:反映资料的变异度。愈大,所需样本含
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 青蓝工程青年科技创新创业方案
- 校园宿舍电气施工方案
- 工业厂房墙面乳胶漆施工方案
- 城市建筑电力供应设计方案
- 防范网络电信诈骗宣传志愿服务活动方案
- 孝亲敬老倡议书范文
- 孝亲敬老从我做起为母亲节制定活动方案
- 江苏省盐城市英语小升初试卷与参考答案
- 网络分析仪操作基础
- 二年级班主任课堂管理工作总结
- 基于数据挖掘的高职学情分析与课堂教学质量提升研究
- 能源岗位招聘笔试题与参考答案(某大型国企)2024年
- 蔡戈尼效应完整版本
- 农业灌溉装置市场环境与对策分析
- 统编版道德与法治初二上学期期中试卷及答案指导(2024年)
- GB/T 22838.6-2024卷烟和滤棒物理性能的测定第6部分:硬度
- 职业技能等级认定质量控制及规章制度
- 山东省临沂市(2024年-2025年小学四年级语文)人教版期中考试(上学期)试卷及答案
- 英大传媒投资集团限公司2024年应届毕业生招聘(第一批)高频500题难、易错点模拟试题附带答案详解
- 2024人教版道法七年级上册第二单元:成长的时空大单元整体教学设计
- 肺胀(慢性阻塞性肺病)中医优势病种诊疗方案
评论
0/150
提交评论