统计学名称解释_第1页
统计学名称解释_第2页
统计学名称解释_第3页
统计学名称解释_第4页
统计学名称解释_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章一、名词解释1、参数 (parameter) :也叫参变量,是一个变量。如果我们引入一个或一些另外 的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究 的变量,我们把这样的变量叫做参变量或参数。描述总体特征的概括性数字度 量,它是研究者想要了解的总体的某种特征值。2 、统计量 (statistic) :描述样本特征的数,是统计理论中用来对数据进行分 析、检验的变量。3 、总体 (population) :根据研究目的确定的研究对象的全体。当研究有具体 而明确的指标时,总体是指该项变量值的全体。4、样本 (sample) :从总体中随机抽取的部分观察单位,总体中有代表性

2、 的一部分。5 、同质 (homogeneity) :是指观察单位(研究个体)间被研究指标的影响因 素相同。6 、变异 (variation) :同质事物个体间的差异。来源于一些未加控制或无法控制 的甚至不明原因的因素。7、 概率 (probability) :度量随机事件发生可能性大小的一个数值, 是一个在 0 到 1 之间的实数。8、 抽样误差 (sampling error) :由于抽样所造成的样本统计量与总体参数的差 别。三、简答题1、统计学的基本步骤有哪些?设计、搜集、整理、分析资料2、总体与样本的区别与关系?区别: 总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时

3、,总 体是指该项变量值的全体。样本:总体中有 代表性 的一部分。 联系:总体包含样本,样本是总体中的一部分3、抽样误差产生的原因有哪些?可以避免抽样误差吗?产生原因 :(1) 总体单位的标志值的差异程度。 差异程度愈大则抽样误差愈大,反之则愈小。(2) 样本单位数的多少。 在其他条件相同的情况下,样本单位数愈多,则抽样误 差愈小。(3) 抽样方法。 抽样方法不同,抽样误差也不相同。一般说,重复抽样比不重复 抽样,误差要大些。(4) 抽样调查的组织形式。 抽样调查的组织形式不同,其抽样误差也不相同,而 且同一组织形式的合理程度也会影响抽样误差。 不可以,它具有不可避免性,只能减少抽样误差4、何为

4、概率及小概率事件? 概率:度量随机事件发生可能性大小的一个数值,是一个在0到 1之间的实数小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上 将p (A)冬或冬 称为小概率事件,认为小概率事件在一次试验中不可能发生第二章第三章1. 正态分布 (normal distribution) :也叫高斯分布 ( Gaussian distribution ), 一种最常见、最重要的连续型对称分布 (正态分布是对称分布,但对称分布不一 定是正态分布)2. 中位数 (median) :是将一批数据从小至大排列后位次居中的数据值,反映一 批观察值在位次上的平均水平。3. 四分位数间距 (

5、quartile interval):是上四分位数与下四分位数之差 , 用四分位数间距可反映变异程度的大小. 即: Q3 -Q14. 方差 (variance) :样本观察值的离均差平方和的均值。表示一组数据的平均 离散情况。反映一组数据的平均离散水平。:也称右偏态分布,右侧的:左偏态分布,左侧的组:对数为正态分布的任5. 正偏态分布 (positively skewed distribution) 组段数多于左侧的组段数,频数向右侧拖尾6. 负偏态分布 (negatively skewed distribution)段数多于右侧的组段数,频数向左侧拖尾7. 对数正态分布 (logarithm

6、ic normal distribution )意随机变量的概率分布。如果 X 是正态分布的随机变量,则exp( X) 为对数 分布;同样,如果 Y 是对数正态分布,则 log( Y) 为正态分布。8. 医学参考值范围 (medical reference range):指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。最常用的是 95% 参考值范围 三、简答题1. 描述数值变量资料集中趋势的指标有哪些? 其适用范围有何异同?平均数:描述一组变量值的集中位置或平均水平的指标体系不同的分布使用不同的指标( 算术 ) 均数:正态或近似正态或观察值相差不大的小样本资料

7、 几何均数:对数正态分布或等比级数资料中位数 :一般偏态分布(传染病发病的潜伏期)2. 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同? 反映数据的离散度( Dispersion )。即个体观察值的变异( variation )程度。 常用的指标有:1. 极差 (Range) ( 全距 ) 适用范围: 任何计量资料;是参考变异指标2. 百分位数与四分位数间距 Percentile and Quartile range 百分位数:适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定 值的资料四分位数间距:常用于描述偏态分布资料的离散程度,值越大 变异程度越大, 中位数与四分位间

8、距一起使用,描述偏态分布资料的特征。3. 方差 Variance 正态分布资料4. 标准差 Standard Deviation 适用范围:均数与标准差经常被同时用来描述 正态分布资料的集中和离散趋势。5. 变异系数 Coefficient of Variation 适用范围:主要用于单位不同或均数 相差悬殊资料3. 医学中参考值范围的涵义是什么?确定的步骤和方法是什么? 医学参考值范围 :指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物步骤与方法: 1) . 确定“正常人”对象的范围:即根据研究目的确定的未患被研 究疾病的个体。2) . 统一测定标准:即检验用的试剂批号、仪器、人员、条

9、件等应相同。3) . 确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也 可根据检验判断。4) . 样本含量确定:一般来讲,正态分布资料所需的样本含量应在 100 以上,偏 态或未知分布时样本含量应更大。5) . 确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。6) . 确定百分位点:一般取 95%或 99%。第四章第五章一、名词解释1 标准误 (standard error) :表示样本统计量抽样误差大小的统计指标,统计上 通常将统计量(如样本均数、样本率 p 等)的标准差称为标准误。2可信区间(confideneeinterval):按一定的或(1-

10、a )用一个区间来估计参数所 在 的 范 围 , 该 范 围 通 常 称 为 参 数 的 可 信 区 间 或 者 置 信 区 间(con fide nee in terval,CI),预先给定的概率(1- a)称为可信度或者(confidencelevel), 常取 95%或 99%。3 假设检验 (hypothesis testing) :利用样本提供的信息判断假设是否成立的统 计方法称为统计假设检验。4 统计推断 (statistical inference) :用一个或一系列样本的结果去估计总体可 能的结果的过程。包括假设检验和参数估计5 I型错误(type I error): “实际无

11、差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是 (其值等于检验水准)6 U型错误(type II error):“实际有差别,但下了不拒绝 H0的结论”,假阴性错误。犯这种错误的概率是 (其值未知)7 检验效能 (power of test): 当两总体确有差别,按检验水准所能发现这种差别的能力。8 变量变换 (variable transformation) :也称变量代换,是将原始数据作某种 函数转换,如转换为对数值。三、简答题1 假设检验的基本原理和步骤 。假设检验过去称显着性检验。它是利用小概率反证法,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在

12、H0成立的条件下计算检验统计量, 最后获得 P 值来判断。1. 建立检验假设,确定检验水准(选用单侧或双侧检验)(1 )无效假设( null hypothesis )零假设,记为 H0;(2)备择假设又称对立假设,记为H1。2. 计算检验统计量 根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。3. 确定P值,下结论。选定显着性水平a的值,PWa,拒绝H0,接受H1,下“有差别”的结论。Pa不拒绝H0,但不能下“无差别”或“相等”的结论, 只能下“根据目前试验结果,尚不能认为有差别”的结论2标准差和标准误的异同。相同点:都是用来表示变异程

13、度的,均是反映随机误差的。区别:标准差与标准误的意义、作用和使用范围均不同。标准差(亦称单数标准差)一般用SD表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离 散程度,是数据精密度的衡量指标;而标准误一般用SE表示,反映样本平均数对总 体平均数的变异程度,从而反映抽样误差,是量度结果精密度的指标。标准差是最常用的统计量,一般用于表示一组样本变量的分散程度;标准误一 般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参 数的区间估计与点估计等。3参考值范围和置信区间有何区别?参考值范围是指具有明确背景资料的参考人群某项指标的测定值,例如医学参考范围指包括绝大多

14、数的正常人的人体形态 ,功能和代谢产物等,表示值时可能有单 侧也可能有双侧,表示方法为正态分布或百分位数法置信区间是指在做区间的估计时指按一定的概率 (1-a)估计总体参数所在的范围, 其中(1-a)被称为置信度,两者的不同之处在于前者是对于某种指标的估计,后者是对参数的估计。置信区间与参考值范围的意义、计算公式和用途均不同。1. 从意义来看95 %参考值范围是指同质总体内包括95 %个体值的估计范围,而总体均2. 从计算公式看若指标服从,95%参考值范围的公式是:x 。总体均数95 %可信区间的公式是:c未知的小样本 X to.o5/2,vSXc未知的大样本X U0.05/2,vSX前者用,

15、后者用。前者用,后者用 a为,为V的t或U界值。4 t检验和方差分析的基本思想各是什么?二者的区别是什么?t检验(假设检验的一种):假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P或P 3 )数据之间均数差异是否显着的一种假设检验方法。5、t检验和t检验的应用条件有何异同?t检验:样本含量n较小时(如n5,且有 宀时,二 项分布可看成近似正态分布。Poisson 分布:它是普通二项分布在次数极大,发生机率很小时的极限,记作X P(), 越大则Poisson分布渐近正态分布。实际应用上, 20就可将其看作是正态分布。第六章 分类资料的统计描述一、名词解释1、率( rate ):

16、是说明某事物(或现象)发生的频率或强度的指标。2、 构成比( constituent ratio) :是说明某事物内部各组成部分的比重或分布的指标。3、 相对比( relative ratio):是说明两个有关联的事物间的相对关系的指标。4、标准化率( standardized rate) :也称调整率, 是多组率之间按统一的“标准”进行 调整,使之具有可比性的率。5、标化发病比( standardized incidence ratio):被标化组实际发病数与预期发病数之比。6、标化死亡比( standardized mortality ratio):被标化组实际死亡(发病、患病等)数与预期

17、死亡(发病、患病等)数之比。第七章 二项分布与 Poisson 分布及其应用第八章 X2 检验第九章 秩和检验三、简答题1、二项分布、 Poisson 分布与正态分布间有何关系?2、X2 检验的应用条件有哪些?(1)四格表的分析方法选择条件:n 40, T 5,专用公式;n 40, 1 2时,一般不作校正。(2)配对四格表的分析分析方法选择条件:b+c 40,专用公式;20 v b+c 5 , n充分大,凡是能用 u检验的都可以2 2用卡方检验,u =X (v =1);2. 两者都有连续性校正问题;二者的不同点:1. 由于正态分布可确定单双侧检验界值,当满足正态分布近似条件时,可使用u检验进行单侧检验;2. 满足四

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论