卫生统计学简答题_第1页
卫生统计学简答题_第2页
卫生统计学简答题_第3页
卫生统计学简答题_第4页
卫生统计学简答题_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学简答题方差分析的基本思想和应用条件是什么?答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助 F分布作出统计推断,从而推论各种研究因素对试验结果有无 影响。其应用条件是, 各样本是相互独立的随机样本,均服从正态分布;各样本的总体方差相等,即方差齐性。多组定量资料比较时,统计处理的基本流程是什么?答:多

2、组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis 秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适 的方法(如Bonferonni、LSD法等)进行两两比较。简述秩和检验的优缺点秩和检验的优点是(1)不受总体分布限制,适用面广;(2 )适用于等级资料及两端无确定 值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能 充分利用信息,检验效能低。试述

3、假设检验与置信区间的联系与区别。答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信 区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即 判断两总体参数是否不等。试述两类错误的意义及其关系 答:1类错误(type I error ):如果检验假设OH实际是正确的,由样本数据计算获得的检 验统计量得出拒绝 0H 的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设 0H(弃真)的错误称为I类错误。U类错误(type n error):假设检验的另一类错误称为U类错误(type n error),即检验假设OH原本不正确(1H正确),由样本

4、数据计算获得的 检验统计量得出不拒绝 0H (纳伪)的结论,此时就犯了 n类错误。n类错误的概率用B 表 示。在假设检验时,应兼顾犯I类错误的概率(a)和犯n类错误的概率(B)。犯I类错误的概率(a)和犯n类错误的概率(B)成反比。如果把I类错误的概率定得很小, 势必增加犯n类错误的概率,从而降低检验效能;反之,如果把n类错误的概率定得很小, 势必增加犯I类错误的概率,从而降低了置信度。为了同时减小a和只有通过增加样 本含量,减少抽样误差大小来实现。什么资料适合用秩和检验进行检验?简述秩和检验步骤 。答:提示:进行有序资料的比较时宜采用秩和检验。( 1)等级资料;( 2)偏态资料;( 3)分布

5、不明的资料;( 4)资料中各组方差不齐,且转换后不能达到方差齐性;( 5)一端或两端无界。秩和检验步骤为: 建立假设H0和H1,并确定检验水准a; 根据不同的设计类型对资 料进行编秩并计算秩和;根据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。进行有序资料的比较时宜采用秩和检验。服从二项分布及 Poisson 分布的条件分别是什么?答:二项分布成立的条件:每次试验只能是互斥的两个结果之一;每次试验的条件不 变;各次试验独立。Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试 验次数n很大,而所关心的事件发生的概率n很小。2.二项分布、Poisson分布分别在何种条

6、件下近似正态分布?简答:二项分布的正态近似:当 n较大,n不接近0也不接近1时,二项分布B(n,冗)近似正态分布 N(n n, )1( nn -n)。Poisson分布的正态近似:Poisson分布)(入n,当入相当大时(20),其分布近似于正态分布 简述简单线性回归分析的基本步骤。答: 绘制散点图,考察是否有线性趋势及可疑的异常点;估计回归系数; 对总体回归系数或回归方程进行假设检验;列出回归方程,绘制回归直线;统计应用。简述线性回归分析与线性相关的区别与联系。答:区别: ( 1 )资料要求上,进行直线回归分析的两变量,若X 为可精确测量和严格控制的变量,则对应于每个 X的Y值要求服从正态分

7、布;若 X、Y都是随机变量,则要求 X、Y 服从双变量正态分布。直线相关分析只适用于双变量正态分布资料。( 2)应用上,说明两变量线性依存的数量关系用回归 (定量分析) ,说明两变量的相关关系用相关 (定性分析)。( 3)两个系数的意义不同。 r 说明具有直线关系的两变量间相互关系的方向与密切程度, b 表示X每变化一个单位所导致 Y的平均变化量。(4)两个系数的取值范围不同:-1 r 0时,r 0,均表示两变量X、Y 同向变化;bv0时,r v 0,均表示两变量X、Y反向变化。(2)回归系数b与相关系数r的假设检验等价,即对同一双变量资料, rbtt= 0由于相关系数 r 的假设检验较回归系

8、数 b 的假设检验简单,故在实际应用中常以 r 的假设检验代替 b 的假设检验0(3)用回归解释相关:由于决定系数 2R=SS回 /SS总,当总平方和固定时,回归平方和的大小决定了 相关的密切程度。回归平方和越接近总平方和,则2R越接近1,说明引入相关的效果越好。例如当r=0.20,n=100时,可按检验水准0.05拒绝H0,接受H1,认为两变量有相关关系。但 2R=(0.20)2=0.04 ,表示回归平方和在总平方和中仅占 4, 说明两变量间的相关关系实 际意义不大直线相关与回归有何联系与区别?联系: ( 1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同0(2)回归系数与相关系

9、数的假设检验是等价的,对同一样本的资料,回归系数的t 检验与相关系数的t检验其数值相等,即tr=tb 。(3)可以用回归解释相关。r的平方称为决定系数(coefficient of determ ination)。区别:回归要求因变量 Y是正态分布的随机变量;X可以是精确测量或严格控制的变量, 也可以是呈正态分布的随机变量,当X是精确测量或严格控制的变量时,此时的回归称I型回归。当X是呈正态分布的随机变量时,此时的回归称为U型回归。相关要求变量X、Y都是呈正态分布的随机变量。当说明两变量间依存变化的数量关系时用回归,当说明两变 量间的相关关系时用相关简述多重线性回归分析中,自变量筛选的标准与原

10、则1、残差平方和(SSE)缩小或决定系数增大2、残差平方(MSE缩小与调整确定系数(R2a)增大3、 Cp 统计量 Cp S|E1 (n 2p)准则:较小的Cp值,Cp=p作为最优的准则,如 p个自变量的模型是合适的,则标准差与标准误有何区别和联系 ?标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而

11、减小,甚至趋于 0。联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。(联系:1、二者都是表示变异度大小的统计指标 2、标准误与标准差大小成正比,与抽样例数n的平方根成反比)何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假 设作出拒绝或不拒绝的结论的过程。 假设检验一般分为以下步骤: 建立假设:包括:H0,般取 0.05 :称无效假设;H1:称备择假设; 确定检验水准:检验水准用a表示,a计算检验统计量:根据不同的检验方法,使用特

12、定的公式计算;确定P值:通过统计量及相应的界值表来确定 P值;推断结论:如Pa,则接受H0,差别无统计学意义;如 P 冬a,则拒绝H0,差别有统计学意义。常用统计图的适用范围是什么?常用的统计图及适用条件是:条图,适用于相互独立的资料,以表示其指标大小;百 分条图及远圆图,适用于构成比资料,反映各组成部分的大小;普通线图:适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。半对 数线图,适用于连续性资料,反映事物发展速度(相对比)。直方图:适用于连续性变量资料,反映连续变量的频数分布。散点图:适用于成对数据,反映散点分布的趋势。简述率的标准化法的基本思想 当比较两

13、个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率 是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总 率的对比。 率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构 成不同对指标的影响, 使算得的标准化率具有可比性。 例如比较两人群的死亡率、 出生率、 患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时, 常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用 统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。简述x 2检验的的基本思想X 2检验是检验

14、理论频数与实际频数的吻合程度, 从基本公式(TTA22)(-刀=x)可以看出, 在检验假设成立的情况下,T (理论频数)与 A (实际频数)之差一般不会很大,此时 x2 值也较小;反之,x2值较大。当x2值较大,且大于一定的界值时,就拒绝 H0,接受H1, 认为两样本率有统计学差异。当 x2值较小,且小于特定的界值时,就不拒绝 H0,认为两 样本率差异无统计学意义 简述当不满足行X列的 2 X检验的条件时的处理办法当不满足行X列的2 X检验的条件(RX C表中不宜有1/5的格子数小于5,或有一个格子的 理论频数小于1时,可采用下述方法处理:(1)增大样本例数,(2)删除理论数较小的行 和列,(3)将理论数较小的行或列与性质相近的行或列合并,但在合并时应注意合并的合 理性。(2)和(3)两种处理方法会丢失部分信息。请简述正态分布的特征1、曲线在横轴上方均数处最高;2、以均数为中心,左右对称;3、正态分布有两个参数:(1)卩:位置参数,确定曲线位置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论