《卫生统计学》-案例版丁元林课后思考题答案_第1页
《卫生统计学》-案例版丁元林课后思考题答案_第2页
《卫生统计学》-案例版丁元林课后思考题答案_第3页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《卫生统计学》-案例版丁元林课后思考题答案1资料之间是如何转换的?定量资料(离散型变量、连续型变量)2无序分类资料(二项分类资料、无序多项分类资料)3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。3、举例说明小概率事件的含义。100一次打中靶的概率≤0.0第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施不能随机分组很难控制干扰因素一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计时,逐一编号繁复,有时难以做到。系统抽样:优点是易于理解、操作简便,被分层抽样:优点是抽样误差小,各层可以独进行分层,操作麻烦。样调查;缺点是抽样误差大。3、调查设计包括那些基本内容?答:(1)明确调查目的和指标确定调查对象和观察单位选择调查方法和技术估计样本大小编制调查表评价问卷的信度和效度制定资料的收集计划指定资料的整理与分析计划制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;备查项目保证分析项目填写得完整和准确的其他项目大型调查表的前言和表底附注。第三章实验设计1、简述实验设计的特点。答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平是由随机分配而定的。2、简述一般选择受试对象的原则。答:(1)受试对象能从临床试验中受益(2)受试对象具有代表性(3)受试对象具有依从性(4)受试对象可以是志愿者。3、什么是混杂因素?设计时怎样控制混杂因素?化的办法来控制混杂因素的影响。4、什么是随机化?怎样实现随机抽样和随机分组?列表或统计软件包来实现随机抽样和随机分组。第四章定量资料的统计描述1、常用的平均数指标有哪些?各适用于何种类型资料?答:(1)有算术均数、几何均数和中位数、众数、调和数等。(2)算术均数:适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势几何均数:等比资料、对数正态分布资料口资料”(即一端或两端无确切数值的资料)2、如何描述定量资料的离散趋势?答:(1)极差:极差越大,单峰对称分布小样本资料的变异程度越大,只局限于初步描述;四分位数间距:四分位数间距越大,偏态分布及但不能全面概括所有观察值的变异情况;方差和标准差:方差和标准差越大,对称分布大;变异系数:变异系数越大,不同度量衡单位或者均数相差悬殊的资料的变异度越大。3、正态分布有哪些基本特征?答:(1)概率密度函数曲线在均数处最高;以均数为中心左右对称,且逐渐减少;正态分布有两个参数,即和曲线下的面积分布有一定规律。第五章定性资料的统计描述1答:相对数适用于定性资料的统计描述。2、率和构成比在应用上主要区别是什么?内部各组成部分的频数所占的比重和分布。3间接标准化法在应用上有何区别?论时,需要对率进行标准化。直接法:已知被观察人群中各年龄组的患病率等资料,适用于两组资料中某事物发生率的互相对比病率的资料4答:动态数列(dynamicseries)是一系列按时间顺序排列起来的统计指标,用以说明事物在时间上的变化和发展趋势。常用动态数列分析指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。第六章总体均数和总体率的估计1、样本均数的标准误的意义是什么?答:反映抽样误差的大小。 越大,样本均数的分越分散,样本均数与总体均数差别越大,由样本均数估计总体均数的可靠性就越小;反之,样本均数分布就越集中,样本均数与总体均数差别就越小,由样本均数估计总体均数可靠性就越大。2、标准误与标准差有何区别?答:①意义不同:标准差:表示观测值的变异程度标准误:反映抽样误差的大小②用途不同:标准差:确定医学参考值范围标准误:用于统计推断(参数估计、假设检验)③公式不同:标准差: 标准误:3、正常值范围与总体均数的可信区间有何区别?答:(1)意义不同:总体均数的可信区间是按预先给定的概率,确定的未知参数的可能范围;正常值范围是描述“正常人”的解剖、生理、生化、某项指标的波动范围公式不同可信区间已知: 或σ未知但n或σ未知:正常值范围:正态分布: 或偏态分布~P100-X均数;正常值范围是用于判断观察对象的某项指标正常与否。4、二项分布、Poisson分布与正态分布之间有何区别与联系?Poisson用概率函数描述其分布状况;而正态分布是连续性概率分布,用密度函数描述其分布状况。分布可以看作是发生概率π很小而观察nλ>20时,Poissonnnπn(1-π)5时,二项分布接近于正态分布。第七章假设检验1问题?答:意义:用样本指标估计总体指标,其结论有的完原假设。应用假设检验时注意的问题:1应有严密的研究设计,即总体应有同质性,样本应有代表性及组间具有可比性;2正确理解a水准和P值的意义,P值越小,越HaP值小到何种程度才拒绝0,H 30;一定有实际意义;4假设检验的结论不能绝对化。2、答:(1)由抽样误差所致(2)体参数之间存在显著性差异。3、假设检验与区间估计有何区别及联系?总体均数的范围;假设检验用于推断质的不同,即判提供更多的信息:可信区间不但能回答差别有无统计学意义,而且还能提示差别有无实际的专业意义。联系:可信区间亦可回答假设检验的问题:可信区间H,按HH,则按0 0 0水准,拒绝H,接受H0 1。4III型错误的区别及联系何在?检验效能的含义是什么?答:(1)区别:I型错误是H实际上是成立的,但由0Ha表示0, ;II型错误是实际上是不成立的,但假设检验没有拒绝它,称“取伪”,概率用表示。a和则只能增大样本含量。(2)a水准能够发现这种差别的能力。5、怎样正确运用单侧检验和双侧检验?验。第八章t检验1、两样本均数比较时为什么要做统计检验?答:两样本均数分别代表的总体均数与相等时,也1 2可能会因抽样误差而导致两样本均数不相等,因此需要做统计检验。2、两样本均数检验比较的t检验中,什么情况下做单侧检验?什么情况下做双侧检验?答:若从专业知识判断一种方法的结果不可能低于或3、t检验要求满足哪些基本条件?资料服从正态分布方差齐性且n较小(n<50)4、在两样本t检验,如果方差不齐,但两组样本量相同并且很大,能否忽略t检验对方差不齐的要求?答n1n250若两总体方差不具有齐性,可采用t或者进行变量转换或者用秩和检验来处理。5t检验有什么关系?答:可信区间包含H,按水准,不拒绝H;若不包0 0H,则按HH0 0 1。第九章方差分析1、为什么不能用两两比较的t检验进行多个样本均数的比较?答:用两两比较的t检验进行多个样本均数的比较时,需要进行多次检验,根据概率乘法法则,全部判断正确的概率大大降低,犯I类错误的概率也就增大,甚至远远大于检验水准。因此,多组均数之间的两两比较不能直接用t检验。取而代之的是,必须在方差分HH0 1两比较。2、方差分析为何是单侧检验?答:F统计量(F=组间均方/组内均方)若原假设成立,即各处理组的样本来自于同一总体,F1近波动;否则,若原假设不成立,即不同处理的作用不同时,组间均方(处理因素的作用)一般大于组内均方(随机误差),因此,F1的F度,就拒绝原假设。因此,F0侧是不可能的,因此只会在另一侧,从而认为方差分析是单侧检验。3、为什么说随机区组设计方差分析的效率高于完全随机分组设计的方差分析?F值更容易出现显著分析的效率高于完全随机分组设计的方差分析。第十章卡方检验1、简述 检验的用途。答:①两个样本率或构成比的比较②多个样本率或构成比的比较③两个分类指标之间的关联性检验④频数分布的拟合优度检验2、2x2表资料,如何正确使用 检验?答(当≥40且所有≥5时用2x2表的 验的基本公式或者专用公式计算;当n≥40但有、1≤T<5时,需要用校正公式算 值;N<40或T<1时不宜计算 值需要用Fisher确切概率计算概率。3、简述RxC表的 检验的注意事项。答:(1)不允许有T<1,或者1<T<5的格子数不能超过总格子数的1/51<T<51/5采取方法:增加样本含量以增大理论频数将理论频数太小性质相近的行或列合并删去理论频数太小的格子所在的行或列单向有序列联表资料不能采用卡方检验4RxC事项。RxC表,选用秩和检验;若研究目的是分析两个有序分类变量间是否存若研究目的是分析两个有序分类变量间是否存在线性变化趋势,则用有序分组资料的线性趋势 验。第十一章非参数检验1有何优缺点?答:(1)非参数检验是不依赖总体的分布类型,不对总体参数进行推断,只是通过样本观察值比较总体的分布或分布位置的推断方法。式的统计推断方法,一般在样本所来自的总体分布型已知(如:正态分布)的基础上,对总体参数进行估计或检验。参数检验:优点是能充分利用提供的信息,检验效能较高缺点是对总体分布类型有比较严格的要求适用范围受到限制。 非参数检验:优点是分布类型不作要求,适用范围广,可用于任何类型资料;缺点是一般犯II类错误的概率β比参数检验大。2、什么是基于秩转换的非参数检验?它适用于哪些情况?用秩和作为统计量进行假设检验的方法。其中“秩”又称等级、即按数据大小排定的次序号,次序号的和(方差齐同等)的资料及无法经变量转换满足参数检验条件的资料;资料、等级资料;分布类型未知的资料。3数据要给予“平均秩次”,而同一组的相同数据可不必计算“平均秩次”?答:因为在不同符号或者对比组不取平均秩次会增大现同一数据,秩和不受影响。4n>10,1n-n>10z2 1非参数检?z检验是比较两样本的非正态分布总体均数的差别。5、完全随机设计两组或多组的等级资料的比较,何时宜用秩和检验?而何时宜用 检验?答:如果源始资料不满足参数检验条件,并不能精确用秩和检验;如果源始资料的分布是一种连续型随机变量的概率分布,并服从标准正态分布,能精确测定和比较两组或多组间的率、构成比、关联性或者频分布的拟合优度等时,用 检验。第十二章双变量关联性分析rr的应用条件有何不同?s答:直线相关系数r:1要求两随机变量要符合双变量正态分布,而且不分主次,处于同等地位2散点有线性趋势3两随机变量相关分析有实际意义;等级相关系数rs:1不服从双变量正态分布的资料2总体分布类型未知的资料3等级资料22x2McNemer 检验与Pearson 检验?McNemer检验;Pearson验。3、简述Person相关与Spearman相关的区别与联系。答:区别:1Person相关要求数据服从二元正态分布,属于参数统计量;而Spearman2两者总体参数的假设检验方法不完全相同1两者都可用于刻画两变量间线性相关的方向与23SpearmanPearson积距相关系数的计算来实现4样本含量大时,两者的假设检验方法近似。第十三章直线回归分析1、用什么方法考察回归直线图示是否正确?答:(1)连出的回归直线不应超出x的实测范围;(2)所绘的回归直线必然通过(,);(3)a。2、剩余标准差的意义和用途?xy线性影响后,y的S越小,表示回归方程的估计精度越高。

。y.x3答:(1)作回归分析要有实际意义应绘制散点图两变量间有线性关系存在,不一定确有因果关系以自变量的取值范围为限,不可随意外延满足线性、独立、正态和方差齐性条件核检查4、举例说明如何用用直线回归方程进行预测和控制?答预测:例如直线回归分析8岁男童心脏横与体重之间关系的回归方程为y=4.2121+0.2041x,据个体Y值的容许区间 可估计体重25kg的8岁健康男童其心脏横径有的可能性(8.6692,9.9610)cm的范围内。(2)控制:例如某市环境监测大气NOxY限Y +t S ,NO最大容许度为0.15mg/m^3时汽a(n-2) Y车流量应控制在1209辆/h。5答:(1)因变量依赖于自变量的变化而变化;以是规律变化的或人为选定的一些数值,也可以是随机变量;第十四章生存分析1答:(1)失访(失去联系)退出(死于其它原因)终止(观察结束时病人尚存活)2亡概率有何区别与联系?活的个体,到该时段结束时仍存活的可能性大小;而生存率是指观察对象经历t个单位时段后仍存活的可能性,即活过t时刻的概率。k联系:生存率实质上是累积生存概率,是多个时段的累积结果,S(t)=P*P*P*…P。n 1 2 3n(2)能性大小;而死亡率表示在某单位时间里的死亡频率或强度(整体或归因于指定因素)。影响整体死亡率。3、为什么两个样本比较的生存时间资料不适宜采用t检验或 检验进行分析?两个样本的总体分布不明确,不满足t检验或检验的应用条件。结局所经历的时间这两个因素,t检验或检验只能分析生存时间有无差别,并不能分析结局有无差别。第十六章Mate分析Mate分析的目的是什么?答:(1)提高检验效能解决若干单个研究结论不一致问题改善效应量的估计提出新的研究问题和研究方向Mate分析的基本步骤又哪些?答:(1)明确研究目的,制定研究计划;制定文献的纳入和排除标准;评价纳入文献的质量;提取必要的数据信息;资料的统计学分析;敏感性分析;报告结果。Mate分析中统计分析模型有哪些?如何选择?答:(1)固定效应模型和随机效应模型(2)需要根据同质性检验的结果来确定统计分析模型固定效应模型(fixedeffectmodel):同质性检验无统计学意义时选用随机效应模型(randomeffectmodel):同质性检验有统计学意义时选用4Mate是什么?果较无统计学意义或无效的研究结果被报告和发表的可能性大。产生原因:1研究者认为无统计学意义的研究意能对此类研究不予以发表。Mate险因素的关联强度,并引发偏倚。Mate分析中应注意的问题有哪些?答:(1)偏倚的识别和控制;Mate分析都采用相同的基本步骤;Mate防止和减少系统误差和随机误差;Mate征、生物学变异、场所、措施、依从性以及辅助治疗等对结果的影响;Mate分析的结果仅仅是对现有的纳入研究综合时更新结论。第十八章生命统计的常用指标1、平均死亡年龄与预期寿命有何区别?为什么预期平?(1预期寿命是假定同时出生的一批婴儿如果按现有该地区的年龄组死亡率而死亡,所能存活的平均年数。生活条件等个人差异限制着人们的寿命。预期寿命的提高同医疗技术的进步和卫生环境的改善是分不开了曾使古代人口大批死亡的各种流行性传染病。2指标时应该注意哪些问题?答:(1) ;定期间暴露人群中新发生的病例数。疾病的存在或流行情况。而发病率是由发病报告或队列研究获得的疾病频率,是衡量疾病的出现情况。3、常见的反应疾病死亡的统计指标有哪些?各有何优缺点?答:(1)测量死亡水平的指标人口

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论