




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、O(Q_Q)OO(Q_Q)O简答题1.欲研究广东省6岁儿童的身高情况,在广东省随机抽取了200名6岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。答:同质体现在同为广东省、同为6岁儿童,变异体现在200名儿童的身高不同。总体是指所有广东省6岁儿童,样本为200名6岁儿童。2卫生统计工作中的统计资料主要的来源有哪些?答:统计报表。经常性工作记录。专题调査或实验。3简述统计工作全过程的四个步骤。答:研究设计、收集资料、整理资料、统计分析。4试举例说明常见的三种资料类型。答:(1).计量或测量或数值资料,如身高、体重等。.计数或分类资料,如性别、血型等。.等级资料,如尿蛋白含量、。统计
2、学上的变异、变量、变量值是指什么?答:变异:每个观察个体之间的测量指标的差异称为变异。变量:表示个体某种变异特征的量为变量。变量值:对变量的测得值为变量值。简述编制频数表的步骤与要点。答:(1)找出最大和最小值,计算极差。确定组距和列出分组计划:第一组应包括最小值;最末组应包括最大值,并闭口。将原始数据整理后,得到各组频数。7描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?答:常用描述平均水平的平均数有算术均数、几何均数和中位数。算术均数适合:对称资料,最好是近似正态分布资料。几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。中位数适合:数据非对称分
3、布、分布不清楚或开口资料的情形。描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。极差适合:数据分布非对称的情形。四分位数差距适合:数据分布非对称的情形。方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。统计描述的基本方法有哪些,各自有何特点?答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。表:详细、精确。图:直观。指标:综合性好。10简述变异
4、系数的实用时机。答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。怎样正确描述一组计量资料?答:(1).根据分布类型选择指标。.正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。正态分布的主要特征有哪些?答:(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。(4)正态曲线下的面积分布有一定规律。参考值范围是指什么?答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。“正常人”是指排除了影响研究指标的疾病和有关因
5、素的同质人群。简述估计参考值范围的步骤与要点。答:设计:样本:“正常人”,大样本nM100。单侧或双侧。指标分布类型。计算:若直方图看来像正态分布,用正态分布法。若直方图看来不像正态分布,用百分位数法。15简述正态分布的用途。答:(1)估计频数分布。(2)制定参考值范围。(3)质量控制。(4)统计检验的理论基础。16简述可信区间在假设检验问题中的作用。答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。故将二者结合起来,才是对假设检验问题的完整分析。假设检验时,当PW005,则
6、拒绝H0,理论依据是什么?答:P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当PW0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于005,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于005,也就是说,有了概率保证。假设检验中Q与P的区别何在?答:以t检验为例,a与P都可用t分布尾部面积大小表示,所不同的是:a值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。P值是由实际样本获得的,是指在H0成立的前提下,出现大于或等于现有检验
7、统计量的概率。什么叫两型错误?作统计学假设检验为什么要加以考虑?答:如果H0正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为a;如果H0错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为卩。一般情况下,a越大,P越小;a越小,p越大。如果要同时减少两类错误,则需最大样本含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论时,都要考虑到两型错误。配对比较是不是就比成组比较好?什么情况下用配对比较比较好?答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不是说凡是配对试验就一定比成组比较好。实验是否应做配对比较,首
8、先应根据业务知识判断,看配成对子的个体间是否比不配对的个体间相似程度更高。t检验有几种?各适用于哪些情况?答:t检验以t分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种:一是样本均数与总体均数比较的t检验。即将一个样本均数X与一已知的总体均数作比较;二是配对资料的t检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。三是两个样本均数比较的t检验;两组的样本量可以不相同。此外尚有相关系数、回归系数的t检验。什么叫假设检验?医学研究中常用的假设检验有哪些?答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤是:提出检验假设0H,确定
9、单双侧与检验水准a;计算检验统计量;确定概率P值;判断结果。在医学研究中常用的显著性检验有u检验、t检验、F检验、2检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。通过实例说明为什么假设检验的结论不能绝对化?答:统计的结论为概率性的结论。拒绝H0时,可能犯I型错误。不拒绝H0时,可能犯II型错误。方差分析的检验假设(H0)是什么?答:各总体均数相等方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机答:总的离均差平方和等于各部分离均差平方和之和.总的自由度等于各部分自由度之和.完全随机设计:SS总=55组内+SS组间V总=V组内+V
10、组间随机区组设计:SS总=55组内+SS处理组间+SS区组间V总=V组内+V处理组间+V区组间三组均数比较时,为什么不能直接作一般的两两均数比较的t检验?答:增大犯第一类错误的可能性.两组均数差别的假设检验能否作方差分析,为什么?答:可以方差分析与t检验关系:k=2时,F=t2,P值相等,即两检验等价。方差分析中,组间变异是来源于那些方面的变异?答:该变异除随机原因的影响外,有可能存在处理因素的作用。对多组均数作方差分析的主要步骤和结果有那些?答:(1)建立检验假设和检验水准(2)计算统计量F值(列出方差分析表)(3)确定P值和作出推断结论(4)作两两均数之间的比较(若PD005则可省略此步骤
11、)30方差分析的基本思想是什么?答:方差分析的基本思想:就是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。31为什么不能以构成比代率?答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。32简述相对数标准化的基本思想。答:基本思想:采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的标准化死亡率具有可比性。33解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?答:率的直接标化法:已知各组的年龄别死亡率pi。
12、间接标化法已知各组的死亡总数和各年龄组人口数.34率的直接标化法,与间接标化法有何不同?答:(1)适用条件不同(见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成”。后者选定一套“标准年龄别死亡率”。35应用相对数时应注意哪些问题?答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假设检验。36常用相对数指标有哪些?它们的意义上有何不同?答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部
13、各组成部分在全体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。37统计学上资料是否“具有可比性”指的是什么?你能举出一些不可比的例子吗?答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。二项分布、Poisson分布各有哪些特征?答:二项分布和Poisson分布都是离散型分布。二项分布的形状取决于兀与n的大小:兀=0.5时,不论n大小,分布对称。兀H0.5时,图形呈偏态,随n的增大,逐渐对称。
14、当n足够大,兀或1-兀不太小,二项分布B(n,兀)近似于正态分布N(n兀,n兀(1-兀)0Poisson分布:九值愈小分布愈偏,九愈大分布趋于对称,当九足够大时,分布接近正态分布N(九,九)o简述二项分布、Poisson分布、正态分布的关系0答:当n足够大,兀或1-兀不太小时,二项分布近似于正态分布。当n足够大,兀或1-兀很小时,二项分布近似于Poisson分布。九较大时,Poisson分布近似于正态分布。二项分布的应用条件是什么?答:(1)每次试验有且仅有两个互相排斥的结果(A或非A)o每次试验中,发生A的概率相同,均为no各次试验独立,即n次观察结果相互独立。X2检验的用途有哪些?答:主要
15、适用于计数资料,(1)两个及两个以上的率或构成比的比较(2)交叉分类资料两属性间的关联性检验(3)频数分布的拟合优度。以下表资料说明X2检验的基本思想。(不用计算)答:基本思想:假设观察值来自理论分布,则观察值与理论值就不会差别太大,如果差距太大,则怀疑H0是否成立。完全符合则为0或特别小,x2值越小,越支持H0。四格表资料X2检验的条件有哪些?答:T1或n40确切概率法nM40但有1口T5不必校正某病的发病率对全国人口来说是8.72%,现在某县回顾一年,抽样调查了120人,有16人发病,如果要考察该县的发病率是否高于全国,请问可不可以对该份资料作X2检验,你认为应该用什么方法?答:不能,用单
16、样本率比较的u检验。请指出非参数检验与参数检验相比的优、缺点。答:非参数检验适用范围广,收集资料、统计分析也比较方便。但检验效率没有参数检验高,犯第二类错误的概率较大。简述参数检验与非参数检验的定义及两者的区别。答:参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。特点:依赖于特定的分布类型,比较的是参数。非参数统计是不依赖于总体分布具体形式的统计方法。特点:不受总体参数的影响,比较的是分布或分布位置,而不是参数。简述配对比较秩和检验的编秩方法。答:求差值,差值编秩;差值0删去,相同值取平均秩配对设计差值的符号秩和检验步骤。答:(1)H0:差值的总体中位数Md=0
17、;H1:MdH0;=0.05(2)求差值(3)编秩:依差值的绝对值从小到大秩次。绝对值相等者,若符号不同取平均秩次;零差值不参与编秩,同时样本数-1;将差值的正负标在秩次之前。(4)求秩和确定检验统计量:分别求正、负秩次之和,任取T+或T作检验统计量T,(5)确定P值,作推断结论。两组比较的秩和检验的编秩方法。答:将两样本混合编秩次。若有“相同数据”,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。对同一资料,又出自同一研究目的,用参数检验和非参检验结果不一致时,宜以何为准?答:当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的条件时,必须采用非参数检验方法。
18、非参数检验的适用范围。答:各种资料的初步分析;等级资料:某种标志不便准确测定,只能以严重程度、优劣等级、成效大小、名次先后或综合判断等方式定出次序;资料分布类型不能确定或偏态分布;综合分析同质性较差的资料,如不同地点、不同年份的某种实验结果;组内个别数据偏离过大,或各组内相差悬殊。两个变量之间的相关系数等于0,是否说明这两个变量之间没有关系?答:0相关不等于无关,因为可能无直线关系但有曲线关系直线回归及其回归方程有何用途?答:(一)描述Y对X的依存关系。(二)预测(forecast):由自变量X估算应变量Y。Y波动范围可按求个体Y值容许区间方法计算。(三)统计控制:控制Y估算X,逆估计。通过控
19、制自变量X的取值,满足应变量Y在一定范围内波动。54简述作直线相关与回归分析时应注意的事项。答:(1)回归方程要有实际意义。(2).分析前绘制散点图,考察是否有直线趋势或异常点。(3).直线回归的适用范围一般以自变量的取值范围为限。没有充分理由X的取值不要外延。55简述直线回归与直线相关的区别与联系。答:(一)、区别(1)资料要求不同:回归可以有两种情况:Y正态随机,X为选定变量-1型回归;X、Y服从双变量正态分布-II型回归。相关:X、Y服从双变量正态分布。(2)应用不同:回归是由一个变量值推算另一个变量的数值,说明依存变化的数量关系。相关是只说明两个变量间是否有关联。(3)意义不同:b表示
20、X每增(减)一个单位,,平均改变b个单位;r说明具有直线关系的两个变量间关系的密切程度和方向。(4)取值范围不同:一80表示正相关;rui-(a/2)的区域称作拒绝域,a般取有时或。11、正常值范围的意义是指绝大多数正常人的变量均在此范围中,这个绝大多数习惯上包括正常人的、而最常用的是。12、对于正态分布的资料,在p1.96b,p2.58b区间内的变量值,其出现的概率分别为和。13、频数分布的两个重要特征是指和,可全面地分析所研究的事物。14、偏态分布资料宜计算以表示其平均水平。15、平均数的计算和应用必须具备、,否则平均数是没有意义。正态分布有以下的特征正态曲线在横轴上方,且所处在最高。正态
21、分布以TOC o 1-5 h z为中心左右对称。正态分布有两个参数即和。正态分布的面积有一定的。描述一组正态分布资料的变异度,以指标为好。变异系数CV常用于比或的两组或多组资料的变异程度三、是非题:1平均数是一类用于推断数值变量及资料平均水平(或集中趋势)的指标。()2反映频数分布的两个重要特征是集中趋势与散离趋势。()3标准差是最常用的变异指标,它既可以用于正态资料亦可用于非正态资料。()4计算中位数时要求组距相等。()5计量单位相同,均数相差不大时,可使用变异系数反应两组变量值的离散程度。()6变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。()7百分位数应用中提到,分布中部
22、的百分位数相当稳定具有较好的代表性,但靠近两端的百分位数只在样本例数足够多时才比较稳定。()8.为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征以及分布类型。()9如果少数几个数据比大部分数据大几百倍一般就不宜计算均数()10原始数据有零,就不能直接计算几何均数()11正态分布是以均数为中心的钟型分布()12高峰位于中央,两侧逐渐下降并完全对称的频数分布即为正态分布()理论上,对于正态分布资料的P-P和X1.96S范围内都包含有95%的变量值。595()制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排影响被研TOC o 1-5 h z究指标的各
23、种疾病的人()描述频数分布离散程度的最常用的指标是变异系数和标准差()正态分布用N(0,1)表示,为了应用方便,常对变量X作u=(x-A)/b变换,使p=0b=1则将正态分布转换为标准正态分布用N(p,b2)表示()只要单位相同,用标准差和用变异系数来比较两组变量值的离散度结论是完全一致的()四分位数间距Q=P75P25,常用于描述近似正态分布资料的离散程度()7525频数表和频数分布图用以推断变量值的分布特征和揭示变量值的分布规律()制定正常值范围,如取95%界限,是指95%的正常人本项指标在此范围()21指标无论过高或过低均属异常,可用X土us来计算正常值范围()四、单选题:以年龄(岁)为
24、例,最常用的组段表示法是A.05,510,1015,1520B.0,5,10,1504,59,1014,1519D.5,10,15,20E.以上都不是;以下指标中可用来描述计量资料离散程度。A.算术平均数B几何均数C.中位数D.标准差E.第50百分位数偏态分布资料宜用_描述其分布的集中趋势。A.算术平均数B.标准差C.中位数D.四分位数间距E.方差用均数和标准差可全面描述_资料的分布特征。A.正态分布B.正偏态分布C.负偏态分布D.对称分布E.任何计量资料分布可用于比较身高与体重的变异度A.方差B.标准差C.变异系数D.全距E.四分位数间距各观察值均加(或减)同一个数后,。A.均数不变,标准差
25、不一定变B.均数不变,标准差变均数不变,标准差也不变D.均数变,标准差不变E.均数变,标准差也变各观察值同乘以一个不等于0的常数后,A.均数B.标准差中位数E.变异系数的资料,均数等于中位数。A.对称B.正偏态负偏态D.对数正态最小组段无下限或最大组段无上限的频数分布表资料,可用_A.均数B.标准差C.中位数四分位数间距E.几何均数描述一组偏态分布资料的变异度,以A.全距(R)B.标准差(s)C.变异系数(CV)D.四分位数间距(Qu-QL)计算某抗体滴度的平均水平,一般选择A.算术均数B.几何均数C.中位数D.标准差计算某病的平均潜伏期,一般选择A.算术均数B.几何均数C.中位数D.标准差E
26、.变异系数表示正态分布资料个体变量值的变异程度的常用指标是A.均数B.全距C.标准差D.标准误平均数是表示A.性质相同的变量值的相对水平C.性质相同的变量值的平均水平性质相同的变量值的变异程度用变异系数比较变异程度,适于不变。C.几何均数描述其集中趋势。指标较好.E.标准误E.变异系数B.性质相同的变量值的实际水平D.性质不同的变量值的平均水平A两组观察值单位不同,或两均数相差较大B两组观察值单位相同,标准误相差较大D以上都不是C.中位数B.均数越大,标准差越小D.标准差越小,均数代表性越差1,21,7,12,1,4,13天。其平均潜伏期为天。D.12E.9.5C两均数相差较大,标准误相差较大
27、正偏态资料计算平均水平,首选算术均数B.几何均数加权均数E.百分位数均数与标准差的关系是A.均数越大,标准差越大标准差越大,均数代表性越好标准差越小,均数代表性越好有8名某传染病患者,潜伏期分别为:2A.4B.5.5C.7五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种指标比较两组数据变异大小为宜A.SB.SXC.全距D.CVE.自由度调査50例链球菌咽峡炎患者潜伏期如下,为计算均数平均数,应首选潜伏期1224364860728496108120合计病例数1711117542250A.算术均数B.几何均数C.中位数百分位数E.以上均可以102
28、名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用抗体滴度1:1001:2001:4001:8001:1600合计人数719342913102A.算术均数B.几何均数C.中位数百分位数E.以上均可以对于均数p、标准差为。的正态分布,95%的变量值分布范围为A.p-ap+aB.p-1.96ap+1.96a0p+1.96aD.-8p+1.96ap-2.58ap+2.58a若u服从均数为0,标准差为1的正态分布,则A.UM2.58的P=0.01B.uM2.58的P=0.005-2.58VuV2.58的P=0.01D.uM2.58的P=0.05uM2.58的P=0.025正态分布有两个参数
29、p与a,曲线的形状越扁平。A.p越大B.p越小C.a越大a越小E.p与a越接近0对数正态分布是一种分布A.正态B.近似正态C.左偏态右偏态E.对称正态分布曲线下,横轴上,从均数p到+8的面积占总面积的比例为A.97.5%B.95%C.50%5%E.不能确定(与标准差的大小有关)标准正态分布的均数与标准差分别为A.0与1B.1与0C.0与0D.1与1E.1.96与2.58若X服从以p,a2为均数和方差的正态分布,则X的第95百分位数即A.p-1.64qB.p-1.96aC.p+aD.p+1.64aE.p+1.96a若正常成人的血铅含量X服从近似对数正态分布,则可用公式制定95%正常值范围。(其中
30、:Y=logX)A.VX+1.96SB.VX+1.64SC.VY+1.64S_YVlog-1(Y+1.64S)E.Vlog-1(Y+1.96S)正态分布曲线下,横轴上,从均数p到p+1.96倍标准差的面积为A.95%B.45%C.97.5%D.47.5%标准正态分布曲线下中间90%的面积所对应的横轴尺度u的范围是A.-1.645到+1.645B.-8到+1.645C.8到+1.282D.-1.282到+1.282xU设X符合均数为p、标准差为a的正态分布,作u=的变量变换则A.符合正态分布,且均数不变B.符合正态分布,且标准差不变C.u符合正态分布,且均数和标准差都不变D.u不符合正态分布u符
31、合正态分布,但均数和标准差都改变正态分布是以A.标准差为中心的频数分布B.t值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布观察例数为中心的频数分布用变异系数比较变异程度,适于A两组观察值单位不同,或两均数相差较大B两组观察值单位相同,标准误相差较大C两均数相差较大,标准误相差较大D以上都不是决定个体值正态分布的参数是A.变异系数B.全距C.标准误D.标准差E.以上都不是正态分布是以A.标准差为中心的频数分布B.t值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布观察例数为中心的频数分布37正偏态资料计算平均水平,首选A.算术均数B.几何均数C.中位数D.加权
32、均数E.百分位数38均数与标准差的关系是A.均数越大,标准差越大B.均数越大,标准差越小C.标准差越大,均数代表性越好D.标准差越小,均数代表性越差E.标准差越小,均数代表性越好39计量资料的标准差A.不会比均数大B.不会比均数小C.要比标准误小D.不决定于均数E.以上都不对40有9名某传染病人,潜伏期分别为(天):2,1,21,7,12,1,4,13,24其平均潜伏期为A4B5.5C7D12E9.5表示变异程度的指标中标准差越大,变异程度越小标准差越小,变异程度越大变异系数越大,变异程度越大变异系数越大,变异程度越小全距越大,变异程度越小.正态资料的变异系数应A.定1B一定V1C.可能1,也
33、可能V1D.定V标准差E.定标准差43.五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种方式说明两组数据变异大小A.SB.SXC.全距D.CVE.自由度44.调查50例链球菌咽峡炎患者潜伏期如下潜伏期1224364860728496108120合计50病例平均潜伏期,应首选一A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以45.102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用抗体滴度1:1001:2001:4001:8001:1600合计人数719342913102A.算术均数B.几何
34、均数C.中位数D.百分位数E.以上均可以五、问答题:均数、几何均数和中位数的适用范围有何异同?2中位数与百分位数在意义上、计算和应用上有何区别与联系?同一资料的标准差是否一定小于均数?测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?正态分布、标准正态分布与对数正态分布在概念上和应用上有何异同?医学中参考值范围的含义是什么?确定的原则和方法是什么?对称分布资料在“均数1.96倍标准差”的范围内,也包括95%的观察值吗?六、计算题某地101例3049岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.69
35、4.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.704.073.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.70
36、4.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05编制频数分布表并绘制直方图,简述其分布特征。计算均数X、标准s、变异系数CV。计算中位数M,并与均数X比较,计算P25及P975并与X1.96s的范围比较。2.597.5分别考察X土IS、X土1.9S6、X土2.58S范围内的实际频数与理论分布是否基本一致?现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地3049岁健康男子中,还有百分之几的人血清总胆固醇值比他高?某地卫生防疫站,对30
37、名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表。表2-1:平均滴度计算表抗体滴度人数f1:821:1661:3251:64101:12841:25621:5121合计30(1)试计算其平均滴度。(2)有人发现本例用抗体滴度稀释倍数和直接用滴度倒数算得几何标准差的对数值相同,为什么?3.50例链球菌咽峡炎患者的潜伏期如表,说明用均数、中位数或几何均数,何者的代表性较好?并作计算。表2-2:50例链球菌咽峡炎患者的潜伏期潜伏期(小时)病例数f122436486072849610812017111175422合计504.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境
38、监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量如表:表2-3:238人发汞含量频数计算表发汞值(“mol/kg)人数f1.5203.5665.5607.5489.51811.51613.5615.5117.5019.521.53合计238说明此频数分布的特征,.计算均数和中位数,何者较大?为什么?何者用于说明本资料的集中位置较合适?.选用何种指标描述其离散程度较好?.估计该地居民发汞值的95%参考值范围答案名词解释:平均数是描述数据分布集中趋势(中心位置)和平均水平的指标标准差是描述数据分布离散程度(或变量变化的变异程度)的指标标准正态分布以p服
39、从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题:计量,计数,等级设计,收集资料,分析资料,整理资料。yUu=(变量变换)标准正态分布、0、1土b土1.96ct土2.58q68.27%95%99%47.5%均数、标准差全距、方差、标准差、变异系数卩土1.96bg土2.58b全距R检验水准、显著性水准、0.05、0.01(0.1)80%90%95%99%95%95%99%集中趋势、离散趋势中位数同质基础,合理分组均数,均数,p,a,规律性标准差单位不同,均数相差较大是非题:1.X2.V
40、3.X4.X5.X6.V7.V8.V9.V10.V11.V12.V13.X14.V15.V16.X17.X18.X19.V20.V21.V单选题:1.B2.D3.C4.A5.C6.D7.E8.A9.C10.D11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B41.C42.B43.D44.C45.B问答题:1.均数、几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。不同点:表2-5
41、.意义应用场合表2-5均数,几何均数和中位数的相异点平均数均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数等比资料;对数正态分布资料中位数位次居中的观偏态资料;分布不明资料;分布一端或两察值水平端出现不确定值中位数与百分位数在意义上、计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布50特征。计算:中位数和百分位数均可用同一公式计算,即Px=
42、L+(i/f)(nx%-Zf)xL可根据研究目的选择不同的百分位数代入公式进行计算分析。应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。同一资料的标准差是否一定小于均数?答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?样本含量的大小,样本含量越大,标准差越稳定。分组的多少分布形状的影响,偏态分布
43、的标准差较近似正态分布大随机测量误差大小的影响研究总体中观察值之间变异程度大小正态分布、标准正态分布与对数正态分布在概念上和应用上有何异同?概念上:相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。相异点:表示方法不同,正态分布用N(內a2)表示,标准正态分布用N(0,1)表示,对数正态分布N(p,a2)表示。lgXlgX应用上:相同点:正态分布、对数正态分布都可以转换为标准正态分布。相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给
44、应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。医学中参考值范围的含义是什么?确定的原则和方法是什么?含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。(2)原则:抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。对选定的正常人进行
45、准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。判定是否要分组(如男女、年龄、地区等)确定正常值范围。决定取双侧范围值还是单侧范围值。选择适当的百分范围确定可疑范围估计界值3)方法:百分位数法:P=L+(i/f)(nx%-Sf)xxL正态分布法(对数正态分布):双侧X土us、lg-1x土uS)曰lgXalgX百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。7对称分布资料在“均数1.96倍标准差”的范围内,也包括95%的观察值吗?答:不一定。均数1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。计算题:1.某地101
46、例3049岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.7040743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.17
47、5.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.051)编制频数分布表,简述其分布特征。找出最大值、最小值求全距(R):全距=最大值-最小值=7.22-2.70=4.50(mmol/L)求组距:1=全距/组数=4.52/10=0.4520.5(mmol/L)分组段,划记(表1-1)表2-6某地101例3049岁健康男子血清总胆固醇值划记表划记频数189组段(mmol/L)2.5
48、3.03.54.0234.5255.0175.596.066.527.07.51合计101由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。表2-7某地101例3049岁健康男子血清总胆固醇值(mmol/L)X、s计算表血清总胆固醇值组中值X频数ffXfX2累计频数累计频数(实际)2.52.7512.757.56310.00993.03.25826.0084.50090.08913.53.75933.75126.563180.17824.04.252397.75415.438410.40594.54.7525118.75564.063660.65355.05.251789.25
49、468.563830.82185.55.75951.75297.563920.91096.06.25637.50234.375980.97036.56.75213.5091.1251000.99017.07.57.2517.2552.5631011.0000478.252242.315注:Xu为组段上限值(2)计算均数X、标准s、变异系数CV。由上计算表1-2可见:X二冯X/冯=478.25/101=4.735(mmol/L)匹fX2-(EfX)2/SfJSf-12O(Q_Q)O2O(Q_Q)Oo(n_n)o2342.313(478.25)2/101=0.882(mmol/L)M其原因因为本例
50、呈正态分布,均数计算结果受到少数较大发汞值的影响,使得X偏向大发汞值一边.本例用中位数描述偏态资料的集中趋势较好,它不受两端较大值和极小值的影响.选用何种指标描述其离散程度较好?选用四分位数间距描述其离散程度较好.估计该地居民发汞值的95%参考值范围本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大,n=23&保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范围较为合适.P95=L+(i/f95)(n*95%-fL)=11.5+(2/16)(238*95%-212)=13.2625(pmol/kg)第三章均数的抽样误差与t检验一、名词解释:1.标准误2.总体均数可信区间3
51、.假设检验4.检验水准5.检验统计量6.P值7.第I类错误8.第II类错误二、填空题:TOC o 1-5 h z用样本均数估计总体均数的可靠程度宜选用。一般将概率小于和的随机事件称为小概率事件。对总体所作的假设进行统计推断,作出拒绝或接受假设的结论的方法,称。样本均数比较,经t检验差别有显著性时,P越小,说明。t分布的图型形状与有关。可信区间的两个要素是,。准误愈小,表示愈小,对估计愈可靠。统计推断包括和两方面。设检验中,不拒绝Ho时,可发错误,其概率用表示。三、是非题:1区间估计以预先给定的概率(可信度)估计总体参数在哪个范围内的方法,称区间估计。)样本标准误S矿S/n反映了抽样误差大小,显
52、然n越大抽样误差越大,用样本推断总体的精度越高。()抽样误差的大小可以用标准差来表示。()4参数估计有点(值)估计一一用样本统计量值估计相应的总体参数。区间估计一一估计总体参数在哪个范围,它不涉及抽样误差,所以比点(值)估计更为重要。567891011()_从正态总体N(p,a)中,随机抽取例数为n的样本,则样本均数X也服从N(p。)的正态分布。()抽样研究时,可通过增加样本含量来减少抽样误差。成组比较的t检验要求两组样本例数一定相等。可信区间比假设检验还可以提供更多信息,不但能回答差别有无统计意义实际意义。()t检验结果t1.96,可以认为两样本均数不同。样本含量相同时,配对设计与成组设计相
53、比,前者统计效率较高)还能提出差别有无121314在配对t检验中,用药前数据减去用药后数据,与用药后数据减去用药前数据作t检验后的结论是相同的(t分布曲线的形状与标准差有关(拒绝了实际上是成立的Ho,这类“弃真”的错误称为第一类错误或I型错误()抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征变量变换是各组观察值经变量转换后达到方差齐性15.16样本均数的99%可信区间可用X+2.58S厶表示17.1819202122四1.2.3.t计算总体均数可信区间的通式为(X-空.v.S一,-tX缩写为X士vSX当PWa时,结论为按所取a检验水准拒绝Ho,接受H如Pa时
54、,1;本信息支持Ho,就无理由拒绝它,此时只好接受它当ttt时,则0.01P0.050.01v0.05v两个均数比较只能用t检验或u检验t检验可用于同一批对象的身高和体重均数差别的假设检验P为第二类错误的概率(1-B)越小,所需的样本例数越多单选题:从一个计量资料的总体中抽样,产生的抽样误差的原因是A.总体中的个体值存在差异B.总体均数不等于零C.样本中的个体值存在差异D.样本均数不等于零E.样本只包含总体的一部分个体aX是指:()A.所有个体值对总体均数的离散程度B.某一个样本均数对总体均数的离散程度C.所有样本均数对总体均数的离散程度D.一些样本均数对总体均数的离散程度E.所有某个含量相同
55、的样本均数对总体均数的离散程度在同一正态总体中随机抽样,有99%的样本均数在下述范围内:()A.X土2.58sxB.卩土2.58sXC.x土2.5%X即样()D.卩土2.58a_E.以上都不是X4.在同一总体中随机抽取多个样本,用样本来估计总体均数的95%可信区间,则估计精密的是()o(n_n)oo(n_n)oo(n_n)o均数大的样本B.均数小的样本C.标准差小的样本D.标准误大的样本E.标准误小的样本5-X土2)叭=X-t0.05(V)SxX+t0.05(V)Sx表示:()总体的95%个体值在该区间内样本的95%个体值在该区间内平均每100个总体均数,有95个总体均数在该区间内平均每100
56、个样本(含量相同)均数,有95个样本均数在该区间内平均每100个样本(含量相同)有95个样本所得出的该区间包括总体均数TOC o 1-5 h z总体均数的99%可信区间为:()A.X土1.96sB.x土1.96s_C.X土t(v)sx0.05X土t(v)s_E.以上都不是0.05x是:择假在由两样本均数的差别推断两总体均数的差别的t检验中,检验假设的无效假设()两样本均数差别无统计意义B.两总体均数差别无统计意义两样本均数相等D.两总体均数相等两总体均数不等由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指:()A.两样本均数差别有显著性B.两总体均数差别有显著性两样本均数和两总体均
57、数的差别都有显著性其中一个样本均数和总体均数的差别有显著性E.以上都不是在样本均数和总体均数差别的显著性检验中,H0(无效假设):p=p0;H1(备设):pHp0;结果因为PV0.05而拒绝H0接受斗,是由于:()A.无效假设成立的可能性小于5%B.备择假设成立的可能性大于5%无效假设成立的可能性小于5%和备择假设成立的可能性大于95%该样本来自该总体(p=p)的可能性小于5%该样本来自另一个总体(pHp)的可能性大于95%与标准正态分布(u分布)比较,t分布的:()A.中心位置左移B.中心位置右移C.分布曲线峻峭一些分布曲线平坦一些E.以上都不是与标准正态分布(u分布)比较,t分布的:()A
58、.均数要小些B.均数要大些C.标准差要小些D.标准差要大些E.以上都不是若总例数相同,则两组计量资料的t检验与配对计量资料的t检验相比较,一般为:A.两组计量资料的t检验的效率要高些B.配对计量资料的t检验的效率要高些C.两者效率相等D.两者效率相差不大E.两者效率不可比在两个均数比较的t检验中,计算合并方差的公式为:()S2S2A.S2二S2+S2B.S2二4+c12Cnn12cnS2+nS2C.S2二1122Cn+n12cnS2+nS2D.S2二1122Cn+n212E.S2C(n1)S2+(n1)S2n+n212推断样本率为16.8%与14.5%所代表的总体有无差别,选用的方法是:()A
59、.样本均数与总体均数比较的t检验B.配对t检验成组t检验D.以上都不是在比较两个小样本的均数时,需改用校正t检验的情况是:()A.两总体均数相等B.两总体均数不等C.两总体方差相等两总体方差不等E.两样本方差不等在两组资料比较的t检验中,结果为PV0.05,差别有显著性。P愈小则:()A.说明两样本均数差别愈大B.说明两总体均数差别愈大C.说明两样本均数有差别的可能性愈大D.愈有理由认为两样本均数不同愈有理由认为两总体均数不同TOC o 1-5 h zt检验中,不同类型资料的t检验的区别是:()检验步骤不同B.统计量t的计算公式不同确定P值时査的表不同D.根据P值判断结果的方法不同以上都不对两
60、组同质资料中,小的那个样本均数更有代表性()A.SB.CVC.SD.XX小,表示用该样本均数估计总体均数的可靠性大。A.CVB.SC.SXD.R统计推断的内容。A.是用样本指标估计相应的总体指标B.是检验统计上的“假设”A、B均不是D.A、B均是两样本均数比较,经t检验,差别有显著性时,P越小,说明。两样本均数差别越大两总体均数差别越大越有理由认为两总体均数不同越有理由认为两样本均数不同五、问答题:标准差和标准误有何区别和联系?可信区间和参考值范围有何不同?假设检验和区间估计有何联系?假设检验时,一般当P3,査t界值故PV0.01,说明接种后血清抗体有增长。试问:(1)本例属于何种类型设计?(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新乡医学院《传感器实验》2023-2024学年第二学期期末试卷
- 2025至2031年中国空调通风道行业投资前景及策略咨询研究报告
- 兴安职业技术学院《数字合成》2023-2024学年第二学期期末试卷
- 2024届山东省临沂兰陵县联考中考数学模拟试题含解析
- 甘肃省定西市渭源县重点中学2024年中考数学押题试卷含解析
- 广东普宁市下架山中学2023-2024学年初中数学毕业考试模拟冲刺卷含解析
- 2024-2025新进厂员工安全培训考试试题(达标题)
- 2024-2025新进厂员工安全培训考试试题附完整答案(网校专用)
- 2025年员工安全培训考试试题预热题
- 2025年班组安全培训考试试题答案必考
- 2024年《金融市场基础知识》冲刺复习讲义
- GB/T 4706.10-2024家用和类似用途电器的安全第10部分:按摩器具的特殊要求
- DL∕T 860.10-2018 电力自动化通信网络和系统 第10部分:一致性测试
- 2024多级AO工艺污水处理技术规程
- 电影鉴赏评论智慧树知到期末考试答案章节答案2024年山东艺术学院
- (新版)碳排放管理员(高级)职业鉴定考试题库(含答案)
- JGJ144-2019外墙外保温工程技术标准
- JB-T 8236-2023 滚动轴承 双列和四列圆锥滚子轴承游隙及调整方法
- 春天就是我童声合唱谱
- MOOC 计算机网络-河南理工大学 中国大学慕课答案
- 项目2自动售货机的PLC控制
评论
0/150
提交评论