数值变量资料统计描述_第1页
数值变量资料统计描述_第2页
数值变量资料统计描述_第3页
数值变量资料统计描述_第4页
数值变量资料统计描述_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE14数值变量资料统计描述选择题:1、以下指标中可用来描述计量资料离散程度。A.算术均数B.几何均数C.中位数D.极差E.第50百分位数2、偏态分布资料宜用描述其分布的集中趋势。A.算术均数B.标准差C.中位数D.四分位数间距E.方差3、用均数和标准差可全面描述资料的分布特征。A.正态分布B.左偏态分布C.右偏态分布D.对称分布E.任何计量资料分布4、可用于比较身高与体重的变异度。A.方差B.标准差C.变异系数D.全距E.四分位数间距5、正态曲线下、横轴上,从均数u到+∞的面积为。A.97.5%B.95%C.50%D.5%E.不能确定6、标准正态分布的均数与标准差分别为。A.0与1B.1与0C.0与0D.1与1E.1.96与2.587、若X服从以u,σ2为均数和方差的正态分布,则X的第95百分位数即。A.u-1.64σB.u-1.96σC.u+σD.u+1.64σE.u+1.96σ8、各观察值均加(或减)同一个数后(A≠0)A.均数不变,标准差不一定变B.均数不变,标准差变C.均数不变,标准差也不变D.均数变,标准差不变E.均数变,标准差也变9、各观察值同乘以一个不等于0的常数后,不变。A.均数B.标准差C.几何均数D.中位数E.变异系数10、分布的资料,均数等于中位数。A.对称B.左偏态C.右偏态D.偏态E.对数正态11、正态分布有两个参数u与σ,曲线的形状越扁平。A.u越大B.u越小C.σ越大D.σ越小E.u与σ越接近012、最小组段无下限或最大组段无上限的频数分布表资料,可用描述其集中趋势。A.均数B.标准差C.中位数D.四分位数间距E.几何均数13、标准正态分布曲线下中间90%的面积所对应的横轴尺度u的范围是:A.(-1.645,+1.645)B.(-∞,+1.645)C.(-∞,+1.282)D.(-1.282,+1.282)E.不能确定14、是表示变量值的指标A.平均水平B.变化范围C.频数分布D.离散趋势E.相互间差别大小15、利用频数分布表及公式M=L+i/f(n/2-∑fL)计算中位数时A.要求组距相等B.不要求组距相等C.要求数据分布对称D.要求数据呈对数正态分布16、与s中A.可能是负数,s也可能B.可能是负数,s不可能C.两者都不可能D.两者都可能17、变异系数的数值A.一定大于1B.一定小于1C.可大于1,也可小于1D.一定比s小18、若一组数据呈正态分布,其中小于-1.645S的变量值有______;如果大于+S的变量值呢?A.5%B.95%C.97.5%D.92.5%E.不能确定19、正态分布曲线下(u±1.96σ)区间的面积占总面积的。A.95%B.90%C.97.5%D.99%E.不能确定20、对于正态分布的资料,可用估计95%的正常值范围A.±1.96sB.±2.58sC.±t0.05(v)sED.x±1.96s数值变量资料统计推断选择题:1、小,表示用该样本均数估计总体均数的可靠性大。A.CVB.SC.σXD.RE.四分位数间距2、统计推断的内容A.是用样本指标估计相应总体指标B.是检验统计上的“假设”C.A.B均不是D.A.B均是E.估计参考值范围3、在正态总体(参数未知),中随机抽样,∣-μ∣≥的概率为5%。A.1.96δB.2.58δC.SD.E.2.584、两样本均数比较时,分别取以下检验水准,以所对应的第二类错误最小。A.0.01B.0.05C.0.10D.0.20E.不能确定5、关于以0为中心的t分布,错误的是:A.t分布是一簇曲线B.t分布是单峰分布C.t分布以0为中心,左右对称D.相同v时,|t|越大,P越大E.相同v时,|t|越大,P越小6、在两样本均数比较的t检验中,无效假设是:A.样本均数不等B.两样本均数相等C.两总体均数不等D.两总体均数相等E.以上都不对7、某地2002年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的正常值范围是:A.74±1.96×4B.74±2.58×4C.74±1.96×4÷10D.74±2.58×4÷10E.以上都不对8、在同一正态总体中以固定n随机抽样时,理论上有99%的总体均数在范围内:A.µ±1.96σEB.µ±2.58σEC.±1.96sED.±2.58SEE.±t0.01(v)SE9、σE表示A.总体均数的标准误B.样本均数的标准误C.变量值X的可靠程度D.总体均数的离散程度10、进行两样本均数差别的u检验时,要求A.两样本含量足够大B.两样本必须来自正态分布总体C.两样本均数相近D.两样本均数相等计算题:1、某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下:表某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值红细胞数(1012/L)男女3602554.664.180.580.294.844.33血红蛋白(g/L)男女360255134.5117.67.1010.20140.2124.7表中标准值为《实用内科学》(1976年)所载均数(转为法定单位)请就上表资料:(1)说明女性的红细胞数与血红蛋白的变异程度何者为大?(2)分别计算男、女血红蛋白的抽样误差。(3)试估计该地健康成年男、女红细胞数的均数。(4)该地健康成年男、女血红蛋白含量有无差别?(5)该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)?分类变量资料统计描述选择题:1、计算麻疹疫苗接种后血清检查的阳转率,分子为;分母为。A.麻疹易感儿数B.麻疹患儿人数C.麻疹疫苗接种人数D.麻疹疫苗接种后的阳转人数E.某地区所有患过麻疹的儿童人数2、从甲、乙两文中,查到同类研究的两个率比较的四格表资料,其检验甲文>0.01(1),乙文>0.05(1),可认为:A.两文结果有矛盾B.甲文结果不可信C.乙文结果不可信D.甲文说明总体的差别更大E.两文结果基本一致3、四个样本率作比较,X2>X20.05(3),可认为。A.各总体率不等或不全相等B.各总体率均不相等C.各样本率均不相等D.各样本率不等或不全相等E.两个总体率相等4、四格表的自由度A.不一定等于1B.一定等于1C.等于行数*列数D.样本含量减1E.以上都不对5、X2值的取值范围为A.-∞<X2<十∞B.X2≤1C.0≤X2≤十∞D.X2≥1E.-∞<X2<0四格表中四个格子基本数字是A.两个样本率的分子和分母B.两个构成比的分子和分母C.两对实测阳性绝对数和阴性绝对数D.两队实测数和理论数7、四个率作比较,有1个理论数小于5,大于1,其它都大于5A.只能作校正χ2检验B.不能作校正χ2检验C.作χ2检验不必校正D.必须先作合理的合并E.要增大样本含量8、某医师用A药治疗9例病人,治愈7人;用B药治疗10例病人,治愈1人,比较两药疗效时,可选用的最适当方法是:A.χ2检验B.u检验C.校正χ2检验D.直接计算概率法E.以上都不对9、四格表如有一个实际数为0,则______。A.就不能作χ2检验B.就必须用校正χ2检验C.还不能决定是否可作χ2检验D.肯定可作校正χ2检验E.以上都不对简答题:下表为一抽样研究资料,试填补空白处。年龄人口数死亡总数其中恶性肿瘤死亡数恶性肿瘤死亡占总死亡的%恶性肿瘤死亡率1/10万0~8292042.9020~6319.0525.7340~281611724260及以上32合计1670907159012.592、某地区1953年、1963年、1973年居民主要死因统计如下表:据此认为“随着时代的发展,循环系统疾病、神经系统疾病、早产的死亡率增加”。请对此结论加以评述。表某地区三个不同年度的主要死因构成(%)死因1953年1963年1973年呼吸系统疾病31.221.017.4循环系统疾病4.66.415.3消化系统疾病14.616.014.6神经系统疾病5.26.411.2早产6.512.213.34、下表为某地某年的肿瘤普查资料,试回答:①各年龄组相比,哪一个年龄组的患者最多?②哪一个年龄组的人患肿瘤的比例最高?表某地某年的肿瘤普查资料年龄人口数肿瘤患者数构成比%患病率1/10万0~589452191.33.2230~65493519412.829.6240~43256750333.2116.2850~12379453635.4432.9860~3112926117.3838.455、以下结论是否正确?据此认为“无论哪一个年龄组发病率乙厂比甲厂高”?表某年甲乙两厂石棉工的石棉肺发病比较年龄组(岁)甲厂乙厂接触人数病人数发病率(‰)接触人数病人数发病率(‰)<45400410.08001012.5≥456001830.02001050.0检验1.某人作了一项调查,使用含氟牙膏200人中患龋齿70人,使用一般牙膏100人中患龋齿50人,试问作用含氟牙膏与使用一般牙膏者的患龋齿率有无不同?2.某卫生防疫站在中小学校观察三种矫正治疗近视眼措施的效果,近期疗效数据如表,试问三种方法疗效有无差别?矫正方法观察例数近期有效率(%)夏天眼药水13537.78新医疗法3218.75眼保健操1827.783.用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲乙两种方法一致的检出率为35%,试问两种方法何者为优?4.为比较槟榔剂和驱虫的效果,对45名绦虫患者进行治疗,其结果如下,问两药疗效是否相同?药物治疗人数有效人数槟榔剂2722阿的平1812合计45345.某县卫生防疫站观察3种药物驱钩虫的疗效,在服药后7天得粪检钩虫卵阴转率(%)如下,问3药疗效是否不同?药物例数阴转例数阴转率(%)复方敌百虫片372875.7纯敌百虫片381847.4灭虫片341029.46.用两种不同剂量的电离辐射照射小白鼠,第一种剂量照射25只,在照射后14天内14死亡只,第二种剂量照射18只,同期内死亡5只。问这两种剂量对小白鼠的致死作用是否相同?7.某医师研究重点中学近视发生率,调查了400名中学生,近视人数为98人,试估计重点高中学生近视发生率的可信区间;若大量调查普通高中近视发生率为18%,问重点高中与普通高中近视发生率有无不同?8.某研究者研究文化活动与老年人生活满意率的关系,调查了经常参加文化活动的老年人306人,对生活满意者有219人,不经常参加文化活动者246人,对生活满意者有159人,问经常参加文化活动与否的生活满意率有无不同?试题精选选择题1、已知X服从正态分布N(,),则统计量_______服从标准正态分布。A、B、C、D、2、两组数据作均数差别的假设检验,除要求数据呈近似正态分布外,还需具备______。A、要求两组数据均数相近,方差相近B、要求两组数据方差相近C、要求两组数据均数相近D、均数与方差相差多少都无所谓3、两样本均数比较时,分别取以下检验水准,以______所对应的第二类错误最小。A、0.01B、0.05C、0.10D、0.204、两组资料比较的秩和检验所要求的条件是______。A、数值变量资料B、两总体呈正态分布,且总体方差齐C、两样本例数要很大D、以上都不要求5、单因素分析中的组间均方是表示______A、抽样误差大小的指标B、某处理因素的效应大小的指标C、因素的效应和随机误差两者综合结果的指标D、N个数据的总的离散程度的指标6、对相关系数r作假设检验,r>r0.05,n-2则有______。A、证明两变量不会是曲线关系,一定是直线关系B、可认为两变量有直线关系C、认为两变量不相关D、两变量不相关的可能性小于5%7、等级资料比较宜用______。A、t检验B、检验C、秩和检验D、F检验8、回归系数的假设检验______。A、只能用r的检验代替B、只能用t检验C、只能用F检验D、三者均可9、若以舒张压≥90mmHg为高血压,调查某地1000人中有10名高血压患者,有990名非高血压患者,这是______。A、数值变量资料B、分类变量资料C、还不能决定是何种资料D、可看作数值变量资料也可看作是分类变量资料10、两样本均数比较,经t检验,差别有显著性,P越小说明:A、两样本均数差别越大B、两总体均数差别越大C、越有理由认为两总体均数不同D、越有理由认为两样本均数不同11、单因素方差分析中,必然有______。SS总=SS组间+SS组内B、SS组间>SS组内C、MS组间>MS组内D、MS总=MS组间+MS组内12、根据正态分布的样本标准差,可用______估计95%正常值范围。A、±1.96SB、±2.58SC、±SD、±13、在参数未知的总体中随机抽样,得均数和标准差,则总体均数95%的可信区间为______。A、±1.96B、±1.96C、±D、±S14、某地1998年110名7岁男孩的身高均数为119.95cm,标准差为4.72cm,试估计该地7岁男孩的身高在132.13cm以上者占该地7岁男孩总数的______。A、5%B、1%C、2.5%D、0.5%15、关于符号秩和检验,下列哪项是错误的______。若差值的绝对值相等,正负号相反,则取平均秩次若差值为0,则不参与编秩以差值的大小从小到大编秩D、分别计算正负秩和,任取正秩和或负秩和为检验统计量16、按年龄、性别、职业、民族居住地等特征抽样作调查,属于:A、单纯随机抽样B、分层抽样C、整群抽样D、系统抽样17、和S的关系是:A、S越大,越可靠B、S越大,越不可靠C、S越大,越大D、S越大,越小18、尿汞含量为偏态分布,过高有病理意义,估计其95%的正常值范围:A、≤P95B、≥P5C、+1.96SD、P2.5,P97.519、行×列表资料的2检验,其自由度为:A、行×列B、(行-1)(列-1)C、(行-1)列D、(列-1)列20、二个样本均数比较时,其样本含量分别为56和107,t=2.35(双侧),则:A、P>0.05B、P<0.05C、P<0.01D、不能确定21、下列哪种说法是正确的:A、治疗某病4例,其中治愈2例,治愈率为5%B、假设检验时,P值越小,意味着实际差别越大C、任何两组资料作比较时,其S大的一组即说明离散程度大。D、偏态分布的资料制订正常值,常用百分位数法22、某地对100名儿童作蛔虫感染情况粪检发现蛔虫卵阳性者50名,估计其99%可信区间为:A、30~70%B、35~60%C、37~63%D、40~60%23、已知男性的钩虫感染率高于女性,今欲比较甲、乙两地居民的钩虫感染率,但甲地人口女多于男,而乙地人口男多于女,适当的比较方法是:A、两个率比较的μ检验B、两个率比较的2检验C、比较两地构成比D、对性别标准化后再比较24、关于统计推断中单双侧的确定,错误的是:A、双侧较稳,故常采用B、做初步研究时,一般先取双侧C、根据专业知识确定D、根据研究者主观需要确定25、标准差的应用,以下不正确的是:A、估计观察值的频数分布B、衡量观察值的离散程度C、表示抽样误差大小D、医学正常值范围制订模拟练习题一、名词解释:总体(population)与样本(sample)根据研究目的确定的同质观察单位的全体;样本是从总体中随机抽取的有代表性的观察单位的集合。参数(parameter)与统计量(statistic)参数是描述总体的指标;统计量是反映样本的指标。数值变量资料(numericalvariable)即用定量方法测量每个观察单位的某项指标的数值大小,一般有度量衡单位。抽样误差(samplingerror)在抽样过程中引起的样本指标与总体指标或样本指标之间的差异。小概率事件(probability)统计学上将P≤0.05或P≤0.01的事件,称为小概率事件。统计描述(descriptive)和统计推断(inferential)对资料的数量特征及其分布规律进行测定和描述。①参数估计②假设检验中位数(median)与百分位数中位数是一组按大小顺序排列的观察值中位次居中的数值,用M表示。百分位数是一个位置指标,用Px表示。一个由小到大的有序数列即被分为100等份,各含1%的观察值。四分位数间距(quartileinterval)四分位数间距是上四分位数Qu(即P75)与下四位数QL(即P25)之差,其间包括了全部观察值的一半,用Q表示。标准差(standarddeviation)是常用的描述数值变量资料分布离散程度的指标,其计算公式为:变异系数(coefficientofvariation)若比较度量单位不同或均数相差悬殊的两组(或几组)观察值的变异度时的指标。其计算公式为CV=S/×100%正态分布(normaldistribution)一条高峰位于中央、两侧完全对称地降低、但永远不与横轴相交的钟型曲线,这条曲线近似于数学上的正态分布曲线。标准误(standarderror)反映均数抽样误差大小的指标是样本均数的标准差。可信区间(confidenceinterval)表示总体均数μ有95%(或99%)的可能在某一范围。P值指从H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有统计量的概率。第一类错误(或I型错误,typeIerror)拒绝了实际上成立的H0,这类“弃真”的错误。第二类错误(或Ⅱ型错误,typeⅡerror)不拒绝实际上不成立的H0,这类“取伪”的错误方差分析(ANOVA)是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。率(rate)表示在一定条件下,某种现象实际发生的例数与可能发生这种现象的总数之比,用以说明某种现象发生的频率构成比(proportion)表示事物内部各个组成部分所占的比重相对比(relativeratio)表示有关事物指标之对比,常以百分数和倍数表示率的标准化法:就是在一个指定的标准构成条件下进行率的对比的方法完全随机设计相关系数说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。回归系数(regressioncoefficient)即直线斜率,其统计学意义是每增加(减少)一个单位,Y平均改变个单位。最小二乘法原理(leastsquaremethod)即保证各实测点至直线的纵向距离的平方和最小。Ⅰ型回归Y服从正态分布;X是可以精确测量和控制的变量。等级相关系数P128把握度(检验效能)1-是指当两总体确有差异时,按规定检验水准所能发现该差异的能力。非参数统计决定系数是回归平方和与总的离均差平方和之比二、计算题1.某地随机抽样10000名成人的血压值(近似正态分布)。结果如下:收缩压的均数=100,标准差=11;舒张压的均数=73,标准差=11。问:⑴从中随机抽取一人,其舒张压在73±1.96×11这一范围的可能性为多少?⑵若以舒张压≥95为高血压,试按正态分布原理估计这10000人中高血压的患病率约为多少?⑶试以95%的概率估计当地全体成年人收缩压均数的范围。⑷这群人收缩压与舒张压的变异程度是否相同?为什么?2.为了研究发生椎体外系反应的病人服药时间情况,观察了75例发生过椎体外系反应病人的服药时间,其结果如表:时间(天)例数构成比%<101114.710~2634.720~2938.630~34.0≥9068.0合计75100.0资料来自<<中华护理杂志>>1999试问:⑴该资料是总体,还是样本?⑵该资料属于哪种类型的资料?⑶请描述资料的分布特征。⑷如果要描述该资料的集中趋势,该选用什么统计指标?⑸如果要描述该资料的离散趋势,该选用什么统计指标?⑹若要把该资料用统计图表达,应选用何种统计图较为合适?3.为了研究新生儿油浴对体温的影响,某妇产科医院对100名新生儿出生断脐后在辐射台上用消毒液体石蜡油进行油浴,2小时后测得的平均体温为37.3℃,标准差为0.5℃。根据长期大量的观察,已知采用传统方法,新生儿在出生2小时后测得的平均体温为36.1℃。(资料来自<<中华护理杂志>>2002)试问:⑴该资料的类型?⑵若推断油浴对新生儿是否起到保温作用,该选用什么统计方法?请写出方法名称及H0、H1⑶在什么情况下,可以得到油浴对新生儿是起到保温作用的?⑷若要估计新生儿油浴2小时后测得的平均体温,则其计算的公式该是如何?(可信度为95%,不必具体计算)4.某医院外科用两种手术方法治疗肝癌患者18例,采用随机方法分配到不同手术组,每例手术后生存月数如下表。己知两样本来自正态总体,且两总体方差齐性,现欲求两种手术方法的术后生存月数是否有差别?问:⑴选用何种统计方法为宜,并列出计算公式和步骤,但不必计算。⑵若检验统计量为4.637,请对结果作出判断。甲法乙法2538494115125126138155.某地调查农村中不同人群的HbsAg阳性情况,结果如下表,从中得出农民HbsAg阳性情况最严重,医务人员最低的结论。讨论:这样的评价是否可信?应作如何补充和修改。人群检查人数阳性人数阳性百分比%农民101312845.9医务人员2141.5中学生99155.4小学生3265118.3学龄前儿童4377627.2其他4751.8合计1943279100.06.为研究缺铁性贫血的“最佳”疗法,某医生观察了12名缺铁性贫血的病人,随机分为四组,分别给予4种疗法治疗,一个月后观察RBC增加数。第一组用B12治疗;第二组用B12+叶酸;第三组用B12+铁剂;第四组用B12+叶酸+铁剂请问:⑴这是一个什么设计?为何采用此设计?⑵请完成下面的方差分析表:变异来源SS自由度VMSFP处理间2.963____________叶酸1.69____铁剂0.91____叶酸+铁剂________误差____________总变异3.0411F0.05(1,8)=5.32;F0.01(1,8)=11.3⑶请根据方差分析的结果,作出正确的推论。这一推论可能犯那一类错误,其概率为多少?7.比较A、B两药引起呕吐反应的差别,使每个受试病人以随机次序先后服用A、B两药,试验100个病人,有人拟用下述四格表作统计分析。分组呕吐不呕吐合计服A药1882100服B药1090100合计28172200⑴你认为用上述四格表做统计分析是否恰当?为什么?⑵如你认为上述分析不恰当,请说明用那一种正确的统计方法(列出相应的四格表、公式,不必计算)。⑶若检验统计量为2.83,请对结果作出判断。8.为了解某新药的安全性,观察了100名受试者用药前后的GPT(AST)变化,结果治疗前治疗后均升高者25名,治疗前治疗后均正常者60名,治疗前升高治疗后正常者6名,治疗前正常治疗后升高者9名。⑴试列表表达研究结果。⑵分析患者治疗前与治疗后GPT升高率是否不同?(说明方法与步骤,并计算)。9.下面的回归方程来自对16个诊断为糖尿病患者的研究,他们接受某种治疗已一年。=-34+0.29X是病人开始治疗之后一年里所减轻的何重,X是病人开始治疗时的体重。请在这项研究资料的基础上作出合理的解释。10.拟进行一个临床试验,研究两种药物对高血压的降压效果并加以比较。问:⑴这一试验的三要素是什么?⑵病例拟分为几组,如何分组?⑶用什么统计方法来检验各组病例之间治疗前血压和病情轻重是否均衡可比?11.为了评价肝素钙压缩雾化吸入对小儿支气管炎的疗效,将140例RSV阳性患儿随机分为两组,治疗组80例,对照组60例;两组患儿在年龄、性别、病程及病情严重程度上经统计学处理,无统计学意义,具有可比性。其结果见表1:表1两组治疗后的总疗效组别显效好转无效合计综合疗法+雾化吸入4235380综合疗法2130960资料来源《药物流行病学杂志》试问:1.资料属于哪种类型?2.设计类型是什么?3.在本研究中实验设计的三大要素是什么?请具体写出。4.若要了解加用肝素钙压缩雾化吸入对小儿支气管炎的疗效情况,应选用什么统计方法?请写出方法名称和基本步骤,不需要具体计算。5.在什么情况下,可以得到加用是有效的结论?得到此结论,有可能犯哪一类错误?其概率有多大?12.调查测量某地107名正常人尿铅含量(umol/L)如下:尿铅含量0~0.19~0.39~0.58~0.77~0.97~1.16~1.35~倒数1422291815612试回答下列问题(每小题3分,共15分)1.本研究的资料属于什么资料?2.请描述其分布特征?3.应选用什么指标来描述其集中趋势和离散趋势?4.该用什么方法来估计正常人尿铅的参考值范围?5.可以选用什么统计图来表达这组资料?13.某研究人员采用不同浓度的含铅饲料喂养大白鼠,以观察铅污染对大白鼠脑铅含量的影响,资料如下:表1.不同铅浓度的饲料对大白鼠脑铅含量的影响组别染毒剂量(mg/L)n脑铅含量(X±S)低剂量组1065.226±0.627高剂量组3066.418±0.772对照组064.778±0.579研究者用成组比较t检验对三组大白鼠脑铅浓度做假设检验,结果表明:高剂量组与对照组差别有统计学意义,而低剂量组与对照组差别无统计学意义。请回答:你认为此方法是否合理?如果不合理,为什么?简述其理由,并提出你认为合理的统计分析方法。(写出具体步骤,不必计算)答案提示:(数值变量资料统计描述)1.总体与样本根据研究目的确定的同质观察单位的全体;样本是从总体中随机抽取的有代表性的观察单位的集合。2.参数与统计量参数是描述总体的指标;统计量是反映样本的指标。3.数值变量资料即用定量方法测量每个观察单位的某项指标的数值大小,一般有度量衡单位。4.抽样误差在抽样过程中引起的样本指标与总体指标或样本指标之间的差异。5.小概率事件统计学上将P≤0.05或P≤0.01的事件,称为小概率事件。6.中位数与百分位数中位数是一组按大小顺序排列的观察值中位次居中的数值,用M表示。百分位数是位置指标,用Px表示。一个由小到大的有序数列即被分为100等份,各含1%的观察值。7.四分位数间距四分位数间距是上四分位数Qu(即P75)与下四位数QL(即P25)之差,其间包括了全部观察值的一半,用Q表示。8.标准差是常用的描述数值变量资料分布离散程度的指标,其计算公式为:9.变异系数若比较度量单位不同或均数相差悬殊的两组(或几组)观察值的变异度时的指标。其计算公式为CV=S/×100%10.正态分布一条高峰位于中央、两侧完全对称地降低、但永远不与横轴相交的钟型曲线,这条曲线近似于数学上的正态分布曲线。答案:1~5dcacc6~10addea11~15ccaab16~20bcaaa计算题3.略4.G=6滴度1:65.=7.26小时s=4.47小时答案提示:(数值变量资料统计推断)1.标准误(standarderror)反映均数抽样误差大小的指标是样本均数的标准差。2.可信区间(confidenceinterva

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论