华北理工卫生统计学实验指导_第1页
华北理工卫生统计学实验指导_第2页
华北理工卫生统计学实验指导_第3页
华北理工卫生统计学实验指导_第4页
华北理工卫生统计学实验指导_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE卫生统计学实验指导专业:班级:目录实验一:电子计算器的使用…………………1目的要求……………………1操作方法……………………1练习题………………………3实验二:SPSS简介 …………4目的要求……………………4操作方法……………………4练习题………………………11实验三:定量资料的统计描述………………12目的要求……………………12案例分析……………………12SPSS操作 …………………12练习题………………………13作业…………………………14实验四:定性资料的统计描述………………15目的要求……………………15案例分析……………………15SPSS操作 …………………16练习题………………………16作业…………………………17实验五:统计表与统计图……………………19目的要求……………………19案例分析……………………19练习题………………………20作业…………………………21实验六:常用概率分布………………………22目的要求……………………22案例分析……………………22练习题………………………22作业…………………………24实验七:参数估计……………25目的要求……………………25案例分析……………………25SPSS操作 …………………25练习题………………………25作业…………………………27实验八:t检验、z检验  ……………………29目的要求……………………29案例分析……………………29SPSS操作   …………………29练习题………………………30作业…………………………31实验九:方差分析……………34目的要求……………………34案例分析……………………34SPSS操作   …………………35练习题………………………35作业…………………………37实验十:卡方检验……………39目的要求……………………39案例分析……………………39SPSS操作   …………………40练习题………………………40作业…………………………42实验十一:基于秩次的非参数检验…………44目的要求……………………44案例分析……………………45SPSS操作   …………………45练习题………………………45作业…………………………46实验十二:相关与回归………………………48目的要求……………………48案例分析……………………48SPSS操作   …………………50练习题………………………50作业…………………………53实验一:电子计算器的使用【目的要求】熟悉电子计算器的功能,掌握电子计算器进行统计分析的方法。【操作方法】计算器一般是指“电子计算器”,能进行数学运算的手持机器,拥有集成电路芯片,但结构简单,比现代电脑结构简单得多,可以说是第一代的电子计算机(电脑),且功能也较弱,但较为方便与廉价,在商业交易、办公中均有较广泛的应用。常见的计算器可分为三类:①算术型计算器——可进行加、减、乘、除等简单的四则运算,又称简单计算器。②科学型计算器——可进行乘方、开方、指数、对数、三角函数、统计等方面的运算,又称函数计算器。③程序计算器——可以编程序,把较复杂的运算步骤贮存起来,进行多次重复的运算。本指导以CASIOfx-3800P为例,简单介绍既具有统计功能又可进行程序编辑的程序计算器的使用方法。一、一般特点一个键多具有两个以上的功能,以黑色指示第一功能,橙色指示第二功能,使用第二功能时须先按第二功能指示键SHIFT,小黑色指示第三功能,使用第三功能时须先按第三功能指示键KOUT。通过运算模式选择键MODE的选择,可以进入不同的运算模式。MODE.:普通初等运算; MODEEXP:显示“LRN”,可写入程序;MODE2:显示“LR”,可执行相关与回归运算(双变量分析);MODE3:显示“SD”,可执行统计运算(限于标准差、均数等;单变量分析);MODE4:显示“DEG”,指定“度”为角度单位;MODE5:显示“RAD”,指定“弧度”为角度单位;MODE6:显示“GRA”,指定“梯度”为角度单位;MODE7:指定“Fix”,即小数位数(接着按几就是保留几位小数);MODE8:指定“Scientific”,即科学计数位数(接着按几就是保留几位小数);MODE9:指定“Normal”,解除“Fix”,“Scientific”时按下此键。二、均数及标准差的计算1.常用符号说明DATA/DELDATA/DEL输入的变量值的平方和输入的变量值总和黑色符号功能键须先按KOUT键。输入的变量值个数n总体标准差样本标准差橙色符号功能键须先按SHIFT键。均数变量的输入/清除当前输入错值操作步骤(1)选择运算模式MODE3(显示屏上出现SD)。若显示屏上方已有SD,此步可省去;(2)清除残存数据:SHIFTAC;(3)输入数据:用DATA键;(4)读取结果:首先取变量值的个数(即样本例数n),如果取出的样本例数与已知的样本例数相等,则可取出其他所需的结果(如均数、标准差等),否则表明输入的数据有误,应回到第2步清除残存数据再往下进行。3.操作方法SHIFTAc:清仓MODE3:SDX1DATA:输入数据X2DATA:输入数据..XnDATA:输入最后一个数据KOUT3:n三、直线回归和相关系数的计算1.常用符号说明黑色符号功能须先按黑色符号功能须先按KOUT键输入数据的对子数n在Y轴的截距A(a)回归系数B(b)相关系数r橙色符号功能须先按SHIFT键X变量值的估计值Y变量值的估计值Y变量值的输入DATA蓝色符号功能直接按键X变量值的输入XD,YD操作步骤(1)选择运算模式MODE2(显示屏上出现LR)。若显示屏上方已有LR,此步可省去;(2)清除残存数据:SHIFTAC;(3)输入数据:必须成对输入,用XD,YD和DATA两键;应先输X值,后输Y值;(4)取出结果:首先取对子数(即样本例数n),如果取出的样本例数与已知的样本例数相等,则可取出其他所需的结果(如相关系数、回归系数等),否则表明输入的数据有误,应回到第2步清除残存数据再往下进行。3.操作方法SHIFTAc:清仓MODE2:LRX1[(Y1DATA:成对输入数据X2[(Y2DATA:成对输入数据X3[(Y3DATA:成对输入数据..Xn[(YnDATA:输入最后一对数据KOUT3:n【练习题】例110名7岁男童体重(Kg)分别为17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求其均数和标准差。例2110名7岁男童身高(cm)的频数表如下,试计算其均数和标准差。11011012341014频数合计133131129127125123组中值2118159931频数121119117115113111109组中值例3某地一年级12名女大学生的体重与肺活量数据如下,试求其相关系数,回归系数和截距。3.003.003.502.853.463.103.41Y肺活量(L)585852525050X体重(kg)2.812.802.402.752.202.55Y肺活量(L)504646464242X体重(kg)

实验二:SPSS简介【目的要求】了解SPSS主要窗口,掌握数据库建立的方法。【操作方法】SPSS简介:一、SPSS的安装1.系统配置:目前所用电脑均能运行。2.安装步骤:(1)光盘版:根据提示即可完成安装。(2)网络版:需要破解,根据破解方法进行安装。二、使用SPSS进行数据分析的基本步骤输入数据到SPSS(DataEditor窗口/File菜单)分析前数据准备。如数据核查、筛选、数据转换、编码等工作(Data/Transform菜单)选择分析方法和分析过程(Analyze/Graphs菜单)选择分析的变量和观察个体运行分析过程,浏览结果三、主要窗口和功能初次安装SPSS软件后,打开SPSS软件会弹出如下图所示窗口。运行运行SPSS教程在数据编辑窗口直接输入数据使用已经定义的SQL数据源使用数据库向导创立一个新的SQL数据使用已有的内部数据使用已有的外部数据以后启动SPSS不再显示该对话框(一)数据编辑窗口数据编辑窗口(DataEditor)是SPSS提供的以类似电子表格形式创建、编辑、浏览数据的一种直观方法。运行SPSS后自动打开此窗口。在数据表中,每一行表示一个观察个体(Case),每一列表示一个变量(Variable)。数据编辑窗口分为两个不同的窗口即“DataView”(数据编辑)和“VariableView”(变量编辑)。数据编辑窗口(DataView)在数据编辑窗口内可以浏览、修改、编辑数据值。窗口的主要内容如下:行:代表观察个体,每一行代表一个观察对象或实例。它由该观察对象的所有属性(变量)构成。列:代表变量,每一列代表被观察对象的一个特性或者属性,同一列所有值的类型全部相同。数据格:每个数据格内为对应观察对象的某个属性的观察值或者数据值标签。菜单栏菜单栏工具栏数据栏数据管理窗口状态栏SPSS菜单:File:文件管理菜单,执行有关文件的调入、存储、显示和打印功能。Edit:编辑菜单,执行文本内容的选择、拷贝、粘贴、寻找和替换等功能。View:视图菜单,执行有关工具栏、状态栏、字体选择、网络等显示功能。Data:数据管理菜单,执行有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等功能。Transform:数据转换处理菜单,执行有关数值的计算、重新赋值、缺失值替代等功能。Analyze:统计菜单,包含了一系列统计方法,为统计分析的主菜单。Graphs:绘图菜单,进行有关统计图的制作。2.变量编辑窗口(VariableView)变量编辑窗口是创建、显示、修改变量属性的窗口,窗口内仅显示数据表中各个变量的有关属性。行代表变量,列是变量属性,可以定义、修改有关的变量属性。变量属性包括:变量名(Name)、类型(Type)、整数位数(Width)、小数位数(Decimals)、变量标签(Label)、变量值标签(Values)、缺失值(Missing)、对齐(Align)、显示宽度(Columns)、变量测度(Measure)等,如图所示。变量序变量序号属性名(二)结果浏览窗口在第一次分析完成后,系统自动打开结果浏览窗口。SPSS的所有计算分析结果都显示在结果浏览窗口(Viewer)中。在此窗口可以浏览、编辑输出结果,改变输出显示顺序等。通过结果浏览窗口还可以将计算结果输出到其他软件中,比如输出到Word文档中。结果浏览窗口分为左右两个子窗口。左边为输出导航大纲窗口,右边为内容窗口。1.输出导航大纲窗口此结果显示计算结果的输出大纲,内容为输出结果条目。导航大纲窗口可以控制内容窗口的显示内容。通过鼠标点击完成操作。该窗口具有编辑功能,可直接进行复制、删除、粘贴等操作,而这些操作就是对内容窗口的编辑。2.内容窗口显示计算输出的全部结果,包括文字、图形和表格等内容。输出导航大纲窗口输出导航大纲窗口内容窗口3.结果的保存(1)结果浏览窗口的内容可以保存为SPSS结果输出文件格式(*.SPO),保存的结果包含了大纲和内容两部分。保存的文件以后可以在SPSS结果浏览窗口中打开。保存方法:File—Save/SaveAs…;工具栏的保存按钮。(2)将结果浏览窗口的内容保存为其它文档格式(Word、Excel、PowerPoint、HMTL文档或文本文档)保存方法:File—Export…输出范围输出范围输出文件名图形对话框输出文档内容输出文件格式保存位置保存为保存为HTML文件,用网页浏览器查看保存为文本文件,用记事本浏览Excel格式Word格式PowerPoint格式OutputDocument:输出全部内容,包括文字、统计图、统计表OutputDocument(NoCharts):仅输出文字,包括统计表但不包括统计图ChartsOnly:仅输出统计图AllObjects:输出窗口的全部结果项目AllVisibleObjects:输出全部可见结果项目,不包括被隐藏者SelectedObjects:输出选择的项目四、通过数据编辑窗口输入数据(一)使用数据编辑窗口输入数据进入SPSS系统后会自动打开数据编辑窗口,在此窗口可直接输入数据。如果在数据编辑窗口已有数据而又需要输入新数据时可以打开新的数据编辑窗口。(File—New—Data)在数据编辑窗口输入数据时可以直接输入数据值而不需要定义变量属性,也可以先定义变量(数据属性)后再输入数据,还可以先输入数据后再定义变量属性。(二)定义变量定义变量就是定义变量的属性。变量属性包括:变量名、类型、宽度、小数位、变量标签、变量值标签、缺失值、显示宽度、对齐、变量测度。在创建变量时,必须指定的变量属性是变量名和变量类型,其它属性可以省略或者使用系统默认定义。变量名变量名类型宽度小数位标签值标签缺失值列宽度对齐方式度量水平1.变量名定义在同一数据文件内,变量名不能重复。首字符必须为字母或者汉字。变量名不能用“.”或者“-”结尾。变量名首尾字符外的其它字符除不能用“?”、“*”、“!”、“’”及空格5种字符外,可以采用其它任何能用的字符。变量名长度在1~64个字符之间。如果全部采用汉字则最多为32个汉字。ALL,AND,OR,NOT,EQ,NE,GE,GT,LT,LE,TO,WITH,BY等名字是系统保留名字,不能作为变量名。英文字母作为名字时,不区分大小写。2.变量类型、宽度和小数点的定义指定每个变量的数据值类型,系统默认的是数字类型。新建变量时除非特别说明是其它类型,否则都是数值类型。常用的类型有3种:数值型(Numeric):需要定义数值的宽度,整数位(Width)默认为8位,小数位数(DecimalPlaces)默认为2位。日期型(Data):可从系统提供的日期显示形式中选择自己需要的。字符型(String):用户可定义字符长度以便输入字符。3.变量测度的定义SPSS把变量测度(Measure)分为3种,即尺度型(Scale)、等级型(Ordinal)和名义型(Nominal),它们分别对应于定量变量,等级(有序)变量和定性变量。4.变量标签定义可采用长达256个字符(128个汉字)对变量做出解释或标注,可以采用任意能输入的字符标签。5.变量值标签用来解释变量值的含义,此功能对等级变量或者定性变量编码时尤其有用。五、SPSS数据文件的存取存取保存的SPSS文件SPSS创建的文件类型有多种,不同的文件类型服务于不同的目的,在不同窗口内保存和打开,这些文件类型统称为SPSS内部文件。SPSS常用的文件类型有2种,即:数据文件(Data),其扩展名为.SAV;输出结果文件(Output),其扩展名为.SPO或者.RTF。2.读取保存的数据文件无论是SPSS数据文件还是外部数据文件类型,读取数据文件的操作方式相似。3.读取Excel电子表格数据文件SPSS可以直接使用微软Excel电子表格建立的数据文件。但需要注意Excel电子表格数据文件最好符合数据库文件建立的标准方式,即首行为变量名,同列数据类型相同。SPSS读取Excel数据文件方式如下:File—Open—Data—文件类型选择Excel(*.xls)选择合适的数据文件,点“打开”后,显示下面所示对话框。Readvariablenamesfromthefirstrowofdata:指定是否首行作为变量名。选择后第一行单元格内容作为变量名,不符合SPSS变量名命名规则的转换为符合规则的,否则使用默认的名字V+n,n为变量序号。Worksheet:选择读取电子表格文件的表单名。默认读取第一个表单。Range:指定数据表格单元范围。Maximumwidthforstringcolumns:指定单个单元格最大能容纳的字符数量。4.保存SPSS数据文件数据窗口内的数据必须保存才能被以后使用,否则,退出数据窗口后所有的修改将丢失。如果不仅想保存数据窗口内的数据和数据修改,而且要更换数据文件名和类型,甚至挑选部分变量保存,则选择File—Saveas。Variable:选择数据文件中需要保留的变量。保存类型:选择SPSS创建不同的数据文件类型,默认为SPSS数据文件。如果想保存部分变量时,单击“Variable”,弹出下面的对话框Keep:选择,不选。KeepAll:选择全部变量。DropAll:删除全部变量。Contiune:完成选择,返回保存对话框。【练习题】例1某医生调查某地区儿童生长发育的情况,共调查了106名7岁儿童,调查表如下所示,请利用SPSS数据编辑窗口建立数据文件。某时某地区学龄儿童体检表某时某地区学龄儿童体检表个人信息学号姓名年龄岁年级性别:男女体检结果身高厘米体重公斤肺活量毫升例2某医生调查某地区儿童生长发育的情况,共调查了106名7岁儿童,调查表如下所示,请利用SPSS数据编辑窗口建立数据文件。某时某地区学龄儿童体检表某时某地区学龄儿童体检表个人信息学校姓名年龄岁年级性别:男女出生日期年月日体检结果身高厘米体重公斤肺活量毫升

实验三:定量资料的统计描述【目的要求】熟悉描述定量资料集中趋势、离散趋势的指标、意义、应用条件,掌握各指标的spss分析过程。【案例分析】案例1:某研究者收集到145名食物中毒病人的潜伏期如下表。145名食物中毒病人的潜伏期潜伏期人数0~176~4612~3818~3224~630~036~442~482为描述食物中毒病人潜伏期的集中趋势和离散趋势,某研究者采用算术均数和标准差两个统计指标。按照频率表法计算算术均数为:计算标准差为你认为其选择的统计描述指标合理吗?为什么?应当怎样做?【SPSS操作】1.Frequencies过程Analyze——DescriptiveStatistics——Frequencies——选择频数分组变量——Statistics…——选择相应的基本统计量——Continue——Charts…——Histograms——WithNormalCurve——continue——OK2.Descriptives过程Analyze——DescriptiveStatistics——Descriptives…——选择变量——Options…——OK3.Explore过程Analyze——DescriptiveStatistics——Explore——DependentList(分析变量)——FactorList(分组标志)——Plots——Normalityplotswithtests(正态性检验)——OK【练习题】一、填空题1.描述定量资料集中趋势的指标有。2.描述定量资料资料离散趋势的指标有。3.抗体滴度宜用描述集中趋势。4.描述对称分布资料集中趋势和离散趋势的指标分别是和。5.描述偏态分布资料集中趋势和离散趋势的指标分别是和。6.定量变量可分为和。二、选择题1.描述一组偏态分布资料的变异度,以()指标较好.A.全距B.标准差C.变异系数D.四分位数间距E.方差2.用均数和标准差可以全面描述()资料的特征.A.正偏态分布B.负偏态分布C.对称分布D.对数正态分布3.比较身高和体重两组数据变异度大小宜采用().A.变异系数B.方差C.极差D.标准差E.四分位数间距4.偏态分布宜用()描述其分布的集中趋势.A.算术均数B.标准差C.中位数D.四分位数间距E.方差5.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势.A.均数B.标准差C.中位数D.四分位数间距E.几何均数6.血清学滴度资料最常用来表示其平均水平的指标是().A.算术平均数B.中位数C.几何均数D.变异系数E.标准差7.变异系数越大说明()A.标准差越大B.标准差、平均数都大C.以均数为准变异程度大D.平均数小8.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>12,其潜伏期的平均水平约为()A.9天B.9.5天C.10天D.11天9.对于同一组资料,哪个指标没有考虑到每个观察值的变异()A.方差B.总体标准差C.变异系数D.四分位数间数10.描述一组数值变量资料的分布特征时()A.应同时选用算术平均数和标准差B.应同时选用中位数和四分位数间距C.根据分布类型选用相应的集中、离散趋势指标D.以上都不正确三、判断题1.对数正态分布资料最好计算几何均数以表示其平均水平。()2.不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。()3.理论上只有服从正态分布条件的变量的算术均数等于中位数。()4.少数几个数据比大部分数据大几百倍,一般不宜用算术均数表示平均水平。()5.数据按等比级数分组时,不管分布如何,都应该计算几何均数表示平均水平。()6.样本中位数不受样本中的极端值影响。()7.分组的连续分布资料,计算百分位数要求组距相等。()8.对于连续分布资料,单位相同时,也可用变异系数比较两个变量的相对离散度。()9.从同一连续分布总体中随机抽样,样本含量越大,理论上从样本算得的变异系数越小。()10.对于计量数据,不应按分组方式决定是否计算几何均数。()四、思考题1.描述定量资料集中趋势的指标有哪些,各适用于什么情况,有什么优缺点?2.描述定量资料离散趋势的指标有哪些,各适用于什么情况,有什么优缺点?3.为什么要根据数据的性质和分布来选择不同的描述集中趋势和离散趋势的指标?【作业】1.从某地20岁男青年中随机抽查120名,根据他们的身高和体重测量结果计算均数和标准差,算得身高X(厘米)为166.06±4.95,体重Y(公斤)为53.72±4.47。试判断两者离散程度的大小。3.某研究者随机调查了唐山市2010年某单位30名44岁健康男性的体重指数(kg/m2)如下:26.32,24.11,25.80,18.10,26.37,25.01,25.61,26.96,29.76,28.74,21.97,22.86,27.34,24.93,22.09,27.68,24.80,24.57,23.66,26.70,25.39,27.13,26.78,28.70,26.61,30.42,25.14,22.54,26.78,26.81。试编制体重指数数据的频数表,绘制直方图,概括其分布特征,并选择合适的统计量描述其集中趋势、离散趋势。(使用SPSS软件分析)

实验四:定性资料的统计描述【目的要求】掌握相对数各指标的意义及其spss分析过程。掌握应用相对数时的注意事项【案例分析】案例1:某医生在一个有5万人口的社区进行肺癌调查,通过随机抽样共调查2000人,全部调查工作在10天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果列于下表,该医生对表中资料进行统计分析,认为男性肺癌的发病率高于女性,而死亡情况则完全相反。某社区不同性别人群肺癌调查情况性别检查人数有病人数死亡人数死亡率(%)发病率(%)男10506350.00.57女9503266.70.32合计20009555.60.45请讨论:1)该医生所选择的统计指标正确吗?2)该医生对指标的计算方法恰当吗?3)应该如何作适当的统计分析?案例2:根据某医生统计了本医院从1960年至1999年的住院病例,得到表1和表2的数据,根据表1,该医生认为“40年来,10种心脏病总的发病率逐年代增高”;根据表2,该医生认为“在10种心脏病中,冠心病发病率迅速增高,从20世纪70年代起居心脏病中第一位”。应如何评价这位医生的分析结论?这两份资料各有什么用处?表11960-1999年住院患者中心脏病患者的频率年度住院患者中10种心脏病患者的频率(%)年度住院患者中10种心脏病患者的频率(%)1960~4.61980~8.91970~7.31990~200010.1表21960-1999年住院患者中心脏病患者中冠心病患者的频率年度10种心脏病住院患者中冠心病患者的频率(%)年度10种心脏病住院患者中冠心病患者的频率(%)1960~9.381980~29.211970~30.101990~200051.45案例3:某医生对某地某年2-4岁儿童麻疹发病情况进行调查,以发病例数除以观察儿童数,得到了两个年龄组儿童的麻疹发病率(下表),该医生认为:从发病率看,该地3-4岁的儿童麻疹发病的危险性比2岁儿童低。你认为该医生的结论是否正确?某地某年3-4岁儿童麻疹发病情况年龄儿童总人数易感儿童书麻疹发病例数发病率(%)2-141378349334.893-491822817118.63【SPSS操作】1.单个定性变量的描述分析Analyze——DescriptiveStatistics——Frequencies——选择分析的变量——Displayfrequencytables——Statistics…——取消所有的基本统计量——Continue——Charts…——选择合适的统计图——Percentages——Continue——OK2.多指标的描述分析——交叉表(Crosstabs)Analyze——DescriptiveStatistics——Crosstabs——选择行变量Row(s)——选择列变量Column(s)——Cells——选择表内统计量——Continue——DisplayClusteredbarCharts…——OK【练习题】一、填空题1.定性变量可分为和。2.常用的相对数指标包括。3.标准化率的计算方法有和。4.标准化法的目的是。5.动态数列说明。二、选择题1.某医院某年住院病人中胃癌患者占5%,则()A.5%是构成比指标B.5%是频率指标C.5%是相对比指标D.5%说明胃癌在人群中的严重性2.计算麻疹疫苗接种后血清检查的阳转率,分母为()A.麻疹易感人群B.麻疹患者数C.麻疹疫苗接种人数D.麻疹疫苗接种后的阳转人数3.某部队夏季拉练,发生中暑21例,其中北方籍战士为南方籍战士的2.5倍,则结论为()A.北方战士易中暑B.南方战士易中暑C.北方比南方战士中暑率高D.尚不能得出结论4.一项新式治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是()A.该病患病率增加B.该病患病率减少C.该病发病率减少D.该病发病率与患病率均减少5.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000人,其中肺结死亡98人,要说明肺结核死亡的严重程度,最好应用()A.初死亡率B.肺结核死亡率C.肺结核死亡构成D.肺结核的病死率6.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为()A.该病男性易得B.该病女性易得C.尚不能得出结论D.根据该资料可计算男女的患病率7.要比较甲乙两厂某工种工人某种职业病患病率的高低,采取标准化法的原理是().A.假设甲乙两厂的工人数相同B.假设甲乙两厂患某职业病的工人数相同C.假设甲乙两厂某工种工人的工龄构成比相同D.假设甲乙两厂某职业病的患病率相同8.要比较甲乙两厂工人患某种职业病的患病率,对工龄进行标化,其标准构成的选择是().A.甲厂工人的年龄构成B.乙厂工人的年龄构成C.甲乙两厂合并的工人的年龄构成D.当地较稳定人口的年龄构成E.甲乙两厂合并的工人的工龄构成9.定基比和环比属于()指标.A.平均数B.构成比C.频率D.相对比E.发展速度10.某医院的资料,计算了各种疾病所占的比例,该指标为()A.发病率B.构成比C.相对比D.标化发病率11.一个地区某病死因顺位提前则说明()A.该病死亡数增多B.该病死亡率增高C.该病死因构成比增大D.以上都不对12.下面4个指标中最能反映某年、某病预防工作水平的是()A.发病率B.患病率C.死亡率D.病死率13.下面4个指标中最能反映某年某病对居民生命危害程度指标的是()A.死亡率B.病死率C.1年生存率D.死亡年龄构成比14.(),可以用死亡率估计发病率。A.发病率较高的疾病B.死亡率较高的疾病C.病死率较高的疾病D.病死率接近1的疾病三、判断题1.某事物内部某一部分所占的比重就是比例,患病率也是一种比例。()2.要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。()3.同一地方30年来肺癌死亡率比较,要研究是否肺癌致病因子在增强,应该用同一标准人口对10年来的肺癌死亡率分别作标化。()4.死因顺位下降的疾病,死亡率也可以是升高的。()5.同一地区的不同年份的某病发病率比较时,不必标准化。()四、思考题1.发病率、患病率、病死率和死亡率存在什么联系和区别?2.常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。3.标准化法的基本思想和意义是什么?【作业】1.下表是两地某病的患病资料。两地某病的患病资料甲地乙地检查人数患病人数患病率%检查人数患病人数患病率%男性52563687913.092563425369.89女性12365368929.83468921256926.80合计649281056816.28725261510520.83某研究者认为乙地总患病率为20.83%,高于甲地的16.28%,乙地某病患病严重,你是否同意该研究者的意见,为什么?(不用计算)。2.某地2005年6月30日有男性人口13697600人,男性人口中因心血管疾病死亡18311人,其中冠心病死亡654人。欲反映该地男性人口冠心病死亡强度与冠心病死亡在心血管疾病死亡中的比重,应计算什么指标?为什么?

实验五:统计表与统计图【目的要求】1.掌握统计表的编制原则、各种统计图的用途。2.掌握统计表、统计图的spss绘制过程。【案例分析】案例1:有缺陷的统计表请修改下面的统计表(原表无标题)年年龄性别222134982378141014例数男男女男女男女男女61-7051-6041-5031-4021-30案例2:有缺陷的统计图这是出现在某一出版物中的统计图,请对其进行修改19531953-57年每年平均1978年479万人110万人【SPSS操作】1.单式条图Graphs——Bar——simple——Define——otherstatistics:选择统计量——CategoryAxis:选择分类轴变量——Titles:添加标题等——OK2.复式条图Graphs——Bar——Clustered——Summariesforgroupsofcases——Define——Barrepresent——otherStatistic——variable:选择变量——CategoryAxis:分类轴变量——Defineclusterby:次要分组标志——Titles:添加标题等——OK3.圆图Graphs——Pie——Datainchartare:summariesforgroupsofcases——Define——Slicesrepresent:sumofvariable——variable:变量——defineSlicesby:分类——ok4.单线图Graphs——Line——Simple——Define——otherStatistic(egmean)——variable(指标)——CategoryAxis(时间)——ok5.多线图Graphs——Line——Multiple——Define——LinesRepresent(指标)——CategoryAxis(时间)——ok6.箱式图Graphs——Boxplot——Simple——Define——variable(指标)——CategoryAxis(分组标志)——ok7.散点图Graphs——Scatter/Dot——SimpleScatter——Define——Yaxis(y值)——Xaxis(x值)——ok8.直方图Graphs——Histogram——Variable(分析变量)——Displaynormalcurve(绘制正态分布曲线)——ok【练习题】一、填空题1.统计表由等部分组成。2.统计表的标目分为。3.根据分类标记的多少,统计表可分为和。4.欲表示相互独立的各项指标数量的大小应绘制图。5.构成图包括和,适用于资料。6.欲表示量变量的相关关系应绘制。7.直方图常表示。二、选择题1.观察某地90年至2000年意外伤害发生率和摩托车数量的关系,宜选择的图形为()A.直方图B.直条图C.散点图D.线图2.观察儿童智力与家庭收入的关系,宜选择的图形为()A.直方图B.直条图C.团图D.散点图3.观察意外死亡在不同年份的变化趋势,宜选择的图形为()A.直条图B.普通线图C.圆图D.半对数线图4.观察甲型肝炎患者的年龄分布,宜选择的图形为()A.直方图B.直条图C.圆图D.普通线图5.观察各种死因造成死亡的比重,宜选择的图形为()A.直方图B.直条图C.圆图D.普通线图6.比较不同性别高血压患病率,宜选择的图形为()A.直方图B.直条图C.圆图D.普通线图7.利用一次横断面调查资料,描述职业和肝炎患病率关系应该用()。A.散点图B.直方图C.直条图D.圆图8.直方图可用于()。A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布9.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为()。A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图10.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用()。A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图11.为了反映某地区19782010年男性肺癌年龄别死亡率的变化情况,可采用()。A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图12.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用()。年龄(岁):10~20~30~40~50~60~人数:6405085201A.线图B.条图C.直方图D.圆图E.散点图三、思考题1.常用的统计图有哪几种,各适用于什么类型资料?2.直方图和圆图在应用中有何区别?【作业】1.1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20.76,卫生院7.63,其他7.77;农村妇女相应为医院20.38,妇幼保健机构4.66,卫生院16.38,其他58.58。试用合适的统计图表达上述资料。(使用SPSS软件分析)

实验六:常用概率分布【目的要求】1.掌握正态分布的特点和面积分布规律,掌握参考值范围的制定方法。2.掌握二项分布、泊松分布的正态近似。【案例分析】案例1:2000年某地艾滋病病毒感染率为十万分之七,该地10万人口,2001年感染了艾滋病病毒的人数为17人,有人说,该地2001年总体上艾滋病病毒感染率与2000年持平。如果是这样的话,该地2001年感染了艾滋病病毒人数为17人这种情况发生的概率为因为发生的概率太小了,所以说该地2001年总体上艾滋病病毒感染率与2000年持平的说法是不成立的。该分析是否正确,为什么?【练习题】一、填空题1.分布的总体均数等于总体方差。2.二项分布在时服从正态分布。3.泊松分布在时服从正态分布。4.确定医学参考值范围的方法有和。二、选择题1.标准正态分布的均数与标准差是()A.0,1B.1,0C.0,0D.1,12.正态分布的两个参数μ与σ,()对应的正态曲线愈趋扁平。A.μ愈大B.μ愈小C.σ愈大D.σ愈小3.正态分布的两个参数μ与σ,()对应的正态曲线平行右移。A.增大μB.减小μC.增大σD.减小σ4.随机变量X服从正态分布N(μ1,σ12),随机变量Y服从正态分布N(μ2,σ22),X与Y独立,则X-Y服从()A.N(μ1+μ2,σ12-σ22)B.N(μ1-μ2,σ12-σ22)C.N(μ1-μ2,σ12+σ22)D.N(0σ12+σ22)5.二项分布的概率分布图在()条件下为对称图形。A.n>50B.π=0.5C.n=1D.π=16.()的均数等于方差。A.正态分布B.二项分布C.Poisson分布D.对称分布7.设X1,X2分别服从以λ1,λ2为均数的Poisson分布,且X1,X2独立,则X1+X2服从以()为方差的Poisson分布。A.λ12+λ22B.λ1+λ2C.(λ1+λ2)2D.(λ1+λ2)-1/28.满足()时,二项分布B(n,π)近似正态分布。A.nπ和n(1-π)均大于等于5B.nπ或n(1-π)均大于等于5C.n>50D.nπ足够大9.满足()时,Poisson分布P(λ)近似正态分布。A.λ=1B.λ>20C.λ=0D.λ=0.510.满足()时,二项分布B(n,π)近似Poisson分布。A.nπ和n(1-π)均大于等于5B.n~∞C.n很大且π接近0.5D.n很大且π接近011.观察某地100名12岁男孩身高,均数为138.00cm,标准差为4.12cm,Z=(128.00-138.00)/4.12。Φ(Z)是标准正态分布的分布函数,1-Φ(Z)=1-Φ(-2.43)=0.9925,结论是()A.理论上身高低于138.00cm的12岁男孩占99.25%B.理论上身高高于138.00cm的12岁男孩占99.25%C.理论上身高低于128.00cm的12岁男孩占99.25%D.理论上身高高于128.00cm的12岁男孩占99.25%12.为了解某城市7岁男童身高的发育情况,随机抽查该市区110名7岁男童,平均身高为119.95cm,标准差为4.72cm。(1)用算式119.95±1.28×4.72计算得到的区间,可以解释为:理论上()的7岁男童身高在此范围内A.95%B.80%C.90%D.10%E.20%(2)理论上90%的7岁男童身高集中在()A.119.95±1.28×4.72B.119.95±1.64×4.72C.119.95±0.13×4.72D.119.95±1.96×4.72E.119.95±2.58×4.72三、判断题1.正态分布与对称分布等价。()2.随机掷一枚筛子,出现的点子数服从二项分布。()3.当n无穷大时,二项分布概率分布图是对称的。()4.如果标准差大于均数,那么一定不符合正态分布。()5.正态分布密度曲线下,横轴上均数+s右侧面积是0.1587。()6.用制定出正常值范围后,不在这个范围内的人一定是病人。()7.标准正态分布常用N(0,1)表示。()8.在某特征比例为π的总体里随机抽样,样本含量n固定时,样本中该特征阳性个体数就服从二项分布。()9.总体比例越接近100%,在该总体随机抽样所得样本比例越接近正态分布。()10.没有传染性的疾病在某个社区内各户的分布都呈二项分布。()11.没有传染性的罕见病在人群中呈Possion分布。()四、思考题1.试述正态分布,标准正态分布及对数正态分布的联系和区别。2.试述正态分布的面积分布规律。3.试述正态分布的特征。4.简述二项分布,Poisson分布和正态分布间的联系。【作业】1.以下是101名30—49岁健康成年男子的血清总胆固醇(mmol/L)测定值的频数表,请据此资料:(1)选用适当的统计指标对此资料进行描述。(2)求该地30—49岁健康成年男子血清总胆醇的正常值范围。(3)估计该地30—49岁健康成年男子血清总胆固醇值小于4.5(mmol/L)的概率。某地101名30—49岁正常成年男子血清总胆固醇(mmol/L)测定值血总胆固醇频数血总胆固醇频数2.515.5--93.086.0--63.596.5--24.0237.0--14.525合计1015.017

实验七:参数估计【目的要求】掌握均数抽样误差的概念及产生原因掌握总体均数的可信区间及估计方法熟悉标准差与标准误的区别和联系【案例分析】案例1:某研究者于某年在某市随机调查了200例正常成年人血铅含量(μg/100g),将资料整理成表5-3的频数表形式,试估计该市正常成年人血铅含量的参考值范围及正常成年人平均血铅含量的置信区间。由于血铅值高于某上限值才被看作异常,故作者将该数据代入公式+1.64S计算得到该市正常成年人血铅含量95%参考值范围的上界;并用公式+1.64计算得到正常成年人平均血铅含量的95%置信区间的上界。试问这样做是否合适?为什么?应当怎么做?200名正常成年人血铅频数表组段(μg/100g)频数f累计频数累计频率(%)4~252512.58~325728.512~369346.516~3012361.520~2514874.024~2217085.028~1118190.532~818994.536~419396.540~419798.544~119899.048~119999.552~561200100.0合计∑f=200【SPSS操作】Analyze→DescriptiveStatistics→Explore→选择变量到DependentList列表中→选择Display选择框内的Statistics→OK【练习题】一、填空题1.抽样误差是指。2.标准误是指。3.总体均数置信区间的计算方法有和。4.t分布的自由度是。5.参数估计分为和。6.总体概率置信区间的计算方法有和。二、选择题1.表示均数抽样误差大小的统计指标是()A.标准差B.方差C.均数标准误D.变异系数E.样本标准误2.表示()A.总体均数B.样本均数的标准差C.总体均数离散程度D.变量值X的离散程度3.标准误越大,表示此次抽样得到的样本频率()A.系统误差越大B.可靠程度越大C.抽样误差越大D.可比性越差4.要减小抽样误差,通常的做法是()A.适当增加样本例数B.将个体变异控制在一个范围内C.严格挑选观察对象D.增加抽样次数5.关于t分布的图形,下列哪项是错误的()A.当v趋于无穷时,标准正态分布是t分布的特例B.当v逐渐增大,t分布逐渐逼近标准正态分布C.v越小,则t分布的尾部越高D.t分布是一条以v为中心左右对称的曲线6.已知某地25岁正常成年男性平均收缩压为113.0mmHg,从该地随机抽取20名25岁正常成年男性,测得平均收缩压为119.0mmHg.113.0mmHg与119.0mmHg不同,原因是()A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.个体差异太大7.从上题的同一个地区再随机抽取20名8岁正常男孩,测得平均收缩压为90mmHg,标准差为9.8mmHg.90mmHg与113.0mmHg不同,原因是()A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.样本均数不可比8.在同一总体随机抽样,样本含量n固定时,a越大,用总体均数的可信区间估计总体均数,估计的情况是()A.错的概率越大B.错的概率越小C.错的概率不变D.其精度越差9.统计推断包括两个重要方面()A.参数估计和假设检验B.计算均数和标准差C.统计描述和假设检验D.计算均数和标准误10.总体均数的可信区间()A.随总体均数而变化B.不随总体均数而变化C.固定区间D.随样本不同而变化11.总体概率的区间估计中,a值越大()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小12.样本频率的标准误越大,()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小13.置信区间和医学参考值范围相比,()A.置信区间也能判断个体值是否正常B.估计的精度好C.估计的精度下降D.置信区间的宽度小于医学参考值范围的宽度E.两者的计算都利于标准误三、判断题1.一般情况下,同一批资料的标准误小于标准差()2.从同一总体中随机抽取样本含量相同的两个样本,他们的样本均数与总体均数相同()3.增加样本含量可以减小抽样误差,所以样本含量越大越好()4.样本含量足够大时,来自正偏峰分布的样本可用正态近似法作参数估计()5.t分布法计算置信区间只适合小样本而不适用于大样本()6.当v一定,a=0.05时,单侧t值小于双侧t值()7.t值相等时,单侧概率小于双侧概率()8.通过样本频率估计总体概率,99%置信区间的精度高于95%置信区间()9.S和都是变异指标,因此它们都可以表示抽样误差的大小()四、思考题1.参考值范围和置信区间有什么区别和联系?2.t分布有什么特点?3.什么是均数标准误?意义是什么?如何计算及控制?【作业】1.为了研究某地黄连中小檗碱含量,随机抽查该地20份黄连中小檗碱含量(mg/100g)得平均数为4.35,标准差为0.20,试计算:(1)总体均数的95%和99%的可信区间。(2)若样本含量为200份,试计算其总体均数的95%和99%的可信区间,并与(1)相比较。2.采用某新药治疗高血压患者200例,服药1个月后160人有效,试估计该药的有效率及其双侧95%可信区间。3.为研究黄芪对细胞中RNA代谢的影响,在人肌皮肤二倍体细胞培养上进行黄芪对尿嘧啶核苷的渗入试验,结果为410、380、601、304、250、146、128、191、139、289、520、220、300(cPm/6×105细胞),试求尿嘧啶核苷含量的95%置信区间。(使用SPSS软件分析)

实验八:t检验、z检验【目的要求】熟悉假设检验的基本步骤掌握t检验、z检验的应用条件及分析过程熟悉假设检验的基本思想【案例分析】案例1:某医生研究脑缺氧对脑组织中生化指标的影响,将乳猪按出生体重配成7对,一组为对照组,一组为脑缺氧模型组。两组乳猪脑组织钙泵的含量差值(对照组减脑缺氧模型组)均数为0.0441ug/g,标准差为0.05716ug/g,经配对t检验(双侧),得t=2.0412,P>0.05,按a=0.05的水准,不拒绝H0,差别无统计学意义,尚不能认为脑缺氧可造成钙泵含量的变化。(1)本例结论是否正确?为什么?(2)该结论可能犯几型错误?案例2:7名接种卡介苗的儿童,8周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的左右前臂。以皮肤浸润直径(mm)为指标。数据如下表所示。某医生计算标准品与新制品的差值,均数为3.19mm,故认为新制结核菌素的皮肤浸润直径比标准结核菌素小。两种结核菌素皮肤浸润直径比较(mm)编号1234567标准品12.014.515.513.012.010.57.5新制品10.010.012.210.0该医师对资料的统计分析是否正确?为什么?若不正确,应该怎么做?案例3:2005年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价,随机抽取了30名小学生,测定结果如表2。经完全随机设计两样本均数比较的t检验(方差齐,F=0.05,P>0.05),t=0.014,P>0.05,故认为该县小学生卡介苗抗体效价无性别差异。2005年某县30名小学生卡介苗抗体滴度测定结果分组卡介苗抗体滴度(倒数)男生40201604032080402040801604080404040女生80201604040160402040160160408040该案例中资料的统计分析是否正确?为什么?若不正确,应该怎么做?【SPSS操作】1.单样本t检验Analyze→CompareMeans→one-sampleTTest…→TestVariable(s):变量→TestValue:总体水平→OK2.配对t检验Analyze→CompareMeans→Paired-SamplesTTest…→PairedVariables:x1-x2(同时选中)→OK3.两样本均数比较的t检验Analyze→CompareMeans→Independent-samplesTTest…→TestVariable(s):x→GroupingVariable:group→OK【练习题】一、填空题1.假设检验中的Ⅰ型错误指。2.假设检验中的Ⅱ型错误指。3.配对t检验的适用条件是。4.成组t检验的适用条件是。5.用于。二、选择题1.关于假设检验,下列哪个正确()A.假设检验是对总体做的某种假设B.假设检验是对样本做的某种假设C.检验假设包括无效假设和零假设D.检验假设只有双侧的假设2.下列关于假设检验的描述正确的是()A.假设检验结果是确切无误的,因此不可能有错误出现B.两样本均数比较若P<0.05认为两样本均数实际差别很大C.t检验适用各种定量资料,不需满足方差齐性等条件D.统计学得出差别有统计学意义结论并不一定有专业意义3.当n不等于无穷时,Z0.05的值与t0.05,n-1的值有关系式()A.Z0.05>t0.05,n-1B.Z0.05<t0.05,n-1C.Z0.05=t0.05,n-1D.Z0.05≥t0.05,n-14.下述()为第一类错误的定义A.拒绝实际上并不成立的H0B.接受实际上并不成立的H0C.拒绝实际上成立的H0D.接受实际上成立的H05.两样本比较时,分别取以下检验水准,哪个水准的第二类错误最小()A.a=0.05B.a=0.01C.a=0.10D.a=0.20E.a=0.156.正态性检验,按a=0.10水准,认为总体服从正态分布,此时若推断有错,错误的概率()A.大于0.10B.小于0.10C.等于0.10D.,而其未知7.在进行成组t检验之前,要注意两个前提条件,一是各样本是否来自正态总体,二是()A.核对数据B.总体方差是否相等C.作变量变换D处理缺失值8.两样本均数的比较,P<0.01可认为两总体均数()A.有差别B.差别非常大C.无差别D.差别较大E.差别有实际意义9.在两样本均数比较的t检验中,无效假设是()A.两总体均数相等B.两样本均数相等C.两总体均数不等D.两样本均数不等E.样本均数等于总体均数10、比较两种药物疗效时,下列哪项可做单侧检验()A.已知A药与B药均有效B.不知A药好还是B药好C.已知A药不会优于B药D.不知A药与B药是否均有效11.当总体方差已知时,检验样本均数与总体均数差别的假设检验是()A.只能用t检验B.只能用Z检验C.t检验或Z检验D.方差分析12.配对t检验,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验()A.t值符号相反,结论相反B.t值符号相同,结论相同C.t值符号相反,结论相同D.t值符号相同,但大小不同,结论相反13.完全随机设计两个大样本均数的比较(总体标准差未知),应选择的方法是()A.方差分析B.t检验C.Z检验D.三者均可14.两组数据中的每个变量值减去同一常数后作两均数差别的t检验,()B.t值变小B.t值变大C.t值不变D.不能确定15.从同一总体中随机抽取例数为n1和n2的样本,要判断相应的总体均数是否相等,则()A.因为样本均数有抽样误差,故有必要作假设检验B.没必要作假设检验C.若样本均数相等就没必要作假设检验D.若样本均数不等就有必要作假设检验16.两样本均数差别的统计检验中,事先估计并确定合适的样本含量的一个重要作用是()A.控制第一类错误的大小B.可消除第一类错误C.控制第二类错误的大小D.可消除第一类错误17.在实际工作的t检验中,有效的控制第一类错误概率大小的办法是()A.增大样本含量B.严格随机抽样C.设立对照组D.研究者确定a值小一些三、判断题1.进行假设检验的前提之一是两组资料具有可比性。()2.t检验是对两个样本均数是否相等进行的假设检验方法之一。()3.假设检验结果为P<0.01,则可认为两总体均数之间确实存在很大差别。()4.为研究两种疫苗接种后效果的差别,作两样本抗体滴度几何均数差别的t检验,其无效假设是两总体算术均数相等。()5.作两样本均数差别的假设检验,当P<0.01时,表示所对应的两总体均数相等的可能性小于0.01。()6.两样本均数差别的假设检验,无效假设成立与不成立犯第二类错误的概率相等。()7.通过随机的抽样研究,即使样本含量很小,如n=5,也可以推断总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论