版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章基本统计分析(1)流行病与卫生统计学科范红敏Descriptivestatistics概述统计学分析有两个方面:统计学描述和统计学推断。统计描述为统计分析打下基础。统计描述有数据频数分布特征描述、集中趋势值和离散趋势值的计算等。数据分类Spss变量分为三类:名义变量(nominal):定性资料计数资料和无序分类资料有序变量(ordinal):有序分类资料尺度变量(scale):定量资料(计量资料)一、统计分析子菜单descriptivestatistics频数分布分析:frequencies描述性统计分析:descriptives探索性统计分析:explore列联表资料分析:crosstabs比值描述:ratio二、基本统计量的定义分为三类:描述集中趋势的统计量描述离散程度的统计量描述总体分布形态的统计量(一)描述集中趋势的统计量统计学中的集中趋势统计量是由样本值确定的量,样本值有向这个数据集中的趋势。测度集中趋势就是寻找数据一般水平的代表值或中心值,不同类型的数据用不同的集中趋势测度值,选择那种测度值取决于数据的类型。1.均值(mean)又称为算术平均值适用于数值型数据,但缺点是易受极端值的影响。2.中位数(median)中位数受数据变化影响比均值大,但不受极值影响。3.众数(mode)是样本中出现次数(频数)最多的数值。众数的优点是不受极端值的影响。众数具有不唯一性,在一组样本中可能无众数或者有好几个众数。4.百分位数(percentile)常用的有4分位数(quartiles),指的是将数据分为四等份,分别为25%,50%和75%处的分位数。百分位数的优点是不受极端值的影响。(二)描述离散趋势的统计量1.样本方差(variance):是描述样本离散趋势的常用统计量。样本方差越大,表面样本值偏离样本平均值的可能性越大。2.样本标准差(std.deviation):将样本方差开方后统计量,也是度量样本离散程度的重要统计量。3.均值标准误(standarderrorofmean):样本均值的标准差,是描述样本均值和总体均值平均偏差程度的统计量。4.极差(range):是样本数中最大值和最小值之差。5.变异系数(coefficientofvariation):主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。(三)描述总体分布形态的统计量1.偏度(skewness)是描述取值分布形态对称性的统计量。理论上总体偏度系数为0时,分布是对称的;取正值时,分布为负偏锋;取负值时分布为正偏锋。2.峰度(kutosis):描述变量取值分布形态扁平程度的统计量。峰度等于0时,表示数据分布的扁平程度适中,即正态分布。峰度大于0时,表示数据呈扁平分布;峰度小于0时,表明数据呈尖峰分布。三、计量资料(数值变量)的统计描述菜单AnalyzeDescriptiveStatistics
Frequencies…注:具体操作制作频数表区间数据频数分段1.用recode进行频数分组2.用计算公式进行数据分组:
频数分组的标准计算公式:
频数分组结果变量=trunc(变量-最小组下限)/组距3.用可视化分组(visualbander)进行频数分段(自学)最小值和最大值四分位数间距标准差三、计量资料的统计描述报告数据库aa1调查对象BMI水平的:集中趋势算术均数中位数离散趋势将要分析的变量BMI选入变量列表三、计量资料的统计描述不要勾选“Displayfrequencytables”单击Statistics(统计量)按钮,打开对话框。(1)PercentileValues是百分位数选项栏。①Quartiles是四分位数,包括上四分位和下四分位。②Cutpointsforequalgroups是每隔指定的百分位间距输出一个百分位数的选项。③Percentiles是直接指定输出的百分位数。如指定输出位于2.5%和97.5%的变量的值。单击Statistics(统计量)按钮,打开对话框。①Mean是平均数。②Median是中位数。③Mode是众数。④Sum是总和或合计。(2)CentralTendency是集中趋势选项栏(3)Dispersion是离散趋势选项栏①Std.deviation是标准差。②Variance是方差。③Range是全距。④Minimum是最小值。⑤Maximum是最大值。⑥S.E.mean是标准误。①Skewness是偏度系数。②Kurtosis是峰度系数。(4)Distribution是分布特征选项栏
系统默认状态是不输出任何选项。如用户需要,可在上述对话框中选择。上述选项做完以后,单击Continue按钮返回频数分析对话框。其中有四种选择:①None是不生成图。这是系统默认选项。②Barchart是绘制条形图。③Piechart是绘制圆形图。④Histogram是绘制直方图。对于直方图还可以选择是否加上正态曲线(Withnormalcurve)。要选择了Histogram选项,即可激活Withnormalcurve选项。4.确定生成的图形单击“Charts”按钮,打开绘图对话框。在该对话框中有两个选项栏。(1)Charttype统计图类型选项栏。(2)Chartvalues是作图数据的选项栏。如果选择了Barchart或Piechart。便激活了Chart。①Frequencies是按频数作图。②Percentages是按百分比作图。系统默认状态是不输出图。可按自己的需要进行选择。上述选项做完以后,单击Continue按钮返回频数分析对话框。单击format按钮打开格式对话框。通过选择该对话框中的选项可以定义输出频数表的格式。5.确定输出格式①Ascendingvalues是按变量值的升序从小到大排列。这是系统默认状态。②Descendingvalues是按变量值的降序从大到小排列。③Ascendingcounts是按频数的升序从小到大排列。④Descendingcounts是按频数的降序从大到小排列。(1)Orderby是定义频数表的排列次序选项栏。(2)MultipleVariables是多变量选项栏该栏中的选项适用于用两个以上变量做频数表如果选择了两个以上变量做频数表,则选择Comparevariables(比较变量)选项,可以将它们的结果在同一个频数表中输出显示。选择Organizeoutputbyvariables(按各变量单独输出)选项,将结果在不同的输出表中显示。如果选择SuppressTableswithmorethanNcategories选项,就激活了than后面的窗口。输入的数字N是频数表分组数的最大设定。当频数表的分组数大于设定的N值时,禁止它在结果中输出,以避免产生巨型表格。系统默认状态是按变量值的升序排序,多个变量在同一个表中输出。用户可根据自己需要作选择。上述选项都确定以后,单击Continue按钮返回频数分析对话框。6.单击OK按钮,提交运行。用户可以在输出文件的Output窗口看到输出的频数分布表。Descriptives的功能是将描述统计的各个统计部分作为分析结果输出。Descriptives是对变量的统计描述,它既适用于数值变量的统计描述。四、描述统计(Descriptives)执行下述操作:Analyze→DescriptiveStatistics→Descriptives打开Descriptives对话框。Savestandardizedvaluesasvariables是将原始数据的标准分存为新变量的选项。选择该项以后,系统将以原始数据的标准分为变量内容生成一个新变量。1.打开描述统计对话框从左侧的源变量窗口中选择将要进行描述统计的变量,使之进入到Variable(s)窗口中。2.选择进行描述统计的变量单击0ptions按钮,打开对话框。该对话框中的大部分内容均在frequencies中见过。只有下方的Displayorder选项栏是新的。Displayorder是确定输出统计结果排列顺序的选项栏。当用户选择了多个变量进行描述时,在输出文件中如何排列这些统计结果,有该栏中的选项来确定。(1)Variablelist是将输出的统计结果按变量顺序列表,这是系统默认的选项。(2)Alphabetic是将输出的统计结果按字母顺序列表。(3)Ascendingmeans是将输出的统计结果按照平均值的升序顺序列表。(4)Descendingmeans是将输出的统计结果按照平均值的降序顺序列表。3.选择描述统计的内容在这个对话框中,系统默认状态是输出平均值、标准差、最大值和最小值。如需要其它的参数可以自己选择。上述选项都确定以后,单击Continue按钮返回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能售货机课程设计问题
- 数字化转型对消费行业的影响
- 工业废盐资源化利用项目建议书
- 智能卡车课程设计
- 散打基础教学课程设计
- 机床电器课程设计
- MY-11B-生命科学试剂-MCE
- 2024年农业机械化挖机购置与操作培训合同3篇
- 博途软件课程设计
- 2024年精密电子产品销售与生产合作合同版B版
- 2017电动汽车用增程器技术条件
- 一例护理不良事件分析(手术室异物遗留预防)
- 2024届江苏省苏州市八校联考高三三模语文试题
- 汽车维修结算合同范本
- 2024年国家公务员考试时事政治必考题库含答案(完整版)
- 幸福在哪里智慧树知到期末考试答案2024年
- 电化学储能电站检修规程
- 《旅游财务管理》课件-4旅游企业筹资管理
- 电力电缆试验报告
- MOOC 家具·设计·生活-北京林业大学 中国大学慕课答案
- MOOC 国际金融-江西财经大学 中国大学慕课答案
评论
0/150
提交评论