第三讲单变量描述统计_第1页
第三讲单变量描述统计_第2页
第三讲单变量描述统计_第3页
第三讲单变量描述统计_第4页
第三讲单变量描述统计_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲单变量描述统计第1页,共62页,2023年,2月20日,星期一一、SPSS统计分析功能概述1、SPSS数值分析过程2、SPSS图形分析过程第2页,共62页,2023年,2月20日,星期一1、SPSS数值分析过程DescriptiveStatistics

Comparemeans

Generallinearmodel

CorrelateRegressionLoglinearClassifyDatareductionScaleNonparametrictests

SurvivalMultipleresponse第3页,共62页,2023年,2月20日,星期一2、SPSS图形分析过程专门作为一章讲授第4页,共62页,2023年,2月20日,星期一基本统计分析功能包括:1、报告分析(Report)2、描述性统计分析(DescriptiveStatistics)二、基本统计分析功能第5页,共62页,2023年,2月20日,星期一(一)报告分析(Report)1、OLAP在线分析处理过程2、CaseSummaries观测值摘要分析过程3、摘要报告分析过程(1)ReportSummariesinRows行形式摘要报告(2)ReportSummariesinColumn

列形式摘要报告第6页,共62页,2023年,2月20日,星期一按Analyze—Reports—OLAPCubes顺序单击打开如下对话框:摘要变量框:进入此框变量为数值型变量分层变量框:进入此框变量为数值型或字符型变量1、OLAP(在线分析处理过程)第7页,共62页,2023年,2月20日,星期一可选择的统计量:Sum总和NumberofCases观测量数目Mean均值StandardDeviation标准差PercentofTotalSum占总和的百分比PercentofTotalN占观察量总数的百分比Medina中位数GroupingMedian分组中位数Std.ErrorofMean均值标准误Minimum最小值Maximum最大值Range范围First首值Last尾值Variance方差Skewness偏度Std.ErrorofSkewness偏度的标准误Kurtosis峰度Std.ErrorofKurtosis峰度的标准误HarmonicMean调和均数GeometricMean几何均数第8页,共62页,2023年,2月20日,星期一标题对话框输入统计量的标题

输入注解,这些注解将显示在统计量输出栏的下面请看演示分析第9页,共62页,2023年,2月20日,星期一30名少儿身高数据第10页,共62页,2023年,2月20日,星期一1、操作步骤:1)按Analyze—Reports—OLAPCubes顺序单击打开OLAPCubes对话框2)打开数据文件“少儿身高.sav”,将height变量选入SummaryVariable框中,将sex变量作为分组变量选入GroupingVariable框中;3)单击Statistics按钮,在Statistics框中选择Sum、Mean、Median项作为要输出的统计量;4)单击Title按钮,在Title框中输入“少儿身高分层报告”,单击Continue返回;单击OK2、输出结果及分析第11页,共62页,2023年,2月20日,星期一表4-3观测量摘要

表4-2说明观测量的一些基本情况,包括总个数、有效值个数和缺省值个数。表4-3是分层报告,输出了总和、均值和中位数。第12页,共62页,2023年,2月20日,星期一2、观测值摘要分析过程一、主要功能

计算指定变量的分组统计量,分组变量可能是一个,也可以有多个。如是多个,则将所有水平进行交叉组合。每个组中,变量值可以显示或不显示。二、观察值摘要分析1)按Analyze—Reports—CaseSummaries顺序单击打开CaseSummaries对话框。第13页,共62页,2023年,2月20日,星期一可在参数框中输入数值,该数值表示分析过程只对前几个观测值进行带有缺省值的观测值不被显示在列出观测值的同时,显示观测值的序号可选择一个或多个变量进入此框分组变量可是数值型或短字符型变量。图4-5SummarizeCASES对话框见图4-62、观测值摘要分析过程第14页,共62页,2023年,2月20日,星期一输入脚注在输出结果中显示各分组统计量的标题在分析过程中剔除带有缺失值的观测量键入一个字符以便在输出结果中标记缺失值输入标题三、例题分析:

将表4-1资料(数据文件为“少儿身高.sav”)进行观测值摘要分析。Options对话框第15页,共62页,2023年,2月20日,星期一

1)打开CaseSummaries对话框2)打开数据文件“少儿身高.sav”,将height变量选入Variable框中,作为摘要分析的变量,将sex和grade变量选入grouping框中作为分组变量。3)清除Displaycases复选框。4)单击Statistics按钮,在Statistics框中选择Numberofcases、Mean、Median项作为要输出的统计量;单击Continue返回。5)单击OK1、操作步骤第16页,共62页,2023年,2月20日,星期一表4-4观测量处理摘要

表4-4说明观测量的总个数、有效值个数和缺省值个数以及各占的百分比。2、输出结果及分析第17页,共62页,2023年,2月20日,星期一分组统计量

表4-5分三部分,1、男生的基本统计量,2、女生的基本统计量3、男女生的基本统计量,每部分包括分年级进行的统计和总的统计,这就是交叉分组。第18页,共62页,2023年,2月20日,星期一一、主要功能把观测量的统计结果用一种简单扼要的表格打印出来有助于更好的把握数据特征。二、行形式摘要报告1)按Analyze—Reports—ReportSummariesinRows顺序,打开SummariesinRows对话框。3、摘要报告分析过程第19页,共62页,2023年,2月20日,星期一将要分析的变量选入此框,每选一个变量进入框内,则需单击Format按钮,打开Format对话框,设置该变量输入格式。进入该框中的变量作为分组变量,可有多个。选中变量后激活Summary、Options、Layout、Titles。输出一个单独的观测量列表。只输出报告的第一页SummarizeinRows对话框第20页,共62页,2023年,2月20日,星期一输入变量的列标题,不输入则将输出变量的标签或名称选择列标题对齐的方式选择变量值所处的位置以缩进的形式输出,可输入缩进数值;变量值位于列中央键入列宽数值,如不设列宽,则:如输出数值标签,则列宽为数值标签中的最长者;如输出变量值,则列宽为变量所定义的宽度;如设置了列标题,则列宽为标题的最长者;如未设置列标题,则列宽为输出的变量标签的最长者;选择输出的内容:将输出变量值将输出变量标签Format对话框第21页,共62页,2023年,2月20日,星期一输出列变量之和。输出列变量的均值。输出列变量中的最小值。输出列变量中的最大值。输出列变量中观测量的数目。输出列变量中高于Value框中设定值的观测量占总数的百分比输出列变量中低于Value框中设定值的观测量占总数的百分比输出列变量中位于Low和Hight框中设定值的观测量占总数的百分比输出标准差。输出输出峰度。输出方差。输出偏度。Summary对话框第22页,共62页,2023年,2月20日,星期一Report栏的Option对话框进行缺失值和输出页码的设置:剔除带有缺失值的观测量输入一个代表系统的和用户的缺失值字符设置报告的起始页码可进行页面设置:可输入分组变量间的间距行数(不超过20)每个分组变量都在新的一页输出在新的一页输出下一个分组变量,并接着上一页的页码输出下一页的页码输入设置分组标题和报告内容之间的间距,最多可插入20行空白BreakColumn中的Options对话框第23页,共62页,2023年,2月20日,星期一所输数值表示报告的每一页输出从第几行开始所输数值表示报告的每一页输出在第几行结束规定每一页输出的左边间距规定每一页输出的右边间距选择报告输出内容的对齐方式设置页面的标题、脚注和页面的距离:设置标题与报告的距离设置注脚与报告的距离决定分组变量显示的位置:所有的分组变量值均位于第一列,激活Indentaneachbreak参数框在此框中设置分类变量值缩进的位置。默认为2空格设置列标题的输出格式:在标题下添加下划线设置列标题下的空白行(默认为2)选择列标题的对齐方式设置分组变量的显示位置:显示在统计量的上一行显示于统计量的同一行,并覆盖统计量标题设置分组变量与统计量之间的空白行数Report栏的Layout对话框第24页,共62页,2023年,2月20日,星期一按Next进入下一行的设置,按Previous返回上一行对齐方式选择特殊变量的值作为标题与注脚在此对话框可规定标题与注脚的输出内容和格式,可设置最多10行Report栏的Titles对话框第25页,共62页,2023年,2月20日,星期一三、列形式摘要报告列形式与行形式摘要报告不同在于,行变量为分组变量值,列变量为进行分析的变量。按Analyze—Reports—ReportSummariesinColumn顺序,打开SummariesinColumn对话框。第26页,共62页,2023年,2月20日,星期一

SummariesinColumn对话框

将要分析的变量选入此框,每选一个变量进入框内,则需单击Format按钮,打开Format(见下图)对话框,设置该变量输入格式。第27页,共62页,2023年,2月20日,星期一1、DataColumns栏1)Summary对话框与行形式基本同,不同是只能选择一个统计量2)Format对话框与行形式同3)InsertTotal按钮按Summary按钮,出现Summary对话框InsertTotal按钮的Summary对话框选择要计算和的变量将其移入右边变量框,至少挑选2个变量。在SummariesinColumn对话框中单击InsertTotal按钮,新增Total变量,第28页,共62页,2023年,2月20日,星期一

1)Options对话框2)Format对话框与“行形式”同3)SortSequence拦:确定分组变量升降排序规则4)Dataarealreadysorted复选框,已将分组变量排序BreakColumns栏中的Options对话框显示每一类分组变量小计结果,在Label框中键入分组变量的标签在此栏中设置页面:输入不超过20分组变量间的间距行数每个分组变量都在新的一页输出在新的一页输出下一个分组变量,并接着上一页顺序编写页码在此栏中设置小计前的空白行数第29页,共62页,2023年,2月20日,星期一3、Preview复选框:只输出报告的第一页,便于用户预览4、Report栏Options如下图Layout对话框与“行形式”同Titles对话框与“行形式”同Options对话框在每一页的底部显示该列的总和,在Label框中键入标签剔除带有缺失值的观测量输入一个代表系统和用户的缺失值的字符设置报告的起始页第30页,共62页,2023年,2月20日,星期一将表4-1资料(数据文件“少儿身高.sav”)进行分析:先做行形式报告输出,再做列形式报告输出。1、单个分组变量的行形式报告按Analyze—Reports—ReportSummariesinRows顺序,打开SummariesinRows对话框。挑height变量进入Data框,grade变量进入Break框。单击BreakColumns栏的Summary按钮,打开SummaryLinesforgrade对话框,选中SumofValues、NumberofCases复选框,再按Continue返回SummariesinRows对话框。选中Displaycases复选框。单击Titles按钮,打开Titles对话框,在标题栏的Center框中输入标题“少儿身高分组统计”,再按返回。单击“OK”完成,输出结果见表4—6。三、例题分析第31页,共62页,2023年,2月20日,星期一观测量分组报告少儿身高分组统计年级身高

四年级121.40134.10135.80135.50133.40140.30120.90141.40Mean132.85N8五年级131.50132.60140.40137.40128.20129.00129.30132.70130.10139.70133.00124.00138.80138.60MEAN133.24N14六年级129.20136.00132.20140.90136.70137.50125.40137.50Mean134.42N8列出了按年级分组后的观测量表第32页,共62页,2023年,2月20日,星期一打开SummariesinRows对话框,挑height变量进入Data框,sex、grade变量进入Break框。选中Break栏中的sex变量,单击Summary按钮,打开SummaryLinesforsex对话框,选中MeanofValues、NumberofCases、MinimumValue和MaximumValue复选框,再按Continue返回。选中Break栏中的grade变量,单击Summary按钮,选中MeanofValues、NumberofCases复选框,再按Continue返回。单击“OK”完成,输出结果见表。2、两个分组变量的行形式报告第33页,共62页,2023年,2月20日,星期一

少儿身高分组统计性别年级身高

男四年级Mean131.70N4五年级Mean132.63N7六年级Mean134.57N4Mean132.90Minimum121.40Maximum140.90N15女四年级Mean134.00N4五年级Mean133.84N7六年级Mean134.27N4Mean134.00Minimum129.90Maximum141.40N15GrandTotalStd.Dev5.70Ketosis.29Skewness.63表分为3部分:1.男生统计量表:各年级的均值和个数,全体男生的均值、个数、最大值和最小值;2.女生统计量表:各年级的均值和个数,全体女生的均值、个数、最大值和最小值;3.全体的统计量:标准差、偏度和峰度。多分组统计量(行形式)第34页,共62页,2023年,2月20日,星期一3、两个分组变量的列形式报告打开SummariesinColumns对话框,挑height变量进入Data框,单击Summary按钮,选中MeanofValues,再按Continue返。先后挑选sex、grade变量进入Break框。单击Report栏中的Options对话框,选中Displaygrandtotal复选框,再按Continue返回。单击Titles按钮,打开Titles对话框,在标题栏的Center框中输入标题“少儿身高分组统计”,再按Continue返回。单击“OK”完成,输出结果见下表。第35页,共62页,2023年,2月20日,星期一

少儿身高分组统计Page身高性别年级Mean________________________男4133.45131.36134.6女5134.0GrandTotal133.5表分为3部分:1.男生的均值表,按各年级算出均值;2.女生的均值表,按各年级算出均值;3.全体的均值。多分组均值表(列形式)第36页,共62页,2023年,2月20日,星期一(二)描述性统计分析(DescriptiveStatistics)1、Frequencies频数分析表2、Descriptive描述性统计分析过程3、Explore探索分析过程第37页,共62页,2023年,2月20日,星期一1、频数分析表一、主要功能可对数据按组进行归类整理,形成变量不同水平的频数分布表和图形,对数据的分布趋势进行初步分析。二、频数分析1)按Analyze—DescriptiveStatistic—Frequencies顺序,打开Frequencies对话框如图。第38页,共62页,2023年,2月20日,星期一选择一个或多个变量右移入Variable(s)框。按Statistics按钮,打开Statistics对话框显示频数分布表按Chart按钮,打开Chart对话框按Format按钮,打开Format对话框Frequences主对话框第39页,共62页,2023年,2月20日,星期一

输出百分位数:输出四分位数,显示25%、50%、75%的百分位数;将数据平均分为所设定的相等等份,可输入2—100的整数,如键入4则输出第25、50、75百分位数自定义百分位数,可输入0—100的整数。输入值后:按Add:输入值后按此键,可反复操作键入多个百分位数;按Remove:删除已键入的数值按Change:重新输入新数离差栏分布参数栏在计算百分位数值和中位数时,假设数据已分组,且用各组的组中值代替各组数据中心趋势栏输出统计量对话框第40页,共62页,2023年,2月20日,星期一Chart对话框不输出任何图形,为默认输出条形图,各条高度代表变量各分类的频数输出圆图,圆图中各块的数值表示各分类变量的频数输出直方图,此图仅适用于区间型数值变量。选择此项后,还可选择Withnormalcurve,画出的直方图带有正态曲线只有选择了条形图和圆图项才有效,决定纵轴表示的统计量纵轴表示频数图纵轴表示百分比第41页,共62页,2023年,2月20日,星期一Format对话框控制频数表输出的分类数量。默认为10多变量框中可设定多变量表格输出的格式设置频数表输出的格式选择频数表中排列顺序按变量升序排列,此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列第42页,共62页,2023年,2月20日,星期一表4—9100名大学生血清蛋白含量(%)三、例题分析对某高校100名大学生血清蛋白含量(g%)做频数分析,数据如表4—9第43页,共62页,2023年,2月20日,星期一1、具体步骤按Analyze—DescriptiveStatistic—Frequencies顺序,打开Frequencies对话框。打开数据文件“大学生血清.sav”,挑xdh变量进入Variable框,grade变量进入Break框。选中Displayfrequencytables复选框,要求输出频数分布表。单击Statistics按钮,选择要输出的统计量。单击Chart按钮,选择Histogram项,输出直方图,并选择Withnormalcurve复选框,输出正态曲线。单击Format按钮,选Ascending项。单击“OK”完成。2、输出结果及分析结果如下表、图第44页,共62页,2023年,2月20日,星期一血清蛋白含量的直方图

血清蛋白含量的统计表第45页,共62页,2023年,2月20日,星期一血清蛋白含量的频数分布表第46页,共62页,2023年,2月20日,星期一一、主要功能:调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等,并可将原始数据转换成Z分数。二、描述统计量分析按AnalyzeDescriptiveStatisticsDescriptives顺序单击,打开Descriptives主对话框。如图选一个或多个变量移入如选中此框,将对Variables框中选择的变量进行标准化产生相应的Z分值,并作为新变量保存到数据窗口,其变量名在原变量名前加z。Descriptive对话框2、描述性统计分析过程第47页,共62页,2023年,2月20日,星期一Options对话框

基本统计量当Variables框中有多个变量时,此框确定其输出顺序:按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列分布三、例题分析

已知20个初生婴儿的体重数据如下表,对其进行描述统计。第48页,共62页,2023年,2月20日,星期一2770291527952995286029703087312631254654227235034218341839212669370723102573388120个初生婴儿的体重(g)1、操作步骤:打开数据文件“婴儿体重.sav”。打开Descriptives主对话框,选定变量t进入Variable栏中。选中Savestandardizedvaluesasvariables复选框,要求计算变量的z值,并保存结果到当前数据集中。单击Options按钮,选中Mean、Std.Deviation、Minimum、Maximum、Variance项。2、输出结果及分析第49页,共62页,2023年,2月20日,星期一婴儿体重的描述统计量这时打开原数据集,可看到多了一列zt,这是t的z分数,如下图所示:保存了z分数的数据集第50页,共62页,2023年,2月20日,星期一一、主要功能:调用此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探索分析过程将提供在分组和不分组的情况下常用的统计量与图形。二、探索分析按Analyze--DescriptiveStatistics--Explore顺序单击,打开Explore主对话框。如图3、探索分析过程第51页,共62页,2023年,2月20日,星期一选择一个或多个变量进入Dependent框作为因变量,单击OK可获得因变量的一系列基本统计量和图形。此作为分组变量,可以是字符变量,对因变量的分析将按该变量的观测值进行分组分析。可有多个分组变量,这时会按多个变量的交叉组合进行分组。该框中的变量作为标识符,在输出诸如异常值时,用该变量进行标识,只允许有一个标识符。可同时输出基本统计量和图形只输出基本统计量只输出图形Explore主对话框第52页,共62页,2023年,2月20日,星期一输出基本统计量均值的置信区间,可键入1—99%的任意值,根据该值算出置信区间的上下限。给出中心趋势的最大拟然比的稳健估计量,当数据分布均匀,且两尾较长,或当数据中存在极端值时,可给出比均值或中位数更合理的估计。输出最大和最小的5个数,且在输出窗口中加以标明。输出5%、10%、25%、50%、75%、90%和95%的百分位数。Statistics对话框第53页,共62页,2023年,2月20日,星期一只有指定分组变量才有效,可输出分布—水平图,同时输出回归直线斜率以及对方差的Levene’s检验不输出分布—水平图对每组数据产生一个中位数与四分位范围的自然对数散点图,同时在满足每组中数据方差相等的条件下对数据进行幂变换的估计。根据在Power参数框中指定的变换对原始数据进行变换。不对数据进行转换Explore栏中Plots对话框在此对话框中可选择要输出的统计图形及其参数。只有在主对话框中指定了一个以上变量时,Boxplot栏才有效。在该栏选择盒形图的输出方式:每一个因变量生成一个盒形图所有因变量生成一个盒形图不显示任何盒形图生成茎叶图,为默认生成直方图输出正态概率和离散正态概率图,同时输出K-S统计量中的Liliefors显著水平检验,如果观测数不超过20,将用W-S统计量代替K-S。第54页,共62页,2023年,2月20日,星期一确定缺失值的处置:因变量或分组变量中带有缺失值的观测量都将在分析过程中被剔除。在分析过程中根据分组变量产生的组中带缺失值的观测量都将被剔除。分组变量的缺失值被单独分为一组,输出频数时将标出缺失组。Explore栏中Options对话框三、例:下表为30名10岁少儿的身高(cm)数据,对其进行探索分析编号身高编号身高编号身高男女男女男女1131.5132.76135.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论