描述性统计分析_第1页
描述性统计分析_第2页
描述性统计分析_第3页
描述性统计分析_第4页
描述性统计分析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

描述性统计分析4、1描述统计量常见得描述性统计量主要包括以下3类:描述变量集中趋势得统计量、描述变量分布情况得统计量、描述变量离散程度得统计量。通常,综合这三类统计量就能够极为准确与清晰得把握数据得分布特点。

描述变量集中趋势得统计量:均值Mean:表示变量值得平均水平中位数Median:一组数据中处于最中间位置得数众数Mode:一组数据中出现次数最多得数与Sum:某变量得所有变量值之与描述变量分布情况得统计量偏度Skewness:描述变量分布得对称程度与方向。偏度为0表示对称,大于0表示右偏,小于0表示左偏峰度Kurtosis:描述变量分布得陡峭程度。峰度为0表示陡峭程度与正态分布相同,大于0表示比正态分布陡峭,小于0表示比正态分布平缓描述变量离散程度得统计量标准差Std、deviation:描述变量关于均值得偏离程度方差Variance:标准差得平方极大值Maximum:某变量所有取值得最大值极小值Minimum:某变量所有取值得最小值全距Range:某变量极大值与极小值之差均值得标准误差S、E、mean:均值得标准误差在描述性统计分析中,Descriptives过程就是连续资料统计描述应用最多得一个过程,她可对变量进行描述性统计分析,计算并列出一系列相应得统计指标。【界面介绍】⑴选择菜单【Analyze】→【DescriptiveStatistics】→【Descriptives】,进入基本描述性统计量得分析界面,出现如图所示得窗口。⑵在Variables(s)框定义要分析得数值型变量,可同时选择多个变量。⑶若需将原始数据得标准正态评分存为新变量,则选择Savestandardizedvaluesasvariables选项。⑷单击【Options】按钮指定计算哪些基本描述性统计量,出现如图所示得窗口。【实验案例】例4-1测量20台液晶显示器得重量,数据见4-1-1、sav,对其进行描述性统计分析。4、2频数分布表分析频数分析统计得就是每一组中观测点得个数,而不就是考虑其实际取值。通过频数分析能够了解变量取值得情况,对于把握数据得分布特征非常有用。当某变量得自然取值就是局限在有限得几个数值中,则频数分析就就是统计该变量在各个取值点得个数分布情况;如果某变量得取值就是在某范围内得离散值,则需要将其取值区域划分为几个取值区间,频数分析就就是统计该变量在各个取值区间观测点个数得分布情况。大家有疑问的,可以询问和交流可以互相讨论下,但要小声点【界面介绍】⑴ 选择菜单【Analyze】→【DescriptiveStatistics】→【Frequencies】,进入频数分析得分析界面,出现如图所示得窗口。⑵将若干频数分析变量选择到Variables(s)框中;选择Displayfrequencytables复项表示在结果中输出频数表。⑶单击【Statistics】按钮后弹出Statistics子对话框。⑷单击【Charts】按钮后弹出Charts子对话框。⑸单击【Format】按钮,弹出Format子对话框。该对话框用于定义输出频数表得格式,在实际中,我们一般采用默认格式。例4-2已知有某地110名10岁女生身高数据,数据见文件4-2-1、sav,请编制频数表。4、3探索性分析Explore过程可对变量进行更为深入详尽得描述性统计分析,主要用于对资料得性质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指标得基础上,增加有关数据其她特征得文字与图形描述,如茎叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析得方案。

【界面介绍】⑴选择菜单【Analyze】→【DescriptiveStatistics】→【Explore】,进入探索性分析界面,出现如图所示得窗口。(2)单击【Statistics】按钮,弹出Statistics子对话框,如图所示。该项用于选择所需要得描述统计量。(3)单击【Plots】按钮,弹出Plots子对话框。该项用于选择所需要得统计图。(4)单击【Options】按钮,在弹出得子对话框中选择对缺失值得处理方式,可以就是不分析有任一缺失值得记录(Excludecaseslistwise)、不分析计算某统计量时有缺失值得记录(Excludecasespairwise),或报告缺失值(Reportvalues)。例4-3已知有某地城市与农村各55名10岁女生身高数据,数据见文件4-2-1、sav,请利用Explore过程分组分析。4、4列联表分析通过频数分析能够掌握单个变量得数据分布情况。在实际分析过程中,不仅要了解单变量得分布特征,还要分析多个变量不同取值下得分布,掌握多变量得联合分布特征,进而分析变量之间得相互影响与关系。当问题涉及多个变量时,采用单纯得频数分析方法显然不够,这时,我们需要借助交叉分组下得频数分析,又称为列联表分析。列联表分析得主要任务有两个:第一,根据收集到得样本数据,产生二维或多维交叉列联表。交叉列联表就是两个或多个以上变量交叉分组后形成得频数分布表。第二,在交叉列联表得基础上,分析两两变量之间就是否具有独立性或一定得相关性。对交叉列联表中得行变量与列变量之间关系进行分析就是列联表分析得第二个任务。在列联表基础上做进一步分析,可以得到行变量与列变量之间就是否有联系、联系得紧密程度如何等更深层次得信息。【界面介绍】⑴选择菜单【Analyze】→【DescriptiveStatistics】→【Crosstabs】,进入列联表分析界面。【实验案例】例4-4调查339名45岁以上吸烟习惯与患肺癌得关系,数据见4-4-1、sav。试问吸烟者与不吸烟者患肺癌得概率就是否有所不同。

4、5相对比描述相对比描述用于对两变量间变量值对比变化得描述分析,适用于定距型变量。在实际问题中,研究者有时除了希望了解变量自身得统计特征外,还希望得到两个变量相对比之间得统计描述。通常,这可以通过对两个变量做除法形成一个新变量,然后分析新变量得统计特征来得到(如均值、中位数、标准差、全距等)。SPSS得Ratio过程除了能够完成上述分析外,还提供了其她相对比描述指标,大致属于集中趋势描述指标(CentralTendency)与离散程度描述指标(Dispersion)得范畴。

指标得具体含义如下:加权比例均值(Weightedmean)加权比例均值属于集中趋势描述指标,就是两变量均值得比。平均绝对离差(AAD,AverageAbsoluteDispersion)AAD用于对比率变量离散程度得描述。式中,就是比率数,M就是比率变量得中位数。离散系数(COD,CoefficientofDispersion)COD也用于对比率变量离散程度得描述,其数学定义为:相关价格微分(PRD,Price-relatedDifferential)PRD也用于对比率变量离散程度得描述,就是比率均值与加权比率均值得比。

变异系数(COV,CoefficientofVariation)COV用于对比率变量离散程度得描述,分为基于均值得变异系数(MeancenteredCOV)与基于中位数得变异系数(MediancenteredCOV)。基于均值得变异系数就是通常意义下得变异系数,就是标准差除以均值;基于中位数得变异系数数学定义为:【界面介绍】⑴选择菜单【Analyze】→【DescriptiveStatistics】→【Ratio】,进入比率分析界面,出现所示得窗口。⑵将相对比中作分子得变量选入Nume

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论