《SPSS统计基础》PPT课件.ppt_第1页
《SPSS统计基础》PPT课件.ppt_第2页
《SPSS统计基础》PPT课件.ppt_第3页
《SPSS统计基础》PPT课件.ppt_第4页
《SPSS统计基础》PPT课件.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,专业基础课,SPSS统计分析基础,SPSS的统计描述,对应课本 第4章,第4章 SPSS的统计描述,2020年9月11日星期五,主要内容,连续变量的统计描述与参数估计 概述:统计学知识回顾菜单介绍 集中趋势指标 离散趋势指标 SPSS应用实例 分类变量的统计描述与参数估计 概述 常用指标分析实例 多选题统计描述 统计表的制作:basic tables,第4章 SPSS的统计描述,2020年9月11日星期五,基本概念再复习,总体(population)与样本(sample) 总体:根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。 样本:是从总体中抽取的部分个体 由于

2、直接研究总体经常是不可能的,故而大多采用抽样研究,即通过抽取样本来推断总体统计推断,第4章 SPSS的统计描述,2020年9月11日星期五,基本概念再复习,参数和统计量 参数:刻画总体特征的指标称为总体参数。 用来确定某一分布的特征;如总体均数,总体阳性率 往往是未知的 统计量:刻画样本特征的指标称为统计量。由观察资料计算出来的量;可以用来近似的反映总体参数 统计的任务:由样本估计总体,由样本统计量估计总体参数,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 变量级别的数据管理,第4章 SPSS的统计描述,2020年9月11日星期五,基本概念再复习,变量类型 连续型变量(定距型

3、)-取值范围是一个区间,连续取值 离散型变量-取值范围是有限个值或一个数列构成。 表示分类情况的离散型变量又称为分类变量:,第4章 SPSS的统计描述,2020年9月11日星期五,基本概念再复习,无序变量(名义型):两分类和多分类如血型,也可用数字进行编码,但没有大小关系。 有序变量(定序型):取值为互不相容的类别, 而且在研究背景下有等级顺序,如疗效(无效、 有效、显效),第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,(一)频数表Frequency 直观的方法:分布类型分布特征 看出集中趋势与离散趋势 发现特大与特小值 便于进一步计算统计指标和做统

4、计处理,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,(二)统计指标 集中趋势Central tendency 均数mean 几何均数G 中位数median 众数mode 离散趋势Dispersion tendency 全距Range 方差Variance 标准差std.deviation 变异系数CV,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,(二)统计指标 百分位数 适用于各种分布 分布指标Distribution 偏度系数Skewness 正态峰正偏态负偏态峰度系数Kurtosis 正态峰平阔峰尖

5、峭峰 其他在SPSS中出现的指标 M-estimators的四个指标 Outlier,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,(三) 统计表 (四)统计图 直方图(Histogram) 箱式图(boxplot) 茎叶图(stem-and-leaf) QQ图,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,连续变量的指标体系 集中趋势指标 离散趋势指标 分布特征:偏度峰度 其他趋势:百分位数指标M统计量,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标

6、 算术平均数(arithmetic mean) 简称均数(mean),有总体均数和样本均数之分 适用于对称分布,特别是正态分布的资料,不适用于偏态分布的资料,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标 中位数是一组观察值的位置平均数, 用于描述偏态分布资料的集中位置,它不受两端特大、特小值的影响,当分布末端无确切数据时也可计算。,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标 截尾均数(trimmed mean) 数据排序后按照一定比例去掉两端的数据求均数 适用于两端有极端值的资

7、料 常用5截尾均数,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标 几何均数(geometric mean ,G) 适用于呈倍数关系的等比资料或对数正态分布的资料,尤其是对数正态分布的计量资料 应用中应注意观察值不能同时有正有负 同一资料算得的几何均数小于算术均数,第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标 几何均数(geometric mean ,G),第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标 几何均数(geomet

8、ric mean ,G),第4章 SPSS的统计描述,2020年9月11日星期五,第一节 连续变量的统计描述的工具,集中趋势指标 众数(mode) 样本数据中出现频次最高的数字 适用于单峰对称的数据,反映出现频次最高的数据情况 调和均数 观察值倒数的均数的倒数,较少使用,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,离散趋势指标 3组同龄男孩体重(KG)如下 甲组26 28 30 32 34 乙组24 27 30 33 36 丙组26 29 30 31 34 均数相等,但各组差异不同,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势

9、的描述指标,离散趋势指标 3组同龄男孩体重(KG)如下 甲组26 28 30 32 34 乙组24 27 30 33 36 丙组26 29 30 31 34 均数相等,但各组差异不同,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,离散趋势指标 对连续变量的描述,需要将集中趋势和离散趋势结合起来,才能对其分布有全面的认识。 描述离散趋势的指标常用的有: 全距、四分位数间距、方差、标准差和变异系数等指标,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,全距(Range ,R )又称极差,即最大和最小观察值之间的间距,用全距描

10、述资料的离散程度简单明了, 但它不能反映观察值的整个变异度,样本的例数越多,极差越大,不够稳定。 所以在样本含量相差悬殊时不宜使用,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,方差(variance) 标准差(standard deviation) 离均差平方和(sum of squares of deviatonsfrom mean, SS)可用来描述资料的变异度。 SS的均数(即方差)不受观察值个数的影响,用来描述资料的离散程度更好。,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,实际中,得到的常是样本资料,总体

11、均数未 知,只能用样本均数代替,得到样本方差S2 n-1为自由度(degree of freedom),第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,标准差(standard deviation) 因方差的单位是原单位的平方,所以使用仍不方便。方差的算术平方根,即标准差,是一个更好的指标。 标准差也有总体标准差和样本标准差之分,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,适用范围: 方差和标准差适合于对对称分布,特别是正态分布及近似正态分布资料 标准差可用于描述变量值的离散程度,与均数结合还可描述资料的分布情况,此外

12、还可用于求参考值范围和计算标准误。,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,百分位数(percentile) 百分位数是一个位置指标,Px表示是资料分布数列的百等份分割值 用于描述样本或总体观察值序列某百分位置的水平,应用中注意,样本例数不够多时,两端的百分位数不稳定 还用于确定参考值范围(reference range),第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,四分位数间距( quartile interval) 四分位数是特定的百分位数,其中P25为下四分位数QL,P75为上四分位数Qu。 Q= Qu

13、- QL 四分位数间距比极差稳定,但仍未考虑每个观察值的变异度。 适用于偏态分布的资料,特别是末端无确切数据时,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,变异系数(coefficient of variance, CV) 当比较多组资料的变异度,均数相差悬殊时 资料的单位不同 实际上是标准差占均数的百分比例。,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,统计描述的模块 Descriptive statistics 模块 1.Frequencies过程 2. Descriptive 过程 3.Explore 过程

14、4. Ratio过程 用于两个连续变量计算相对比指标 5. Crosstabs过程 分类变量资料的统计描述 一般的统计检验(卡方检验),第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Frequencies过程 产生频数表,对连续变量和分类变量资料都适用 计算常用的统计指标和按要求给出某百分位点的数值 常用的条图,圆图等统计图。 变异系数CV需手工计算,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Frequencies过程 主对话框 Statistics 子对话框 Chart子对话框 Format子对话框,第4章 SP

15、SS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Statistics 子对话框 Percentile Values复选框组定义输出的百分位数 四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles) Central tendency复选框组定义描述集中趋势 均数(Mean) 中位数(Median) 众数(Mode) 总和(Sum)。,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Dispersion复选框组定义描述离散趋

16、势 标准差(Std.deviation) 方差(Variance) 全距(Range)、最小值(Minimum) 最大值(Maximum) 标准误(S.E.mean)。 Distribution复选框组定义描述分布特征 偏度系数(Skewness)和峰度系数(Kurtosis)。 Values are group midpoints复选框 确定输出的数据是分组频数数据,具体数值是组中值,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Descriptive 过程 进行一般性的统计描述,适用于正态分布资料 区别: 用于连续型变量 Z值的产生 主对话框 Opti

17、on子对话框,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Explore 过程 主要用于对资料的性质、分布特点等完全不清楚时 主对话框:加入分组变量 Statistics 子对话框 plot子对话框 Option子对话框,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Statistics 子对话框 Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标 准误、偏度系数、偏度系数的标准误及指定的均数可信区间。,第4章 SPSS

18、的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,Statistics 子对话框 M-estimators复选框:作中心趋势的粗略最大似然稳健估计,输出四个不同权重的最大似然估计值。 Outliers复选框:输出五个最大值与五个最小值。 Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,plot子对话框 Boxplots单选框组:确定箱式图的绘制方式 按组别分组绘制(Factor levels together), 不分组绘制(Depentends

19、 together) 不绘制(None) Descriptive复选框组: 茎叶图(Stem-and-leaf)和直方图(Histogram)。,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,plot子对话框 Normality plots with test复选框: 正态分布图和正态分布的检验。 Spread vs. Level with Levene Test单选框组: 有分组变量时,绘制水平图, 设置变量的转换方式,并进行组间方差齐性检验,第4章 SPSS的统计描述,2020年9月11日星期五,第三节 离散趋势的描述指标,例题 数据文件:问卷调查数据

20、student.sav Explore过程分析 统计描述指标 参数估计 百分位数和极端值 统计图 Frequencies过程:生成Z值 Descriptive 过程,第4章 SPSS的统计描述,2020年9月11日星期五,第四节 实例,例题 数据文件:问卷调查数据student.sav Explore过程分析 统计描述指标 参数估计 百分位数和极端值 统计图 Frequencies过程:生成Z值 Descriptive 过程,第4章 SPSS的统计描述,2020年9月11日星期五,第五节 连续变量的参数估计,正态分布,第4章 SPSS的统计描述,2020年9月11日星期五,第五节 连续变量的参数估计,正态分布,第4章 SPSS的统计描述,2020年9月11日星期五,第五节 连续变量的参数估计,正态分布 (1)当样本量越来越大, (2)并且组距越来越小时 直方条的顶缩成点并且各个直方条的顶连接成一条曲线即正态分布曲线 概率密度曲线段的面积就是相应的累计概率,频率(面积)趋向概率。,第4章 SPSS的统计描述,2020年9月11日星期五,第五节 连续变量的参数估计,正态分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论