版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 SPSS的基本统计分析,基本统计分析,频数分析 计算基本描述统计量(分布特征测度) 图形分析工具 列联分析,频数分析,目的 粗略把握变量值的分布状况。 例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况) 采用的方法 计算频分布表:包括计算 频数、累计频数、百分比、累计百分比 绘制统计图形:条形图、饼图,频数分析,基本操作步骤 (1)菜单选项:analyze-descriptive statistics-frequencies (2)选择几个待分析的变量到variabl
2、es框. (3)chart选项,选择所需要的图形,频数分析,频数分析中的其他分析 计算分位数:适用于定距数据 数据按升序排序后,找到若干个分位点上的变量值 quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU) cut points for n equal groups:n等份 percentile:自定义百分位点 分位数的应用 在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较,计算描述统计量,目的 精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭
3、程度。 基本方法 计算基本描述统计量,计算描述统计量,描述集中趋势的统计量 均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。 适用于定距数据。 特点:利用了全部数据,易受极端值的影响。 描述离散程度的统计量 标准差(standard deviation-Std Dev):表示某变量的所有变量值离散程度的统计量。 SPSS中计算的是样本标准差。 方差(variance):标准差的平方。 SPSS中计算的是样本方差。 极差 (range):最大值(maximum)最小值(minimum),计算描述统计量,描述对称程度的统计量 偏度(skewness):描述某变量分布形态的偏斜程度
4、和方向的统计量. 偏度为0表示对称; 大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值; 小于0表示负偏差大(左偏)。,计算描述统计量,描述陡峭程度的统计量 峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。 峭度为0表示与标准正态分布峭度相同。 大于0表示比标准正态分布陡,尖峰。 小于0表示比标准正态分布缓;平峰。,计算描述统计量,其他统计量 标准误差(standard error S.E):抽样分布中的标准差,反映样本误差。 均值标准误差(means of S.E) 中心极限定理认为:样本均值N(u,2/n) 反映样本均值与总体真值间的平均离散程度 样本
5、数越大,样本均值的离散程度越小,对真值的估计越准确,计算描述统计量,基本操作步骤 (1)菜单选项:analyze-descriptive statistics-descripive (2)选择将参加计算的数值型变量名到variables框。,其他功能 数据标准化处理 新变量的均值为0,标准差为1; 小于0表示在平均水平下,大于0反之. 正态分布的数据标准化后呈标准正态分布(68.2%,95.4%,99.7%) save standardized values as variables选项 将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.,计算描述统计量,交叉分组下的频数分析,目的 了
6、解不同变量在不同水平下的数据分布情况 例:学习成绩与性别有关联吗?(两变量) 例:职业、性别、爱逛商店有关联吗?(三变量) 分析的主要步骤 产生交叉列联表 分析列联表中变量间的关系,产生交叉列联表,什么是列联表,列变量,行变量,地区,控制变量,频数,产生交叉列联表,基本操作步骤 (1)菜单选项: analyze-descriptive statistics- crosstabs (2)选择一个变量作为行变量到row框. (3)选择一个变量作为列变量到column框. (4)可选一个或多个变量作为控制变量到layer框. 控制变量的层次设置:同层为水平数加;不同层为水平数积. (5)是否显示各分
7、组的棒图(display clustered bar charts ),产生交叉列联表,进一步计算 cells选项:选择在频数分析表中输出各种百分比. row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);,分析列联表中变量间的关系,目的: 通过列联表分析,检验行列变量之间是否独立。 方法: 卡方检验:对品质数据的相关性进行度量,分析列联表中变量间的关系,卡方检验 年龄与工资收入交叉列联表 低 中 高 青 400 00 中 0 5000 老 0 0600 低 中 高 青 0 0500 中 0 6000 老 400 00,分析列
8、联表中变量间的关系,卡方检验基本步骤 (1)H0:行列变量之间无关联或相互独立 (2)构造卡方统计量 统计量服从(r-1)*(c-1)个自由度的卡方分布 count:观察(实际)频数 expected count:期望频数 (期望频数反映的是H0成立情况下的数据分布特征) Residual:剩余 (观察频数-期望频数),分析列联表中变量间的关系,卡方检验基本步骤 (3)计算卡方统计量的值,并得到该统计量值的概率P值 (4)决策。概率P与显著性水平比较,小于等于则拒绝H0,否则不能拒绝 实现步骤 statistics选项 cells选项,分析列联表中变量间的关系,卡方检验的要求: 一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以合并单元格。 卡方值会受样本数的影响,多选项分析,多选项分析的基本思路 定义多选项变量集 多选项频数分析 多选项交叉分组下的频数分析,多选项分析,定义多选项变量集 目的:将已分解的变量定义为一个集合,便于进行多选项分析 菜单选项:analyze-multiple response-define sets 从原变量中选取被分解的变量(数值型)到variables in sets框 指定被分解的变量是按多选项二分法(dichotomize)分解还是按多选项分类法(categori
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度20XX离婚协议书撰写与婚姻家庭法律援助合同3篇
- 2025版建筑工程转包与环境保护责任协议3篇
- 二零二五年度人工智能教育项目个人众筹投资协议3篇
- 舞蹈专业系统课程设计
- 语文课程设计规划
- 电子手表设计课程设计
- 自动搅拌机课程设计
- 桥梁悬臂施工法课程设计
- 个人信息安全协议与数据保护免责声明
- 企业MES系统开发协议
- 水泥行业数字化转型服务方案
- 深圳市南山区2024-2025学年第一学期期末教学质量检测九年级物理 24-25上九年级物理
- 应急设施设备和物资储备管理制度(4篇)
- 团委书记个人工作总结
- 高危多发性骨髓瘤诊断与治疗中国专家共识(2024年版)解读
- 英语语法与长难句理解知到智慧树章节测试课后答案2024年秋山东石油化工学院
- 2025年新高考语文古诗文理解性默写(含新高考60篇)
- 中医内科学虚劳培训课件
- DB31-T 1477-2024 空间地理数据归集技术要求
- 2024版房屋市政工程生产安全重大事故隐患判定标准内容解读
- 江苏省镇江市实验学校2023-2024学年九年级上学期期末考试化学试卷
评论
0/150
提交评论