版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1Spss数据分析
第9讲描述性分析spss2-描述性统计分析共37页,您现在浏览的是第1页!2教师信息教师:张晓黎电子信箱:zhangxiaoli@办公室:学院楼B420电话:67703854答疑:周四下午在学院楼B420spss2-描述性统计分析共37页,您现在浏览的是第2页!重点与难点理解常用的描述性统计量集中趋势:均值离散趋势:标准差分布形态:偏度、峰度理解各种图形方法对数据统计特征的描述茎叶图箱图了解假设检验spss2-描述性统计分析共37页,您现在浏览的是第3页!1.描述性统计分析概念目的通过变量的描述性统计分析,掌握和了解样本数据的统计特征和总体分布形态,进而更深入地揭示变量变化的规律。方法数据计算:计算描述性统计量的值,准确反映样本数据的统计特征。图形绘制:绘制常见的统计图形,通过图形来直观展现数据的分布特征,比较数据分布的异同。spss2-描述性统计分析共37页,您现在浏览的是第4页!2.1频数分布表取值不及格及格中等良好优秀合计取值区间0-5960-6970-7980-8990-1000-100频数1919321677百分比1.30%11.69%24.68%41.56%20.78%100.00%累计百分比1.30%12.99%37.66%79.22%100.00%100.00%频数(Frenquency):变量值落在某个区间或者某个取值点的个数。百分比(Percent):各频数占总样本数的百分比。有效百分比(ValidPercent):各频数占有效样本数的百分比。累计百分比(CumulativePercent):各百分比逐级累加起来的结果,最终取值是100。spss2-描述性统计分析共37页,您现在浏览的是第5页!示例1-频数分析对语文成绩进行分数分段统计数据文件:3-StudentScore.sav
步骤1:对“语文”成绩进行分段Transform→Recode→IntoDifferentVariables…结果保存为3-StudentScore_成绩分段.savspss2-描述性统计分析共37页,您现在浏览的是第6页!示例2-P36-频数分析中的基本描述性统计量客户满意度的频数统计分析数据文件:HBAT_200.savAnalyze→DescriptiveStatistics→Frequencies…结果保存为:HBAT_200_frequency.spospss2-描述性统计分析共37页,您现在浏览的是第7页!3.1描述集中趋势的统计量指一组数据向某一中心集中的程度,即在某一中心附近观测值数目较多,远离该中心的观测值数目较少。平均值(Mean):即算术平均值。易受极端值影响。中位数(Median):把变量的值有序排列,位于中间位置的值即中位数。是位置平均置,不易受极端值的影响。众数(Mode):样本中出现次数最多的值,代表数据的集中程度。求和(Sum):所有变量之和,反映变量的总体水平。spss2-描述性统计分析共37页,您现在浏览的是第8页!3.2描述离散趋势的统计量极差(Range)也称全距或跨度或范围,R=最大值-最小值极差不考虑最大值与最小值之间的观测值,仅仅依靠端点值来确定,因而稳定性差。最小值(Minimum)一组资料中各个观测值的最小者。最大值(Maximum)一组资料中各个观测值的最大者。均值标准误差(S.E.Mean,StandardErrorofMean,简称标准误):样本数据是从总体数据中抽取出来的。虽然在一定程度上,样本数据可以反映总体数据的特征。但在不同次抽样中所得的样本均值是不同的,并且它们与总体均值间存在差异。均值标准误差就是描述这些样本均值与总体均值之间平均差异程度的统计量。spss2-描述性统计分析共37页,您现在浏览的是第9页!示例3-P38-基本描述性统计量计算客户满意度(X19)、推荐意愿(X20)、购买意愿(X21)和购买水平(X23)的平均值、标准差、最大值和最小值。数据文件:HBAT_200.sav步骤Analyze→DescriptiveStatistics→Descriptives…结果保存为:HBAT_200_descriptives.spospss2-描述性统计分析共37页,您现在浏览的是第10页!4.探索性分析数据探索性分析,可以帮助决定选择哪种统计方法进行数据分析,有如下三方面的考察:考察数据的正确性考察数据中的一些异常值,分析这些值产生的原因,判断其正确性,再决定修改、删除或保留它们。考察数据的分布特征考察数据的正态分布特征可以为以后进行统计分析时采用正确的统计方法提供正确的依据。考察变量之间数据的相互关系变量与变量之间相关性的考察、方差齐性的考察,是一些统计分析过程必须事先了解的。spss2-描述性统计分析共37页,您现在浏览的是第11页!例4-1茎叶图绘制语文成绩的茎叶图数据文件:4-Explore.sav步骤:Analyze→DescriptiveStatistics→Explore…结果保存为:4-Explore-Stem-Leaf.spospss2-描述性统计分析共37页,您现在浏览的是第12页!奇异值和极端值奇异值:某个数据距离箱体主体边缘的距离超过箱主体高度的1.5倍,称为奇异值,在箱图中用○表示。奇异值分为上奇异值和下奇异值。极端值:某个数据距离箱体主体边缘的距离超过箱主体高度的3倍,称为极端值,在箱图中用★表示。极端值分为上极端值和下极端值。13spss2-描述性统计分析共37页,您现在浏览的是第13页!例4-2分组箱图按性别分组绘制语文成绩的箱图数据文件:4-Explore.sav步骤:Analyze→DescriptiveStatistics→Explore…选择语文-因变量,性别-分类变量Factorlevelstogether:如果有多个因变量,则分别绘制探索图Depedentstogether:如果有多个因变量,则将因变量作为整体绘制探索图结果保存为:4-Explore-BoxbyGroup.spo分析女生语文成绩整体好于男生成绩女生的奇异低值个案是7号和9号;极端高值个案是6号,奇异高值个案是8号个案。男生的奇异低值个案是14号,极端低值个案是17号;奇异高值个案是18号。spss2-描述性统计分析共37页,您现在浏览的是第14页!4.3QQ图反趋势正态概率QQ图反趋势正态概率QQ图也是以变量(语文成绩)的观测值为X轴坐标,以该变量分布的Z分数与正态分布期望值的偏差为纵坐标。水平直线为期望标准线。若观测点离线越近,表示该点越符合正态分布。反之,越不符合正态分布。spss2-描述性统计分析共37页,您现在浏览的是第15页!例4-4数据的方差齐性检验方差齐性检验样本正态性检验对不同性别的学生语文成绩进行正态性检验和方差齐性检验数据文件:4-Explore.sav步骤:Analyze→DescriptiveStatistics→Explore…结果保存为:4-Explore-VT.spospss2-描述性统计分析共37页,您现在浏览的是第16页!5.交叉列联表分析通过频数分析,能够掌握单个变量的数据分布情况。交叉列联表的用途交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。了解和分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。例如:不同地区和不同工作分类之间的关系交叉列联表分析的两大基本任务:根据样本数据,产生二维或多维交叉列联表在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析spss2-描述性统计分析共37页,您现在浏览的是第17页!例5-结果1分析未来3年不买房的,本市户口占95%,外地户口占房5%本市户口中,未来3年不买房的占75.7%,买房的占24.3%未来3年的买房意愿,本市户口人数相差比较大行百分比列百分比spss2-描述性统计分析共37页,您现在浏览的是第18页!例5-结果2从表中可以看出,在0.05置信度水平下,双尾检验值为0.002,小于置信度水平(0.05),因此,我们有理由认为,户籍与是否购房之间的关系显著,及不同户籍的人对于是否购房看法不一致。列联表的卡方检验用于检验两个分类变量的关联程度。spss2-描述性统计分析共37页,您现在浏览的是第19页!课堂练习与作业掌握本节所有概念和SPSS操作步骤课堂练习:中的例1-5课后作业:例6spss2-描述性统计分析共37页,您现在浏览的是第20页!2.频数分析频数分析是统计每一组中观测点的个数,而不考虑其实际取值。了解变量取值的一般特征。如,哪些数值出现的频率高?变量取值的大致范围是什么?考察数据是否符合建模所需的计量模型的假设。评估数据的质量。如,有多少缺失值或者有多少数据录入错误?形式频数分布表频数分布图spss2-描述性统计分析共37页,您现在浏览的是第21页!2.2频数分布统计图条形图(BarChart):用条形的长度表示各类别频数的多少,其宽度是固定的各矩形通常是分开排列的;主要用于展示分类数据。饼图(PieChart):直方图(Histograms):用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距;由于分组数据具有连续性,各矩形通常是连续排列;主要用于展示数值型数据。spss2-描述性统计分析共37页,您现在浏览的是第22页!示例1-频数分析步骤2:对“分数分段”进行统计Analyze→DescriptiveStatistics→Frequencies…结果保存为3-StudentScore_成绩分段.spospss2-描述性统计分析共37页,您现在浏览的是第23页!3.基本描述统计量通过频数分析对数据的总体分布状况有了基本了解之后,通常还需要对定距变量的分布特征有更为精确的认识,这就需要通过计算基本描述统计量等途径来实现。变量分类定类变量:变量的不同取值仅仅代表了不同类的事物,这样的变量叫定类变量。问卷的人口特征中最常使用的问题,而调查被访对象的“性别”,就是定类变量。对于定类变量,加减乘除等运算是没有实际意义的。定序变量:变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,这样的变量叫定序变量。问卷的人口特征中最常使用的问题“教育程度“,以及态度量表题目等都是定序变量,定序变量的值之间可以比较大小,或者有强弱顺序,但两个值的差一般没有什么实际意义。定距变量:变量的值之间可以比较大小,两个值的差有实际意义,这样的变量叫定距变量。有时问卷在调查被访者的“年龄”和“每月平均收入”,都是定距变量。定比变量,有绝对0点,如质量,高度。定比变量与定距变量在市场调查中一般不加以区分,它们的差别在于,定距变量取值为“0”时,不表示“没有”,仅仅是取值为0。定比变量取值为“0”时,则表示“没有”。分类描述集中趋势(CentralTendency)的统计量描述离散趋势(Dispersion)的统计量描述分布形态(Distribution)的统计量spss2-描述性统计分析共37页,您现在浏览的是第24页!3.2描述离散趋势的统计量反映的是一组资料中各个观察值之间的差异或离散程度。即考察所有数据相对于“中心值”分布的疏密程序。方差(Variance):样本方差越大,说明变量值之间的差异越大,样本方差没有单位。标准差(std.deviation):样本标准差越大,说明变量的观测值之间的差异越大,距离均值这个“中心”的离散程序越大。spss2-描述性统计分析共37页,您现在浏览的是第25页!3.3描述分布形态的统计量
考察数据分布形态特征的统计量,例如,数据分布是否对称、偏斜程度以及陡缓程度,主要有如下两种统计量:峰度(Kurtosis):峰度值>0,数据分布比标准正态分布更陡峭,为尖峰分布;峰度值<0,数据分布比标准正态分布更平缓,为平峰分布。偏度(Skewness):偏度值>0,为正偏或右偏,右侧的尾部更长,分布的主体集中在左侧;偏度值<0,为负偏或左偏,左侧的尾部更长,分布的主体集中在右侧。偏度绝对值越大,偏斜越大。spss2-描述性统计分析共37页,您现在浏览的是第26页!示例4-P39-统计分组平均数计算不同消费者类型(X1)的客户满意度(X19)的平均值、标准差、最大值和最小值。数据文件:HBAT_200.sav步骤:Analyze→CompareMeans→Means…结果保存为:HBAT_200_meansbygroup.spo分析:消费类型在1年以下的客户满意度最低;客户的满意度随消费类型所涉及的时间增长而增加。spss2-描述性统计分析共37页,您现在浏览的是第27页!茎叶图-描述频度分布茎叶图(Stem-and-LeafPlots)由数字构成,表达变量的频数分布。在茎叶图中:第1列表示频数,表示个案的个数第2列表示茎叶图的茎,表达整数部分,其代表的数值与茎宽(Stemwidth)有关
当Stem=6,Stemwidth=10,实际表达的值是60第3列表示茎叶图的叶子,表达小数部分,其代表的数值也与茎宽有关,Eachleaf表示每片叶子的个案数茎叶图中第1行数据表示的意义表示有2个小于或等于55的极端值(Extreme)茎叶图中第4行数据表示的意义共有8个个案值为75、76、77的个案各有1个、值为78的个案有2个、值为79的个案有3个茎叶图中最后1行数据表示的意义表示有2个大于或等于94的极端值(Extreme)28
第1列第2列第3列spss2-描述性统计分析共37页,您现在浏览的是第28页!4.2箱图-描述数据分布箱图(Boxplots)显示了变量数据的中位数、25%百分位数和75%百分位数并给出偏离总体分布的奇异个案和极端个案。spss2-描述性统计分析共37页,您现在浏览的是第29页!例4-2箱图绘制语文成绩的箱图数据文件:4-Explore.sav步骤:Analyze→DescriptiveStatistics→Explore…选择语文-因变量
Factorlevelstogether:如果有多个因变量,则分别绘制探索图Depedentstogether:如果有多个因变量,则将因变量作为整体绘制探索图
结果保存为:4-Explore-Box.spospss2-描述性统计分析共37页,您现在浏览的是第30页!4.3QQ图通过正态分布检验的Q-Q概率图描述数据分布的正态性。正态概率QQ图反趋势正态概率QQ图。正态概率QQ图正态概率图以变量(语文成绩)的观测值为X轴坐标,以该变量分布的Z分数为纵坐标。斜线为正态分布的Z分数的期望标准线。若观测点离线越近,表示点越符合正态分布。反之,越不符合正态分布。spss2-描述性统计分析共37页,您现在浏览的是第31页!例4-3QQ图与反趋势QQ图绘制语文成绩的Q-Q概率图数据文件:4-Explore.sav步骤:Analyze→DescriptiveStatistics→Explore…结果保存为:4-Explore-QQ.spospss2-描述性统计分析共37页,您现在浏览的是第32页!例4-4数据的方差齐性检验正态检验的零假设H0:数据服从正态分布方差齐性检验的零假设H0:两样本方差齐性(相等,或无显著性差异)。结果与分析上图-KS检验的sig>0.05,语文成绩按性别分开形成的两个样本是正态的下图-方差齐性检验的sig>0.05,说明两样本的方差差异不显著,方差是齐性的spss2-描述性统计分析共37页,您现在浏览的是第33页!例5-交叉列联表分析1产生二维或多维交叉列联表,反映不同户籍和是否购房交叉分组下的分数频数分布情况。数据文件:4-crosstabulation1.sav步骤:Analyze→DescriptiveStatistics→Crosstabs…结果:4-crosstabulation.spo结果1的参数设置结果2的参数设置spss2-描述性统计分析共37页,您现在浏览的是第34页!例5-交叉列联表分析2在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析在交叉列联表的基础上做进一步的分析,可以得到行变量和列变量之间是否存在联系以及联系的紧密程度如何等更深层次的信息。观测频数是分散在列联表的各个单元格中,不容
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度行政合同行政主体特权在紧急情况下的适用合同4篇
- 2025版小学操场运动设施更新与维修合同3篇
- 体育会展客户关系管理考核试卷
- 光纤通信在智能电网故障诊断中的应用考核试卷
- 2025年土地转让合同
- 2025版停车场消防设施建设与维护服务合同3篇
- 2025版木工材料研发与劳务合作合同范本3篇
- 2025年写作创作分期付款合同
- 2025年加盟代理合约协议
- 2025年家庭矛盾仲裁协议
- 油气行业人才需求预测-洞察分析
- 《数据采集技术》课件-Scrapy 框架的基本操作
- 2025年河北省单招语文模拟测试二(原卷版)
- 高一化学《活泼的金属单质-钠》分层练习含答案解析
- DB34∕T 4010-2021 水利工程外观质量评定规程
- 理论力学智慧树知到期末考试答案章节答案2024年中国石油大学(华东)
- 2024老年人静脉血栓栓塞症防治中国专家共识(完整版)
- 四年级上册脱式计算100题及答案
- 上海市12校2023-2024学年高考生物一模试卷含解析
- 储能电站火灾应急预案演练
- 人教版(新插图)二年级下册数学 第4课时用“进一法”和“去尾法”解决简单的实际问题 教学课件
评论
0/150
提交评论