版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用统计学(SPSS)
AppliedStatistics(SPSS)计算机与信息科学学院
主讲教师:韩毅
Tel:68367232
E-mail:hanyi72@③2023/1/311应用统计学(SPSS)03-韩毅本课程的基本知识结构SPSS基础知识描述统计推断统计统计基础知识非参数检验均值比较与T检验方差分析相关分析回归分析因子分析时序分析聚类分析判别分析探索分析统计图表生成统计量/频数计算多元统计分析2023/1/312应用统计学(SPSS)03-韩毅第三讲描述统计应用统计学(SPSS)
AppliedStatistics(SPSS)2023/1/313应用统计学(SPSS)03-韩毅第三讲描述统计1主要描述统计量
频数分析与多选项分析
2
探索分析
3
统计表生成
4统计图制作52023/1/314应用统计学(SPSS)03-韩毅主要描述统计量一、均值和均值标准误差均值(平均值、平均数,mean)表示的是某变量所有取值的集中趋势或平均水平总体平均数:若一组数据X1,X2,…,XN,代表一个大小为N的有限总体,则其总体平均数为P68-732023/1/315应用统计学(SPSS)03-韩毅主要描述统计量一、均值和均值标准误差样本平均数:若一组数据x1,x2,…,xn,代表一个大小为n的有限样本,则其样本平均数为均值标准误差(StandardErrorofMean,S.E.mean)描述样本均值与总体均值间平均差异程度的统计量P68-732023/1/316应用统计学(SPSS)03-韩毅主要描述统计量二、中位数(Median)把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数若一组数据x1,x2,…,xn是按从小到大或从大到小进行排列,则中位数为P68-732023/1/317应用统计学(SPSS)03-韩毅主要描述统计量三、众数(Mode)是指一组数据中,出现次数最多的那个变量值手工计算众数比较麻烦,需要统计数据的次数分布9年级6班学生的体重(千克)46515954465337525051494449444346564752525047554947525242454060635440555056464953465544455752504955485842525945485862515263585962525557P68-732023/1/318应用统计学(SPSS)03-韩毅主要描述统计量四、全距(Range)全距(亦称极差)是数据的最大值与最小值之间的绝对差计算公式一组数据x1,x2,…,xn,极差为P68-732023/1/319应用统计学(SPSS)03-韩毅主要描述统计量五、方差和标准差方差(Variance)是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值标准差(StandardDeviation)是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。P68-732023/1/3110应用统计学(SPSS)03-韩毅总体、样本的方差及标准差计算公式P68-732023/1/3111应用统计学(SPSS)03-韩毅主要描述统计量六、四分位数、十分位数和百分位数四分位数(Quartiles)是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数),其中Q3到Q1之间的距离的一半又称为四分位差,记为QQ1Q2Q3P68-732023/1/3112应用统计学(SPSS)03-韩毅主要描述统计量六、四分位数、十分位数和百分位数十分位数(Deciles)将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为D1,D2,…,D9,表示10%的数据落在D1下,20%的数据落在D2下,…,90%落在D9下D1…D9D2P68-732023/1/3113应用统计学(SPSS)03-韩毅主要描述统计量六、四分位数、十分位数和百分位数百分位数(percentiles)将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,…,P99,表示1%的数据落在P1下,2%的数据落在P2下,…,99%落在P99下P2…P99P1P68-732023/1/3114应用统计学(SPSS)03-韩毅主要描述统计量七、峰度(Kurtosis)峰度是描述某变量所有取值分布形态陡缓程度的统计量峰度计算公式峰度为0,表示其数据分布与正态分布的陡缓程度相同;峰度大于0,表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0,表示比正态分布的高峰要平坦,为平顶峰。P68-732023/1/3115应用统计学(SPSS)03-韩毅主要描述统计量
八、偏度(Skewness)偏度是描述数据分布形态的,它是描述某变量取值分布对称性的统计量计算公式偏度为0,表示其数据分布形态与正态分布偏度相同;偏度大于0,表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0,表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边P68-732023/1/3116应用统计学(SPSS)03-韩毅主要描述统计量九、标准化Z分数及线性转换Z分数定义从平均数为μ标准差为σ的总体中抽取出一个变量值x,该变量值大于或小于平均数的标准差倍数Z分数线性转换P68-732023/1/3117应用统计学(SPSS)03-韩毅主要描述统计量十、比率分析比率分析的定义对两变量值比率变化的描述分析,适用于定距变量比率分析的主要指标加权比率均值平均绝对离差(averageabsolutedeviation)离散系数(coefficientofdispersion)相关价格微分(price-relateddifferential)变异系数(coefficientofvariance)P91-32023/1/3118应用统计学(SPSS)03-韩毅主要描述统计量
研究问题1
针对商品房购买意向的调查数据,对月住房开销计算基本统计量,并实现以下两个目标:目标1-计算月住房开销的基本统计量,并对不同居住类型进行比较;目标2-分析月住房开销的数量是否存在不均衡现象P68-73具体数据值参见光盘2023/1/3119应用统计学(SPSS)03-韩毅主要描述统计量
研究问题2
根据2006年各地区保险业务情况数据,分析各地区财产保险业务的保费收入占全部保费收入的比例情况,并与1999年数据进行比较。P91-3具体数据值参见光盘2023/1/3120应用统计学(SPSS)03-韩毅第三讲描述统计1主要描述统计量
频数分析与多选项分析
2
探索分析
3
统计表生成
4统计图制作52023/1/3121应用统计学(SPSS)03-韩毅频数分析与多选项分析一、一维频数(Frequency)分析就是一个变量在各个变量值上取值的个案数利用一维频数分布表可以对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征和观测量分布有一个概括的认识主要指标与工具P63-8指标:频数,百分比,有效百分比,累计百分比工具:条形图,饼图,直方图2023/1/3122应用统计学(SPSS)03-韩毅频数分析与多选项分析
研究问题
针对商品房购买意向的调查数据进行频数分析,并实现以下两个目标:目标1-分析被调查者的户籍状况以及他们认为房价的变化情况;目标2-分析月住房开销的分布,并对不同居住类型进行比较P63-8具体数据值参见光盘2023/1/3123应用统计学(SPSS)03-韩毅频数分析与多选项分析二、交叉列联表分析交叉列联表分析的定义分析多个变量在不同取值情况下的联合分布特征,进而分析变量之间的相互影响和关系例子:不同专业学生的高考成绩是否有较大的不同?不同学科同学生活态度上是否表现不同?参与交叉分析的两个变量分别称为交叉列联表的行变量与列变量,还可以再指定其它控制变量P73-852023/1/3124应用统计学(SPSS)03-韩毅一个实例具体数据值参见光盘的“职工数据”行变量列变量列边缘分布行边缘分布条件分布P73-852023/1/3125应用统计学(SPSS)03-韩毅频数分析与多选项分析二、交叉列联表分析交叉列列联表分析的主要内容①交叉分组的频数分布②变量间的独立性
检验变量间是否相互独立③变量间的相关性
根据变量的属性选择有效的相关系数计算方法P73-852023/1/3126应用统计学(SPSS)03-韩毅频数分析与多选项分析二、交叉列联表分析相关系数的相关关系检验检验的零假设(H0):
行和列变量相互独立,不存在显著相关关系SPSS将自动给出检验的相伴概率,如果相伴概率小于显著性水平0.05,那么应拒绝零假设,认为行列变量之间彼此相关P73-852023/1/3127应用统计学(SPSS)03-韩毅频数分析与多选项分析二、交叉列联表分析相关系数的相关关系检验P73-85检验方法总结表定类变量定序变量定距变量定类变量卡方,列联系数,Phi系数,V系数,Lambda,不确定系数等卡方卡方,Eta系数定序变量卡方,Gamma系数,Somersd系数,KendallTau-b系数,KendallTau-c系数,Mantel-Haenszel卡方,相关系数卡方定距变量卡方,相关系数2023/1/3128应用统计学(SPSS)03-韩毅(1)卡方统计量检验
是常用的检验行列变量之间是否相关的方法。交叉列联表的卡方检验零假设是:行列变量之间独立,计算公式为主要的相关关系检验方法P73-85其中fo和fe分别为单元格的观察与期望数,TR和CT分别为行总观察数与列总观察数2023/1/3129应用统计学(SPSS)03-韩毅(2)Contingencycoefficient:列联系数用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为
主要的相关关系检验方法其中,n为样本容量P73-852023/1/3130应用统计学(SPSS)03-韩毅(3)Phi
系数和Cramer’sV系数
用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为主要的相关关系检验方法其中n为样本容量,R和C分别为表的行数和列数P73-852023/1/3131应用统计学(SPSS)03-韩毅(4)Kendall系数
用于定序变量之间的相关系数计算,建立在“同序对数”与“异序对数”的基础上。主要的相关关系检验方法其中P、Q分别为同序对数和异序对数,Tx(Ty)为的变量
x(y)上同分但在变量y(x)中不同分的对数,R和C分别为列联表的行数和列数P73-852023/1/3132应用统计学(SPSS)03-韩毅频数分析与多选项分析
研究问题1
针对商品房购买意向的调查数据,分析不同居住类型的被访者未来的购房预期是否一致。P73-85
研究问题2
针对商品房购买意向的调查数据,分析不同收入类型的被访者在住房开销方面的一致性。2023/1/3133应用统计学(SPSS)03-韩毅频数分析与多选项分析什么是多选项分析?三、多选项分析就是对多选项问题的频数统计分析方法所谓多选项问题,即通常一个问题的答案是顺序变量或名义变量,并且允许选择的答案可以有多种组合例您为什么选择来学习SPSS?
a)指导老师推荐学习的b)课程系统中安排的c)感觉将来可能有点用途d)该软件好象比较流行e)其它(请注明)
。P85-912023/1/3134应用统计学(SPSS)03-韩毅频数分析与多选项分析多选项分析处理方法三、多选项分析①多选项二分法(MultipleDichotomiesMethod)将每个可能的答案设置为一个SPSS变量变量取值有两个,分别为0和1优点:比较简单缺点:需要处理的变量数比较多P85-912023/1/3135应用统计学(SPSS)03-韩毅频数分析与多选项分析多选项分析处理方法三、多选项分析②多选项分类法(MultipleCategoryMethod)估计多选项问题可能出现的答案个数来设置变量如果某个案的答案比估计的少,则后面的变量取值为缺失值存在的一个问题:对普通的频数分析或交叉列联表分析有时候不能达到要求P85-912023/1/3136应用统计学(SPSS)03-韩毅频数分析与多选项分析多选项分析处理方法三、多选项分析分解多选项问题并设置相应变量P85-91设置多选项问题变量的多重响应变量集运行多重响应变量集的频数分析2023/1/3137应用统计学(SPSS)03-韩毅频数分析与多选项分析
研究问题
针对商品房购买意向的调查数据进行频数分析,并实现以下两个目标:目标1-分析被调查者选择的付款方式;目标2-分析不同收入段被调查者选择的付款方式P63-8具体数据值参见光盘2023/1/3138应用统计学(SPSS)03-韩毅第三讲描述统计1主要描述统计量
频数、列联表与多选项分析
2
探索分析
3
统计表生成
4统计图制作52023/1/3139应用统计学(SPSS)03-韩毅探索分析一、什么是探索分析(exploratoryanalysis)?就是应用图表等工具对变量进行更为深入详尽的描述性统计分析核心内容:检查数据是否有误(异常值、影响点或错误数据);数据的正态性与方差齐性基本目标:
在一般描述性统计指标的基础上增加有关数据其他特征的文字与图形描述,显示数据更加细致与全面的特征,帮助用户思考与确立对数据进行进一步分析的方案2023/1/3140应用统计学(SPSS)03-韩毅探索分析二、探索分析的考查方法在数据分组或不分组情况下,获取常用统计量与图形统计量:应用分组统计量或不分组统计量,反映数据的集中趋势、离散趋势及分布特征图形:通过图形方式直观帮助用户确定奇异值、影响点、进行假设检验,以及确定用户要使用的某种统计方式是否合适2023/1/3141应用统计学(SPSS)03-韩毅探索分析三、探索分析的工具与方法1.箱图(boxplots)中位数,50%上触须线,最大值第一四分位数,25%界外值:小于框长值1.5倍极值:大于框长值3倍第三四分位数,75%下触须线,最小值盒须2023/1/3142应用统计学(SPSS)03-韩毅探索分析三、探索分析的工具与方法1.箱图(boxplots)对集中趋势分布的3种平稳测度中位数修正均值M估计值2023/1/3143应用统计学(SPSS)03-韩毅探索分析三、探索分析的具体工具2.茎叶图(stemandleafplot)一个叶子表示一个个案,其近似值计算式为:(茎+叶*0.1)*茎宽表示有5个个案,其值分别为36000,36000,37000,37000,370002023/1/3144应用统计学(SPSS)03-韩毅探索分析三、探索分析的具体工具3.直方图(histogram)可检验数据的正态性,一般可叠加正态曲线,提供Shaprio-Wilks和Lilliefors检验。对分组或不分组数据作数据分布图,计算均值、标准差及样本容量2023/1/3145应用统计学(SPSS)03-韩毅探索分析三、探索分析的具体工具4.Q-Q图2023/1/3146应用统计学(SPSS)03-韩毅探索分析三、探索分析的具体工具5.方差齐性检验1)Spreadvs.level图2)Levene检验不强调数据正态分布要求的单因素方差分析2023/1/3147应用统计学(SPSS)03-韩毅探索分析指数转换指数转换3211/2立方平方无变换平方根-1/20-1平方根倒数对数倒数3)幂转换幂指数=1-斜率,通常选择最接近1/2的整数倍的值为指数三、探索分析的具体工具4.方差齐性检验2023/1/3148应用统计学(SPSS)03-韩毅探索分析
研究问题针对用户购房调查数据中的“现居住面积”或“人均居住面积”,选定一个分组变量进行探索性分析。目标1-分析因变量是否是正态分布;目标2-分析选定分组变量下因变量是否满足方差齐性2023/1/3149应用统计学(SPSS)03-韩毅第三讲描述统计1主要描述统计量
频数、列联表与多选项分析
2
探索分析
3
统计表生成
4统计图制作52023/1/3150应用统计学(SPSS)03-韩毅统计表生成一、简单报表生成1.个案简明统计报表(CasesSummary)计算指定变量的分组统计量2.行形式报表(ReportSummariesinRows)以行为对象生成统计结果3.列形式报表(ReportSummariesinColumns)以列为对象生成统计结果2023/1/3151应用统计学(SPSS)03-韩毅统计表生成一、简单报表生成
研究问题1----个案简明统计报表
以职工数据为对象,以20名员工的基本工资、奖金和分红信息生成个案简明统计报表。
研究问题2-行形式报表仍用研究问题1中的例子,生成行报表P75-832023/1/3152应用统计学(SPSS)03-韩毅统计表生成一、简单报表生成
研究问题3-列形式报表
根据职工数据,以20名员工的基本工资、奖金和分红信息生成列形式报表。
P75-832023/1/3153应用统计学(SPSS)03-韩毅统计表生成二、自定义表格各组分类中子女的数量01~23~4>=5列%列%列%列%性别男结婚幸福很幸福63.2%64.9%62.2%71.4%中等幸福32.9%33.0%35.2%26.2%不太幸福3.9%2.1%2.4%2.4%女结婚幸福很幸福69.2%63.9%61.6%57.6%中等幸福28.6%33.2%35.5%23.3%不太幸福2.2%2.9%2.8%9.1%不同性别多子女人群对结婚幸福的感受2023/1/3154应用统计学(SPSS)03-韩毅统计表生成二、自定义表格堆栈表格嵌套表格分层表格2023/1/3155应用统计学(SPSS)03-韩毅统计表生成二、自定义表格自定义表格2023/1/3156应用统计学(SPSS)03-韩毅统计表生成二、简单报表生成
研究问题
根据职工数据,以20名员工的基本工资、奖金和分红信息为列标题、以员工职称为行标题生成表格,并计算不同职称基本工资、资金及分红的平均数。
P75-832023/1/3157应用统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年学校教研工作计划范文
- 护理个人年度工作计划
- 底阁2024德育计划新
- 初中一年级课程计划 初中一年级课程
- 珠宝首饰销售工作计划
- 2024年专业爆炸品物流服务协议一
- 2024年个体合作伙伴权益分配协议
- 中度安全工作计划
- 中学体育艺术卫生工作自查报告总结计划
- 2024年度精密仪器陆路运输保险合同3篇
- 双选会策划书
- 二年级上册数学应用题100道可打印
- 牛顿第一定律完整版课件
- 2023年达州市通川区社区工作者招聘考试真题
- 五年级上册英语一课一练-Unit 6 In a nature park课时(4) 人教PEP(word版含答案)
- 社区社会组织培训
- 2024年中国中信集团招聘笔试参考题库含答案解析
- 2024年中煤能源集团招聘笔试参考题库含答案解析
- 贷款服务保密协议
- 2024年会计总结及工作计划
- 经济社会学大纲
评论
0/150
提交评论