描述性分析详解_第1页
描述性分析详解_第2页
描述性分析详解_第3页
描述性分析详解_第4页
描述性分析详解_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

描述性分析详解演示文稿2023/5/20目前一页\总数二十一页\编于六点优选描述性分析2023/5/20目前二页\总数二十一页\编于六点名义和序号变量一般选择条形图或饼图度量变量选择直方图2023/5/20目前三页\总数二十一页\编于六点Bootstrap法又称为自助法,是以现有样本为基础的模拟抽样判断法,可用于研究某统计量的分布特征,特别适用于那些难以用常规方法处理的参数区间估计,假设检验等问题。其提出是基于参数估计准确性考察的目的,目前已发展到几乎统计学所有领域。提供了一条确保所建模型的稳定性和可靠性的有效途径,它通过对原始样本进行有放回的重置抽样,进而估计某个估计量的抽样分布。2023/5/20目前四页\总数二十一页\编于六点若要做等距分组进行频数描述如何操作?如分成:60以下60—7070—8080—9090以上2023/5/20目前五页\总数二十一页\编于六点练习:

某百货公司连续40天的商品销售额如下(单位:万元)41252947383430384340463645373736454333443528463430374426384442363737493942323635(1)根据以上的数据进行适当的分组,编制频数分布表,并绘制频数分布的直方图;(2)计算适当的统计指标对该百货公司这40天的销售情况进行描述说明。2023/5/20目前六页\总数二十一页\编于六点多重反应下的频次分析基本功能:对每一项目对应多个反应(如多项选择)的数据进行频次分析。菜单位置:【分析】—【多重响应】—【定义变量集】—【频率】例:你主要的新闻渠道包括哪些?(可多选)1报纸2电视3杂志4广播

5互联网6朋友/家人步骤:第一步:录入,把每个选项视为一个变量,变量的数目与选项的数目相等。最好把每个多选项统一编码,以便于分析数据。2023/5/20目前七页\总数二十一页\编于六点第二步:【多重响应】—【定义变量集】2023/5/20目前八页\总数二十一页\编于六点$a1频率响应个案百分比N百分比获取新闻主要渠道a报纸80225.2%72.3%电视79424.9%71.5%杂志2437.6%21.9%广播1715.4%15.4%互联网103132.4%92.9%朋友/家人/同事1454.6%13.1%总计3186100.0%287.0%a.组第三步:【多重响应】—【定义变量集】—【频率】2023/5/20目前九页\总数二十一页\编于六点第二节Descriptives过程(描述性分析)调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存入数据库,所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。如:1班分数的均值和标准差分别为78.53和9.43,而2班的均值和标准差分别为70.19和7.00。试问1班的90分是不是比2班的82分成绩更好?(Z1=1.22,Z2=1.69)2023/5/20目前十页\总数二十一页\编于六点例:30名学生的考试成绩:SPSS练习211.打开【分析】—【描述统计】—【描述】描述统计量N全距极小值极大值和均值标准差方差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误成绩304151922.E374.902.01111.015121.334-.283.427-.599.833有效的

N(列表状态)302023/5/20目前十一页\总数二十一页\编于六点系统以ZCJ为变量名将原始数据转换成标准z分值,存放在原数据库中,亦即变量的标准化过程。2023/5/20目前十二页\总数二十一页\编于六点第三节Explore过程(探索分析)

调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。2023/5/20目前十三页\总数二十一页\编于六点打开【分析】—【描述统计】—【探索】例:男女各15名学生的考试成绩,试分析成绩与性别是否有关系。见SPSS练习212023/5/20目前十四页\总数二十一页\编于六点描述SEX统计量标准误成绩男均值71.803.151均值的

95%置信区间下限65.04上限78.565%修整均值72.11中值71.00方差148.886标准差12.202极小值51极大值87范围36四分位距20偏度-.196.580峰度-1.2441.121女均值78.002.336均值的

95%置信区间下限72.99上限83.015%修整均值78.00中值77.00方差81.857标准差9.047极小值64极大值92范围28四分位距17偏度.310.580峰度-1.0821.1212023/5/20目前十五页\总数二十一页\编于六点第四节交互分析(crosstabs)基本功能:适用于两个或两个以上变量交叉分类形成列联表,对变量的关联性进行分析。数量变量和类别变量都可以进行。常用于检验两类假设,即变量间的独立性假设与比例一致性假设。独立性假设检验同意群样本在两个变量上的反应,以判断在总体范围内两变量之间的关系。比例一致性假设检验,首先从两个总体范围内抽取两个样本(同一总体抽取2个样本),然后根据两个样本反应推论两个总体是否相同。2023/5/20目前十六页\总数二十一页\编于六点菜单位置:【分析】—【描述统计】—【交叉】例:在网民媒体习惯调查中,有一个问题“您认为哪一种读物更适合在周末阅读?”有三个选项:日报的周末版、杂志、周报。研究者想知道不同性别网民的选择是否一致?2023/5/20目前十七页\总数二十一页\编于六点进行行和列变量相互独立的假设检验,有多种检验法。进行相关系数的检验,有两项结果显示:Pearson相关系数和Spearman相关系数用来描述相关性当用自变量预测因变量时,此系数反映这种预测降低错误的比率。(1表示自变量可以完全预测因变量,0表示完全不能)表示用一个变量来预测其他变量时降低错误的比率适用于定序变量:Gamma系数反映两个有序变量间的对称相关性。是Gamma检验的非对称推广。对有序变量和秩变量相关性的非参数检验。与Kendall’stau-c相似适用于定序变量:用于检验相关性(“1”高度相关,“0”无相关)进行一个二值因素变量和一个二值响应变量的独立性检验。用于检验两个评估方法对同一对象的评估是否具有一致系。检验某事件发生和某因子之间的关系(“1”完全一致,“0”一致性与偶然预期相同,至少大于0.7)进行两个相关的二值变量的非参数检验Statistics对话框2023/5/20目前十八页\总数二十一页\编于六点

你认为下列哪一种读物更适合在周末阅读?合计日报的周末版杂志周报性别男计数379313208900

性别

中的

%42.1%34.8%23.1%100.0%女计数788632196

性别

中的

%39.8%43.9%16.3%100.0%合计计数4573992401096

性别

中的

%41.7%36.4%21.9%100.0%输出结果:男性网民与女性网民对周末读物的需求并不相同。2023/5/20目前十九页\总数二十一页\编于六点卡方检验值df渐进

Sig.(双侧)Pearson卡方7.251a2.027似然比7.3372.026线性和线性组合.5381.463有效案例中的

N1096a.0单元格(.0%)的期望计数少于

5。最小期望计数为

42.92。对称度量值近似值

Sig.按标量标定φ.081.027Cramer的

V.081.027有效案例中的

N1096卡方检验结果:零假设为比例相同,显著性水平(sig)小于0.05,意味着零假设不成立,因此不同性别的网民对周末读物的选择性有显著差异。卡方检验结果存在显著差异,有必要对每对假设分别进行检验。Φ和v值是衡量两个变量关系强度的常用指标。一般适用于2*2、2*3、3*2交互列表,值在(-1,1)之间,越小关系强度越低,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论