版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、三 峡 大 学经济与管理学院2021-12-13第三讲第三讲 描述性分析描述性分析实验目的实验目的 摘要性分析的诸个过程,完成许多统计学摘要性分析的诸个过程,完成许多统计学指标,对于计量资料,可完成均数、标准差、指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资标准误等指标的计算;对于计数和一些等级资料,可完成构成比率等指标的计算。料,可完成构成比率等指标的计算。三 峡 大 学经济与管理学院2021-12-13第一节第一节 Frequencies过程(频数分析)过程(频数分析)例:例:3030名学生的考试成绩:名学生的考试成绩:SPSSSPSS练习练习2121 打
2、开【分析】选择【频率】三 峡 大 学经济与管理学院2021-12-13名义和序名义和序号变量一号变量一般选择条般选择条形图或饼形图或饼图图度量变量度量变量选择直方选择直方图图三 峡 大 学经济与管理学院2021-12-13Bootstrap法又称为自助法,是以现法又称为自助法,是以现有样本为基础的模拟抽样判断法,有样本为基础的模拟抽样判断法,可用于研究某统计量的分布特征,可用于研究某统计量的分布特征,特别适用于那些难以用常规方法处特别适用于那些难以用常规方法处理的参数区间估计,假设检验等问理的参数区间估计,假设检验等问题。其提出是基于参数估计准确性题。其提出是基于参数估计准确性考察的目的,目前
3、已发展到几乎统考察的目的,目前已发展到几乎统计学所有领域。提供了一条确保所计学所有领域。提供了一条确保所建模型的稳定性和可靠性的有效途建模型的稳定性和可靠性的有效途径,它通过对原始样本进行有放回径,它通过对原始样本进行有放回的重置抽样,进而估计某个估计量的重置抽样,进而估计某个估计量的抽样分布。的抽样分布。三 峡 大 学经济与管理学院2021-12-13若要做等距分组进行频数描述如何操作?若要做等距分组进行频数描述如何操作?如分成:如分成:60以下以下 6070 7080 8090 90以上以上三 峡 大 学经济与管理学院2021-12-13练习:练习: 某百货公司连续某百货公司连续4040天
4、的商品销售额如下天的商品销售额如下 (单位:万元)(单位:万元) 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35(1 1)根据以上的数据进行适当的分组,编制频数)根据以上的数据进行适当的分组,编制频数分布表,并绘制频数分布的直方图;分布表,并绘制频数分布的直方图;(2 2)计算适当的统计指标对该百货公司这)计算适当的统计指标对该百货公司这4040天的天的销售情况进行描述说明。销售情况进行描述说明。三 峡
5、大 学经济与管理学院2021-12-13多重反应下的频次分析多重反应下的频次分析 基本功能:对每一项目对应多个反应(如多项基本功能:对每一项目对应多个反应(如多项选择)的数据进行频次分析。选择)的数据进行频次分析。 菜单位置:菜单位置:【分析分析】【多重响应多重响应】【定义变定义变量集量集】【频率频率】例:你主要的新闻渠道包括哪些?(可多选)例:你主要的新闻渠道包括哪些?(可多选) 1报纸报纸 2 电视电视 3杂志杂志 4 广播广播 5互联网互联网 6 朋友朋友/家人家人步骤:步骤:第一步:录入,把每个选项视为一个变量,变第一步:录入,把每个选项视为一个变量,变量的数目与选项的数目相等。最好把
6、每个多选项统量的数目与选项的数目相等。最好把每个多选项统一编码,以便于分析数据。一编码,以便于分析数据。三 峡 大 学经济与管理学院2021-12-13第二步第二步: :【多重响应多重响应】【定义变量集定义变量集】三 峡 大 学经济与管理学院2021-12-13$a1 $a1 频率频率响应个案百分比N百分比获取新闻主要渠道a报纸80225.2%72.3%电视79424.9%71.5%杂志2437.6%21.9%广播1715.4%15.4%互联网103132.4%92.9%朋友/家人/同事1454.6%13.1%总计3186100.0%287.0%a. 组第三步:第三步:【多重响应多重响应】【定
7、义变量集定义变量集】【频率频率】三 峡 大 学经济与管理学院2021-12-13第二节第二节 Descriptives过程(描述性分析)过程(描述性分析) 调用此过程可对变量进行描述性统计分析,调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始计算并列出一系列相应的统计指标,且可将原始数据转换成标准数据转换成标准Z分值并存入数据库,所谓分值并存入数据库,所谓Z分值分值是指某原始数值比其均值高或低多少个标准差单是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。位,高的为正值,低的为负值,相等的为零。 如:如:1班分数的均值和标准差分别
8、为班分数的均值和标准差分别为78.53和和9.43,而,而2班的均值和标准差分别为班的均值和标准差分别为70.19和和7.00。试问试问1班的班的90分是不是比分是不是比2班的班的82分成绩更好?分成绩更好? (Z1=1.22, Z2=1.69)sxxz三 峡 大 学经济与管理学院2021-12-13例:例:30名学生的考试成绩:名学生的考试成绩:SPSS练习练习211打开打开【分析分析】【描述统计描述统计】【描述描述】描述统计量描述统计量N N全距全距极小值极小值极大值极大值和和均值均值标准标准差差方差方差偏度偏度峰度峰度统计统计量量统计量统计量 统计量统计量统计量统计量统计量统计量统计统计
9、量量标准标准误误统计统计量量统计统计量量统计统计量量标准误标准误统计统计量量标准误标准误成绩成绩30304141515192922.E32.E374.9074.90 2.012.011 111.0111.015 5121.3121.33434- -.283.283.427.427-.599-.599.833.833有效的有效的 N (列表状(列表状态)态)3030三 峡 大 学经济与管理学院2021-12-13 系统以系统以ZCJZCJ为变量名将原始数据转换成标准为变量名将原始数据转换成标准z z分值,存放在原数据库中分值,存放在原数据库中, ,亦即变量的标准化过亦即变量的标准化过程。程。三
10、峡 大 学经济与管理学院2021-12-13第三节第三节 Explore过程(探索分析)过程(探索分析) 调用此过程可对变量进行更为深入详尽的描调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。述性统计分析,故称之为探索性统计。 它在一般描述性统计指标的基础上,增加有它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细关数据其他特征的文字与图形描述,显得更加细致与全面,有助于致与全面,有助于用户思考对数据进行进一步分用户思考对数据进行进一步分析的方案。析的方案。三 峡 大 学经济与管理学院2021-12-13打开打开【分析分析】【描述统计描述统
11、计】【探索探索】例:例:男女各男女各1515名学生的考试成绩,试分析成绩与性名学生的考试成绩,试分析成绩与性别是否有关系。别是否有关系。 见见SPSSSPSS练习练习2121三 峡 大 学经济与管理学院2021-12-13描述描述SEXSEX统计量统计量标准误标准误成绩成绩 男男均值均值71.8071.803.1513.151均值的均值的 95% 置信区间置信区间 下下限限65.0465.04上上限限78.5678.565% 5% 修整均值修整均值72.1172.11中值中值71.0071.00方差方差148.88148.886 6标准差标准差12.20212.202极小值极小值5151极大值
12、极大值8787范围范围3636四分位距四分位距2020偏度偏度-.196-.196.580.580峰度峰度-1.244-1.2441.1211.121女女均值均值78.0078.002.3362.336均值的均值的 95% 置信区间置信区间 下下限限72.9972.99上上限限83.0183.015% 5% 修整均值修整均值78.0078.00中值中值77.0077.00方差方差81.85781.857标准差标准差9.0479.047极小值极小值6464极大值极大值9292范围范围2828四分位距四分位距1717偏度偏度.310.310.580.580峰度峰度-1.082-1.0821.121
13、1.121三 峡 大 学经济与管理学院2021-12-13第四节第四节 交互分析(交互分析(crosstabs) ) 基本功能:基本功能:适用于两个或两个以上变量交叉分类适用于两个或两个以上变量交叉分类形成列联表,对变量的关联性进行分析。数量变形成列联表,对变量的关联性进行分析。数量变量和类别变量都可以进行。量和类别变量都可以进行。 常用于检验两类假设,即变量间的独立性假设与常用于检验两类假设,即变量间的独立性假设与比例一致性假设。比例一致性假设。 独立性假设检验同意群样本在两个变量上的反应,独立性假设检验同意群样本在两个变量上的反应,以判断在总体范围内两变量之间的关系。以判断在总体范围内两变
14、量之间的关系。 比例一致性假设检验,首先从两个总体范围内抽比例一致性假设检验,首先从两个总体范围内抽取两个样本(同一总体抽取取两个样本(同一总体抽取2 2个样本),然后根据个样本),然后根据两个样本反应推论两个总体是否相同。两个样本反应推论两个总体是否相同。三 峡 大 学经济与管理学院2021-12-13菜单位置:菜单位置:【分析分析】【描述统计描述统计】【交叉交叉】例:例:在网民媒体习惯调查中,有一个问题在网民媒体习惯调查中,有一个问题“您认为哪一种读您认为哪一种读物更适合在周末阅读?物更适合在周末阅读?”有三个选项:日报的周末版、杂志、有三个选项:日报的周末版、杂志、周报。研究者想知道不同
15、性别网民的选择是否一致?周报。研究者想知道不同性别网民的选择是否一致?三 峡 大 学经济与管理学院2021-12-13进行行和列变量相互独立的假进行行和列变量相互独立的假设检验,有多种检验法。设检验,有多种检验法。进行相关进行相关系数的检系数的检验,有两验,有两项结果显项结果显示:示:Pearson相关系数相关系数和和 Spearman相关系相关系数数用来描述相关性用来描述相关性当用自变量预测因变量时,此当用自变量预测因变量时,此系数反映这种预测降低错误的比系数反映这种预测降低错误的比率。率。(1表示自变量可以完全预测表示自变量可以完全预测因变量,因变量,0表示完全不能)表示完全不能)表示用一
16、个变量来预测其他变表示用一个变量来预测其他变量时降低错误的比率量时降低错误的比率适用于定序变量:适用于定序变量:Gamma系数反映两个有序变量间系数反映两个有序变量间的对称相关性。的对称相关性。是是Gamma检验的非对称推广。检验的非对称推广。对有序变量和秩变量相关性的非参对有序变量和秩变量相关性的非参数检验。数检验。与与Kendalls tau-c相似相似适用于定序变量:适用于定序变量:用于检验相关性(用于检验相关性(“1”高度相关,高度相关,“0”无相无相关)关)进行一个二值因素变量和一个二值响应变量的独进行一个二值因素变量和一个二值响应变量的独立性检验。立性检验。用于检验两个评估方法对同
17、一对象的评估是否具用于检验两个评估方法对同一对象的评估是否具有一致系。有一致系。检验某事件发生和某因子之间的关系(检验某事件发生和某因子之间的关系(“1”完完全一致,全一致,“0”一致性与偶然预期相同,至少大于一致性与偶然预期相同,至少大于0.7)进行两个相关的二值变量的非参数检验进行两个相关的二值变量的非参数检验Statistics 对话框对话框三 峡 大 学经济与管理学院2021-12-13 你认为下列哪一种读物更适合在你认为下列哪一种读物更适合在周末阅读?周末阅读? 合计合计日报的周末版日报的周末版杂志杂志周报周报性别 男计数379379313313208208900900 性别 中的
18、%42.1%42.1%34.8%34.8%23.1%23.1%100.0%100.0%女计数787886863232196196 性别 中的 %39.8%39.8%43.9%43.9%16.3%16.3%100.0%100.0%合计计数45745739939924024010961096 性别 中的 %41.7%41.7%36.4%36.4%21.9%21.9%100.0%100.0%输出结果:输出结果:男性网民与女性网民对周末读物的需求并不相同。男性网民与女性网民对周末读物的需求并不相同。三 峡 大 学经济与管理学院2021-12-13卡方检验卡方检验值df渐进 Sig. (双侧)Pears
19、on 卡方7.2517.251a a2 2.027.027似然比7.3377.3372 2.026.026线性和线性组合.538.5381 1.463.463有效案例中的 N10961096a. 0 a. 0 单元格单元格(.0%) (.0%) 的期望计数少于的期望计数少于 5 5。最小。最小期望计数为期望计数为 42.9242.92。对称度量对称度量值值近似近似值值 Sig.按标量按标量标定标定.081.081.027.027Cramer Cramer 的的 V.081.081.027.027有效案例中的有效案例中的 N10961096卡方检验结果:零假设为比例卡方检验结果:零假设为比例相同
20、,显著性水平(相同,显著性水平(sigsig) )小于小于0.050.05,意味着零假设不成立,意味着零假设不成立,因此不同性别的网民对周末读因此不同性别的网民对周末读物的选择性有显著差异。物的选择性有显著差异。卡方检验结果存在显著差异,卡方检验结果存在显著差异,有必要对每对假设分别进行有必要对每对假设分别进行检验。检验。和和v v值是衡量两个值是衡量两个变量关系强度的常用指标。变量关系强度的常用指标。一般适用于一般适用于2 2* *2 2、2 2* *3 3、3 3* *2 2交互列表,值在(交互列表,值在(-1-1,1 1)之间,越小关系强度越低,之间,越小关系强度越低,其中其中0.10.
21、1表示低,表示低,0.300.30表示表示一般,一般,0.50.5表示高。表示高。三 峡 大 学经济与管理学院2021-12-13例:例:某公司调研关于不同地区对地板的喜好数据:某公司调研关于不同地区对地板的喜好数据:地板材料地区合计123地板6912616211其他789927204合这些数据是否提供证据说明该城市不同地区居民这些数据是否提供证据说明该城市不同地区居民对地板喜好比例不同?对地板喜好比例不同?三 峡 大 学经济与管理学院2021-12-13三 峡 大 学经济与管理学院2021-12-13商品商品* 地区地区 交叉制表交叉制表地区地区合计合计1 12 23 3商品商品地板地板计数计数69691261261616211211地区地区 中的中的 %46.9%46.9%56.0%56.0%37.2%37.2%50.8%50.8%其他其他计数计数787899992727204204地区地区 中的中的 %53.1%53.1%44.0%44.0%62.8%62.8%49.2%49.2%合计合计计数计数1471472252254343415415地区地区 中的中的 %100.0%100.0%100.0%100.0%100.0%100.0%100.0%100.0%卡方检验卡方检验值值dfdf渐进渐进 Sig. (双侧双侧)Pearson Pea
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 提供全球计算机网络用户接入服务行业营销策略方案
- 农业气象信息服务行业相关项目经营管理报告
- 工厂内部安全信号灯管理方案
- 电力设施拆除施工方案流程
- 建筑工程质量月专项方案
- 医用泥浆产业规划专项研究报告
- 夹鼻眼镜产业规划专项研究报告
- 家用抛光设备和机器非电动产业规划专项研究报告
- 外汇交易行业营销策略方案
- 新能源汽车充电网络安全管理制度
- 2024-2030年组氨酸行业市场现状供需分析及投资评估规划分析研究报告
- 教育信息化教学资源建设规划
- 2024年山东省淄博市中考道德与法治试卷真题
- 屠宰场食品安全管理制度
- 部编版(2024秋)语文一年级上册 6 .影子课件
- GB/T 44723-2024氢燃料内燃机通用技术条件
- 2024秋期国家开放大学专科《刑事诉讼法学》一平台在线形考(形考任务一至五)试题及答案
- 病例讨论英文
- 2022年11月软考(高级)网络规划设计师上午真题
- 2024-2025学年二年级上册语文第四单元测试卷(统编版)
- 中国法律史-第二次平时作业-国开-参考资料
评论
0/150
提交评论