![6上机课第5讲 属性数据分析_第1页](http://file4.renrendoc.com/view/a60ee7bca266426a830a7dea333bcc83/a60ee7bca266426a830a7dea333bcc831.gif)
![6上机课第5讲 属性数据分析_第2页](http://file4.renrendoc.com/view/a60ee7bca266426a830a7dea333bcc83/a60ee7bca266426a830a7dea333bcc832.gif)
![6上机课第5讲 属性数据分析_第3页](http://file4.renrendoc.com/view/a60ee7bca266426a830a7dea333bcc83/a60ee7bca266426a830a7dea333bcc833.gif)
![6上机课第5讲 属性数据分析_第4页](http://file4.renrendoc.com/view/a60ee7bca266426a830a7dea333bcc83/a60ee7bca266426a830a7dea333bcc834.gif)
![6上机课第5讲 属性数据分析_第5页](http://file4.renrendoc.com/view/a60ee7bca266426a830a7dea333bcc83/a60ee7bca266426a830a7dea333bcc835.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文格式为Word版,下载可任意编辑——6上机课第5讲属性数据分析
属性数据分析一、列联表分析—得到概括性信息二、属性变量的无关联性检验三、有序变量的关联性分析
四、FREQ过程
案例5.1性别与主修专业是否相关—P116案例5.2是否判死刑与种族是否相关——P119案例5.3工艺与产品质量是否有关系——P125案例5.4患病程度和牛群大小是否相关——P1302
变量的类型:1.名义变量2.有序变量(两个值的差没有意义)3.区间变量(间隔变量,譬如温度)4.比率变量(比例变量)
名义变量属性变量(定性变量、离散变量)有序变量
区间变量定量变量(连续变量)比率变量
属性数据由属性变量得到的数据都是属性数据.当我们研究的指标是一个属性变量,并希望用其他变量来说明或预计这个属性变量的取值时,不管用以说明的变量是属性的或连续的,使用的统计方法统称为属性数据分析.
对属性数据进行分析的目的:1.2.3.4.产生汇总分类数据列联表;检验属性变量间的独立性(无关联性);计算度量属性变量间的关联性统计量;对高维数据进行分层分析和建模.
注:(1)本章仅研究1-3.(2)使用SAS中FREQ过程
一、列联表分析几个概念:1.交织表(两个或两个以上变量的列联表)
2.双向表(两个变量的列联表)3.单元
4.单元频数
两个属性变量的列联表112n11n21
2n12n22
………
cn1cn2c
sumn1jn1jn2jn2j
r
nr1
nr2n2
……
nrc
nrjnrj
sumn1
nc
n
由原始数据生成列联表1.使用FREQ过程来生成列联表;
2.使用SAS菜单系统“分析员应用〞生成列联表(tableanalysis).
案例5.1性别与主修专业是否相关.书P116—原始数据表:属性变量:性别、
主修专业(统计专业和非统计专业).
程序:见属性数据分析中案例5.1
student1234567891011121314151617181920
sexmmfmffmmmfmfmmmfmmfm
majoryesnoyesnoyesyesnonoyesyesnoyesyesyesnoyesyesnonoyes
输出结果sexmajor
统计课程中学生的专业和性别
Frequency|PercentRowPctColPct|||no|yes|Total
|||f||||1|5.00|14.29|12.50|6|30.00|85.71|50.00|735.00
|||m|||7|35.00|53.85|6|30.00|46.15|1365.00
|
87.50|
50.00|
|||Total840.001260.0020100.00
由现成的汇总表生成列联表1.使用FREQ过程来生成列联表;注意:在FREQ过程中必需使用WEIGHT语句.2.使用SAS菜单系统“分析员应用〞生成列联表.注意:要给出频数变量cellCounts.
案例5.2是否判死刑与种族是否相关看书P119.数据如下表:种族
是否判死刑
白人19141
黑人17149
是否
程序:见属性数据分析中案例5.2
生成多个变量的交织表使用FREQ过程来生成列联表;
procfreqdata=welfarepage;tablescity*employ*politic*opinion;……run;
二、属性变量的无关联性检验1、属性变量无关联性的卡方检验假设:H0:行变量与列变量独立,H1:它们不独立
统计量:
2i1j1
r
c
(nijmij)mij
2
其中:
nij表示观测频数mij表示期望频数mijninjn
两个属性变量的列联表112n11n21
2n12n22
………………
cn1cn2c
sumn1jn1jn2jn2j
rsum
nr1n1
nr2n2
…………
nrc
nrjnrj
nc
n
(1)在H0成立时,当观测数据较大时,2统计量的分布近似听从自由度为(r1)(c1)的
2分布.(a)没有空单元(所有单元频数都不为0)(b)所有单元的期望频数均大于等于5(2)在H0成立时,观测频数nij与期望频数m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安保服务外包合同
- 湘教版数学九年级上册《3.4.1相似三角形的判定》听评课记录
- 人教版地理七年级下册8.1《中东》(第2课时)听课评课记录
- 湘教版数学八年级上册1.1《分式的概念》听评课记录2
- 甲方终止租赁合同范本(2篇)
- 新版湘教版秋八年级数学上册第二章三角形课题三角形的基本概念听评课记录
- 人教版数学七年级下册5.3.2-2《命题、定理、证明2》听评课记录1
- 一年级下数学听评课记录
- 湘师大版道德与法治九年级下册1.2《充满活力的社会主义市场经济》(第1课时)听课评课记录
- 一二年级听评课记录
- 农用拖拉机考试题库
- GJB438C模板-软件开发计划(已按标准公文格式校准)
- 2023年政府采购评审专家考试真题及答案
- 云端数据加密与密钥管理解决方案
- 毒麻药品试题答案
- 元明时期左江上思州黄姓土司问题研究
- 传统体育养生学
- DB4401∕T 33-2019 电梯托管标准化管理规范
- 松原市人民政府关于印发松原市招商引资服务公司组建工作实施方案的通知
- 义工财务管理制度范文
- 西安旅游景点介绍PPT模板(推荐)
评论
0/150
提交评论