6上机课第5讲 属性数据分析_第1页
6上机课第5讲 属性数据分析_第2页
6上机课第5讲 属性数据分析_第3页
6上机课第5讲 属性数据分析_第4页
6上机课第5讲 属性数据分析_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——6上机课第5讲属性数据分析

属性数据分析一、列联表分析—得到概括性信息二、属性变量的无关联性检验三、有序变量的关联性分析

四、FREQ过程

案例5.1性别与主修专业是否相关—P116案例5.2是否判死刑与种族是否相关——P119案例5.3工艺与产品质量是否有关系——P125案例5.4患病程度和牛群大小是否相关——P1302

变量的类型:1.名义变量2.有序变量(两个值的差没有意义)3.区间变量(间隔变量,譬如温度)4.比率变量(比例变量)

名义变量属性变量(定性变量、离散变量)有序变量

区间变量定量变量(连续变量)比率变量

属性数据由属性变量得到的数据都是属性数据.当我们研究的指标是一个属性变量,并希望用其他变量来说明或预计这个属性变量的取值时,不管用以说明的变量是属性的或连续的,使用的统计方法统称为属性数据分析.

对属性数据进行分析的目的:1.2.3.4.产生汇总分类数据列联表;检验属性变量间的独立性(无关联性);计算度量属性变量间的关联性统计量;对高维数据进行分层分析和建模.

注:(1)本章仅研究1-3.(2)使用SAS中FREQ过程

一、列联表分析几个概念:1.交织表(两个或两个以上变量的列联表)

2.双向表(两个变量的列联表)3.单元

4.单元频数

两个属性变量的列联表112n11n21

2n12n22

………

cn1cn2c

sumn1jn1jn2jn2j

r

nr1

nr2n2

……

nrc

nrjnrj

sumn1

nc

n

由原始数据生成列联表1.使用FREQ过程来生成列联表;

2.使用SAS菜单系统“分析员应用〞生成列联表(tableanalysis).

案例5.1性别与主修专业是否相关.书P116—原始数据表:属性变量:性别、

主修专业(统计专业和非统计专业).

程序:见属性数据分析中案例5.1

student1234567891011121314151617181920

sexmmfmffmmmfmfmmmfmmfm

majoryesnoyesnoyesyesnonoyesyesnoyesyesyesnoyesyesnonoyes

输出结果sexmajor

统计课程中学生的专业和性别

Frequency|PercentRowPctColPct|||no|yes|Total

|||f||||1|5.00|14.29|12.50|6|30.00|85.71|50.00|735.00

|||m|||7|35.00|53.85|6|30.00|46.15|1365.00

|

87.50|

50.00|

|||Total840.001260.0020100.00

由现成的汇总表生成列联表1.使用FREQ过程来生成列联表;注意:在FREQ过程中必需使用WEIGHT语句.2.使用SAS菜单系统“分析员应用〞生成列联表.注意:要给出频数变量cellCounts.

案例5.2是否判死刑与种族是否相关看书P119.数据如下表:种族

是否判死刑

白人19141

黑人17149

是否

程序:见属性数据分析中案例5.2

生成多个变量的交织表使用FREQ过程来生成列联表;

procfreqdata=welfarepage;tablescity*employ*politic*opinion;……run;

二、属性变量的无关联性检验1、属性变量无关联性的卡方检验假设:H0:行变量与列变量独立,H1:它们不独立

统计量:

2i1j1

r

c

(nijmij)mij

2

其中:

nij表示观测频数mij表示期望频数mijninjn

两个属性变量的列联表112n11n21

2n12n22

………………

cn1cn2c

sumn1jn1jn2jn2j

rsum

nr1n1

nr2n2

…………

nrc

nrjnrj

nc

n

(1)在H0成立时,当观测数据较大时,2统计量的分布近似听从自由度为(r1)(c1)的

2分布.(a)没有空单元(所有单元频数都不为0)(b)所有单元的期望频数均大于等于5(2)在H0成立时,观测频数nij与期望频数m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论