版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
会计学1第分类变量的推断第7章分类变量的推断7.1一个分类变量的拟合优度检验
7.2两个分类变量的独立性检验
7.3两个分类变量的相关性度量
c2test第1页/共43页2021-6-20学习目标一个分类变量的拟合优度检验两个分类变量的独立性检验应用2检验应注意的问题两个分类变量的相关性度量
用SPSS进行2检验第2页/共43页2021-6-20性别与是否逃课有关系吗?读完四年大学,一次课也没有逃过,这样的学生恐怕不多2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取150名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生逃课情况的汇总表如下第3页/共43页2021-6-20性别与是否逃课有关系吗?这里涉及到两个分类变量,一个是逃课情况,一个是性别根据上面的数据,你认为性别与逃课与否有关系吗?如何来检验两个分类变量之间是否存在关系呢?学完本章内容就很容易解决这样的问题第4页/共43页7.1一个分类变量的拟合优度检验
7.1.1期望频数相等
7.1.2期望频数不等
第7章分类变量的推断第5页/共43页2021-6-20利用Pearson-2统计量来判断某个分类变量各类别的观察频数分布与某一理论分布或期望分布是否一致的检验方法比如,各月份的产品销售量是否符合均匀分布不同地区的离婚率是否有显著差异也称为一致性检验(testofhomogeneity)该检验也可用于判断各类别的观察频数分布是否符合泊松分布或正态分布等什么是拟合优度检验?
(goodnessoffittest)第6页/共43页7.1.1期望频数相等7.1一个分类变量的拟合优度检验第7页/共43页2021-6-20【例7-1】为研究消费者对不同品牌的牛奶是否有明显偏好,一家调查公司抽样调查了500个消费者对4个品牌的偏好情况,得到的结果如下表所示。检验消费者对牛奶品牌的偏好是否有显著差异(=0.05)拟合优度检验
(期望频数相等)第8页/共43页2021-6-20拟合优度检验
(期望频数相等)第1步:提出假设
H0:观察频数与期望频数无显著差异(无明显偏好)H1
:观察频数与期望频数有显著差异(有明显偏好)第2步:计算2统计量自由度df=类别个数-1第9页/共43页2021-6-20拟合优度检验
(期望频数相等)2统计量计算表第10页/共43页2021-6-20拟合优度检验
(期望频数相等)第3步:做出决策由于自由度=4-1=3,利用Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为6.22366E-12,由于P值接近于0。拒绝原假设,表明消费者对牛奶品牌的偏好有显著差异第11页/共43页2021-6-20拟合优度检验
(使用SPSS—期望频数相等)
第1步:先指定“频数”变量点击【Data】→【Weight-Cases】,选择
【Weightcasesby】,将“频数”(本例为人数)
选入【FrequencyVariable】,点击【OK】
第2步:选择菜单:【Analyze】→【NonparametricTest】→【ChiSquare】,进入主对话框第3步:将频数变量选入(本例为人数)【TestVariableList】。点击【OK】用SPSS进行检验SPSS第12页/共43页2021-6-20拟合优度检验
(使用SPSS)近似的显著性水平(Asymp.Sig.)即为P值。由于P值接近于0。拒绝原假设,表明消费者对牛奶品牌的偏好有显著差异第13页/共43页7.1.2期望频数不等7.1一个分类变量的拟合优度检验第14页/共43页2021-6-20【例7-2】一项针对全国的房地产价格调查表明,城镇居民对房价表示非常不满意的占15%,不满意的占45%,一般的占25%,满意的占9%,非常满意的占6%。为研究一线大城市的居民对房地产价格的满意程度,一家研究机构在某城市抽样调查300人,其中的一个问题是:“您对目前的住房价格是否满意?”调查共设非常不满意、不满意、一般、满意、非常满意5个选项。调查结果的频数分布如下表所示。检验该城市居民对房屋价格满意度评价的频数与全国的调查频数是否一致拟合优度检验
(期望频数不等)第15页/共43页2021-6-20拟合优度检验
(期望频数不等)第1步:提出假设
H0:该城市居民对房屋价格的评价频数与全国的评价频数无显著差异
H1
:该城市居民对房屋价格的评价频数与全国的评价频数有显著差异第2步:计算期望频数和2统计量自由度df=类别个数-1第16页/共43页2021-6-20拟合优度检验
(期望频数不等)期望频数计算表第17页/共43页2021-6-20拟合优度检验
(期望频数不等)2统计量计算表第18页/共43页2021-6-20拟合优度检验
(期望频数不等)第3步:做出决策由于自由度=5-1=4,利用Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为0.102662,由于P>0.05。不拒绝原假设,没有证据表明该城市居民对房屋价格满意度的评价与全国有显著差异第19页/共43页2021-6-20拟合优度检验
(使用SPSS—期望频数不等)第1步:先指定“频数”变量第2步:选择菜单:【Analyze】→【NonparametricTest】→【ChiSquare】,进入主对话框第3步:将频数变量选入【TestVariableList】第4步:在【ExpectedValues】下选择【Values】,并将相应的期望比例(本例为全国的调查比例)
依次输入到框内并点击【Add】(每次只能输入1个,并点击【Add】,然后在输入另一个,再点击【Add】…)。点击【OK】用SPSS进行检验SPSS第20页/共43页2021-6-20拟合优度检验
(使用SPSS)近似的显著性水平(Asymp.Sig.)即为P值。由于P>0.05。不拒绝原假设,没有证据表明该城市居民对房屋价格满意度的评价与全国有显著差异第21页/共43页7.2两个分类变量的独立性检验
7.2.1列联表与2独立性检验
7.2.2应用2检验应注意的问题第7章分类变量的推断第22页/共43页7.2.1列联表与2独立性检验
7.2两个分类变量的独立性检验第23页/共43页2021-6-20研究两个分类变量时,每个变量有多个类别,通常将两个变量多个类别的频数用交叉表的形式表示出来一个变量放在行(row)的位置,称为行变量,其类别数(行数)用r表示另一个变量放在列(column)的位置,称为列变量,其类别数(列数)用c表示这种由两个或两个以上分类变量交叉分类的频数分布表称为列联表(contingencytable)一个由r行和c列组成的列联表也称为rc列联表例如,本章开头的案例中,行变量“逃课情况”有两个类别,列变量“性别”也有两个类别,这就是一个22列联表什么是独立性检验?
(testofindependence)第24页/共43页2021-6-20对列联表中的两个分类变量进行分析,通常是判断两个变量是否独立该检验的原假设是:两个变量独立(无关)如果原假设被拒绝,则表明两个变量不独立,或者说两个变量相关独立性检验的统计量为什么是独立性检验?
(testofindependence)自由度df=(r-1)(c-1)第25页/共43页2021-6-20【例7-3】利用本章开头关于学生逃课情况调查的数据,如下表所示。检验性别与逃课情况是否独立2独立性检验
(例题分析)第26页/共43页2021-6-202独立性检验
(例题分析)第1步:提出假设
H0:性别与是否逃课独立
H1
:性别与是否逃课不独立第2步:计算期望频数和2统计量RT为给定单元格所在行的合计频数;CT为给定单元格所在列的合计频数;n为样本量第27页/共43页2021-6-202独立性检验
(例题分析)第2步:计算期望频数和2统计量第28页/共43页2021-6-202独立性检验
(例题分析)第3步:做出决策由于自由度=(2-1)(2-1)=1,利用Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为0.159372,由于P>0.05。不拒绝原假设,可以认为性别与逃课情况独立第29页/共43页2021-6-202独立性检验
(使用SPSS)@将列联表中的数据转换为原始数据形式
第1步:选择【Analyze】→【DescriptiveStatistics-
Crosstabs】,进入主对话框第2步:将行变量(本例为“逃课情况”)选入【Row(s)】,将列变量(本例为“性别”)选入【Column(s)】(行列可以互换)第3步:点击【Statistics】并选中【Chi-square】;点击
【Continue】返回主对话框点击【Cells】,在【Counts】下选中【Expected】,点击【Continue】返回主对话框。点击【OK】用SPSS进行检验SPSS第30页/共43页2021-6-202独立性检验
(使用SPSS)近似的显著性水平(Asymp.Sig.)即为P值。由于P>0.05。不拒绝原假设,可以认为性别与逃课情况独立第31页/共43页7.2.2应用2检验应注意的问题7.2两个分类变量的独立性检验第32页/共43页2021-6-20在应用2检验时,要求样本量应足够大,特别是每个单元格的期望频数不能太小,否则应用应检验可能会得出错误的结论从2统计量的公式可以看出,期望频数在公式的分母上,如果某个单元格的期望频数过小,统计量的值就会变大,从而导致拒绝原假设应用2检验时对单元格的期望频数有以下要求如果仅有两个单元格,单元格的最小期望频数不应小于5。否则不能进行2检验单元格在两个以上时,期望频数小于5的单元格不能超过总格子数的20%,否则不能进行2检验如果出现期望频数小于5的单元格超过20%,可以采取合并类别的办法来解决这一问题应用2检验应注意的问题第33页/共43页7.3两个分类变量的相关性度量
7.3.1系数和Cramer’sV系数
7.3.2列联系数第7章分类变量的推断第34页/共43页7.3.1系数和Cramer’sV系数7.3两个分类变量的相关性测量第35页/共43页2021-6-20主要用于22列联表的相关性测量计算公式为例7—3的计算结果,得到的性别与逃课情况两个变量之间的系数为0.114891。由于很小,表明性别与逃课情况不存在相关关系。这与独立性检验的结论是一致的系数
(
coefficient)第36页/共43页2021-6-20由Cramer提出,计算公式为Cramer’sV系数的取值范围总是在0~1之间当两个变量独立时,V=0;当两个变量完全相关时,V=1如果列联表的行数或列数中有一个为2,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学生体适能提升的多样化教学方法探讨
- 2025年押证不押车健身贷款合同为健身创业提供有力支持3篇
- 教育领域内儿童心理健康的新挑战及应对策略
- 2025年度环保材料门头装修施工合作协议书2篇
- 意境感受在小学古诗词背诵中的促进作用
- 教育信息化与学校环境卫生管理的融合探讨
- 德育工作与心理健康教育相结合的实践案例
- 教育心理学在实验教学与职业素养培养中的运用
- 2025年建筑材料销售订购合同规范范本
- 信息获取有来源(说课稿)2024-2025学年陕教版信息技术三年级上册
- 2023年上海高中物理合格考模拟试卷一含详解
- 2022版义务教育(地理)课程标准(附课标解读)
- 2024年滑雪用品行业分析报告及未来发展趋势
- 经方治疗脑梗塞的体会
- 新版DFMEA基础知识解析与运用-培训教材
- 制氮机操作安全规程
- 衡水市出租车驾驶员从业资格区域科目考试题库(全真题库)
- 护理安全用氧培训课件
- 《三国演义》中人物性格探析研究性课题报告
- 注册电气工程师公共基础高数辅导课件
- 土方劳务分包合同中铁十一局
评论
0/150
提交评论