![《第十讲列联表》课件_第1页](http://file4.renrendoc.com/view10/M03/29/2A/wKhkGWefE5iAH0tWAAHxp58RqR4871.jpg)
![《第十讲列联表》课件_第2页](http://file4.renrendoc.com/view10/M03/29/2A/wKhkGWefE5iAH0tWAAHxp58RqR48712.jpg)
![《第十讲列联表》课件_第3页](http://file4.renrendoc.com/view10/M03/29/2A/wKhkGWefE5iAH0tWAAHxp58RqR48713.jpg)
![《第十讲列联表》课件_第4页](http://file4.renrendoc.com/view10/M03/29/2A/wKhkGWefE5iAH0tWAAHxp58RqR48714.jpg)
![《第十讲列联表》课件_第5页](http://file4.renrendoc.com/view10/M03/29/2A/wKhkGWefE5iAH0tWAAHxp58RqR48715.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十讲列联表第一节概念1、研究内容1〕研究两定类变量的关系2〕为研究y的分类是否与x之分类有关,将数据先按x分类,再分别统计x分类情况下y的分类。3〕按两个定类变量进行交叉分类的频次分配表,即二维列联表。4、列联表的一般形式Nij:x=xiy=yj时所具有的频次yxx1x2...xcy1N11N21...Nc1y2N12N22...Nc2............yrN1rN2r...Ncr学生上网调查
(统计各项比例,能发现什么问题?〕男生女生聊天玩游戏网恋学习2020505015151515
2、列联表中变量的分布1〕联合分布对于二变量来说,为了知道分布,集合中的变量值,必须同时具有x和y两个变量的取值。〔x1y1N11〕〔x2y2N12〕〔x1yrN1r〕此称联合分布〔xiyjNij〕〔xcyrNcr〕Nij表示频次时联合频次分布表表示概率时联合概率分布表后者可以通过前者求出2〕边缘分布:对联合分布进行简比,只研究其中某一变量的分布,而不管另一变量的取值,这样就得到边缘分布。按行加总y的边缘分布:按列加总x的边缘分布:3〕条件分布:将其中一个变量控制起来取固定值,再看另一变量的分布,即条件分布。控制x时,条件分布中的每一项都以边缘分布的为分母控制y时,条件分布中的每一项都以边缘分布的为分母3、列联表中的相互独立性:1〕列联表研究定类变量之间的关系,实际上是通过条件分布的比较进行的。如果两个变量之间没有关系,那么称变量之间是相互独立的。2〕如果两个变量之间是相互独立的,那么必然存在变量的条件分布与其边缘分布相同。条件分布=边缘分布是列联表检验的根底:〔控制x时〕第二节列联表的检验一、原假设:将总体中变量间无关系或相互独立作为检验的原假设。总体和未知时,用样本和代替。二、统计量
~统计量的讨论1、对于2×2列联表,由于格数过少,为减少作为离散观测值与作为连续型变量x值之间的偏差,可作连续性修正:2、二项总体统计量为总体成数男女休闲爱好男女泡吧8030逛商店2070对开卷考试的看法态度赞成反对人数60403、对多项总体:统计量:~4、使用统计量对列联表进行检验,每一格值的要保持在一定数目之上。如果有的格值过小,那么在计算值时值的波动就会较大。每格要求:处理方法:将期望值偏小的格值合并右例,做检验。Eij203031nij182942注意:列联表就其检验内容来看是双边检验,但从形式上看,却又很像单边检验。其判断的内容仅是变量间似乎否存在关系。至于方向,由于列联表属定类变量,因此是不存在的。列联表检验步骤1、2、统计量:~3、4、比较例:以下是老、中、青三代对某影片的抽样,能否认为三代人对该影片评价有显著差异老中青很高453921一般472622第三节列联强度一、变量间的相关1、列联表中的频次分布情况,不仅是检验是否存在关系的依据,同时也是度量变量间关系强弱的依据。相关性程度越高,说明社会现象与社会现象间的关系愈密切。2、列联表中变量间的关系的强度分析,可以将频次转化为条件分布,然后比较自变量取不同值时,因变量条件分布的不同。例右表中,男生上网玩游戏的比例高于女生;而上网聊天的比例低于女生;想一想,当x取值大于2时,怎样比较?y\x男生女生玩游戏聊天4067%1025%3033%3075%二、2×2表——系数和Q系数列联表中两个变量都只有二种取值时,就是2×2表当变量间无关系时〔独立〕对于2×2表,无论系数或Q系数,都以差值为根底进行讨论,同时,也把关系强度的取值范围定义在之间。yxabcd
1、系数——当两变量相互独立——b、c为零,值最大1a、d为零,值最小-1——一般情况前例中计算2、Q系数当a、b、c、d中有一个是零时,那么对应的实际情况是配对样本研究例3、、Q系数的选择当自变量的不同取值都会影响因变量时,用系数。当存在控制组时,用Q系数新政策前新政策后正点迟到501005004、列联表1〕以值为根底的相关性测量期望频次是基于无相关前提下计量出来的,因愈大,表示变量间距离无相关性愈远。值构成系数其与2×2表中系数是一致,2×2表中是表中系数的特例。由于表的数增多后,值增加,没有上限,无法比较,因此以c系数修正。
c值在[0,1]但永远小于1,又出现了v系数:V的取值:例:c=2r=4求系数,c系数,v系数再例:练习习题三、四。2〕以减少误差比例为根底的相关性测量PRE不受变量层次的限制,通过现象之间的关系研究,从一个现象预测另一个现象。:不知y与x有关系时,预测y的全部误差:知道y与x有关系后,用x去预测y的全部误差表示所减少的相对误差,越大表示y与x关系越密切。PRE的取值范围:PRE=0:两变量是无相关〔知道x与否无助于y的预测,误差不变〕PRE=1:两变量是全相关〔知道x与y有关系后,可以消除预测的全部误差〕0<PRE<1:其他:不知y与x有关,用y的边缘和的最大值去猜y值,猜中的频次会更多。全部误差为::知道有关后,先看它属于x的哪一类,然后用这一类的众值去猜y值,误差为两种系数:1〕系数即:的取值范围:x与y无相关:;x与y全相关:例:上网爱好与性别〔100人〕男女聊天103040游戏4020605050100值的非对称性:1〕以x为自变量,用对y的预测来定义PRE,所得值称作2〕以y为自变量,用对x的预测来定义PRE,所得值称作3〕如果x和y孰因孰果不明显的情况,这时可同时计算和,并取其平均值,作为x和y间的相关程度。系数:对和的定义比系数又有修正:当不知道x与y有关系预测y时,充分考虑到y值边缘分布所提供的信息。的取值范围:x与y无相关:〔边缘分布与条件分布相同〕x与y全相关:〔各行、各列均只有一个不为0的频次〕以前例为参照的推导:1、不知x与y有关:猜游戏与聊天:用边缘分布:40%,60%随机指派40人,猜对游戏的人数40×40/100=16猜错的人数40-40×40/100=40〔1-40/100〕=24同理:随机指派60人,猜对聊天的人数60×60/100=36猜错的人数60-60×60/100=60〔1-60/100〕=24E1即为猜错人数之和。推广:知道x与y有关后:用y的条件分布来猜y值当x=男生时随机10人,猜对聊天的人数:10×10/50猜错的人数:10-10×10/50随机40人,猜对游戏的人数:40×40/50猜错的人数:40-40×40/50猜错二者相加:=〔10-10×10/50〕+〔40-40×40/50〕
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年王比颗粒项目可行性研究报告
- 2025年度公路工程施工现场临时用电合同
- 2025年度大型体育场馆设施租赁管理合同范本
- 2025年度智能交通系统设计保密协议
- 2025年最高额抵押担保合同:规范抵押权实现与抵押物处置
- 2025年度车辆购置担保合同
- 个人原因离职申请书
- 2025年度合伙经营海鲜餐厅合同
- 2025年度建筑施工安全风险评估与控制合同
- 2025年度大型户外活动策划与搭建服务合同范本
- 诗词写作入门课件
- 2023年上海青浦区区管企业统一招考聘用笔试题库含答案解析
- 2023版押品考试题库必考点含答案
- 植物之歌观后感
- 空气能热泵安装示意图
- 建筑工程施工质量验收规范检验批填写全套表格示范填写与说明
- 2020年中秋国庆假日文化旅游市场安全生产检查表
- 昆明天大矿业有限公司寻甸县金源磷矿老厂箐-小凹子矿段(拟设)采矿权出让收益评估报告
- 心有榜样行有力量 -从冬奥冠军徐梦桃身上感受青春奋斗初中主题班会
- GB/T 3860-1995文献叙词标引规则
- 七年级英语下册阅读理解10篇
评论
0/150
提交评论