版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.1,Chi-square,2,卡方检定的基本介绍,卡方检定的两个主要用途,卡方检定应注意的问题,3,A chi-square test,alsowrittensistest(x读作希腊文字,卡) isanystatisticalhypothesisthereconsinthesprongdistionoftheteststatisticisachi-squaredistionwhennullshypothesistrue . 在chi-square is a non-parametric test .all variables are categorical .4,chi-square is
2、 a n 1985,112 ),具体地说,比较实际次数和期待次数(或理论次数)之间是否有显着差异。 期望次数是基于某种理论模式,或者是基于关于特征分布的假设而期望的,或者是应该获得的次数。5,卡方检定的程序,1 .零假说H0和预备假说h1,2 .根据理论经验和理论分布计算希望次数,卡方检定的零假说,实际次数和希望次数之间没有差异(根据用途不同,零假说的陈述方法有所不同),预备假说,实际次数和希望次数之间有差异根据自由度和显着水平o,从卡方分布表中找到相应的卡方阈值。 如果计算出的卡方值大于卡方阈值,则拒绝零假设,相反地接受零假设。 3 .根据实际度数和希望度数来计算样本的卡方值并计算卡方值的基
3、本公式: X2卡方值O指的是实际的次数或观测次数E指的是希望的次数或理论次数,是英国统计学家Karl Pearson首次提出的Pearson x2 7“chi-square测试,testforguddentionoffitofthedata,testforgroudentindence .8,Chi-square for goodness of fit, 科学研究中可能有很多影响一个东西的因素,在一个检查中,只有一个因素的变化被称为单因素检查,一个以上的因素的检查被称为多因素检查(盛步骤,1989; 241 .我们必须经常验证某个实际要素实际出现的频率和所希望的频率是否有显着差异。 这是统计学
4、上的适合度检查(韩宝成,2000; 155 ),9,thistesisusedwhentheresisonsonlectorectricalvidewithtwoormorelevels .目的:验证实际次数是否与预期次数一致。 两种常见的单因素卡方适合度检查:检查观测数据间的差异度,检查样品分布和理论分布模型的适合度,10、检查观测数据间的差异度,观测数据间的差异度检查是比较简单的单因素检查,被分为多个项目的单因素度数之间是否有显着差异11、一所大学的英语老师为了了解学生学习英语的动机,进行了很小范围的问卷调查。 此次问卷调查共计6件,调查对象为普通高中英语以外的150名大学生,调查结果如下
5、表第2行所示进行了整理。 从调查结果中有明显的显着差异吗? 如果有显着差异的话,其主要动机是什么?12,分析顺序:1.H0 :学生学习英语的动机没有显着差异。 2 .计算希望度数。 根据零假说,如果学生学习英语的动机没有显着差异,150名学生选择6个项目的概率相等。 希望度数=总数/分类项,3 .计算卡方值。 基于X2=33.40,13,4 .自由度和显着性水平找到适当的平方阈值,并且自由度可以理解我们在某种意义上检查时所依据的独立信息的数量(Woods,1986 )。 计算自由度式为df=k-1 (k为组数),df=6-1=5,o=0.05,卡方阈值为12.6,5 .结论: X2=33.4远
6、远大于卡方阈值,因此拒绝零假设的学生在学习英语的动机上有显着差异。 通过观察可知动机是通过四级的人数最多的,学生学习英语的主要动机是因为通过四级。14、验证样本分布和理论分布模型的适合度,另一个重要的应用是验证样本分布是否适合于特定分布模型。正规性检查:检查实际的次数分布和期待次数分布是否有显着差异,实际次数是指样品各组数据的实际分布次数,期待次数是指样品来自正规的母集团时各组数据应具有的次数,实际次数和期待次数没有差异如果样品来自正态分布,两者差异显着,表示样品来源的整体分布不正态。 在进行正规检查之前,首先把样本整理成组数分布表,第一列是数据组,第二列是迷人的实数o,2 .然后假定样本来源
7、的整体是正态分布,计算各组的期待次数是正规检查的关键。 3 .在计算了希望次数后,根据公式计算X2值,4 .根据设定的有效水平和自由度,根据卡方分布表求出卡方阈值。 这种正规性检查的自由度是从组数中减少3 K-3,5、5、5。 如果卡方值小于阈值,则检验没有显着意义,即不能推翻零假设,证明样本来源于整体正规性。 相反,拒绝零假说,表示样本没有来自整个正规。16、希望次数计算顺序:1 .计算样品的平均值和标准偏差,2 .将每个组的上限转换为标准点z (即上限偏离平均值的标准偏差单位数),从正态分布表中检测对应的正态曲线中的面积a,3 .求出每个组的面积,该面积为每个组的希望次4 .将每个组的希望
8、次数的比例乘以样本容量(PN ),即求出每个组的希望次数e。注意:如果某个组的希望次数小于5,则与相邻组的希望次数合并,直到合并后的希望次数达到5以上。 否则,会影响卡方检定的可靠性。 注: a是夹在z值和平均值之间的面积,从一组上限标准分对应面积中减去下一组上限对应面积,以17、a级30名学生的某精读考试成绩为例,说明如何用卡方检定来验证该样品满足正规整体的条件的方法成绩如下:数据的平均为73.823标准偏差为7.661,18,进行卡方检验:1 .零假设H0,样品从正态分布整体随机样品,2 .显着水平o为0.01。 注意:卡方检定要求每个分数段的频率次数有足够的期望值(至少5个以上)。 不那
9、样的话,卡方值就会变大。 因此,表中的第一组和第二组被组合,第五、第六、第七组被组合。 这种组数为4个,自由度df=4-3=1,根据查卡方向分布表,阈值为6,64,3 .卡方向值3.07小于阈值6,64,因此,验证没有意义,即不能复盖零假设,该样本来自正规整体除了适合性检查之外,chi-squarefortestinggroupindence还被用于分析两个或更多元素之间的相关性的有无和判定元素之间的差异是由采样引起的随机差异还是由不同的总体引起的真实差异、thetestforgrougroncedisusedwhentheteraretoromorronelectionallofthevar
10、iablesarecategorical .四表独立性检查,20,表独立性检查, 独立性检查所使用的数据一般被整理成列连接表的形式,一个分类基准把数据分成几列,另一个分类基准把数据分成几行,矩阵交叉形成一个方格(cell )的各行和各列有合计,写在一行或一列的末尾,称为“界限合计” 因为所有极限的总和是所有数据的数量和样本容量n,列表行数一般用r,列数用k表示,所以一个列表是rk,例如上表是23,21,独立性检查步骤:1 .叙述零假设的H0 :两个分类标准完全独立,2 .有效水平o,3 计算每一个网格的希望次数,例如设第一网格a的希望次数为(A B C)(A D)/N,按照惯例,希望次数一般是
11、开放的、22,4 .卡方值x 2,5 .自由度的确定: df=(r-1)(k-1 ),6 .在卡方分布表中查找与o和df相对应的值。 如果X2大于阈值,则推翻零假说。 23、我们想知道日常书信(Family Letters,FL )和事务书信(Business Letters,BL )的词长和信件类别有无联系(或是否独立)。 现在,从两种信中分别随机选择500词和600词,把词长按下表分类的话,2音节以下(2)、34音节、5音节以上(5)的词长的次数分布如下表所示。 (204.5 )、(159.1 )、(136.4 )、(136.6 )、(190.9 )、解析顺序:1.0假设:词长独立于信的类
12、型,即两者不相关。 2 .计算希望次数。 决定(245.5 )、24、3 .自由度,设定有效水平,该表的数据列连接表根据23式计算df=(r-1)(k-1)=12=2,设定有效水平o=0.05,4,4 .卡方阈值5.99,3 .卡方值,计算x2=2 .25,四表独立性检查,四表也称为依赖表,一种22形式的列联表中22个四表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表的表对于b、b、c、d、n=ab、c、d、4个表,自由度为(2-1)(2-1)=1、26, 假设(4.8)、(5.2)、(7.8)、(7.2)、FL BL、SIM COM、1213、101525,显着水平为0.01,两种信息在句型下的次数分布有显着差异吗? 1 .零假设:消息类型和句型完全独立。 2 .计算期待次数,计算卡方值,用简单的公式计算卡方值,6.64,3 .自由度为1 .有效水平为0.01,卡方分布表的卡方阈值为6.64,卡方阈值大于阈值,推翻零假设,即信的类型和句的用两个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论