配合度检验独立性检验与同质性检验_第1页
配合度检验独立性检验与同质性检验_第2页
配合度检验独立性检验与同质性检验_第3页
配合度检验独立性检验与同质性检验_第4页
配合度检验独立性检验与同质性检验_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本资料来源第十章χ2检验χ2检验(chi-squaretest)是专门用于计数数据的统计方法。由于这类数据在整理时,常常以列联表(contingencytable)或交叉表(crosstabulation)呈现,因此这种分析方法又被称为列联表分析或交叉表分析。χ2检验用于对点计而来的离散型数据资料进行假设检验,对总体的分布不做要求,也不对总体参数进行推论,因此属于自由分布的非参数检验。χ2检验是对由样本得来的实际频数与理论频数的分布是否有显著性差异所进行的检验。其计算公式为:(15.1)三大类别配合度检验独立性检验同质性检验配合度检验把实得的点计数据只按一种分类标准编制成表就是单向表。对单向表的数据所进行的χ2检验,称为单向表的χ2检验,也称为配合度检验(goodnessoffittest)。独立性检验独立性检验主要用以两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量的关联性和依存性问题。如人的血型和人的性格是否有关联。把两个因素实得的点计数据按两种分类标准编制成的表就是双向表。对双向表的数据所进行的χ2检验,叫作双向表的χ2检验,即双因素的χ2检验。两个以上因素形成的表称为多维列联表。重点是两因素的独立性检验。假如双向表中横行所分的组数用R表示,纵列所分的组数用C表示,那么,双向表的χ2检验也称为R×C表的χ2检验。在双向表的χ2检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种χ2检验称为独立性检验。如果是判断几次重复实验的结果是否相同,这种χ2检验称为同质性检验。(一)双向表χ2检验的计算1.理论频数的计算双向表χ2检验中,理论频数的计算公式为(16.1)

公式中,fxi表示横行各组实际频数的总和

fyi表示纵列各组实际频数的总和

N表示样本容量的总和例1:家庭经济状状况属于上上、中、下下的高三毕毕业生,对对于是否愿愿意报考师师范大学有有三种不同同的态度((愿意、不不愿意、未未定),其其人数分布布如表10-6。问学生是是否愿意报报考师范大大学与家庭庭经济状况况是否有关关系?表10-6不同家庭经经济状况学学生报考师师范大学的的不同态度度家庭经济状况对于报考师范大学的态度总和愿意不愿意未定上中下18201827197102011555936总和565341150解题过程解:1.提出假设H0:学生是否否愿意报考考师范大学学与家庭经经济状况无无关H1:学生是否否愿意报考考师范大学学与家庭经经济状况有有关2.选择检验统统计量并计计算对计数数据据进行差异异检验,可选择χ2检验理论频数计计算计算理论频频数允许有有小数,因因为χ2分布已被作作为连续型型的分布看看待。表10-7不同家庭经经济状况学学生报考师师范大学的的不同态度度家庭经济状况对于报考师范大学的态度总和愿意不愿意未定上中下1820182719710201155=fx159=fx236=fx3总和56=fy153=fy241=fy3150=N20.5312.7222.0313.4419.4320.8515.0316.139.84计算表10-8学生报考师师范大学的的态度与家家庭经济状状况的χ2检验计算表表愿意-上1820.53-2.536.40090.3118愿意-中2022.03-2.034.12090.1871愿意-下1813.444.5620.79361.5471不愿意-上2719.437.5757.30492.9493不愿意-中1920.85-1.853.42250.1641不愿意-下712.72-5.7232.71842.5722未定-上1015.03-5.0325.30091.6834未定-中2016.133.8714.97690.9285未定-下119.841.161.34560.1367总和15015010.48023.统计决断双向表的自自由度:df=(R-1)(C-1)查χ2值表,当df=(3-1)(3-1)=4时计算结果为为:χ2=10.48*9.49<χ2=10.48<13.3,则0.05>P>0.01结论:学生生是否愿意意报考师范范大学与家家庭经济状状况有显著著关系。双向表的χ2值除用理论论频数方法法计算外,,还可以用用下式由实实际频数直直接求得::公式中,foi表示双向表表中每格的的实际频数数(16.2)将例1数据用公式式(10.8)计算=10.48家庭经济状况对于报考师范大学的态度总和愿意不愿意未定上中下18201827197102011555936总和565341150表10-8不同家庭经经济状况学学生报考师师范大学的的不同态度度双向表的独立性χ2检验和同质性χ2检验,只是是检验的意义不同,而方法完全相相同。对于同一组组数据所进进行的χ2检验,有时时既可以理理解为独立立性χ2检验,又可可以理解为为同质性检检验,两者者无根本区区别。第十四章抽样原理及及方法统计推断的的可靠性与与下列因素素有关1.数据的质量量样本对总体体的代表性性,既涉及及到抽样方法,又涉及到样本的容量量。2.运用统计方法及数据处理理的准确性性3.样本对总体体的代表性在收集数据据的过程中控制制选择恰当的的方法通过抽样设计控制抽样设计的的原则抽样设计的的要求是样样本对研究究总体有良良好的代表性,即即样样本本的的构构成成与与总总体体保保持持一一致致。。为为了了保保证证这这一一点点,,抽抽样样时时必必须须遵遵循循随机机化化(randomization)的的基基本本原原则则。。所谓谓随随机机化化原原则则,,是是指指在在抽抽样样时时,,样样本本中中的的每每一一个个体体都都是是按按照照随随机机的的原原理理被被抽抽取取的的,,总总体体中中每每一一个个体体被被抽抽到到的的可可能能性性是是相相等等的的。。一..几几种种重重要要的的随随机机抽抽样样方方法法1.简单单随随机机抽抽样样(simplerandomsampling)简单单随随机机抽抽样样就就是是按按照照随随机机原原则则直直接接从从总总体体中中抽抽取取出出若若干干个个单单位位作作为为样样本本。。简单单随随机机抽抽样样法法能能保保证证总总体体中中的的每每一一个个对对象象都都有有同同等等的的被被抽抽取取到到的的可可能能性性,,并并且且个个体体之之间间都都相相互互独独立立。。这这是是在在总总体体异异质质性性不不是是很很大大而而且且所所抽抽取取的的样样本本较较小小时时经经常常采采用用的的一一种种形形式式。。简单单随随机机抽抽样样法法的的局局限限是是::当当样样本本规规模模小小时时,,样样本本的的代代表表性性较较差差。。简单单随随机机取取样样有有两两种种基基本本方方式式:抽签签法法(drawinglots)随机机数数字字表表法法(randomnumbertable)2.等等距距抽抽样样等距距抽抽样样(intervalsampling)也称称为为机机械械抽抽样样或或系系统统抽抽样样。。实实施施时时,,先先把把总总体体中中的的所所有有个个体体按按一一定定顺顺序序编编号号,,然然后后依依固固定定的的间间隔隔取取样样。。等距距抽抽样样可可以以保保证证样样本本的的成成分分与与总总体体一一致致,,但但随随机机性性不不如如单单纯纯随随机机抽抽样样法法。。应应用用中中可可将将两两种种方方法法结结合合使使用用。。3.分层随随机抽样样分层随机机取样简简称分层层抽样((stratifiedsampling或hierarchicalsampling),是是进行行大规规模研研究时时常常常使用用的抽抽样方方法。。分层抽抽样的的方法法:先将总总体按按照一一定标标准分分为若若干类类型((统计计上称称为层层),,再根根据各各层对对象的的数量量在总总体数数量中中所占占的比比例,,确定定从每每一种种类型型(层层)中中抽取取样本本的数数量,,然后后按随随机原原则和和所确确定的的各层层取样样的数数量,,从各各层中中取样样。做好分分层随随机取取样的的关键键:分类的的标准准要科科学,,要符符合实实际情情况。。各层层内的的差别别要小小,而而层与与层之之间的的差异异则越越大越越好。。计算各各层应应抽样样的个个体数数量的的计算算方法法:⑴.按按各层层比例例计算算公式中中,ni为第i层中被被抽取取的个个体数数量n为整个个研究究样本本中个个体的的总数数量Ni为第i层中对对象的的数量量N为总体体内个个体的的数量量(22.1)例1:为了调调查某某区重重点中中学720名高一一学生生的视视力,,首先先按视视力的的情况况将他他们分分成好(108人)、中(360人)、、差(252人)三三种水水平。。若用用分层层抽样样法抽抽取120人进行行调查查,问问各层层应抽抽多少少人??计算::⑵.最最佳配配置法法最佳配配置法法不仅仅考虑虑各层层的人人数比比例,,而且且考虑虑到了了各层层的标标准差差。当当各层层内的的标准准差已已知,,应该该在标标准差差大的的层内内多分分配而而在标标准差差小的的层内内少分分配抽抽样数数量。。最佳配配置法法可以以使得得到的的样本本具有有较好好的异质性性。在各层层内应应抽取取个体体数计计算公式中中,ni表示从从某一一层所所抽个个体数数n表示样样本容容量Ni表示某某层个个体总总数σi表示某某层标标准差差(22.2)当各个个σ没有现现成资资料可可以应应用时时,可可以先先从该该层抽抽一个个小样样本,,由这这一小小样本本计算算出的的样本本标准准差S对σ进行估估计。。(22.3)分层随随机取取样法法的优点是代表表性和和推论论的精精确性性较好好。它它适用用于总总体单单位数数量较较多,,并且且内部部差异异较大大的研研究对对象。。分层随随机取取样法法的局限性是要要求对对总体体各单单位的的情况况有较较多的的了解解,否否则就就难以以作出出科学学的分分类。。4.两阶阶段随随机抽抽样当总体体容量量很大大时,,直接接以总总体中中的所所有个个体为为对象象,从从中进进行抽抽样,,在实实际调调查或或研究究中存存在很很大困困难。。采用分阶段段的抽样方方法,可以以缩小实际际抽样的范范围,使实实际抽样工工作能够按按研究设计计的要求顺顺利进行。。两阶段随机机抽样(two-stagesrandomsampling)的一般过过程是:先先将总体分分成M个部分;第一阶段从这M个部分中随随机抽取m个部分作为为第一阶段段样本;第二阶段是分别从这这m个部分中抽抽取一定数数量(ni)的个体构构成第二阶阶段样本。。5.整群抽样样整群随机抽抽样是先将将总体各单单位按一定定的标准分分成许多群群(小组)),然后按按随机原则则从这些群群中抽取若若干群作为为样本。整群随机取取样法的优点是样本比较较集中,适适宜于某些些特定的研研究,尤其其是在教育育实验中常常用此法。。此外,在在规模较大大的调查研研究中,整整群随机取取样易于组组织,可节节省人力、、物力和时时间。整群随机抽抽样法的缺点是样本分布布不均匀,,代表性较较差。二.样本本容量的确确定(自学学)1.确定样本本容量的意意义在应用中应应根据研究究所要求的的精确度及及经费情况况确定样本本容量。如如果样本容容量过小,,会影响样样本对总体体的代表性性,增大抽抽样误差而而降低研究究推论的精精确性;样样本容量过过大,虽然然减小了抽抽样误差,,但可能增增大过失误误差,并且且增加不必必要的人力力物力资源源的浪费。。样本容量与与抽样误差差并不是直直线关系。。确定容量的的基本原则则是:在尽尽量节省人人力、经费费和时间的的条件下,,确保用样样本推断总总体达到预预定的可行行度及准确确性。2.总体平均均数估计样样本容量的的确定⑴.总体σ已知其中,最大大允许误差差为,可信度为为1-α。由有(22.4)可以看到,,当α确定之后,,总体标准准差和最大大允许误差差d是决定样本本容量的两两个因素。。⑵.总体σ未知由有当样本容量量n未确定时,,t值无法确定定,因此一一般采用尝尝试法。(22.5)尝试法求样样本容量的的过程⑴.将df=∞的t值代入公式式求出n1,⑵.将n1的t值代入公式式求出n2,……⑶.直至前后两两次求出的的n相同为止。。也可据S/d查附表20求出样本容容量例2:拟估计某市市高校四级级英语考试试成绩的总总体平均分分数。以往往考试成绩绩的标准差差为13,这次的估估计最大允允许误差为为2分,可信度度为95%,问应抽取取多大的样样本?例3:拟对某市初初中升入高高中入学考考试语文成成绩的总体体平均数进进行估计。。根据以同同等难度的的试题对同同等教育水水平的另一一城市部分分初中升入入高中入学学考试语文文成绩算出出的S=11.4。若要求估估计的最大大允许误差差为d=3,可信度为为99%,问样本容容量应为多多少?计算1.由t分布表查得得自由度度df=∞时,t1=2.5762.由t分布表查得得自由度度df=96-1时,t2=2.6293.由t分布表查得得自由度度df=100-1时,t3=2.627前后两次算算出的样本本容量相等等,因此n=100当估计出的的样本容量量比较大时时,可以直直接按公式式(22.4)计算而不不必采用尝尝试法。2.平均数显显著性检验验时

样本本容量的确确定⑴.总体σ已知在假设检验验中,要同同时考虑α错误和β错误,因此此将以上两式式相加为::若令δ=μ-μ0,则单侧检验:双侧检验:(22.6)(22.7)式中的α和β由研研究究者者预预先先确确定定,,α值要要比比β值小小。。一一般般α为0.05或0.01,而而β值一一般般确确定定为为0.10、0.20或0.30。对对同同一一个个α值,,单单侧侧和和双双侧侧时时的的Z临界界值值是是不不一一样样的的。。当样本容量已已知,α值及其他条件件也已确定,,则β就是确定值。。这时可以利利用有关公式式计算β值,从而对检检验的统计力力作出评价。。可以看到,在在平均数的假假设检验中,,当确定了α和β之后,样本的的容量n取决于总体标标准差σ和假设的总体体差异δ。与参数估计计相比,多考考虑了一个β因子,并且δ与参数估计中中的具有不同同的涵义。例4:某市高中入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论