假设检验的逻辑与基本步骤_第1页
假设检验的逻辑与基本步骤_第2页
假设检验的逻辑与基本步骤_第3页
假设检验的逻辑与基本步骤_第4页
假设检验的逻辑与基本步骤_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验统计检验方法假设检验拟合优度检验因子分析聚类分析组合分析假设检验的逻辑得到原始数据之后,我们通过编辑、编码、输入、分析等步骤最后得到可以做为决策依据的信息;疑问:这个信息是不是只代表了这一次的取样特点?假设检验的逻辑例:为了对于荒野地区和国家公园的开发和控制。总共有一万人参加了调查,并回答了一系列问题。其中一个主要的问题是如何控制某些广受欢迎的漂流运动河流的人数。一种极端的政策是限制性非常强的政策,通过许可证制度,保护国家公园的荒野特征。另一种相反的极端政策是不受限制的使用这些荒地。这个问题用尺度的方法测量。假设检验的基本步骤问题的界定明确零假设和被择假设选择适当的检验方法和适当的概率分布选择临界值比较检验统计量和临界值作出判断,拒绝或接收假设检验的基本概念零假设与被择假设注:假设检验的目的不是质疑样本的统计量的计算结果。而是对样本统计量和总体参数假设之间的差作出一个判断假设检验的能力理想情况应该可以接收错误的零假设置信度假设检验的基本概念自由度:样本统计量不受约束的数据数量单尾检验和双尾检验注:假设检验的目的不是质疑样本的统计量的计算结果。而是对样本统计量和总体参数假设之间的差作出一个判断选择合适的概率分布假设检验组数/样本数检验目的统计检验频数一拟合优度卡方分布二独立性检验卡方比例一比较样本和总体各自的比例比较两个样本各自的比例tt均值一比较样本和总体各自的均值t二比较多个样本均值F方差一二比较样本方差和总体方差比较样本方差卡方F选择临界值显著性水平的概念(板书)显著性水平的选择没有简单的规则可循,通常选取接近于0的正数常用的显著性水平有1%5%和10%两种错误H0为真接受H0正确拒绝H0错误(弃真)H0为伪接受H0错误(取伪)拒绝H0正确人们当然希望这两类错误都很小,但是当样本容量n一定的时,第一类错误和第二类错误发生的概率是互补的。要同时要降低这两类错误,则要求增加样本容量。实际操作时是控制的大小来进行调整的。参数数检检验验———统统计计推推断断————平平均均数数分分析析统计计推推断断概念念根据据已已收收集集到到的的样样本本数数据据推推断断样样本本来来自自的的总总体体的的分分布布或或总总体体均均值值、、方方差差等等总总体体统统计计参参数数。。产生生原原因因总体体数数据据无无法法全全部部收收集集到到;;总体体数数据据虽虽能能全全部部收收集集到到,,但但将将要要耗耗费费大大量量的的人人力力和和物物力力。。统计计推推断断分类类参数数检检验验假设设总总体体分分布布已已知知,,根根据据样样本本的的参参数数推推断断总总体体的的参参数数。。非参参数数检检验验假设设总总体体分分布布未未知知,,根根据据样样本本的的分分布布推推断断总总体体的的分分布布。。平均均数数分分析析功能能用样样本本均均值值来来推推断断总总体体均均值值的的方方法法。。内容容单样样本本t检检验验两独独立立样样本本t检检验验两配配对对样样本本t检检验验一般般平平均均数数分分析析原理理检验验目目标标::通通过过计计算算样样本本均均值值来来估估计计总总体体均均值值是是否否为为某某个个确确定定的的值值。。前提提::大样样本本,,总总体体方方差差未未知知;;小样样本本,,要要求求总总体体服服从从正正态态分分布布。。原假假设设计算算检检验验统统计计量量;;根据据统统计计量量的的值值查查表表得得到到对对应应的的相相伴伴概概率率值值;;作出出判判断断::当,,拒拒绝绝,,总总体体均均值值与与检检验验值值之之间间存存在在显显著著差差异异;;当,,接接受受,,总总体体均均值值与与检检验验值值之之间间不不存存在在显显著著差差异异。。单样样本本t检检验验单样样本本t检检验验SPSS操操作作步步骤骤打开开单单样样本本t检检验验对对话话框框AnalyzeComparemeansOne-SampleTTest……选择择分分析析变变量量确定定待待检检参参数数确定定置置信信度度和和缺缺失失值值的的处处理理方方法法输出出t检检验验结结果果单样样本本t检检验验实例例对““休休闲闲调调查查1””中中的的““住住房房面面积积””变变量量进进行行单单个个样样本本的的t检检验验。。原原假假设设为为::城城市市居居民民的的户户均均住住房房面面积积为为38平平方方米米。。原理理检验验目目标标::根根据据样样本本数数据据对对它它们们来来自自的的两两独独立立总总体体的的均均值值是是否否有有显显著著性性差差异异进进行行推推断断。。前提提::两样样本本相相互互独独立立((个个案案数数目目可可不不同同,,变变量量值值顺顺序序可可更更改改))样本本来来自自的的两两个个总总体体服服从从正正态态分分布布原假假设设两两总总体体均均值值之之间间不不存存在在显显著著差差异异判断断两两总总体体的的方方差差是是否否相相等等((方方差差检检验验,,F检检验验))根据据判判断断结结果果,,决决定定t统统计计量量和和自自由由度度的的计计算算公公式式对两两样样本本的的均均值值差差进进行行t检检验验,,作作出出判判断断两独独立立样样本本t检检验验两独独立立样样本本t检检验验SPSS操操作作步步骤骤打开开两两独独立立样样本本t检检验验对对话话框框AnalyzeComparemeansIndependent-SamplesTTest……选择择分分析析变变量量确定定分分组组变变量量确定定分分组组变变量量的的取取值值确定定置置信信度度和和缺缺失失值值的的处处理理方方法法输出出t检检验验结结果果两独独立立样样本本t检检验验实例例1.用用““休休闲闲调调查查””中中的的数数据据分分析析不同同性性别别的被被调调查查者者家家庭庭的的住住房房面面积积是是否否有有差差异异。。2.用用““休休闲闲调调查查””中中的的数数据据分分析析初中中学学历历与与高高中中学学历历的被被调调查查者者家家庭庭的的住住房房面面积积是是否否有有差差异异。。((练练习习))3.用用““休休闲闲调调查查””中中的的数数据据分分析析40岁岁以以下下与与40岁岁以以上上被调调查查者者家家庭庭的的住住房房面面积积是是否否有有差差异异。。原理理配对对样样本本::同同一一样样本本的的某某个个变变量量进进行行前前后后两两次次测测试试所所获获得得的的两两组组数数据据,,或或是是对对两两个个完完全全相相同同的的样样本本在在不不同同条条件件下下进进行行测测试试所所获获得得的的两两组组数数据据。。检验验目目标标::根根据据样样本本数数据据对对它它们们来来自自的的两两配配对对总总体体的的均均值值是是否否有有显显著著性性差差异异进进行行推推断断。。前提提::两样样本本是是配配对对的的((个个案案数数目目相相同同,,变变量量值值顺顺序序不不能能随随意意更更改改));;样本来来自的的两个个总体体服从从正态态分布布;原假设设两两总总体均均值之之间不不存在在显著著差异异。求出两两总体体对应应观测测值的的差值值,得得到差差值序序列。。对差值值序列列的均均值进进行单单样本本t检检验,,判断断该均均值是是否与与零有有显著著差异异。根据差差值序序列的的t检检验判判断结结果。。两配对对样本本t检检验两配对对样本本t检检验SPSS操操作步步骤打开两两配对对样本本t检检验对对话框框AnalyzeComparemeansPaired-SamplesTTest……选择分分析变变量确定置置信度度和缺缺失值值的处处理方方法输出t检验验结果果两配对对样本本t检检验实例“贫困困调查查”中中的““满意意度1”是是贫困困人口口获得得低保保以前前的生生活满满意度度测量量结果果,““满满意度度2””是贫贫困人人口获获得低低保以以后的的生活活满意意度测测量结结果。。检验验获得得低保保前后后的生生活满满意度度是否否有变变化。。一般平平均数数分析析功能均值的的比较较和检检验过过程。。原理根据某某分类类变量量对数数据进进行分分组后后,通通过比比较各各组的的均值值的差差异的的大小小来确确定总总体中中这两两个变变量是是否相相关。。一般平平均数数分析析SPSS操操作步步骤打开平平均数数分析析对话话框AnalyzeComparemeansMeans……选择分分析变变量确定分分组变变量选择输输出的的统计计量输出平平均数数分析析结果果一般平平均数数分析析实例用“休休闲调调查””中的的数据据进行行不同同教育育水平平的被被调查查者的的户均均住房房面积积的平平均数数分析析。补充练练习1、某某轮胎胎厂的的质量量分析析报告告中说说明,,该厂厂某轮轮胎的的平均均寿命命在一一定的的载重重负荷荷与正正常行行驶条条件下下会大大于25000公里里。平平均轮轮胎寿寿命的的公里里数近近似服服从正正态分分布。。现对对该厂厂的这这种轮轮胎抽抽取一一容量量为15个个的样样本如如下,,能否否作出出结论论:该该产品品与申申报的的质量量标准准是否否相符符?21000,19000,33000,31500,18500,34000,29000,26000,25000,28000,30000,28500,27500,28000,26000补充练练习2.某某物物质在在处理理前与与处理理后分分别抽抽样分分析其其含脂脂率如如下::处理前前:0.19,,0.18,0.21,,0.30,0.41,,0.12,0.27处理后后:0.15,,0.13,0.07,,0.24,0.19,,0.06,0.08,,0.12假定处处理前前后的的含脂脂率都都服从从正态态分布布,且且方差差相同同。问问:处处理前前后的的含脂脂率的的均值值是否否有显显著变变化??补充练练习3.某某单单位研研究饮饮食中中缺乏乏维生生素E与肝肝中维维生素素A含含量的的关系系。将将同种种属的的大白白鼠按按性别别相同同、年年龄体体重相相近者者配成成对,,共8对,,并将将每对对中的的两头头动物物随机机分到到正常常饲料料组和和维生生素E缺乏乏组。。一定定时期期后,,将大大白鼠鼠杀死死测得得其肝肝中维维生素素A的的含量量。结结果如如下表表,问问:不不同饲饲料的的大白白鼠中中维生生素A含量量有无无差别别?大白鼠对号12345678正常饲料组35502000300039503800375034503050维生素A缺乏组24502400180032003250270025001750上机实实践主题::参数数检验验熟练掌掌握使使用SPSS进进行统统计分分析的的操作作方法法。练习SPSS电电子教教材案案例。。补充练练习((下课课前提提交))。非参数数检验验本讲主主要内内容非参数数检验验概述述单样本本非参参数检检验多样本本非参参数检检验非参数数检验验概述述假设总总体分分布未未知,,根据据样本本的分分布推推断总总体的的分布布。单样本本非参参数检检验卡方检检验二项分分布检检验K-S检验验游程检检验四种单单样本本非参参数检检验方方法的的比较较原理检验目目标::根据据样本本数据据推断断总体体的分分布与与期望望分布布或某某一理理论分分布是是否有有显著著差异异。零假设设::样样本来来自的的总体体其分分布形形态与与期望望分布布或某某一理理论分分布无无显著著差异异;统计量量根据统统计量量的的值查查表得得到对对应的的相伴伴概率率值;;作出判判断::当,,拒绝绝当,,接受受卡方检检验卡方检检验SPSS操操作步步骤打开卡卡方检检验对对话框框AnalyzeNonparametricTestsChiSquare选择分分析变变量确定理理论分分布范范围确定分分布的的理论论值选择输输出结结果的的形式式及缺缺失值值的处处理方方法输出检检验结结果卡方检检验实例从以往往的了了解得得知,,贫困困人口口中的的大部部分人人是因因为疾疾病或或年老老而丧丧失劳劳动能能力的的人,,其身身体状状况的的分布布基本本为生生活完完全不不能自自理的的占5%,,生活活基本本不能能自理理的占占10%,,生活活能自自理但但无劳劳动能能力的的占20%%,部部分丧丧失劳劳动能能力的的占25%%,身身体健健康的的占40%%。用用“贫贫困调调查””中““身体体状况况”这这一变变量的的数据据的分分布来来检验验本次次调查查总体体的贫贫困人人口身身体状状况的的分布布与上上述比比例是是否一一致。。二项分分布某一变变量的的取值值是两两类的的,若若一类类出现现的概概率是是p,,则另另一类类出现现的概概率是是1-p,,这种种分布布称为为二项项分布布。12.2.2二二项项分布布检验验原理检验目目标::根据据样本本数据据推断断总体体的分分布与与指定定的某某个二二项分分布是是否有有显著著差异异。零假设设::样样本来来自的的总体体其分分布形形态与与期望望分布布或某某一理理论分分布无无显著著差异异;统计量量根据统统计量量Z的的值查查表得得到对对应的的相伴伴概率率值;;作出判判断::当,,拒绝绝当,,接受受12.2.2二二项项分布布检验验二项分分布检检验SPSS操操作步步骤打开二二项分分布检检验对对话框框AnalyzeNonparametricTestsBinomial选择分分析变变量确定二二分值值确定检检验概概率的的值选择输输出结结果的的形式式及缺缺失值值的处处理方方法输出检检验结结果二项分分布检检验实例前期调调查表表明,,贫困困人口口中的的绝大大多数数都是是无业业者,,在职职人员员不到到10%。。用““贫困困调查查”的的“人人员类类别””这一一变量量的数数据的的分布布来检检验本本次调调查的的总体体是否否为上上述比比例。。原理检验目目标::根据据样本本的分分布来来确定定总体体是否否服从从某种种分布布。零假设设::样样本来来自的的总体体其分分布形形态服服从给给定的的分布布;统计量量T根据统统计量量T的的值查查表得得到对对应的的相伴伴概率率值;;作出判判断::当,,拒绝绝当,,接受受K-S检验验K-S检验验SPSS操操作步步骤打开K-S检验验对话话框AnalyzeNonparametricTests1-sampleK-S选择分分析变变量确定要要检验验的分分布((4个个选项项)选择输输出结结果的的形式式及缺缺失值值的处处理方方法输出检检验结结果K-S检验验实例检验““休闲闲调查查”中中的““住房房面积积”变变量是是否服服从正正态分分布。。游程检检验住房面积19243544475658687886899198120140156学历0001000011111011游程的的概念念设有两两个变变量X和Y,X为定定距以以上变变量,,Y为为二分分名义义变量量。如如果Y不是是二分分名义义变量量,可可取分分割点点进行行转换换。将将X按按大小小排列列后,,再用用Y的的取值值作为为数据据的标标志,,将数数据分分为两两类。。在数数列的的排序序中,,每个个标志志的一一个持持续就就是一一个游游程。。如X---住住房面面积;;Y---学历历(0:大大学以以下学学历;;1:大大学或或大学学以上上学历历)原理检验目目标::根据据样本本数据据对总总体某某变量量的取取值是是否随随机进进行检检验或或检验验两个个总体体的分分布是是否相相同。。零假设设::两两个总总体的的分布布无显显著性性差异异。统计量量根据统统计量量的的值查查表得得到对对应的的相伴伴概率率值;;作出判判断::当,,拒绝绝当,,接受受游程检检验游程检检验SPSS操操作步步骤打开游游程检检验对对话框框AnalyzeNonparametricTestsRuns选择分分析变变量指定分分割点点选择输输出结结果的的形式式及缺缺失值值的处处理方方法输出检检验结结果游程检检验实例检验在在“休休闲调调查1”中中,大大专以以下文文化水水平与与大专专和大大专以以上文文化水水平的的被调调查者者的住住房面面积是是否有有显著著差异异。四种检检验方方法的的比较较前三种种方法法属于于拟和和性检检验,,可检检验样样本来来自的的总体体是否否服从从某种种理论论分布布。卡方检检验一一般要要求待待检验验样本本有较较大的的样本本容量量,较较适合合一个个因素素的多多项分分类的的数据据分析析。二项分分布检检验只只能作作二项项分布布检验验。单样本本K-S检检验较较适合合于连连续型型数据据的分分析。。四种检检验方方法的的比较较游程检检验即即可用用来检检验样样本的的随机机性,,也可可以用用来检检验两两个总总体的的分布布是否否相同同,它它与个个案的的排序序有关关。12.3多多样样本非非参数数检验验两独立立样本本非参参数检检验多独立立样本本非参参数检检验两相关关样本本非参参数检检验多相关关样本本非参参数检检验12.3.1两两独独立样样本非非参数数检验验检验目目标根据两两独立立样本本之间间的差差异大大小来来确定定两个个总体体是否否相等等。SPSS操操作步步骤打开两两独立立样本本检验验对话话框AnalyzeNonparametricTests2Independent-Samples选择分分析变变量确定分分组变变量确定分分组标标志确定检检验方方法选择输输出结结果的的形式式及缺缺失值值的处处理方方法输出检检验结结果12.3.1两两独独立样样本非非参数数检验验实例对“休休闲调调查””中不不同性性别的的被调调查者者的““文化化程度度”是是否有有差异异进行行检验验。12.3.2多多独独立样样本非非参数数检验验检验目目标根据多多个独独立样样本之之间的的差异异大小小对多多个总总体之之间的的差异异进行行检验验;或或将一一个总总体进进行多多项分分类后后对多多个类类别间间的差差异进进行检检验。。SPSS操操作步步骤打开多多独立立样本本检验验对话话框AnalyzeNonparametricTestsKIndependent-Samples选择分分析变变量确定分分组变变量指定分分组变变量值值的范范围确定检检验方方法选择输输出结结果的的形式式及缺缺失值值的处处理方方法输出检检验结结果12.3.2多多独独立样样本非非参数数检验验实例对“休休闲调调查””中不不同受受教育育水平平的被被调查查者的的“住住房面面积””是否否有差差异进进行检检验。。两配对对样本本非参参数检检验检验目标根据样本数数据对它们们来自的两两配对总体体的分布进进行推断。。SPSS操操作步骤打开两配对对样本检验验对话框AnalyzeNonparametricTests2RelatedSamples选择分析的的配对变量量确定检验方方法选择输出结结果的形式式及缺失值值的处理方方法输出检验结结果两配对样本本非参数检检验实例“贫困调查查”中的““满意度1”是贫困困人口获得得低保以前前的生活满满意度测量量结果,““满意度度2”是贫贫困人口获获得低保以以后的生活活满意度测测量结果。。检验获得得低保前后后的生活满满意度是否否有变化。。多配对样本本非参数检检验检验目标根据样本数数据对它们们来自的多多配对总体体的分布进进行推断。。SPSS操操作步骤打开多配对对样本检验验对话框AnalyzeNonparametricTestsKRelatedSamples选择分析的的相关变量量族确定检验方方法选择输出的的统计结果果多配对样本本非参数检检验实例“休闲调查查”中的““电话”、、“传呼机机”、“手手机”、““传真机””、“互联联网”是被被调查者对对这五种现现代通讯工工具在生活活中的重要要性的评分分。现用多多个相关样样本检验的的方法,来来分析这五五种通讯工工具的重要要性有无差差异。上机实践主题:非参参数检验熟练掌握使使用SPSS进行统统计分析的的操作方法法。练习SPSS电电子教材案案例小组期末社社会调研项项目补充练习1.下列资资料是某产产品52周周的订货量量,若a=0.01,试检验验该产品的的周订货量量是否服从从正态分布布。18202227251922272625292425192325282026282130172425152031293325241920221535282421272638341519343525282420补充练习2.某地方方当局宣称称该地区企企业经理阶阶层月收入入的中位数数为5800元,为为了验证这这一说法是是否正确,,统计调查查部门抽取取了如下的的一组样本本数据资料料,试在5%的显著著性水平下下,检验假假设H0:Me<=5800,H1:Me>5800。600052006300490072005712650553207210489058006009610058306000714048505820660073005180638059005600700069003800493070006920542047905400补充练习3.从甲、、乙两台机机床加工的的同一种产产品中,各各抽取一个个样本进行行检测,得得到如下一一组资料::甲机床:15.014.515.215.514.915.315.814.214.915.4乙机床:14.714.915.215.215.015.815.715.115.515.315.4假定服从正正态分布,,通过秩和和进行检验验,两台机床加加工的产品品是否服从从同样的分分布(显著性性水平为5%)。补充练习4.某公司司的市场销销售部门在在9个不同同的销售地地区,同时时用三种促促销手段进进行了促销销宣传活动动,为期一一个月后,,收到订单单数据如下下,问三种种促销方式式对销售的的影响如何何(显著性性水平为5%)。销售地区订单数(件)促销手段1促销手段2促销手段31380420550256038982033203658004530482660561459073064323814707258240268832977090197069120第13讲方方差分析析9、静静夜夜四四无无邻邻,,荒荒居居旧旧业业贫贫。。。。12月月-2212月月-22Thursday,December29,202210、雨中中黄叶叶树,,灯下下白头头人。。。03:49:5803:49:5803:4912/29/20223:49:58AM11、以我独沈沈久,愧君君相见频。。。12月-2203:49:5803:49Dec-2229-Dec-2212、故人江海海别,几度度隔山川。。。03:49:5803:49:5803:49Thursday,December29,202213、乍见翻翻疑梦,,相悲各各问年。。。12月-2212月-2203:49:5803:49:58December29,202214、他他乡乡生生白白发发,,旧旧国国见见青青山山。。。。29十十二二月月20223:49:58上上午午03:49:5812月月-2215、比不不了得得就不不比,,得不不到的的就不不要。。。。十二月月223:49上上午午12月月-2203:49December29,202216、行动动出成成果,,工作作出财财富。。。2022/12/293:49:5803:49:5829December202217、做做前前,,能能够够环环视视四四周周;;做做时时,,你你只只能能或或者者最最好好沿沿着着以以脚脚为为起起点点的的射射线线向向前前。。。。3:49:58上上午午3:49上上午午03:49:5812月月-229、没有失失败,只只有暂时时停止成成功!。。12月-2212月-22Thursday,December29,202210、很多事事情努力力了未必必有结果果,但是是不努力力却

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论