




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计数据分析基础教程统计数据分析基础教程基于基于SPSSSPSS和和ExcelExcel的调查数据分析的调查数据分析第第8章章简单统计推断简单统计推断: :假设检验假设检验本章内容本章内容8.18.1 假设检验的原理假设检验的原理8.2 8.2 利用利用SPSSSPSS实现单个样本实现单个样本t t检验检验8.3 8.3 利用利用SPSSSPSS实现独立样本实现独立样本t t检验检验8.4 8.4 利用利用SPSSSPSS实现配对样本实现配对样本t t检验检验8.5 8.5 利用利用ExcelExcel实现单个样本实现单个样本t t检检验验8.6 8.6 利用利用ExcelExcel实现独立样
2、本实现独立样本t t检检验验8.7 8.7 利用利用ExcelExcel实现配对样本实现配对样本t t检检验验8.8 8.8 总体比例的检验总体比例的检验假设检验假设检验由于对由于对总体总体不了解不了解,任何有关总体的,任何有关总体的叙述,都只是假设而已(统计假设)。叙述,都只是假设而已(统计假设)。除非进行除非进行普查普查,否则一个,否则一个统计假设统计假设是是对对或或错错,根本就不可能获得正确的答案。,根本就不可能获得正确的答案。但因为绝大多数情况是不允许也无法但因为绝大多数情况是不允许也无法进行普查,所以才会通过进行普查,所以才会通过抽样调查抽样调查,用,用抽查结果所获得的数据,来检验先
3、前的抽查结果所获得的数据,来检验先前的统计假设,以判断其对或错。统计假设,以判断其对或错。8.18.1 假设检验的原理假设检验的原理如果一个人说他如果一个人说他从来没有骂过人从来没有骂过人。他能够。他能够证明证明吗?吗?如果非要如果非要证明他没有骂过人证明他没有骂过人,他必须出示他从,他必须出示他从小到大每一时刻的录音录像,所有书写的东西小到大每一时刻的录音录像,所有书写的东西等,还要证明这些物证是完全的、真实的、没等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一有间断的。这简直是不可能的。即使他找到一些证人,比如他的同学、家人和同事来证明,些证人,比如他的同学
4、、家人和同事来证明,那也只能够证明在那些证人在场的某些片刻,那也只能够证明在那些证人在场的某些片刻,他没有被听到骂人。他没有被听到骂人。但是,反过来,如果要但是,反过来,如果要证明这个人骂过人证明这个人骂过人很容很容易易,只要有一次被抓住就足够了。,只要有一次被抓住就足够了。看来,看来,企图肯定什么事物很难企图肯定什么事物很难,而,而否定却要相否定却要相对容易得多对容易得多。物理学以及其他科学都是在否定。物理学以及其他科学都是在否定中发展的,这也是假设检验背后的哲学。中发展的,这也是假设检验背后的哲学。8.18.1 假设检验的原理假设检验的原理假设检验假设检验是是一种方法一种方法,目的是为了决
5、,目的是为了决定一个关于定一个关于总体特征总体特征的定量的断言的定量的断言(比如一个假设)(比如一个假设)是否真实是否真实。通过计算从总体中抽出的随机样本的通过计算从总体中抽出的随机样本的适当的统计量来检验一个假设适当的统计量来检验一个假设。如果得到的统计量的如果得到的统计量的实现值实现值在在假设为假设为真真时应该是时应该是罕见的罕见的(小概率事件小概率事件),),将有理由将有理由拒绝拒绝这个假设。这个假设。8.18.1 假设检验的原理假设检验的原理在假设检验中,一般要设立一个在假设检验中,一般要设立一个原假设原假设(前面的(前面的“从来没骂过人从来没骂过人”就是一个例子)。就是一个例子)。而
6、设立该假设的动机主要是而设立该假设的动机主要是企图利用人们掌握的企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛反映现实世界的数据来找出假设与现实之间的矛盾盾(这里所谓的矛盾,就是按照原假设,现实世(这里所谓的矛盾,就是按照原假设,现实世界数据的出现仅仅属于小概率事件,是不大可能界数据的出现仅仅属于小概率事件,是不大可能出现的),出现的),从而否定这个假设,并称该检验显著从而否定这个假设,并称该检验显著(SigSignificantnificant)。)。多数统计实践中(除了理论探讨之外)的多数统计实践中(除了理论探讨之外)的假设检假设检验都是以否定原假设为目标验都是以否定原假设为
7、目标。如果如果否定不了否定不了,那就说明,那就说明证据不足证据不足,无法否定原,无法否定原假设。但这不能说明原假设正确,就像一两次没假设。但这不能说明原假设正确,就像一两次没有听过他骂人还远不能证明他从来没有驾过人。有听过他骂人还远不能证明他从来没有驾过人。8.1.18.1.1 假设检验的过程和逻假设检验的过程和逻辑辑例例8-18-1 一个顾客买了一包标有一个顾客买了一包标有500g500g重的红糖,觉得分量不足,于是找到重的红糖,觉得分量不足,于是找到监督部门。当然他们会觉得一包分量监督部门。当然他们会觉得一包分量不够可能是随机的,于是监督部门就不够可能是随机的,于是监督部门就去商店称了去商
8、店称了5050包包红糖,得到红糖,得到均值均值(平平均重量均重量)是)是498.35g498.35g。这的确比。这的确比500g500g少,但这是否能够说明厂家生产的这少,但这是否能够说明厂家生产的这批红糖平均起来批红糖平均起来不够分量不够分量呢?呢?01:500:500HH8.1.18.1.1 假设检验的过程和逻假设检验的过程和逻辑辑假设检验的逻辑步骤为:假设检验的逻辑步骤为: 第一,写出零假设和备选假设。第一,写出零假设和备选假设。 第二,确定检验统计量。第二,确定检验统计量。 第三,确定显著性水平第三,确定显著性水平。 第四,根据数据计算检验统计量的实现值。第四,根据数据计算检验统计量的
9、实现值。 第五,根据这个实现值计算第五,根据这个实现值计算p p值。值。 第六,进行判断:如果第六,进行判断:如果p p值小于或等于值小于或等于,就拒绝零假设,这时犯(第一类),就拒绝零假设,这时犯(第一类)错误的概率最多为错误的概率最多为;如果;如果p p值大于值大于,就不拒绝零假设,因为证据不足。,就不拒绝零假设,因为证据不足。8.1.2 8.1.2 假设检验的类型与单假设检验的类型与单/ /双尾检双尾检验验1 1等于与不等于的双尾检验等于与不等于的双尾检验2 2等于与大于的右侧单尾检验等于与大于的右侧单尾检验 或或3 3等于与小于的左侧单尾检验等于与小于的左侧单尾检验 或或012112:
10、HH012112:HH012112:HH012112:HH012112:HH8.2 8.2 利用利用SPSSSPSS实现单个样本实现单个样本t t检检验验对于对于例例8-18-1,监督部门称了,监督部门称了5050包包标有标有500g500g重的红重的红糖,糖,均值均值是是498.35g498.35g,少于少于所标的所标的500g500g,对于厂,对于厂家生产的这批红糖平均起来是否够分量,需要进家生产的这批红糖平均起来是否够分量,需要进行行统计检验统计检验由于厂家声称每袋由于厂家声称每袋500g500g,因此,因此零假设为总体均值零假设为总体均值等于等于500g500g(被怀疑对象总是放在零假
11、设)。而且(被怀疑对象总是放在零假设)。而且由于样本均值少于由于样本均值少于500g500g(这是怀疑的根据),把(这是怀疑的根据),把备选假设定为总体均值少于备选假设定为总体均值少于500g500g菜单:“Analyze”-“Compare Means”-“One-Sample T Test” 01:500:500HH结论:结论:拒绝拒绝H H0 0,因此可以认为:红糖平均重量为包装上标记的,因此可以认为:红糖平均重量为包装上标记的500g500g是不能接受的,该数据倾向于是不能接受的,该数据倾向于支持平均重量少于支持平均重量少于500g500g的备选假设。的备选假设。单尾检验8.2.38.
12、2.3 单个样本单个样本t t检验的应用实检验的应用实例例例例8-28-2 某汽车厂商声称其发动机排放标准的一个某汽车厂商声称其发动机排放标准的一个指标平均指标平均低于低于2020个单位。在抽查了个单位。在抽查了1010台台发动机之发动机之后,得到相应的排放数据。该后,得到相应的排放数据。该样本均值为样本均值为21.1321.13。究竟究竟能否由此认为该指标均值能否由此认为该指标均值超过超过2020?这次的假设检验问题是(这次的假设检验问题是(单尾检验单尾检验)菜单:“Analyze”-“Compare Means” - -“One-Sample T Test” 01:20:20HH结论:结论
13、:不能拒绝不能拒绝H H0 0,抽查结果表明,抽查结果表明该指标均值该指标均值没有超过没有超过2020个单位。个单位。8.38.3 利用利用SPSSSPSS实现独立样本实现独立样本t t检检验验例例8-38-3 用用“19911991年美国社会调查数据年美国社会调查数据”分析分析男女男女的受教育年限的受教育年限。假设检验问题为(假设检验问题为() :菜单:“Analyze”-“Compare Means” - -“Independent-Samples T Test” 结论:结论:拒绝拒绝H H0 0,说明在,说明在19911991年的美国,年的美国,男女的受教育程度是男女的受教育程度是有显著
14、差异有显著差异的。的。01:HH女女男男8.3.38.3.3 独立样本独立样本t t检验的应用实例:检验的应用实例:量表的两组均值检验量表的两组均值检验例例8-48-4 量表的检验(两组)。请先看第量表的检验(两组)。请先看第7 7章附录章附录问卷中的问卷中的“Q6.Q6.请就下列有关手机的产品属性勾请就下列有关手机的产品属性勾选其重要程度选其重要程度”量表。这样的评价量表,有时也量表。这样的评价量表,有时也需要按照需要按照性别性别进行分组检验。进行分组检验。看对某一属性的注看对某一属性的注重程度,是否会因重程度,是否会因性别性别不同而有显著差异不同而有显著差异。假设检验问题为(假设检验问题为
15、(单尾检验单尾检验):):(女性比男性更注重) 或或(男性比女性更注重) 菜单:“Analyze”-“Compare Means” - -“Independent-Samples T Test” 01:HH女女男男=结论:请见P237P2372382388.4 8.4 利用利用SPSSSPSS实现配对样本实现配对样本t t检验检验两配对样本t检验的目的是利用来自两个总体的配对样本,推断两个总体的均值是否存在显著差异配对样本t检验与独立样本t检验的差别之一是要求样本是配对的,抽样不是相互独立,而是互相关联的。所谓配对样本可以是个案在“前”、“后”两种状态下某属性的两种不同特征,也可以是对某事物两
16、个不同侧面的描述。配对样本t检验是先求出每对观测值的差,再对差值求平均值。通过检验配对变量均值之间的差异的大小,来确定两个总体的均值的差异是否显著配对样本t检验也有单尾和双尾检验 。8.4 8.4 利用利用SPSSSPSS实现配对样本实现配对样本t t检检验验例例8-5 8-5 有有两列两列5050对减肥数据对减肥数据。其中一列数据其中一列数据(beforebefore)是)是减肥前减肥前的体重,另一列(的体重,另一列(afterafter)是)是减肥后减肥后的体重。要比较的体重。要比较5050个人在减肥前和减肥后的体重。这样个人在减肥前和减肥后的体重。这样就有了两个样本,每个样本的样本量都是
17、就有了两个样本,每个样本的样本量都是5050。这里不能。这里不能用前面的独立样本均值差的检验,因为两个样本并不独用前面的独立样本均值差的检验,因为两个样本并不独立。每一个人减肥后的体重都和自己减肥前的体重有关。立。每一个人减肥后的体重都和自己减肥前的体重有关。但不同人之间却是独立的。但不同人之间却是独立的。假设检验问题为假设检验问题为( (单尾检验单尾检验) ):菜单:“Analyze”-“Compare Means”- - “Paired-Samples T Test” 01:0:0DDHH结论:结论:拒绝拒绝H H0 0,说明减肥后和减,说明减肥后和减肥前相比,肥前相比,平均体重显著要轻平
18、均体重显著要轻。8.4.38.4.3 配对样本配对样本t t检验的应用实检验的应用实例例例例8-6 8-6 在在“19911991年美国社会调查数据年美国社会调查数据”中,对于中,对于教育程度(受教育年限),涉及了受访者教育程度(受教育年限),涉及了受访者自身自身的的受教育程度、受教育程度、父母父母的受教育程度以及的受教育程度以及配偶配偶的受教的受教育程度。可以对这些数据进行分析,对比育程度。可以对这些数据进行分析,对比自身与自身与父母父母之间、之间、夫妻之间夫妻之间、父母之间父母之间的受教育年限是的受教育年限是否存在显著差异。否存在显著差异。假设检验问题为:假设检验问题为: 自己与父亲: 自
19、己与母亲: 自己与配偶: 父亲与母亲:结论:受访者结论:受访者自身自身的的受教育程度比受教育程度比父母父母的的都都高高,而与,而与配偶配偶的受的受教育程度教育程度没有显著差没有显著差异异,此外,此外父母父母之间的之间的受教育程度受教育程度也没有显也没有显著差异著差异。0111:0:0DDHH0212:0:0DDHH0313:0:0DDHH0414:0:0DDHH8.5 8.5 利用利用ExcelExcel实现单个样本实现单个样本t t检检验验例例8-7 8-7 某邮递家具公司收到了许多客户关于不按某邮递家具公司收到了许多客户关于不按期送货的投诉。该公司怀疑责任在于他们雇用的期送货的投诉。该公司
20、怀疑责任在于他们雇用的货物运输公司。货物运输公司保证说他们的平均货物运输公司。货物运输公司保证说他们的平均运输时间运输时间不超过不超过2424天天。家具公司随机抽选。家具公司随机抽选5050次次运运输记录,得知输记录,得知样本均值样本均值为为24.4624.46天,试以天,试以0.050.05的的显著性水平对货运公司的保证的准确性作出判断。显著性水平对货运公司的保证的准确性作出判断。假设检验问题为假设检验问题为( (单尾检验单尾检验) ):菜单:“工具”-“数据分析”,选择“t-检验:双样本异方差假设” 01:24:24HH结论:结论:拒绝拒绝H H0 0,表明运输公司的,表明运输公司的保证是
21、保证是不可信不可信的。的。8.6 8.6 利用利用ExcelExcel实现独立样本实现独立样本t t检检验验例例8-88-8 某大学管理学院考虑专业设置情况,现已知某大学管理学院考虑专业设置情况,现已知会计会计专业与专业与财务财务专业皆为社会所需求,但似乎专业皆为社会所需求,但似乎会计会计专业毕业专业毕业生生年薪高于年薪高于财务财务专业。现在某地开发区随机调查会计专专业。现在某地开发区随机调查会计专业毕业生业毕业生1414名、财务专业毕业生名、财务专业毕业生1212名,询问其参加工作名,询问其参加工作第一年的年薪情况。试以第一年的年薪情况。试以0.050.05的显著性水平,推断会计的显著性水平
22、,推断会计专业毕业生的年薪是否高于财务专业毕业生的年薪。专业毕业生的年薪是否高于财务专业毕业生的年薪。假设检验问题为假设检验问题为( (单尾检验单尾检验) ):菜单:“工具”-“数据分析”,选择“F-检验 双样本方差” 菜单:“工具”-“数据分析”,选择“t-检验:双样本等方差假设”结论:结论:拒绝拒绝H H0 0,可以认为会计专业毕业生,可以认为会计专业毕业生工作第一年的年薪工作第一年的年薪高于高于财务专业毕业生。财务专业毕业生。012112:0:0HH8.7 8.7 利用利用ExcelExcel实现配对样本实现配对样本t t检检验验例例8-98-9 根据美国劳动部女工局资料显示,根据美国劳
23、动部女工局资料显示,19941994年美国年美国女性劳动力约占女性劳动力约占46%46%,女性为美国的经济发展贡献了近,女性为美国的经济发展贡献了近一半的力量,然而,其收入却同美国男性有着显著差别。一半的力量,然而,其收入却同美国男性有着显著差别。数据是美国劳动部女工局随机抽取的男女劳动力在数据是美国劳动部女工局随机抽取的男女劳动力在6565个个职业中的平均每周收入。假定平均每周收入服从正态分职业中的平均每周收入。假定平均每周收入服从正态分布,以布,以0.050.05为显著性水平,对为显著性水平,对美国男女收入差异美国男女收入差异进行检进行检验,以判断是否存在差异。如果存在差异,则是否相差验,
24、以判断是否存在差异。如果存在差异,则是否相差120120美元以上?美元以上?假设检验问题为:假设检验问题为:菜单:“工具”-“数据分析”,选择“t-检验: 平均值的成对二样本分析” 结论:结论:不能拒绝不能拒绝H H0 0,认为差异在,认为差异在120120美元左右,还美元左右,还没没有达到有达到120120美元以上美元以上。01:120:120HH女女男男8.88.8 总体比例的检验总体比例的检验例例8-108-10 对于评价电视节目,对于评价电视节目,收视率收视率是个重要的指标。是个重要的指标。一个电话调查表明,在某一节目播出的时候,被访的正一个电话调查表明,在某一节目播出的时候,被访的正
25、在观看电视的人中有在观看电视的人中有2323正在观看这个节目。现在想知正在观看这个节目。现在想知道,这是否与该节目的制作人所期望的道,这是否与该节目的制作人所期望的p=25p=25相比有显相比有显著不足。著不足。假设检验问题为:假设检验问题为:在Excel中,用二项分布BINOMDIST函数或标准正态分布NORMSDIST函数。在SPSS中,菜单“Analyze”-“Nonparametric Tests”-“Binomial” 结论:结论:与样本量与样本量n n有关有关。n n15001500,拒绝拒绝H H0 0,认为说收视率有认为说收视率有2525是过分了。是过分了。n n100100,
26、不能拒绝不能拒绝H H0 0,没有足够的理由拒绝收视率有没有足够的理由拒绝收视率有2525的零假设。的零假设。01:0.25:0.25HpHp8.8.28.8.2 两个总体比例之差的检两个总体比例之差的检验验例例8-11 8-11 对于两个样本,也有关于对于两个样本,也有关于两个总体比例之差两个总体比例之差p p1 1p p2 2的检验的检验。还以收视率为。还以收视率为例。如果例。如果节目甲节目甲的样本的样本收视率收视率为为2020,而,而节目乙节目乙的为的为2121,是不是,是不是节目甲的总体收节目甲的总体收视率就真的低于节目乙的视率就真的低于节目乙的?假设检验问题为:假设检验问题为:在Ex
27、cel中,用标准正态分布NORMSDIST函数。结论:当结论:当n n1 112001200,n n2 2=1300=1300时,时,不能拒不能拒绝绝H H0 0,说明没有足够证据可以拒绝说明没有足够证据可以拒绝“节节目甲和节目乙收视率相等目甲和节目乙收视率相等”的零假设。的零假设。012112:0:0HppHpp假设检验假设检验由于对由于对总体总体不了解不了解,任何有关总体的,任何有关总体的叙述,都只是假设而已(统计假设)。叙述,都只是假设而已(统计假设)。除非进行除非进行普查普查,否则一个,否则一个统计假设统计假设是是对对或或错错,根本就不可能获得正确的答案。,根本就不可能获得正确的答案。
28、但因为绝大多数情况是不允许也无法但因为绝大多数情况是不允许也无法进行普查,所以才会通过进行普查,所以才会通过抽样调查抽样调查,用,用抽查结果所获得的数据,来检验先前的抽查结果所获得的数据,来检验先前的统计假设,以判断其对或错。统计假设,以判断其对或错。8.1.2 8.1.2 假设检验的类型与单假设检验的类型与单/ /双尾检双尾检验验1 1等于与不等于的双尾检验等于与不等于的双尾检验2 2等于与大于的右侧单尾检验等于与大于的右侧单尾检验 或或3 3等于与小于的左侧单尾检验等于与小于的左侧单尾检验 或或012112:HH012112:HH012112:HH012112:HH012112:HH8.3
29、8.3 利用利用SPSSSPSS实现独立样本实现独立样本t t检检验验例例8-38-3 用用“19911991年美国社会调查数据年美国社会调查数据”分析分析男女男女的受教育年限的受教育年限。假设检验问题为(假设检验问题为() :菜单:“Analyze”-“Compare Means” - -“Independent-Samples T Test” 结论:结论:拒绝拒绝H H0 0,说明在,说明在19911991年的美国,年的美国,男女的受教育程度是男女的受教育程度是有显著差异有显著差异的。的。01:HH女女男男8.3.38.3.3 独立样本独立样本t t检验的应用实例:检验的应用实例:量表的两
30、组均值检验量表的两组均值检验例例8-48-4 量表的检验(两组)。请先看第量表的检验(两组)。请先看第7 7章附录章附录问卷中的问卷中的“Q6.Q6.请就下列有关手机的产品属性勾请就下列有关手机的产品属性勾选其重要程度选其重要程度”量表。这样的评价量表,有时也量表。这样的评价量表,有时也需要按照需要按照性别性别进行分组检验。进行分组检验。看对某一属性的注看对某一属性的注重程度,是否会因重程度,是否会因性别性别不同而有显著差异不同而有显著差异。假设检验问题为(假设检验问题为(单尾检验单尾检验):):(女性比男性更注重) 或或(男性比女性更注重) 菜单:“Analyze”-“Compare Means” - -“Independent-Samples T Test” 01:HH女女男男=结论:请见P237P2372382388.4.38.4.3 配对样本配
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年03月浙江嘉兴市海盐县事业单位公开招聘工作人员96人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2025年03月北京西城区事业单位公开招聘13人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 脲醛塑料项目安全评估报告
- 长春工业大学《老子》2023-2024学年第一学期期末试卷
- 江苏医药职业学院《植物绿化与配置》2023-2024学年第二学期期末试卷
- 亳州职业技术学院《模型制作》2023-2024学年第一学期期末试卷
- 山西财贸职业技术学院《钢琴即兴伴奏与弹唱》2023-2024学年第一学期期末试卷
- 安徽省宿州地区重点中学2024-2025学年初三下学期期末英语试题测试卷含答案
- 湘中幼儿师范高等专科学校《计算机系统设计及实践》2023-2024学年第二学期期末试卷
- 宁夏大学《工程力学(下)》2023-2024学年第二学期期末试卷
- 3-1实验室废弃物的处理
- 1到六年级古诗全部打印
- 重访灰色地带:传播研究史的书写与记忆
- 处方书写调剂发药服务质量督导检查记录
- 成品出货检验报告模板
- 全国职业院校技能大赛(花艺赛项)备考试题库(汇总)
- 部编小学语文(6年级下册第6单元)作业设计
- 斜拉桥索塔钢锚箱安装施工工法
- (167)-晴雯课件1红楼梦人物艺术鉴赏
- (新版)艺术素养基础知识考试题库(400题)
- 2020年青海省中考化学试卷附真卷答案解析版
评论
0/150
提交评论