




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、5.3 总体参数假设检验总体参数假设检验5.2 总体参数估计总体参数估计本章目录5.1 随机抽样随机抽样5.4 方差分析方差分析5.5 相关和回归分析相关和回归分析1第1页/共80页5.1.2 使用随机数生成函数实现随机抽样5.1.1 利用 EXCEL数据分析功能实现随机抽样5.1 随机抽样2第2页/共80页5.1.1 利用EXCEL数据分析功能实现随机抽样实现随机抽样有两种方法:利用 Excel 数据分析功能实现随机抽样。使用随机数生成函数实现随机抽样。第3页/共80页例例5-1 图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下: 第一步:选
2、择“工具”菜单下“数据分析”中“抽样”功能,打开“抽样”对话框,如图 5-2 所示。第4页/共80页例例5-1 图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下: 第二步:设置相关参数,如图 5-2 所示,单击“确定”按钮。第5页/共80页6第6页/共80页利用 Excel“数据分析”提供的抽样功能抽取的样本存在以下问题: 12随机抽样采用的是可放回抽样,因此,总体中的每个数据都可以多次被抽中,所以样本中的数据一般都会有重复现象。经过筛选,抽样结果避免了重复,但最终所得样本数量可能少于所需数量,因而要根据经验适当调整在数据样本选取时的数量设置,
3、以使筛选后的样本数量满足要求。 3尽管高级筛选可以对重复抽样情况进行修补,但抽样结果只能输出所需数目的所抽选项,其他相关信息需要利用其他辅助手段得到,给后继数据分析带来困难。第7页/共80页5.1.2 使用随机数生成函数实现随机抽样利用随机数函数 RAND()进行随机抽样上例数据利用 RAND函数抽样的操作步骤为:第一步:增加字段“生成随机数”和“随机数排序” 。第二步:在单元格 F2 中输入公式“=RAND()” ,并复制到单元格区域 F3:F81,得到一列动态随机数。如图 5-5 所示。第三步:选择单元格区域 F2:F81,单击鼠标右键,选择“复制” ,移动光标到单元格 G2,再次单击鼠标
4、右键,选择“选择性粘贴” ,在出现的对话框中选择“数值”并单击“确定” ,得到一列静态随机数。第四步:选择单元格区域 A1:G81,选择“数据”“排序” ,以“随机数排序”为主要关键字排序。在排序结果中根据所需样本数目,即可以进行进一步数据推断。第8页/共80页5.2.2 均值区间估计5.2.1 参数估计概述5.2 总体参数估计5.2.3 比率区间估计9第9页/共80页5.2.1参数估计概述参数估计是指用样本指标(也称为统计量)来估计未知的总体指标(也称为总体参数) 。最常见的是用样本平均数估计总体均数、用样本比率估计总体比率。点估计也称为定值估计,是以样本指标的实际值直接作为总体未知参数的估
5、计值的一种推断方法。区间估计是给出总体未知参数的可能变动范围,即区间,并用一定的概率保证区间包含总体未知参数,即根据统计量和标准误差推断总体指标的可能范围。第10页/共80页5.2.2均值区间估计正态总体区间估计说明总体方差已知为样本均值,n为样本容量, 为已知总体标准差, 为正态分布临界值总体方差未知容量30S为样本标准差,其他符号意义同上容量30 为t 分布临界值,其他符号意义同上nZx2x2ZnSZx2nStx22t第11页/共80页例例5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, (1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%
6、的置信区间。 (2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下: 第一步:建立均值区间估计计算表,如图 5-7 所示。第12页/共80页13第13页/共80页例例5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, (1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 (2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下: 第二步:总体方差已知的区间估计:在单元格B24 中输入已知总体标准差“10” ,在单元格 B25中输入置信水平“95%” ,在单元格 B26 中输入
7、样本容量“ 20 ”,在单元格 B23 中输入公式“=AVERAGE(C2:C21)” ,计算样本均值;在单元格B27 中输入公式“=ABS(NORMSINV(1-B25)/2)” ,计算正态分布临界值;在单元格 B28、B29 中分别输入公式“=B23-B27*B24/SQRT(B26)” , “=B23+ B27*B24/SQRT(B26)” ,计算均值区间的下限和上限。第14页/共80页例例5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, (1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 (2)总体方差未知,估计80 名学
8、生数学平均分 95%的置信区间。具体的操作步骤如下: 第三步:总体方差未知的区间估计:在单元格D25 中输入置信水平“95%” ,在单元格 D26 中输入样本容量“20” ,在单元格 D23 中输入公式“=AVERAGE(C2:C21)” ,计算样本均值;在单元格D24 中输入公式“=STDEV(C2:C21)” ,计算样本标 准差;在单元格 D27 中输入公式“=TINV(1-D25,D26-1)” ,计算 t 分布临界值;在单元格 D28、D29中分别输入公式“=D23D27* D24/SQRT(D26)” ,“=D23+D27*D24/SQRT(D26)” ,计算均值区间的下限和上限。第
9、15页/共80页5.2.3比率区间估计nZp)1 (2比率在大样本情况下,服从正态分布分布,比率的区间估计为:第16页/共80页例例5-3 某市区随机调查了 300 名居民户,其中 6户拥有等离子电视机,估计该地区等离子电视机 95%的置信区间。具体的操作步骤如下: 第一步:建立比率区间估计的计算表,如图 5-8所示。 第二步:在单元格 B4 中输入公式“=B3/B2” ,计算样本比率;在单元格 B7中输入公式“=ABS(NORMSINV(1-B6)/2)” ,计算正态分布临界值。 第三步:在单元格 B8、B9 中分别输入公式“=B4-B7*SQRT (B4*(1-B4)/B5)” , “=B
10、4+B7*SQRT(B4*(1-B4)/B5)” ,计算比率置信区间下限和上限。 第17页/共80页5.3.2 一个总体参数假设检验5.3.1 假设检验概述5.3 总体参数假设检验5.3.3 两个总体参数假设检验18第18页/共80页5.3.1假设检验概述 1.假设检验 假设检验是推断分析的另一项重要内容,它与参数估计类似,但角度不同。参数估计是利用样本信息推断未知总体参数,而假设检验是先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。假设检验有参数检验和非参数检验两种。 逻辑上运用反证法,统计上依据小概率事件不可能发生这一原理。第19页/共80页5.3.1假设检
11、验概述 2.原假设与备择假设 统计是对总体参数的具体数值所作的陈述。在假设检验中,有原假设与备择假设。原假设是研究者想收集证据予以反对的假设,又称“零假设” ,用符号表示为 H 0 。之所以用零来修饰原假设,是因为原假设的内容总是没有差异或没有改变,或变量间没有关系等。关于样本统计量,如样本均值或样本均值之差的零假设,是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或者是否相等。 备择假设也称“研究假设” ,是研究者想收集证据予以支持的假设,表示为 H1 。第20页/共80页5.3.1假设检验概述 3.双侧检验与单侧检验 如果备择假设没有特定的方向性,并含有符号“” ,这样的检验称为
12、双侧检验或双尾检验(图 5-9) 。 如果备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验。备择假设的方向为“” ,称为左侧检验(图 5-10) . 备择假设的方向为“” ,称为右侧检验(图 5-11) 。 图5-9双侧假设检验图5-10 左侧假设检验图5-11右侧假设检验第21页/共80页5.3.1假设检验概述 4.显著性水平 在假设检验中,把拒绝 H0 所犯的错误称为弃真错误(或类错误) ,发生的概率设为 ,也称显著性水平; 把接受不真实的 H0 所犯的错误,称为取伪错误(或类错误) ,发生的概率设为, 两者之间的关系是: 大, 就小; 小, 就大,一般力求
13、在控制 的前提下减少。显著性水平 的通常取值有 0.1、0.05、0.001 等。 如果犯类错误损失更大,为减少损失, 值取小;如果犯类错误损失更大, 值取大。确定了 ,就确定了临界点。 第22页/共80页5.3.1假设检验概述 5.检验统计量与拒绝域 检验统计量是根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。 标准化检验统计量(点估计量假设值)点估计量的标准差,是对样本估计量的标准化结果,即原假设 H0 为真时,点估计量的抽样分布。双侧检验的拒绝域如图5-9 所示,左侧检验的拒绝域如图 5-10 所示,右侧检验的拒绝域如图 5-11所示。 图5-9双侧假设检验
14、图5-10 左侧假设检验图5-11右侧假设检验第23页/共80页5.3.1假设检验概述 6. 假设检验的步骤 根据已知总体与样本陈述原假设和备择假设。 确定一个适当的检验统计量,并利用样本数据算出其具体数值。 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域。 将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域内,拒绝 H,否则不拒绝 H。也可以直接利用 P 值作出决策,P 值,拒绝 H。第24页/共80页5.3.2一个总体参数假设检验 双侧检验左侧检验右侧检验假设形式H0:0H1:0H0:0H1:0H0:0H1:0检验统计量大样本未知, ,已知, 小样本未知, ,已知, 统
15、计量与临界值决策准则统计量临界值统计量-临界值统计量临界值P值决策准则P,拒绝H0nSXZ/nXZ/nSXt/nXZ/表5-2 一个总体均值检验类型1.一个总体均值检验第25页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第一步:建立如图 5-12所示的总体均值检验表。 第二步:在单元格区域 B7:D8,B15:D16 设置检验形式。其中, (1)为双侧检验,
16、 (2)为左侧检验, (3)为右侧检验。在单元格 B4 输入例 5-2 计算样本标准差。第26页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第三步:总体方差已知的情况下,在单元格区域 B10:D10 分别输入公式“=NORMSINV(1B9/2)” , “=NORMSINV(B9)” , “=NORMSINV(1B9)” ,计算三种检验临界值。 在单元格 B
17、11 中输入公式“=(B280)/(B3/SQRT(20)” ,计算检验统计量。第27页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第三步:在单元格区域B12:D12 分别输入公式“=IF(ABS(B11)B10,”平均分不为 80 分“,”平均分为 80 分“)” ,“=IF(B11D10,平均分高于 80 分,平均分不高于 80 分)” ,进行检验决策。
18、第28页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第四步: 总体方差未知情况下, 在单元格区域 B18:D18 分别输入公式 “=TINV(B17, 19)” ,“=-TINV(2*C17,19)” , “=TINV(2*C17,19)” ,计算三种检验临界值。在单元格 B19 中输入公式“=(B280)/(B4/SQRT(20)” ,计算检验统计量。第2
19、9页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: (1)学生数学平均分是否为 80 分, (2)学生数学平均分是否低于 80 分, (3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第四步: 在单元格区域 B20:D20 分别输入公式“=IF(ABS(B19)B18,”平均分不为 80 分“,”平均分为 80 分“)” , “=IF(B19D18,平均分高于 80 分,平均分不高于 80分)” ,进行检验决策。第30页/共80页5.3.2一个总体参数假设检验 表5-3大样本下一个总体比率检
20、验类型2.一个总体比率假设检验双侧检验左侧检验右侧检验假设形式H0:0H1:0H0:0H1:0H0:0H1:0检验统计量统计量与临界值决策准则Z Z Z P值决策准则P,拒绝H0npZ)1 (0002zzz第31页/共80页例例5-5 一种以休闲娱乐为主题的杂志声称其读者群中女性读者不低于 80%。为检验这一说法是否属实,某研究部门抽取了一个 200 人的样本,发现有 146 名女性经常阅读该杂志,在显著性水平为 0.05 下检验杂志社的声称是否属实。具体的操作步骤如下: 第一步:建立图 5-13 所示的比率检验计算表 第32页/共80页例例5-5 一种以休闲娱乐为主题的杂志声称其读者群中女性
21、读者不低于 80%。为检验这一说法是否属实,某研究部门抽取了一个 200 人的样本,发现有 146 名女性经常阅读该杂志,在显著性水平为 0.05 下检验杂志社的声称是否属实。具体的操作步骤如下: 第二步:在单元格 B2 中输入“=146/200” ,计算样本比率。根据题目,该检验为左侧检验,在单元格区域 B3、B4 中设置原假设和备择假设。在单元格 B6 中输入公式“=NORMSINV(0.05)” ,计算检验临界值,在单元格 B7 中输入公式“=(B2-80%)/SQRT(80%*(180%)/200)” ,计算检验统计量。第33页/共80页例例5-5 一种以休闲娱乐为主题的杂志声称其读者
22、群中女性读者不低于 80%。为检验这一说法是否属实,某研究部门抽取了一个 200 人的样本,发现有 146 名女性经常阅读该杂志,在显著性水平为 0.05 下检验杂志社的声称是否属实。具体的操作步骤如下: 第三步:在单元格 B8 中输入公式“=IF(B7)B6,不属实,属实)” ,进行决策。 第34页/共80页5.3.2一个总体参数假设检验 表5-4一个总体方差检验类型3.一个总体方差检验双侧检验左侧检验右侧检验假设形式 H0: H1: H0: H1: H0: H1: 检验统计量统计量与临界值决策准则 或 2202202202202202202022) 1(sn2) 1(22/nn2) 1(2
23、2/1nn2) 1(22/1nn2) 1(22/nn第35页/共80页例例5-6 啤酒生产企业采用自动生产线灌装啤酒,每瓶装填量为 640 mL,但由于受某些不可控制因素影响,每瓶装填量会有差异。装填量太多或太少要么企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过也不应低于 4 mL。企业质监部门抽取了 10 瓶啤酒检验,得到样本标准差为 3.8 mL,以显著性水平为 0.1检验装填量标准差是否符合要求。具体的操作步骤如下: 第一步:建立图 5-14 所示的方差检验计算表。第36页/共80页例例5-6 啤酒生产企业采用自动生产线灌装啤酒,每瓶装填量为 640 mL,但由
24、于受某些不可控制因素影响,每瓶装填量会有差异。装填量太多或太少要么企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过也不应低于 4 mL。企业质监部门抽取了 10 瓶啤酒检验,得到样本标准差为 3.8 mL,以显著性水平为 0.1检验装填量标准差是否符合要求。具体的操作步骤如下: 第二步:在单元格 B2、B3中输入已知样本标准差和样本容量。根据题目,该检验为双侧检验,在单元格 B4、B5 设置原假设和备择假设。在单元格 B7、B8 中分别输入公式“=CHIINV(1-B6/2,B3-1)” , “=CHIINV(B6/2,B3-1)” ,计算卡方检验的两个临界值;在单元格
25、 B9 中输入公式“=(B3-1)*B22/42” ,计算检验统计量。 第37页/共80页例例5-6 啤酒生产企业采用自动生产线灌装啤酒,每瓶装填量为 640 mL,但由于受某些不可控制因素影响,每瓶装填量会有差异。装填量太多或太少要么企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过也不应低于 4 mL。企业质监部门抽取了 10 瓶啤酒检验,得到样本标准差为 3.8 mL,以显著性水平为 0.1检验装填量标准差是否符合要求。具体的操作步骤如下: 第三步:在单元格 B10中输入公式“=IF(B9B7,”不符合要求,IF(B9B8,符合要求,不符合要求)” ,进行决策。第3
26、8页/共80页双侧检验左侧检验右侧检验假设形式H0: 00H1: 0H0: 0H1: 0H0: 0H1: 0检验统计量 已知, 未知(大样本), 未知且相等(小样本), 未知且不等(小样本), 统计量与临界值决策准则统计量临界值统计量-临界值统计量临界值P值决策准则P,拒绝H05.3.3两个总体参数假设检验 表5-5一个总体方差检验类型2121212121212221,2221212121)()(nnxxZ2221,2221212121)()(nSnSxxZ2221,21212111)()(nnSxxtp2221,2221212121)()(nSnSxxt第39页/共80页例例5-7 某工厂为
27、了比较新旧两种装配方法的效率,分别组织两组员工,每组 9 人,一组用新方法,一组用旧方法,两组员工装配时间见表 5-6。假设两组员工装配时间均服从正态分布。 (1)新、旧方法装配时间方差已知,分别为 15 和 20,根据数据是否有理由认为新方法更节约时间?(2)新、旧方法装配时间方差相等但未知,根据数据是否有理由认为新方法更节约时间?(=0.05)具体的操作步骤如下: 第一步:根据题目条件在单元格 F3、F4 设置假设,并建立双样本假设检验计算表,见表5-6。第40页/共80页例例5-7 某工厂为了比较新旧两种装配方法的效率,分别组织两组员工,每组 9 人,一组用新方法,一组用旧方法,两组员工
28、装配时间见表 5-6。假设两组员工装配时间均服从正态分布。 (1)新、旧方法装配时间方差已知,分别为 15 和 20,根据数据是否有理由认为新方法更节约时间?(2)新、旧方法装配时间方差相等但未知,根据数据是否有理由认为新方法更节约时间?(=0.05)具体的操作步骤如下: 第二步:总体方差已知的检验。选择“工具”菜单中“数据分析” ,在打开的“数据分析”对话框中选择“z-检验:双样本平均差检验” ,打开如图5-15所示对话框。 按如图 5-15 所示设置好参数, 单击 “确定” 。 在单元格 B27 中输入公式 “=IF(B22-B24, 新方法节约时间,新方法不节约时间)” ,进行检验决策。
29、计算结果如图5-16 所示。第41页/共80页例例5-7 某工厂为了比较新旧两种装配方法的效率,分别组织两组员工,每组 9 人,一组用新方法,一组用旧方法,两组员工装配时间见表 5-6。假设两组员工装配时间均服从正态分布。 (1)新、旧方法装配时间方差已知,分别为 15 和 20,根据数据是否有理由认为新方法更节约时间?(2)新、旧方法装配时间方差相等但未知,根据数据是否有理由认为新方法更节约时间?(=0.05)具体的操作步骤如下: 第三步:总体方差相等但未知的检验。选择“工具”菜单中“数据分析” ,在打开的“数据分析”对话框中选择“t-检验:双样本等方差假设” ,打开如图5-17 所示对话框。 按如图 5-17 所示设置好参数, 单击 “确定” 。 在单元格 F29 中输入公式 “=IF(F24B19,”有显著线性关系,无显著线性关系)” ,进行决策。第71页/共80页5.5.1相关分析(2)Spearman等级相关系数。两个变量之间简单线性相关系数要求变量是正态分布的,若不能满足正态分布的要求, 简单线性相关系数的分析方法不宜使用, 可以用pearman等级相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六年级上册语文知识梳理
- 2025年管业:地暖专用管合作协议书
- 2025年PURL系列反应型皮革用聚氨酯乳液合作协议书
- 河北省枣强县枣强中学2025届高考仿真卷化学试卷含解析
- 延续护理科普知识
- 2025届柳州铁路第一中学高三第四次模拟考试化学试卷含解析
- 小班社会领域培训课件
- 工艺装置运行培训课件
- 一年级数学计算题专项练习集锦
- 五年级数学(小数除法)计算题专项练习及答案汇编
- 科技成果技术成熟度评估规范
- DB11T 388-2015 城市景观照明技术规范(1~8部分)
- 西方文论概览(第二版)-第五章课件
- 基础工程复习资料
- 钢铁项目环评报告 - 17结论与建议
- 数列的概念(第一课时)教案高二数学(人教A版2019选择性必修第二册)
- 铲车司机雇佣合同范本
- 江苏省南京市鼓楼区2023-2024学年五年级下学期期末检测语文试卷
- 2024年山东省济南市莱芜区中考一模数学试题(含答案解析) (二)
- (高清版)JTG 3363-2019 公路桥涵地基与基础设计规范
- 旅游行业:2024中国出境游客白皮书
评论
0/150
提交评论