[管理学]应用统计学.ppt_第1页
[管理学]应用统计学.ppt_第2页
[管理学]应用统计学.ppt_第3页
[管理学]应用统计学.ppt_第4页
[管理学]应用统计学.ppt_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计学应用统计学-6-6 P102(107):P102(107): 例例5.1;5.1;例例5.25.2例例5.35.3 样本,个体样本,个体 哪个大?哪个大? 定义定义5.15.1 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行 调查,并根据样本数据所提供的信息来推断总体的数量特征。 定义定义5.25.2 定义定义5.35.3 定义定义5.45.4 从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本 都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯 随机抽样。 从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽 取n个元素为止。这样的抽样方法称为重复抽样。 一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元 素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。 参考定义参考定义5.55.5,5.65.6 ,5.75.7(P103P103 104104)。)。 见见P109P109, 分层抽样分层抽样 就是类型就是类型 抽样或分抽样或分 类抽样。类抽样。 分层抽样与整分层抽样与整 群抽样的区别群抽样的区别 在那里?在那里? 等距抽样就等距抽样就 是系统抽样是系统抽样 整群抽样就是整群抽样就是 分区抽样分区抽样 某大学的商学院相对今年的毕业生进行一次调查,以便某大学的商学院相对今年的毕业生进行一次调查,以便 了解他们的就业倾向。该学院有了解他们的就业倾向。该学院有5 5个专业:会计、金融、市个专业:会计、金融、市 场营销、经营管理、信息系统。今年有场营销、经营管理、信息系统。今年有15001500名毕业生,其中名毕业生,其中 会计专业会计专业500500名,金融专业名,金融专业350350名,市场营销专业名,市场营销专业300300名,经名,经 营管理专业营管理专业150150名,信息系统专业名,信息系统专业200200名。假定要选取名。假定要选取180180人人 作为样本,各专业应抽取人数:作为样本,各专业应抽取人数: 会计专业会计专业 名,金融专业名,金融专业名,市场营销专业名,市场营销专业名名 ,经营管理专业,经营管理专业名,信息系统专业名,信息系统专业名。名。 会计专业:会计专业:6060名名 金融专业:金融专业:4242名名 市场营销专业:市场营销专业:3636名名 经营管理专业:经营管理专业:1818名名 信息系统专业:信息系统专业:2424名名 分层抽样还是整群抽样?分层抽样还是整群抽样? 分层抽样与整分层抽样与整 群抽样的区别群抽样的区别 在那里?在那里? (1 1)非随机分层,层内随机抽样;)非随机分层,层内随机抽样; 随机分群,群内全面调查(非随机)随机分群,群内全面调查(非随机) 。 (2 2)层间差异大于层内差异;群内)层间差异大于层内差异;群内 差异大于群间差异。差异大于群间差异。 所以,事先对总体结构又一定认识时所以,事先对总体结构又一定认识时 ,可以用分层抽样;在总体没有原始,可以用分层抽样;在总体没有原始 资料可利用时,可以用整群抽样。资料可利用时,可以用整群抽样。 例:分层抽样与整群抽样的区别:例:分层抽样与整群抽样的区别: 分专业抽样(分层抽样分专业抽样(分层抽样 / / 分类型抽样)分类型抽样) 分班抽样(整群抽样)分班抽样(整群抽样) 见见 P109P109 例:各种概率抽样的区别例:各种概率抽样的区别 非随机分层,层内随机抽样非随机分层,层内随机抽样 (测量地层)(测量地层) 例:各种概率抽样的区别例:各种概率抽样的区别 40m40m 随机随机 随机分群,群内全面调查(非随机)随机分群,群内全面调查(非随机) (计算植物样方)(计算植物样方) 240m240m 10m10m 例:各种概率抽样的区别例:各种概率抽样的区别 什么是样本什么是样本 指标的分布指标的分布 ? 什么是容量什么是容量 相同的所有相同的所有 可能的样本可能的样本 ? 为何样本统为何样本统 计量是随机计量是随机 变量?变量? 这是一个均匀分布,即每个元素这是一个均匀分布,即每个元素 出现的机会(概率)是一样的出现的机会(概率)是一样的。 Y Y轴和轴和x x轴轴 分别代表分别代表 什么?什么? 见见P105P105(110110) 均值在均值在 那里?那里? 1.251.25 为何概为何概 率为率为 0.250.25? 例例5.45.4(P105P105;p109p109) MM是什么是什么 ? n n是什么?是什么? N N是什么?是什么? n n变大的变大的 结果如何结果如何 ? 所有容量为所有容量为n n 的样本数的样本数. . 从这两张图中从这两张图中 要明白:要明白: (1 1)为什么)为什么 样本统计量是样本统计量是 随机变量。随机变量。 (2 2)什么是)什么是 样本均值的均样本均值的均 值。值。 n n变大,抽变大,抽 样分布方样分布方 差越小。差越小。 样本均值的数学样本均值的数学 期望就是样本均值期望就是样本均值 的均值。的均值。 图中那条曲线图中那条曲线 的均值更接近的均值更接近 总体的均值?总体的均值? 在这张图中在这张图中 总体均值在总体均值在 那里?那里? 用什么估用什么估 计总体均计总体均 值?值? 总体分布,样本分布,(总体的)抽样分布的关系总体分布,样本分布,(总体的)抽样分布的关系 . x x x x x x x x x x x xx x x x f f 总体分布总体分布 样本分布样本分布 抽样分布抽样分布 x x x x 总体元素个数、样本容量、样本(组)所有可能取值总体元素个数、样本容量、样本(组)所有可能取值 总体元素个数总体元素个数N N (总体的所有个体)(总体的所有个体) 样本容量样本容量n n (每一次取样的数量)(每一次取样的数量) 容量为容量为n n的样本的所有可能取值的样本的所有可能取值 (所有的(所有的N N n n 种可能都出现为止)种可能都出现为止) 重复抽样重复抽样 . x x x x x x x x x x x x x x x x f f x x 修正系数修正系数 (当N很大时修 正系数趋于1) P109P109 注意标准差与标注意标准差与标 准误差的区别。准误差的区别。 表表5.15.1(P106)P106),例,例5.45.4(P105P105;P109P109) 样本均值的抽样分布、样本方差的抽样分布样本均值的抽样分布、样本方差的抽样分布 总体的均值、方差总体的均值、方差 方差的样本分布方差的样本分布 均值的样本分布均值的样本分布 方差抽样分布(均值、方差)方差抽样分布(均值、方差) 均值抽样分布(均值、方差)均值抽样分布(均值、方差) . x x x x x x x x x x x x x x x x f f D D D D D D D D D D D D D D D D D D D D D D X X X X2 2 注意:服从正态注意:服从正态 分布和服从卡方分布和服从卡方 布分布的区别布分布的区别 n n 是什么?是什么? 此处红色曲线此处红色曲线 分布形成的均分布形成的均 值是什么?值是什么? 由样本标准差计由样本标准差计 算出来的卡方算出来的卡方 X X2 2 由样本标准差由样本标准差 0.0014mm0.0014mm计算出计算出 来的卡方值来的卡方值 X X2 2 样本均值的抽样分布、样本方差的抽样分布样本均值的抽样分布、样本方差的抽样分布 总体的均值、方差总体的均值、方差 方差的样本分布方差的样本分布 均值的样本分布均值的样本分布 方差抽样分布(均值、方差)方差抽样分布(均值、方差) 均值抽样分布(均值、方差)均值抽样分布(均值、方差) . x x x x x x x x x x x x x x x x f f D D D D D D D D D D D D D D D D D D D D D D X X 样本均值的抽样分布、样本方差的抽样分布、样本均值的抽样分布、样本方差的抽样分布、 样本均值的抽样分布样本均值的抽样分布 均值均值 方差方差 样本方差的抽样分布样本方差的抽样分布 均值均值 方差方差 样本其他参数的抽样分布样本其他参数的抽样分布 均值均值 方差方差 N N0 0 / N / N m m k k = =E(XE(X k k ) ) 原点矩原点矩 C C k k =EX-=EX-E(X)E(X)k k 中心矩 中心矩 定义定义5.95.9 用来估计总体参数的统计量的具体数值用来估计总体参数的统计量的具体数值, ,称为估计量称为估计量, ,用符号用符号表示。表示。 定义定义5.105.10 定义定义5.115.11 定义定义5.125.12 用来估计总体参数时计算出来的估计量的具体数值,称为估计值。用来估计总体参数时计算出来的估计量的具体数值,称为估计值。 在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。 用样本估计量用样本估计量的值直接作为总体参数的值直接作为总体参数的估计值,称为参数的点估计。的估计值,称为参数的点估计。 第第2 2点是什点是什 么意思?么意思? 这是什么这是什么 意思?意思? nn时时, , x x 与总体参数的真值间的误差趋于与总体参数的真值间的误差趋于0 0;如果一个估计量不是一致性的,如果一个估计量不是一致性的, 即便即便nn,x x 仍然不能等于仍然不能等于总总总总体参数的真体参数的真值值值值 总体均值总体均值 1 1 =(=(n-a)/(n-bn-a)/(n-b) ) 用某个用某个x x估计总体参数时,估计总体参数时,x x不一定等不一定等 于总体参数真值,但多个于总体参数真值,但多个x x的平均值的平均值 一定等于总体参数的真值一定等于总体参数的真值 无偏估计无偏估计 点估计与抽样分布的关系点估计与抽样分布的关系 . x x x x x x x x x x x xx x x x x x f f 总体分布总体分布 样本分布样本分布 抽样分布抽样分布 误差误差| | x x - - x x| | n n n n 根据中心极限定理当根据中心极限定理当 n n越大,样本(参数越大,样本(参数 )的抽样分布越接近)的抽样分布越接近 总体(参数)的真值总体(参数)的真值 。 为何只用一个样为何只用一个样 本估计,而不是本估计,而不是 用抽样分布估计用抽样分布估计 ? x x 定义定义5.135.13 估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为,所选择,所选择 的估计量为的估计量为,如果,如果E(E()=)=, ,称称为为的无偏估计。的无偏估计。 定义定义5.155.15 定义定义5.145.14 对同一总体参数的两个无偏估计量对同一总体参数的两个无偏估计量 1 1 和和 2 2 ,若,若D D( 1 1 ) 以一定的概率出现以一定的概率出现 根据中心极限定理当根据中心极限定理当n n越越 大,样本(参数)的抽大,样本(参数)的抽 样分布越接近总体(参样分布越接近总体(参 数)的真值。数)的真值。 | | x x x x | | xx 误差误差 ? x x = = x x 样本分布样本分布 区间估计与抽样分布的关系区间估计与抽样分布的关系 以一定的概率(以一定的概率(1 1) )出现出现 P P(x xx x x x x xx x)= 1-= 1- xx xx 抽样分布抽样分布 x x x x f f . 总体分布总体分布 样本分布样本分布 x x x x x x x x x x P P( x x x x x x x x x x)= 1-= 1- | | x x - x - x| | xx 误差误差 x x x x X X x + x + x x x x x x 区间区间 x x x x 抽样分布区间抽样分布区间 = 样本区间样本区间 x x x x x x x x x x x x x x x x x x x x x x x x xx 抽样分布抽样分布 x x x x f f . 总体分布总体分布 样本分布样本分布 x x x x x x x x x x x x x x x x x x x x x x z z 标准正态分布标准正态分布 xx 0 0 z z f f xxxx 此处此处 是是总总总总 体的体的标标标标准差准差 ,还还还还是是样样样样本本 的的标标标标准差?准差? Z Z /2/2是什么? 是什么? P117(125)P117(125) Z Z /2/2 N N (0,1(0,1) Z Z可靠性系数可靠性系数( (临界值临界值) ) x x Z Z /2/2( (/ n / n ) 估计误差估计误差x x 置信上(下)限置信上(下)限 Z =Z = / n / n x x - - N(0,1)N(0,1) 置信下(上)限 风险值 置信水平 边际误差 误差范围 可靠性系数 临界值 这是什么? P125P125 x x Z Z /2/2( (/ n / n ) 估计误差估计误差x x 置信上(下)限置信上(下)限 1 1 - Z Z /2/2 x x x x Z Z /2/2 此处此处 为总为总为总为总 体体标标标标准差,准差, 未知未知时时时时以以样样样样本本标标标标准差准差 s s代替。代替。 1. 1. 求产品平均重求产品平均重 量的范围量的范围, ,而不是而不是 平均重量平均重量. . 2.2.需要多大的范围需要多大的范围 . .才能以概率为才能以概率为 95% (0.95)95% (0.95)的准确的准确 率包含真正的平均率包含真正的平均 重量。重量。 /2/20.0250.025, 查(查(1-0.0251-0.025),), (0.975-0.5)(0.975-0.5) /2/20.0250.025, 查(查(1-0.0251-0.025),), (0.975-0.5)(0.975-0.5) 反查正态概率分布表反查正态概率分布表 和上题的差别和上题的差别: :没没 有总体标准差有总体标准差. . 总体标准差未总体标准差未 知,以样本标知,以样本标 准差代替。准差代替。 查查0.950.95 查查0.950.95 自由度为自由度为 n n1 1 的的 t t 分布分布 查查 t t0.025 0.025 X X B ( n, p ) B ( n, p ) p p N ( p , p ( 1 p ) ) N ( p , p ( 1 p ) ) 1 1 n n 二项分布, p为成 功率、比例等。 N N ( , 2 2 ) Z Z N N (0,10,1) X - X - 自由度为自由度为 n n1 1 的卡方的卡方 分布分布 置信下限置信下限 置信上限置信上限 / 2/ 2 / 2/ 2 置信下限置信下限 置信上限置信上限 0 0 / 2/ 2 / 2/ 2 置信下限置信下限 置信上限置信上限 0 0 样本容量与抽样分布的关系样本容量与抽样分布的关系 . x x x x x x f f 总体分布总体分布 样本分布样本分布 抽样分布抽样分布 误差误差|x|x x x | | n n n n 根据中心极限定理当根据中心极限定理当 n n越大,样本(参数越大,样本(参数 )的抽样分布越接近)的抽样分布越接近 总体(参数)的真值总体(参数)的真值 。 只用一个样本估计,而不是只用一个样本估计,而不是 用抽样分布估计。用抽样分布估计。 xxxx 估计误差估计误差x x x x Z Z /2/2( (/ n / n ) 置信上(下)限 置信上(下)限 置信区间置信区间 置信水平置信水平1-1- (1 1)如果确定了置信区间,就可以)如果确定了置信区间,就可以 确定估计误差(边际误差)确定估计误差(边际误差) 。 (2 2)如果确定了置信水平,就可以)如果确定了置信水平,就可以 确定确定Z Z /2/2。 。 (3 3)如果确定了估计误差和置信水)如果确定了估计误差和置信水 平,再知道总体标准差平,再知道总体标准差 ,就可以就可以 求一定求一定误误误误差范差范围围围围内和一定置信水平内和一定置信水平 下所需要的下所需要的样样样样本容量本容量n n。 如果只知道置如果只知道置 信区间信区间, ,能否确能否确 定定Z Z /2 ?/2 ? 此处是非标准 正态分布的置 信区间 边际误差边际误差 可靠性系数可靠性系数 不重复抽样时求样本容量不重复抽样时求样本容量n n的公式(的公式(P123P123)。)。3.3. 意义?意义? 样本容量样本容量n n与总体方差与总体方差 2 2 之间的关系之间的关系 = = x x n=5n=5 =0=0 x x =0=0 n=10n=10 0 0 x x1 1 x x2 2 x x3 3 x x4 4 x x5 5 x x1 1 =x=x 2 2 =x=x 3 3 =x=x 4 4 =x=x 5 5 = x x 总体方差越小,需要总体方差越小,需要 的样本容量越小。的样本容量越小。 总体分布总体分布 样本分布样本分布 抽样分布抽样分布 样本容量样本容量n n与与边际(估计)误差边际(估计)误差E E的关系的关系 xxxx xxxx 误差越大,落入误差范围的样误差越大,落入误差范围的样 本(参数)越多,如果缩小误本(参数)越多,如果缩小误 差,只有加大样本容量,使抽差,只有加大样本容量,使抽 样分布变窄,才能使同样多的样分布变窄,才能使同样多的 样本落入误差范围内样本落入误差范围内 。 1-1- 1-1- 1-1- 1-1- n n = = n n x x x x 1-1- 1- 1- n n x x 1-1- = = 1- 1- xxxx xxxx 误差越大,置信误差越大,置信 水平越大水平越大 同样的置信水平,要同样的置信水平,要 减少误差,就要加大减少误差,就要加大 样本容量误差样本容量误差 样本容量样本容量n n与可靠性系数(与可靠性系数(Z Z或或t t)的关系的关系 估计误差估计误差x x x x Z Z /2/2( (/ n / n ) 置信上(下)限置信上(下)限 置信区间置信区间 置信水平置信水平1-1- xxxx /2/2 /2/2 x x = = x x /2 /2 /2/2 Z Z /2/2 n n z z z z 例例1 1:某零件加工企业生产一种螺丝钉,对某天加工的零件每隔一定时间抽出一:某零件加工企业生产一种螺丝钉,对某天加工的零件每隔一定时间抽出一 个,共抽出个,共抽出1212个,测得长度(单位:个,测得长度(单位:mmmm)数据见数据见ExcelExcel中中A2:A13A2:A13。假定零件长假定零件长 度服从正态分布,试以度服从正态分布,试以95%95

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论