小样本及容量_第1页
小样本及容量_第2页
小样本及容量_第3页
小样本及容量_第4页
小样本及容量_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一只鹦鹉大摇大摆地走进酒吧,飞上吧台。 “嘿,伙计!给我来一盘毛毛虫!”鹦鹉嚷道。 “我们这里不卖毛毛虫!”侍者有点生气。 “什么破酒吧?”鹦鹉骂了一句,一摇一摆地走了。 第二天,鹦鹉又来了,跃上吧台。 “喂,伙计!快给我来一盘毛毛虫!”鹦鹉仿佛忘了昨天的事。 “你是不是不长记性!我们这里不卖毛毛虫!”侍者十分恼火。 “到底是不是做生意的?”鹦鹉嘟哝着走了。 第三天,鹦鹉照旧来到酒吧,“扑哧”一声窜上吧台。 “伙计!来一盘毛毛虫!”鹦鹉依旧老一套。 “你要是再敢要毛毛虫,我就把你的嘴壳子钉在这吧台上!” 说着侍者挥了挥拳头. “暴脾气!” 鹦鹉埋怨了一声,急忙逃走了。 第四天,鹦鹉居然还是来到

2、酒吧。 它飞上吧台,“伙计!给我来一盘钉子!” 鹦鹉终于改了说法. “滚开!我们这里没有钉子!”侍者骂道。 “那么,给我来一盘毛毛虫!” 1第三节 小样本情形下的区间估计使用t分布的条件(p129):正态总体、当样本容量n30,总体标准差未知时,用样本标准差S代替总体标准差。T分布:2在讨论大样本的参数估计时,我们引用了中心极限定理,即把平均数的抽样分布看成是正态分布。 3但中心极限定理是在极限意义上引进的。如果样本容量太小,而总体方差未知时,由于样本标准差是有偏估计量,当我们用样本标准差代替(点估计)总体标准差时,就不能再认为平均数的抽样分布是N。即:当n较小, 不再成立。 4 所以,当我们

3、利用样本标准差来代替总体标准差时,在对参数进行估计时,就会人为地引入一个误差来源,而我们又使用小样本,更会影响我们估计的精度,为了保持我们需要的置信度,我们只有加宽置信区间。 从区间估计的公式中可以看到,s代替,n是我们选择的样本容量,不能再变,能变化的只有Z值了,而改变Z,除了改变置信度外,就要改变分布的形式,即认为抽样分布不服从正态分布。 5 经过证明及推导,引出在小样本的情况下,我们估计的临界值服从自由度为(n-1)的t分布,临界值用表示,置信区间为:(),6 特点(p106、130): 关于y轴对称;随着自由度的逐渐增大,密度曲线逐渐接近于标准正态密度曲线.标准t分布表示方法:xt(0

4、, ),其密度曲线:Xf(x)7 t分布的 分位数:Xf(x) 设Xt(n),对于给定(0)=,则称为t(n)分布的水平的分位数, 记为:例如. 设Xt(15),求(1)=0.005的上侧分位数;解(1)=t0.005(15),查表得=2.947t(n)8估计区间:9例题1: 某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。10分析: 在置信度不变的情况下,相同的面积在t 分布中包含的区间更长一些

5、。11例题2:从大学一年级学生中随机抽取12名学生,其阅读能力得分(服从正态分布)为28,32,36,22,34,30,33,25,31,33,29,26。试评估一下大学一年级学生阅读能力的总体平均分数。要求置信度分别是95%和99%。12步骤:(1)计算样本平均数: (2)计算样本标准差(3)构造分布,并确定自由度(4)计算平均误差:(5)估计总体平均数置信区间:29.917 4.1 1.184 11 (27.311 32.523) 13习题1: 为管理的需要,银行要测定在业务柜台上每笔业务平均所需的时间。假设每笔业务所需时间服从正态分布,现随机抽取样本量为16,测得平均时间为13分钟,标准

6、差为5.6分钟,要求以99%的置信系数确定置信界限。若置信系数改为90%,其置信界限有什么区别?14 习题2:某出租汽车公司欲测定该公司汽车的每公升汽油能行驶的里程,该数据服从正态分布。随机抽取8辆车测定得数据如下:11.95,14.28,17.90,15.94,11.73,15.64,16.58,12.50。要求估计该公司所有汽车每公升汽油平均行驶里程的置信区间,置信系数为95%。15 习题3: 随机地从一批钉子中抽取16枚,测得它们的直径(单位:厘米),并求得其样本均值为2.125,方差为0.01713 .设钉的直径服从正态分布,试求总体均值的置信系数为0.90的置信区间已知 : 16第四

7、节:抽样容量的确定(p141) 所谓必要的抽样数目,也就是指为了使抽样误差不超过给定的允许范围至少应抽取的样本单位数目。17影响抽样容量的因素:(1)总体方差2(或总体标准差)。其他条件不变下,总体单位的差异程度大,则应多抽,反之可少抽一些。(2)允许误差范围 或 。(书中用E表示)(3)置信度( )。(4)抽样方法(是否重复抽样)。(5)抽样组织方式。18影响区间宽度的因素1、数据的离散程度,用 来测度2、样本容量,3、置信水平 (1 - ),影响 Z 的大小与总体方差成正比与允许误差成反比与可靠性系数成正比19重复抽样不重复抽样估计总体均值时样本容量的确定 20根据均值区间估计公式可得样本

8、容量n为因此:21根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定(P143) 若总体比例P未知时,可用样本比例 来代替 p22样本量的确定(实例1)需要多大规模的样本才能在 90% 的置信水平上保证均值的误差在 5 之内? 前期研究表明总体标准差为 45.nZE=222222(1645)(45)(5)219.2220.向上取整23【例2】一家广告公想估计某类商店去年所花的平均广告费有多少。经验表明,总体方差约为1800000元。如置信度取95%,并要使估计在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?24解:已知2=1800000,=0.05, Z/2=1.9

9、6,=500 应抽取的样本容量为25例题4: 某食品厂要检验本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?26不重复抽样:2728一个结论: 不重复抽样的效率高于重复抽样。29习题4: 某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本?30 习题5: 某养鸡专业户养了1000只小鸡,一个月后欲估计这批小鸡的总重量,要求估计误差不超过2公斤(2000

10、克),而每只鸡重量的方差约为49 ,要求置信度为95%应抽多少只鸡作样本?3132 习题6:某果园有1000株果树,在采摘前欲估计果园的总产量,随机抽选了10株,产量分别为161,68,45,102,38,87,100,92,76,90公斤。假设果树的产量服从正态分布,试以95%的置信水平估计该果园的总产量,若要求置信区间缩小一半,应抽多少株果树作样本?33总体方差未知时样本容量的确定(P142、143)例7:某商场经理预估计消费者每次来商场购物所花费的金额,以往经验表明,一般消费者最多花费356元,最低花费68元,如想以95%的把握,使估计的误差不大于30元,应该抽取多少样本容量?34简单随

11、机抽样下估计总体比例时样本容量的确定式中的总体比例可以通过以下方式估计:根据历史资料确定通过试验性调查估计取为0.5。35 【例4】某品牌电脑公司,准备将电脑销售市场转入拉美地区,事先派出有关人员到该地区查询资料,以便估计一下该地区有电脑的家庭所占的比例。公司希望这一比例的估计允许误差不超过0.05,且置信度为95%。问:要抽取多大容量的样本?(事先对总体一无所知) 。36解: 已知=0.05,=0.05,Z/2=1.96,当p未知时用最大方差0.25代替 应抽取的样本容量为37 例题6:某企业对一批产品进行质量检查,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?38例8:某调查机构想调查某市家庭拥有电脑的比率,如果客户要求的把握程度是90%,误差不大于2%,应抽取多大的样本?39练习7:从我校新入学的名单中得知,新生中年龄最大的22岁,最小的17岁,如果想以95%的把握使估计的平均年龄不超过0.5岁,应抽取多大的样本?40为了考察我校英

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论