实训三用Ecel进行统计推断_第1页
实训三用Ecel进行统计推断_第2页
实训三用Ecel进行统计推断_第3页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实训三用Excel进行统计推断目的与要求:理解抽样分布原理,掌握在不同的组织形式下抽取样本 的方法,明确抽样标准误差、抽样边际误差之间的区别,重点掌握简 单随机抽样组织形式的区间估计方法,会用Excel软件抽取样本、进 行区间估计、以及确定样本单位数。一、用Excel抽取样本使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原 则,也可以按有关标志或无关标志,具体可参见本书有关抽样的章节,编号后, 将编号输入工作表。案例12:假定有100个总体单位,每个总体单位给一个编号,共有从1到100个编号5-1所示:图:5-1总体各单位编号表输入各总体单位的编号后,可按以下步骤操作:第

2、一步:单击工具菜单,选择数据分析选项(若无数据分析选项,可在工具 菜单下选择加载宏,在弹出的对话框中选择分析工具库,便可出现数据分析选项),打开数据分析对话框,从中选择抽样。如图5-2所示:图5-2数据分析对话框第二步:单击抽样选项,弹出抽样对话框。如图5-3图5-3抽样对话框第三步:在输入区域框中输入总体单位编号所在的单元格区域,在本例是 $A$1:$J$10,系统将从A列开始抽取样本,然后按顺序抽取B列至J列。如果输 入区域的第一行或第一列为标志项(横行标题或纵列标题),可单击标志复选框。第四步:在抽样方法项下,有周期和随机两种抽样模式:“周期”模式即所谓的等距抽样,采用这种抽样方法,需将

3、总体单位数除以 要抽取的样本单位数,求得取样的周期间隔。如我们要在100个总体单位中抽取 12个,则在“间隔”框中输入8。“随机模式”适用于纯随机抽样、分类抽样、整群抽样和阶段抽样。采用纯 随机抽样,只需在“样本数”框中输入要抽取的样本单位数即可;若采用分类抽 样,必须先将总体单位按某一标志分类编号,然后在每一类中随机抽取若干单位, 这种抽样方法实际是分组法与随机抽样的结合;整群抽样也要先将总体单位分类 编号,然后按随机原则抽取若干类作为样本, 对抽中的类的所有单位全部进行调 查。可以看出,此例的编号输入方法,只适用于等距抽样和纯随机抽样。第四步:指定输出区域,在这里我们输入 $A$14,单击

4、确定后,即可得到抽样结果,如图5-4A BDFGHIJ三4.4142434<145464743055152535556575856S163S4656耳右wsey-6T71727374757778?3?8818283E4S阴7S3893991929394959eg7939931010203040506030勺0itjo11121314宫15L616241732134D1 548B621222324W n She er 1 Z Shoe t Z /Sl ice 13 Z1 * 11dl二、CONFIDENCE边际误差)函数 CONFIDENCEalpha, sta ndard-dev, si

5、ze)返回总体平均值的置信区间。alpha (即a)是用于计算置信度的显著水平参数。置信度等于(1a),亦即,如果a为0.05,贝U置信水平为0.95。置信度为1.96Sta ndard-dev 数据区域的总体标准差,假设为已知(实际中,总体标准差 未知时通常用样本标准差代替)。Size 样本容量(即n)。x _ 1.96(如果假设a等于0.05,则需要计算标准正态分布曲线(1 a = 0.95 )之 下的临界值,查表知其临界值为土 1.96。因此置信区间为:使用的主要函数如下图:也立悴轴琦QI MEDJfiA. dJ格式iQ】工口. HIfjL) 由u电,胡fib QD导IHGl曰A册驭“&

6、quot;jAl-1= 超体垛的区冋估计AAI匚IDE1转体均低 的Li |nf占计HZ 乐2102:. 63样本弯盘COUMTiI) 1:235251004样丰均值AVEBJuGEC.ZJ 1.B25)105. 36lie .65:样本标淮差STDEVCD1 T>25>9, 6544S9156 S6101V宜估水平9列107 58抽样估计标推瞑腔E5/SQRT(R3)1- 30398123. 59rroFMsn<rv(o. 5+B7/2)1, 95991£拆41O绝对课.差B9*BS3. 781435102- S丄丄佶tj國帧COITFroKbTCECl -E7r

7、B5PB3J3; 784435103C楚体平均魏的塔伯取 间)5513L区估计10214侑计下限B-BUCh101.57557. 3丄吕佶计上卩艮B-iH-BlO1091445101 51B102丄了108: 8101. 81910S: 6204乂 1100 S22115 各23102:. 2242&勺S32G案例13:均值的区间估计(一)正态总体、方差未知、大样本某饭反店在-7星期内抽查4L9位顾客的消费额(元)服从正态分布,数据如下:152438263042183025263444203524263448182846193036422432453621472628314245362

8、42827323647532224324626求在概率90%勺保证下,顾客平均消费额的估计区间。 解:操作步骤如下:第一步:把数据输入到 A1: G7单元格。第二步:选中B9单元格,用鼠标单击工具栏的粘贴函数fx,在“函数分类” 单击“统计”,在其右边显示的“函数名”中单击“COUNT,出现图5-5对话框因文件密 镐揭视囲凹 插入 楮式© 工且 敷届理 宙口理 帮勘®I為电)唱二1 x “二 =oonrran:GT)COUHT图5-5 COUNT函数6789101234Rom ati在Valuel中输入或拖入数据区域A1: G7单元格,然后单击确定,获得样本 容量。同理,在

9、B10中,使用粘贴函数AVERAGEA1: G7),获得样本平均数;在B13中,使用粘贴函数CONFIDENCE出现图5-6对话框,EZ1< Excel BioolK 1剳文件(ZJ flilis CEJ视图(Y)ffiA(L) 格式 叱 工具CD 劫据OIJ會口 0D 帘肋QP在B11中,使用粘贴函数STDEV(A1: G7),获得样本标准差; 在B12中输入显著性水平a值10%图 5-6 CONFIDENCE函数在B14中输入“ =C10-C13,在B15中输入“ =C10+C13,回车后,便可得顾客平均消费额的置信下限为29.80184,置信上限为34.19816。如图5-7在Al

10、pha中输入 a值,此为C12在Standard-dev中输入样本标准差值, 此为C11,在Size中输入样本容量值,此为 C9,然后单击确定,即获得边际误 差。 L也晶电电1F23T=1ABCDEFG115243826304218yo旳<1-1yb昭'的<1(5119lbb必21<1Y艷U1IL!&4b必24M 丫兑74753222432462689样本容呈玖491 0样本均值3211杯強差9-3546S8912显著件水平a10%13边际送差2-198155414昼倍下限羽 8018451 F且倍上限34. 1舶1亦I也文件世)編齿1)观凹匹)抽小、迂丿格式

11、也丄貝敷IS Q隹fl I UN)帘肋QP或者,在B9中输入函数“ =C0UNTA1: G7)”,获得样本容量(即此例中的数 据个数);在B10中输入“ =AVERAGEA1: G7)”,获得样本平均数;在B11中输入“ =STDEV(A1: GO”,获得样本标准差;在B12中输入显著性水平a值10%在B13中输入表达式:“ =CONFIDENCC12 C11, C9)”,回车即得到边际误 差;在B14中输入“ =C1O-C13,在B15中输入“ =C1O+C13,回车后,便可得顾 客平均消费额的置信下限为29.80184,置信上限为34.19816。关于总体方差的估计、总体比例的估计等可按类

12、似方法进行。(二)正态总体、方差未知、小样本某零件加工企业生产一种螺丝钉,对某天加工的零件每隔一定时间抽出一 个,共抽取12个,测得其长度(单位:mm数据如附表中的A2:A13。假定零件 长度服从正态分布,试以95%勺置信水平估计该企业生产的螺丝钉平均长度的置 信区间。解:为构造区间估计的工作表,我们应在工作表中输入下列内容: A列输入样本 数据,B列输入变量名称,C列输入计算公式,D列为C列的计算结果,当输入 完公式后,即显示D列结果。用Excel求置信区间ABCD1样本数据计算指标计算公式计算结果210.94样本数据个数=COUNT(A2:A13)12311.91样本均值=AVERAGE(

13、A2:A13)11.074167410.91样本标准差=STDEV(A2:A13)0.272746510.94样本平均值的标准差=C4/SQRT(C2)0.078735611.03置信水平=0.950.95710.97自由度=C2-111811.09t值=TINV(1-C6,C7)2.200986911.00误差范围=C8*C50.1732941011.16置信下限=C3-C910.9008721110.94置信上限=C3+C911.24746101211.031310.97我们有95%把握认为该企业生产的螺丝钉的平均长度在10.900872mm11.247461mm 之间。对于不同的样本数据

14、,只要输入新的样本数据,再对C列公式中的样本数据区域加修改,置信区间就会自动给出。如果需要不同的置信水平,填入相应的数 值即可。方差已知时采用正态分布统计量构造置信区间,此时不用计算样本标准差, 直接使用总体标准差;B8单元格改为Z值;C8单元格改为“ =NORMSINV( (1-C6) /2) ”可。案例14:比例的区间估计以某厂对一批产品的质量进行抽样检验为例, 抽样数据和要求如下:采用重 复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为90%时优 质品率的边际误差。我们可以在 EXCEL中分别在: B1单元格中输入样本容量200; B2单元格中输入样本比率85%;在B3单

15、元格中输入计算样本比率的标准差公式“= SQRT(B2* (1-B2) ”;在B4单元格输入a为10%;在B5单元格中输入表达式:“ =CONFIDENCEB4, B3, B1)”,回车即Z j P(1 - P)得到呻门等于4.15 %。在B6单元格中输入表达式“ B2B5',回车即得到置信下限值,80.85%, 在B7单元格中输入表达式“ B2+B5,回车即得到置信上限值,89.15%.CONFIDENCE数的应用如图5-8Microsoft EKcel - Baokl图5-8总体优质品率的区间估计或用鼠标单击工具栏的粘贴函数fx,在“函数分类”单击“统计”,在其 右边显示的“函数名

16、”中单击“ CONFIDENCE,在Alpha中输入a值,此为 B4,在Standard-dev中输入样本标准差值,此为 B3,在Size中输入样本容量 值,此为B1,然后单击确定,即获得边际误差。案例15:估计总体必要的样本容量(一)估计均值的必要样本容量某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样边际误差为5元,计算应抽取的样本户数。 操作步骤:(1)建立“样本容量工作表”,如图5-9中A列;(2) 在单元格B1、B2中分别输入抽样边际误差5和置信度95.45%;(3)选中单元格B3,在编辑栏中输入“ =N0RMSINVB2)”,回

17、车后单元格B3显 示与置信度95.45%对应的Z值1.690145837 ;(4)在单元格B4中输入标准差30;(5) 选中单元格 B5,在编辑栏中输入样本容量公式“ =(B3A2*B4A2) /B1A2, 回车后单元格 B5显示102.8373462 ;(6) 选中单元格B6,在编辑栏中输入样本容量取整公式“ =CEILING(B5, 1)”, 回车后单元格B6显示103;计算结果如图5-9。|吋文件®囲備視因婕】插人格式识D cQQl X电殂I 10 -Bl 7匕=AB1 c1样未迪陆逞差52置信度95* 45%3 |2值1. 6901464标准差305样本容量102. 8373

18、6样本容量取整1037图5-9(二)估计总体比例(成数)的必要样本容量抽查一批产品的合格率,根据过去的资料,产品合格率为98%若要求把握程度(置信度)为95%边际误差不超过2%则应抽取多大容量的样本? 操作步骤:(1)建立“样本容量工作表”,如图5-10中A列;在单元格B1、B2、 B3中分别输入合格率98%置信度95%边际误差2%(2)在单元格 B4中输入公式“ =NORMSINV(B2+(1-B2)/2),回车后单元格 B4显 示与置信度95%寸应的Z值1.959964 ;(3)在单元格B5中输入样本容量公式“ =(B1*(1-B1)*B4/B3A2 ),回车后单元 格 B5 显示 188

19、.2315 ;(6)选中单元格B6,在编辑栏中输入样本容量取整公式“ =CEILING(B5, 1)”,回车后单元格B6显示189;计算结果如图5-10EH c xrosolf-to 01- Oool£ 1冏S女卄gtQEJ CMS 插不rxi 祜盘工ora 与 a肌8已|+C"-B1S十=ABU11匕例2UOM5边际谍左41. 9日996J.!5怦申夸旦1誇日一 230©1S9T图 5-10【实训三上机练习】1.某商场连续100天的销售额(单位:百元)资料如下:117122124129139107117130122125108131125117122133126

20、122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121要求:采用“纯随机模式”及“周期”模式各抽一个容量为10的样本2.表5-1包含50个由n=5个测量值组成的随机样本,均选自 4.5和二2 =8.25 的总体。表5-1 由n=5个测量值组成50随机样本数据1,8,0,6,61,6,0,0,93,6,4,2,04,5,3,4,82,3,7,6,32,1,7,2,96,8,5,2,81,5,0,5,85,6,7,8,2,2,0,6,6,34,5,7,7,

21、12,4,9,4,64,6,2,6,23,8,6,0,1,1,9,0,3,23,6,1,8,1,6,7,0,4,31,8,8,2,11,4,4,9,08,9,2,7,09,8,6,2,90,5,9,9,69,0,6,1,77,7,9,8,11,5,0,5,16,8,8,3,54,4,7,5,63,7,3,4,39,2,9,8,77,8,7,7,69,5,7,7,96,6,5,5,64,5,2,6,66,8,9,6,09,3,7,3,97,6,4,4,75,0,6,6,59,3,7,1,33,4,6,7,05,1,1,4,06,5,6,4,23,0,4,9,61,9,6,9,68,4,7,6,9

22、2,5,7,7,98,6,8,6,03,0,7,4,15,1,2,3,46,9,4,4,23,0,6,9,7要求:(1)计算每一个样本均值;构造 50个样本均值的分配数列,并做出直方 图;此图近似代表以容量n=5的样本为基础的X抽样分布。(2) 计算50个样本均值的平均数和标准差,与总体 刃=4.5和二2 =8.25可以得 出什么结论?用经验公式计算其抽样平均误差,与50个样本的标准差比较,可 以得出什么结论?(3)将50个n=5的样本一对一地合并,形成25个由n=10个测量值组成的样本; 构造25个样本均值的分配数列,并做出直方图;此图近似代表以容量n=10的样 本为基础的X抽样分布。(4)

23、 计算25个样本均值的平均数和标准差,与总体 4.5和二2 =8.25可以得 出什么结论?用经验公式计算其抽样平均误差,与25个样本的标准差比较,可 以得出什么结论?(5)比较(1)和(3)两个抽样分布的标准差,哪个抽样分布的变异性较小?3.某单位按简单随机重复抽样方式抽取 40名职工,对其业务情况进行考核,考 核成绩资料如下:68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 7671 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87要求:(1)根据上述资料按成绩分成

24、以下几组:60分以下,60-70分,70-80 分,80 90分,90100分,并根据分组整理成变量分配数列;(2) 根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试 成绩的区间范围。4.126页127页5.75.11题5. MetropolitanResearch有限公司是一家消费者研究组织,它设计调查,对消费者所使用的大量的产品和服务进行评估。在某一项研究中,Metropolita n 调查消费者对底特律某一个主要制造商所生产的汽车的性能的满意程度。分发给该制造商所生产的一种最大型号小汽车用户的调查表表明,许多人抱怨该车刚开始传动系统不佳。为了更好地了解传动系统的问题

25、,Metropolita n采用由底特律地区一个修理企业所提供的实际传动系统的维修记录为样本。表4-2数据是50辆汽车传动系统出现故障时所行驶的实际里程的数据:表5-2数据8509232609594657743732534640903246459902393238964194219116803928576343665605858616434261978679985981710176995774121352695687437666998400017206925066770986992235662744256720211844453500792946454486813116269378318934

26、173341852881381145340285586822567753988798要求:(1)用适当的描述统计量汇总传动系统数据(2)求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所 行驶里程的均值的95%S信区间,并对该区间估计做出管理上的解释。(3) 按照一些汽车用户曾经历过的早期传动系统失灵的说法,你的统计结 果说明了什么?(4) 如果研究公司想在5000英里的允许误差下,估计出现传动系统问题时 所行驶里程的均值,则置信度为 95%寸应选取多大的样本容量?(5) 为了更全面地对该传动系统问题做出评价,你还需要收集一些其他什么 样的信息?6. Lisa Rae Bock 在 1

27、994 年开办了一家 Bock投资服务公司(Bock Investment Serices,BIS),旨在给南加利福尼亚货币市场提供咨询服务和指导。为了给其 目前的客户提供更好的服务并吸引新客户,她每周做一份简讯。为了更好地反映 每周对基金管理者电话调查的结果,Lisa正在考虑向简讯中添加一项新内容。 为了对提供这种服务的可能性进行调查,以便确定在简讯中应包含哪些类的信 息,Lisa选取了 45种货币市场基金组成一个简单随机样本,部分数据见表4-3她们报告了基金的资产、最近7天和最近30天的获益率(Barrons,1994.10.3 ) 在给基金管理者打电话以获取更多的信息之前,Lisa决定先

28、对已搜集的数据做一些初始分析。要求:(1)用适当的描述统计量汇总货币市场基金的资产和获益率数据。(2)求货币市场基金总体的资产均值、 最近7天的获益率和最近30天的获 益率的95泄信区间估计。并对该区间估计做出管理上的解释。(3) 从Lisa该如何在其每周的简讯中使用这些信息的角度上看,你的统计 结果能说明什么?(4)为了向用户提供最有用的信息,你建议Lisa还需要搜集一些其它什么 信息表5-3 Bock投资服务公司问题中所用的数据货币市场基金资产/百万美圆过去7日的 获益率(%过去30日的获益 率(%Amcore103.94.104.18Alger156.74.794.73Arch MM/Trust496.54.174.13BT In stit Treas197.84.374.32Ben chmark Dir2755.44.544.47Bradford707.63.883.83Capital Cash1.74.294.22Cash Mgt Trust2707.84.144.04Composite122.84.033.91Cowe n Sta ndby694.74

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论