




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版第1章 绪论1什么是统计学?怎样理解统计学与统计数据的关系?2试举出日常生活或工作中统计数据及其规律性的例子。3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本;(4)描述推断。答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装
2、箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.53650226.8 kg。4“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体;(2)描述研究变量;(3)描述样本; (4)一描述推断。答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝
3、的两个品牌(4)推断:两个品牌中哪个口味更好。第2章 统计数据的描述练习题1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1) 指出上面的数据属于什么类型;用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。解:(1)由于表2.21中的数据为服务质量的等级,可以进
4、行优劣等级比较,但不能计算差异大小,属于顺序数据。(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C3232D1818E1515合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导条形图选择子图表类型完成(见Excel练习题2.1)。即得到如下的条形图:2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152124129116100103929512710410511911411587103118142135125117108105110107137120136
5、1171089788123115119138112146113126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万125万元为良好企业,105万115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为15287=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87
6、可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下10011
7、0110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.03.某百货公司连续40天的商品销售额如下(单位:万元):4125294738343038434046364537373
8、6454333443528463430374426384442363737493942323635 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:全部数据中,最大的为49,最小的为25,知数据全距为4925=24; 为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值25已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列
9、;将各组天数除以总天数40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)253030353540461510.015.037.5404545509622.515.0合计40100.0 直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.3).为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:70071672871968570969168470571870671571272269170869069
10、2707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3
11、)绘制茎叶图,并与直方图作比较。解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据排序确定,即完成数据排序的工作。(见Excel练习题2.4)(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题2.4) 100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计 =SUM(ABOVE) 100 =SUM(ABOVE) 100
12、 制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.4)(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:651866145686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147将直方图与茎叶图对比,可见两图十分相似。.下面是北方
13、某城市12月份各天气温的记录数据:-32-4-7-11-1789-6-7-14-18-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5指出上面的数据属于什么类型;对上面的数据进行适当的分组;绘制直方图,说明该城市气温分布的特点。解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。(2)分组如下: 由于全部数据中,最大的为9,最小的为25,知数据全距为9(25)=
14、34; 为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数天数,并填入表内,得到频数分布表如下表;北方某城市12月份各天气温分组天数(天)-25-208-20-158-15-1010-10-514-50140545107合计 =SUM(ABOVE) 65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点
15、击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.5).下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄18192121222425293034353940444559%1.934.734.117.26.42.71.81.2对这个年龄分布作直方图;从直方图分析成人自学考试人员年龄分布的特点。解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.6)(2)年龄分布的特点:自学考试人员年龄的分布为右偏。.下面是A、B两个班学生的数学考试成绩数据:A班
16、:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100将两个班的考试成绩用一个公共的茎制成茎叶图;比较两个班考试成绩分布的特点。解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:A班树茎B班数据个数树 叶树叶数据个
17、数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安14970765777727965516724168715775808365
18、4167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272资料来源:中国统计年鉴1998,中国统计出版社1998,第10页。解:箱线图如下:(特征请读者自己分析)9.某百货公司6月份各天的销售额数据如下(单位:万元):257
19、276297252238310240236265278271292261281301274267280291258272284268303273263322249269295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9) =274.1(万元)或点选单元格后,点击“自动求和”“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。在Excel表中将30个数据重新排序
20、,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:Me=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:QL=261+=261.25(万元) 同理,后四分位数位于第16第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:QU=291=290.75(万元)。(2)未分组数据的标准差计算公式为: s=利用上公式代入数据计算是个较为复杂
21、的工作。手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“”符号右边的小三角“”,选择“其它函数”选择函数“STDEV” “确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:(万元)。(见Excel练习题2.9)10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业AB
22、C152030210030001500325515001500比较哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为 x,产量为f,则总成本为xf,由于:平均成本=,而已知数据中缺产量f 的数据,又因个别产品产量f =从而 =,于是得:甲企业平均成本19.41(元),乙企业平均成本18.29(元),对比可见,甲企业的总平均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。11.在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200300193004003040050042500600
23、18600以上11合计120 计算120家企业利润额的均值和标准差。解:设各组平均利润为 x,企业数为f,则组总利润为xf, 由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)组中值企业数(个)总利润xfxf20030025019475030040035030105004005004504218900500600550189900600以上650117150合计12051200于是,120家企业平均利润为: = 426.67(万元);分组数据的标准差计算公式为: s= 手动计算须列表计算各组数据离差平方和(x426.67)2f,并求和,再代入计算公式:列表计算
24、如下组中值企业数(个)(x426.67)2fxf25019593033.489135030176348.6674504222860.133855018273785.200265011548639.1779合计1201614666.668表格中(x426.67)2f的计算方法:方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3426.67)* (a3426.67)*b3,回车,得到该行的计算结果;点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x426.67)2f计
25、算完毕;于是得标准差:(见Excel练习题2.11)s =116.48(万元)。点击第三列的合计单元格后,点击菜单栏中的“”号,回车,即获得第三列数据的和。方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“”符号右边的小三角“”,选择“其它函数”选择函数“STDEV” “确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11)于是得标准差:s =116.484
26、5(万元)。12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名717岁的少年儿童作为样本,另一位调查人员则抽取了1000名717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同? (2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相
27、同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1公斤2.2磅),求体重的平均数和标准差。 (3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间? (4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间? 解:(1)由于两组的平均体重不相等,应通过
28、比较离散系数确定体重差异较大的组:因为女生的离散系数为V=0.1男生体重的离散系数为V=0.08对比可知女生的体重差异较大。 (2) 男生:=27.27(磅),s =2.27(磅); 女生:=22.73(磅),s =2.27(磅); (3)68%;(4)95%。14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:成年组166169172177180170172174168173幼儿组68696870717372737475 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?解:(1)应采用离散系数,因为成年人和幼儿的身
29、高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:成年组身高的离散系数:;又得幼儿组身高的平均数为71.3,标准差为2.497,从而得: 幼儿组身高的离散系数:; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):方法A方法B
30、方法C164129125167130126168129126165130127170131126165130128164129127168127126164128127162128127163127125166128126167128116166125126165132125你准备采用什么方法来评价组装方法的优劣?如果让你选择一种方法,你会作出怎样的选择?试说明理由。解:(1)下表给计算出这三种组装方法的一些主要描述统计量: 方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏差2.13标准偏差1.75标准偏差
31、2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128评价优劣应根据离散系数,据上得:方法A的离散系数VA=0.0129,方法B的离散系数VB=0.0136,方法C的离散系数VC=0.0221; 对比可见,方法A的离散系数最低,说明方法A最优。(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高
32、科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。 (1)你认为该用什么样的统计测度值来反映投资的风险? (2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票? -30 0 30 60 -30 0 30 60 收 益 率 收 益 率 (a)商业类股票 (b) 高科技类股票解:(1)方差或标准差;(2)商业类股票;(3)(略)。02550频数频数0255017.下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与【例2.10】相同,试对该图反
33、映的人口、政治、社会、经济状况进行分析。第3章 概率与概率分布练习题(全免)1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?序号123456789101112性别男男男女男男女男女女男男职称工程师技术员技术员技术员技术员工程师工程师技术员技术员工程师技术员技术员解:设A女性,B工程师,AB女工程师,A+B女性或工程师(1)P(A)4/121/3(2)P(B)4/121/3(3)P(AB)2/121/6(4)P(A+B)P(A)P(B)P(AB
34、)1/31/31/61/22. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率。考虑逆事件“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:于是 3. 已知参加某项考试的全部人员合格的占80,在合格人员中成绩优秀只占15。试求任一参考人员成绩优秀的概率。解:设A表示“合格”,B表示“优秀”。由于BAB,于是 0.80.150.124. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许
35、在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80,第二发命中的可能性为50。求该选手两发都脱靶的概率。解:设A第1发命中。B命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 0.810.20.50.9 脱靶的概率10.90.1或(解法二):P(脱靶)P(第1次脱靶)P(第2次脱靶)0.20.50.15.已知某地区男子寿命超过55岁的概率为84,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?解: 设A活到55岁,B活到70岁。所求概率为:6.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调
36、查得知,采用新生产管理流程后产品优质率达95的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?解:这是一个计算后验概率的问题。设A优质率达95,优质率为80,B试验所生产的5件全部优质。P(A)0.4,P()0.6,P(B|A)=0.955, P(B|)=0.85,所求概率为:决策者会倾向于采用新的生产管理流程。7. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25、30和45。这三个企业产品的次品率分别为4、5、3。如果从这些产品中随机抽出一件,试问:(1)抽出次品的
37、概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?解:令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)0.25,P(A2)0.30, P(A3)0.45;P(B|A1)0.04,P(B|A2)0.05,P(B|A3)0.03;因此,所求概率分别为:(1) 0.250.040.300.050.450.030.0385(2)8.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相互独立的,且红灯持续24秒而绿灯持续36秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。解:据题意,在每个路口遇到红灯的概
38、率是p24/(24+36)0.4。设途中遇到红灯的次数X,因此,XB(3,0.4)。其概率分布如下表:xi0123P(X= xi)0.2160.4320.2880.064期望值(均值)1.2(次),方差0.72,标准差0.8485(次)9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):(1)至少获利50万元的概率;(2)亏本的概率;(3)支付保险金额的均值和标准差。解:设被保险人死亡数X,XB(20000,0.00
39、05)。(1)收入2000050(元)100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X 10)0.58304。(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:P(X20)1P(X20)10.998420.00158(3)支付保险金额的均值50000E(X)50000200000.0005(元)50(万元)支付保险金额的标准差50000(X)50000(200000.00050.9995)1/2158074(元)10.对上述练习题3.09的资料,试问:(1)可否利用泊松分布来近似计算?(2)可否利用正态分布来
40、近似计算?(3)假如投保人只有5000人,可利用哪种分布来近似计算?解: (1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,= np=200000.0005=10,即有XP(10)。计算结果与二项分布所得结果几乎完全一致。(2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。本例中,np=200000.0005=10,np(1-p)=200000.0005(1-0.0005)=9.995,即有X N(10,9.995)。相应的概率为:P(X 10.5)0.51995,P(X20.5)0.853262。可见误差比较
41、大(这是由于P太小,二项分布偏斜太严重)。【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。(3)由于p0.0005,假如n=5000,则np2.55,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9
42、。解:(1)0.04779合格率为1-0.047790.95221或95.221。(2) 设所求值为K,满足电池寿命在200K小时范围内的概率不小于0.9,即有:即:,K/301.64485,故K49.3456。12.某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?解:设X 同一时刻需用咨询服务的商品种数,由题意有XB(6,0.2)(1)X的最可能值为:X0(n+1)p70.21 (取整
43、数)(2)1-0.90110.0989第4章 抽样与抽样分布练习题(全免)1. 一个具有个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 给出的抽样分布(重复抽样)的均值和标准差 描述的抽样分布的形状。你的回答依赖于样本容量吗? 计算标准正态统计量对应于的值。 计算标准正态统计量对应于的值。解: 已知 n=64,为大样本,=20,=16, 在重复抽样情况下,的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。23; 25; .落在16和22之间; 1.645,所以应该拒绝。3.11,拒绝。1.93,不拒绝。7.48,
44、拒绝。206.22,拒绝。 -5.145,拒绝。 1.36,不拒绝。 -4.05,拒绝。 8.28,拒绝。(1)检验结果如下:t-检验: 双样本等方差假设变量 1变量 2平均100.7109.9方差24.1157894733.35789474观测值2020合并方差28.73684211假设平均差0df38t Stat-5.427106029P(T=t) 单尾1.73712E-06t 单尾临界1.685953066P(T=t) 双尾3.47424E-06t 双尾临界2.024394234t-检验: 双样本异方差假设变量 1变量 2平均100.7109.9方差24.1157894733.35789
45、474观测值2020假设平均差0df37t Stat-5.427106029P(T=t) 单尾1.87355E-06t 单尾临界1.687094482P(T=t) 双尾3.74709E-06t 双尾临界2.026190487(2)方差检验结果如下:F-检验 双样本方差分析变量 1变量 2平均100.7109.9方差24.1157894733.35789474观测值2020df1919F0.722940991P(F4.07,应拒绝,说明X、联合起来对Y确有显著影响。(4)计算总成本对产量的非线性相关系数:因为因此总成本对产量的非线性相关系数为或R=0.9867466(5)评价:虽然经t检验各个系
46、数均是显著的,但与临界值都十分接近,说明t检验只是勉强通过,其把握并不大。如果取,则查t分布表得,这时各个参数对应的t统计量的绝对值均小于临界值,则在的显著性水平下都应接受的原假设。9. 研究青春发育与远视率(对数视力)的变化关系,测得结果如下表: 年龄(岁)远视率(%)对数视力=ln663.644.153761.064.112838.843.659913.752.6211014.502.674118.072.088124.411.484132.270.82142.090.737151.020.02162.510.92173.121.138182.981.092试建立曲线回归方程解:利用Exc
47、el输入X、和Y数据,用Y对X回归,估计参数结果为 t值=(9.46)(-6.515) 整理后得到:时间序列分析练习题1. 某汽车制造厂2003年产量为30万辆。(1)若规定20042006年年递增率不低于6%,其后年递增率不低于5%,2008年该厂汽车产量将达到多少?(2)若规定2013年汽车产量在2003年的基础上翻一番,而2004年的增长速度可望达到7.8%,问以后9年应以怎样的速度增长才能达到预定目标?(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?解:设i年的环比发展水平为x i,则由已知得:x200330,(
48、1)又知:,求x2008 由上得 即为 ,从而2008年该厂汽车产量将达到得 x200830 = 301.3131 = 39.393(万辆)从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。(2)规定,求由上得 可知,2004年以后9年应以7.11的速度增长,才能达到2013年汽车产量在2003年的基础上翻一番的目标。(3)设:按每年7.4%的增长速度n年可翻一番, 则有 所以 (年)可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29
49、年即3个月另14天达到翻一番的预定目标。2. 某地区社会商品零售额19881992年期间(1987年为基期)每年平均增长10%,19931997年期间每年平均增长8.2%,19982003年期间每年平均增长6.8%。问2003年与1987年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997年社会商品零售额为30亿元,按此平均增长速度,2004年的社会商品零售额应为多少? 解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为: ,即为 ,即为 ,即为 于是得:以1987年为基期,2003年与1987年相比,该地区社会商品零售额的发展速度为: =(原解答案中,0397为
50、5年是错的,导致增长速度也是错的。下同)从而得知,2003年与1987年相比,该地区社会商品零售额共增长254.43%。 (2)1987年至2003年之间,年平均发展速度为: =1.0822945=108.23%可知,1987年至2003年之间,年平均增长速度为8.23%。(3) 若x1997=30亿元,按平均增长速度8.23%计算x2004, 即由 得 x2004= (亿元)可知,按照假定,2004年的社会商品零售额应为52.1867亿元3.某地区国内生产总值在19911993年平均每年递增12,1994-1997年平均每年递增10,1998-2000年平均每年递增8。试计算:(1)该地区国
51、内生产总值在这10年间的发展总速度和平均增长速度;(2)若2000年的国内生产总值为500亿元,以后平均每年增长6,到2002年可达多少?(3)若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105,则2002年一季度的计划任务应为多少?解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为: ,即 ,即 ,即该地区国内生产总值在这10年间的发展总速度为 =则平均增长速度为:若x2000=500亿元,以后平均每年增长6,即由 得到 x2002=(亿元),可知,若2000年的国内生产总值为500亿元,以后平均每年增长6,到2002年可达561.80亿元。若2002年的
52、国内生产总值的计划任务为570亿元,一季度的季节比率为105,则2002年各季度的平均计划任务是5704亿元,于是,2002年一季度的计划任务为:(亿元)。4. 某公司近10年间股票的每股收益如下(单位:元):0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50(1)分别用移动平均法和趋势方程预测该公司下一年的收益;(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向?解: (1) *用移动平均法预测该公司下一年的收益: 在Excel中作出10年间股票的每股收益表,添加“五项平均”计算列,选定“五项平均”列中的第三行单元格,点击
53、菜单栏中“”符号右边的小三角“”,选择点击:自动求和平均值,用鼠标选定前五个数据(b2:b6),回车,即得到第一个五项平均值“0.96”。选择第一个五项平均“0.96”所在的单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即得到用五项移动平均法计算的趋势值,如下表:年序每股收益五项平均10.64 20.73 30.94 0.9641.14 1.1351.33 1.3261.53 1.4771.67 1.6681.68 1.9092.10 102.50 再利用上表的计算结果预测第11年的每股收益: 选定上Excel表中的全部预测值,
54、并将鼠标移动到该选定区域的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列第11年对应的单元格处放开,即获得911年的预测值(见下表蓝色数字),即得第11年的每股收益额为“2.30”。如下表: 年序每股收益五项平均10.64 20.73 30.94 0.9641.14 1.1351.33 1.3261.53 1.4771.67 1.6681.68 1.9092.10 1.99102.50 2.092.30 *用趋势方程法预测该公司下一年的收益: 先求出10年间股票每股收益的趋势(回归)方程。 设时间为t,每股收益为y,趋势方程为 y=1+2 t 解法一:应用Excel统计函数进行计算:
55、= 1 * GB2 应用统计函数“SLOPE”计算直线斜率: = 1 * GB3 在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“”,选择“统计”,再在“选择函数(N)”中选择函数“SLOPE”,然后点击“确定”; = 2 * GB3 在“函数参数”窗口中,点击“Known_ys”输入栏后,在Excel表中刷取y列数据,再点击“Known_xs”输入栏后,在Excel表中刷取t列数据,然后点击“确定”。这时即在选定的单元格中出现直线斜率的计算结果0.192848 = 2 * GB2 应用
56、统计函数“INTERCEPT”计算直线与y轴的截距直线起点值: = 1 * GB3 在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“”,选择“统计”,再在“选择函数(N)”中选择函数“INTERCEPT”,然后点击“确定”; = 2 * GB3 在“函数参数”窗口中,点击“Known_ys”输入栏后,在Excel表中刷取y列数据,再点击“Known_xs”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。这时即在选定的单元格中出现直线斜率的计算结果 0.365333 解法二:应用
57、最小二乘法,用Excel列表计算趋势方程的公式元素: 年序每股收益t2tyty10.64 10.6420.73 41.4630.94 92.8241.14 164.5651.33 256.6561.53 369.1871.67 4911.6981.68 6413.4492.10 8118.9102.50 10025合计55 14.26 38594.34 可得:回归系数 初始值 = = =0.365336 于是,得每股收益倚年份序号的趋势方程为:对趋势方程代入 t=11,可预测下一年(第11年)的每股收益为:元(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。
58、是一个较为适合的投资方向。5.某县20002003年各季度鲜蛋销售量数据如下(单位:万公斤)年份一季度二季度三季度四季度200020012002200313.110.814.618.413.911.517.520.07.99.716.016.98.611.018.218.0(1)用移动平均法消除季节变动;(2)拟合线性模型测定长期趋势;(3)预测2004年各季度鲜蛋销售量。解:(1)由于应用移动平均法修匀数据由于周期性或季节性引起的波动,必须以周期或季节的长度作为时距的长度,因此对上面的数据作四项移动平均。 先在Excel中将数据按年序和季度顺序排列成表,然后计算四项移动平均:选定“四项移动平
59、均”列中的第三季度对应的单元格(实际位于第二、三季度之间,即上升半行的位置),点击:菜单栏中“”右边的“”后,选择“平均值”后,在Excel表中刷取2000年的四个季度的销售量数据,回车,即获得第一个四项平均值。选定上Excel表中的第一个四项平均值,并将鼠标移动到该选定单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列倒数第三行(实际位于第二、三季度之间,即上升半行的位置) 的单元格处放开,即获得全部四项移动平均值。 再计算移正平均:选定“移正平均”列中的第三季度对应的单元格,点击:菜单栏中“”右边的“”后,选择“平均值”后,在Excel表中刷取头两个四项平均值,回车,即获得第一
60、个移正平均值。选定上Excel表中的第一个移正平均值,并将鼠标移动到该选定单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即获得全部移正平均值。 可见,移正后的数据基本上呈上升状态,已经消除了原来鲜蛋销售量的季节波动影响,为作数据的长期趋势分析提供了有效支持。 数据如下表:移动平均法消除季节变动计算表年序季序鲜蛋销售量四项移动平均值移正平均值()2000年一季度13.1二季度13.9三季度7.910.87510.5875四季度8.610.3102001年一季度10.89.79.925二季度11.510.1510.45三季度9.710.7511.225四季
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届山东省菏泽市高三10月期中考-政治试题(含答案)
- 中医专长培训定制班一学员协议书
- 2024年河北省中等职业对口升学中职英语真题(解析版)
- 2025年泰安货运从业资格证试题及答案
- 脊柱外科相关知识
- 2025年份第二季度职业柔道俱乐部寝技专家训练器械维护协议
- 工程售后服务协议书
- 股权转让附条件协议
- 二零二五版房屋合租协议
- 建设加油加气加氢充电一体站项目可行性研究报告写作模板-拿地申报
- 2023学年杭州市余杭区七年级语文下学期期中考试卷附答案解析
- 9《小水滴的诉说》(教学设计)-2023-2024学年统编版道德与法治二年级下册
- 2025年安徽合肥兴泰金融控股集团招聘笔试参考题库含答案解析
- 《道路交通安全法》课件完整版
- 加快形成农业新质生产力
- 施工现场应急救援知识
- 饲料行业业务员聘用合同范本
- 全国园地、林地、草地分等定级数据库规范1123
- 人工智能在教学动画设计中的应用与创新路径探究
- 护理中医新技术新项目
- VDA-6.3-2016过程审核检查表
评论
0/150
提交评论