


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学课本课后作业题(全)题目:第 1 章:Pii 6, 7第 2 章: P52 练习题 3、9、10、第 3 章:Pii6 思考题 i2 、i4思考题 6 ,练习题思考题 4 、练习题思考题 4 、练习题思考题 i 、练习题思考题 4、 i0第 4 章: Pii4第 5 章: Pi79第 6 章: P209第 7 章: P246第 8 章: P287ii练习题 i6 、 252、4、6、i33、4、6、iii、3、6i、7练习题 2、 3第一章6一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检 查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是 2 440
2、加仑的油漆罐。 这家零售商抽查了 50 罐油漆,每一罐的质量精确到 4 位小数。装满的油漆罐应为 4.536 kg 。 要求:(1) 描述总体;最近的一个集装箱内的全部油漆;(2) 描述研究变量;装满的油漆罐的质量;(3) 描述样本;最近的一个集装箱内的 50 罐油漆;(4) 描述推断。50罐油漆的质量应为 4.536 X50 = 226.8 kg 。 7“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中
3、,两个品牌不做外观标记 ),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。第二章3.某百货公司连续 40天的商品销售额如下(单位:万元):41252947383430384340463645373736454333443528463430374426384442363737493942323635根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 解:采用等距分组全距=49-25=24n=40取组距为5,则组数为
4、 24/5=4.8 取5组频数分布表:按销售额分组(万元)频数(天数)25-3030-354635-4040-4545-501596合计405HYvcneuaer6962530354045sales509.某257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295(1) 计算该百货公司日销售额的均值、中位数和四分位数;(2) 计算日销售额的标准差。&- X 8223十一解:(1) X =274.1 (万兀)n 30将30个数据重新排序,则中位数位于30个数据的中间
5、位置,即靠中的第15、第16两个272 273数272和273的平均数:Me=272.5 (万元)21第15个数据的由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第中间位置(第8位)靠上四分之一的位置上,由重新排序后的第 8位是261,第15位是272 ,273 272一、从而:Ql=261+=261.25 (万兀)4同理,后四分位数位于第 16第30个数据的中间位置(第23位)靠下四分之一的位置上,273 272由重新排序后第 23位是291,第16位是273 ,从而:Qu=291 =290.75 (万4元)。30(XiX)2(2 )未分组数据的标准差计算公式为:i 1得 s=
6、21.1742n 110.甲乙两个企业生产三种产品的单位成本和总成本资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业A1521003255B2030001500C3015001500比较哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为 X,产量为f,则总成本为xf,由于:平均成本x= 一Xf =总成本 f 总产量而已知数据中缺产量f的数据,又因个别产品产量该产品成本该产品单位成本xf从而- xfX=,于是得:甲企业平均成本=xfXXfxfX2100 3000 15002100 3000 1500152030(元),乙企业平均成本=xfxfx3255 1500 15003255
7、 1500 1500=18.29 (元),对比可见,甲企业的总平152030均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量 中所占比重较大,因此拉低了总平均成本。11.在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200 70019300 40030400 50042500 60018600以上11合计120计算120家企业利润额的均值和标准差。解:设各组平均利润为 x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)组中值企业数(个)总利润xfxf200
8、 /700250194750300 /-4003503010500400 /-5004504218900500 /-600550189900600以上650117150合计是,120家企业平均利润为:12051200- xf 51200十一X = 426.67 (万兀);f 120s J(Xi X)2f J666l68=116.48 (万元)。Y f 1 V 120 1思考练习:12解析总体分布、样本分布和抽样分布的含义总体分布:就是与总体相联系的随机变量的概率分布样本分布:是与样本相联系的随机向量的联合概率分布抽样分布:就是作为样本的函数的统计量的分布14解析中心极限定理的含义:是阐述大量随
9、机变量之和的分布趋近于正态分布的一系列定理的总称200小时,标准差为 30小时16某企业生产的某种电池寿命近似服从正态分布,且均值为若规定寿命低于150小时为不合格品。试求(1) 该企业生产的电池的合格率是多少?(2)该企业生产的寿命在 200小时左右的多大范围内的概率不小于0.9?解(1) P(X150) P(Z佰:。200) P(Z1.6667) = 0.04779合格率为1-0.04779 = 0.95221 或 95.221 %。(2) 设所求值为 K,满足电池寿命在 200 ±K小时范围内的概率不小于 0.9,即有:I x 2001 kP(|X 200| K) P|Z| =
10、0.93030即: PZ 爲 0.95 , K/30 >1.64485,故 K>49.3456。25某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算X,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 如果该生产过程仍旧正常,则x的样本分布为何?假设这个
11、检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值x <830牛顿的概率是多少? 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看法(即夹克级别均值是否仍为840牛顿)? 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了 45牛顿。在这种情况下 X的抽样分布是什么?当 X具有这种分布时,则 X <830牛顿 的概率是多少?第四章参数估计6简述样本量与置信水平、总体方差、允许误差的关系。样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间
12、里选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,求允许误差;(3)如果样本均值为120元,求总体均值95%的置信区间。解:(1)已假定总体标准差为b =15元则样本均值的抽样标准误差为(T15升=X 5=2.142949(2)已知置信水平1 - a =95%,得Z a佗=1.96,于是,允许误差是Z a /2(Tn=1.96 X2.1429=4.2000(3) 已知样本均值为 X=120元,置信水平1 - a =95%,得 乙佗=1.96 ,这时总体均值的置信区间为Z a /2(T n=120 ±4.2=12
13、4.2115.8可知,如果样本均值为120元,总体均值95%的置信区间为(115.8 , 124.2 )元。4.从一个正态总体中随机抽取容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。解:(7.1,12.9 )。6.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和 95%。解:已知样本容量 n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,拥有该品牌电视机的家庭比率的抽样标准误差为P(1 P)0.23 °
14、.77 =2.98%200双侧置信水平为90%时,通过 2 B 仁0.90换算为单侧正态分布的置信水平P =0.95,查单侧正态分布表得Za/2=1.64,此时的置信区间为pZ a /2P(1_p) =23% ±1.64 X2.98%= / 27.89% n'.18.11%可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11% , 27.89% )。双侧置信水平为95%时,得Z a /2=1.96 ,此时的置信区间为Za 12, P(1 P)=23% ±1.96 X2.98%=28.8408%17.1592%可知,当置信水平为 95%时
15、,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16% ,28.84% )。13.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?解:已知总体比率=2%=0.02 ,由置信水平 1- 0=95%,得置信度Z ”2=1.96,允许误差EW 4%即由允许误差公式opE= Z £-整理得到样本容量 n的计算公式:n=(6)2=(乙 4)2=Z202 丫-",便 0.022 0.98 =47.0596EEE20.042由于计算结果大于47,故为保证使成立,至少应取48个单位的样本。第五章4 什么是 P 值? P
16、 值检验决策的意义是什么?答:p值是当原假设为真时, 检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。 P 值常常作为观察到的数据与原假设不一致程度的度量。 统计量检验采用 事先确定显著性水平 ,来控制犯第一类错误的上限, p 值可以有效地补充 提供地关于 检验可靠性的有限信息。 p 值检验的优点在于,它提供了更多的信息,让人们可以选择一 定的水平来评估结果是否具有统计上的显著性。3 一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60g 一袋的那种土豆片的重量不符合。 店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片 碎屑,但为了使顾客们对花钱
17、买到的土豆片感到物有所值, 店方仍然决定对来自于一家最大 的供应商的下一批袋装炸土豆片的平均重量(g)u 进行检验,假设陈述如下: Ho : u>=60H1: u<60(1) 与这一假设检验问题相关联的第I 类错误是什么?(2) 与这一假设检验问题相关联的第II 类错误是什么?(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为 严重?(1) 第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60 克,但检验 结果却提供证据支持店方倾向于认为其重量少于 60 克;(2) 第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60 克,但检验结
18、却 没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。4 某种纤维原有平均强度不超过 6g ,现希望通过改进工艺来提高其平均强度。研究人员测得了 100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为 1.19不变,在5%的显著性水平下对该问题进行假设检验。(1 )选择检验统计量并说明其抽样分布是什么样的。(2 )检验的拒绝规则是什么?(3) 计算检验统计量的值,你的结论是什么?(1)检验统计量zxs/ n在大样本情形下近似服从标准正态分布;(2)如果Z z0.05,就拒绝H0(3)检验统计量 Z
19、 = 2.94>1.645 ,所以应该拒绝 H0。6 一个视频录像设备(VCR)的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差,并在a=0.05的显著性水平下作出结论。2解:提出假设 H 0 : TV2VCR2 20.75 ,H1: tv20.7522已知:n 30, s2,0.052 n检验统计量一1 s22VCR29*20.752103fa 2942.557拒绝H。,可判定电视使用寿命的方差显著大于VCR11为比较新旧两种
20、肥料对产量的影响,一边决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下表。旧肥料新肥料1091019798100105109110118 109113111111 9911298989499106117991071191041101111031101191038810810210697105102104101取显著性水平a=0.05,用Excel检验(1 )检验结果如下:t-检验:双样本等方差假设变量1变量2平均100.7109.9方差24.1157894733.35789474观测值2020合并方差28.73684211假设平均差
21、0df38t Stat-5.427106029P( T<=t)单尾1.73712E-06t单尾临界1.685953066P( T<=t)双尾3.47424E-06t双尾临界2.024394234t-检验:双样本异方差假设变量1变量2平均100.7109.9方差24.1157894733.35789474观测值2020假设平均差0df37t Stat-5.427106029P( T<=t)单尾1.87355E-06t单尾临界1.687094482P( T<=t)双尾3.74709E-06t双尾临界2.026190487(2 )方差检验结果如下:F-检验双样本方差分析变量1
22、平均100.7109.9方差24.1157894733.35789474观测值2020df1919变量20.722940991p(Fv=f)单尾0.243109655F单尾临界0.395811384第六章4简述方差分析的基本思想。是对比不同影响水平下整体方差和组间方差的差异,即不同水平的数据间方差和 随机方差的对比1从三个总体中各抽取容量不同样本数据,得到的资料见表。检验3个总体的均值之间是否有显著差异。(a=0.01 )三个总体抽取的样本数据样本1样本二样本三158148161154169153142156149169158180F 4.6574 Fo.018.0215(或 P value
23、0.04090.01),不能拒绝原假设。3某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多, 随机抽取了 30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数 进行方差分析得到的结果(1 )完成下面的方差分析表方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueF crit组间42022101.4780.2459463.354131组内383627142.07一一一总计425629一一一一(2) 若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异。F 1.478 F0.o5 3.554131 (或 P value 0
24、.2459460.05),不能拒绝原假设。6为检验广告媒体和广告方案对产品销售的影响,一家营销公司做了一项试验,考察三种 广告方案和两种广告媒体,获得的销售数据如表。广告方案广告媒体报纸电视A812128B22261430C10181814检验广告方案、广告媒体或其交互作用对销售量的影响是否显著。(a=0.05)F广告方案10.75 Fo.05 5.1432 (或 P value 0.01040.05),拒绝原假设。F广告媒体3 F0.05 5.9874 (或P value 0.13400.05),不能拒绝原假设。F交互作用1.75 Fo.055.1432(或 P value 0.25190.
25、05),不能拒绝原假设。第七章1相关分析与回归分析的区别和联系是什么?答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法,不能揭示现象之间的本质关系。1. 设销售收入x为自变量,销售成本 y为因变量。现已根据某百货公司某年12个月的有关资料计算出以下数据(单位:万元) :(1) 拟合简单西线性回归方程,并对方程中回归系数的经济意义作出结解析(2) 计算可决系数和回归估计的标
26、准方差(3) 对B2进行显著性水平为 5%的显著性检验(4) 假定下年一月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。解:设简单线性回归方程为: y i2X(1)米用OLS估计:yi yxiX334229.09425053.731 回归系数经济意义:销售收入每增加1万元,销售成本会增加 0.786万元。(2) 可决系数为:R2yi_ 2 _ 2XiXyiy334229.0920.9998回归标准误:1 R212 2V 102.29?(3) 检验统计量为:t 2Se ?/?20.7862.29八 425053.73223.76所以2是显著不为零(4)预
27、测:?f?2xf40.5660.786*800669.36695%的预测区间为669.366 1.96*2.292800 647.88425053.73即(664.579, 674.153 )7.表中给出y对x2和X3回归的结果:多元性回归的结果离差来源平方和(SS)自由度(df )平方和的均值(MSS)来自回归(ESS)65965来自残差(RSS)总离差(TSS)6604214(1 ) 该回归分析中样本容量是多少?(2)计算 RSS;(3) ESS和RSS的自由度是多少?(4)计算可决系数和修正的可决系数;(5) 怎样检验x2和X3对y是否有显著影响?根据以上信息能否确定x2和X3各自对 y
28、的贡献为多少?解:(1 )该回归分析中样本容量是 14+1=15(2) 计算 RSS=66042-65965=77ESS的自由度为 k-仁2,RSS的自由度 n-k=15-3=122(3) 计算:可决系数 R65965/ 66042 0.9988修正的可决系数R21(1 0.9988)0.998615 3(4)检验X2和X3对Y是否有显著影响 ESS/(k 1)RSS/( n k)65965/2329825140.1177/126.4166(5) F统计量远比F临界值大,说明X2和X3联合起来对Y有显著影响,但并不能确定X2和X3各自对Y的贡献为多少。第八章4甲企业近四年产品销售产量分别增长了
29、9%、7%、8%、6%,乙企业这四年产品的次品率也正好是 9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?10循环变动和季节变动的区别是什么?循环变动与季节变动的区别是,循环变动的周期长短很不一致,不像季节变动那样有明显的 按月或按季的固定周期规律,循环变动的规律性不甚明显。2. 某地区社会商品零售额 1988 1992 ( 1993 1997 )年期间(1987 ( 1992 )年为基期) 每年平均增长 10%,1993 1997( 1998 2002)年期间每年平均增长 8.2%,1998 2003(2003 2008)年期间每年平均增长 6.8%。问2003年与1987年相比该地区社会商品零 售额共增长多少?年平均增长速度是多少?若 1997( 2002)年社会商品零售额为 30亿
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 版产品销售代理合同样本
- 版代理记账业务合同
- 2025合伙型联合合同范本
- 2025商业银行个人储蓄质押贷款合同范本
- 2025合同范本(广州)
- 2025汽车销售合同的概念及特征
- 2025茶馆装饰工程合同
- 2025劳动合同样本编号
- 《彩印工艺学习教程》课件
- 《清新型花语课件》
- 2025中煤鄂尔多斯能源化工有限公司高校毕业生招聘98人笔试参考题库附带答案详解
- 2024年基金应知应会考试试题
- 湖北省武汉市洪山区2023-2024学年八年级下学期期中考试物理试题
- 电路原理图设计评审检查要素表
- 屋面顶板堵漏注浆工程技术施工方案
- 留守儿童家访记录表(共19页)
- 工商银行大额提现审批表
- 基于PLC的电梯控制系统设计毕业论文
- 2021年注册商标使用许可合同(特许经营用)
- 湖州地方志类文献
- 材料合同结清证明版本
评论
0/150
提交评论