统计学课后习题与答案(全部)_第1页
统计学课后习题与答案(全部)_第2页
统计学课后习题与答案(全部)_第3页
统计学课后习题与答案(全部)_第4页
统计学课后习题与答案(全部)_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经典word整理文档,仅参考,双击此处可删除页眉页脚。本资料属于网络整理,如有侵权,请联系删除,谢谢!一、判断题对)对)对)错)对)对)对)8.无论数量指标或质量指标,其数值大小都与总体容量(或样本容量)有关。(错)9.任何总体,其所包含的个体必须至少具备一个可变标志和一个不变标志。(对)错)对)对)))错)错)错)错)对)20.抽象总体是具体总体的延伸和抽象化,而具体总体则可看作为抽象总体的组对)二、单项选择题1.统计学的研究对象是(BA.统计方法B.各种现象的数量方面1C.统计活动过程D.总体与样本的关系)。2.统计研究的基本前提是现象总体的(A.大量性B.数量性D.差异性C.同质性3.《政治算术》的是(A.康令C.配第B.格兰特D.凯特勒4.某班某名男生的身高为176cm,这个数是(A.标志B.变量D.指标C.变量值5.以一、二、三等来表示产品等级,那么产品等级是(A.质量指标C.数量标志B.品质标志D.数量指标6.连续不断投掷硬币的结果所组成的总体属于()。A.有限总体C.抽象总体B.具体总体D.自然总体7.下列哪个变量不能采用定比尺度计量?()A.企业职工人数C.企业销售额B.企业产品产量D.企业利润额8.下列哪个指标不属于数量指标?()A.企业职工平均工资C.企业产品产量B.企业职工人数D.企业增加值9.要了解某市50所中学的学生眼睛视力状况,则个体是(A.每所中学C.每名学生B.全部中学D.每名学生的眼睛视力10.人口出生率、资金利润率等指标属于(A.结构相对数C.强度相对数B.比例相对数D.比较相对数11.性别、职业、民族等数据属于(2A.定序数据C.定距数据B.定类数据D.定比数据12.大数据的4V特征是体量巨大、形式多样、增长快速和(A.真实可靠C.结构复杂B.知识涌现D.深藏价值13.高校专任教师中具有博士学位者比重这一标志属于(A.不变标志C.品质标志B.直接标志D.间接标志14.下列哪个指标其数值大小与总体容量大小无关?()A.高校工资总额B.高校粮食消费量D.高校年人均发表论文数C.高校年发表论文总数15.下列哪个指标其数值大小与时间长短没有必然关系?(A.某地区生产总值C.某地区人口数B.某地区投资总额D.某地区用电量16.下列标志中属于不变标志的是(A.企业职工年龄C.城市居民身高B.高校教师收入D.部队军人身份三、多项选择题1.连续不断的网络数据总体属于()。B.抽象总体D.无限总体A.有限总体C.具体总体E.动态总体2.一个国家或地区的人均土地面积属于(A.总量指标C.平均指标E.质量指标B.相对指标D.强度相对指标3.一个国家或地区的人均粮食消费量属于(A.总量指标B.相对指标3C.平均指标E.质量指标4.大数据呈现出(A.大量性D.强度相对指标)相互交错的特点。B.复杂性C.多样性D.涌现性E.不确定性5.统计研究所采用的方法包括(B.指标方法D.描述方法A.定量方法C.归纳方法E.推断方法6.统计指标的定义方法包括(A.提要法C.穷举法B.示算法D.公式法E.限定法7.非结构化数据包括(A.文本B.图像C.声音D.办公文档E.符号8.总量指标的计量单位有(B.时间单位D.度量衡单位A.价值单位C.自然单位E.双重单位和复合单位9.年末国家粮食储备总量属于(B.时期指标D.实物指标A.总量指标C.时点指标E.存量指标10.大数据按照产生的途径不同可以分为(A.结构化数据B.社交网络数据C.人机交换数据D.非结构化数据4E.机器感应数据5一、判断题)))4.偶然性误差只存在于抽样调查,观测性误差则可能存在于任何统计调查。())))8.调查单位和填报单位在任何情况下都不可能一致。())10.由于离散型变量不能用小数表示,因此只能以单项数列来表现资料。())12.为了便于被调查者作出回答,问卷中问题的设计可以有一定的倾向性或))14.统计分组中的“分”是针对总体单位而言的,而“合”则是针对总体而))16.在异距分组数列中,计算频数密度主要是为了消除组距因素对次数分布)17.频数表示标志值对总体绝对作用程度,而频率则说明标志值对总体相对)18.组中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组)))6二、单项选择题1.最常用的统计调查方式是(A.普查B.重点调查D.科学推算C.抽样调查2.调查小学男生的身高,则身高是(A.观测标志3.抽样调查中不可避免的误差是(A.系统性误差B.偶然性误差4.最常见的变量分布类型是()B.观测单位C.调查对象D.变量值C.观测性误差D.登记性误差A.正J型分布C.钟型分布B.U型分布D.反J型分布5.调查时限是指()A.调查资料所属的时间C.调查工作登记的时间B.进行调查工作的期限D.调查资料的报送时间是正确的()A.80—89%90—99%100—109%B.80以下80.1—90%90.1—100%C.90以下90—100%100—110%D.85%以上85—95%95—105%110%以上100.1—110%110%以上105—115%7.划分离散变量的组限时,相邻两组的组限()A.必须是间断的B.必须是重叠的D.应当是相近的C.既可以是不重合的,也可以是重叠的8.次数分配数列是()A.按数量标志分组形成的数列B.按品质标志分组形成的数列C.按数量标志或品质标志分组形成的数列D.按总体单位数分组形成的数列9.分组标志一经确定就()A.掩盖了总体单位在此标志下的性质差异7B.突出了总体单位在此标志下的性质差异C.突出了总体单位在其他标志下的性质差异D.使得总体内部的差异消失了10.人口普查的调查单位是(A.每一户B.所有的户C.每一个人D.所有的人11.先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于(A.简单随机抽样C.整群抽样B.等距抽样D.分层抽样12.某市规定2016年工业经济活动成果年报呈报时间是2017年1月31日,则调查期限为(A.一天B.一个月C.一年D.一年零一个月13.人口普查规定标准时间是为了(A.避免登记的重复和遗漏C.确定调查单位B.确定调查对象的范围D.确定调查时限14.对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(A.全部网点C.所有从业人员B.每个网点D.每个从业人员15.在问卷中,如果要求被调查者对问题的答案按照一定的要求加以排序,那么这样的答案设计属于(A.是非式B.程度评价式C.顺应式D.多项式16.问卷设计的主体部分是(A.被调查基本情况C.问题和答案B.引言和注释D.结语17.按某一标志分组的结果表现为(A.组内差异性,组间同质性C.组内同质性,组间同质性)B.组内同质性,组间差异性D.组内差异性,组间差异性18.设对某地区的人口按年龄分组如下:不满周岁,1—3岁,4—6岁,7—812岁以上,最后一组的组中值为()A.110岁19.对企业职工按技术等级分组,在此基础上再按工资水平分组,这样的分组属于(A.简单分组20.如果数据分布很不均匀,则应编制(A.开口组B.闭口组C.等距数列21.对于不等距数列,在制作直方图时,应计算出(A.频数分布B.频数密度C.各组次数D.各组组距22.分布数列是说明(B.109岁C.109.5岁D.119岁)B.复合分组C.按品质标志分组D.不等距数列D.并列分组A.总体单位总数在各组的分配情况B.总体标志总量在各组的分配情况C.分组的组数D.各组分布规律23.用组中值代表各组内的一般水平有一个假定条件,即假定(A.各组的次数均相等C.各组的变量值相等B.各组的组距均相等D.各组次数分布各组内是均匀的24.已知某分组数列的最后一组是500以上,该组次数是10,又知相邻组为400—450,则最后一组的次数密度是(A.0.2B.0.3C.0.5D.0.425.在编制分布数列中,组限的确定(A.最小组下限高于最小变量值C.最大组上限高于最大变量值B.最小组下限等于最小变量值D.最大组上限低于最大变量值三、多项选择题1.统计调查的基本要求是(A.全面性B.准确性C.及时性D.完整性E.社会性2.非全面调查包括(A.重点调查)B.抽样调查C.快速普查9D.典型调查E.统计报表3.在工业企业设备普查中(A.全部工业企业是调查对象C.每台设备是调查单位B.工业企业的全部设备是调查对象D.每台设备是填报单位E.每个工业企业是填报单位4.我国第六次人口普查的标准时间是2010年11月1计人口数的有()A.2010年11月2日出生的婴儿B.2010年10月30日出生的婴儿C.3010年10月30日晚死亡的人D.2010年11月1日1时死亡的人E.2010年10月30日出生,11月1日6时死亡的婴儿5.问卷中的问题按搜集资料的内容不同可分为(A.开放式问题D.封闭式问题B.事实性问题E.解释性问题)C.意见性问题6.统计分组的作用是(A.划分社会经济类型B.说明总体的基本情况C.研究同类总体的结构D.说明总体单位的特征E.分析现象总体诸标志之间的联系和依存关系7.下列哪些分组是按数量标志分组(A.学生按健康状况分组)B.工人按出勤率状况分组D.家庭按收入水平分组C.企业按固定资产原值分组E.人口按地区分组8.形成一个组距式分布数列的要素为()A.变量的性质D.组距和组数B.变量的大小C.组限和组中值E.选择分组标志的内容9.指出下面的分布数列属于什么类型()按劳动生产率分组(件/人)职工人数(人)×××50~6060~7070~80合计×××××××××10A.品质标志分组数列C.组距变量分布数列B.变量次数分布数列D.等距变量分布数列E.单项式变量分布数列10.组距数列中,组距的大小与()A.组数的多少与正比B.组数的多少成反比C.总体单位数多少成反比D.全距的大小成反比E.全距的大小成正比11.在等组距式数列中,组数等于(A.最大标志值与最小标志值之差)B.(最大标值-最小标志值)÷(各组上限-各组下限)C.最大标志值÷最小标志值D.全距÷组距E.组距÷全距12.在统计分组时,为了处理某些单位的标志值正好等于相邻组上下限数值的情况,一般把此值归并到作为下限的那一组,这一原则称为()A.“上限在内”原则B.“上限不在内”原则C.“下限在内”原则D.“下限不在内”原则E.“上限、下限在内”原则13.在累计频数计算中的向上累计频数即指()A.由标志值低的组向标志值高的组计算的累计频数B.由标志值高的组向标志值低的组计算的累计频数C.某组上限以下各组频数之和D.某组下限以上各组频数之和E.某组下限以下各组频数之和14.从形式上看,统计表主要组成部分有()A.总标题B.填表说明E.纵栏标题C.横行标题D.指标数值15.累计频率分布图中的洛伦茨曲线主要是反映次数分布的()A.集中程度D.对称程度B.离散程度E.开放程度C.均匀程度四、计算题1.某班40名学生统计学考试成绩分别为:1166898884868775737268758297588154797695767160906576727685899264578381787772617081学校规定:60分以下为不及格,60-70分为及格,70-80分为中,80-90分为良,90-100分为优。要求:(1)将该班学生分为不及格.及格.中.良.优五组,编制一张次数分配表。2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。2.根据书中例2-6关于55名工人日加工零件数资料,要求:(1)编制频数分布数列和频率分布数列;(2)编制向上、向下累计频数分布数列和累计频率分布数列;(4)说明工人日加工零件数的分布特征。3.2016年第四季度某集团下属40个企业的产值计划完成程度资料如下:97、123、119、112、113、117、105、107、120、107、125、142、103、115、119、88、115、158、146、126、108、110、137、136、108、127、118、87、114、105、117、124、129、138、100、103、92、95、127、104(1)据此编制分布数列;(3)画出次数分布曲线图。4.某企业某班组工人日产量资料如下:90-100合计53根据上表指出:12(1)上表变量数列属于哪一种变量数列?(2)计算各组组距、组中值、频率。五、实践题请同学们组成5效问卷50Excel要统计图,并写出简单的调查报告。一、判断题12.×;13.×;14.×;15.×;16.√;17.√;18.×;19.×;20.√二、单项选择题三、多项选择题四、多项选择题1.BCD;2.ABD;4.BDE;6.ACE;7.BCD;9.BCD;10.BE;11.BD;12.BC;13.AC;14.ACDE;15.AC四、计算题1.(1)“学生考试成绩”为连续变量,需采组距式分组,同时学生考试成绩变动较均匀,故可用等距式分组来编制变量分配数列。90-100合计40100.013(2)分组标志为考试成绩,属于数量标志,简单分组:从分配数列中可看成绩集中在70-90分之间,说明该班同学成绩总体为良好。列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。(%)向上累计向下累计向上累计向下累计110以下5.4523.6443.6418.187.271.82100.00100.0094.5570.9127.279.09(4)钟型分布。产值计划完成%向下累计频率%频数频数4038352514621009590-100100-110110-120120-130130-14051526343787.562.53537.592.51514140-150150-160合计39407.52.52.510040频率%3330252015105计划产值完成%80901001101201301401501604.(1)该数列是等距式变量数列(3)组距是10,组中值分别是55、65、75、85、95,频率分别是11.32%、22.64%、33.96%、18.87%、13.21%。五、实践题(略)15一、判断题3.位置平均数不受变量数列中的极端值的影响。())))))))9.中位数把变量数列分成两半,一半数值比它大,另一半数值比它小。)((10.如果)xMMeo11.不论左偏分布还是右偏分布,中位数始终处于算术平均数与众数之间。)13.若比较两变量平均数代表性高低,则方差或标准差大者平均数代表性15.在实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算16.加权调和平均数与加权算术平均数虽然应用数据的条件不同,但都符合)))))17.就同一批产品而言,对应于合格率、不合格率的标准差是相等的。()18.若某一变量数列的各组频数都增加10%,则平均数也增加)19.若某一变量的所有变量值都增加15%,则方差也增加15%。()20.若变量数列的各组频数都增加5%,则方差也增加二、单项选择题)161.下列哪一组平均数不受极端值的影响?()A.算术平均数与众数B.调和平均数与中位数D.众数与中位数C.几何平均数与算术平均数2.如果计算算术平均数的所有变量值都增加100,则方差(A.增加100C.不变B.增加10000D.不能确定如何变化3.如果计算加权算术平均数的各组频数都减少为原来的(A.减少4/5C.不变B.减少为原来的4/5D.不能确定如何变化4.计算连续过程的平均比率应该采用(A.算术平均数C.几何平均数B.调和平均数D.位置平均数5.在统计推断中最重要的离散指标是(A.平均差C.标准差B.全距D.四分位差采用何种离散指标(A.平均差C.标准差B.全距D.离散系数7.已知某银行定期存款占全部存款A.20%C.25%B.24%D.30%3.6量3.5万件。今年甲车间生产人数增加6%,乙车间生产人数增加8%。如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比(A.上升C.不变B.下降D.不能确定如何变化9.某高校管理学院有780名学生,统计学院有400名学生,人文学院有17320名学生,会计学院有1600名学生,在上面描述中,众数是(A.780C.800B.会计学院D.60010.已知某变量分布属于钟形分布且,,则(m,moeA.﹤900xB.900﹤﹤930xC.﹥930xD.=915x11.对某一变量数列计算数学意义上的数值平均数,得=390,则(xA.B.GHHGC.GHD.GHG12.若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则(A.平均数大者代表性强C.两个平均数的代表性一样B.平均数小者代表性强D.无法判断哪个平均数的代表性强13.离散指标中受极端值影响最大的是(A.平均差C.全距B.标准差D.方差14.统计学中最常用的平均数是(A.众数与中位数C.算术平均数B.调和平均数D.几何平均数15.假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,那么全班考试成绩的水平高低应该用什么平均数来说明?()A.可以用算术平均数B.只能用众数C.可以用众数或中位数D.只能用中位数16.根据学生基本信息资料,大一新生的平均身高是170cm,标准差为3cm,大概有多少比例的新生身高处在167cm-173cm之间?()A.68.3%C.90.0%B.95.5%D.97.3%17.根据统计动差的定义,方差属于(18A.一阶原点动差C.一阶中心动差B.二阶原点动差D.二阶中心动差18.标准化统计量Z服从什么样的正态分布?()A.均值为1B.标准差为0D.均值为0、标准差为1C.均值为1、标准差为019.动差法偏度系数的取值范围是(A.(-1,1)B.(-3,3)D.(-0.5,0.5)C.(-∞,∞)20.某司机开车从甲地到乙地的速度是100km/h,从乙地返回甲地的速度是120km/h,该司机的平均速度是(A.110.0km/hB.100.9km/hD.105.5km/hC.109.1km/h三、多项选择题1.平均指标的作用主要包括(A.反映变量分布的一般水平B.对不同空间或时间上的发展水平进行比较C.作为评判事物的一种标准D.用于分析现象之间的依存关系E.作为统计分析与推算的基础2.离散指标的主要作用包括(A.反映变量分布的离中趋势B.据以衡量和比较平均数代表性的高低C.反映事物发展变化的稳定性D.作为评判事物的一种标准E.作为统计推断的依据3.容易受到极端值影响的平均数有(A.众数B.中位数C.算术平均数E.几何平均数D.调和平均数4.若偏度系数小于0,说明变量分布属于(A.左偏B.右偏19C.正偏E.对称D.负偏5.下列哪些情况需通过离散系数来比较不同变量数列平均数代表性的高低(A.平均数大(小)者标准差也大(小)B.平均数大(小)者标准差小(大)C.平均数相等、标准差不等D.标准差相等、平均数不等E.不同变量数列的计量单位不同6.下列哪些公式是正确的?()A.∑(x−=1B.∑(x−=0C.∑(x−2=1D.∑(x−=最小值2E.∑(x−=最小值7.下列哪些情况平均数的结果不受影响?(A.所有变量值都增加或减少100个单位B.分组后各组频数相等)C.各组频数都扩大或缩减1/5D.各组频数都增加或减少100单位E.所有变量值都扩大或缩减1/58.下列哪些情况方差的结果不受影响?(A.所有变量值都增加或减少100个单位B.分组后各组频数相等)C.各组频数都增加或减少1/5D.各组频数都增加或减少100个单位E.所有变量值都扩大或缩减1/59.下列哪些情况适合用众数来说明集中趋势?()A.成衣尺寸分布B.若干方案的民意分布D.人口死亡率的年龄分布C.全国高校本科生的年龄分布E.城镇居民家庭收入分布2010.标准差与离散系数的区别有(A.两者的作用不同)B.两者的计算方法不同C.两者的适用条件不同D.指标表现形式不同E.与平均数的关系不同四、计算题1.菜场上某鱼摊大鲫鱼每条约重0.4公斤,售价为每公斤20元,小鲫鱼每条约重0.25公斤,售价为每公斤12元。某顾客向摊主提出大、小鲫鱼各买一条,一起称重,价格为每公斤16元。摊主应允,问这次买卖谁占了便宜?为什么?2.市场上有三种大米价格分别是每公斤16元和8元,问每种大米都购买3公斤和每种大米都购买40元,其平均价格有什么区别?试通过计算加以说明。3.有甲、乙两位车手进行场地赛,各跑50圈。甲以230km/h的速度跑了15圈,以250km/h的速度跑了25圈,以270km/h的速度跑了10圈;乙以245km/h的速度跑了20250km/h的速度跑了20265km/h的速度跑了10圈。问谁跑得更快一些?4.某公司27家企业的资金利润率分组数据和各组年利润额数据如下表所示:合计275500请计算:(1)平均每个企业的利润额;(2)全公司的平均资金利润率。215.某企业三个车间生产同一种产品,某月的人均产量与总产量情况如下:合计请计算:10550(1)该公司该月的平均每个车间的总产量,并说明这属于什么平均数?(2)该企业该月的人均产量,并说明这属于什么平均数?6.某公司某年50个门店的流通费用率分组数据与各组流通费用额比重如下表所示:按流通费用率分组(%)合计50100请计算该公司平均的流通费用率。7.某城市2010年城镇户籍人口为308年为345万人,问这几年来城镇户籍人口的平均增长率是多少?8.某产品生产需经过258道工序的合格率为99%,4道工序的合格率为98%,6道工序的合格率为97%,4道工序的合格率为96%,3道工序的合格率为95%,问平均合格率是多少?9.某年某企业3个车间的产品生产情况如下表所示:ABC9895996800720080001843422合计问:(1)若3个车间依次完成整辆产品某一工序的加工装配任务,全厂总的合格5665422000率、平均合格率和平均废品率分别是多少?(2)若3平均合格率和平均废品率分别是多少?(3)若3合格率和平均废品率又分别是多少?结果如下表。请计算距离的均值和标准差。152718610-1515-2020-25中位数大概是多少?该分布是对称的、正偏的,还是负偏的?12.由15家软件公司组成一个样本,下面是2015年每股收益情况(单位:元)。0.093.500.136.360.417.830.518.921.121.201.493.1810.1312.9916.40布,偏度系数是多少?13.甲班某次统计学考试成绩如下表所示,回答以下问题。2860-7023合计(1)考试成绩的算术平均数、中位数和众数;(2)考试成绩的全距、平均差、异众比率、方差和标准差;(3)根据动差法计算考试成绩的偏度系数和峰度系数;(4)如果乙班考试成绩的算术平均数为80分,标准差为10分,那么哪个班级的平均成绩更有代表性?14.某班级A、B、C三门课程期末考试的平均成绩分别为80分、85分和88分,标准差分别为8分和7分。甲、乙、丙三位同学该三门课程的考试成绩如下:B778969918693898295丙问:这三位同学的总分虽然都是257分,但实际上谁更具有竞争优势?15.根据已知条件推算以下各题:(1)若变量的算术平均数是标准差的30倍,问标准差系数是多少?(2)若变量的算术平均数是20,变量平方的平均数是425,问变量的方差和标准差分别是多少?(3)若变量的算术平均数是100,标准差系数是15%,问方差是多少?(4)一批产品共20018是多少?16.值是2500元,标准差是100元。利用经验法则回答以下问题:(1)大约68.3%的租金落在哪两个值之间?(2)大约95.5%的租金落在哪两个值之间?24(3)几乎全部的租金落在哪两个值之间?一、判断题1.错;2.对;3.对;4.对;5.错;6.对;7.错;8.对;9.错;10.错;11.对;12.错;13.错;14.错;15.对;16.对;17.对;18.错;19.错;20.错二、单项选择题1-5:DCCCC6-10:DBBBC11-15:DACCC三、多项选择题16-20:ADDCC四、计算题1.买者占便宜。大、小鲫鱼分别按各自价格买一条,买者应付11元,平均价格是16.92元/公斤;合在一起购买,买者实付10.4元,便宜了0.6元。原因是鲫鱼的重量起到权数作用。2.每种都购买3公斤,则平均价格是12元/公斤;每种都购买40元,则平均价格是11.08元。区别在于前者采用算术平均数,后者采用调和平均数。3.甲的平均速度是248km/h,乙的平均速度是251km/h,乙跑得更快。4.(1)平均每个企业的利润额为203.70为13.08%。5.(1)该公司该月的平均每个车间的总产量为3516.67件,这属于简单算术平均数;(2)该企业该月的人均产量为104.46件,这属于加权调和平均数。6.该公司平均的流通费用率为7.83%。7.该城镇户籍人口的平均增长率为2.88%。8.平均合格率是97.39%。9.(1)全厂总合格率、平均合格率和平均废品率分别是92.17%、97.32%和2.68%;2.69%;2.62%。10.均值为13.0km,标准差为5.12km。2511.中位数为61.67,属于负偏。12.(1)均值为4.95元,中位数为3.18元,标准差为5.22元;(2)根据均偏。13.(1)均值为78.45分,中位数为77.95分,众数为76.67分;(2)全距为408.38104.51分10.22分;(3)偏度系数为-0.0979,峰度系数为2.49;(4)乙班的离散系数相对较小,所以乙班的平均成绩更有代表性。14.甲、乙、丙三位同学该三门课程的标准化成绩的总和分别为和1.63,所以,丙同学更具有竞争优势。15.(1)标准差系数是3.33%;(2)方差是25,标准差是5;(3)方差是225;(4)合格率是9%,相应的方差是8.19%。16.(1)大约68.3%的租金落在2400-2600之间;(2)大约95.5%的租金落在2300-2700之间;(3)几乎全部的租金落在2200-2800之间。26第四章思考与练习一、判断题1.抽样估计的目的是用以说明样本的数量特征。2.样本分布是一种经验分布,随着容量的扩大而趋近于总体分布。3.反映样本分布特征的样本统计值是可知的,且是惟一的。4.抽样分布是研究总体分布与样本分布关系的桥梁。的分布就惟一确定。6.抽样方法是决定抽样分布的最关键因素。7.抽样分布的方差越小,说明抽样估计的效果越好。8.抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。所以在实际估计时,抽样标准误都是不变的。10.抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。11.在区间估计中,概率1是指所有可能样本所给出的估计区间中包含总体参数在内的估计区间出现的频率。12.非抽样误差会随着样本容量的扩大而下降。二、单项选择题行测试,则(A.观测单位是学校C.观测单位是学生B.观测单位是班级D.观测单位可以是学校、也可班级或学生2.总体参数的值通常是(A.唯一但未知的B.可知但非唯一的C.唯一且可知的D.非唯一也不可知的3.下列误差中属于非一致性误差的有(A.估计量偏差B.偶然性误差27C.抽样标准误D.非抽样误差的可能性越来越大,则该估计量符合()的要求。A.无偏性C.有效性B.一致性D.充分性5.抽样标准误大小与下列哪个因素无关?()A.样本容量B.抽样方式、方法D.估计量C.概率保证程度6.下列关于抽样标准误的叙述哪个是错误的?()A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是唯一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小7.在抽样调查时,若有意选择所偏好的个体,则会产生(A.登记性误差C.系统性误差B.调查性误差D.偶然性误差大为原来的(A.1倍C.3倍B.2倍D.4倍三、多项选择题1.影响样本容量大小的因素有()A.总体分布B.对抽样精度的要求C.抽样方法和抽样组织形式E.对可靠程度的要求2.抽样标准误(A.理论上是唯一确定的C.主要取决于样本容量D.调查经费B.是反映抽样估计效果的关键指标D.也取决于抽样方法和抽样组织形式28E.实际上需根据样本加以估计3.抽样极限误差、抽样标准误和抽样概率度三者的关系是(A.抽样极限误差一定大于抽样标准误B.抽样极限误差与抽样标准误成正比C.抽样极限误差与抽样概率度成正比D.抽样标准误与抽样概率度成正比E.抽样标准误与抽样概率度成反比4.抽样误差的表现形式有(A.抽样实际误差C.抽样标准误B.登记性误差D.抽样极限误差E.系统性误差5.常用的抽样分布定理有(A.正态分布再生定理C.二项分布定理B.中心极限定理D.t分布定理E.超几何分布定理四、计算题1.设总体由重复抽样)抽取三个数字构成样本,要求:(1)列出样本均值的抽样分布;(2)计算样本均值抽样分布的期望与方差;(3)计算抽样标准误;(4)计算概率保证程度为95%时的抽样极限误差;(5)若抽中的三个数字是2、8、10,求95%概率保证的总体均值的置信区间。2.设总体中有15张卡片,其中红色卡片8张。现从总体中随机抽取7张卡片构成样本,分别求重复抽样和不重复抽样时样本中红色卡片比例的抽样分布。3.为调查某中学学生的每月购书支出水平,在全校2500名学生中,用不重复简单随机抽样形式抽取一个容量为30的样本。经调查,每个抽中学生上个月的购书支出金额如下表所示:2930名学生某月购书支出金额的样本数据支出额(元)149111213141516171819202122232425262728293010146157184要求:(1)以95%的概率保证程度估计该校学生该月平均购书支出额;(2)以同样的概率保证程度估计该校学生该月购书支出额超出170元的人数;(3)在以95%的概率保证程度估计该校学生该月购书支出超出170元的人数比例,要求抽样极限误差不超过10%时,计算所需的样本量。4.某保险公司欲对某地区家庭拥有私人汽车的情况进行调查,该地区拥有30万户家庭,在全体居民中按简单随机抽样方法抽出150户家庭,调查后发现其中30户家庭拥有私人汽车,要求:(1)试估计该地区拥有私人汽车的家庭比例并给出抽样标准误;(2)在以95%的概率保证程度要求估计的极限误差不超过样本量。10个居民户并调查每户最近一个月购买彩票花费的金额(元),结果如下表所示:新村1居民户数2563240701010102010103020302342020351050040501020201680200309050400300要求:(1)估计该小区居民户购买彩票的平均支出,并给出抽样标准误;(2)当概率保证程度为6和Neyman分配的样本量及各层的样本量。文史哲艺类、理工科类和经济管理类三层,层权分别为0.2,0.5和0.3。预先猜测各层的考研比率分别为和要求抽样标准误与样本量为100虑有限总体校正系数)?若差距不大,原因是什么?7.某灯泡厂每天生产灯泡2000108时数,结果如下:11036107511259951088106510239881002299431047112611831058114210989459681036498751046115310879841224998103297611036958711531078103910061214107698699410488112612161094109610351004105310041122108011529641136118510211007948102497510839941113109310051088997103498599710051120104710971136989107311029769841004311082要求:(2)如果将以上数据视为从20000个灯泡中按简单随机抽样直接抽取的,估计平均耐用时数及其抽样标准误,并与整群抽样结果进行比较。8.在一项植物病害的研究中,植物生长在160个小地块上,每个小地块有9株植物。随机抽取40个小地块,再从每个被抽中的小地块中抽取3株植物,考察它们是否有病害。结果发现22个小地块上没有病害植物(从被抽取的3株植个小地块上各有1株有病害的植物,4个小地块上各有2株有病害个小地块上各有390%的可靠程度估计有病害的植物的比例。参考答案一、判断题12.错二、单项选择题1.C;2.A;3.D;4.B;5.C;6.C;7.C;8.D三、多项选择题1.ABCDE;2.ABCDE;3.BCE;4.ACD;5.ABCDE四、计算题1.(1)样本均值的抽样分布为::44.670.15.330.266.670.27.330.18xi:0.10.20.1i(2)样本均值抽样分布的期望为:6;方差为:V(x)1.33;E(x)32(3)抽样标准误为:1.1547;SE(x)(4)概率保证程度95%时的抽样极限误差为:=2.2632;(5)若抽中的三个数字是2、8、10,则95%概率保证的总体均值的置信区2.重复抽样时样本中红色卡片比例的抽样分布为::00.1430.2860.4290.5710.7140.8571pi:0.00480.03860.13220.25180.28780.19730.0752i0.0123不重复抽样时样本中红色卡片比例的抽样分布为::00.1430.2860.4290.5710.7140.8571pi:0.00020.00870.09140.30460.38070.18280.0305i0.00123.(1)x5.20元,10.19元,以95%元,s28.74元,se(x)(2)p26.67%,8.14%,15.95%,以同样的概率保证程度估se(p)计该校学生该月购书支出额超出170(3)所需的样本量为:n73人。4.(1)该地区拥有私人汽车的家庭比例为:p20%,抽样标准误为:3.27%;se(p)(2)所需的样本量为:n246户。5.(1)NW,0.3,0.5,0.2;11.2,25.5,WWxx12312x26;s9.12,17.39,29.14;估计该小区居民户购买彩票的平均ss3123支出为:=21.31元,抽样标准误为:()3.38元。sexxstst(2)当概率保证程度为95%,要求极限误差不超过6元时,按比例分配所需的样本量为:n36,其中11,18,7;Neyman分配所需的样本n1n2n35,16,10。量为:n31,其中n1n2n333ˆ6.根据题意可猜测该校学生的总考研意愿为0.41,=0.2419,PˆˆPP)ˆˆWPP)iii层抽样时,与样本量为100的简单随机样本具有相同抽样标准误所需的样本量应为:n98。差距不大,主要原因在于各层考研意愿的差距不够明显,即层间0.25很接近或相等。7.(1)样本各群的均值分别为:1039.1,1059,1056.1,1072,1085.6,Xi和s2b数为:x1054.78小时,抽样标准误为:se(x)6.13小时。cscs(2)如果将以上数据视为从20000计平均耐用时数为:1054.78小时,抽样标准误为:=7.91小时;抽样se(x)x效果整群抽样优于简单随机抽样。8.160,40,9,m3,f0.25,f个调查小地rRM12块中,有病害植物的样本比例为:22个0%,11个33.33%,4个66.67%,3个100%;可估计该160个小地块上有病害的植物的比例为:p23.33%;tss0.098,s0.125;抽样标准误为:se(p)4.48%;具有90%概率保22pbp2ts34第五章思考与练习一、判断题))))5.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。()6.所谓的小概率事件是相对的,与事先规定的显著性水平有直接的关系。()7.如果检验统计值的绝对值小于临界值的绝对值,就接受原假设,也就是说当P值小于(或)2)9.假设检验的第一类错误是“以假为真”的错误,而第二类错误是“以真为))11.在样本容量既定时,β越大,α就越小,假设检验的功效就越大。()12.如果样本值与假设值之间的差异是由随机性因素引起的,那么在一次抽样中)13.如果在双侧检验中原假设成立,那么在单侧检验中原假设也一定成立。()二、单项选择题1.假设检验时,当样本容量一定时,若缩小犯第一类错误的概率,则犯第二类错误的概率就会(A.变小)。B.变大C.不变D.不确定2.某广告制作商声称有30%以上看过此广告的电视观众喜欢此广告。为了证35A.双侧检验C.左侧检验B.单侧检验D.右侧检验3.假设检验是检验(A.样本指标)的假设值是否成立。B.总体指标C.样本方差D.总体均值4.设X~N(X,S),S已知,X未知,是样本观察值,已知X的22x,x,,x12n置信度为0.95的置信区间为(时,检验假设H:X5.0,H:X5.0的结果是()01A.不能确定B.接受H0C.拒绝D.条件不足无法判断H05.某种产品的使用者要求厂商提供的产品其平均使用寿命不得低于1000小时,否则拒收。使用者在决定是否接受某批产品而进行抽样检验时,应建立的备择假设是(A.XC.XB.XD.X6.在检验中,标准正态分布(或t分布)区域被分为接受与拒绝原假设的两个区域,本检验问题的拒绝区域处于接受域的()A.左侧C.两侧B.右侧D.内侧7.在上述检验问题中,如果规定显著性水平为0.05,则作为判断标准的临界值是(A.1.96C.-1.64B.1.64D.±1.648.如果使用者偏重于担心出现纳伪错误而造成的损失,则应把显著性水平定得(A.大一些B.小一些C.大小无所谓D.无法决定369.某经济特区对某项地方法规进行民意测验,执法机关认为只有60%的居民赞成该项法规,而立法机关则怀疑这个看法,而相信有60%以上的居民赞成,现在准备抽选样本进行实际调查以验证自己的看法。这应该取()为检验统计量。A标准正态分布C.t—分布B.卡方分布D.F—分布三、多项选择题1.统计推断的具体内容很广泛,归纳起来主要是()问题。A.抽样分布D.回归分析2.下列关于假设检验的陈述正确的是(B.参数估计C.方差分析E.假设检验A.假设检验实质上是对原假设进行检验B.假设检验实质上是对备择假设进行检验错误D.假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确正确3.在假设检验中,当我们作出检验统计量的观测值为落入原假设的拒绝域时,表示(A.没有充足的理由否定原假设C.可以放心地信任原假设E.拒绝备择假设B.原假设是成立的D.检验的P值较大4.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质上是指(A.选择的检验统计量应与原假设有关B.选择的检验统计量应与备择假设有关C.在原假设为真时,所选的检验统计量的抽样分布已知37D.在备择假设为真时,所选的检验统计量的抽样分布已知E.所选的检验统计量的抽样分布已知,不含未知参数。t5.关于检验,下面正确的说法是(tA.检验实际是解决大样本均值的检验问题tB.检验实际是解决小样本均值的检验问题tC.检验适用于任何总体分布tD.检验对正态总体适用tE.检验要求总体的已知四、计算题1.设某产品的指标服从正态分布,它的标准差S,今抽了一个容量为的样本,计算得平均值为1637。问在显著性水平5%下能否认为这批产品的指标的期望值X为1600?2.按规定,100g罐头番茄汁中的平均维生素C含量不得少于21mg/g。先从工厂的产品中抽取17个罐头,其100g番茄汁中,测得维生素C含量(mg/g)记录如下:16,25,21,20,23,21,19,15,13,23,17,20,29,18,22,16,22设维生素含量服从正态分布N(X,S)X,S22(0.05)3.要求一种元件使用寿命不得低于100025件,测得寿命的平均值为950小时。已知该种元件的寿命服从标准差为S小时的正态分布,试在显著性水平下确定这批元件是否合格?4.测定某种溶液中的水分,它的10个测定值给出样本均值为0.452%,样本标准差为0.037%,设测定值总体服从正态分布N(X,S)试在显著性水平下,2分别检验假设:(1)H:X0.5%;(2)H:S0.04%。005.随机地挑选8个人,分别测量了他们在早晨起床时和晚上就寝时的身高(cm),得到以下的数据:序号172168180181160163165177早上(x)i38172167177179159161166175晚上(y)i设各对数据的差dx(i1,2,L,8N(X,S)的样本,X,S22iii均未知,问是否可以认为早晨的身高比晚上的身高要高?()6.为了比较两种枪弹的速度(单位是米/秒),在相同的条件下进行速度测试。算得样本均值和样本标准差如下:枪弹甲:nx2805,s111枪弹乙:nx2680,s105.00222在显著性水平下,这两种枪弹在速度方面及均匀性方面有无显著差异?7.下表分别给出文学家马克.吐温的8篇小品文以及思诺特格拉斯的10篇小品文中由3个字母组成的词的比例:马克.吐温0.2250.2620.2170.2400.2300.2290.2350.217思诺特格拉0.2090.2050.1960.2100.2020.2070.2240.223斯0.2200.201小品文中包含由3个字母组成的词的比例是否有显著的差异?()尺寸,得到如下结果:第一台机器:15.014.515.215.514.815.115.214.8第二台机器:15.215.014.815.215.015.014.815.114.8设零件尺寸服从正态分布,问第二台机器的加工精度是否比第一台机器的高?()组10人,其中一组中每人被单独地关禁闭,另一组的人不关禁闭,几天后,测得这两组人脑电波中的波的频率如下没关禁闭10.710.710.410.910.510.39.611.111.210.4关禁闭9.610.49.710.39.29.39.99.59.010.9设这两组数据分别来自两个相互独立的正态总体,问在显著性水平下,能否认为这两个总体的均值与方差有显著的差别?3910.两台车床生产同一型号的滚珠,根据经验可以认为两车床生产的滚珠的直径均服从正态分布,先从两台车床的产品中分别抽出8个和9个,测得滚珠直径的有关数据如下:88甲车床:乙车床:xi(xx)2ii1i199y(yy)2iii1i1设两个总体的方差相等,问是否可以认为两车床生产的滚珠直径的均值相等?0.0511.某种零件的椭圆度服从正态分布,改变工艺前抽取16件,测得数据并算得x0.081,s0.025;改变工艺后抽取20件,测得数据并计算得x0.07,112s0.022值有无明显差异?(=0.05)12.有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量nns15.46,s9.66.设222121两样本相互独立。问在显著性水平0.05下能否认为第一台机器生产的部件重量的方差显著地大于第二台机器生产的部件重量的方差?13.上海1875年到1955年的81年间,选择其中的63年,观察一年中(5月到9月)下暴雨次数,并整理资料如下表所示:94814191042110实际年数ni试检验一年中暴雨次数是否服从泊松分布?(14.某工厂近5年来发生了63次事故,按星期几分类如下:星期次数一9二10三11四8五1312(注:该厂的休息日是星期天,星期一至星期六是工作日)40问:事故的发生是否与星期几有关?15.下面列出了84个依特拉斯坎人男子的头颅的最大宽度(mm),试验证这些数据是否来自正态总体?(14114813213815414215014615515815014014714814415014914514915814314114414412614014414214114014513514714614113614014614213714815413713914314013114314114914813514815214314414114314714615013214214214315314914614913814214914213713414414614714014214013715214516.设总体的概率密度为Xx,0x11f(x,)0,其它H:1H:2X中抽出容量为2的样本(x,x),01123拒绝域为Cx,x)|x}和犯第二类错误的4x1221概率。17.一药厂生产一种新的止痛片,厂方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一半,因此厂方提出需检验H:X2X,H:X2X。此处,分别是服用原有止痛片和服用新止痛片后至起作用01211212的时间间隔的总体的均值。设两总体均为正态且方差分别为已知值S,S。现分2212别在两总体中取一样本x,x,,x和y,y,,y,设两个样本独立。试给出上12n112n2述假设H018.设有A种药随机地给8个病人服用,经过一个固定时间后,测得病人身体细41胞内药的浓度,其结果为:1.401.421.411.621.551.811.601.52又有种药给6个病人服用,并在同样固定时间后测得病人身体细胞内药的浓B度,结果为:1.761.411.811.491.671.81并设两种药在病人身体细胞内的浓度都服从正态分布.试问种药在病人身体内A2的浓度的方差是否为种药在病人身体细胞内浓度方差的?()B3参考答案一、判断题1.对;2.错;3.对;4.错;5.对;6.错;7.错;8.对;9.错;10.错;11.对;12.错;13.错二、单选题1.B;2.D;3.B;4.B;5.D;6.C;7.D;8.A;9.A三、多选题1.BE;2.ACE;3.ADE;4.AC;5.AD四、计算题xX163716001.,查表得z1.96。1.96,未落入拒绝u01.2578u15026/2S/n域,即可以认为这批产品的指标期望值X为1600。xX20213.98432.1.035t(16)1.7459由于1.7495t(9)2.2622。由于t0t。s/n17绝域,接受原假设,即可以认为这批罐头符合要求。xX95010003.02.5z1.64uu10025S/n拒绝原假设,即可以认为这批原件不合格。xX0.452%0.5%4.(1)04.102,查表得t0.037%10s/n/2t,落入拒绝域,拒绝原假设;42(ns290.037%2(2)(9)2.700,(9)19.0237.701222S0.04%2。2220由于2.70019.023,未落入拒绝域,接受原假设。25.求出各对数据的差dxy(L)为i,8iii82各对数据的差di这是一个成对数据试验问题,对应的差是来自于正态总体的样本。经计算d0s/n0d1.25,s,tt(7)1.89468t1.8946要高。s120.412126.(1)F,1.315查表得s105.002221F(n1,nF(n1,nF121222以观察值没有落入拒绝域,接受原假设,即认为均匀性方面无显著差异。xx(2)t7.9822t(208)1.96。由于t,观察值1211/2snnw12落入拒绝域,所以拒绝原假设,即认为两种枪弹在速度方面有显著差异。xx7.t12113.8789t(16)2.1199|t0.025snnw123个字母组成的词的比例有显著的差异。s21s28.F13.1868,查表得F(7,8)3.5。由于F,观察值落入拒绝域,0.05243度比第一台机器的高。s21s29.(1),0.5833查表得F21。由于F(n1,n4.03,F(n1,nF(n1,n121222122F差异。xxt,3.35查表得t(18)t12112.093/2snnw12拒绝域,所以拒绝原假设,即认为这两个总体的均值有显著的差别。xx10.1211t(15)2.1315|t2.13150.94410.025tsnnw12没有落入拒绝域,所以接受原假设,即认为两车床生产的滚珠直径的均值相等。s21s211.(1),1.5625查表得F21F(n1,nF(n1,nF(n1,n121222212有落入拒绝域,接受原假设,即认为改变工艺前后,方差无显著差异。xx(2)t,1.4677查表得t(34)。由于观察值没有落入拒12112.0322/2snnw12绝域,所以接受原假设,即认为改变工艺前后,均值无明显差异。s21s212.F1.6F(59,39)1.640.052部件重量的方差。4413.有关计算结果列表如下:实测频数v19ip0.0500.1490.2240.2240.1680.1013.159.38714.1114.1110.586.360.2290.2040.0001.6940.0310.875736594858692796233.351948inpi0.3145752iii2k拒绝域为(fˆ)/ˆ1222iiii1拒绝域,所以接受原假设,即可以认为暴雨次数服从泊松分布。14.有关计算结果列表如下:三实测频数vipinpi0.214290.02380.02380.595240.595240.214291.64292iii2k拒绝域为(fˆ)/ˆ;经计算,观察值没有落入拒222iiii1绝域,所以接受原假设,即可以认为事故的发生与星期几无关。15.所求问题为检验假设1(xX)2:X的概率密度()fxex,2S2H,2S0由于正态分布总体的参数未知,首先估计整体的参数X143.8,S6.0,22将以上数据分成745表:2(kr(52(2),2220.10.1观察值没有落入拒绝域,所以接受原假设,即可以认为服从正态分布。16.犯第一类错误的概率为:P(x,x)CHPx3,4x12021当时,的联合概率密度为:1x,x120x,x1;f(x,x)12H1203令D(x,x)|0x,x1,x,所以4x12122113ln3;444f(x,x113H121212312044xD1犯第二类错误的概率为:P(x,x)CHPx23,4x12021当时,的联合概率密度为:2x,x124xx,0x,x1;f(x,x)1212H1203令D(x,x)|0x,x1,x,所以4x1121221f(x,x4xx114xx114xx12H121212121122313200144xD1146993ln1684。17.此时需在显著性水平下检验假设S4S22H:X2X,H:X2Xx2x~N(X2X,12)nn012112121212x2x量为u1S4S2H为真时,u~N(,|u|k02212nn12从而对于给定的显著性水平,由Puz},可得此时的检验拒绝域为H0X2X12z。4S2S21n2n12s21s218.F,0.9829查表得21F(n1,nF(n1,nF(n1,n121222212种药在病人身体内的浓度的方差为种药在BA2病人身体细胞内浓度方差的。347第六章思考与练习一、判断题1.在方差分析中,若拒绝原假设,则表明各总体的均值相互之间都不相同。()2.双因素方差分析主要用于检验两个总体方差是否相等。()3.单因素方差分析的组间误差反映的是影响因素(自变量)和随机因素的影响。()4.单因素方差分析中,F统计量分子的自由度为全部观测值个数减因素水平数。()5.只考虑主效应的双因素方差分析是指用于检验的两个自变量对因变量的影响是独立的。()6.考虑交互效应的双因素方差分析等价于三种假设。()7.无重复观测(无重复实验)的两因素影响的样本数据可用于考虑交互效应的双因素方差分析。()8.单因素方差分析的基本统计模型为xx。ijiij()9.可以对每个样本绘制箱线图来检查每个水平对应的总体是否服从正态分布。(10.方差分析根据因变量的个数不同,分为单因素方差分析和双因素方差分)析。()二、单选题1.方差分析的主要目的是(A.比较各总体的方差是否相等B.分析各样本数据之间是否有显著差48异C.判断各总体是否存在方差响是否显著A.总离差D.研究类别自变量对数值因变量的影)反映的是样本数据与其组平均值的差异。B.组间误差C.抽样误差D.组内误差3.在方差分析中,方差是指(A.离差平方和除以自由度后的结果B.组间平方和除以组内平方和后的结果C.组间平方和除以总平方和后的结果D.样本数据的方差4.单因素方差分析中,若因素有r个水平,总样本量为n,计算F统计量,则其分子与分母的自由度各为(A.r,nB.r-n,n-rC.r-1,n-rD.n-r,r-15.在单因素方差分析中,原假设是H:0,备择假设是012r(A.H:B.H:112r112rC.H:D.H:,,,不全为0112r112r6.不属于方差分析所包含的假定前提是(A.正态分布B.独立随机样C.等方差性D.非负性7.只考虑主效应的双因素方差分析是指用于检验的两个因素(A.对处变量的影响是独立的C.对因变量的影响是独立的B.对自变量的影响是有交互作用的D.对因变量的影响是有交互作用的8.从4个总体中各抽取了3个观测值,得到组间平方和SSA=546,组内平方和SSE=808,则组间方差与组内方差分别为(A.182,101B.273,89.78D.273,101C.182,87.789.在考虑交互效应的双因素方差分析中,若因素A有个水平,因素B有sr个水平,因素A、B的每个水平组合都有m用的离差平方和为(49m(xxxx)2rsmrsA.C.(xx)2B.D.ij.ij.i.j.i1j1k1i1j1rsms(xx)2rm(xx)2.j.i1j1k1j110.下列不属于检验正态分布的方法是(A.正态概率图B.箱线图C.Shapiro-Wilk统计检验法S统计检验法D.K-三、多选题1.方差分析法(A.可以用于两个总体方差是否相等的检验B.可以用于两个总体均值是否相等的检验C.可以用于多个总体方差是否相等的检验D.可以用于多个总体均值是否相等的检验E.可以用于三个总体均值是否相等的检验2.应用方差分析的前提条件是(A.各个总体服从正态分布B.各个总体均值相等C.各个总体具有相同的方差D.各个总体均值不等E.各个总体相互独立3.若检验统计量F近似等于1,说明(A.组间方差中不包含系统因素的影响B.组内方差中不包含系统因素的影响C.组间方差中包含系统因素的影响E.方差分析中应接受原假设D.方差分析中应拒绝原假设4.对于单因素方差分析的组内误差,若因素有r个水平,总样本量为n,下面哪些说法是对的?(A.其自由度为r-1为n-r)B.反映的是随机因素的影响C.其自由度D.反映的是随机因素和系统因素的影响E.组内误差一定小于组间50误差5.为研究教学方法对教学效果的影响,将教学方法分为三个水平,则称这种方差分析是(A.单因素方差分析B.双因素方差分析C.三因素方差分析D.单因素三水平方差分析四、计算题E.双因素三水平方差分析1.以下是三种不同方式完全随机实验得到的数据,请分析三种不同方式对实验结果有没有显著影响?()2.32.某连锁超市在同城三个不同地点开设了三家分店,从这三家分店随机抽取5天的营业额的数据如下表所示:单位:万元第一天第二天第三天第四天第五天121011131011(2)检验三家分店的地点不同对每天的营业额是否有显著的影响;(0.05)51(3)编制方差分析表。3.从统计学院随机抽取5)多元统计分析同学1同学2同学3同学4同学590868478858683706981706582884.以下是两种污水治理方案在不同城市取得的经济效益的随机抽样调查数)336342375388377370380参考答案一、判断题1.错;2.错;3.对;4.错;5.对;6.对;7.错;8.对;9.错;10.错二、单选题1.D;2.D;3.A;4.C;5.D;6.D;7.C;8.A;9.B;B三、多选题1.BDE;2.ACE;3.ABD;4.BC;5.AD52四、计算题(r21.F当显著性水平取时,由。(nr)9分布表查得F2,9)4.26,因F3.227<F9)4.26,所以接受H,F0即认为三种实验方式对实验结果的影响不显著。r2.(1)组间离差平方和nxnx1585.2-22iii1rnir组内离差平方和2-xnxi2ijii1j1i1xnxrni总离差平方和22iji1j1(r2(2)F当显著性水平取时,由。(nr)52.8分布表查得F3.89,因F0.4698<F3.89,所以接受F0.050.05H,即认为三家分店的地点不同对营业额的影响不显著。0(3)方差分析表值F分店(组间)随机误差(组内)总和0.4698121456.934(r(r-1)s(s3.F,F,当显著(r-1)sAB性水平取时,由分布表查得:F3.84F4.46由F,此:FF)FF),。所以,在显著性水平取0.05时,拒绝原假AB53设,认为不同同学考试成绩差异不显著,不同课程考试成绩差异也不显著。(r(s4.FFrsmrs(mAB,,(rsrs(mF当显著性水平取时,由分布表查F。得:F85.32,F4.07F47.121F),,A0.05F0.316F,F0.799F所以拒绝原假设H,认为治。B0.050.05理方案对经济效益有显著影响;接受原假设H,认为城市对经济效益无显著影响;接受原假设H,认为治理方案和城市对经济效益无交互影响。54第七章思考与练习一、判断题)))4.判定系数越大,估计标准误就越大;判定系数越小,估计标准误就越小。()))7.相关系数越接近于)))10.回归系数的显著性检验是用以检验解释变量对被解释变量有无显著解释)11.相关系数0.8与-0.8))二、单项选择题1.下面属于函数关系的是()A.销售人员测验成绩与销售额大小的关系B.圆周的长度与半径的关系C.家庭的收入和消费的关系D.数学成绩与统计学成绩的关系2.相关系数的取值范围()rrrrA.-∞<<+∞B.-1≤≤+1C.-1<<+1D.0≤≤+1r3.相关分析对资料的要求是()A.两变量均为随机的B.两变量均不是随机的C.自变量是随机的,因变量不是随机的D.自变量不是随机的,因变量是55随机的xyx4.年劳动生产率(千元)和工人工资=10+70,这意味着年劳动生产率每提高1千元,工人工资平均()A.增加70元B.减少70元C.增加80元D.减少80元5.下列哪两个变量之间的相关程度高()A.商品销售额和商品销售量的相关系数是0.9B.商品销售额与商业利润率的相关系数是0.84C.平均流通费用率与商业利润率的相关系数是-0.94D.商品销售价格与销售量的相关系数是-0.91yx6.在回归直线=a+b中,b表示()xyA.当增加一个单位时,增加a的数量yxB.当增加一个单位时,增加b的数量xyC.当增加一个单位时,的平均增加量yxD.当增加一个单位时,的平均增加量7.直线回归方程中,若回归系数为负,则()A.表明现象正相关B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度8.对于线性回归模型,我们一般假定随机误差项服从(A.均匀分布B.二项分布D.正态分布C.t分布9.相关系数的正负取决于(A.协方差s2B.标准差sxC.标准差sD.ssyxy10.若回归方程的判定系数为0.9025,则(A.相关系数为0.95B.相关系数为-0.95D.无法推算相关系数C.相关系数为0.95或-0.95三、多项选择题1.直线回归分析中(A.自变量是可控制量,因变量是随机的56B.两个变量不是对等的关系C.利用一个回归方程,两个变量可以互相推算D.根据回归系数可判定相关的方向E.对于没有明显因果关系的两个变量可求得两个回归方程2.下列属于正相关的现象是(A.家庭收入越多,其消费支出也越多B.某产品产量随工人劳动生产率的提高而增加C.流通费用率随商品销售额的增加而减少D.生产单位产品所耗工时随劳动生产率的提高而减少E.产品产量随生产用固定资产价值的减少而减少3.简单线性回归方程中的称为回归系数,其作用是(bA.可确定两变量之间因果的数量关系B.可确定两变量的相关方向C.可确定两变量相关的密切程度D.可确定因变量的实际值与估计值的变异程度E.可确定当自变量增加一个单位时,因变量的平均增加值4.下列指标可用来判

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论