统计学各章习题及参考答案_第1页
统计学各章习题及参考答案_第2页
统计学各章习题及参考答案_第3页
统计学各章习题及参考答案_第4页
统计学各章习题及参考答案_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章统计学习题及参考答案绪论单项选择题1、在整个统计工作过程中处于基础地位的是(、统计数据搜集、统计数据的整理、统计数据的整理、统计数据的分析78分、84分和、统计数据搜集、统计数据的整理、统计数据的整理、统计数据的分析78分、84分和95分,这三个数字C、统计分析 D2、统计学的核心内容是( )A、统计数据的搜集 BC、统计数据的发布 D3、某班三名学生期末统计学考试成绩分别为是( )A指标 B、标志C、变量D、变量值某管理局有 20个下属企业, 若要调查这 20个企业全部职工的工资收入情况,则统计总体为(、 20个企业的每个职工、 20个企业每个职工的工资、 20个企业的每个职工、 20个企业每个职工的工资C 、应用统计 D 、推C 、推断统计 D 、应C、20个企业的全部职工 D5、现代统计学的主要内容是( )A、描述统计 B、理论统计断统计( )是整个统计学的基础。A、理论统计 B、描述统计用统计二、多项选择题1、统计学 ( )A、主要特征是研究数据 B、研究具体的实际现象的数量规律 C、研究方法为演绎与归纳相结合D、研究抽象的数量规律 E、研究有具体实物或计量单位的数据2、数学( )A、为统计理论和统计方法的发展提供数学基础 B、研究具体的数量规律C、研究抽象的数量规律 D、研究方法为纯粹的演绎 E、研究没有量纲或单位的抽象的数三、填空题 和 是统计方法的两个组成部分。统计过程的起点是 ,终点是探索出客观现象内在的 。3、统计数据的分析是通过 和 的方法探索数据内在规律的过程。四、联系实际举例说明, 为什么统计方法能够通过对数据的分析找出其内在的规律性?(要求举三个例子且不与教科书上的例子雷同)统计数据的搜集与整理尺z―统计数据的搜集与整理第二章

一、单项选择题1、某种产品单位成本计划比基期下降 3%,实际比基期下降了 %,则单位成本计划完成相对数为( )A、%A、%B、%C、%D、%30003000元,可以得出李四的月收入)、定距尺度 D、定类尺、调查一次, 以后不再D 、只隔一年就进行一次)、是毫无关系的两个概、有时一致,有时不一、工人体重 D、工人工)、前者是连续变量, 后者是离散变D、离散变量2、计算结构相对数时,总体各部分数值与总体数值对比求得的比重之和()A、小于100%B、大于100%C、等于100%:D、小于或大于100%TOC\o"1-5"\h\z将全班学生划分为“男生”和“女生”,这里采用的数据计量尺度位 ( )A定比尺度B、定距尺度 C、定类尺度 D、定序尺度4、将全班学生期末统计学考试成绩划分为优、良、中、及格、不及格,这里采用的数据计量尺度为( )A、定类尺度 B、定距尺度 C、定序尺度D 、定比尺度5、昆明市的温度为260C与景洪市的温度310C相差50C,这里采用的数据计量尺度位( )A、定距尺度 B、定类尺度 C、定比尺度D、定序尺度6、张三的月收入为 1500元,李四的月收入为是张三的两倍,这里采用的数据计量尺度位(TOC\o"1-5"\h\zA、定序尺度 B、定比尺度 C度7、一次性调查是指( )A、只作过一次的调查 B调查C、间隔一定时间进行一次调查的调查8、在统计调查中,调查单位和填报单位之间(TOC\o"1-5"\h\zA、无区别 B念C、不可能是一致的 D致9、下列中,属于品质标志的是( )A、工人年龄 B、工人性别 C资10、商业企业的职工人数、商品销售额是(A、连续变量 B量 C、前者是离散变量 ,后者是连续变量11、对昆明市所有百货商店的工作人员进行普查,调查对象是( )A、昆明市所有百货商店 B 、昆明市所有百货商店的全体工作人员昆明市所有百货商店的每一位C、昆明市的一个百货商店工作人员昆明市所有百货商店的每一位TOC\o"1-5"\h\z12、在全国人口普查中,调查单位是( )A、全国人口 B、每一个人 C、每个人的性别 D、每个人的年龄13、对某城市工业企业的设备进行普查,填报单位为( )A全部设备B、每台设备C、每个工业企业D、全部工业企业14、某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( )A.普查B、典型调查 C、抽样调查D、重点调查15、人口普查规定统一的标准时间是为了( )A避免登记的重复和遗漏 B 、确定调查的范围G确定调查的单位 D 、登记的方便16、( )是对事物最基本的测度。A、定序尺度 B、定比尺度C、定类尺度 D、定距尺度17、下列中,最粗略、计量层次最低的计量尺度是( )A、定类尺度 B、定序尺度C、定比尺度 D、定距尺度18、下列中,计量结果只能进行加减运算的计量尺度是( )A、定距尺度 B、定比尺度C、定类尺度 D、定序尺度二、多项选择题1、某企业职工工资情况如下:按月工资分组(元)职工人数(人)660--680150680--700250700—-820200合计600表中(A、变量是150、250、200 B 、变量是660、680、700、820G工资是变量 D、变量有3个E、组中值有3个TOC\o"1-5"\h\z2、下列各项中,属于统计指标的是( )A、某地区2004年GDP1000乙元 B、某工人月工资850元C、某地区2004年货物运输量2000万吨D、某地区明年小麦预计产量21万吨E、某地区去年人口自然增长率7%3、抽样调查与重点调查的主要区别是( )A、抽选调查单位的多少不同 B、抽选调查单位的方式方法不同C、取得资料的方法不同D、在对调查资料的使用时所发挥的作用不同 E、原始资料的来源不同4、某地区进行工业企业的现状调查,则每一个工业企业是( )A、调查对象 B、统计总体 C、调查单位 D、调查项目 E、填报单位TOC\o"1-5"\h\z5、搜集统计数据的具体方法主要有( )A、访问调查B、邮寄调查 C、电话调查D、座谈会E、个别深度访问某地区对集市贸易个体户的偷税漏税情况进行调查, 1月5日抽选 5%样本, 5月1日抽选 10%样本检查,这种调查是( )A非全面调查B、一次性调查C、定期调查D、不定期调查D、经常性调查7、为了研究全国乡镇工业企业的发展情况,国家决定对全国乡镇工业企业进行普查,则每一个乡镇工业企业是( )A、调查总体 B 、调查单位 C 、报告单位D调查对象 E 、既是调查单位又是报告单位8、在某一组距数列中( )A、组数的确定应以能够显示数据的分布特征和规律为目的 B、组距大小与组数的多少成正比 C、组距大小与组数的多少成反比 D、组距宜取5或10的倍数 E、第一组的下限应低于最小变量值;最后一组的上限应高于最大变量值三、填空题TOC\o"1-5"\h\z1、数量型统计数据通常有两种基本的形式,即 和 。2、统计的原始数据都有一定的计量单位。绝对数的计量单位有 、 和 三种。3、数字变量根据其取值的不同,可以分为 和 。4、离散变量只能取 个值,而且其取值都以 断开,可以一一列举。5、连续变量可以取 个值,其取值是 的,不能一一列举。6、从使用者的角度看,统计数据主要来源于两种渠道:一是来源于7、根据对比的数量不同,相对数可分为 和 两种基本形式。8、访问调查又称 ,它是调查者与被调查者之间通过 而得到所需资料的调查方法。9、在市场调查中,基本上都是采用 调查方式,调查对象是确定 框的基本依据。TOC\o"1-5"\h\z10、调查表是用来登记调查数据的一种表格,一般由 、 和 三部分组成。11、调查时间包括 和 。12、数据整理通常包括数据的 、 、 等几个方面的内容,它是 之前的必要步骤。13、数据的预处理是 的先前步骤,内容包括数据的 与14、对于通过直接调查取得的原始数据应主要从 和 两个方面去审核。15、审核数据准确性的方法主要有 和 。16、对于其它渠道取得的第二手数据,除了对其 和 进行审核外,还应着重审核数据的 和 。17、按数量标志分组的方法主要有 和 。18、频数密度= 19、闭口组组中值=(+)+220、直方图是用 和 来表示频数分布的图形四、判断题1、调查单位可以是调查对象的全部单位,也可以是调查对象的部分单位。()TOC\o"1-5"\h\z2、人口普查的调查单位是每一个人。 ( )3、调查项目是调查的具体内容,它可以是调查单位的数量特征,也可以是调查单位的某种属性或品质特征。 ( )4、消费者购买某种产品的动机的调查,常用“座谈会”调查方法。 ( )5、搜集与研究课题有密切关系的少数人员的倾向和意见,常用个别深度访问。()6、品质标志实际上就是定类尺度和定序尺度。 ( )7、数量标志实际上就是定距尺度和定比尺度。 ( )8、组距可以根据全部数据的最大值和最小值及所分的组数来确定。 ( )9、组数越多,数据分布越集中,组数越少,数据分布就越分散。 ( )10、组距分组时, 为了解决“不重”问题,习惯上规定“上组限不在内” 。( )11、若一个班的统计学考试成绩的最高分为 99分,最低分为 2分,则在组距分组时宜采用“xx以下”和“xx以上”这样的开口组。 ( )12、用组中值作为一组数据的代表值有一个必要的假定条件, 即各组数据在本组内呈均匀分布或在组中值两侧称对称分布。 ( )13、从变量值小的一方向变量值大的一方累加频数,称为向下累计。 ( )14、从变量值大的一方向变量值小的一方累加频数,称为向上累计。 ( )15、人和动物的死亡率分布近似服从正态分布。 ( )16、经济学中的供给曲线呈现为正 J型分布。( )五、简答题1、普查作为一种特殊的调查方式具有哪些特点 ?2、组距分组需要经过哪几个步骤 ?六、计算分析题1、某行业管理局 40个企业1999年的产品销售收入统计数据如下 (单位:万元):152124 129 116 100 103 9295127104104105119114115 87 103 118 142 135125117108105110107137120136117 108 97 88 123 115119138112146113126要求:①对上面的数据资料进行适当的分组,编制频数分布表,并绘制频数分布的直方图和折线图。②根据频数分布表计算累计频数和累计频率。③如果按企业成绩规定:销售收入在 125万元以上为“先进企业”;115〜125

万元为“良好企业”;105〜115万元为“一般企业”;105万元以下为“落后企业”。试按先进企业、良好企业、一般企业和落后企业进行分组。2、某车间按工人日产量分组资料如下:日r#(件)工人人数(人)50-60660-701270--801880—901090-1007合计53要求:根据上表指出:①上表变量数列属于哪一种变量数列;②上表中的变量、变量值、上限、下限、次数(频数);③计算各组组距、组中值、频率。3、某商店有职工20人,月工资额(单位:元)分别如下:550550640640660660680680700700720720740740690690698698590590要求:利用分组法,将上述20人的工资分成三个组,并说明该商店职工工资的分布特征。4、请用或“X”完成下表(其中说明具有某种数学特征, “X”说明不具有某种数学特征)。计量尺度数学特征 \定类尺度定序尺度定距尺度定比尺度分类(=,w)排序(< ,>)间距(+ ,-)比值(X,一)5、某地区人口统计资料如下表,请计算此表中空白处的数字,并填入表中按年龄分组(周岁)人口数(人)组距组中值频率(%向上累积向卜累积频数(人)频率(%频数(人)所(%0—41925—1745918—2426425—3442935—4439345—6446765及以上318合计

*6、兹有下列调查:A、为了了解钢材积压情况,上级机关向单位颁发一次性调查表要求填报。B、一批商品运到商业仓库,在这批商品中选出10件进行仔细检查,以判断和记录其质量。C、某乡在春播期间每隔5天向上级主管部门提交播种进度报告。D为了了解科技人员分配、使用状况,有关部门向各单位布置调查表,要求填报。E、对大中型基本建设项目投资效果进行调查。 F、选取部分企业进行调查,以了解扩大企业自主权试点后的成果及问题。要求:(1)指出上述各项调查按组织方式分类各属于哪种调查?( 2)指出上述各项调查按登记事物的连续性分类各属于哪种调查?(3)指出上述各项调查按调查对象的范围分类各属于哪种调查?(4)指出各项调查按收集资料的方法分类各属于哪种调查?第三章 数据分布特征的描述一、单项选择题1、经验表明,当数据分布近似于正态分布时,则有95%勺数据位于区间(A、XTOC\o"1-5"\h\z2、实际中应用最广泛的离散程度测度值是( )A、极差和平均差B、平均差和四分位差C、方差和标准差D、异众比率和四分位差3、集中趋势的测度值中,最主要的是( )A、众数 B、中位数C、均值D、几何平均数4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。由此可知这10个数据的( )A、均值为0B、均值为1B、均值为6C、均值为5、某生产小组由36名工人,每人生产的产量数量相同,其中有14人生产每件产品耗时8分钟;16人生产每件产品耗时10分钟;6人生产每件产品耗时5分钟,计算该生产小组生产每件产品的平均耗时应采用(A、A、简单算术均值B、简单调和算术均值 C加权算术均值 D.、加权调和均值6、某敬老院里有6、某敬老院里有9位百岁老人的岁数分别为101、102、103、104、108、102、105、110105、110、102,据此计算的结果是(A、土讥6=中位数二众数C、众数〉中位数>均值7、几何均值主要适合于(A、具有等差关系的数列B 、均值>中位数>众数D 、中位数>均值〉中数)B、变量值为偶数的数列 C、变量值的连乘积等于总比率或总速度的数列D连乘积等于总比率或总速度的数列D、变量值之和等于总比率或总速度也受变量之出现的次数多少的影响,、变量值较小、次数较多时也受变量之出现的次数多少的影响,、变量值较小、次数较多时、变量值较大、次数较多时的数列8、加权算术均值不但受变量值大小的影响,因此下列情况中对均值不发生影响的是(A、变量值出现次数相等时 BC、变量值较大、次数较少时 DTOC\o"1-5"\h\z9、一组数据的均值为350,众数为200,则( )A、中位数为275,数据呈右偏分布 B 、中位数为275,数据呈左偏分布C、中位数为300,数据呈左偏分布 D 、中位数为300,数据呈右偏分布10、一组数据的均值为5,中位数为3,则( )A数据呈右偏分布 B、数据呈对称分布C、数据呈左偏分布D、数据呈正态分布11、经验表明,当数据分布近似于正态分布时,则变量值落在区间 X的概率为( )A95% B、68%C、%D、%12、当众数(M0中位数(Me和均值(X)三者的关系表现为:Mo=MeX,则A、数据有极小值 B、数具有极大值C、数据是对称分布D数据是左偏分布 E、数据右偏分布13、在单项式数列中,假定标志值所对应的权数都缩小 1/10,则算术平均数()A、不变B、无法判断C、缩小1/100D、扩大1014、若单项式数列的所有标志值都减少一倍, 而权数都增加一倍,则其算术平均TOC\o"1-5"\h\z数( )A、增加一倍 B、减少一倍 C、不变D、无法判断15、各变量值与其算术平均数的离差之和( )A等于各变量值之和的平均数 B、等于最大值C、等于零D、等于最小值16、各变量值与其算术平均数的离差平方之和( )A、等于各变量值之和的平均数 B、等于最大值C、等于零D、等于最小值二、多项选择题1、当众数(M。、中位数(Me和均值(X)三者的关系表现为:X<Me<Mo则( )A、数据是左偏分布 B 、数据是右偏分布 C、数据是对称分布D数据存在极小值 E 、数据存在极大值2、当众数(M。、中位数(Me和均值(X)三者的关系表现为:Mo<Me<X,则( )A数据是右偏分布 B、数据是对称分布 C、数据是左偏分布D数据有极大值 E、数据有极小值3、数据分布的两个重要特征是( )A、正态分布 B、集中趋势 C、t分布D、2分布E、离散程度4、利用组距分组数据计算众数时,有一些基本假定,即( )A、假定数据分布具有明显的离中趋势 B、既定数据分布具有明显的集中趋势C、假定众数组的频数在该组内是正态分布 D、假定众数组的频数在该组内是均匀分布E、假定众数组的频数在该组内是二项分布TOC\o"1-5"\h\z5、众数( )A、是一组数据分布的最高峰点所对应的数值 B、可以不存在C、也可以有多个 D、是位置代表值 E、不受数据中极端值的影响。6、极差( )A、是描述数据离散程度的最简单测度值 B、不易受极端值影响C、易受极端值影响D、不能反映出中间数据的分散状况E、不能准确描述出数据的分散程度7、一组数据为17、19、22、24、25、28、34、35、36、37、38。贝U( )A、该组数据白^中位数为28B、该组数据的第一个四分位数为22C、该组数据的众数为38D 、该组数据无众数 E 、该组数据的第三个四分位数为368、下列标志变异指标中,与变量值计量单位相同的变异指标有( )A、全距 B、平均差C、标准差D、标准差系数 E、平均差系数9、下列标志变异指标中,用无名数表示的有( )A、全距 B、平均差C、标准差D、标准差系数 E、平均差系数10、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断( )A、甲单位标准差系数大 B、乙单位标准差系数大 C、甲单位平均数代表性大D乙单位平均数代表性大 E、无法判断两单位平均数代表性大11、已知100个零售企业的分组资料如下:销售利润率(%企业数销售额(万元)10608001540200这100个企业的平均销售利润率正确计算公式是 ( )A、10%6015%40 b、10%x60%+15雅40% C、604010%80%+15%20%10%15% 10%80015%200DX E、 2 800200三、填空题1、中位数将全部数据分为两部分,一部分数据2另一部分数据则2、根据未分组数据计算中位数时,若数据个数N为奇数时,则中位数Me= N为偶数时,则中位数Me=3、几何平均数是适用于特殊数据的一种平均数,它主要用于计算的平均;在实际应用中,几何平均数主要用于计算社会经济现象的4、均值的主要缺点是易受数据 的影响,对于 的数据,均值的代表性较差。5、均值的变形主要有?口o前者主要用于 的数据,后者主要用于计算 的平均数。6、方差是。其均值 的平均数。7、极差也称,它是一组数据的?口之差。8、众数是一组数据中 的变量值,从分布的角度看,它是具有明显 的数值。四、判断题TOC\o"1-5"\h\z1、在均值加减3个标准差的范围内几乎包含了全部数据。( )2、样本方差与总体方差在计算上的区别是:总体方差是通体数据个数或总频数减1去除离差平方和,而样本方差则是用样本数据个数或总频数去除离差平方和。( )3、从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的结果。( )4、由于中位数是一个位置代表值,其数值的大小受极大值和极小值的影响,因此中位数据有稳健性的特点。( )5、中位数与各数据的距离最长。( )N6、XiMemin(最小) ( )i17、从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。 ( )8、几何平均数的对数是各变量值对数的算术平均。 ( )9、根据MoMe和X之间的关系,若已知 Me=,X=5,则可以推算出Mo=.()10、对于具有偏态分布的数据,均值的代表性要好于中位数。 ( )11、当数据分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。( )五、简答题1、权数的实质内容是什么?2、数据集中趋势的测度值与离中趋势的测度值各有哪些?3、试比较众数、中位数和均值三者的特点及应用场合。4、什么是离散系数?为何要计算离散系数?5、均值具有哪些重要的数学性质?6、离散特征数在统计分析中的作用?7、实际中几何平均数应用于哪些场合?六、计算分析题1、根据要求计算:(1)已知X500,V=,求方差(T2。(2)已知X5.5EX2=385,N=10,求离散系数V。(3)已知①=20,X60,求各数据值对50的方差。(4)已知X350,V=,求各数据值对400的标准差。(5)已知X810, X265770,N=10,求标准差和离散系数V。(6)已知:(72=100,_XT2600,求离散系数V(7)已知:样本方差S2n-i=16,E(X-X)2=784,求样本容量n。2、某车间生产三批产品的废品率分别为 1%2%%三批产品的产量占全部产量的比重分别为25%35%40%试计算该车间三批产品的平均废品率。3、某产品精加工车间加工零件5000件,其中合格品4500件,不合格品500件。要求:计算是非标志的平均数、方差、标准差及离散系数。4、有两个教学班进行《统计学》期中测验,甲班有45个学生,平均成绩为78分,标准差为8分;乙班有50个学生,平均成绩为72分,标准差额为10分。要求计算两个教学班总的平均成绩和标准差。5、某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量(单位:吨)为:100150170210150120 同期非星期一的产量整理后的资料如下表:日产量(吨)天数(大)100——1508150——20010200——2504250以上2合计24根据资料:(1)计算6个星期一产量的均值和中位数;(2)计算非星期一产量的均值、中位数、众数;(3)分别计算星期一和非星期一产量的标准差;(4)比较

星期一和非星期一产量的离散程度哪一个大一些?( 5)计算非星期一产量数据分布的偏态系数和峰度系数。6、甲工厂工人的工资的离差的绝对值之和是乙工厂工人工资离差绝对值之和的3倍,即:x甲X甲3x乙X乙;而乙工厂工人工资的平均差却是加工厂工人工资平均差的3倍,即:AD乙2A.D甲,求:通过计算判断上述情况在什么情况下可能会发生?7、从某地区抽取120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200—30019300—40030400—50042500—60018600以上11合计120要求:(1)计算120家企业利润的众数、中位数、和均值。(3)计算分布的偏态系数和峰度系数,并作简要分析说明。8、抽取10名成年人和10名幼儿进行身高(厘米)调查,结果如下:成年组166169172177180170172174168173幼儿组686968707173727374175要求:(1)若要比较成年组和幼儿组的身高差异,应采用什么样的指标测度值?为什么?(文字回答即可)(2)试通过计算,比较分析哪一组的身高差异大?9、甲、乙两个企业生产三种产品的有关资料如下:产品名称单位成本(元)总成本(兀)甲企业乙企业A1521003255Br 2030001500C3015001500试比较哪个企业的总平均成本高,并分析其原因10、甲、乙两单位各抽取了若干工人进行生产情况调查, 测得有关资料如下:日产量(件/人)甲单位工人数(人)乙单位总产量(件)241238245620合计1856试通过计算分析:(1)哪个单位工人的平均日产量水平高?

(2)哪个单位工人的日产量水平均衡?11、已知某地区农民家庭按年人均收入分组的资料如表所示:按人均收入分组(元)家庭户数占总户数比重(%100以下100—200200—300300—400400—500500—600600以上合计要求:(1)计算该地区平均每户家庭人均年收入的中位数、均值及标准差。(2)根据计算结果回答,该地区平均每户家庭人均年收入与其平均数相比,平均相差多少元?(即是问标准差)12、在某城市抽取100户家庭所做的一项抽样调查结果如下:按月收入分组(元)家庭户数占总户数比重(%300—40024400—50027500—60028600—70010700—8007800以上4你认为要分析该城市家庭的人均收入情况,用均值、众数和中位数哪一个测度值更好?试说明理由。(提示:用中位数。因为收入分布为右偏,且频数较多的几个组的家庭百分比相差不大,众数不十分明显。)13、某厂两个主要生产车间工人某月奖金资料如下:工人按奖金额分组(元)工人数(人)甲车间乙车间20以下4120—308630—40503040—50165550以上28要求:(1)计算甲车间的众数、中位数和均值。根据计算结果描述众数、中位数及均值的关系,并据此判断甲车间数据分布的形态。(2)通过计算判断哪个车间工人平均奖金额的代表性强?14、某县两个乡在不同地块的粮食产量资料如下:甲乡乙乡甲乡地块编号平均山广(公斤/亩)粮食产量(公斤)平均山广(公斤/亩)播种面积(山)110025001001252150150001505034005000040075试比较哪个乡的平均亩产高?并进一步分析原因。 (提示:从两个乡产量水平不同的地块所占比重差异来分析)15、某企业某种产品须经过4个车间的流水作业才能完成,如果第一车间的产品合格率为90%第二车间的产品合格率为97%第三车间的产品合格率为95%第四车间的产品合格率为98%求平均合格率。16、某种产品的生产须经过10道工序的流水作业才能完成,有2道工序的合格率都为90%有3道工序的合格率都为92%有4道工序的合格率都为94%有1道工序的合格率为98%试计算平均合格率。17、某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:(1)如果该班的男女学生各占一半,全班考试成绩的平均数是多少?标准差又是多少?(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少?(3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少?(1)比较(1)、(2)和(3)的平均考试成绩有何变化,并解释其变化的原因。(2)比较(2)和(3)的标准差有何变化,并解释其原因。(6)如果该班的男女学生各占一半,全班学生中考试成绩在分〜分的人数大概有多少?18、某企业购进四批不同规格的原材料,每批价格及采购金额如下表所示,求这四批材料的总平均价格批次价格(元/公斤)采购金额(元)第一批3510000第二批4020000第三批4515000第四批505000合计一50000(提示:总平均价格采购总金额采购总数量19、已知某公司下属三个工厂的实际产值及计划完成程度资料如下:工厂 计划完成程度(% 实际产值(万

元)甲95乙105丙115合计一649试求:三个工厂的平均计划完成程度(提示:计划完成程度 —100%;平均计划完成程度平均实际产值平均计划产值100%实际产值 3计划产值3100%实际产值 3计划产值3100%实际产值计划产值100%)第四章 概率与概率分布一、单项选择题1、随机事件A,B互斥,且P(A)0.36,P(B)0.24,那么TOC\o"1-5"\h\zP(AB)( )A、 B、C、 D、02、随机事件A,B相互独立,且已知P(A)0.50,P(B)0.30,那么P(AB)()A B、C、 D、3、事件A,B,C都不发生的概率为,那么A,B,C至少一个发生的概率为()AB、C、D、无法计算4、设随机变量X〜B(10,,那么最可能“成功”的次数为( )A0 B、10C、4 D、5、某种电子元件的使用寿命 X服从参数为 的指数分布,且EX=,那么()AB>1000C、D、10000006、随机变量X〜N(0,1),以(x)表示其分布函数,那么(0)( )A、0 B、C、 D、二、多项选择题1、概率的三公理是指( )AP(A)<0B、P(A)>0C、P()0D、P()0E、P(AE、P(A1A2 )P(A)P(A2)(其中A,i1,2两两互斥)2、事件A,B互斥,且P(A)0.30,P(B)0.50,那么AP(AB)0.80B、ABC、P(AB)0D、P(AB)1E、P(AB)0.203、事件A,B相互独立,且P(A)0.30,P(B)0.50,那么( )AP(AB)0.15B、P(AB)0.35C、P(AB)0.65D>P(A/B)0.50E、P(AB)0.354、随机变量X服从参数为 3的Poisson分布,那么( )AEX=3 B 、DX=3 C 、EX=DX=330D最可能值为3和2E、P(X0)—e3e30.04980!5、随机变量X~N(5,16),那么以下结论正确的有(AEX=5BAEX=5B、F(x)F(x)C、P(X5)P(X5)0.5000DF(10) (1.25)E、P(7X17)0.9973TOC\o"1-5"\h\z6、随机变量X~N(,2),那么( )A、分布曲线关于x对称 B 、曲线中心位置为xG概率密度函数在x处取最大值D、P(X)0E、X在一个给定区间取值的概率随 减小而增大7、随机变量的数学期望EX的意义为( )A、表示变量取值的分散程度 B、概率分布的重心 C、变量取值的集中趋势D是变量算术平均数的稳定中心 E、接近变量最有可能取的值8、关于二项分布,以下说法正确的有( )A、产生自n重贝努里实验B、实验方式改为重复实验后,超几何分布蜕化为二项分布G变量的最有可能取值为[(n+1)p]D、n很大,p很小时,可以用泊松分布近似E、是描述缺陷数或稀有事件数的合适分布三、填空题1、A表示产品外观合格,B表示产品内在质量合格。那么,A+B表示AB表示 2、射手甲、乙单独以及同时击中目标的概率依次为:,和,目标被击中的概率为3、街头随机抽取一个人,是中国人的概率为,是非云南中国人的概率为,那么此人是云南人的概率为 4、在校园中任抽一名同学,他喜欢足球的概率为,在喜欢篮球的条件下他喜欢足球的概率为,他同时喜欢篮球与足球的概率为5、随机变量X~B(n,p),且已知EX15,DX6,其概率分布为 期最可能取值为 TOC\o"1-5"\h\z6、一个离散随机变量X的数学期望与方差的数值相等,那么这个随机变量的分布是 ,如果P(X4)P(X5),那么P(X2) =,EX=最可能取值为07、随机变量X~N(0,1), (x)为其分布函数,那么(0),(x),P(|X|h)。 (2)0.97725 ,P(|X2) ,P(X2)=,如果P(|X|h)0.9973,那么h=.8、随机变量X〜N(2,4),那么变量Z= 服从标准正态分布。P(X2)=P(Z) ,P(X6) =,P(1X5) =,P(X4)=.o如果已知P(Xx)0.9545,那么x=。9、随机变量X服从参数为的指数分别,且已知标准差 0.0001,那么参数= ,数学期望EX,概率密度为f(x),P(X20000)。10、随机变量X在区间[4,12]上服从均匀分布,则P(X6) ,P(5X7),—那么如果P(cxd)0.40(4cd12),且4c2,d212那么P(c2Xd2)= ,EX= ,DX ,且几何中心与 重合。四、判断题1、事件A发生的概率为,事件B发生的概率为,则事件A发生的可能性大于事件B发生的可能性,在一次实验中一定是事件 A发生而事件 B不发生。()2、随机事件的概率,从统计定义的角度可以理解为随机事件频率的稳定值。()同一事件的主客观概率不相等时, 只能根据客观概率判断事件发生的可能性。()事件和的概率等事件的概率之和()事件差的概率等于事件概率之差。()事件乘积的概率等于事件概率之积。()必然事件的概 率为1, 故而概 率为1的事件是必 然事件。()概率为零的事件 才有 可能是不可能 事件。()9、正态分布的重要性表现在许多分布的极限分布是正态分布,很多分布出自正TOC\o"1-5"\h\z态分布( )正态分布在数学期望值附近 的 概率分布密集程度最 高 。()指数分布的参数等于数学期望 的 倒数,一般做失效率理 解 。()12、均匀分布的变量在区间 [a,b]内某一小区间取值的概率与 [a,b]的长度成反比。( )计算连续随机变量取值于某区间的概率时, 可以不计区别区间端点是否在内。()数学期望是个分布的重心,接近于变量的最有可能取值。()贝努里大数定理表明, 实验次数足够大时频率作为概率的估计值, 出现很大偏差的可能性很小。()16、独立同分布大数定律,为以样本平均数估计总体平均数提供了理论依据。()17、独立同分布大数定律, 为多次测定值的算术平均数作为真实值的估计, 提供了理论依据( )五、问答题1、随机事件的概率及其性质。2、随机变量及其在统计学的地位。3、正态分布及其在统计学中的重要性。4、贝努里实验与二项分布。六、计算分析题1、从一批产品中任抽 20件产品,结果有 4件次品,问“这批产品的次品率为5%”的说法可以相信吗?甲、乙、丙三个企业生产同一种零件, 其市场占有率依次为: 30%,60%和10%,零件的一等品比重分别为: 70%,90%与50%,现从市场上任意购买(不问品牌)一个零件。问: (1)这件零件是一等品的概率; (2)是非一等品的概率; (3)如果买得的零件是一等品,是哪家企业生产的可能性最大?3、保险公司开发一种新的保险产品,拟向每个保户收取保费 20元/人,如果保护在保险期内发生赔付责任事故,保险公司赔付的标准为 20000元/人。经调查愿意购买该产品的保户人数为 50000人,每位保户在保险期内发生责任事故的概率为%0。问:(1)期内发生责任事故的保户数大于2户的概率是多少?(2)公司因为此项业务而亏损的概率是多少?4、在总体 N(80,202)中,(1)抽取一个容量为 100的样本,求样本平均数与总体平均数之差的绝对值大于 3的概率;(2)如果样本平均数与总体平均数之差的绝对值小于的概率为 %,那么样本容量为多少?抽样与抽样估计第五章抽样与抽样估计一、单项选择题TOC\o"1-5"\h\z1、实际工作中,小样本是指( )A、样本容量大于 30的样本 B、样本容量小于 30的样本 C、样本容量等于 30的样本 D 、样本容量小于等于 30的样本2、从 5个字母中随机抽取 2个字母作为样本,采用重复抽样,考虑顺序,则可能的样本个数为( )A、10个 B、20个 C、25个D、30个当总体方差未知, 且样本容量小于 30时,进行正态总体均值的区间估计应采用的临界值为( )A、F值 B 、Z值C、t值D、x2值4、当总体方差已知,无论样本容量 n的大小如何,进行正态总体均值的区间估计应采用的临界值为( )A、F值 B 、Z值C、t值 D、x2值5、在总体内部情况复杂、且各单位之间差异程度大、单位数又多的情况下,宜采用()A、等距抽样 B、整群抽样 C、简单随机抽样 D、类型抽样6、根据重复抽样的资料,甲单位工人工资方差为 25,乙单位为 100,乙单位抽的人数比甲单位多 3倍,则抽样平均误差( )A甲单位较大 B、甲单位较大 C、无法判断 D、甲、乙单位相同7、某学校在全校学生中随机重复抽取 100人调查身高,计算出抽样平均误差为5cm如果改用不重复抽样方法,在其他条件不变时,其抽样平均误差将会()A大于5cmB、小于5cmC、等于5cmD、不确定8、纯随机重复抽样条件下,样本容量扩大为原来的 9倍,其它条件不变,则()A、抽样允许误差不变 B、抽样允许误差缩小为原来的九分之一 C、抽样允许误差缩小为原来的三分之一 D、抽样允许误差增大为原来的九倍二、多项选择题1、影响抽样平均误差的因素主要有( )A、总体方差或标准差 B 、样本容量C、抽样方法 D、抽样组织方式 E、抽样的对象2、下列说法中错误的有( )A、抽样误差是不可避免的 B、抽样误差是可以避免的 C、抽样误差可以计算但不能加以控制机 D、抽样误差是由于抽样的随机性而产生的样本估计量与总体参数之间的代表性误差 E、抽样误差是指登记性误差TOC\o"1-5"\h\z3、评价估计量的优劣常用下列三个标准( )A、一致性 B、有效性C、合理性D、代表性E、无偏性4、抽样推断过程包括相互联系的三项内容( )A、随机抽样 B、统计估计C、假设检验D、抽样精度E、置信度5、下列说法正确的有( )A、总体参数是唯一的、确定的,但又是未知的 B、总体参数是随机变量 C、样本统计量是随机变量 D、样本统计量是唯一的、确定的E、样本所包含的总体单位个数称为样本容量6、概率抽样最基本的组织方式有( )A简单随机抽样B、分层抽样C、等距抽样 D、整群抽样E、配额抽样7、抽样估计中的抽样误差( )A、无法避免 B、可以控制C、只能在估计结束才能知道 D、可以计算E、不可控制8、抽样平均误差是指( )A、所有可能样本的样本指标与总体指标的平均离差 B、所有可能样本的样本指标对总体指标的标准差 C、已抽出样本的标准差 D、等价于极限误差E、已抽出样本的平均差三、填空题1、概率抽样也叫随机抽样,是指按照原则抽取样本。2、在其他条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量扩大为原来的一倍。3、当n趋近于无穷大时,卡方分布趋近于分布。四、判断题TOC\o"1-5"\h\z1、抽样估计中所谓的抽样误差,是指系统误差。 ( )2、编制抽样框,是实施抽样的基础。( )3、F分布不以正态分布为其极限分布,它总是一个正偏态分布。 ( )4、若总体平均数和方差有限,当样本容量n充分大时,无论总体分布形式如何,样本平均数近似服从t分布。( )5、根据中心极限定理,当n趋近于无穷大时,二项分布趋近于正态分布。(6、在其他条件不变的情况下,扩大抽样极限误差会降低估计的置信度。(7、抽样平均误差越小,则样本对总体的代表性越小。 ( )8、在其他条件相同的情况下,不重复抽样的抽样误差总是大于重复抽样的抽样误差。( )9、总体方差是影响抽样数目的因素之一。在其他条件不变的情况下,总体单位的差异程度大,则应少抽,反之可以多抽一些。( )10、重复抽样所产生的样本是彼此独立的。( )11、总体参数的数值是客观存在的确定的,但又是未知的,需要用样本资料去估计。( )12、样本统计量不含未知参数,它是随样本不同而不同的随机变量。 ( )13、全面调查也可产生代表性误差。( )14、在其他条件不变的情况下,提高估计精度会提高估计的置信度。 (1n15、样本方差S:1= 3x1是总体方差的无偏估计量。( )n1i116、估计量是参数的无偏估计,可以保证它对参数 的估计没有系统偏差。()17、样本比例是总体比例的无偏估计。( )18、登记性误差是抽样调查所特有的。( )19、抽样推断是归纳推断法中的一种。( )20、参数估计和假设检验是抽样推断的两个组成部分。 ( )五、简答题1、什么是抽样框?抽样框有哪三种主要形式?2、什么是抽样平均误差、抽样方差、抽样极限误差?它们之间有何关系?3、必要抽样数目受哪些因素影响?4、什么叫估计量?评价估计量优劣的标准有哪三项?5、点估计常用的方法有哪两种?其基本思想是什么?六、计算分析题1、某电池的寿命(单位:分钟)的95胡信区间是430<小<470。假设这个结果是根据一个样本容量为100的样本得出的。试问:(1)样本的均值是多少(2)样本的标准误差是多少(3)如果置信区间419<小<481是从相同样本数据得出的,置信度是多少(置信度为%90%95%%%时,正态分布概率值分别是(123)2、调查公司想要估计全日制的大学生每周花在看电视上的时间(单位:小时)平均有多少小时。当极限误差为小时时,计算估计均值所需要的样本容量。 (假设想要达到的置信度为95%标准差估计为小时。)3、一个样本中包含75台若干年前购买的电视机。这些电视机的置换时间为年,标准差为年。试对那一时期所有电视机的平均置换时间构建一个 95%勺置信区问。怎样才能减小这一区间。4、一个样本容量为400的随机样本取自均值以和标准差6均未知。已算出x2280,x2 38532。求小的95%勺置信区问。5、当你选购一种商品时,考虑得最多的是什么?是价格还是商品的质量?某市场调查公司调查了2000名成年人,结果又64%勺人说他们主要根据价格做出购买决策。(1)试对根据价格做出购买决策的成年人的真正百分率构造%勺置信区间。(2)对此区间做出解释(3)如果将置信度从%窜到90%(1)中的置信区间将会发生什么变化。6、一个研究者想要估计年龄在12-18岁之间、在学校使用计算机的学生比例。如果他想要%勺把握程度相信极限误差为5%必须要对多少名随机选择的学生进行调查?(1)假设我们将先前的一项研究中得出的百分比82%乍为p的估计值(2)假设我们事先没有信息可以提供p的可能值7、某厂对当年生产的产品进行质量检查,从50000件产品中随机抽取200件产品,发现其中有15件不合格,试应用恰当的方法在%(Z=2)的概率保证下,对全部不合格产品作可能范围估计。8、某进出口公司出口一种名茶。按规定这种茶叶每包重量应不低于 150克,现用不重复抽样的方法抽取1%S行检验,其结果如下每包重量(克) 包数(包)148—14910149—15020150—15150151—15220合计100要求:①试以的概率(Z=3)估计这批茶叶平均平均每包的重量范围。以便确定是否达到规定要求。②以95%勺把握程度估计这批茶叶包装合格率的范围9、某地区粮食播种面积共8000亩。随机抽取100亩进行调查,结果平均亩产量为580公斤,亩产量的标准差为40公斤,试以%勺置信度(Z=3)估计该地区粮食平均亩产量的可能范围和粮食总产量的可能范围。10、一个容量为n=16的随机样本来自总体均值和方差未知的正态分布总体。如果样本有均值X27.9和标准差s二,则总体均值的95%勺置信区间是多少?在重复研究中,n多大时,才能使得总体的允许误差为?这个样本容量数,对于95%的置信区间要求的允许误差为能达到吗?11、一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸广告的家庭占多大比例。为了估计这个比例,首先要确定抽多少个家庭做调查。该公司希望以90%勺置信水平对这个比例作出估计,并使估计值处在真正比例附近范围内。在一个由15个家庭组成的样本中,有35%勺响应者指出他们家中有某个人看过这种广告,试问应取多大的样本?12、设已知某果园某种果树单株产量按正态分布。随机抽取6株计算其年产量(单位:kg)为:205 236试以95%勺置信水平,估计全部果树的平均年产量的置信区问。13、某灯泡厂为了使生产的螺丝口和卡口灯泡的比例能很好地适应用户需要,从全市所有电灯中随机抽出1500盏灯作为样本。查得其中螺丝口灯头占15%试以95%勺置信度系数求卡口灯头的真正百分比的置信区问。第六章 假设检验一、单项选择题1、假设检验的基本思想是( )A、带有概率性质的反证法 B 、小概率事件的出现是合理IC、对总体均值的检验 D 、对总体方差的检验2、假设检验的显著性水平 的一般取值为( )A、大于B、大于C、小于D、不超过3、样本容量不变,犯第一类错误的概率减小,3、样本容量不变,犯第一类错误的概率减小,则犯第二类错误的概率(A、A、增大 B、减小C4、正态总体方差未知,且样本容量小于、不变D、变化不定30,检验总体均值的统计量应取A一X0 _A一X0 _AZx-N(0,1) BS.n2c2(n1)S 2C 2 (n1) D05、假设检验中的P值的意义为(A拒绝原假设的最小显著性水平 B水平G接受原假设的最小显著性水平 D水平〜N(0,1)、拒绝原假设的最大显著性、接受原假设的最大显著性二、多项选择题1、实际推断原理的要件是( )A实验的次数 B、实验的次数以一次为限 C、事件发生的概率很小D很小D事件不发生是主观的认定 E2、关于假设检验的显著性()A、原假设H为真却被拒绝的概率率G改变检验的结论必随之改变减小E、减小,犯采伪的错误必随之增大、事件不发生是客观事实水平,以下说法正确的是B、原假设H不真被拒绝的概D、减小,拒绝原假设的概率3、关于假设检验中第一、第二类错误的概率3、关于假设检验中第一、第二类错误的概率()A同时减小,的方法是增大样本容量,,以下的说法正确的是B 、 1G拒真的代价大,取较小的验功效E、采伪的代价大,取较大的G拒真的代价大,取较小的验功效E、采伪的代价大,取较大的4、以下属于参数假设的有(AH0: 100BD总^体X,Y有相同的分布而容忍较大的以求较小的Ho:X~N(10,25)ED、(1 )成为检2C、Ho: 1、总体X,Y相互独对于假设 H0: 5,H0: 5的检验, 以下说法正确的有 ( )A、这是一个单侧检验B、这是右侧检验C、这是左侧检验绝原假设D这是双侧检验D这是双侧检验、检验统计量的数值大于上侧位临界值时拒6、关于假设检验中的 P值,以下说法正确的是( )A、P为拒绝原假设的最小显著性水平 B、接受原假设的最大显著性水平C、如果P,在显著性水平 下拒绝原假设D、P值越小拒绝原假设的理由越充分E、如果<P,则在显著性水平 下接收原假设、填空题某一假设检验为左侧检验,其原假设是H0: 10,则备择假设为TOC\o"1-5"\h\z2、原假设拒绝域和接受域的分界点坐标值,称为 。_3、假设检验的四种情况是: 、 、 和 。4、双侧检验的拒绝域位于统计量分布曲线的 ,右侧检验的拒绝_域位于 ,左侧检验的拒绝域位于统计量分布曲线的5、“接受原假设”的含义是 。__6、如果我们希望提高“拒绝原设”的说服力,那么应该 的数值。7、双侧检验的P值等于8、如果改变显著性水平 ,假设检验的结论 ,因此假设_检验又称为 。_四、判断题、假设检验一定有犯 错误的风险。()、假设检验的结论具有 100%的准确率。()、显著性水平=,表示拒绝原假设的概率为10%。()、 减小必然增大,故而假设检验中的犯第一、第二类错误互为逆事件。()、建立假设时遵行的原则是“不轻易拒绝原假设”。()、改变假设检验的显著性水平,检验的结论有可能改变。7、在假设检验中,减小一类错误的概率势必以另一类错误的概率增加为代价,除非扩大样本容量假设检验控制错误的方法是, 先固定,然后选择(1 )最小的检验方法。要提高“拒绝原假设”的说服力,应增大显著性水平的数值()“拒绝原假设”和“接受原假设”具有相同的可靠程度()11、在显著性水平 =之下,接受原假设等价于统计量的数值落入置信度为的置信区间()12、假设检验中的P值越大,拒绝原假设的理由越充分五、简答题1、假设检验的思想及步骤2、假设检验中的错误3、假设检验的显著性水平4、假设检验的局限性5、误用 Z统计量检验替代 T统计量的后果六、计算分析题1、已知某种零件的尺寸服从正态分布 N(23.02,1.52),现从这一批零件中任抽七件进行测量,测得尺寸数据(单位: mm如下:能否认为这批零件的平均尺寸仍为 ( 0.05)。2、假设英语四级考试中学生成绩服从正态分布。 现随机抽取 25名学生的考试成绩,算得平均分为 67分,标准差为 10分。在显著性水平 0.01下,可否认为全体学生的平均考试成绩为 72分?3、某市统计局调查了 30个集市上的鸡蛋价格,测得平均价格为元 /千克,已知以往的鸡蛋价格一般为元 /千克。假定该市的鸡蛋售价服从正态分布 N(,0.64),假定方差不变,能否认为当前鸡蛋的平均价格高于以往? ( 0.01)。4、从一批保险丝种抽取8根,测得其熔化时间X(单位:毫秒),得如下数据:50485053515552512设X服从正态分布,质量标准为 2=35。问这批产品是否合格 ( 0.05)?

5、某市声称人口普查的差错率为先,为了检验该结果是否可靠,随机抽查了了2000人,结果发现漏登 2人,问可否认为原来的差错率正确 ( 0.05)?第七章 方差分析一、单项选择题)这一假设进行检验。C、均值相等 )这一假设进行检验。C、均值相等 D、均值不)C、是负偏态的 D、取值小A、方差相等B、方差相异等2、方差分析使用的统计量 F(A、是正态分布 B、是正偏态的3、设单因素方差分析中误差项离差平方和为,水平项离差平方和为 375,那么总离差平方和为( )A、250B、 C、 D、5004、因素 A共4个水平,每个水平下重复 5次实验,数据的平方和为 1250,数据总和为 150,A、125B、-125 C 、无法计算D、14005、在单因素方差分析中,已知总离差平方和的自由度为 24,水平项离差平方和TOC\o"1-5"\h\z的自由度为 7,那么误差项离差平方和的自由度为( )A、17B、24 C 、7 D 、316、在一个双因素方差分析中, FA=,FB=相应的 P-value依次为和,那么结论是( )AA的作用显著,B的作用不显著 B、A的作用不显著,B的作用显著C、A的作用不显著,B的作用不显著D、A的作用显著,B的作用显—著7、已知SST1440,SSA700,SSB560,fT30,fA6,fB8,那么TOC\o"1-5"\h\zFA=( )A、1440 B、700C、 D、8、如果MSA12.25,fA4,MSB8.00,fB5,MSE2.25,fE16,那么SST( )A无法计算 B C、25 D、125二、多项选择题1、方差分析假定的内容有( )A、数据来自正态总体 B、数据来自二项总体 C、各总体相互独立

D各总体不相关 E、各总体方差相等2、一个单因素方差分析中,因素的水平为5,每个水平下的样本容量是6,SST=120,SSA=75那么以下正确的是( )An=30B、dfA=4C、MSE=D、d}=29 E、F=3、在一个单因素方差分析问题中,因素的水平为4,每个水平下的样本容量是5,那么下列说法正确的是( )A、检验的原假设为H0:1 2 3 4B、检验的临界值为F(4,5)G检验的原假设为H0:1 2 3 4 5D、检验的临界值为F(3,16)E、E、检验的统计量为FSSA3SSE164、一个因素A有6水平,因素B有4水平的双因素方差分析中,以下正确的有()A、数据共24个B、误差平方和的自由度为15C、SSA的自由度为6DSST的自由度为3E、SST=SSA+SSB+SSE5、一个因素A有7水平,因素B有8水平的双因素方差分析中,SST=225,SSA=78,SSB=140下正确的有( )A、SSE=2B、SSE=7C、Fa78D、MSE=E、因素A的作用显著三、填空题 数据间的差异来自:1 数据间的差异来自:2、方差分析认为3、单因素方差分析中,A共6个水平,SSA=;自由度df= 04、单因素方差分析问题中,F=,P—value=,表示拒绝原假设的概率为。5、因素A设4水平,因素B设6水平的双因素方差分析中,SSE的自由度为6、某一双因素方差分析的计算结果为:6、某一双因素方差分析的计算结果为:应为 Fa=,Fb=,P-value依次为,,那么结论_四、判断题、水平间的方差只包含有系统性因素()、F分布的第一自由度越小,它右偏态的程度越大()3、方差分析,将总离差平方和分解为水平项离差平方和与误差项平方和,同时也将总的自由度分解为各个平方和的自由度之和4、单因素方差分析的检验统计量为FSSASSE()5、方差分析输出结果总的P-value越大,越应该拒绝原假设。( )6、方差分析每个水平下设置的样本容量都必须相等。( )7、双因素方差分析的两个因素问不会产生交互作用。()8、因素A共6个水平,因素B共5个水平,那么随机误差项的自由度为20()9、如果方差分析的结论是拒绝原假设的话,意味着所有水平之间存在着显著差异。( )10、如果统计量F=,而Fcrit为,那么因素的作用不显著。 ( )五、简答题1、方差分析的原理2、方差分析的原假设及其被拒绝的意义。3、双因素方差分析中SSA、SSBSSE与SST的内容及关系4、方差分析的步骤六、计算分析题1、设有五种治疗尊麻疹的药,为了比较它们的治疗效果,将30个病人随机分为5组,每组6人进行试验,结果如下:药物AA1A2A3A4A5治64679愈86444总和T=169天76465数73567总评均x5.63Xj10533786256和Ti4630243138平均Xi7.675.004.005.176.33平方和362158106 171 2561053试检验五种药物的疗效有无显著差异( 0.01)2、对四种小麦进行产量(单位:kg/小区)的对比实验,假设各小区地力相同,5分析不同小麦品种小区产量有无显著差异(0.01)3、某种商品不同的装潢,在五个地区销售,资料如下:地区(因素| 装潢(因素AB) Ai A 2 ABi414534B2535144B3544846B4554345B433951检验商品的不同装潢和在不同地区销量之间是否有显著差异 (0.05)第八章 相关与回归分析一、单项选题题TOC\o"1-5"\h\z1、当自变量X减少时,因变量Y随之增加,则X和Y之间存在着( )A、线性相关关系B、非线性相关关系 C、正相关关系D、负相关关系2、下列属于函数关系的有( )A、身高与体重之间 B、广告费用支出与商品销售额之间 C、圆面积与半径之间 D、施肥量与粮食产量之间3、下列相关程度最高的是( )Ar=B、r=C、r=D、r=4、两变量x与y的相关系数为,则其回归直线的判定系数为( )A、 B、 C、 D、5、在线性回归模型中,随机误差项被假定服从( )A、二项分布 B、t分布C、指数分布 D、正态分布6、物价上涨,销售量下降,则物价与销售量之间的相关属于( )A、无相关 B、负相关C、正相关D、无法判断7、相关分析中所涉及的两个变量( )A、必须确定哪个是自变量、 哪个是因变量 B、都不能为随机变量C、都可以是随机变量 D 、不是对等关系8、单位产品成本y(元)对产量x(千件)的回归方程为:yt1000.2xt,其中“—”的含义是()A、产量每增加1件,单位成本下降元 B、产量每增加1件,单位成本下降20%C、产量每增加1000件,单位成本下降20%D、产量每增加1000件,单位成本平均下降元 E、产量每增加 1000件,单位成本平均下降 20%二、多项选择题1、下列说法正确的有( )A、相关分析和回归分析是研究现象之间相关关系的两种基本方法 B、相关分析不能指出变量间相互关系的具体形式, 也无法从一个变量的变化来推测另一个变量的变化情况 C、回归分析可以不必确定变量中哪个是自变量,哪个是因变量 D、相关分析必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量 E、相关分析中所涉及的变量可以都是随机变量,而回归分析中因变量是随机的,自变量是非随机的TOC\o"1-5"\h\z2、判定现象之间有无相关关系的方法有( )A、计算回归系数 B、编制相关表 C、绘制相关图 D、计算相关系数 E、计算中位数3、相关关系按相关的形式可分为( )A、正相关 B、负相关C、线性相关D、非线性相关 E、复相关4、在直线回归方程yt=1+2Xt中,回归系数2的数值( )A、表明两变量之间的平衡关系 B、其正、负号表明两变量之间的相关方向C、表明两变量之间的密切程度 D、表明两变量之间的变动比例 E、在数学上称为斜率5、下列那些项目属于现象完全相关( )A、r=0B、r=—1C、r=+1D、y的数量变化完全由X的数量变化所确定E、r=6、在回归分析中,要求所涉及的两个变量乂和丫( )A、必须确定哪个是自变量、哪个是因变量 B、不是对等关系C、是对等关系D一般来说因变量是随机的,自变量是非随机变量 E、y对x的回归方程与x对y的回归方程是一回事7、下列有相关关系的是( )A居民家庭的收入与支出 B、广告费用与商品销售额 C、产量与单位产品成本D、学生学习的时间与学习成绩E、学生的身高与学习成绩8、可决系数r2=%寸,意味着( )A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有80%T通过回归直线来解释C、因变量的总变差中,有20%T由回归直线来解释D相关系数绝对值一定是 E、相关系数绝对值一定是三、填空题1、相关系数r的取值范围为。2、可决系数的取值范围为。3、客观现象之间的数量联系存在着两种不同的类型:一种是关系;另一种是关系。4、已知r=,X=20,y=40,又知y是x的3倍,则Y对X的回归直线方程为o5、若已知 (xx)2是(yy)2的2倍,(xx)(yy)是(yy)2的倍,则相关系数r等于。四、判断题TOC\o"1-5"\h\z1、当自变量X按一定的数量变化时,因变量Y也相应随之等量变化,则X和Y之间存在着线性相关关系。( )2、可决系数是判断回归模型拟合优度优劣最常用的数量指标, 但不是最佳指标。()3、样本相关系数是总体相关系数的一致估计量。 ( )4、若有线性回归方程Y(元)=+(元),则表明当X增加一元时,Y增加元。( )5、若有线性回归方程Y(元)=160—(件),则表明当X增加一件时,Y平均减少元。( )6、可决系数越大,则模型对样本的拟合程度越差。 ( )7、可决系数r2=0时,SSE=SSR( )28、数学上可以证明,S2=一%是2的无偏估计。( )n29、回归估计标准误S越小,表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差。( )10、r=0时,表明两个变量之间不存在任何形式的相关关系。 ( )11、对于简单线性回归模型,相关系数r的平方等于可决系数。( )12、变量间的相关关系也就是函数关系。( )13、逻辑上没有关系,但却在数值上相互依存的相关关系称为“伪相关”。( )14、最小二乘法估计的样本回归直线 yt=1+2X一定通过点(X,Y)o()15、所有样本观测点全部在最小二乘法估计的样本回归直线 yt=1+2”上。()TOC\o"1-5"\h\z16、最小二乘法适用的前提是Y与X之间的关系确为Y=a+bX( )17、对于可划为线性模型的非线性回归问题,一般先划为线性模型,然后再用最小二乘法估计参数。( )18、一元线性回归方程的回归系数 2的符号与相关系数的符号完全一致。正号表示正相关,负号表示负相关。( )19、Y倚X的回归方程与X倚Y的回归方程是一回事。( )20、r=0时,只是表明两变量之间不存在线性相关关系,有可能存在非线性相关TOC\o"1-5"\h\z关系。( )21、相关分析中,所涉及的两个变量都可以是随机变量。 ( )22、相关系数是在所有情况下,用来说明两个变量相关关系密切程度的统计分析指标。( )23、两个变量中不论假定哪个变量为自变量X,哪个变量为因变量Y,都只能计算出一个相关系数。( )五、简答题1、试举例说明什么是相关关系?什么是函数关系?2、试述回归分析中误差项的标准假定。3、什么是单相关、复相关和偏相关?什么是线性相关和非线性相关?请各举一个你熟悉的例子说明。4、相关分析与回归分析之间的联系与区别?六、计算分析题1、某商店想了解职工工龄长短与月工资的关系, 调查了10名售货员的工龄和月工资情况。设工龄为X(年),月工资为Y(元)。经计算,已得到以下结果: x=70,y=640, x2=532, y2=42816, xy=4754要求:(1)计算相关系数r;(2)拟合以月工资为因变量的直线回归方程,并指出其回归系数的意义;(3)计算判定系数,并评价拟合优度。2、设销售收入X为自变量,销售成本Y为因变量。现根据某百货公司10个月的有关资料计算出以下数据:(单位:万元)(Xt—X)2=4250, X=, (Yt-Y)2=2620, Y=, (Yt—Y)(Xt-X)=3300要求;(1)计算简单相关系数,拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释;(2)计算可决系数和回归估计标准误差;(3)对2进行显著性水平为5%勺显著性检验。

3、从某大学统计系的学生中随机抽取16人,对数学和统计学的考试成绩(单位:分)进行调查,结果如下:学生编号数学成绩统计学成绩学生编号数学成绩统计学成绩181729837829090108194391961177684746812606657082136658673781484877858115708286071165446要求:(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论