人大统计学作业答案解析_第1页
人大统计学作业答案解析_第2页
人大统计学作业答案解析_第3页
人大统计学作业答案解析_第4页
人大统计学作业答案解析_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

完美.格式.编辑完美.格式.编辑专业.资料整理专业.资料整理★统计学(第二版)(ZK007B)第一章总论1、【104134】(单项选择题)某市分行下属三个支行白^职工人数分别为 2200人、3000人、1800人,这三个数字是( )。A.标志B.指标C.变量D.变量值【答案】D2、【104137】(单项选择题)统计一词的三种涵义是( )。A.统计活动、统计资料、统计学B.统计活动、统计调查、统计学C.统计调查、统计整理、统计分析D.统计指标、统计资料、统计学【答案】A3、【104143】(单项选择题)一项调查表明,北京市大学生每学期在网上购物的平均花费是500元,他们选择在网上购物的主要原因是“价格实惠”,则“大学生在网上购物的原因”是( )。A.分类型变量B.顺序型变量C.数值型变量D.定距变量【答案】A4、【104147】(单项选择题)一家研究机构从IT从业者中随机抽取800人作为样本进行调查,其中70%回答他们的月收入在5000元以上,则月收入是( )。A.分类型变量B.顺序型变量C.数值型变量D.定距变量【答案】C5、【104149】(单项选择题)一家研究机构从IT从业者中随机抽取800人作为样本进行调查,其中40%的人回答他们的消费支付方式是信用卡,则消费支付方式是( )。A.分类型变量B.顺序型变量C.数值型变量D.定距变量【答案】A6、【104156】(单项选择题)绝对不可能发生的事件发生的概率是( )。0B.0.1C.0.5D.1【答案】A7、【104160】(单项选择题)必然会发生的事件发生的概率是( )。00.1C.0.5D.1【答案】D8、【104161】(单项选择题)抛掷一枚均匀的硬币,出现正面的概率是( )。A.00.1C.0.5D.1【答案】C9、【104176](简答题)统计数据可以划分为哪几种类型?分别举例说明。【答案】统计数据按照所采用计量尺度的不同可划分为三种类型。 一种是数值型数据,是指用数字尺度测量的观察值。例如,每天进出海关的旅游人数,某地流动人口的数量等。数值型数据的表现就是具体的数值,统计处理中的大多数都是数值型数据; 另一种是分类型数据,是指对数字进行分类的结果,例如人口按性别分为男、女两类,受教育程度也可以按不同类别来区分;再一种是顺序型数据,是指数据不仅是分类的,而且类别是有序的,例如满意度调查中的选项有“非常满意”,“比较满意”,“比较不满意”,“非常不满意”,等。在这三类数据中,数值型数据由于说明了事物的数量特征,因此可归为定量数据,分类型数据和顺序型数据由于定义了事物所属的类别,说明了事物的品质特征,因而可统称为定性数据。10、【104173](填空题)参数是描述特征的概括性数字度量。【答案】总体11、【104174】(填空题)统计量是描述特征的概括性数字度量。【答案】样本12、【145091】(填空题)根据计量尺度的不同,可将数据划分为三种类型:、和。【答案】数值型数据;分类型数据;顺序型数据第二章数据的搜集13、【104177】(单项选择题)下列哪一项不是数据的直接来源( )。A.普查B.二手数据C.统计报表D.抽样调查【答案】B14、【104178】(单项选择题)数据的间接来源有(A.普查B.实验数据C.二手数据D.抽样调查【答案】C15、[104180](填空题)数据的误差包括:【答案】抽样误差、未响应误差、响应误差16、【104181】(填空题)抽样误差的影响因素有:【答案】样本量的大小、总体的变异性17、【104182】(填空题)抽样误差是由于抽样的随机性引起的样本结果与之间的误差。【答案】总体真值第三章数据的描述(一)一一数据的直观显示18、【104184】(单项选择题)统计表的形式应该是( )。A.上下不封顶,左右不开口B.上下要封顶,左右要开口C.上下要封顶,左右不开口D.上下不封顶,左右要开口【答案】B19、【104186】(单项选择题)直方图一般可用于表示( )。A.累计次数的分布B.次数分布的特征C.变量之间的函数关系D.数据之间的相关性【答案】B20、【104187】(单项选择题)直方图相比,茎叶图( )原始数据的信息。A.没保留B.保留了C.掩盖了D.浪费了【答案】B21、【104188】(单项选择题)10家公司在电视广告上的花费如下(百万元) :557,72,65.2,30,28,553,24,20,35,38。下列图示法不宜用于描述这些数据的是( )。A.茎叶图B.散点图C.饼图D.直方图【答案】C22、【122753】(单项选择题)对某地区人口按年龄分组如下: 4岁以下、4〜8岁、……、65~79岁、80~89岁、90~99岁、100岁以上。第一组与最后一组的组中值分别为( )。1.5岁和1045岁2岁和104.5岁2岁和105岁D.1.5岁和105岁【答案】B23、【104194](简答题)怎样理解在统计分组过程中的“互斥”、“不重不漏”、“上组限不在组内”、“下限不包括在内”的原则?【答案】在统计分组中的“互斥”原则,就是指各组中不应相互包含。所谓“不重”就是指一项数据只能归入其中的一组,而不能同时归入两个或两个以上的组。所谓“不漏”就是指各组别能够穷尽,即在所分的全部组别中,每项数据都能分在其中的一组而没有遗漏。为了解决“不重”问题,在统计分组中习惯上规定,对于越大越好的数值,采用“上组限不在组内”的原则,即当采用重叠组限时,某一变量值恰与组限同值,应将其归入下限组,而不是上限组;对于越小越好的数值,则采用“下限不包括在内”的原则,即当采用重叠组限时,某一变量值恰与组限同值,则应将其归入上限组,而不是下限组。为了解决“不漏”的问题,在分组时可以采用开口组,这样可以将极端值包括在分组中,不被遗漏。24、【104190】(填空题)重叠组限对于越大越好的变量按“■”的原则归组,而对于越小越好的变量则应按照“”的原则归组。【答案】上限不包括在内;下限不包括在内25、【104191】(填空题)统计表一般由、行标题、和数据资料构成。【答案】表头,列标题26、【104192】(填空题)盒形图由一组数据的最大值、、上四分位数、、最小值五个特征数值组成。【答案】中位数,下四分位数27、【104199](计算题)某班级30名学生统计学成绩被分为四个等级: A.优;B.良;C.中;D.差。结果如下: BCBABDBCCBCDBCABBCBABABBDCCBCABDAACDCABD

(1)根据数据,计算分类频数,编制频数分布表;(2)按ABCD顺序计算累积频数,编制向上累积频数分布表和向下累计频数分布表。【答案】成绩频数频率向上累积频数向上累积百分比向下累积频数向下累积百分比A820.0820.040100.0B1537.52357.53280.0C1127.53485.01742.5D615.040100.0615.0合计40100.028、【104202(计算题)某企业某班组工人日产量资料如下:日产量分组(件)工人数(人)50-60960-701970-802580-901690-10011合计80根据上表指出:(1)上表变量数列属于哪一种变量数列;(2)上表中的变量、变量值、上限、下限、次数;(3)计算组距、组中值、频率。【答案】(1)该数列是等距式变量数列。(2)变量是日产量,变量值是 50-100,下限是5。6a7a80、、90,上限是60、70、、80、9。100,次数是9、19251611;(3)组距是10,组中值分别是55>6517585、95,频率分别是11.25%23.75%31.25%.20%3.75%。29、【104203](计算题) 甲乙两班各有30名学生,统计学考试成绩如下:考试成绩人数甲班乙班优45良813中149差43

(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图;(2)比较两班考试成绩分布的特点。乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高。因此乙班学生考试成绩平均比乙班好。两个班学生都呈现出 "两头大,中间小"的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。30、【104205】(计算题)科学研究表明成年人的身高和体重之间存在着某种关系,根据下面一组体重身高数据绘制散点图,说明这种关系的特征。体重(Kg) 50 53 57 60 66 70 76 75 80 85身高(cm) 150 155 160 165 168 172 178 180 182 185【答案】散点图:

90-7CT拿L90-7CT拿L斯可以看出,身高与体重近似呈现出线性关系。身高越高,体重越重。31、【150771】(计算题)某班40名学生统计学考试成绩分别为:TOC\o"1-5"\h\z66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 7695 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 7772 61 70 81学校规定:60分以下为不及格,60-70为及格,70-80分为中,80—90分为良,90—100分为优。要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。(2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。【答案】(1)”学生考试成绩”为连续变量,需采组距式分组,同时学生考试成绩变动均匀,故可用等距式分组来编制变量分配数列。考试成绩学生人数(人)比率(%60分以下37.560-70「615.070-801537.580-901230.090-100410.0合计「40100.0(2)分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同学不及格人数和优秀生的人数都较少,分别为 7.5%和10%。大部分同学成绩集中在70-90分之间,说明该班同学成绩总体良好。考试成绩一般用正整数表示时,可视为离散变量也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。第四章数据的描述(二)一一重要的统计量32、【104206】(单项选择题)对于右偏分布,均值、中位数和众数之间的关系是 ( )。A.均值>中位数>众数B.中位数>均值〉众数C.众数〉中位数>均值D.众数>均值>中位数【答案】A33、【104207】(单项选择题)中位数( )。A.不是平均数B.是一种趋势值C.是一种位置平均数D.是一种位置【答案】C34、【104208】(单项选择题)众数( )。A.不是平均数B.是一种趋势值C.是一种位置平均数D.是一种位置【答案】C35、【104209】(单项选择题)下列不受极端值影响的平均数是( )。A.算术平均数B.众数C.调和平均数D.上述三种都不对【答案】B36、[104210](单项选择题)在下列两两组合的平均指标中,哪一组的两个平均数不受极端两值的影响?(A.算术平均数和调和平均数B.几何平均数和众数C.调和平均数和众数D.众数和中位数【答案】D37、【104211】(单项选择题)下列说法正确的是( )。A.异众比率的作用是衡量众数对一组数据的代表程度B.异众比率越大,则众数的代表性越好C.异众比率不宜用来比较不同总体D.定类尺度数据不能计算异众比率【答案】A38、【104214】(单项选择题)计算平均速度最好用( )。A.算术平均数B.调和平均数C.几何平均数D.众数【答案】C39、【104215】(单项选择题)A.方差B.极差C.平均差D.众数【答案】D40、【104218】(单项选择题)A.中位数B.众数C.标准差D.均值【答案】C41、【104220】(单项选择题)A.前者是时点指标而后者是时期指标B.前者是时期指标而后者是时点指标C.两者都是时期指标D.两者都是时点指标【答案】A42、【104221】(单项选择题)则其离散系数等于( )。A.&19C.0.9D.1【答案】C43、【104222】(单项选择题)A.众数不适用于定距和定比数据B.众数不受数据极端值的影响一组数据只能有一个众数D.众数不适用于定类数据【答案】B44、【104229】(单项选择题)npqA.np测度数据集中趋势的统计指标有( )。测度数据离散趋势的统计指标有( )。人口数与出生人数( )。有一组数据,其均值为10,样本方差为81,中位数为9,关于众数,下列说法正确的是( )。随机变量Y~B(n,p),则其变异系数为( )。npBVnpqC.q1D.q【答案】A45、【104230】(单项选择题)下列说法不正确的是(A.在单峰分布条件下,如果数据是对称的,则众数和中位数相等B.只有均值对所有类型的数据都适用C.对于偏态分布的数据,均值的代表性较差D.众数、四分位数和均值都适用于定比数据【答案】B关于均值,下列说法正确的是(关于方差和标准差,正确的说法是(46、【104231】(单项选择题)关于均值,下列说法正确的是(关于方差和标准差,正确的说法是(A.均值不适用于定类数据和定序数据B.均值不适用于定距数据和定比数据C.各变量与其均值的离差之和等于D.几何平均数不适用于定比数据【答案】A47、【104232】(单项选择题)A.方差有量纲B.标准差有量纲C.方差和标准差都有量纲D.方差的实际意义比标准差清楚【答案】B48、【104233】A.左偏B.右偏C.对称D.无法确定【答案】B49、【104237】A.左偏B.右偏C.对称D.无法确定【答案】A50、【104239】A.尖峰B.扁平C.右偏D.左偏【答案】A51、【104242】A.小于零(单项选择题)(单项选择题)(单项选择题)(单项选择题)当偏态系数大于零时,当偏态系数小于零时,当峰度系数大于零时,则分布是(则分布是(则分布是(正态分布的偏态系数(B.等于零C.大于零D.大于或等于零【答案】B52D.大于或等于零【答案】B52、【104244】(单项选择题)A.小于零B.等于零C.大于零D.大于或等于零【答案】B53、【104245】(单项选择题)65C.4D.5.5【答案】D54、【104246】(单项选择题)45C.5.5D.6【答案】B55、【145010】(单项选择题)A.频数正态分布的峰度系数( )。一组数据有10个观察值,则中位数的位置为(一组数据有9个观察值,则中位数的位置为(对列联水平进行分析的统计量主要是( )。B.频率C.中位数D.A且B【答案】D56、【104262](简答题)试回答描述数据的集中趋势的统计量有哪些?并对这些统计量的特点加以比较。【答案】常用的描述集中趋势的统计量主要有均值、中位数、众数。(1)均值又分为算术平均数、调和平均数和几何平均数。未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。根据分组整理的数据计算的算术平均数,就要以各组变量值出现的次数或频数为权数计算加权的算术平均数。(2)调和平均数也称倒数平均数或调和均值。 调和平均数和算术平均数在本质上是一致的,实际应用时,当计算算术平均数其分子资料未知时,就采用加权算术平均数计算均值,分母资料未知时,就采用加权调和平均数计算均值。(3)几何平均数也称几何均值,通常用来计算平均比率和平均速度。(4)中位数是将变量取值按大小顺序排列后,处于中间位置的那个变量值。 中位数很好的代表了一组数据的中间位置,对极端值并不敏感。由于中位数只是数据中间位置的代表取值,因此中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。

(5)众数是指一组数据中出现次数最多的变量值。众数具有不唯一性。均值、中位数、众数是描述数据集中趋势的主要统计量,它们按照不同的方法来确定,具有不同的特点和应用场合;但是,三者之间存在着一定的数量关系,这种数量关系取决于变量取值的频数分布状况。从分布的角度看,均值是一组数据全部数值的平均数,中位数是处于一组数据中间位置上的数值,众数始终是一组数据分布的最高峰值。对于具有单峰分布的大多数数据而言,均值、中位数、众数存在以下关系:当变量取值的频数分布对称时,则均值与众数、中位数三者完全相等,即当变量取值的频数分布呈现右偏时,三者之间的关系为 x>Me>Mo;当变量取值的频数分布呈现左偏时,三者之间的关系为 x<Me<Mo。从上面的关系我们可以看出,当频数分布呈对称分布或近似对称分布时,以均值、x=Me=Mo.中位数或众数来描述数据的集中趋势都比较理想;当频数分布呈偏态时,极端值会对均值产生较大影响,而对众数、中位数没有影响,此时,用众数、中位数来描述集中趋势比较好。均值不适用于定性数据。均值的优点在于它对变量的每一个取值都加以利用;缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。对于偏态分布的数据,均值的代表性较差。因此,当数据分布的偏斜程度很大时,可以考虑选择中位数或众数作为集中趋势的代表。57、【104263](简答题)试回答描述数据的离散趋势的统计量有哪些?并对这些统计量的特点加以比较。【答案】离散趋势反映了变量各个取值远离其中心值的程度。常用的测度离散程度的统计量主要有异众比率、极差、四分位差、平均差、方差、标准差和离散系数等。(1)异众比率是指一组数据中非众数(组)的频数占总频数的比例,是衡量众数对一组数据的代表性程度的指标。异众比率越大,说明非众数组的频数占总频数的比重就越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好。(2)极差是一组数据的最大值与最小值之差,也称全距,主要用于测度顺序数据和定量数据的离散趋势。极差容易受极端值的影响。(3)四分位差是上四分位数与下四分位数之差。四分位数是指处在 25%位置上的数值(下四分位数)和处在75%位置上的数值(上四分位数)。四分位差主要用于测度顺序数据和定量数据的离散趋势,它克服了极差容易受数据中两端极值的影响这一缺陷。数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。(4)平均差是一组数据与其均值离差绝对值的平均数。平均差越大,说明数据的离散趋势越大;平均差越小,说明数据的离散趋势越小。但是,由于平均差是用绝对值进行运算的,它不适宜于代数形式处理,所以在实际应用上受到很大的限制。(5)方差是一组数据与其均值离差平方的算术平均数。标准差是方差的平方根。方差、标准差同平均差一样,也是根据全部数据计算的,能够准确地反映每个数据与其均值的平均差异程度。但方差、标准差是取离差的平方消除正负号,这更便于数学上的处理。58、【10425458、【104254】(填空题)差、平均差、、标准差、【答案】方差、离散系数描述数据的离散趋势的统计量主要有异众比率、极差、四分位O59、【104255】(填空题)描述数据的集中趋势的统计量主要有【答案】均值、中位数、众数

60、【104256】(填空题)当变量取值的频数分布呈现左偏时,均值、中位数、众数三者之间的关系为:。【答案】均值〈中位数〈众数61、【104258】(填空题)平均发展速度和平均增长速度之间的数量关系式是: —【答案】平均增长速度=平均发展速度—162、【104275】(计算题)设某产品的完整生产过程包括 3道流水作业的连续工序,这生产工序的产品合格率分别为 80%、90%和95%。则整个生产流程的产品总合格率是多少?30.80.90.95=30.684=88.1%63、【145013】(计算题) 某学院一年级两个班的学生高等数学考试成绩如下表:高等数学考试成绩学生人数甲班乙班50〜602460〜705770〜80101480〜90171890〜10067合计4050试分别计算两个班的平均成绩和标准差,并比较说明哪个班的高等数学考试成绩差异程度更大。【答案】高等数学考试成绩组中值x甲班f乙班f甲班xf乙班xf50〜60552411022060〜70655732545570〜80751014750105080〜908517181445153090〜1009567570665合计4050320039205320040二80320040二80x甲=iJ5—甲班成绩均值: Y甲班成绩标准差:

甲班成绩离散系数:[(55-80jM2+(65-80jM5+(75-80jM10+(85_80j父17+(95-80jX61062甲班成绩离散系数:4. 40 =.s甲10.62V甲==二 =0.1328x甲80乙班成绩均值:5二为fi39j050=78.4乙班成绩标准差:5 2jfiA

5

Ji

i155-78.44「65—78.4239j050=78.4乙班成绩标准差:5 2jfiA

5

Ji

i155-78.44「65—78.4214485—78.4218'95—78.42750=11.36乙班成绩离散系数:11.3678.4=0.1449V甲<牝,因此,乙班的高等数学考试成绩差异更大。64、【145019】(计算题)根据下表资料,计算众数和中位数。按年龄分组人口数(万人)015142153016830459645606460以上52【答案】按年龄分组人口数(万人)向上累计次数向下累计次数015142142522153016831038030459640621245606447011660以上5252252合计522次数最多的是168万人,众数所在组为15〜3°这一组,故XL=5,Xu=30&T68_142=26人 4=168-96=72人Mo=XlMo或:△1-1:--22.2-1 ,2-2中位数位置26

d=15 15=18.98267272

d=30_ 15=18.982672▼f522=——=——=261,说明这个组距数列中的第 262位所对应的人口年龄是中位数。从累计(两种方法)人口数中可见,第261位被包括在第2组,即中位数在15〜30这组中。Xl=15Xu=30 fm=168 Sml=142 Sm书=212???Me=XlJS._Sm」 dfm261-142

=15 15=25.625168或者:Me=XuJS।7m1-2 dfm二30一胃15二乃625日产件数工人数(人)10-202520-303830-403440-501265、【145089](计算题) 有甲乙两个生产小组,甲组平均每个工人的日产量为 32件,标准差为8件。乙组工人日产量资料如下:要求:(1)计算乙组平均每个工人的日产量和标准差。(2)比较甲、乙两生产小组哪个组的日产量差异程度大?【答案】4

xifi

三+i1(1)1525253835344512 =28.03253834124i=1_15-28.0322525-28.0323835-28.0323445-28.03212_—■■ —9.43253834-12(2)8=—=0.2532宓V乙==电9.43 =0.3428.03说明乙组日产量差异程度大于甲组。66、【163301】(计算题)某年度两家工厂采购同一种原材料的价格和批量情况如下55i15~3i”i115106825245115 106 82 .55i15~3i”i115106825245115 106 82 .52 .45700 725 755 770 780400——二740.740.54(元/吨)5mi——i1xL -x^P —i/x100100100100100100 ?100 '100 '100—100—700 725 755 770 780500067=746.27(元/吨)采购单彳/b(元/吨)采购金额(万元)甲工厂乙工厂700115100725106100755821007705210078045100合计40050067、【173857】(计算题)某农场在不同自然条件的地段上用同样的管理技术试种两个粮食新品种,有关资料如下表所示:试种地段甲品种乙品种播种面积(亩)收获率(公斤/亩)播种面积(亩)收获率(公斤/亩)A2.04502.5383B1.53851.8405C4.23943.2421D5.34205.5372合计13.013.0试计算有关指标,并从作物收获率的水平和稳定性两方面综合评价,哪个品种更有推广价值?【答案】平均值标准差4.二xfix甲=Ij4一Jii12.04501.53854.23945.34205358.3= = =412.1813134 4 2xi—x甲 力i14Ji

i1450-412.182X2.0邠85—412.182父1.5戈394—412.182父4.2刊420—412.18j父5.3=_209013 一.V甲标准差系数阱20.90而一412.18=0.05074、Xifii4 2.53831.84053.24215.5372 5079.7平均值标准差4Jii11313=390.754 —2£(为_x乙ni34空■383-390.7522.5405-V乙标准差系数记_20.34

五3390.75=0.0521第五章概率和概率分布68、【104283】(单项选择题)每次试验成功的概率为 p,0<p<1,则在3次独立的重复试验中,至少失败一次的概率为( )。A3(1—p)B.3(1-p)p2c.1-p3D.I-p3【答案】B69、【104284】(单项选择题)根据中心极限定理,当nA30,np>5,nq>5,样本比例为p,p(1-p)p-z2,nA.B.C.D.时,总体比例p,p(1-p)p-z2,nA.B.C.D.p(1-p)pnnp4“1”pjp(;p)【答案】A70、【104287】(单项选择题)连续性随机变量的密度函数f(xJ定满足A/f&dx=1limfB.x,二x=1C.」Efx<0D.f(x肝定义域内单调增加【答案】A71、【104289】(单项选择题)若随机变量x~nM<t2)x1,x2,…,xn,是抽自x的一个样本,则下面(x—」可,nx-」Vr'n)的结论是正确的。2~N(口,二)~N(0,1)CX〜N(0,1)X―」—2 ~N(0,1)仃/D.n【答案】B72、【104290】(单项选择题)P(AB)=P(A)-P(B)P(AB)=P(A)-P(B)_p(A)p(B)P(AB)=P(A)-P(B)-p(AB)P(AB)=P(A)-P(B)-p(AB)【答案】C73、【104291】(单项选择题)(1)(A—B)+B=A⑵(A+B)-C=A+(B-C)(1)成立、(2)成立(1)成立、(2)不成立(1)不成立、(2)成立(1)不成立、(2)不成立【答案】D74、【104295】(单项选择题)一■定成立的是( )。P(A|B)=1P(B|A)=1P(B|A)=1P(A|B)=0【答案】A75、【104296】(单项选择题)对于任意两事件A、B,有( )。A.B.C.D.试问下列各式成立的有( )。设A,B为两个事件,P(A)#P(B)>0,且A=)B,则下列A.B.C.D.某人射击时,中靶的概率为34,如果射击直到中靶为止,则射击次数为3的概率为( )。A.343B.(3汹)2父(1/4)C(1/4)2X(3/4)D.⑴4)3卜面哪一个符合概率分布的要求(【答案】C卜面哪一个符合概率分布的要求(76、【104299】(单项选择题)xP{X二x}二一(x=1,2,3)TOC\o"1-5"\h\z\o"CurrentDocument"6xP{X=x}=(x=1,2,3)\o"CurrentDocument"4xP{X=x} (x--1,1,3)\o"CurrentDocument"32xP{X=x}=—(x--1,1,3)\o"CurrentDocument"8【答案】A77、【104301】(单项选择题)则"分别为( )。77、【104301】(单项选择题)则"分别为( )。=5,b=10=6,b=8=5,b=9二一7,b二7【答案】CA.aB.aC.a随机变量X服从区间[a,b]上的均匀分布,EX=7,DX_4

一号78、【104306】(单项选择题)事件A,B相互独立的充要条件为(A.AB3BP(AB)=P(A)(B)AB=:,P(A+B)=p(A)+P(B)【答案】BP(x)79、【104308】(单项选择题)设连续型随机变量X的分布函数是F(X),密度函数是则对于任意实数口,有P(X=3=( )。P(x)A.F(X)Bp(x)C.0D.以上都不对【答案】C80、【150761】(单项选择题)设DX=4,DY=1,^Y=0.6,则D(3X-2Y)为(A.40B.10-9C.25.6D.17.6【答案】B81、【104317](简答题)正态分布概率密度函数的图形有何特点?【答案】 正态分布概率密度函数f(xM图形有以下特点:①f(x户0,即整个概率密度曲线都在x轴上方。1f-C②曲线f(x族于X=N对称,并在x=N处达到最大彳t U2g。③曲线的随缓程度由。决定,。越大,曲线越平缓; 。越小,曲线越陡峭。④当X趋于无穷时,曲线以X轴为其渐近线。由以上特性可见,正态分布的概率密度曲线 f(x遍一条对称的钟形曲线。82、【104318](简答题)一事件A的概率P(A)=0,能否肯定事件A是不可能事件?为什【答案】不能肯定皿不可能事件。不可能事件是指在同一组条件下每次t^佥都一定不出现的事件。而 P(A)=O,并不能肯定A就是不可能事件。例如在闭区间 0,11上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为°,因此概率为0的事件不一定都是不可能事件。83、【104319](简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布?【答案】常见的随机变量分为离散型随机变量和连续型随机变量。离散型随机变量包括均匀分布、 0-1分布、二项分布、泊松分布。连续型随机变量包括均匀分布、正态分布。正态分布衍生卡方分布、 t分布、F分布。84、【104313】(填空题)甲、乙、丙三人参加同一项考试, 及格的概率分别为70%,60%,90%,则三人均及格的概率为;三个人都不及格的概率为;至少有一个人及格的概率为;至少有一个人不及格的概率为。【答案】0.378;0.012;0.988;0.622,(照)(% )(89 )(26 )85、【104314】(填空题)正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心由决定,曲线的陡峭程度由决定。【答案】均值电);方差右发者标准差⑷86、【104315】(填空题)当二项分布的n>20,P<0.25且nPM5时,二次分布可以近似为,该分布的均值为,方差为。[答案]泊松分布;np;曲(1~)87、【104322】(计算题)某车间有20台机床,在给定的一天每一台机床不运行的概率都是0.05,机床之间相互独立。问在给定的一天内,至少有两台机床不运行的概率是多少?(结果保留三位小数)【答案】设x表示在给定的一天内不运行的机床台数,则X~B(np),n=20,P"05解法一:p(x_2)=1_p(x:::2)=1-p(x=0)-p(x=1)]0 0 20 1 1 19=1_c00(0.05)0(0.95) _c20(0.05)|(0.95)=1—0.3585—0.3774=0.264解法二:因为n=20,p=0.05,np=1哆,可以用泊松分布近似计算二项分布%=nPT,则有:TOC\o"1-5"\h\zx /01 .1 1P(x=0)—e=—e=0.3679x! 0!x 1P(x=1) 'e-1e」=0.3679x! 1!则p(x—2)=1—p(x:::2)=1—p(x=0)—p(x=1)=0.26488、【150764】(计算题)某厂生产的螺栓的长度服从均值为10cm,标准差为0.05的正态分布。按质量标准规定,长度在9.9~10.1cm范围内的螺栓为合格品。试求该厂螺栓的不合格率是多少。(查概率表知,P(X<2尸位2尸097725)Z=X-10~N(0,1)【答案】螺栓的长度X~N(10,0.05),则Q05 ,合格的概率为9.9-10 X-1010.1-10 , ,P{9.9_X_10.1}=P{ - - }=Y2)-M(-2)0.05 0.05 0.05=243(2)-1=20.97725-1=0.9545故不合格率为1-0.9545=0.0455第六章参数估计89、【104324】(单项选择题)在估计某一总体均彳1时,随机抽取 n个单元作样本,用样本均值作估计量,在构造置信区间时,发现置信区间太宽,其主要原因是( )。A.样本容量太小B.估计量缺乏有效性C.选择的估计量有偏D.抽取样本时破坏了随机性【答案】A90、【104325】(单项选择题)根据某地区关于工人工资的样本资料,估计出的该地区工人平均工资95%的置信区间为[700,1500],则下列说法最准确的是( )。A.该地区平土工资有95%的可能性落入该置信区间

B.该地区只有5%的可能性落到该置信区间之外C.该置信区间有95%的概率包含该地区的平均工资D.该置信区间的误差不会超过5%【答案】C91、【104326】(单项选择题)点估计的缺点是( )。A.不能给出总体参数的准确估计B.不能给出总体参数的有效估计C.不能给出点估计值与总体参数真实值接近程度的度量D.不能给出总体参数的准确区间【答案】C92、【104327】(单项选择题)总体参数的置信区间是由样本统计量的点估计值加减 ( )得到的。A.样本统计量的抽样标准差B.总体标准差C.边际误差D.置信水平的临界值【答案】C93、【104328】(单项选择题)估计量是指( )。A.用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C.总体参数的名称D.总体参数的具体数值【答案】A若X1,X2,…Xn为抽自X若X1,X2,…Xn为抽自X~N(E°2)的一个样本,总体方差。2)°A.X匚B.";C.x-t?C.x-t?sn4

nsn4x—t:; D.2%nD.【答案】D95、【104330】(单项选择题)总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以( )。A.样本均值的抽样标准差B.样本标准差C.样本方差D.总体标准差【答案】A96、【104332】(单项选择题)当置信水平一定时,置信区间的宽度( )。A.随着样本容量的增大而减小B.随着样本容量的增大而增大C.与样本容量的大小无关D.与样本容量的平方根成正比【答案】A97、【104333】(单项选择题)95%的置信水平是指( )。A.总体参数落在一个特定的样本所构造的区间内的概率为 95%B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为 95%C.总体参数落在一个特定的样本所构造的区间内的概率为 5%D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为 5%【答案】B98、【104334】(单项选择题)估计一个正态总体的方差使用的分布是( )。A.正态分布B.t分布不分布F分布【答案】C99、【104335】(单项选择题)当正态总体的方差未知时,且为小样本条件下,估计总体均值使用的是分布是( )。A.正态分布t分布C.’分布D.F分布【答案】B100、[104338】(单项选择题)对于非正态总体,在大样本条件下,估计总体均值使用的是分布是( )。A.正态分布B.t分布*分布F分布【答案】A101、[104339】(单项选择题)使用正态分布估计总体均值时,要求( )。A.总体为正态分布B.总体为非正态分布C.总体为正态分布但方差未知D.总体为正态分布且方差已知【答案】D102、[145018】(单项选择题)当正态总体的方差已知时,且为小样本条件下,估计总体均值使用的分布是( )。A.正态分布B.t分布C.7分布D.F分布【答案】A103、[150769】(单项选择题)当正态总体的方差未知时,且为大样本条件下,估计总体均值使用的分布是( )。A.正态分布B.t分布7分布F分布【答案】A[104348](简答题)参数估计的方法有哪些?【答案】参数估计的方法有点估计和区间估计两种。点估计就是用样本统计量的某个取值直接作为总体参数的估计值。区间估计是在点估计的基础上,给出总体参数的估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。[104349](简答题)点估计的方法通常有哪些?【答案】点估计就是直接以样本统计量的某个取值作为总体参数的估计值,包括矩法和极大似然法。矩法估计的基本思想:在总体各阶矩存在的条件下,用样本的各阶矩去估计总体相应的各阶矩,用样本矩的相应函数估计总体矩的函数。极大似然估计的基本思想是:设总体含有待估参数8,它可以取很多值,我们要在日的一切可能取值之中选出一个使样本观测值出现的概率最大的那个 6值作为的估计(记为有),并称©为日的极大似然估计。106、[104343】(填空题)在对总体均值进行估计时,把要估计的总体均值称之为,把用来估计总体均值的样本均值称作,把样本均值的具体观察值称为。【答案】待估参数;估计量;估计值[104344】(填空题)一个由n=50的随机样本,算得样本均值x=32,总体标准差为6.总体均值卜的95%置信区间为。【答案】32.1.66[104345】(填空题)如果估计量百与&相比满足,我们称其是比*2更有效的一个估计量。D(7?):::D(^2)

[104346】(填空题)如果估计量在满足,我们称g是无偏的一个估计量。【答案】E(@)=tN是总体均值。[122755】(计算题)一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信的服务满意情况。调查人员随机访问了 30名去该电信营业厅办理业务的大客户,发现受访的大客户中有 9名认为营业厅现在的服务质量比两年前好。试在 95%的置信水平下对大客户中认为营业厅现在的服务质量比两年前好的比率进行区间估计。 (查概率表可知,.-0.05=1.96【答案】解:n=30,z- =1.96,这是一个求某一属性所占比率的区间估计问题。已知 型2 根据抽样结果计算出的样9?二一=30%本比率为 30 。计算得?(1-?)=30%?(1-?)=30%1.96 30%(1一30%)30二(13.60%,46.40%)111、[145012】(计算题)根据以往经验,居民家庭人口数服从正态分布,其方差为 2」。现从某地区随机抽取60户居民家庭,测得样本的平均家庭人口数为 3.75人,试以95%的可靠程度构造该地区平均居民家庭人口数的置信区间。 (结果保留两位小数)(查概率表可知,Z0.05-1.96【答案】解:已知家庭人口数X~N(R2.1),x=3.75(人),n=60(户),1一仪=0.95,口=0.05,2^=1.962 (可查正态分布表)"cr_."cr_.(x-z、1 ,x-z二.21n2,2.1.60XX12)二(3.75-1.962」,3.751.96

,60即以95%的可靠程度估计该地区平均居民家庭人口数在 3.38人至4.12人之间。第七章假设检验[104354】(单项选择题)假设检验按原假设和备择假设的形式可分为( )。A.左侧检验和右侧检验B.正向检验和反向检验C.双侧检验和单侧检验D.正态检验和非正态检验【答案】C[104355】(单项选择题)双侧检验的特点是( )。A.它有两个接受域B.它有两个临界值

C.它有一个拒绝域D.它可能有两个接受域【答案】B114、114、[104356】(单项选择题)A.拒绝原假设B.不能拒绝原假设匚MSAF= :::F-,k-1,n-k当MSE8 '时,则(C.接受原假设D.不能确定【答案】C115、[104357】(单项选择题)所谓a错误指的是( )。A.原假设为假,接受原假设B.原假设为假,接受替换假设C.原假设为真,拒绝替换假设D.原假设为真,拒绝原假设【答案】D[104358】(单项选择题)所谓。错误指的是( )。A.原假设为假,接受原假设B.原假设为假,接受替换假设C.原假设为真,拒绝替换假设D.原假设为真,拒绝原假设【答案】A[104359】(单项选择题)若假设形式为H0:N"0,H1:N<A,当随机抽取一个样本,其均值大于外,则()。A.肯定不拒绝原假设,但有可能犯第I类错误B.有可能不拒绝原假设,但有可能犯第I类错误C.有可能不拒绝原假设,但有可能犯第n类错误D.肯定不拒绝原假设,但有可能犯第n类错误【答案】D[104360】(单项选择题)假定总体服从正态分布,下列适用 t检验统计量的场合是()。A.样本为大样本,且总体方差已知B.样本为小样本,且总体方差已知C.样本为小样本,且总体方差未知D.样本为大样本,且总体方差未知【答案】C119、[1043611(单项选择题)某一贫困地区所估计的营养不良人数高达 20%,然而有人认为实际上比这个比例还要高,要检验说法是否正确,则假设形式为( )。H0:"02Hl:.L"O2H0:」=0.2,H1:"-0.2CH0:H>0.3,Hi:N<0.3DHo:P<0.3,Hi:P>0.3【答案】A[104363】(单项选择题)在双侧检验中,如果将两侧的面积之和定义为 P值,则对于给定的显著性水平u,拒绝原假设的条件是( )。PA.2B.P±C.P二2D.P【答案】D121、[104364】(单项选择题)在假设检验中,如果所计算出的P值越小,则说明( )。A.不利于原假设的证据越强B.不利于原假设的证据越弱C.不利于备择假设的证据越强D.不利于备择假设的证据越弱【答案】A122、[104365】(单项选择题)对于给定的显著性水平a,拒绝原假设的准则是( )。P=:P;二P;DP=a=0【答案】B[104374](简答题)假设检验依据的基本原理是什么?【答案】假设检验依据的基本原理是小概率原理。所谓小概率原理是指,若一个事件发生的概率很小,在一次试验中就几乎是不可能发生的。根据这一原理,如果在试验中很小概率的事件发生了,我们就有理由怀疑原来的假设是否成立,从而拒绝原假设。[104375](简答题)什么是假设检验中的显著性水平?【答案】 利用样本信息对原假设进行推断有犯错误的可能。假设检验中的显著性水平是指:当原假设为正确时却把它拒绝了的概率,实际就是统计决策中所面临的风险。显著性水平用仪表不。[104376](简答题)为什么在点估计的基础上还要引进区间估计?区间估计中各相关要素的含义和作用是什么?【答案】 点估计的方法就是用一个确定的值去估计未知参数,表面看起来很精确,实际上把握程度不高。因为估计量是来自一个随机抽取的样本,总是带有随机性或偶然性,样本估计量&恰好等于10的可能性是很小的;而且点估计并未给出估计精度和可信程度。 但估计日在某一小区间内,并给出估计的精度和可靠度,则把握程度就高多了。这种估计总体参数在某一区间内的方法称作区间估计。如果用数学语言来描述区间估计, 则应该是这样的:设X1,X2「'Xn

是抽自密度为f(x£)的一个样本,对于给定的0<1,如能求得统计量e和8,使P(gwewS=1-a,则称(e5为日的置信度为1—的置信区间,它表达了区间估计的准确性或精确性;0和电均为样本估计量的函数,分别称作置信下限和置信上限; 1«称作置信度或信度或置信概率或置信水平或概率保证程度,它是区间估计可靠性的概率; a称为显著性水平,它表达了区间估计不可靠的概率。总之,区间估计可以克服点估计的不足,因而实际应用意义较大。[104377](简答题)某市调查职工平均每天用于家务劳动的时间。该市统计局主持这项调查的人认为职工用于家务劳动的时间不超过 2小时。随机抽取400名职工进行调查的结果2a=0.05)为:x=1.8小时,s2=1.44a=0.05)【答案】解一:Ho:」:_2 H1:■'-:::2,故t--=z:,=1.645_x-0一:1.8-2J..225--2.5a=0.05当n故t--=z:,=1.645_x-0一:1.8-2J..225--2.5拒绝域t工"%々5<—1.645拒绝H0,即可以接受调查主持人的看法。解二:由于n=225为大样本,可用z统计量。H0:口_2,H1:口.2za=1.645Z<-^1.8-2X-0=-2.51.8-2X-0=-2.5落入接受域,即调查结果支持该调查人的看法。[104378](简答题)简述假设检验的基本步骤。【答案】(1)建立原假设和备择假设。(2)确定检验统计量,并确定该统计量的分布情况, 然后依据样本信息计算该检验统计量的实际值。(3)设定检验的显著性水平并确定临界值。(4)将检验统计量的实际值与临界值进行比较,做出是否拒绝原假设的决策。[104369】(填空题)通常把汽错误称为一类错误或;把「错误称为二类错误或。【答案】弃真错误;取伪错误[104370】(填空题)假设检验中确定的显著性水平越高,原假设为真而被拒绝的概率就。【答案】越高

检验一个正态总体的方差时所使用的分布是研究者想收集证据予以支持的假设通常称为130、[104371】(填空题)检验一个正态总体的方差时所使用的分布是研究者想收集证据予以支持的假设通常称为【答案】片分布131、[104372】(填空题)【答案】备择假设132、[122756】(计算题)有一个组织在其成员中提倡通过自修提高水平,目前正考虑帮助成员中还未曾高中毕业者通过自修达到高中毕业的水平。该组织的会长认为成员中未读完高中的人等于25%,并且想通过适当的假设检验来支持这一看法。他从该组织成员中抽选 200人组成一个随机样本,发现其中有 42人没有高中毕业。试问这些数据是否支持这个会长的看法?,a=1.96(口H.05,查概率表可知, 『2 )【答案】解:42上=0.21 p0=0.25200H0:p=0.25,H1:p=0.25?-p00 =」.306p0(1-团)n=1.96=1.96由于,故接受H°,可以认为调查结果支持了该会长的看法。由于第八章列联分析133、[104382】(填空题)列联表经常用到的品质相关系数有、列联相关系数、V相关系数。【答案】中相关系数134、[145090】(计算题)根据下表,请检查含氟牙膏是否同儿童的龈齿有关。 (G=°.05,查概率表可知,x20.05^)=3.8415)表6-2 使用含氟牙膏与一般牙膏儿童的胡患率牙膏类型患胡齿人数调查人数%含氟牙膏70(76.67)130(123.33)20035.00一般牙膏45(38.33)55(61.67)10045.0011518530038.33【答案】H0:使用含氟牙膏和一般牙膏儿童龈患率相等H1:使用含氟牙膏和一般牙膏儿童斜患率不等

2_70-76.672 130-123.332 45-38.332 55-61.672一76.67 123.33 38.33 61.67=2.82H0,尚不能认为使用含氟牙膏比使用一般炉=2.82<『0.05(1)=3.8415,按H0,尚不能认为使用含氟牙膏比使用一般牙膏儿童的制患率低。第九章方差分析rnj 2SSEGv(Xj-Xi)2[104384】(单项选择题) n反映了( )的差异程度。A.不同因素水平之间B.由不同因素水平造成的各个总体之间C.由不同因素水平造成的总体内部D.由于抽样误差引起的总体内部【答案】D[104385】(单项选择题)在无交互作用的双因素方差分析中,因素 A有r个水平,因素B有s个水平,则对于检验因素A的FA统计量( )。FaFaA.FaB.FaC.-SSE_SSA(r-1)"SSE(r-1)(s-1)_SSA(r_-1)"SSB(s-1)D.它服从自由度为(r口的一1)的f分布【答案】B[104386】(单项选择题)在单因素方差分析中,f统计量分子、分母的自由度分别为( )。r,nr-1,nTn-1,r-1r-1,n-r【答案】D138、[104387】(单项选择题)在单因素方差分析中,若 SSA=10,SSE=10,n=10,r=5,则f值为( )。A.5B.1.25C.1.5D.2【答案】B139、[104388】(单项选择题)方差分析的主要目的是判断( )。

A.各总体是否存在方差B.各样本数据之间是否有显著差异C.分类型自变量对数值型因变量是否显著D.分类型因变量对数值型自变量是否显著【答案】C140、[104389】(单项选择题)方差分析是检验( )。A.多个总体方差是否相等的统计方法B.多个总体均值是否相等的统计方法C.多个样本方差是否相等的统计方法D.多个样本均值是否相等的统计方法【答案】BD.多个样本均值是否相等的统计方法【答案】B141、[104390】(单项选择题)A.因子B.方差C.处理D.观测值【答案】A142、[104391】(单项选择题)A.正态分布B.非正态分布C.任意分布D.F分布【答案】A143、[104392】(单项选择题)A.’2统计量t统计量z统计量在方差分析中,所要检验的对象称为(在方差分析中,假定每个总体都服从(在方差分析中,用于检验的统计量是(D.F统计量【答案】D[104401](简答题)什么是方差分析?【答案】方差分析是研究分类自变量对数值因变量的影响。虽然希望研究均值,但在判断均值之间是否有差异时借助的是方差这个统计量,还表示通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。[145008](简答题)简述应用方差分析的条件。【答案】应用方差分析要求符合两个条件:(1)各个水平的观察数据,要能看作是从服从正态分布的总体中随机抽取的样本。(2)各组观察数据是从具有相同方差的相互独立的总体中抽得的。146、[104395】(填空题)在单因素方差分析中,总离差平方和 Q、组间离差平方和Q2与误差平方和Q1之间的关系式为。

【答案】Q=QQ2【答案】Q=QQ2[104396】(填空题)在无交互作用的双因素方差分析中,总离差平方和 SST可以分解为SSA和三项。【答案】SSB,SSE[104397】(填空题)在无交互作用的双因素方差分析中,若因素 A有5个水平,因素B有4个水平,则SST的自由度为,SSA勺自由度为,SSE的自由度为。【答案】19;4;12149、【104398149、【答案】系统误差[104403】(计算题)为研究食品的包装和销售地区对销售量是否有影响,在三个不同地区中用三种不同包装方法进行销售,表三是一周的销售量数据:表二:方法BiB2B3A457530A505040A3356550用Excel得出的方差分析表如下:差异源SSdfMSfP-valueFcrit行(地区)22.2222211.11110.07270.93116.9443列(包装)955.55562477.77783.12730.15226.9443误差611.11114152.7778总计1588.8898取显著性水平口=0.05,检验不同地区和不同包装方法对该食品的销售量是否有显著影响。【答案】解:首先提出如下假设:因素AH0:H=M2=也,地区对销售量没有影响H1:凡氏内不全相等,地区对销售量有影响因素B:H0:科=2 ,包装对销售量没有影响H1:科,%E不全相等,包装对销售量有影响由于FA=0.0727<Fa=6.9443=0.0727,所以接受原假设H0,这说明地区对销售量没有显著影响。由于Fb=3.1273<Fa=6.9443=3.1273,所以接受原假设H0,这说明包装对销售量没有显著影响。

直接用P-value进行分析,结论也是一样的。[193498】(计算题)某厂商想了解销售地点和销售时间对销售量的影响。它在六个试验点Ai(i=1,2,…⑹进行销售,并记录了五个时期Bj(j=1,2,…,5)的销售量,对记录的数据处理后得到表一,试在口二0.05下分析不同地点和不同时间对销售量的影响是否显著 (不存在交互作用)(查概率表可知:F0.05(5,20)=2.71 F0.05(4,20)=2.87, )o表一方差来源 平方和 自由度因素A 145.9 5因素B 50.0 4误差 46.3 20总和 242.2 29【答案】解:假设因素A(销售地点)的第i个水平对销售量的效应为 5。=1,2,…⑹。设因素b(销售时间)的第j个水平对销售量的效应为 Pj(j=1,2,…,5)。则建立假设:fH01:d=%=03=04=佻=06=0:H11:口。=1,2,…,6)不全为0』H02:目=隹=口=%=艮=。:h12:Pj(j=1,2,…,5)不全为0根据已知数据Q,Qi,Q2,Q3和各自的自由度S2Q—=29.18 S2=逛=12.5 S32Q—=2.315可计算5 ,4,20,29.182.315=12.629.182.315=12.6匚12.5一Fb= =5.42.315则将结果列入方差分析表,见表二。查表得:Fo.05(5,20)=2.71,Fo.05(4,20)=2.87因为FA=12.6>F0.05(5,20)=2.71,所以拒绝H01,认为销售地点对销售量有显著影响。因为Fb=5.4aF0.05(4,20)=2.87,所以拒绝H02,认为销售时间对销售量有显著影响。表二1方差F因素A145.9529.1812.6因素B50.0412.55.4误差46.3202.315总和242.229第十章相关与回归152、[104404】(单项选择题)数( )。A.0「二1在回归直线?=a+似中,若b<o,则x与y之间的相关系B.-1「0r<-1r-1【答案】B153、[104406】(单项选择题)的是( )。A?=20-0.63xB?=-64+1.39xC?=89-0.65xD?=150-15x【答案】B154、[104407】(单项选择题)A.拟合程度越低若x与y之间存在负相关关系,则下列回归方程中肯定错误2拟合优度R2的值越小,则回归方程( )。B.拟合程度越高C.拟合程度有可能高,也有可能低D.用回归方程进行预测越准确【答案】A155、[104408】(单项选择题)AZ(yi-Y)B.Z(Yi-Y?)2CZ(Y?-Y)2DE(xi-X)2【答案】C156、[104409】(单项选择题)确的是( )。A.估计标7B误差Sy=0B.回归系数b=0C.相关系数r=02D.判定系数R=0【答案】A157、[104410】(单项选择题)回归平方和指的是( )。如果变量x与变量y之间没有线性相关关系,则下列不正在相关分析中,正确的是( )。A.相关系数既可测定直线相关,又可测定曲线相关B.相关系数可以测定直线相关,但不可测定曲线相关

C.相关系数可以测定曲线相关,但不可测定直线相关D.相关系数既不能测定直线相关,又不能测定曲线相关【答案】B158、[104411】相关属于( )。A.显著相关B.高度相关158、[104411】相关属于( )。A.显著相关B.高度相关C.正相关D.负相关【答案】C159、[104412】A.0<r<11<r<1r:二1D.-二;r;二【答案】B(单项选择题)(单项选择题)受教育程度与收入水平之间的相关系数为 0.6835,则这种相关系数的取值范围可表示为(160、[104416】(单项选择题)当回归直线?=a+bx与x轴平行时,则x与y之间的简单相关系数( )0「二1rr=1r=0【答案】D161、[104417161、[104417】(单项选择题)现根据样本数据建立的单位产品成本(元)对产量(千件)的一元线性回归方程为?=7°M.8x,以下说法错误的是(A.产量每增加1千件,单位成本平均降低4.8元B.产量为1千件时,单位成本为65.2元C.产量每增加1千件,单位成本平均增加4.8元D.单位成本与产量之间存在着负相关【答案】C162、[104418】(单项选择题)下列表述中肯定错误的是(A.?=60-4x,r=-0.4239B.?-Y55x,r=0.7628C.?--56-4x,r=@6537D.?=40-5x,r=0.63873.65说明( )。163、[104420】(单项选择题)线性回D3方程^=36.85-3.65%3.65说明( )。X平均增加一个单位,Y会减少365个单位X平均增加一个单位,Y肯定会减少3.65个单位X每增加一个单位,Y肯定会减少3.65个单位X每增加一个单位,Y平均会减少3.65个单位【答案】D164、[104421】(单项选择题)一个样本由1000名职工组成,职工的收入水平与受教育程度的相关系数为0.83,这说明( )。A.职工收入水平与受教育程度有高度的正相关关系B.有83%的较高受教育者有较高的收入C.有83%的高收入者具有较高的受教育程度D.当中只有83%的人受教育程度与收入水平有关【答案】A165、[104422】(单项选择题)若两个变量的相关系数为0,则下列说法正确的是( )。A.两个变量没有相关关系只有函数关系B.两个变量还可能有非线性关系C.两个变量还可能有线性关系D.两个变量没有任何关系【答案】B[122752】(单项选择题)在回归直线?=a+bx中,回归系数不b表示( )。A.当x=0时y的平均值x变动一个单位时y的变动总量x变动一个单位时y的平均变动量y变动一个单位时x的平均变动【答案】C[104432](简答题)如何划分变量之间的相关关系?【答案】相关关系可以按照相关程度大小、相关关系的变动方向、相关形式和涉及变量的数量等因素划分。(1)按相关程度的大小划分可以将相关关系可分为完全相关、不完全相关和不相关。 完全相关在相关图上表现为所有的观察点都落在同一条直线上。这种情况下,相关关系实际上是函数关系;不相关是指变量之间不存在联系;不完全相关关系介于不相关和完全相关之间。(2)按相关关系的变动方向划分为正相关和负相关。 正相关指两个变量之间的变化方向一致,都是呈增长或下降的趋势。负相关指两个变量之间变化方向相反,此消彼长。x发生变动,因变(3)x发生变动,因变量y值随之发生大致均等的变动, 从图像上近似地表现为直线形式。 非线性相关中,自变量x值发生变动,因变量y也随之发生变动,这种变动不是均等的。曲线相关在相关图上的分布,表现为抛物线、双曲线、指数曲线等非直线形式。(4)按变量多少划分可分为单相关、复相关。简单相关研究两个变量之间的相关关系。复相关涉及三个或三个以上因素的相关关系。[104433](简答题)试回答相关系数有哪些性质。【答案】一般来说,我们需要看相关系数的符号和绝对值大小。(1)观察相关系数的符合:「>0表明两变量为正相关;r<。表明两变量为负相关。(2)相关系数的取值范围在一1和+1之间,即:TMrM1。(3)相关系数r的绝对值越接近于1,表示变量之间的相关程度越高;越接近于 °,表示变量之间的相关程度越低。如果r=1或—1,则表示两个现象完全线性相关。如果r=0,则表示两个现象完全不相关。一般认为,r<0.3表示变量之间的线性相关关系较弱; 0.8Mr<1表示变量之间高度相关。但不能完全依据相关系数的大小来判断相关关系的强弱。[104434](简答题)试回答相关分析与回归分析的区别。【答案】相关分析描述的是变量之间的相关性。回归分析是一种应用极为广泛的数量分析方法,它用回归方程的形式描述和反映变量间的数量变换规律。对比相关分析,回归分析研究变量之间相互关系的具体形式,能从一个变量的变化来推测另一个变量的变化情况,为预测提供可能。回归分析同相关分析的另一个区别是:相关分析假设变量之间的地位是等同的,不对变量进行区分;而在回归分析中则把变量区分为自变量和因变量。二者的地位不同,自变量通常被假设为非随机变量。[104428】(填空题)在线性回归分析中,只涉及一个自变量的回归称作;涉及多个自变量的回归称作。【答案】一元线性回归;多元线性回归171、[104429】(填空题)若变量x与y之间不存在线性相关关系,则 r=;若变量x与y之间完全相关,则r=。【答案】0;-1[104430】(填空题)若平均工资(y,单位:元)与劳动生产率(x,单位:千元/人)的直线回归方程为:?=10+110x,则这个方程意味着当劳动生产率为1000元/人时,平均工资为元,当劳动生产率增加1000元/人时,平均工资增加元。【答案】120;110[104431】(填空题)一般认为,r小于表示变量之间的线性相关关系较弱,父「<1表示变量之间高度相关。【答案】。巴0.8174、[104435】(计算题)下表给出Y对X一元线性回归的结果:离差来源平方和自由度均方和回归平方和残差平方和总平方和659506735024试计算:(1)该回归分析中的样本容量是多少?(2)计算残差平方和。(3)回归平方和和残差平方和的自由度分别是多少?(4)计算判定系数。【答案】(1)24+1=2567350—65950=1400(3)回归平方和的自由度是1,残差平方和的自由度是 23(4)65950,67350=0.9792175、[104436】(计算题)在计算一元线性回归方程时,得到如下结果:离差来源平方和自由度均方和回归平方和残差平方和100.3525总平方和2355.87试计算:(1)该回归分析中的样本容量是多少?(2)试计算回归平方和。(3)回归平方和和总平方和的自由度分别是多少?(4)回归均方和和残差均方和。(5)计算判定系数。【答案】(1)25+2=27(2)2355.87」00.35=2255.52(3)回归平方和的自由度是 1,总平方和的自由度是 26(4)回归均方和是及55.52—2255.52,残差均方和是皿取昨4.0142255.522355.87=0.9574⑸,176、[104437](计算题)下表为1978-2008年来我国农民生活消费支出与纯收入的数据:

年份生活消费支出Y(元)纯收入X(元)年份生活消费支出Y(元)纯收入X(元)1978116.1133.619941016.812211979134.5160.219951310.41577.71980162.2191.319961572.11926.11981190.8223.419971617.22090.11982220.2270.119981590.321621983248.3309.819991577.42210.31984273.8355.320001670.12253.41985317.4397

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论