统计学试题库及试题库答案_第1页
统计学试题库及试题库答案_第2页
统计学试题库及试题库答案_第3页
统计学试题库及试题库答案_第4页
统计学试题库及试题库答案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

...wd......wd......wd...统计学题库及题库答案题库1一、单项选择题〔每题2分,共20分〕1、调查时间是指〔〕A、调查资料所属的时间B、进展调查的时间C、调查工作的期限D、调查资料报送的时间2、对某城市工业企业未安装设备进展普查,总体单位是〔〕。A、工业企业全部未安装设备B、企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业企业3、比照分析不同性质的变量数列之间的变异程度时,应使用〔〕。A、全距B、平均差C、标准差D、变异系数4、在简单随机重复抽样条件下,假设要求允许误差为原来的2/3,那么样本容量〔〕A、扩大为原来的3倍B、扩大为原来的2/3倍C、扩大为原来的4/9倍D、扩大为原来的2.25倍5、某地区组织职工家庭生活抽样调查,职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选〔〕。A、576户B、144户C、100户D、288户6、当一组数据属于左偏分布时,那么〔〕A、平均数、中位数与众数是合而为一的B、众数在左边、平均数在右边C、众数的数值较小,平均数的数值较大D、众数在右边、平均数在左边7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,那么末组的组中值为〔〕。A、520B、510C、500D、4908、用组中值代表组内变量值的一般水平有一定的假定性,即〔〕A、各组的次数必须相等B、变量值在本组内的分布是均匀的C、组中值能取整数D、各组必须是封闭组9、是来自总体的样本,样本均值服从〔〕分布A、B.、C.、D、10、测定变量之间相关密切程度的指标是〔〕A、估计标准误B、两个变量的协方差C、相关系数D、两个变量的标准差二、多项选择题〔每题2分,共10分〕1、抽样推断中,样本容量的多少取决于〔〕。A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样组织形式2、抽样估计中的抽样误差〔〕。A、是不可防止要产生的B、是可能通过改进调查方式来消除的C、是可以事先计算出来的D、只能在调查完毕后才能计算的E、其大小是可能控制的3、在什么条件下,加权算术平均数等于简单算术平均数〔〕。A、各组次数相等B、各组变量值不等C、变量数列为组距数列D、各组次数都为1E、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有〔〕A、Z检验法B、t检验法C、检验法D、F检验法E、几何检验法5、指出以下分组哪些是属性分组〔〕A、人口按性别分组B、企业按产值多少分组C、家庭收入水平分组D、在业人员按文化程度分组E、产品按质量等级分组三、填空题〔每空2分,共20分〕1、统计分组的关键问题是正确选择与划分。2、对某村6户居民家庭共30人进展调查,所得的结果是,人均收入400元,其离差平方和为480,那么标准差是,标准差系数是。3、抽样推断的主要内容有和两个方面。4、假设检验中的两类错误分别称为和。5、相关系数r的取值范围是到。四、简答题〔每题5分,共20分〕1、众数、中位数、均值的特点与应用场合是什么2、什么是假设检验的P值如何根据P值作出假设检验的结论3、为什么要计算标准差系数4、单因素方差分析的步骤是什么五、计算题〔每题10分,共30分〕1、某班学生统计学原理考试成绩次数分布如下:要求:根据上表资料,计算相应的的数字,填入表中空格。2、根据有关调查,北京市每天每个家庭上网的时间服从正态分布。现从北京市家庭中随机抽取16户,测得平均每天每户家庭上网时间为4.5小时。试在0.05的显著性水平下判断北京市家庭上网的时间是否有显著提高()3、从100家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:n=100,∑X=10,∑Y=20,∑X2=1.5,∑Y2=50,∑XY=3。根据以上数据,求出利润额对销售额的直线回归方程。题库2一、单项选择题〔每题2分,共20分〕1、统计学自身的开展,沿着两个不同的方向,形成〔〕A、描述统计学与理论统计学B、理论统计学与推断统计学C、理论统计学与应用统计学D、描述统计学与推断统计学2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进展调查,这种调查方式是〔〕A普查B典型调查C抽样调查D重点调查3、用组中值与次数求坐标点连接而成的统计图是〔〕A直方图B条形图C曲线图D折线图4、离中趋势指标中,最容易受极端值影响的是〔〕A极差B平均差C标准差D标准差系数5、一组数据的偏态系数为1.3,说明该组数据的分布是〔〕A正态分布B平顶分布C左偏分布D右偏分布6、抽样平均误差说明抽样指标与总体指标之间的〔〕A实际误差B平均误差C实际误差的平方D允许误差7、假设检验是检验〔〕的假设是否成立。A样本方差B总体指标C样本方差D样本平均数8、用组中值代表组内变量值的一般水平有一定的假定性,即〔〕A、各组的次数必须相等B、变量值在本组内的分布是均匀的C、组中值能取整数D、各组必须是封闭组9、总体平均数的假设检验方法,在小样本,且方差未知时,通常采用〔〕A、Z检验法B、t检验法C、检验法D、F检验法10、年劳动生产率x〔千元〕和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均〔〕A、增加70元B、减少70元C、增加80元D、减少80元二、多项选择题〔每题2分,共10分〕1、概率抽样调查〔〕A、是一种非全面调查B、其目的是根据抽样结果推断总体数量特征C、它具有经济性、时效性、准确性和灵活性等特点D、其调查单位是随机抽取的E、抽样推断的结果往往缺乏可靠性2、常用的样本指标有〔〕A样本平均数B样本成数C抽样误差D样本方差E标准差3、在什么条件下,加权算术平均数等于简单算术平均数〔〕。A、各组次数相等B、各组变量值不等C、变量数列为组距数列D、各组次数都为1E、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有〔〕A、Z检验法B、t检验法C、检验法D、F检验法E、几何检验法5、中位数是〔〕A由标志值在变量数列中所处的位置决定的B根据标志值出现的次数决定的C总体单位水平的平均值D总体一般水平的代表值E不受总体中极端数值的影响三、填空题〔每空2分,共20分〕1、一个完整的统计工作过程可以划分为_____、____、_____、_______四个阶段。2、当变量数列中算术平均数大于众数时,这种变量数列的分布呈_____分布;反之,算术平均数小于众数时,变量数列的分布呈______分布。3、评价点估计量好坏的标准有_____、______和______。4、相关系数,用于反映______条件下,两变量相关关系的密切程度和方向的统计指标。四、简答题〔每题5分,共20分〕1、离中趋势的指标有哪些〔至少列出三个〕,它们之间有何区别2、影响抽样误差的因素有哪些3、相关分析和回归分析的联系与区别4、假设检验一般有哪些步骤五、计算题〔每题10分,共30分〕1、某班级分甲、乙两个学习小组,在统计学考试中,甲小组平均成绩75分,标准差11.5,乙小组成绩资料如表:成绩〔分〕人数〔人〕60以下60-7070-8080-9090以上25864合计25〔1〕计算乙小组的平均成绩。〔2〕以尽可能准确的方法比较两小组平均成绩的代表性。2、根据历史的统计,某种产品的次品率为2%。如果要求置信水平为95.45%的置信区间,并要求允许误差不超过4%,应抽取多大的样本〔〕3、从100家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:n=100,∑X=10,∑Y=20,∑X2=1.5,∑Y2=50,∑XY=3。根据以上数据,〔1〕求出利润额对销售额的直线回归方程;〔2〕预测当销售额为0.5亿元时,利润额在置信度为95.45%的预测区间〔预测标准误差为0.05亿元〕。题库3一、单项选择题〔每题2分,共20分〕1.某地进展私营商业企业经营情况调查,那么调查对象是〔〕A该地所有商业企业B该地所有私营商业企业C该地每一私营商业企业D该地每一商业企业2.统计分组的关键问题是〔〕A确定分组标志和划分各组界限B确定组距和组数C确定组距和组中值D确定全距和组距3用组中值与次数求坐标点连接而成的统计图是〔〕A直方图B条形图C曲线图D折线图4.离中趋势指标中,最容易受极端值影响的是〔〕A极差B平均差C标准差D标准差系数5.所谓大样本是指样本单位数在〔〕及以上。A30个B50个C80个D100个6.抽样指标与总体指标之间抽样误差的可能范围是〔〕A抽样平均误差B抽样极限误差C区间估计范围D置信区间7.原假设为真,我们却拒绝它的概率为〔〕A1-BC1-D8.假设检验是检验〔〕的假设是否成立。A样本方差B总体指标C样本方差D样本平均数9.下面的函数关系是〔〕A销售人员测验成绩与销售额大小的关系B圆周的长度决定于它的半径C家庭的收入和消费的关系D数学成绩与统计学成绩的关系10.年劳动生产率x〔千元〕和工人工资(元)y=30+70x,这意味着年劳动生产率每提高1千元时,工人工资平均〔〕A增加70元B减少70元C增加100元D减少100元二、多项选择题〔每题2分,共10分〕1.询问调查法有以下几种〔〕A访问调查B邮寄调查C调查D实验法E观察法2.某单位100名职工按工资额分为300以下、300-400、400-600、600-800、800以上等五个组。这一分组〔〕A是等距分组B是异距分组C末组组中值为800D相邻的组限是重叠的E某职工工资600元,应计在600-800元组内3.在各种平均数中,不受极端值影响的平均数是〔〕A算术平均数B调和平均数C中位数D几何平均数E众数4.在总体1000个单位中,抽取20个单位进展调查,以下各项正确的选项是〔〕A样本单位数是20个B样本个数是20个C一个样本有20个单位D样本容量是20个E是一个小样本5.以下哪些变量之间的关系为相关关系〔〕A家庭收入与消费支出关系B圆的面积与它的半径关系C广告支出与商品销售额关系D单位产品成本与利润关系E在价格固定情况下,销售量与商品销售额关系三、填空题〔每空2分,共20分〕1、统计学按方法的构成可以分________________与_________________。2、组距式变量数列,根据各组的组距是否相等可以分为________________和_________________。3、直方图是用__________________的宽度和高度来表示频数分布的图形。4、标准差系数是______________与________________之比。5、常用的总体指标有_______________、_____________、______________。四、简答题〔每题5分,共20分〕1、统计调查方案包括有哪几个方面的内容2、数据的计量尺度分几类它们之间有什么区别与联系3、标准差与标准差系数各是什么含义衡量数据的离散程度时,如何选择4、必要的抽样数目受哪些因素的影响五、计算题〔每题10分,共30分〕2006年某月份甲、乙两农贸市场某农产品价格和成交额、成交量资料如下:品种价格〔元/斤〕甲市场成交额〔万元〕乙市场成交量〔万斤〕甲1.21.22乙1.42.81丙1.51.51合计-5.54试问哪一个市场农产品的平均价格高并说明理由。2、某食品厂用自动装袋机包装食品,每袋标准重量为50克,每隔一定时间抽取包装袋进展检验。现抽取10袋,测得其重量为〔单位:克〕;49.8,51,50.5,49.5,49.2,50.2,51.2,50.3,49.7,50.6假设每袋重量服从正态分布,每袋重量是否符合要求。〔=0.05,〕3、某10户家庭样本具有以下收入和食品支出〔元/天〕数据:收入x20303240455356586574支出y79811121413151716试求出以最小二乘法计算的回归方程,并预测当x=5时y的值。题库4一、单项选择题〔每题2分,共20分〕1、.人口普查的调查单位是〔〕。A.全部人口B.每个人C.全部人口数D.每户家庭;2、将由显著性水平所规定的拒绝域平分为两局部,置于概率分布的两边,每边占显著性水平的二分之一,这是〔〕。A.、单侧检验B、双侧检验C、右单侧检验D、左单侧检验3、产品质量的检查应该采用〔〕。A、重点调查的方法;B、典型调查的方法;C、普查的方法;D、抽样检验的方法;4某组向上累计次数表示()A、大于该组上限的次数有多少;B、大于该组下限的次数有多少;C、小于该组上限的次数有多少;D、小于该组下限的次数有多少;5、对正态总体均值进展区间估计时,其它条件不变,置信水平越大,那么置信上限与置信下限的差〔〕A、越大B、越小C、不变D、不确定6、在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,那么样本容量〔〕。A.扩大为原来的4倍B.扩大为原来的2倍C.缩小为原来的二分之一D.缩小为原来的四分之一7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,那么职工月平均收入的离散程度()A、甲类较大B、乙类较大C、两类一样D、不确定8、所谓显著水平是指〔〕A、原假设为真时将其承受的概率;B、原假设不真时将其舍弃的概率;C、原假设为真时将其舍弃的概率;D、原假设不真时将其承受的概率;9、在一元线性回归方程中,b表示()A、当x增加一个单位时,y增加a的数量;B、当y增加一个单位时,x增加b的数量;C、当x增加一个单位时,y的平均增加量;D、当y增加一个单位时,x的平均增加量.10.在其他条件一样的前提下:不重复抽样误差〔〕A、大于重复抽样误差B、小于重复抽样误差C、等于重复抽样误差D、与重复抽样误差何者更大无法判定二、多项选择题〔每题2分,共10分〕1.频率是〔〕A概率B各组次数C非负数D自然数E各组的次数占总体单位数的比重2.以下的表述正确的有〔〕A.总体是唯一确定的,样本是随机的B.总体指标是确定不变的C.抽样指标是样本量的函数D.抽样指标也是随机变量E.抽样指标是确定不变的3.假设一组数据的偏度系数是-0.25,那么以下说法正确的有〔〕A平均数、中位数与众数是别离的B众数在左边、平均数在右边C数据的极端值在右边,数据分配曲线向右延伸D众数在右边、平均数在左边E数据的极端值在左边、数据分配曲线向左延伸4.进展方差分析需要满足的假设条件有〔〕A每次试验都是独立进展B各样本都来自正态总体C各总体的方差相等D各样本的样本量相等E各总体分布相互独立5.人的血压与体重之间存在一定的相关关系,这种相关属于〔〕A正相关B单相关C负相关D复相关E完全相关三、填空题〔每空2分,共20分〕1、统计调查按调查对象包括的范围不同可分为_____________与______________。2、测定峰度系数β=3时,次数分布曲线为____________;为β<3时,为____________;β>3时,为________________曲线。3、当___________________时,加权算术平均数等于简单算术平均数。4、总体方差越大,抽样误差就___________;总体方差越小,抽样误差______________。5、当变量数列中算术平均数大于众数时,这种变量数列的分布呈__________分布;反之,算术平均数小于众数时,变量数列的分布呈___________分布。四、简答题〔每题5分,共20分〕1、什么是统计学怎样理解统计学与统计数据的关系2、如何对任意两个总体平均数的代表性进展比较3、影响抽样误差的因素有哪些4、什么是假设检验的P值如何根据P值来作出假设检验的结论五、计算题〔每题10分,共30分〕1、随机抽查某企业100名职工,其月工资资料如下表月工资额〔百元〕职工数〔人〕要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。

5—88-1010-1212-1414—184108033合计1002、从500名初中生中随机抽出100名测量身高,通过计算得样本身高平均值为1.65米,样本标准差s为0.073,在概率为95.45%的保证程度下,对这些初中生的身高作出区间估计。〔φ〔2〕=0.9545〕3、对9位青少年的身高y与体重x进展观测,并已得出以下数据:,,,,要求:以身高为因变量,体重为自变量,建设线性回归方程。题库5一、单项选择题〔每题2分,共20分〕1.统计学的方法分为〔〕A描述统计学与理论统计学B理论统计学与推断统计学C理论统计学与应用统计学D描述统计学与推断统计学2.某蕊片厂为了掌握该厂的产品质量,拟进展一次质量大检查,这种检查应选择〔〕A统计报表B重点调查C全面调查D抽样调查3.以下分组中按品质标志分组的是〔〕A人口按年龄分组B产品按质量优劣分组C企业按固定资产原值分组D乡镇按工业产值分组4.在分组时,假设有某个数据的值正好等于相邻组的下限时,一般应将其归在〔〕A上限所在组B下限所在组C任意一组均可D另设新组5.方差是数据中各变量值与其算术平均的〔〕A离差绝对值的平均数B离差平方的平均数C离差平均数的平方D离差平均数的绝对值6.一组数据的偏态系数为-1.3,说明该组数据的分布是〔〕A正态分布B平顶分布C左偏分布D右偏分布7.原假设为假,我们却不拒绝它的概率为〔〕A1-BC1-D8.在简单随机重复抽样条件下,假设要求抽样误差为原来的1/2,那么样本容量〔〕A扩大为原来的5倍B扩大为原来的2倍C扩大为原来的4倍D扩大为原来的2.5倍9.假设检验和区间估计之间的关系,以下说法正确的选项是〔〕A虽然概念不同,但实质一样B两者完全没有关系C互相对应关系D不能从数量上讨论它们之间的对应关系10.当相关系数r=0时,说明〔〕A现象之间完全相关B相关程度较小C现象之间完全相关D无直线相关关系二、多项选择题〔每题2分,共10分〕1.不属于询问调查法有〔〕A访问调查B邮寄调查C调查D实验法E观察法2.非全面调查是指〔〕A普查B全面统计报表C重点调查D典型调查E抽样调查3.变量数列中频率应满足的条件是〔〕A各组频率大于1B各组频率大于0C各组频率之和等于1D各组频率之和小于1E各组频率之和大于14.在500位同学中,抽取100名同学进展调查,以下各项正确的选项是〔〕A样本单位数是1000个B样本个数是100个C一个样本有100个单位D样本容量是100个E是一个大样本5.以下哪些变量之间的关系为函数关系〔〕A家庭收入与消费支出关系B圆的面积与它的半径关系C广告支出与商品销售额关系D单位产品成本与利润关系E在价格固定情况下,销售量与商品销售额关系三、填空题〔每空2分,共20分〕1、统计数据大体上可分为________________与_________________两种类型。2、数据的计量尺度由低级到高级可以分为______________、____________、________________和__________________。3、当满足___________________条件,加权算术平均数等于简单算术平均数。4、参数点估计的方法有____________________与_______________________。5、相关系数的取值范围是______________。四、简答题〔每题5分,共20分〕1、简述平均数、众数、中位数三者的特点与应用场合2、什么是随机原那么在抽样调查中为什么要遵循随机原那么3、什么是离散系数它的计算有什么意义4、什么是假设检验的P值如何根据P值来作出假设检验的结论五、计算题〔每题10分,共30分〕1.根据下表数据,计算10名工人日加工零件数均值、标准差。按零件数分组人数0~10210~20520~303合计102、根据过去大量资料,西安市每天每个家庭看电视的时间服从正态分布。现从西安市家庭中随机抽取16户,测得平均每天每户家庭看电视时间为4.5小时。试在0.05的显著性水平下判断西安市家庭看电视的时间是否有显著提高()3、检查5位同学统计学的学习时间与成绩分布如下表:每周学习时数x4671013学习成绩y4060507090试求出以最小二乘法计算的回归方程,并预测当每周学习时数为8时,统计学成绩。题库6一、单项选择题〔每题2分,共20分〕1、.研究如何对现象的数量特征进展计量、观察、概括和表述的理论和方法属于()A、应用统计学B、描述统计学C、推断统计学D、理论统计学2、假设各个标志值都扩大2倍,而频数都减少为原来的1/3,那么平均数〔〕A、扩大2倍B、减少到1/3C、不变D、减少到1/23、在处理快艇的6次试验数据中,得到以下最大速度值:27、38、30、37、35、31.那么最大艇速的均值的无偏估计值为〔〕A、32.5B、33C、39.6D、304、假设两个变量的平均水平接近,标准差越大的变量,其()A、平均值的代表性越好B、离散程度越大C、稳定性越高D、离散程度越小5、对正态总体均值进展区间估计时,其它条件不变,置信水平越小,那么置信上限与置信下限的差〔〕A、越大B、越小C、不变D、不确定6、方差分析中的原假设是关于所研究因素()A、各水平总体方差是否相等B、各水平的理论均值是否相等C、同一水平内部数量差异是否相等D、同一水平内部数值相等7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,那么职工月平均收入的离散程度()A、甲类较大B、乙类较大C、两类一样D、不确定8、在假设检验中,假设,那么此检验是〔〕A、左侧检验B、右侧检验C、双侧检验D、不知道9、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为()A、45B、40C、44D、4310、某次考试学生的考试成绩近似服从正态分布,,那么可认为有大约95.45%的学生考试成绩分布的范围是()A、(70,80)B、(70,86)C、(62,94)D、(70,90)二、多项选择题〔每题2分,共10分〕1.估计量的评价标准是〔〕A无偏性B有效性C一致性D客观性E及时性2.以下哪些属于全面调查〔〕A普查B全面统计报表C重点调查D典型调查E抽样调查3.以下关于变量数列中频率的说明不正确的选项是〔〕A各组频率大于1B各组频率大于0C各组频率之和等于1D各组频率之和小于1E各组频率之和大于14.总体平均数的假设检验方法通常有〔〕AZ检验法Bt检验法C检验法DF检验法E几何检验法5.收入与消费存在一定的相关关系,这种相关属于〔〕A正相关B单相关C负相关D复相关E完全相关三、填空题〔每空2分,共20分〕1、统计词有三种涵义,即________________、_________________与_____________________。2、加权算术平均数受两个因素的影响,一个是______________,一个是_____________。3、在假设检验中,把符合的总体判为不符合加以拒绝,这类错误称为____________错误;把不符合的总体当作符合而承受,这类错误称为____________错误;显著性水平是用来控制犯第_______类错误的概率。4、直线相关系数等于零,说明两变量之间________________;直线相关系数等于-1,说明两变量之间_______________________。四、简答题〔每题5分,共20分〕1、统计学确实对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论那么会带来更大的欺骗性。为了防止这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法2、随机抽样的含义与特点3、什么是标准差系数在什么场合下计算标准差系数4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系五、计算题〔每题10分,共30分〕1、随机抽查某企业100名职工,其月工资资料如下表月工资额〔百元〕职工数〔人〕要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。

5—88-1010-1212-1414—184108033合计1002、某快餐店对顾客的平均花费进展抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;〔φ〔2〕=0.9545〕3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量〔台〕xi4050507080生产费用〔万元〕yi130140145150156要求:利用最小二乘法求出估计的回归方程。附:题库一答案一、选择题〔每题2分,共20分〕B2.C3.D4.D5.A6.D7A8.B9.D10.C二、多项选择题〔每题2分,共10分〕1.ABCE2.ACE3.ADE4.AB5.ADE三、填空题〔每空2分,共20分〕分组标志、组矩4元、0.01参数估计、假设检验弃真错误、纳伪错误-1,1四、简答题(每题5分,共20分)1.答:〔1〕众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性。〔1分〕〔2〕中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。〔1分〕〔3〕均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。〔1分〕应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据那么无法计算均值,但却可以计算众数和中位数。〔2分〕答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平〔2分〕。〔3分〕。3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平上下的影响,也就是与变量的均值大小有关。〔2分〕。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进展比较的。为了消除变量值水平上下和计量单位不同对离散程度测度值的影响,而需要计算标准差系数〔3分〕。4、答:方差分析的步骤:首先,计算出总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)。SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小,三者之间的关系:SST=SSA+SSE。第二,计算SSE的均方MSE,SSA的均方MSA。将MSA和MSE进展比照,即得到所需要的F检验统计量。第三,将统计量的值F与给定的显著性水平a的临界值Fa进展比较,作出对原假设H0的决策。五、计算题(每题10分,共30分)1.解:〔全对,给10分,错一空扣1分〕考分人数比率向上累计向下累计人数〔人〕比率〔%〕人数〔人〕比率〔%〕60以下25.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090以上820.040100.0820.0合计40100.0————2.解:根据题意:提出假设:〔2分〕检验统计量〔3分〕由=0.05,查表临界值由于Z=2>=1.645,所以应拒绝而承受H1,即北京市家庭每天上网的时间确有显著提高。〔5分〕3.解:〔4分〕〔4分〕样本回归方程:〔2分〕题库二答案一、选择题〔每题2分,共20分〕C2.D3.D4.A5.D6.B7B8.B9.B10.A二、多项选择题〔每题2分,共10分〕1.ABCD2.ABD3.ADE4.AB5.ADE三、填空题〔每空2分,共20分〕统计设计、统计调查、统计整理、统计分析右偏、左偏无偏性、有效性、一致性线性相关四、简答题(每题5分,共20分)1.答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数〔2分〕。〔1〕全距:计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差〔2分〕。〔2〕平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算〔2分〕。〔3〕标准差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算〔2分〕。〔4〕离散系数:用来比照不同水平的同类现象,特别是不同类现象总体平均数代表性的大小〔2分〕。2.答:总体各单位的差异程度〔即标准差的大小〕,总体各单位的差异程度越大,抽样误差越大〔4分〕;样本单位数的多少,样本单位数越大,抽样误差越小〔2分〕;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小〔2分〕;抽样组织方式:简单随机抽样的误差最大〔2分〕。3.答:相关分析,就是用一个指标来说明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态,选择一个适宜的数学模型,来近似地表达变量间的平均变化关系〔2分〕。〔1〕两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来说明现象数量相关的具体形式,而回归分析那么需要依靠相关分析来说明现象数量变化的相关程度〔4分〕。〔2〕相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析那么是研究变量之间相互关系的具体形式,确定一个相关的数学方程式,根据这个数学方程式从变量推测未知量,从而为估算和预测提供了一个重要的方法〔4分〕。4、答:基本步骤:1.提出原假设和备择假设〔2分〕2.确定适当的检验统计量〔2分〕3.规定显著性水平α,确定临界值〔2分〕4.计算检验统计量的值〔2分〕5.作出统计决策〔2分〕五、计算题(每题10分,共30分)1.解:〔1〕乙班的平均分数:〔5分〕乙班平均分数的标准差:乙班平均分数的标准差系数:〔3分〕〔2〕比较哪个班的平均分数更有代表性:因为小于所以甲班的平均分数更有代表性〔2分〕。解::,。〔5分〕1-=95.45%即。必要的抽样数目:〔件〕〔5分〕3.解::样本回归方程:〔6分〕将有关数据代入回归方程,得:〔亿元〕置信度为95.45%的利润额的预测区间为:,即0.9〔元〕Y1.1〔元〕〔4分〕。题库三答案一、选择题〔每题2分,共20分〕1.B2.A3.D4.A5.A6.A7.D8.B9.B10.A二、多项选择题〔每题2分,共10分〕1.ABC2.BDE3.CE4.ACDE5.ACD三、填空题〔每空2分,共20分〕描述统计学、推断统计学等距式分组、异距式分组矩形标准差、均值总体均值、总体比例、总体方差四、简答题(每题5分,共20分)1.答:完整的统计调查方案包括:(1)确定调查目的,即为什么调查〔2分〕;(2)确定调查对象和调查单位,即向谁调查〔2分〕;(3)确定调查工程和调查表,即调查什么〔2分〕;(4)其他内容,包括调查的时间与组织安排等〔4分〕。2.答:数据的计量尺度由低级到高级、由粗略到准确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。定类尺度,是最粗略、计量层次最低的计量尺度,它是按照事物的某种属性对其进展平行的分类或分组。各类别之间是平等的并列关系,无法区分优劣或大小。〔1分〕定序尺度,它是对事物之间等级差或顺序差异的一种测度。该尺度不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。该尺度的计量结果只能比较大小,不能进展加、减、乘、除数学运算。〔1分〕定距尺度,它不仅能将事物区分为不同类型并进展排序,而且可以准确地指出类别之间的差距是多少。该尺度的计量结果表现为数值,并可以计算差值,因而,其结果可以进展加减运算。定距尺度没有一个绝对零点,不能进展乘、除运算。〔1分〕定比尺度,与定距尺度属于同一层次,其计量的结果也表示为数值。由于有绝对的零点,可以进展加、减、乘、除运算。〔1分〕上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到准确逐步递进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。〔1分〕3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平上下的影响,也就是与变量的均值大小有关。变量值绝对水平越高,离散程度的测度值自然也就大,绝对水平越低,离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位一样,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。〔2分〕标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(1分)因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进展比较的。为了消除变量值水平上下和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。〔2分〕4、答:必要抽样数目受以下因素影响:〔1〕总体方差。其他条件不变的条件下,总体单位的差异程度大,那么应多抽,反之可少抽一些〔1分〕。〔2〕允许误差范围。允许误差增大,意味着推断的精度要求降低,在其他条件不变的情况下,必要的抽样数目可减少;反之,缩小允许误差,就要增加必要的抽样数目〔1分〕。〔3〕置信度〔1-〕。在其他条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目〔1分〕。〔4〕抽样方法。一样条件下,采用重复抽样应比不重复抽样多抽一些样本单位〔1分〕。〔5〕抽样组织方式。由于不同抽样组织方式有不同的抽样误差,在误差要求一样的情况下,不同抽样组织方式所必需的抽样数目也不同〔1分〕。五、计算题(每题10分,共30分)1.解:解:品种价格〔元/斤〕甲市场乙市场成交额〔m〕成交量(m/x)成交量(f)成交额(xf)甲1.21.2122.4乙1.42.8211.4丙1.51.5111.5合计-5.5445.3甲市场平均价格〔元〕(3分)乙市场平均价格〔元〕(3分)说明:两个市场销售单价是一样的,销售总量也是一样的,影响两个市场平均价格上下不同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销售价格较高的乙产品最多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用(4分)。2.解:根据题意:提出假设:检验统计量由=0.05,查表临界值由于t=0.9733<=2.2622,所以不应拒绝,即每袋重量符合要求。3.解:(4分)(4分)当元(2分)题库四答案一、选择题〔每题2分,共20分〕1.D2.D3.B4.B5.B6.C7.B8.C9.C10.D二、多项选择题〔每题2分,共10分〕1.DE2.CDE3.BC4.ACDE5.BE三、填空题〔每空2分,共20分〕定性数据、定量数据定类尺度、定序尺度、定距尺度、定比尺度各组权数相等矩估计法、极大似然估计法-1,1四、简答题(每题5分,共20分)1.答:〔1〕众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。〔2〕中位数:不受极端值影响,数据分布偏斜程度较大时应用(2分)。〔3〕平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(2分)。2.答:随机原那么,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否入样是随机的(2分)。遵循随机原那么抽样,能有效防止主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建设在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。3.答:以标准差系数为例。标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分)因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进展比较的。为了消除变量值水平上下和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。〔3分〕4、答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。(3分)五、计算题(每题10分,共30分)1.解:均值:(件)〔5分〕标准差:〔件〕〔5分〕2.解:根据题意:提出假设:检验统计量〔5分〕由=0.05,查表临界值由于Z=2>=1.645,所以应拒绝而承受H1,即西安市家庭每天看电视的时间确有显著提高。〔5分〕3.解:(4分)(4分)当分(2分)题库五答案一、选择题〔每题2分,共20分〕1.B2.A3.B4.B5.B6.B7.A8.A9.C10.C二、多项选择题〔每题2分,共10分〕1.ABC2.AB3.ADE4.AB5.AB三、填空题〔每空2分,共20分〕统计工作、统计数据、统计学变量水平、权数各组权数相等所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论