社会统计学期末复习题与答案整理_第1页
社会统计学期末复习题与答案整理_第2页
社会统计学期末复习题与答案整理_第3页
社会统计学期末复习题与答案整理_第4页
社会统计学期末复习题与答案整理_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

千里之行,始于脚下。第2页/共2页精品文档推荐社会统计学期末复习题与答案整理社会统计学期末复习训练

一、单项挑选题(20=2×10)

1.为了解IT行业从业者收入水平,某讨论机构从全市IT行业从业者随机抽取800人作为样

本举行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于消遣消费在1000元以上。此处800人是.样本

2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭举行调查,

以判断全部家庭的年均收入水平。这项讨论的总体是332.1户家庭的年均收入

3.小学后勤集团想了解小学22000同学的每月生活费用,从中抽取2200名同学举行调查,

以判断全部同学的每月生活费用水平。这项讨论的总体是22000名同学的每月生活费用

4.为了解地区的消费,从该地区随机抽取5000户举行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级

6.下列变量属于数值型变量的是工资收入

7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的

机会入选样本,这样的抽样方式称为.容易随机抽样

8.某班级有60名男生,40名女生,为了了解同学购书支出,从男生中抽取12名同学,从

女生中抽取8名同学举行调查。这种调查办法属于分层抽样

9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采纳容易随机抽样或系统抽

样的方式抽取子样本,这样的抽样方式称为分层抽样

10.某班级有100名同学,为了了解同学消费水平,将全部同学根据学习成果排序后,在前

十名同学中随机抽出成果为第3名的同学,后面依次选出第13、23、33、43、53、63、73、83、93九名学生举行调查。这种调查办法属于系统抽样

11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率

12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率

13.在频数分布表中,频率是指各组频数与总频数之比

14.在频数分布表中,比率是指不同小组的频数之比

15.假如用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2023-2023年人口总量(单位:万人)分离为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图

17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图

18.在某市随机抽取10家企业,7月份利润额(单位:万元)分离为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为39.1919.某班级10名学生期末统计课考试分数分离为76、93、95、80、92、83、88、90、92、72,那么该班考试成果的中位数是89

20.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为3250元21.为了解某行业12月份利润情况,随机抽取5家企业,12月份利润额(单位:万元)分

别为65、23、54、45、39,那么这5家企业12月份利润额均值为45.2

22.某专业共8名学生,他们的统计课成果分离为86、77、97、94、82、90、83、92,那

么该班考试成果的中位数是88

23.某班级同学平均天天上网时光可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值

近似为5.5小时

24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度

27.两组数据的平均数不相等,但是标准差相等。那么平均数大的,离散程度小

28.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为70029.一班同学的平均体重均为55千克,二班同学的平均体重为52千克,两个班级同学体重的标准差均为5千克。那么二班同学体重的离散程度大30.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为350031.正态分布中,σ值越小,则离散趋势越小

32.已知某单位职工平均每月工资为3000元,标准差为500元。假如职工的月收入是正态分布,可以推断月收入在2500元—3500元之间的职工人数大约占总体的68%33.假如一组数据中某一个数值的标准分值为-1.5,这表明该数值比平均数低1.5个标准差34.某班级同学期末英语考试平均成果为75分,标准差为10分。假如已知这个班同学的考试分数听从正态分布,可以推断成果在65-85之间的同学大约占全班同学的68%

35.阅历法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有95%的数据

36.期中考试中,某班级同学统计学平均成果为80分,标准差为4分。假如同学的成果是正太分布,可以推断成果在72分-88分之间的同学大约占总体的95%

37.假如一组数据中某个数值的标准分值为1.8,这表明该数值比平均数高出1.8个标准差38.某班级同学期末统计学考试平均成果为82分,标准差为5分。假如已知这个班同学的考试分数听从正态分布,可以推断成果在77-87之间的同学大约占全班同学的68%

39.阅历法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有68%的数据

40.用样本统计量的值直接作为总体参数的估量值,这种办法称为点估量

41.用样本统计量的值构造一个置信区间,作为总体参数的估量,这种办法称为区间估量42.某单位对该厂第一加工车间残品率的估量高达10%,而该车间主任认为该比例(π)偏高。假如要检验该说法是否正确,则假设形式应当是

H:π≥0.1;

1

H:πCompareMeans—>Paired—SampleTTest,浮现图11—4所示窗口。“PairedVariables”框中的变量作为分析变量,总是成对浮现,指定要检验的两个变量到“PairedVariables”输入栏里的“Variable1”和“Variable2”中,在“CurrentSelections”栏中就会显示被选中的成对变量,在“Options”选项中可以举行置信水平和缺失值的设置,同单样本T检验。

22.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区分。P207

T检验(TTest)是最常见的一种假设检验类型,主要验证总体均值间是否存在显著性差异。T检验属于参数假设检验,所以它适用的范围是数值型的数据,在某网战分析中可以是拜访数、自立访客数、停歇时光等,电子商务的订单数、销售额等。T检验还需要符合一个条件——总体符合正态分布。

卡方检验(chi-squaretest),也就是χ2检验,用来验证两个总体间某个比率之间是否存在显著性差异。卡方检验属于非参数假设检验,适用于布尔型或二项分布数据,基于两个概率间的比较,早期用于生产企业的产品合格率等,在某网战分析中可以用于转化率、BounceRate等全部比率度量的比较分析,

23.简要说明卡方的拟合优度检验和自立性检验的含义。P1782、拟合优度检验

(1)拟合优度检验

从总体的不同类别中抽取元素构成样本,样本包含总体中各个类别的元素,对不同类别的目标量之间是否存在显著性差异举行的检验称为拟合优度检验。拟合优度检验是2

χ检验中重要的一部分,可以同时对多个总体举行比较。在2

χ检验中,假如2

χ

统计量小于给定的2

αχ,那么就不能否决原假设,假如大于则否决。即2

χ检验的否决域是2

χ>2αχ(k-1),其中k-1是自由度。自由度是可以自由变动的变量个数,在列

联表中,自由度=(R-1)*(C-1)。自立性检验

(1)自立性检验:2

χ检验还可用于推断两个分类变量之间是否存在联系,例如,对

宿舍管理XXX的态度是否与专业有关、对XXX的态度是否与学历有关等。假如两个

推断它们之间是否关联,这时称为独分类变量之间没有关系,则称为自立,我们用2

立性检验。

四、计算题(每题15分,共30分)12-16题题型一样,公式自己抄

1.某校社会学专业学生统计课成果如下表所示。

社会学专业学生统计课成果表

(1)对考试成果按由低到高举行排序,求出众数、中位数和平均数。

(2)对考试成果举行适当分组,编制频数分布表,并计算累计频数和累计频率。

解答:(1)对考试成果按由低到高举行排序如下:

62,66,68,70,70,75,76,76,76,76,76,77,78,79,80,80,80,81,82,82,83,83,85,86,86,87,87,88,88,90,90,90,91,91,92,93,93,94,95,95,96,97

其中,众数为76,中位数为83,平均数为83.1

2.某行业管理局所属40个企业2023年产品销售额数据如下所示。

40个企业2023年产品销售额

要求:

(1)对2023年销售额按由低到高举行排序,求出众数、中位数和平均数。

(2)假如根据规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为普通企业,105万以下的为落后企业,请按先进企业、良好企业、普通企业、落后企业举行分组,编制频数分布表,并计算累积频数和累积频率。

解答:(1)对2023年销售额按由低到高举行排序如下:

87,88,91,95,97,100,103,103,104,105,105,107,108,108,110,112,113,115,115,115,116,117,117,118,119,119,120,123,124,125,126,127,129,135,136,137,138,142,146,152

得到众数为115;中位数为115.5;平均数为116.175。

(2)对企业按销售额举行适当分组,编制频数分布表如下:

3.甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示。

要求:

(1)计算乙单位员工月收入的均值和标准差。

(2)比较甲单位和乙单位哪个单位员工月收入的离散程度更大?(提醒:使用离散系数)

解答:对分组数据先求出各组的组中值

25001XXX00420450054055004206500300

47001800

x?+?+?+?+?=

=乙

乙单位员工月收入的标准差为

1166

σ=

=

=乙(2)甲单位员工收入的离散系数1200

0.2674500

V=

=甲,乙单位员工收入的离散系数1166

0.2484700

V=

=乙,故甲单位员工月收入的离散程度大。

4.某校社会学专业共有两个班级。期末考试时,一班学生社会学理论平均成果为86分,标准差为12分。二班学生成果如下所示。

要求:

(1)计算二班学生考试成果的均值和标准差。

(2)比较一班和二班哪个班成果的离散程度更大?(提醒:使用离散系数)

解答:对分组数据先求出各组的组中值

二班学生社会学理论成果分组数据表

(1)二班学生考试成果的均值为

552657759857955

7730

?+?+?+?+?=分

二班学生考试成果的标准差为

11.7=分

(2)一班的成果的离散系数为1120.1XXXV=

=,二班的成果的离散系数为211.7

0.1577

V==

故二班的成果的离散程度大。

5.某公司聘请职员时,要求对职员举行两项基本能力测试。已知,A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。一位应试者在A项测试中得了102分,在B项测试中得了215分。若两项测试的成果均听从正太分布,该位应试者哪一项测试更抱负?解答:在A项测试中10290112Z-=

=,在B项测试中215200

0.625

Z-==说明该位应试者在A项测试中的成果高于均值1倍的标准差,在B项测试中的成果高于均

值0.6倍的标准差,故该位应试者A项测试成果更抱负。

6.一项关于高校生体重情况的讨论发觉,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:

(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?

解答:(1)男生体重的离散系数15

0.08360

V=

=,女生体重的离散系数为15

0.150

V=

=,故女生体重差异大。(2)男生体重2

1~(60,5)XN,令1160

~(0,1)5

XZN-=

,从而1116055606560

(5565)()(11)68%555

XPXPPZ≤≤=≤≤=-≤≤=,

故男生中有68%的人体重在55~65千克之间。

(3)女生体重2

2~(50,5)XN,令2250

~(0,1)5

XZN-=

,从而2225040506050

(4060)()(22)95%555

XPXPPZ≤≤=≤≤=-≤≤=,

故女生中有95%的人体重在40~60千克之间。

7.为估量每个网络用户天天上网的平均时光是多少,抽取了225个网络用户的容易随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。

(1)试用95%的置信水平,计算网络用户天天平均上网时光的置信区间。

(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。

注:

96

.1Z025.0=

解答:(1)网络用户天天平均上网时光的95%的置信水平下置信区间为

(6.51.961.96

-+即(6.17,6.83)(2)90

0.4,10.6225

PP=

=-=

年龄在20岁以下的网络用户比例的95%的置信水平下置信区间为

(0.41.961.96-+即(0.34,0.46)

8.为估量某地区每个家庭日均生活用水量为多少,抽取了450个家庭的容易随机样本,得到样本均值为200升,样本标准差为50升。

(1)试用95%的置信水平,计算该地区家庭日均用水量的置信区间。

(2)在所调查的450个家庭中,女性为户主的为180个。以95%的置信水平,计算女性为户主的家庭比例的置信区间。

注:

96

.1Z025.0=

解答:(1)95%的置信水平下,该地区家庭日均用水量的置信区间为

(2001.962001.96

-+即(195.4,204.6)(2)180

0.4,10.6450

PP=

=-=

95%的置信水平下,女性为户主的家庭比例比例的置信区间为

(0.41.961.96-+即(0.345,0.445)

9.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR=1600,

残差平方和SSE=450。要求:

(1)写出销售量y与广告费用x之间的线性回归方程。

(2)如果明年方案投入广告费用为25万元,按照回归方程估量明年汽车销售量。

(3)计算判定系数2

R,并解释它的意义。

解答:(1)销售量y与广告费用x之间的线性回归方程为^

3631.42yx=+

(2)如果明年方案投入广告费用为25万元,按照回归方程估量明年汽车销售量为398量。

(3)判定系数2

1600

R0.781600450

SSRSSRSSE=

==++,它表示回归平方和SSR占平方

和SST的比例为78%,回归拟合程度较好。

10.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y举行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。要求:

(1)写出广告费用x与销售量y之间的线性回归方程。

(2)如果广告费用投入50000元,按照回归方程估量商品销售量。

(3)计算判定系数2

R,并解释它的意义。

解答:(1)销售量y与广告费用x之间的线性回归方程为^^

3641.42yx=+(2)如果广告费用投入50000元,按照回归方程估量商品销售量为71000。

(3)判定系数2

R0.976=,它表示回归平方和SSR占平方和SST的比例为97.6%,回归拟合程度很好。

11.某公司欲了解广告费用x对销售量y的影响,收集了16个地区的数据,并对x、y举行线性回归分析,得到:方程的截距为280,回归系数为1.6,回归平方和SSR=1503000,残差平方和SSE=38000。要求:

(1)写出广告费用x与销售量y之间的线性回归方程。

(2)如果广告费用投入80000元,按照回归方程估量商品的销售量。

(3)计算判定系数2

R,并解释它的意义。

解答:(1)销售量y与广告费用x之间的线性回归方程为^

2801.6yx=+(2)如果广告费用投入80000元,按照回归方程估量商品销售量为128280。

(3)判定系数2R0.975=,它表示回归平方和SSR占平方和SST的比例为97.5%,回归拟合程度很好。

12.某调查公司讨论出租司机天天收入(元)与行驶里程(公里)之间的关系。对30位出租车司机举行调查,并按照天天的收入y、行驶里程x举行回归,得到:方程的截距为

162,回归系数为0.6,回归平方和SSR=2600,残差平方和SSE=513。要求:

(1)写出天天的收入y与行驶里程x之间的线性回归方程。

(2)如果某司机某天行驶了300公里,按照回归方程估量他该天的收入。

(3)计算判定系数2

R,并解释它的意义。

解答:(1)天天的收入y与行驶里程x之间的线性回归方程为^

^

1620.6yx=+(2)如果某司机某天行驶了300公里,按照回归方程估量他该天的收入为342元。(3)判定系数2

2600

R0.8352600513

=

=+,它表示回归平方和SSR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论