2023年秋社会统计学期末复习训练题_第1页
2023年秋社会统计学期末复习训练题_第2页
2023年秋社会统计学期末复习训练题_第3页
2023年秋社会统计学期末复习训练题_第4页
2023年秋社会统计学期末复习训练题_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023秋社会记录学期末复习训练

一、单项选择题

1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽

取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%

回答他们每月用于娱乐消费在1000元以上。此处800人是()

A.样本

B.总体

C.记录量

D.变量

2.在频数分布表中,将各个有序类别或组的比例逐级累加起来称为

()

A.频率

B.累积频数

C.累积频率

D.比率

3.离散系数的重要目的是()

A.反映一组数据的平均水平

B.比较多组数据的平均水平

C.反映一组数据的离散限度

D.比较多组数据的离散限度

4.经验法则表白,当一组数据正态分布时,在平均数加减1个标准差的范围

之内大约有()

A.50%的数据

B.68%的数据

C.95%的数据

D.99%的数据

5.在某市随机抽取10家公司,7月份利润额(单位:万元)分别为72.0、

63.1、20.0、23.0、54.7、54.3、23.9,25.0、26.9、29.0,那么这

10家公司7月份利润额均值为()

A.39.19

B.28.90

C.19.54

D.27.95

6.用样本记录量的值直接作为总体参数的估计值,这种方法称为()

A.点估计

B.区间估计

C.有效估计

D.无偏估计

7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为

该比例(万)偏高。假如要检查该说法是否对的,则假设形式应当为()

A.H。:乃20.1;%:乃<0.1

B.40:灯W0.1;M:万〉0.1

C.Ho:7T=0.1;%:TTW0.1

D.Ho:乃>0.1;:万WO.1

8.下面哪一项不是方差分析中的假定()

A.每个总体都服从正态分布

B.观测值是互相独立的

C.各总体的方差相等

D.各总体的方差等于0

9.判断下列哪一个不也许是相关系数()

A.-0.9

B.0

C.0.5

D.1.2

10.用于说明回归方程中拟合优度的记录量重要是()

A.相关系数

B.离散系数

C.回归系数

D.鉴定系数

11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000

户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是()

A.332.1万户家庭

B.3000户家庭

C.332.1户家庭的年均收入

D.3000户家庭的年均收入

12.下列变量属于数值型变量的是()

A.工资收入

B.产品等级

C.学生对考试改革的态度

D.公司的类型

13.假如用一个图形描述比较两个或多个样本或总体的结构性问题时,适

合选用哪种图形()

A.环形图

B.饼图

C.直方图

D.条形图

14.在频数分布表中,频率是指()

A.各组频数与上一组频数之比

B.各组频数与下一组频数之比

C.各组频数与总频数之比

D.各组频数与最大一组频数之比

15.两个定类变量之间的相关分析可以使用()

A.4系数

B.0系数

C.r系数。

D.Gamma系数

16.根据一个样本均值求出的90%的置信区间表白()

A.总体均值一定落入该区间内

B.总体均值有90%的概率不会落入该区间内

C.总体均值有90%的概率会落入该区间内

D.总体均值有10%的概率会落入该区间内

17.已知某单位职工平均每月工资为3000元,标准差为500元。假如职

工的月收入是正态分布,可以判断月收入在2500元一3500元之间的职工人数

大约占总体的()

A.95%

B.68%

C.89%

D.90%

18.方差分析的目的是()

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著

19.对于线性回归,在因变量的总离差平方和中,假如回归平方和所占比例

越大,那么两个变量之间()

A.相关限度越大

B.相关限度越小

C.完全相关

D.完全不相关

20.正态分布中,cr值越小,则()

A.离散趋势越小。

B.离散趋势越大

C.曲线越低平。

D.变量值越分散

21.从具有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每

个元素都有相同的机会入选样本,这样的抽样方式称为()

A.简朴随机抽样

B.系统抽样

C.整群抽样

D.分层抽样

22.某地区2023-2023年人口总量(单位:万人)分别为98,102,103,106,10

8,109,110,111,114,115,下列哪种图形最适合描述这些数据()

A.茎叶图

B.环形图

C.饼图

D.线图

23.假如一组数据中某一个数值的标准分值为T.5,这表白该数值()

A.是平均数的-1.5倍

B.比平均数少1.5

C.等于一1.5倍标准差

D.比平均数低1.5个标准差

24.某班级10名同学期末记录课考试分数分别为76、93、95、80、92、

83、88、90、92、72,那么该班考试成绩的中位数是()

A.89

B.72

C.88

D.95

25.某班级学生期末英语考试平均成绩为75分,标准差为10分。假如已

知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大

约占全班学生的()

A.68%

B.89%

C.90%

D.95%

26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的

标准差为()

A.700

B.0.2

C.3500

D.175000

27.在假设检查中,不拒绝虚无假设意味着()

A.虚无假设是肯定对的的

B.虚无假设肯定是错误的

C.没有证据证明虚无假设是对的的

D.没有证据证明虚无假设是错误的

28.在因变量的总离差平方和中,假如回归平方和所占的比例越大,则两变

量之间()

A.相关限度越高

B.相关限度越低

C.完全相关

D.没有任何关系

29.从两个总体中各选取了6个观测值,得到组间平方和为234,组内平方

和为484,则组间方差和组内方差分别为()

A.234,121

B.117,121

C.234,48.4

D.117,81

30.在回归方程中,若回归系数等于0,这表白()

A.因变量y对自变量x的影响是不显著的

B.自变量x对因变量y的影响是不显著的

C.因变量y对自变量x的影响是显著的

D.自变量x对因变量y的影响是显著的

31.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取

12名学生,从女生中抽取8名学生进行调查。这种调查方法属于()

A.简朴随机抽样

B.整群抽样

C.分层抽样

D.系统抽样

32.某公司职工的月收入水平分为以下五组:1)1500元及以下;2)150

0-2023元;3)2023-2500元;4)2500-3000元;5)3000元及以上,则3000

元及以上这一组的组中值近似为()

A.300076

B.3500元

C.2500元

D.3250元

33.对于右偏分布,平均数、中位数和众数之间的关系是()

A.平均数>中位数>众数

B.中位数>平均数,众数

C.众数》中位数〉平均数

D.众数〉平均数》中位数

34.两组数据的平均数不相等,但是标准差相等。那么()

A.平均数小的,离散限度小

B.平均数大的,离散限度大

C.平均数大的,离散限度小

D.两组数据离散限度相同

35.在假设检查中,假如所计算出的P值越小,那么检查的结果()

A.越显著

B.越不显著

C.越真实

D.越不真实

36.假如物价与销售量之间的线性相关系数为-0.87,并且两者之间具有

记录显著性,那么两者之间存在着()

A.高度相关

B.中度相关

C.低度相关

D.极弱相关

37.回归平方和(SSR)反映了y的总变差中()

A.由于x与y之间的线性关系引起的y的变化部分

B.除了x对y的现有影响之外的其他因素对y变差的影响

C.由于x与y之间的非线性关系引起的y的变化部分

D.由于x与y之间的函数关系引起的y的变化部分

38.根据一个具体的样本求出的总体均值90%的置信区间()

A.以90*的概率包含总体均值

B.绝对包含总体均值

C.10%的也许性包含总体均值

D.绝对不包含总体均值

39.在假设检查中,虚无假设和备择假设()

A.都有也许成立

B.都不也许成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

40.在方差分析中,某一水平下样本数据之间的误差称为()

A.组内误差

B.组间误差

C.组内平方

D.组间平方

41.学校后勤集团想了解学校22023学生的每月生活费用,从中抽取2200

名学生进行调查,以推断所有学生的每月生活费用水平。这项研究的总体是

()

A.22023名学生

B.2200名学生

C.22023名学生的每月生活费用

D.2200名学生的每月生活费用

42.从变量分类看,下列变量属于定序变量的是()

A.专业

B.性别

C.产品等级

D.收入

43.在频数分布表中,比率是指()

A.各组频数与上一组频数之比

B.各组频数与下一组频数之比

C.各组频数与总频数之比

D.不同小组的频数之比

44.某地区2023—2023年人口总量(单位:万人)分别为98,102,103,10

6,108,109,110,11U114,115,下列哪种图形最适合描述这些数据

()

A.茎叶图

B.环形图

C.饼图

D.线图

45.根据一个样本均值求出的90%的置信区间表白()

A.总体均值一定落入该区间内

B.总体均值有90%的概率不会落入该区间内

C.总体均值有90%的概率会落入该区间内

D.总体均值有10%的概率会落入该区间内

46.判断下列哪一个不也许是相关系数()

A.-0.89

B.0.34

C.1.32

D.0

47.期中考试中,某班级学生记录学平均成绩为80分,标准差为4分。假如

学生的成绩是正太分布,可以判断成绩在72分一88分之间的学生大约占总体的

()

A.95%

B.68%

C.89%

D.90%

48.正态分布中,o■值越小,则()

A.离散趋势越小

B.离散趋势越大

C.曲线越低平

D.变量值越分散

49.下面哪一项不是方差分析中的假定()

A.每个总体都服从正态分布

B.观测值是互相独立的

C.各总体的方差相等

D.各总体的方差等于0

50.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中

收入的回归系数为0.8,这表白()

A.收入每增长1元,消费增长0.8元

B.消费每增长1元,收入增长0.8元

C.收入与消费的相关系数为0.8

D.收入对消费影响的显著性为0.8

51.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简朴

随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,

这样的抽样方式称为()

A.简朴随机抽样

B.系统抽样

C.整群抽样

D.分层抽样

52.在频数分布表中,某一小组中数据个数占总数据个数的比例称为

()

A.频率

B.频数

C.频次

D.频谱

53.某专业共8名同学,他们的记录课成绩分别为86、77、97、94、82、

90、83、92,那么该班考试成绩的中位数是()

A.86

B.77

C.90

D.88

54.经验法则表白,当一组数据正太分布时,在平均数加减2个标准差的范

围之内大约有()

A.50%的数据

B.68%的数据

C.95%的数据

D.99%的数据

55.残差平方和(SSE)反映了y的总变差中()

A.由于x与y之间的线性关系引起的y的变化部分

B.除了x对y的现有影响之外的其他因素对y变差的影响

C.由于x与y之间的非线性关系引起的y的变化部分

D.由于x与y之间的函数关系引起的y的变化部分

56.某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种

方法最合适()

A.回归分析。

B.方差分析

C.卡方检查

D.列联表分析

57.用样本记录量的值构造一个置信区间,作为总体参数的估计,这种方法称

为()

A.点估计

B.区间估计

C.有效估计

D.无偏估计

58.在假设检查中,虚无假设和备择假设()

A.都有也许成立

B.都不也许成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

59.方差分析的目的是()

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著

60.用于说明回归方程中拟合优度的记录量重要是()

A.相关系数

B.离散系数

C.回归系数

D.鉴定系数

61.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%

回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用

在300元以上。此处5000户是()

A.变量

B.总体

C.样本

D.记录量

62.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形

()

A.环形图

B.饼图

C.直方图

D.条形图

63.假如一组数据中某一个数值的标准分值为1.8,这表白该数值()

A.是平均数的1.8倍

B.比平均数多1.8

C.等于标准差的1.8倍

D.比平均数高出1.8个标准差

64.离散系数的重要目的是()

A.反映一组数据的平均水平

B.比较多组数据的平均水平

C.反映一组数据的离散限度

D.比较多组数据的离散限度

65.某班级学生期末记录学考试平均成绩为82分,标准差为5分。假如已

知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大

约占全班学生的()

A.68%

B.89%

C.90%

D.95%

66.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月

收入的均值为()

A.700

B.O.2

C.3500

D.140

67.根据一个具体的样本求出的总体均值95%的置信区间()

A.以95%的概率包含总体均值

B.5%的也许性包含总体均值

C.绝对包含总体均值

D.绝对不包含总体均值

68.在因变量的总离差平方和中,假如回归平方和所占的比例越小,则自变

量和因变量之间()

A.相关限度越高

B.相关限度越低

C.完全相关

D.没有任何关系

69.从两个总体中共选取了8个观测值,得到组间平方和为432,组内平方

和为426,则组间均方和组内均方分别为()

A.432,71

B.216,71

C.432,426

D.216,426

70.对于线性回归,在因变量的总离差平方和中,假如残差平方和所占比例越

大,那么两个变量之间()

A.相关限度越大

B.相关限度越小

C.完全相关

D.完全不相关

71.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩

排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、2

3、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于()

A.简朴随机抽样

B.整群抽样

C.分层抽样

D.系统抽样

72.某班级学生平均天天上网时间可以分为以下六组:1)1小时及以下;2)

1-2小时;3)2-3小时;4)3-4小时;5)4—5小时;6)5小时及以上,则5小

时及以上这一组的组中值近似为()

A.5小时

B.6小时

C.5.5小时

D.6.5小时

73.对于左偏分布,平均数、中位数和众数之间的关系是()

A.平均数>中位数〉众数

B.中位数>平均数>众数

C.众数〉中位数〉平均数

D.众数〉平均数》中位数

74.一班学生的平均体重均为55公斤,二班学生的平均体重为52公斤,

两个班级学生体重的标准差均为5公斤。那么()

A.一班学生体重的离散限度大

B.二班学生体重的离散限度大

C.两个班学生体重的离散限度相同

D.无法判断

75.在假设检查中,假如所计算出的P值越大,那么检查的结果()

A.越不显著

B.越显著

C.越不真实

D.越真实

76.假如收入与支出之间的线性相关系数为0.92,并且两者之间具有记录显

著性,那么两者之间存在着()

A.高度相关

B.中度相关

C.低度相关

D.极弱相关

77.为了解某行业12月份利润状况,随机抽取5家公司,12月份利润额(单

位:万元)分别为65、23、54、45、39,那么这5家公司12月份利润额均

值为()

A.39

B.45.2

C.23.5

D.65

78.在假设检查中,不拒绝虚无假设意味着()

A.虚无假设是肯定对的的

B.虚无假设肯定是错误的

C.没有证据证明虚无假设是对的的

D.没有证据证明虚无假设是错误的

79.某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为

该比例(万)偏高。假如要检查该说法是否对的,则假设形式应当为()

A.H。:乃20.13;X:TT<0.13

B."o:万W0.13;修:灯>0.13

C.H():乃二0.13;H、;兀WO.13

D.Pi。:)>0.13;,:乃W0.13

80.下列哪种情况不适合用方差分析()

A.性别对收入的影响

B.专业对收入的影响

C.年龄对收入的影响

D.行业对收入的影响

二、名词解释

1.抽样单位与抽样框

2.普查与抽样调查

3.参数与记录量

4.方差与标准差

5.独立样本与配对样本

6.总体与样本

7.抽样分布

8.二维表

9.相关系数

10.组内均方

11.普查

12.误差减少比例

13.散点图

14.正态分布

15.最小二乘法

16.概率抽样

17.中位数

18.相关系数

19.区间估计

20.中心极限定理

21.假设检查

22.均值

23.虚无假设与替换假设

24.置信水平

25.离散系数

26.离散变量与连续变量

27.众数

三、简答题

1.判断以下随机变量是定性变量还是定量变量,假如是定量变量,拟定是离

散变量还是连续变量。

(1)网络供应商的姓名

(2)每月的网络服务费

(3)每月上网时间

(4)上网的重要目的

(5)上周收到的电子邮件数量

(6)每月用于网上购物的金额

(7)上月网上购物的次数

(8)使用的电脑的品牌

(9)上网是否玩游戏

(10)电脑是否带有光盘刻录机

2.调查方法重要涉及哪几种?简要说明各种方法的优缺陷。

3.什么是简朴一元线性回归分析?其作用是什么?

4.举例简要说明社会研究过程。

5.按测度水平,变量可分为哪几类?并举例说明。

6.简要举例说明在分析双变量的关系时,t检查和卡方检查的重要区别。

7.等距分组和不等距分组有什么区别?请举例说明。

8.举例说明什么是自变量和因变量,两者之间是什么关系?

9.简要说明卡方的拟合优度检查和独立性检查的含义。

10.条形图和直方图有什么区别?

11.简述众数、中位数和平均数作为测量中心趋势的指标所合用的数据类

型。

13.简要举例说明在分析双变量的关系时,t检查和卡方检查的重要区别。

14.举例说明什么是离散变量和连续变量。

15.SPSS重要有哪些功能?

16.在SPSS中如何定义变量属性?

17.登记表重要由哪几部分构成?

18.简述相关系数的取值与意义。

19.概率抽样方法重要涉及哪几种?

20.简要说明卡方的拟合优度检查和独立性检查的含义。

21.数据分析中的归纳法和演绎法分别是什么?

22.什么是简朴回归分析?其作用是什么?

23.一元线性回归模型中有哪些基本假定?

24.判断以下随机变量是定性变量还是定量变量,假如是定量变量,拟定是

离散变量还是连续变量。

(1)考研辅导班参与者的姓名

(2)家庭月消费

(3)温度

(4)上个月外出吃饭的次数

(5)产品等级

25.简述定类变量、定序变量和数值型变量集中趋势测量的方法。

26.如何对配对样本进行t检查。

四、计算题(每题15分,共30分)

1.某校社会学专业同学记录课成绩如下表所示。

社会学专业同学记录课成绩表

学号成绩学号成绩学号成绩

101023761010377510105270

101024911010387010105388

101025871010397610105493

10105

1010267810104090562

101027851010417610105695

101028961010428610105795

101029871010439710105866

101030861010449310105982

101031901010459210106079

101032911010468210106176

101033801010478010106276

101034811010489010106368

101035801010498810106494

101036831010507710106583

规定:

(1)对考试成绩按由低到高进行排序,求杰出数、中位数和平均数。

⑵对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频

率。

2.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地

区的有关数据。通过度析得到以下结果:

方差分析表

变差来源SSdfMSFSig.

回归ABCD0.000

残差205158.07EF——

1642866.6

总计711一一—

规定:

(1)计算上面方差分析表中A、B、C、D、E、F处的值。

(2)商品销售量的变差中有多少是由价格的差异引起的?

(3)销售量与价格之间的相关系数是多少?

3.某公司招聘职工时,规定对职工进行两项基本能力测试。已知,A项测

试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为

25分。一位应试者在A项测试中得了102分,在B项测试中得了215分。若两

项测试的成绩均服从正太分布,该位应试者哪一项测试更抱负?

4.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,

并对x、y进行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归

平方和SSR=1602708.6,残差平方和SSE=40158.07。规定:

(1)写出广告费用y与销售量程x之间的线性回归方程。

(2)假如广告费用投入50000元,根据回归方程估计商品销售量。

(3)计算鉴定系数R2,并解释它的意义。

5.为估计每个网络用户天天上网的平均时间是多少,抽取了225个网络用

户的简朴随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。

(1)试用95%的置信水平,计算网络用户天天平均上网时间的置信区间。

(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以

95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。

注:Z(),O25=1-96

6.某公司使用3种方法组装一种新的产品,为拟定哪种方法生产效率最高,

随机抽取30名工人,并指定每人使用其中的一种方法。通过对每个工人生产的

产品数进行分析得到下面的方差分析表。请完毕方差分析表。

变差来源SSdfMSFSig.

组间2100.000

组内3836——

总计29———

7.甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所

Zj\o

乙单位月收入分布表

按收入分组(元)人数(个)

3000分以下120

3000〜4000420

4000—5000540

5000~6000420

6000以上300

合计1800

规定:

(1)计算乙单位员工月收入的均值和标准差。

(2)比较甲单位和乙单位哪个单位员工月收入的离散限度更大?(提醒:

使用离散系数)

8.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过

去2023的有关数据,通过度析得到:方程的截距为363,回归系数为1.42,

回归平方和sSR=1600,残差平方和SSE=450o规定:

(1)写出销售量y与广告费用x之间的线性回归方程。

(2)假如明年计划投入广告费用为25万元,根据回归方程估计明年汽车销

售量。

(3)计算鉴定系数R:并解释它的意义。

9.某行业管理局所属40个公司2023年产品销售额数据如下所示。

40个公司2023年产品销售额

公司编公司编公司编公司编

销售额销售额销售额销售额

号号号号

1152111052110331136

2105121232210332146

3117131162313733127

497141152413834135

512415110259135117

6119161152611836113

7108171002712037104

88818872811

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论