社会统计学形考任务2021_第1页
社会统计学形考任务2021_第2页
社会统计学形考任务2021_第3页
社会统计学形考任务2021_第4页
社会统计学形考任务2021_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学形考任务1

表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入

SPSS软件,并(1)对考试成绩进行排序和分组(10分),(2)制作频数分布表(10分)

并绘制频数分析统计图(10分)。

请注意分组时按照下列标准:

AA,R4-RR-Cnp

分和00-1007A_7Q7Hs70-79An_A?n_sQ

表1某专业二年级同学社会统计学期末考试成绩(百分制)

学牛成绩学牛成绩学牛成绩学生成;绩学牛成绩

19R44S5RRR?70ino71

96。?0AS56oaRARRiinR。

36530305784XX111X7

42X31785XX3856X11266

sR5a.R65QQAR687“aR4

68733846095878X11483

77034876171889111585

86435856290897611678

951369363区60027117RI

1()5837966489918111881

119()38826589926111971

125039786683937212086

13R740SO67*494X6I7191

148241746844952912266

156542726968963712358

166843737089978212468

178644867184988212580

188045857286998212677

1981469073791008512755

2070476974781017812854

2180488675871028012962

2249498676881039013054

2380508477821048213165

2470518178831057213274

2559529079921068613370

2680533480861078013472

275254S481861088213573

(1)排序和分组见

步骤:排序:Data------SortCases------Sortby成绩(Ascending)

分组:Transform-----Recodeintodifferentvariables-----成绩----output-----成绩分组一

—1为90-00,2为86—89,3为83-85.......以此类推。详见作业l.sav。

(2)频数分布表如下图

步骤:Analyze-----DescriptiveStatistics-----Frequencies------成绩分组

成绐分创

Cumulative

FrequencyPercentValidPercentPercent

gildA139.69.69.6

42820.720.730.4

B+1611.911.942.2

B2216.316.358.5

B・85.95.964.4

C+43.03.067.4

C128.98.976.3

C-75.25281.5

D+53.73.785.2

D32.22.287.4

F1712.612.6100.0

Total135100.0100.0

(3)频数分布图如下:

步骤:Analyze------DescriptiveStatistics-------Frequencies-------成绩分组----Charts-------

Histograms(Withnormalcurve)o

Histogram

Mean=4.97

Std.Dev.-3.264

N-135

5ii____iii■i-

00020。40060080010.0312.00

成绩分机

社会统计学形考任务2

表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件;

(1)计算学生上网时间的中心趋势测量各指标(9分)和离散趋势测量各指标(12分)。

(2)计算学生上网时间的标准分(Z值)及其均值和标准差。(8分)

(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比

例。(6分)

表1某专业一年级同学一周上网时间(小时)

学生上网时间学生上网时间学生上网时间学生上网时间学生上网时间

113211841146188110

29222242762198210

38232243963248320

412241044864138421

582513451065218516

6262610461866218610

7132712472667108710

852822481468138821

93291949869208919

10183010501070219010

1133122511371129132

1210323052287215927

1320338531273269328

14193420541074209419

1515351755975179515

1683614561076199610

17837857127799720

1815381258247821988

19203915592679179914

202240136020801610018

①集中趋势各指标:均数为15.2、中位数为14.0、众数为10。离散趋势:四分位数分别

为P25为10、P50为14、P75为20、方差为39.515、标准差为6.286、极差为29。

步骤:Analyze------DescriptiveStatistics------Frequencies------上网时间----(勾选集中趋势指

标mean,median,mode,minimum,maximun离散趋势指标:quartiles,Variance,Std.deviation,

Range)

(2)标准分Z值(详见作业2.sav)。

步骤Analyze------DescriptiveStatistics------Descriptive------Savestandardizedvaluesas

varianles即可。

均数位15.2,标准差6.286

步骤Analyze------DescriptiveStatistics------Descriptive------Options------勾选(mean,

Std.deviation)

(3)一周上网时间超过20小时的学生所占比例21%。

步骤l:Analyze------SelectCases-------if上网时间>20h

步骤2:Analyze------DescriptiveStatistics------Descriptive——上网时间超过20h。得出上网时

间超过20h人数为21人,占总人数的21%。

社会统计学形考任务3

一、单项选择题(每题2分,共20分)

试题1

某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名

学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、

93九名同学进行调查。这种调查方法属于()。

正确答案是:系统抽样

试题2

以下关于因变量与自变量的表述不正确的是()

正确答案是:自变量的变化是以因变量的变化为前提

试题3

某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,11。,

111,114,115,下列哪种图形最适合描述这些数据()。

正确答案是:线图

试题4

以下关于条形图的表述,不正确的是()

正确答案是:条形图的矩形通常是紧密排列的

试题5

某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差

为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩

考得更好。

正确答案是:数学

试题6

有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,

标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是()

正确答案是:甲的离散程度小,稳定性水平高

试题7

下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组。

组另按年龄分组(岁)工作人员数(人)

120-246

225-2914

330-3424

435-3918

540-4412

645-4918

750-5414

855-596

112

合计

正确答案是:第5组

试题8

对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量

之间()

正确答案是:相关程度越小

试题9

回归平方和(SSR)反映了y的总变差中()

正确答案是:由于x与y之间的线性关系引起的y的变化部分

试题10

正确答案是:年龄对收入的影响

二、名词解释(每题5分,共20分)

非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符

合概率抽样要求的抽样都称为非概率抽样。

试题12

二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1

分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表

试题13

置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的

次数所占的比例

试题14

卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假

设分布所作的假设检验,即根据样本的频数分布来推断总体的分布

三、简答题(每题10分,共30分)

等距分组和不等距分组有什么区别?请举例说明

答(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度

等其它特征时,这种变量称为定类变量。例如:性别

0定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程

度等序次差异时,这种变量称为定序变量。例如:学历

0定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同

类别之间的数量差别和间隔差距时,这样的变量称为定距变量。例如:智商

④定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,

这样的变量称为定比变量。例如:收入

试题16

简述相关系数的取值与意义

答:相关系数的取值在-1~1之间;相关系数的正负号表示两个变量相关关系的方向,“+”

表示正相关,“「表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关

程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0

时,只能说变量之间不存在线性相关,而不能说它们之间不相关

试题17

简述什么是简单回归分析?其作用是什么

答(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个

变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的

数量伴随关系。

(2)回归分析的作用包括:

①从已知数据出发,确定变量之间的数学关系式;

②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;

③利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。四、

计算题(共30分)

一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生

的平均体重为50千克,标准差为5千克。请问:

(1)是男生体重差异大还是女生体重差异大?为什么?

(2)男生中有多少比重的人体重在55千克-65千克之间?

(3)女生中有多少比重的人体重在40千克-60千克之间?

备注:4)(1)=0.8413,4)(2)=0.9772

答:

S里5cS力5c.

Va=-37—=—=0.083va=——=——=0.1

"男60(3分)750(3分)

v男<、'女,所以女生体重差异比男生大.(1分)

(2)P(55<X<65)=d»[(65-60)/5]-d»[(55-60)/5]

=4»(1)—e(-1)=4»(1)—[1—4»(-1)]

=24)(1)-1(3分)

由题得,<i>(1)=0.8413,所以2巾(1)-1=0.6826,即68%的男生体重在55

千克-65千克之间。(1分)

(3)P(55*65)=4»[(60-50)/5]一小[(40-50)/5]

=4»(2)—@(-2)=e(2)—[1—*(-2)]

=24)(2)-1(3分)

由题得,由(2)=0.9772,所以26(2)-1=0.9544,95%的女生体重在40千克-60

千克之间。(1分)

试题19

为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过

分析得到以下方差分析表:

变差来源SSdfMSFSig.

回归1602708.6BDF0.000

残差40158.08CE————

总计A11______

要求:

(1)计算上面方差分析表中A、B、C、D、E、F处的值。

⑵商品销售量的变差中有多少是由价格的差异引起的?

答:

变差来源SSdfMSFSig.

回归1602708.611602708.6399.10.000

残差40158.08104015.808——

总计1642866.6811———

SSR1602708.64

R=---=----------=0.9756

(2)SST1642866.68

即商品销售量:的变差中有97.56蝎是由广告费用引起的。(3分)

社会统计学形考任务4

一、单项选择题(每题2分,共20分)

试题1

以下关于因变量与自变量的表述不正确的是()

正确答案是:自变量是引起其他变量变化的变量

试题2

某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小

时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为

()

正确答案是:5.5小时

试题3

以下关于条形图的表述,不正确的是()

正确答案是:条形图的矩形通常是紧密排列的

试题4

下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组

组别按年龄分组(岁)工作人员数(人)

120-246

225-2914

330-3424

435-3918

540-4412

645-4918

750-5414

855-596

合计112

正确答案是:第5组

试题5

某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差

为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成

绩考得更好.

正确答案是:数学

试题6

在假设检验中,不拒绝虚无假设意味着()

正确答案是:没有证据证明虚无假设是错误的

试题7

根据一个样本均值求出的90%的置信区间表明()

正确答案是:总体均值有90%的概率会落入该区间内

试题8

在回归方程中,若回归系数等于0,这表明()

正确答案是:自变量x对因变量y的影响是不显著的

试题9

中心极限定理认为不论总体分布是否服从正态分布,从均值为外方差为。2的总体中,抽

取容量为n的随机样本,当n充分大时(通常要求*30),样本均值的抽样分布近似服从

均值为()、方差为()的正态分布。

正确答案是:n,o2/n

试题10

下列哪种情况不适合用方差分析()

正确答案是:年龄对收入的影响

二、名词解释(每题5分,共20分)

试题11

整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子

群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。

试题12

Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总

体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式

为:Z=(X—]i)/o

试题13

二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1

分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

试题14

误差减少比例:在预测变量Y的值时,知道变量X的值时所减少的误差(一)与总误差的比

值称为误差减少比例,简称PRE

三、简答题(每题10分,共30分)

试题15

判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变

量。

(D网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的

(5)上月网购次数

答(1)网络供应商的姓名:定性(2分)

⑵每月的网络服务费:定量、连续变量(2分)

⑶每月上网时间:定量、连续变量(2分)

④上网的目的:定性(2分)

®上月网购次数:定量、离散变量(2分)

试题16

简述什么是简单回归分析?其作用是什么?

答(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个

变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的

数量伴随关系。

(2)回归分析的作用包括:

①从已知数据出发,确定变量之间的数学关系式;

②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;

试题17

如何对配对样本进行t检验。

答:配对样本检验主要是判断不同的处理或试验结果是否有差异。配料羊本的t检验用于检

验两个相关的样本是否来自具有相同均值的总体。在对配对样本进行t检验时,首先计算两

个样本中每个对应变量之间的差值;然

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论