社会统计学(第2版)课后习题答案-5-8习题_第1页
社会统计学(第2版)课后习题答案-5-8习题_第2页
社会统计学(第2版)课后习题答案-5-8习题_第3页
社会统计学(第2版)课后习题答案-5-8习题_第4页
社会统计学(第2版)课后习题答案-5-8习题_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章类别变量与尺度变量关系的描述统

1.下表是某高校分属三个专业的18名研究生入学英语考试成绩。

某高校三个专业的18名研究生入学英语考试成绩单位:分

专业成绩

专业一.W859288889089

专业二泗828491788683

专业三>'3/818287907880

要求:计算相关比率,说明专业与英语考试成绩是否相关。

解:由题目数据计算可得:

%=88.7,%=84,%=83,y=85.2

6663力

Z此=47198,Z氏=42430,Z此=41438,££芯=⑶066

7=17=1y=lJ«1y=l

*31,

耳,£(先-刃2二ZX¥一〃F=131066-18X85.22=40328

1=1j=l/=!j=\

tn3、

G=之之(力-工)、之和“力律

Mj=iIy=i)

=(47I98-6X88.72)+(42430-6X842)+(41438-6X832)

=189.86

403.28-189.86

PRE=E一&=0.5292

E\403.28

计算相关比率得es=0・73。

由误差消减比例看,消减掉的误差占总误差的53%左右,相关比率达到().73

说明专业与英语考试成绩有一定的相关性的。

2.下表是15名工人分别使用三种方法装配一件仪器所需时间。

15名工人分别使用三种方法装配一件仪器所需时间单位:分钟

方法时间

方法一列1213121518

方法二如1516162022

方法三功1618192428

要求:

(1)绘制三种方法所需平均时间的条形图;

(2)计算相关比率,说明装配方法是否对装配时间有影响。

解:(1)绘制条形图。

根据题目数据计算可得:工=14,%=17.8,%=21,t=17.6,

得到条形图图5-1,

均25.00-

20.00-

15.00-

10.00-

5.00-

0.00

方法1方法2方法3

方法

图5-1三种方法所需平均时间的条形图

(2)计算相关比率。

计算可得:

ty;j=1006,14=1621,£氏=2301

>17=1;=1

XX=4928

f=l/=1

m43ni

&=一»=ZE片一〃尸=4928-15x17.62=281.6

1=17=11=1j=l

m33n;、

七2=2之(用-犷=之之苫-%律

i=lj=li=l\y=l)

=(1006-5X142)+(1621-5X17.82)+(2301-5x212)

=158.8

E.-E281.6-158.8

PRE=2=0.4361

Ei-281.6

计算相关比率得eta=0.66。

由误差消减比例看,消减掉的误差占总误差的40%左右,相关比率达到0.66,

可见不同的装配方法对装配时间有明显的影响,具有一定的相关性。

3.为了解大学生网购的情况,某学院进行了一次小型调查,被调查的20名

学生在过去的三个月里网购次数的情况如下所示:

按性别整理的调查结果

性别网购次数

男加38640510

女刘78319091051232

按专业整理的调查结果

专业网购次数

专业一y\j3505

专业二yij841783123

专业三功602190910

要求:

(1)计算性别与网购次数的相关比率,说明被调查者的性别与其网购次数

是否有关

(2)计算专'也与网购次数的相关比率,说明被调查者的专业与其网购次数

是否有关

解:(1)计算性别与网购次数的相关比率。

根据题目数据计算可得:

五=3.375,%=5.75,了=4.8

2优=151,£用=567

J=Ij=i

ZEX>=151+567=718

r=l;=1

m%3n)

2

Ei=££(y,?-»=—〃92=718—20X4.8=257.2

/=1/=!/=1/=1

mn,2(%、

£2=EZ(X)-X)2=E之片一勺律

/=lj=l/"1\)

=(151-8x3.3752)-(567-12x5.752)=230.125

——二257.2"25=。」1

E、257.2

eta=0.33

由误差消减比例看,消减掉的误差占总误差的10%左右,相关比率为Q33,

可见被调查者的性别而网购次数有一定影响,但相关性并不很高。

(2)计算专业与网购次数的相关比率。

根据题目数据计算可得:

豆=3.25,y2=5.75,%=4.625,y=4.8

m叫3,看

i=lj=li=lIj=1

=(203.25-5x6.12)+(70-7x32)+(17.5-4xl.752)

=29.45

-XJ6.86-29.45:06侬

476.86

々”0.785

由误差消减比例看,消减掉的误差占总误差的61.68%,相关比率高到().785,

可见被调查者做家务时间与其原居住地区类型之间有比较强的相关性。

5.在东、中、西部三个地区随机抽取了16个环保重点城市2014年空气质量

达到及好于二级的天数数据如下表所示。

环保重点城市空气质量达到及好于二级的天数

东部地区中部地区西部地区

168135187

239229134

276188202

18893254

302179

344230

资料来源:中华人民共和国统计局.中国统计年鉴:2015.北京:中国统计出版社,2015.

要求:根据上表数据,

(1)绘制2014年三个地区抽取的环保重点城市空气质量达到及好于二级天

数均值的条形图。

(2)计算相关比率,并说明地区与相应的环保重点城市空气质量达到及好

于二级的天数之间是否相关。

(1)绘制条形图。

根据题目数据计算可得:7,=252.83,y2=161.25,勇=197.67,y=209.25,

得到条形图图5-2,

图5-2三个地区抽取的环保重点城市空气质量达到及好于二级天数均值的

条形图

(2)计算相关比率。

计算可得:

X就=406405,£居=114659,之用=243186

7=17=1j=l

次1%=764250

r=l;=1

m叫3nj

E=y广田2=££%—"F=764250-16x209.252=63618

f=l>1i=l>1

£2=EE<^-y/)2=E♦%-勺律

i=lj=li=l\j=l,

=(406405-6x252.832)+(114659-4xl61.252)+(243186-6x197.672)

=42265.1232

—-=63681-42265.1232=03363

E,63681

计算相关比率得々4=0.58。

由误差消减比例看,消减掉的误差占总误差的34%左右,相关比率为Q58,

可见不同地区与相应的环保重点城市空气质量达到及好于二级的天数之间具有

一定的相关性。

第6章概率与随机变量的概率分布

1.某社区关爱老年人协会共有40名志愿者,其中3名男性,现需要选取5

人组成一个工作组到另一个社区做交流。问:

(1)5名志愿者都是女性的概率为多少?

(2)5名志愿者中有2位男性的概率为多少?

解:设随机事件A=5名志愿者都是女性;随机事件B=5名志愿者中有2位

男性。本题的基本事件的个数为〃=仁)。

(1)计算5名志愿者都是女性的概率。

5名志愿者都是女性这样的组合个数为%=C;7,

则P(4)=吆=冬=0.662。

(2)计算5名志愿者中有2位男性的概率。

5名志愿者有2名男性这样的组合个数为的产

则P(B)=^=冬冬=0.035。

2.某社区卫生院所辖甲、乙、丙三个居民小区,各居民小区人数分别占三

个小区总人数的LL』,甲、乙、丙三个小区居民平均每天锻炼超过30分钟的

4312

人数占各小区总人数的,,一。求:

245

(1)从这三个小区中随机选取一个人,此人平均每天锻炼超过3()分钟的概

率;

(2)从这三个小区中随机选取一个人,发现此人平均每天锻炼超过30分钟,

此人属于乙小区的概率。

解:(1)计算从这三个小区中随机选取一个人,此人平均每天锻炼超过30

分钟的概率。

设随机事件&=抽取一个人为甲小区居民,他=抽取一个人为乙小区居民,

人内=抽取一个人为丙小区居民

8=抽取一个人平均每天锻炼超过30分钟,

则同为产一个人为甲小区居民且平均每天锻炼超过30分钟,依此类推。

由题意可知,

p(AQ=J,P(B|Aj=;;P(&)=!,P(B|AJ=;;

ILJI

P%)4,P(B|A丙)《

P(8)=P(A/(8&J+P(AQP(8Mj+P(4j)P(8|Aj

1111517

=-X--卜—X--1--X—=--

423412524

(2)计算从这三个小区中随机选取一个人,发现此人平均每天锻炼超过30

分钟,此人属于乙小区的概率。

「入⑻=3」(切尸(即乙)=3=2

P(B)P(B)2_7

24

3.某人花2元钱买一张彩票,他抽中100元奖的概率是0.1%,抽中10元奖

的概率是1%,抽中1元奖的概率是2()%。己知各种奖不能同时抽中,求:

(1)此人中奖的概率分布;

(2)此人中奖金额的期望值;

(3)此人中奖金额的标准差。

解:

(1)计算此人奖金的概率分布。

设此人买彩票的收益为X,X的概率分布如表6-2所示。

表6-2某人买彩票奖金的概率分布表

Xi0110100

Pi78.9%20%1%0.1%

(2)计算此人中奖金额的期望值。

£(X)=^x,.p/=0x78.9%4-1X20%+10xl%4-100x0.1%=0.4(元)

(3)计算此人中奖金额的标准差。

计算过程如表6-3所示。

表6-3某人购买彩票收益的标准差计算过程

2

XPiX-E(X)[X-E(X)]Piix-E(x)y

078.9%-0.40.160.12624

120%0.60.360.072

101%9.692.160.9216

1000.10%99.69920.169.92016

D(X)=E[X-E(X)]2=£因-凤X)]4

f=l

=0.12624+0.072+0.9216+9.92016=11.04

所以标准差b=Jax尸Ju.04=3.32o

或者运用公式D(X)=E[X-E(X)]2=E(X2)-[E(X)]2,

E(x2)=Nx;Pi=02x78.9%+l2x20%+102xl%+1002x0.1%=11.2

f=l

D(X)=E(X2)-[E(X)]2=11.2-O.42=11.O4

标准差仍为b=7^(X)=711.04=3.32o

4.设X-N(5,32),求:

(1)P(X<8);

(2)P(3<X<8)0

解:由于X-N(5,3?),所以--N(0,l)。

3

(1)计算尸(XV8)的值。

v*_5Q_5V_c

P(X<8)=P(^^<^^)=P(^^<l)=(D(l)=0.8413

333

(2)计算尸(3vX«8)的值。

尸(3<X«8)=尸二<容(?)=崎<容小)

33333

=0(1)-6(-0.67)=O(l)-[l-0(0.67)]=0.8413-1+0.7486=0.5899

5.已知X~N(O,1),P(X>x)=0.05,求x的值。

解:查表可得工=2。=Z005=1.64o

6.已知X〜N(0』),P(X<x)=0.975,求x的值。

解:因为P(X<JV)=0.975,所以P(XNx)=l-0.975=0.025。

查表可得:x=Za=Z002S=1.96o

7.一次统计学测验的均值为78分,标准差为1()分,求

(1)93分与62分对应的标准分数

(2)标准分数-().5与1.5对应的分数。

解;(1)计算93分与62分对应的标准分数。

_93-78_62-78,/

Z793--jo--1.5,Z-------=—1.0

6210

(2)计算标准分数-0.5与1.5对应的分数。

设标准分数-0.5对应的分数为小

r1一78,U

乙­=1.5

、10

得%=93o

设标准分数L5对应的分数为),,

Z、.=W—5

'10

得y=63。

8.某同学在两次统计学考试中的成绩分别为78分与82分。第一次考试全

班的平均成绩为75分,标准差为5分;第二次考试全班的平均成绩为8()分,标

准差为6分。问:该同学在两次考试中哪一次的成绩更理想。

解:用Z分数来衡量两次考试的相对理想程度。

4=土4=生上=0,6,表明他在第一次考试中比全班平均成绩高0.6个

巧5

标准差;

Z2=歪二改=与丝=0.33,表明他在第二次考试中比全班平均成绩高0.33

(J26

个标准差。

可见,他在第一次考试中的成绩更理想一些。

9.已知某生产线生产的袋装食品的平均重量是500克,标准差为5克。如

果某天平均每袋食品的重量高于或低于平均重量的2个标准差,就认为该生产线

需要进行调节。下面是某一周该生产线生产的袋装食品的平均重量。

某一周生产线生产的袋装食品的平均重量单位:克/袋

时间周一周二周三周四周五周六周日

平均重量502498505492489506508

要求:判断4匕产线是否需要调整。

解:平均重量的2个标准差范围为(500-5x2,500+5乂2),即(49(),510)»

可见,周五的平均重量超出了这个范围,这天的生产线需要进行调整。

10.已知/~,(20),尸02x)=0.025,求♦的值。

解:因为3/(20),P02x)=0.025。所以尤rhoxQO)。

查表得:x=rOO25(2O)=2.086o

2

il.已知/~/(12),P(Z>x)=0.05,求x的值。

2

解:因为/(⑵,P(Z>X)=0.05,所以x=/oos(12)。

查表得:x=/)(晨12)=21.026。

12.已知产~尸(5,10),尸(尸>x)=0.90,求x的值。

解:因为尸~尸(510),P(F>x)=0.90,所以X=纥9O(5,1O)=————

%o(lO,5)

查表可得:玲」。(10,5)=3.30,得力=59G(5,10)=」一=0.303。

3.30

第7章大数定律、中心极限定理与抽样分

1.某快餐厅过去3年的日均营业额为3()00元,标准差为500元,服从右偏

分布。现从中随机抽取100天组成一个样本,问:

(1)这个样本均值的标准差为多少?

(2)这个样本均值大于3050的概率为多少?

解:(1)计算这个样本均值的标准差。

_5OO2

根据中心极限定理,X7V(3OOO,—),

所以这个样本均值的标准差为:

_<7_50()_.n

“"TH-Vfoo

(2)计算这个样本均值大于3050的概率。

3050-3000

P(X>3050)=l-P(X<3050)=1-0)=1-0(1)

5()

=1-0.8413=0.1587

2.已知某城市初生婴儿的身高(单位:厘米)基本服从正态分布,即乂~

/V(50,32),如果从数千个该城市一周岁幼童中随机抽取4个孩子作为样本测量他

们的身高,并计算样本均值,共抽取150次.问:有多少个样本均值为53厘米

或更高?

解:根据中心极限定理,G~N(50,—),

4

(53_cn、

P(X>53)=1-P(X<53)=1-O~~~=1一①(2)=1—0.9772=0.0228

I3/V4)

即这15()个样本中均值为53厘米或更高的期望个数为0.0228xl5()a3个。

3.某蔬菜合作社1500户农户,上周平均销售额〃=3100元,标准差。=350

元。现随机抽取49户作为随机样本,问:该样本在上周平均销售额低于3000

元的概率是多少?

解:由于〃=49>30,根据中心极限定理,该样本平均销售额又近似服从

3502

N⑶00,玄)。

3000-3100

P(X<3000)=①=O(-2)=1-①(2)=1-0.9772=0.0228

350/7

即这个样本在上周平均销售额低于3000元的概率只有2.28%。

4.抛掷一枚均匀的硬币12()次,正面出现的次数占40%到60%的概率为多

少?

解:抛掷一枚均匀的硬币120次可以看作从抛掷一枚硬币的所有结果这一无

限总体中随机抽取的一个样本。总体中正面出现的概率P=0.5,根据样本频率

的抽样分布,可得:

P(l—P)0.5x(1-0.5)

-----=---------=O.OOZ

p〜NQ5,0.002)

>八“/一、不/0.6-0.5)小(0.4-0.51

P(0.4<p<0.6)=0)/一①.

(V0.002)(V0.002)

=0(2.24)中(2.24)=20(2.24)1=2x0.98751=0.975

即抛掷一枚均匀的硬币120次,正面出现的次数占40%到60%的概率为0.975。

5.在某市考上大学的应届毕业生中随机抽取容量为500人的样本进行调查,

发现女同学有286人,则这样抽取的容量为500的随机样本中考上大学的女同学

所占比例的标准差为多少?

解:由题意得p=286/500=0.572。

根据中心极限定理,大样本情况下,样本频率P~N(肛型二艰)。由于总体

n

频率未知,用样本频率代替。所以这样抽取的容量为500的随机样本中考上大学

的女同学所占比例的标准差为:

0.572x(1-0.572)=0.022二2.2%

500

6.已知某地区9岁男童的体重(单位:公斤)基本服从正态分布X~7V(32,22),

现随机抽取容量为100的该地区9岁男童组成样本,问:样本方差分布的均值与

标准差分别为多少?

解:由题意得:,=100,cr2=22=4o

在总体服从正态分布的情况下,・炉(〃一1)

/空跖=〃_1=91%2)="1

即样本方差分布的均值顼S2)=〃=4

2

£>5:产'=2(„_i)^^ZlL£>(s)=2(n-l)

即样本方差分布的方差D(S2)=—cr4=-----x24=0.3232

n—\100-1

所以,样本方差分布的标准差为疯变到=().57。

第8章参数估计

1.从一个总体中采用放回抽样的方法抽出一个容量为5()的样本,样本均值

为25,样本标准差为2,求总体均值〃的95%的置信区间。

解:由题意可知,

n=50>30,元=25,s=2,a=0.05。

大样本情况下,总体均值〃的置信区间为x-za/2-^,x+zaf2^

查表得Zoo25=1.96,代入数据得,

25-1.96x3,25+1.96x3

V50V50J

计算得置信区间为[24.45,25.55]o

2.从总体中抽取一个〃=100的简单随机样本,得到了=104,样本标准差

s=85,要求:

(1)构建总体均值〃的90%的置信区间。

(2)构建总体均值〃的95%的置信区间。

(3)构建总体均值"的99%的置信区间。

(4)观察置信度对置信区间的影响

解:样本容量〃=10030,为大样本情况,总体均值〃的置信区间为

又一Za/2^,又+Za/2^]。

(1)计算总体均值JJ的90%的置信区间。

«=0.1,查表得405=1.64,代入数据得,

104-1.64x-^=,104+1.64x-^=

_Vioo7155」

计算得置信区间为[90.06/17.94]o

(2)计算总体均值〃的95%的置信区间。

a=0.05,查表得%025二1・96,代入数据得,

104—1.96xJJ04+1.96xJ

LViooViooJ

计算得置信区间为[87.34,120.66]。

(3)计算总体均值〃的99%的置信区间。

a=0.01,查表得%0G5=2.58,代入数据得,

104—2.58x/,104+2.58x/

_V100ViooJ

计算得置信区间为[82.07,125.93].

(4)通过(1)(2)(3)的结果可见,置信度越高,估计的可靠性越强,但

置信区间随之变宽,精确性变差。

3.利用下面的信息,构建总体均值〃的置信区间:

(1)总体服从正态分布,s=50,H=15,X=8OOO,,置信度为95%。

(2)总体不服从正态分布,5=50,=64,7=8000,,置信度为95%。

解:(1)总体服从正态分布,标准差未知,总体均值〃的置信区间为

又一卡,又+%25]。

查表得%2(〃T)=,0.025(14)=2.145,

代入数据得,

80(H)-2.145x卷,80()0+2.145x器

_V15V15J

计算得置信区间为[7972.3,8027.7]。

(2)样本容量〃=64〉30,属于总体方差未知的大样本情况,总体均值〃的

置信区间为X-Za/2-^=,X+ZM2苧],

查表得2。必二1-96,代入数据得,

x±za/2-^==8000-1.96x—,8000+1.96x—

-\JnL88_

计算得置信区间为[7987.75,8012.25]。

4.为检验产品的豆量,某企业质检人员每天从当天产品中随机抽取12包过

秤检验。某天秤得的重量如下:

抽检结果单位:千克

9.910.110.310.410.510.29.79.810.110.09.810.3

假定重量服从正态分布,请根据此数据估计该产品平均重量的95%的置信区

间。

解:由题意可知,〃=12,a=0.05,总体方差未知时正态总体均值的置信

区间为X-ta/2

计算可得工=10.1,s=0.26,查表得fog。1)=2201,

代入数据得,

10.1-2.201x黑,10.1+2.201x0.26]

正_|'

计算得该产品平均重量的95%的置信区间为[9.93,10.27]千克。

5.为了解购买保湿护肤产品顾客的平均年龄,某品牌化妆品随机抽取购买

保湿护肤产品的16位顾客进行调查,得到样本均值为30岁,样本标准差为8

岁,假定顾客的年龄近似服从正态分布,试求购买保湿护肤产品顾客平均年龄的

置信度为95%的置信区间。

解:由题意可知,/?=16,x=30,5=8>a=0.05,总体方差未知时正态

-2卡,

总体均值的置信区间为

查表得43(15)=2.131,

代入数据得,

Q

30-2.131x>,30+2.131x

计算得购买保湿护肤产品顾客的平均年龄置信度为95%的置信区间为

[26,34]岁。

6.某高校从总体中随机抽取了200人组成样本,对其旷课原因进行问卷调

查。有60人说他们旷课是由于任课教师讲课枯燥。请对由于这种原因而旷课的

学生的比例构造95%的置信区间。

解:由题意可知,n=200,〃=〃]/〃=60/200=0.3,a=0.05。

n]=60>5,n2=200-60=140>5,符合对总体比例估计的大样本要求。

总体比例的的置信区间为P-Z'all,P+Z

查表得z°g=L96,代入数据得,

0.3-1.96x0.3+1.96X

计算得这种原因旷课的学生比例的置信区间为[0.24,0.36]。

7.从两个正态总体中抽取两个独立的随机样本,它们的均值和标准差如下

表所示:

两个样本的均值与标准差

来自总体1的样本来自总体2的样本

X,=35元2=30

5;=12s;=18

要求:(1)已知“=%=100,求从-〃2的95%的置信区间

(2)已知%=10,〃2=20,求必-人的95%的置信区间

(3)已知,=,t2=10,求〃]-外的95%的置信区间

解:(1)吗=%=100>30属于大样本情况,总体均值差的置信区间为:

查表得z°ss=1.96,代入数据得,

(35-30)-l.96x.—+—,(35-30)+1.96X.—+—,

'7V100100v)V100100

计算得置信区间为[3.93,607]。

(2)属于正态总体方差未知但相等的小样本事件,总体均值差的置信区间

(不2)-%2$卬+,,(不-》2)+%2sx4+L

c2_(%-l)s;+(%一1)$_(10-1)x12+(20-1)x18/一

S\y———10.V/

(4+%-2)(10+20-2)

查表得八025(10+20-2)=2.048,代入数据得,

(35-30)-2.048xJl6.07x^+^J(35-30)+2.048xJl6.07'('+'

计算得置信区间为[1.82,8.18]。

(3)属于正态总体方差未知但样本相等的小样本情况,总体均值差的置信

区间为

(元一鼠)一%2,工*~+上,(无~.)+2*」

%丫〃I〃2」

2=(勺(10_l)xl2+(10_l)xl8

懵一(勺+%一2)~-(10+10-2)

查表得QO25(10+10-2)=2.101,代入数据得,

rII>11

(35-30)-2.101x15x—J,(35-30)+2.101x/15xio+lo

计算得置信区间为[1.36,8.64]。

或者,当了=%时,

11]=(勺-1诉+(4一1局(11'

nJ(勺+%-2)n2>

s:+s:2s;+s;2s;s;

----------•—=+——

2/?!2/?2勺n-,

卜史

(35-30)-2.l()lx+(35-30)+2.101xJ^1°

计算得置信区间仍为[1.36,8.64]。

8.为调查甲乙证券公司投资者的投资存款额,分别从两家证券公司抽取由

64名投资者组成的随机样本,样本均值分别为45万元和32.5万元,标准差分别

为9.2万元和9.6万元°试求这两个讦券公司投资者平均投资存款额之差4-4的

置信度为95%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论