统计学概论(第2版)习题答案_第1页
统计学概论(第2版)习题答案_第2页
统计学概论(第2版)习题答案_第3页
统计学概论(第2版)习题答案_第4页
统计学概论(第2版)习题答案_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论

1.1单选题

1-5DDACB

1.2多选题

1.BDE2.CD3.ABD4.ABCDE5.CD

1.3简答题

1.什么是统计学?

统计学是一门关于数据的学科,是一门收集、整理与显示、分析、解释统计

数据,并从数据中得出结论的科学。

2.统计学的发展都经历了哪几个时代?

古典统计学时代:代表学派有国势学派和政治算数学派。国势学派代表人物

是康令和阿亨瓦尔,提出了••统计学”之名,但无统计学之实;政治算数学派代

表人物是威廉•配第和约翰•格朗特,威廉•配第的代表作是《政治算数》,马克思

称其为“政治经济学之父”,约翰•格朗特的代表作是《关于死亡表的自然和玫治

观察》,被后人称为“人口统计学之父”。政治算数学派被认为虽无统计学之名,

但有统计学之实。

近代统计学时代:代表学派有数理统计学派和社会统计学派。数理统计学派

代表人物为凯特勒,被称为“统计学之父”,使统计学发展进入了一个新的台阶,

由描述到推断;运用了大量观察法。社会统计学派代表人物是恩格尔。

现代统计学时代:是统计学发展最辉煌的时期。

3.统计数据有哪儿种类型?不同类型的数据有哪些特点?

按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照

统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间

的关系,分为截面数据和时间序列数据。

按计量尺度分时:分类数据中各类别之间是平等的并列关系,各类别之间的

顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其

结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控

制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描

述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时

间序列数据所描述的是现象随时间而变化的情况。

4.举例说明什么是有限总体和无限总体?

总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限

总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。比如,由若

干个企业构成的总体就是有限总体,一批待检验的灯泡也是有限总体,一所学校

的所有学生、某单位的所有职工等等都可构成有限总体。

无限总体是指总体所包括的元素是无限的、不可数的。例如,在科学试验中,

每一个试验数据可以看做一个总体的一个元素,而试验则可以无限地进行下去,

因此由试验数据构成的总体就是一个无限总体。

5.变量有哪几种类型?

变量按其反映数据的计量尺度不同,可分为3种类型:分类变量、顺序变量

和数值型变量.分类变量是指说明事物类别的一个名称,其数值表现就是分类数

据。顺序变量是指说明事物有序类别的一个名称,其数值变现是顺序数据。数值

型变量是指说明数字特征的一个名称,数值表现是数值型数据。

6.什么是离散变量?什么是连续变量?

数值型变量按其取值是否连续可以分为离散型变量和连续型变量。

离散型变量就是其取值可以用整数一一列举的变量。例如,企业个数,学生

人数,产品数量等,这些变量值只能用整数表现,且只能取有限个值,取值都以

整数位断开。

连续型变量就是其取值可以无限分割而不能一一列举的变量。例如,人的身

高,体重,收入等,这类变量的取值在两个整数之间可有无限个数值,且取值是

连续不断的。

1.4分析题

(1)总体是2010年我国所有网购消费者。

(2)分类变量。

(3)平均网购次数。

(4)参数。

(5)推断统计法。

第二章统计调查

2.1单选题

1-8CBDDDBBA

2.2多选题

1.ACE2.ABC3.ABCDE4.BCDE5.ABCDE

2.3简答题

1.简述普查与抽样普查的特点。

普查的特点:普查具有周期性;

普查规定统一的标准时点;

普查是全面调查;

普查适用对象较窄。

抽样调查的特点:抽样调查具有经济性;

抽样调查具有时效性;

抽样调查具有准确性;

抽样调查具有适应性。

2.统计数据的具体收集方法有哪些?

有询问调查法、观察法、实验法。

其中询问调查法具体包括访问调查法、邮寄调查法、电话调查法、电脑辅助

调查法、网络调查法、座谈会、个别深度访问等。

3.统计调查方案包括哪儿个方面的内容?

调查目的、调查对象和调查单位、调查项目和调查表、调查时间、调查工作

组织计划。

4.高质量的统计数据有哪几个方面的要求?

(1)精度,即最低的抽样误差或随机误差;

(2)准确性,即最小的非抽样误差或偏差;

(3)关联性,即满足用户决策、管理和研究的需要;

(4)及时性,即在最短的时间内取得并公布数据;

(5)一致性,即保持时间序列的可比性;

(6)经济型,即在满足以上标准的前提下,以最低的成本取得数据。

的质量,为进一步整理和分析打下基础。

(2)数据筛选。对审核过程中发现的错误应尽可能的予以纠正。调查结束

后当数据中发现的错误不能予以纠正,或者有些数据不符合调查的要求而无法弥

补时,就需要对数据进行筛选。

(3)数据排序。数据排序是按照一定的顺序将数据排列,以便初步显示数

据的一些明显特征和规律,为研究者找到解决问题的线索。

2.分类数据和顺序数据的整理和显示方法各有哪些?

分类数据的整理的方法主要有:频数、比例、百分比、比率;

分类数据的显示的图形主要有条形图、饼形图和环形图。

适合于分类数据整理与显示的方法同样适合于顺序数据,除此之外,顺序数

据还有自己的整理的方法:(1)累积频数:就是将各类别的频数逐级累加起来,

其方法有两种:一是向上累积,二是向下累积.

(2)累积频率或百分比:就是将各类别的百分比逐级累加起来也有向上累

积和向下累积两种方法。

适合顺序数据的显示图形有:累积频数分布图(包括向上累积频数分布图和

向下累积频数分布图)。

3.饼图和环形图有什么不同?

环形图与饼图类似,但又有区别。环形图中间有一个“空洞”,总体中的每

一部分数据用环中的一段表示。饼图只能显示一个总体各部分所占的比例,对于

研究结构性问题十分有用。而环形图则可以同时绘制多个总体的数据系列,每一

个总体的数据系列为一个环。因此环形图可以显示多个总体各部分所占的相应比

例,从而有利于进行比较研究。

4.数值型数据的分组方法有哪些?简述组距分组的步骤。

数值型数据的分组方法有单变量值分组和组距式分组两种。

组距式分组的步骤:第一步:确定组数:

第二步:确定各组的组距;

第三步:确定每一组的上限和下限;

第四步:根据分组整理成频数分布表。

5.直方图与条形图的区别体现在哪些方面?

(1)条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;

直方图是用面积表示各组频数的多少。矩形的高度表示每一组的频数或频率,宽

度则表示各组的组距,因此其高度宽度均有意义。

(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形

图是分开排列。

(3)条形图主要用于展示分类数据。直方图主要用于展示数值型数据。

6.与直方图相比,茎叶图有哪些优点?

茎叶图是由“茎”和“叶”两部分组成的、反映原始数据分布的图形。其图

形是由数字组成的。通过茎叶图,可以看数据的分布形状及数据的离散状况。与

直方图相比,茎叶图既能给出数据的分布状况,又能给出一个原始数值,即保留

了原始数据的信息。而直方图不能给出原始数值。

7.统计表由哪儿个主要部分组成?

统计表的构成可以从表式和内容两个方面认设。

从表式上;统计表是由纵横交叉的线条组成的一种表格,一般由表头、行标

题、列标题、和数字资料4个主要部分构成,必要时可以在统计表的下方加上表

外附加。

从内容上;统计表由主词栏和宾语栏两部分组成。

8.在绘制统计表的过程中,应该注意哪些问题?

(1)要合理安排统计表的结构,比如标题、列标题、数字资料的位置应合

理安排。

(2)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简

明确切地概括统计表的内容,一般需要标明统计数据的时间、地点以及何种数据。

(3)如果表中的全部数据都是同一计量单位,可在表的右上角表明,若各

指标的计量单位不同,则应在每个指标后或单列出列标明。

(4)表中的上下两条线一般用粗线,中间的其他线要用细线,这样使人看

起来清楚、醒目。统计表的左右两边不封口,列标题之间一般用竖线隔开,而行

标题之间不必用横线隔开。总之,表中尽量少用横竖线。表中的数据一般是右对

齐,有小数点时应以小数点对齐,而且小数点的位数应统一。对于没有数字1勺表

格单元,一般用“-”表示,一般填好的统计表不应出现空臼单元格。

(5)如表中栏数较多,通常要加以编号。主词栏和计量单位栏用(甲)、(乙)

等文字标明,宾词栏用(1)、(2)、(3)等数字标明。表中有关栏次如有计算上

的勾稽关系,可同时标明,如(3)=(2)/(1)。

(6)表中的合计栏可以放在前而,也可放在后面,如果只列在其中部分项

目,则合计栏必须放在前面。

(7)在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资

料来源,以表示对他人劳动成果的尊重,方便读者查阅使用。

3.4计算分析题

1.(1)频数分布表如下所示:

按销售收入频率向上累积向下累积

企业数(个)

分组(万元)(%)企业数频率(%)企业数频率(%)

100以下512.5512.54010C.0

100—110922.51435.03587.5

110—1201230.02665.02665.0

120—130717.53382.51435.0

130—140410.03792.5717.5

140以上37.540100.037.5

合计40100—————

(2)按先进企业、良好企业、一般企业、落后企业进行分组:

按销售收入分组(万元)企业数(个)频率(%)

先进企业1127.5

良好企业1127.5

一般企业922.5

落后企业922.5

合计40100.0

2.(1)按照组距式分组的步骤进行分组后,形成如下频数分布表:

按销售收入频率向上累积向下累积

企业数(个)

分组(万元)(%)企业数频率(%)企业数频率(%)

100以下512.5512.54010C.0

100—110922.51435.03587.5

110—1201230.02665.02665.0

120—130717.53382.51435.0

130—140410.03792.5717.5

140以上37.540100.037.5

合计40100————

(2)根据频数分布表绘制直方图和折线图如下所示:

35

30-

25

20

d15

40个企业1999年产品销售收入直方图

35-

30

(25-

)20-

<

15

10

5-

0-

40个企业1999年产品销售收入折线图

3.(1)

成绩(分)学生数(人)百分比(%)

60以下613.3

60-70920.0

70-801533.4

80-90920.0

90以上613.3

合计45100

(2)

按成绩分组学生数百分比向上累积向下累积

(分)(人)(%)累积频数累积频率累积频数累积频率

(人)(%)(人)(%)

60以下613.3613.345100

60-70920.01533.33986.7

70801533.43066.73066.7

80-90920.03986.71533.3

90以上613.345100613.3

合计45100—————

(3)

(4)成绩在80分以上的人数有15人,占33.3机

4.(1)两个班级考试成绩的茎叶图如下所示:

A班B班

树茎

数据个数树叶树叶数据个数

03592

14404484

297512245667778912

119766533211060112346889

23988777665555544433321007001134498

7665520081233456

663222090114566

0100009

(2)从茎叶图可以看出,A班考试成绩的分布比较集中,且平均分数较高;B

班考试成绩的分布比A班分散,且平均成绩较A班低。

5.频数分布表如下所示:

服务质量等级家庭数(频数)频率(%)

好(A)1414

较好(B)2121

一般(C)3232

较差(D)1818

差(E)1515

合计100100

根据频数分布表绘制如下条形图:

服务质量等级评价条形图

第四章数据的概括性度量

4.1单选题

1-8BCBACBCB

4.2多选题

1.ABCD2.DE3.AC4.AB5.BCE6.BD

4.3简答题

1.什么是数据的集中趋势?反映数据集中趋势的指标有哪些?

集中趋势是指一组数据向其中心值靠拢的程度、倾向,测度集中趋势也就是

寻找数据的一般水平低代表值或中心值。

反映集中趋势的指标有两种:一是位置平均数(众数、中位数、四分位数);

二是数值平均数(算术平均数、调和平均数、几何平均数)。

2.什么是均值、几何平均数、调和平均数?它们有哪些特点?

平均数也称均值,是一组数据相加后除以数据个数得到的结果,包括简单算

术平均数和加权算术平均数,是所有集中趋势测度指标中应用最广泛的指标,只

适用于数值型数据,而分类数据和顺序数据不适用;

几何平均数也称几何均值,是n个变量值乘积的n次方根,用G表示,几何

平均数适用于特殊数据,即变量值是相对数,变量值连乘积有意义的场合;

调和平均数是平均数的一种,是变量值的倒数的算术平均数的倒数,也称倒

数平均数;它具有独立的形式,更多的作为算数算术平均数的变形而存在。

3.简述众数、中位数和均值的特点及应用场合。

众数:位置平均数,易理解,不受极端值的影响。缺点是不唯一性,不适合

于进一步的代数计算。

应用场合:主要用于分类数据的集中趋势测度,数据量较多时。

中位数:位置代表值,不受极端值影响,缺点是不适于进一步计算。

应用场合:当一组数据偏斜程度较大时主要适用于顺序数据的集中趋势测度。

平均数:通俗易懂,直观清晰,受极端值的影响,对于偏态分市的数据,平

均数的代表性差,数据有开口组时,按相邻组距计算假定性很大,代表性低。

应用场合:主要适用于数值型数据的集中趋势测度。

4.在计算平均数时,算数平均数和调和平均数分别适用于什么样的条件?

(1)简单算术平均数适用于计算根据未经分组整理的原始数据均值;

(2)加权算术平均数是根据单变量值分组的数据和组距式分组数据计算的

平均数;

(3)调和平均数是在我们计算平均数时,不知道变量值个数,只知道各组

变量值与各组变量总值的情况下用的。

5.怎样理解平均数在统计学中的地位?

平均数分为算术平均数、调和平均数和几何平均数。三者在统计学中具有重

要地位:算术平均数是进行统计分析和统计推断的基础,是一组数据的重心所在,

是数据误差相互抵消的必然性结果,反映出事物必然性的数量特征,且算术平均

数同时具有各变量值与其算术平均值的离差之和等于零,各变量值与其算术平均

数的离差平方和最小-调和平均数与算术平均数都符合总体变量总值与总体总额

频数的对比关系,两者是可以相互变通的。儿何平均数是适用于特殊数据的一种

平均数,主要适用于变量值是相对数,变量值连乘积存意义的场合,主要应用于

计算计算平均比率和平均速度。

6.什么是数据的离散程度?常用的测度离散程度的指标有哪些?

数据的离散程度反映各变量值远离其中心值的程度,从另一个侧面说明了集

中趋势测度值的代表程度,数据离散程度越大,集中趋势的测度值对该组数据的

代表性就越差;离散程度越小,其代表性就越好。

常用的测度离散程度的指标有:异众比率、四分位差、全距、平均差、方差

和标准差、标准分数、离散系数。

7.什么是极差、方差、标准差?其特点是什么?

极差:也称全距,是一组数据最大值和最小值之差。

特点:只能用于测量数值型数据的离散程度,分类数据和顺序数据不能使用;

易受极端值影响,不能充分反映数据的离散程度。

方差:是各个数据与其算术平均数的离差平方的平均数。

标准差:又称均方差,方差的算术平方根即为标准差。方差和标准差消去离

差的正负号,是测度数据变异程度最常用的指标。

8.为什么要计算离散系数?

为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需计算离

散系数。离散系数主要用于对不同组组别数据的离散程度进行比较。离散系数大

的说明该组数据的离散程度也大,离散系数小的说明该组数据的离散程度也小。

9.如何反映数据分布的形状?

数据分布的形状要用形状指标来反映。形状指标就是反映数据分布具体形状,

即左右是否对称、偏斜程度与陡峭程度如何的指标。由于数据分布的形状一般从

对称性和陡峭性两方面来反映,所以形状指标有两个方面:一是反映数据分布偏

斜程度的指标,称为偏态系数;二是反映数据分布陡峭程度的指标,称为峰态系

数。

10.当考察一个分布数列的特征时,为什么必须运用平均指标和离散指标?两者

之间有何关系?

平均指标是指一组数据向其中心值靠拢的程度、倾向,平均指标也就是寻找

数据一般水平的代表值或中心值。离散指标是反映各变量远离其中心值的程度,

从另一个侧面说明了平均指标的代表程度。

关系:分布数列的离散指标越大,平均指标的测度值对该分布数列的代表性就越

差;离散指标越小,其代表性越好。

11.试比较极差、平均差和标准差3种变异指标的特点,并说明,为什么标准差

是最常用、最基本的变异指标。

极差:是测定数据离散程度的一种简单方法,但易受极端值影响,往往不能

充分反映数据的离散程度;

平均差:综合反映了总体各单位标志值的变动程度。只能用于测量数值型数

据离散程度,分类数据和顺序数据不能使用。平均差越大,则表示数据离散程度

越大,反之则表示数据离散程度越小。

标准差:是方差的算数平方根,是根据全部数据冲算的,它反映了每个数据

与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。

由于平均差采用了离差的绝对值,不便于运算,这样使其应用受到了很大限

制。而标准差是根据全部数据计算出来的,能准确地反映出数据的离散程度,同

时计算简便,所以是最常用、最基本的变异指标。

4.4计算题

1.(1)M/80,M°=80,Q,=74.5,Q〃=86,7=79.37

(2)02=88.97,a=9.43

(3)sk=-0.8390,k=1.0348

(4)从计算的特征值可以看出,班级学生的成绩分布左偏,偏斜程度不大;且

为尖峰分布,峰值相对•偏高。

2.M„=774.29,M0=755・88

3.(1)7987889295100103103104105

105107107108108110112113114115

115117117118119119120123124125

126127127129136137138142146158

(2)绘制频数分布表如下:

按利润分组(万兀)企业数(家)频率(%)

80以下12.5

80——9025

90——10025

100——1101025

110——1201127.5

120——130820

130——14037.5

140——15025

150以上12.5

合计40100

(3)M=115,Q.=105,Q,,.=125.75

8L1/

79105115125.75158

EM-乖600住

—ymf3450八

4.X=£—=——^=63.88件,M.,=

乎54小二市件'

一由一(竺937”6二13.18件

a=v^T

72400+3150+3600,9一u

5.[二黑一=------------------=1.02兀/斤

2f2000+3000+4000

H上24。。+3150+3600

=1.02元/斤

m24003150+陋

------十

乙X1.21.020.9

yni750+400+450、°一人缶

6.=——=-----------------------=1.6兀/千克

「m750400450

乙x1.51.61.8

才乙二1.625元/千克

歹甲=1.6<7乙=1.625,所以乙市场的平均价格代表性高。

因为在乙市场,中午时价格高的菜销量多(结构分布不一样),所以乙市场

的销售额高。

-yx.f.

7.(1)原品种牛:;二n11=294兀

Zfi

当利润分别为-200元/头、0元/头、200元/头、400元/头时,改良品种牛

的频率分别为:75OX1%=7.5、750X2%=15、750X57%=427.5、750X40%=300

-YXf.

所以改良品种牛:h.一二272元

所以原品种牛利涧总额为:294X600-176400兀,改良品种牛利润总额为:

272X750=204000元

因为204000>176400,所以牧场主应该选择改良品种牛

(2)当改良品种牛的利润总额小于176400元时,或当改良品种牛的平均利

润小于235.2元(1764004-750)时,他会改变在(1)所做的选择。

—>mf_八

8.(1)才甲二等一78.2分,才乙二77.8分

£(%—肝工。•甲

(2)。甲乙।二9.47,。乙=11.68,V甲二驾二0.12,

ZLJ甲

V,=0.15

因为0.12<0.15,所以甲班学生的平均成绩的代表性强。

9.鼠尸空二逆%5,晨二跑二52.5

700乙100

b2,甲二—y\三-__3乙工/二57.1429,所b以-。甲二7.56

。2J=78.929,所以J。/=8.88

b甲二也二0.168,3乙二0.169

1甲

因为V)甲vv0乙,所以甲工人平均产量的代表性好。

10.6'=3=3Vo.95X0.92X0.96=94.32%

11.J储//储T=,71.05X1.02X1.2X1.01-1=6.74%

12.(1)不相同,甲调查人员的平均身高较大。因为甲组的样本容量较小,出现误

差的机率较大且会出现较大的误差。

(2)不相同,甲调查人员的标准差较大。因为标准差一.由此

可以看出,样本容量N的大小对标准差起着决定性作用,样本容量越大,标准差

越小。

(3)不相同,乙调查人员的机会较大。因为乙组的样本容量较大,占总体的比

率较大,因此,最高者或最低者落入乙组样本的样本较大。

13.由表中数据可知,组中值分别为55、65、75、85、95,

_E(吼:斤

=76.22o甲=157.68,

厂乙二3.20,。乙=1.48,V。甲=强=2.07,V。乙二0.4625

X甲

因为2.07>0.4625,所以甲公司的成绩离散程度大于乙公司,所以乙公司

的成绩较整齐。

9

14.(1)V男=二二0.09,V女=0.11,因为V女〉V男,所以女生体重差异大。

X

L-X_50-55

=1,

Z二

所以有68%在50kg—60kg之间。

(3)Z,=-2,Z2=2,所以有95%在35kg—55kg之间。

X.-X115-1001425-400.

15.Z=--=---------=1,Z7n=---------二0A.5

"?lS1550

因为Z/AZ。,所以该应试者A项测试更理想。

V-V

16.由公式Z二——一,代入可得Xj=5100±2X90=(4920,5280),所以该生产

S

线周二、周四失去了控制I。

17.(1)采用离散系数,因为计算离散系数就是为了消除变量值水平高低和计

量单位不同对离散程度测量值的影响。成年组和幼儿组的身高的均值是不相等的,

所以要用离散系数来衡量身高差异。

,、一yXi-氏

(2)才成人二区」二172.25cm,/幼儿=71.67cm,S成人二^仝伍」--一--肝乙=4.03cm,

nyn-1

S幼儿=2.42cm,

所以忆成人=2二0.02,\%儿二0.03,

X

因为Vs成人VVs幼儿,所以幼儿组身高的离散程度大于成人组身高的离数程

度,即幼儿组的身高差异大。

一Gif-

18.(1)二甲一《「一74.848,X-67.575

*Z£7

因为7甲,?乙,所以甲单位工资高

(2).甲J=133.52,o-,..=11.56,V。甲=他二0.154

n小

。乙2二235.65,=15.35,V。乙二0.227

因为V"乙,所以甲单位平均工资更具有代表性。

(3)当变量值水平高低与计量单位相同时。

第五章抽样分布与参数估计

5.1单选题

1-7BACDCDC

5.2多选题

1.ABCDE2.BCD3.ACDE4.ABCE5.AB

5.3简答题

1.什么是总体分布和样本分布?两者有什么关系?

总体分布就是总体中所有个体关于某个变量的取值所形成的分布;样本分布

就是样本中所有个体关于某个变量的取值所形成的分布。

关系:由于样本来自于总体,包含了一部分关于总体的信息,所以样本分布是一

种经验分布。当样本容量n很大,或者是当n逐渐增大时,样本分布会接近总体

分布。如果样本容量很小,那么样本分布就有可能与总体分布相差很大,抽样估

计的结果就会很差。

2.什么是抽样分布?它受哪些因素影响?

抽样分布指所有样本统计量的概率分布,也就是从容量为N的总体中抽取容

量为n的样本时,所有可能的样本统计值所形成的分布。

影响因素:

(1)总体分布。在其他因素不变时,总体分布不同则抽样分布也不一样,

一般地总体分布越集中则抽样分布也越集中,总体分布越分散则抽样分布也越分

散。

(2)样本容量.样本容量是决定抽样分布最有效、最关键的因素.在其他

因素不变时,样本容量越大则抽样分布越集中,样本容量越小则抽样分布越分散。

(3)抽样方法。以简单随机抽样为例,重复抽样与不重复抽样的抽样分布

不同,考虑样本单位抽取顺序与不考虑样本单位抽取顺序的抽样分布有别。

3.简述评估估计量的标准。

标准有三个:

(1)无偏性。指估计量抽样分布的数学期望等丁被估计的总体参数。没1

是。的估计值,若E卜则称[是。的无偏估计量。7和S2都分别是总体均

值〃和总体方差。2的无偏估计,其中而£伊)二。2的推导复杂,S2的

表达式中,分母是nT而不是n,正是为了满足无偏性。

(2)有效性。对于多个无偏估计量,方差小的波动小,稳定性好,即方差

(八、/A、AA

DA越小越好。E2=6,若D:<D2,则称A比0更有效。

\0)

样本均值F、样本比例P和样本方差S2分别是总体均值〃、总体比例兀、总体

方差。2的有效估计量,

(3)一致性。以样本估计总体,虽然会存在估计误差,但是作为一个优良

的估计量,其估计误差会随着样本容量的增大而减小。也就是说,大样本比小样

本趋于接近一个更好的点估计。样本均值7、样本比例P和样本方差S2分别是

总体均值〃、总体比例”、总体方差。2的一致估计量。

4.解释中心极限定理的含义。

设从均值为〃,方差为。2的任意一个总体中抽取样本量为n的样本,当n

充分大(通常n230)时,样本均值的抽样分布近似服从均值为〃,方差为d/n

的正态分相。

5.怎样理解置信区间?

置信区间是指由样本统计量所构成的总体参数的估计区间。设要估计总体的

AA

一个位置参数夕,若由样本确定的两个统计量q(X,,X2,…,Xn)及口(:<,,

X2,…,X。)对于给定值a(0<a<1),若满足:尸{«<夕<4}=1-a,则称随

AAAA

机区间(口,口)为,的置信区间,久、q分别被称为置信下限和置信上限,a

称为显著性水平,1-a称为置信度或置信水平。

6.什么是区间估计?并举例说明。

区间估计就是用样本估计量的点估计值加减估计误差构成的区间来估计总

体参数,并以一定的概率保证总体参数在所估计的区间内。区间估计的基本要求

是:(1)置信度的要求:希望随机区间包含0的真值的概率1-a越大越好;12)

精确度的要求:希望随机区间的评价越短越好。在样本容量一定的条件下,这两

个基本要求往往是一对矛盾。如果置信度增大,则置信区间必然增大,精确度便

降低;如果提高精确度,则置信度必然减小。如求某商品合格率的95%的置信区

间。

5.4计算题

1.改成1、3、5、1、9五个数字

⑴略

吴=—=2.67

(2)总体均值〃=5,总体方差/二8;由此可以得到E(元)=4=5

(T-==1.63

(3)抽样标准误

2.

P的取值P取值的概率P

01/99

1/414/99

2/442/99

3/428/99

17/99

抽中红的卡片p的抽样分布如下图:

a105

3.(1)

1VnV363

(2)由己知Z〃=2.58,所以估计误差为Zj*=4.3

55x/n

“广/;&6125

4.(1)

(2)15鼻二z〃・b-=1.96X3.125=6.125

IaX

~ivn万

(3)7±Za・*=350±2.58X3.125二(341.94,358.06)

7如

—s

5.⑴1±La'-r=60±1.95=(58.05,61.95)

27n

s

(2)7±Za=60±2.32=(57.68,62.32)

2X

—Zx1619yG;-x]

6.Z=——53.97,S=^~——=24.3983

N30}\N-1

—s24.3983

X±Za-=53.97±1.645X=(46.64,61.30)

3vnV30

s=53.97±1.96X

7±z£2,歹二(45.24,62.70)

~2V30

—s243983

/±Zj'=53.97±2.58义•二’二(42.48,65.46)

7VnV30

zyC(J

7.X±Za--==500±1.645X-==(491.775,508.225)

2JnV100

8.〃=^~^=23.7,__^-=2.7101,n=10,t〃(10-1)=2.262

产NVN-1£

S97101

ju±t»-T==23.7±2.262X'=(21.7614,25.6386)

a2JnV10

-VMf5066VG/;-肝fj

9.⑴八£二而力°】.3功S二「I'

因为a=0.05,n=50,

__C1/?Q

所以『土Za-=101.32±1.96X5==(100.87,101.77)

2VnV50

347,L4

(2)由题意可得,样本合格率为P=」+——X100%=90%,

50

因为n=50,a=0.05

所以P士ZJJPQ-P)=0.9±1.96X/9点。,1二(682,0.98)

10.由已知,/=43000,S=4120,n=16,ta(n-1)=2.131

—,4190

所以二±ta--?==43000±2.131X-==(40805,45195)

2如J16

11.(1)p+ZjJPQ_虱0.44士L96XJ」(0.2822,0.5978)

PQ-P)=0.67±L645X.但67X633二(0.5927,0.7434)

100

⑶P±3=°.88±2.58X炸产二(。⑻37,0,9463)

12.⑸p±Z.砰3=5巡L96X怜产二(0,4525.0.6475)

⑹P士Z1档4…'拚4(0,4216.0,6784)

⑹P士Z•抻尹=5做3X酶*L<0-4008,0,6992)

13.(1)由已知,1二2000,S=12,a=0.05

—s12

所以¥土Z„«—=2000±1.96X-==(1997.648,2002.352)

2vn7100

(2)由已知,p合格率=0.8,a=0.05

所以p±ZjJPQ;P)=0.8±L96X¥=(0.7216,0.8784)

(1)由题意可得,了二容2二640元,一丁=201.33元,

14.

VZfi-1

向、i°S201.33一

所以。-=-==-==---=11.62兀

'VnJnV300

(2)由已知,a=0.05,n=300,由(1)得丫:640,S=201.33

_qQr\iQQ

所以『土ZJ3==640±1.96X(617.22,662.78)

5JnV300

(3)由己知可得p=0.2,a=0.05

所以。p二心钟d23;;8=2.3%,所以抽样平均误差为2.3%

p±Z~P/=0.2+1.96X^Q,8=(0.15,0.25)

22

15.(1)l-a=90%f/£=42.557,ZI-^17.708,n=30

所以总体方差b2的置信区间为:(卜-"2,修产)=(]02216,24.5651)

Z?Z1-?

(2)1^=95%,/y32.852,/崂=8.907,n二2。

所以总体方差。2的置信区间为:((n一小\」[M)=(i7.3505,63.9946)

共z2.-f

21.(1)由题意得,p-0.25,a-0.05,n=30

所以p±ZJJPQ-P)=0.25士].96XJ。*25京0.7$:(0.14,0.36),

所以家庭比例为(0.14,0.36)

CTlp(l-p)Io.25X0.75ccc他

抽样标准误为5.60%

(2)由已知可得,。=0.05,E=0.05

Z2巴•a:

所以n=-J—=289户

E2

t7-=0.05,根据。丁产科,所以n=30

22.由已知,乃二8乐

储外、性也_血=。,必。

23.//=^Z—^=6.35,

尸N

24.(1)由已知得,赞成的比例P=0.64,n=50,a=0.05

所以p土Zg・JP(;P)=0.64±1.966"铲=963,0.65)

(2)由己知,a=0.1,E=0.05,p=0.8

Z2g-p(l-p

1.6452x0.8x0.2

所以一亡「=174户

SOS?

22

7£•<y

25.由已知,E=3,。=5,Z=1.96,所以n二———-=11

-p2

2c

3疑卷9

===

26.由已知,E0.05,p0.9,Za1.96,所以n二

E

27.由己知可得,a=0.05,p=3%,E=0.02,

由z毋十六号•p(l-p)h962xo03x097

所以样本谷量n=----------二-----------;-------二280瓶

E20.022

第六章假设检验

6.1单选题

1-5ACDBB

6.2多选题

1.ABC2.DE3.ADE4.ACDE5.BE

6.3简答题

1.假设检验和参数估计有什么共同点和不同点?

相同点:参数估计和假设检验是统计推断的两个组成部分,他们都是利用样

本对总体进行杲种推断;

不同点:推断的角度不同,参数估计讨论的是用样本统计量估计总体参数的

方法,总体参数在估计前是未知的,通过样本信息估计总体参数;而假设检验技

术不仅可以对总体分布的某些参数,而且也可以对总体本身的分布做出假设,通

过对样本的统计分析来判定该假设是否成立,从而对总体分布给以进一步的确认。

2.什么是假设检验?假设检验的基本步骤是什么?

⑴假设检验是利用样本资料计算出有关的检验统计量,再根据该统计量的抽

样分布理论来判断样本资料对原假设是否有显著的支持性或排斥性,即在一定的

概率下判断原假设是否合理,从而决定应接受或否定原假设。也称为显著性检验。

⑵步骤:①提出假设

②设计检验统计量

③给定显著性水平并确定相应的临界值

④得出结论

3.两类错误之间有什么关系?

“弃真错误”称作假设检验的“第一类错误”,“取伪错误”称作假设检验的

“第二类错误”。假设殓验犯第一类错误的原因是:在原假设为真的情况下,检

验统计量不巧刚好落入小概率的拒绝区域,从而导致拒绝了原假设。因而,第一

类错误发生的概率就是显著性水平a,第二类错误发生的概率记为夕。概率a与

仅是密切相关的,在样本一定的条件下,减小。,就是增大了夕;反之,增大a,

就减小了p。

4.什么是假设检验中的显著性水平?统计显著是什么意思?

显著性水平(significancelevel)表示假设"。为真时拒绝原假设的概率,也就

是拒绝原假设所冒的风险,用。表示。。一般取值很小,常取。=0.1、0.05、

O.Olo给定了显著性水平。,也就确定了原假设"。的接受区域和拒绝区域。

5.解释假设检验中的p值。

P值是在原假设为真的条件下某一统计量的取值以其观察值为最小值或最

大值的事件的小概率,或说某一统计量的取值以其观察值为最小值或最大值是一

个小概率事件,此小概率就是P。实际上P值是拒绝原假设的最小的显著性水平。

6.显著性水平和p值之间有什么关系?

假设检验问题的P值(probabilityvalue)是由检验统计量的样本观察值得出

的原假设可被拒绝的最小显著性水平。任一检验问题的P值可以根据检验统计量

的样本观察值的以及检验统计量在"。下一个特定的参数值(一般是"。与匕所

规定的参数的分界点)对应的分布求出。

6.4计算题

1.采取H。:〃<1035,//>1035的假设

2.(1)第一类错误是“弃真”错误,即“土豆片的重量大于60g”是真实的,

但店方拒绝了。

(2)第二类错误是“取伪”错误,即“土豆片的重量大于60g”是不真实的,

但店方接受了。

(3)顾客会将第二类错误看得严重,供应商会将第一类错误看得严重。

3.解:设H。:〃=0.5,%w0.5

由已知,n=9,(T=0.015,a=0.05

XAo

所以7=0.5112,1=~=2.24,Za=1.96

_Z_

因为⑶=2.24>Zg=1.96,所以拒绝原假设,即机器不正常。

2

4.设:Ho://<40,H,:〃>40

Z=I--3.125,a=0.05,Zff=1.65,

cr

因为Z=3.125>Z-所以拒绝原假设,即用新方法生产的推进器的燃烧

率较以往生产的有显著提高。

5.设:Ho://<225,H1://>225

t="/=0.67,自由度为NT=15,t005(15)=1.753

因为t=0.67<1.753,所以不能拒绝原假设,即没有足够的理由认为元

件的平均寿命大于225小时。

6.第一步:建立原假设和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论