用样本数字特征估计总体的数字特征PPT学习教案_第1页
用样本数字特征估计总体的数字特征PPT学习教案_第2页
用样本数字特征估计总体的数字特征PPT学习教案_第3页
用样本数字特征估计总体的数字特征PPT学习教案_第4页
用样本数字特征估计总体的数字特征PPT学习教案_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1 用样本数字特征估计总体的数字特征用样本数字特征估计总体的数字特征 2 第1页/共32页 3 一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按大小依次排列,把处:将一组数据按大小依次排列,把处 在最中间位置的一个数据(或最中间两个数据的在最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数 众数众数:在一组数据中,出现次数最多的数:在一组数据中,出现次数最多的数 据叫做这组数据的众数据叫做这组数据的众数 众数、中位数、平均数都是描述一组数众数、中位数、平均数都是描述一组数 据的集中趋势的特征数,只是描述

2、的角度不同据的集中趋势的特征数,只是描述的角度不同 ,其中以平均数的应用最为广泛,其中以平均数的应用最为广泛. )xxx( n 1 n21 平均数平均数: 一组数据的算术平均数一组数据的算术平均数,即即 x= 第2页/共32页 4 练习练习: 在一次中学生田径运动会上,参加在一次中学生田径运动会上,参加 男子跳高的男子跳高的17名运动员的成绩如下表所示:名运动员的成绩如下表所示: 成绩成绩 (单位单位:米米) 150160165170175180185190 人数人数 23234111 分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与 平均数平均数 解:在解:在17个数

3、据中,个数据中,1.75出现了出现了4次,出现的次,出现的 次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75 上面表里的上面表里的17个数据可看成是按从小到个数据可看成是按从小到 大的顺序排列的,其中第大的顺序排列的,其中第9个数据个数据1.70是最中是最中 间的一个数据,即这组数据的中位数是间的一个数据,即这组数据的中位数是1.70; 第3页/共32页 5 这组数据的平均数是这组数据的平均数是 答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数 依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米). 第4页/共32页

4、6 频率频率 组距组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 例如,在上一节调查的例如,在上一节调查的100位居民的月均用水量的位居民的月均用水量的 问题中,从这些样本数据的频率分布直方图可以看问题中,从这些样本数据的频率分布直方图可以看 出,月均用水量的众数是出,月均用水量的众数是2.25t.如图所示:如图所示: 二二 、 众数、中位数、平均数与众数、中位数、平均数与 频率分布直方图的关系频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。中,

5、就是最高矩形的中点的横坐标。 第5页/共32页 7 2、在样本中,有、在样本中,有50的个体小于或等于中的个体小于或等于中 位数,也有位数,也有50的个体大于或等于中位数,因的个体大于或等于中位数,因 此,在频率分布直方图中,此,在频率分布直方图中,中位数左边和右边中位数左边和右边 的直方图的面积应该相等,的直方图的面积应该相等,由此可以估计中位由此可以估计中位 数的值。下图中虚线代表居民月均用水量的中数的值。下图中虚线代表居民月均用水量的中 位数的估计值,此数据值为位数的估计值,此数据值为2.03t. 频率频率 组距组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2

6、.5 3 3.5 4 4.5 月平均用水量(t) 第6页/共32页 8 说明说明: 2.03这个中位数的估计值这个中位数的估计值,与样本与样本 的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数 据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明 分布的形状分布的形状,但是从直方图本身得不出但是从直方图本身得不出 原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方 图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的 实际中位数值不一致实际中位数值不一致. 第7页/共32页 9 3、平均数是频率分布直方图的平均数是频率分布直方图的“

7、重心重心 ”. 是直方图的平衡点是直方图的平衡点. n 个样本数据的平均数个样本数据的平均数 由公式由公式: 给出给出 )xxx( n 1 n21 X = 下图显示了居民月均用下图显示了居民月均用 水量的平均数水量的平均数: x=1.973 频率频率 组距组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 第8页/共32页 10 三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无 法客观地反映

8、总体特征法客观地反映总体特征.如上例中众数是如上例中众数是 2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的 居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民 数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少. 第9页/共32页 11 2、中位数是样本数据所占频率、中位数是样本数据所占频率 的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它 对极端值的不敏感有时也会成为缺点对极端值的不敏感有时也会成为缺点 。如上例中假设有某一用户月均用水。如上例中假设有某一用户

9、月均用水 量为量为10t,那么它所占频率为,那么它所占频率为0.01,几几 乎不影响中位数乎不影响中位数,但显然这一极端值是但显然这一极端值是 不能忽视的。不能忽视的。 第10页/共32页 12 3、由于平均数与每一个样本的、由于平均数与每一个样本的 数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的 改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因 如此如此 ,与众数、中位数比较起来,平,与众数、中位数比较起来,平 均数可以反映出更多的关于样本数据均数可以反映出更多的关于样本数据 全体的信息,但平

10、均数受数据中的极全体的信息,但平均数受数据中的极 端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时 可靠性降低。可靠性降低。 第11页/共32页 13 四四 众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用 例例 某工厂人员及工资构成如下:某工厂人员及工资构成如下: 人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计 周工资周工资2200250220200100 人数人数16510123 合计合计22001500110020001006900 (1)指出这个问题中周工资的众数、中位数、平均)指出这个问题中周工资的众数、中位数、平均 数数(2)这

11、个问题中,工资的平均数能客观地反映该厂)这个问题中,工资的平均数能客观地反映该厂 的工资水平吗?为什么?的工资水平吗?为什么? 解解:众数为众数为200,中位数为,中位数为220,平均数为,平均数为300。 因平均数为因平均数为300,由表格中所列出的数据可见,由表格中所列出的数据可见, 只有经理在平均数以上,其余的人都在平均数以下,只有经理在平均数以上,其余的人都在平均数以下, 故用平均数不能客观真实地反映该工厂的工资水平。故用平均数不能客观真实地反映该工厂的工资水平。 第12页/共32页 14 第13页/共32页 15 平均数向我们提供了样本数据的重要信息平均数向我们提供了样本数据的重要信

12、息,但是平均但是平均 有时也会使我们作出对总体的片面判断因为这个平有时也会使我们作出对总体的片面判断因为这个平 均数掩盖了一些极端的情况,而这些极端情况显然是均数掩盖了一些极端的情况,而这些极端情况显然是 不能忽的因此,只有平均数还难以概括样本数据的不能忽的因此,只有平均数还难以概括样本数据的 实际状态实际状态 如:有两位射击运动员在一次射击测试中各射靶如:有两位射击运动员在一次射击测试中各射靶10次,每次,每 次命中的环数如下:次命中的环数如下: 甲:甲: 乙:乙: 如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价? 如果看两人本次射击的平均成绩如果看两人本

13、次射击的平均成绩,由于由于 77 乙乙甲甲x,x 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没有什么那么两个人的水平就没有什么 差异吗差异吗? 第14页/共32页 16 (甲) 45 6 78910 环数 频率 0.1 0.2 0.3 频率 (乙) 456789 10 0.1 0.2 0.3 0.4 环数 直观上看直观上看,还是有差异的还是有差异的.如如:甲成绩比较分散甲成绩比较分散, 乙成绩相对集中乙成绩相对集中(如上图所示如上图所示). 因此因此,我们还需要从另外的角度来考察这两组我们还需要从另外的角度来考察这两组 数据数据.例如例如:在作统计图表时提到过的

14、极差在作统计图表时提到过的极差. 第15页/共32页 17 甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4. 它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一与平均数一 起起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显然显然,极差对极端值非极差对极端值非 常敏感常敏感,注意到这一点注意到这一点,我们可以得到一种我们可以得到一种“去掉一个最高分去掉一个最高分,去去 掉一个最低分掉一个最低分”的统计策略的统计策略. 考察样本数据的分散程度的大小,最常用的统计量是标准差考察样本数据的分散程度的大小,最

15、常用的统计量是标准差 标准差是样本平均数的一种平均距离,一般用标准差是样本平均数的一种平均距离,一般用s表示表示 所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解: :x。xxxxx in 的距离是到表示这组数据的平均数假设样本数据是 ,., 21 ).,2,1(nixx i 第16页/共32页 18 :xxxx, n 是平均距离的到样本数据于是”“, 21 . 21 n xxxxxx S n 由于上式含有绝对值,运算不太方便,因此,通常改用由于上式含有绝对值,运算不太方便,因此,通常改用 如下公式来计算标准差如下公式来计算标准差 .)()()( 1 22 2 2 1 x

16、xxxxx n s n 一个样本中的个体与平均数之间的距离关系可用下图表示一个样本中的个体与平均数之间的距离关系可用下图表示: 考虑一个容量为考虑一个容量为2的样本的样本: . 2 , 2 , 1212 21 xx a xx xx 记其样本的标准差为 第17页/共32页 19 显然显然,标准差越大标准差越大,则则a越大越大,数据的离散程度越大数据的离散程度越大;标准标准 差越小差越小,数据的离散程度越小数据的离散程度越小. 用计算器可算出甲用计算器可算出甲,乙两人的的成绩的标准差乙两人的的成绩的标准差 乙甲 ss 由由 可以知道可以知道,甲的成绩离散程度大甲的成绩离散程度大,乙的成乙的成 绩离

17、散程度小绩离散程度小.由此可以估计由此可以估计,乙比甲的射击成绩稳定乙比甲的射击成绩稳定. 09512 乙甲 ,ss 上面两组数据的离散程度与标准差之间的关系可用图上面两组数据的离散程度与标准差之间的关系可用图 直观地表示出来直观地表示出来. 45678910 甲 s 乙 s 2 21 xx 1 x 2 x a 第18页/共32页 20 标准差标准差 标准差是样本数据到平均数的一种平均距离。标准差是样本数据到平均数的一种平均距离。 它用来描述样本数据的离散程度。在实际应用中,它用来描述样本数据的离散程度。在实际应用中, 标准差常被理解为稳定性。标准差常被理解为稳定性。 规律:标准差越大,规律:

18、标准差越大, 则则a越大,数据的越大,数据的 离散程度越大;反离散程度越大;反 之,数据的离散程之,数据的离散程 度越小。度越小。 第19页/共32页 21 例题例题1:画出下列四组样本数据的直方图画出下列四组样本数据的直方图,说明它们的异同说明它们的异同 点点.(1) 5, 5, 5, 5, 5, 5, 5, 5, 5; (2) 4, 4, 4, 5 , 5, 5, 6, 6, 6; (3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7; (4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ; 解解:四组样本数据的直方图是四组样本数据的直方图是: 频率

19、 o 12345678 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 5 x S=0.00 (1) 第20页/共32页 22 12345678 频率 o 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 5 x S=1.49 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 (2) 频率 o 12345678 5 x S=0.82 频率 o 1234 5 678 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.05 x S=2.83 第21页/共32页 23 四组数据的平均数都是四

20、组数据的平均数都是5.0,标准差分别是标准差分别是0.00,0.82,1.49,2.83. 虽然它们有相同的平均数虽然它们有相同的平均数,但是它们有不同的标准差但是它们有不同的标准差,说明数据的说明数据的 分散程度是不一样的分散程度是不一样的. 标准差还可以用于对样本数据的另外一种解释标准差还可以用于对样本数据的另外一种解释.例如例如: 在关于居民月均用水量的例子中在关于居民月均用水量的例子中,平均数平均数 标准差标准差s=0.868 973. 1 x 所以所以 .237.02,105.1 709.32,841.2 sxsx sxsx 外外的的只只有有4 4个个。9 90 0. .2 23 3

21、7 7, ,3 3. .7 70 02 2s sx x2 2s s, ,x x区区间间这这1 10 00 0个个数数据据中中,在在 据据。几几乎乎包包含含了了所所有有样样本本数数2 2s sx x2 2s s, ,x x也也就就是是说说, : 2 的工具测量样本数据分散程度 方差来代替标准作为方人们有时用标准差的平从数学的角度考虑s, .)()()( 1 22 2 2 1 2 xxxxxx n s n 第22页/共32页 24 例例2 2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm25.40mm的一种零件的一种零件. .为了为了 对两人的生产质量进行评比对两人的生产质量进行评比

22、, ,从他们生产的零件中各抽出从他们生产的零件中各抽出 2020件件, ,量得其内径尺寸如下量得其内径尺寸如下( (单位单位:mm):mm) 甲甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39 乙乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43

23、, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看从生产的零件内径的尺寸看, ,谁生产的质量较高谁生产的质量较高? ? 第23页/共32页 25 分析分析: :每一个工人生产的所有零件的内径尺寸组成一个总体每一个工人生产的所有零件的内径尺寸组成一个总体, , 由于零件的生产标准已经给出由于零件的生产标准已经给出( (内径内径25.40mm),25.40mm),生产质量可以生产质量可以 从总体的平均数与标准差两个角度来衡量从总体的平均数与标准差两个角度来衡量. .总体的平均数与内总体的平均数与内 径标准尺寸径标准尺寸25.0

24、0mm25.00mm的差异在时质量低的差异在时质量低, ,差异小时质量高差异小时质量高; ;当总当总 体的平均数与标准尺寸很接近时体的平均数与标准尺寸很接近时, ,总体的标准差小的时候质量总体的标准差小的时候质量 高高, ,标准差大的时候质量低标准差大的时候质量低. .这样比较两人的生产质量只要比这样比较两人的生产质量只要比 较他们所生产的零件内径尺寸所组成的两个总体的平均数与较他们所生产的零件内径尺寸所组成的两个总体的平均数与 标准差的大小即可标准差的大小即可. .但是这两个总体的平均数与标准差都是不但是这两个总体的平均数与标准差都是不 知道的知道的, ,根据用样本估计总体的思想根据用样本估

25、计总体的思想, ,我们可以通过抽样分别我们可以通过抽样分别 获得相应的样体数据获得相应的样体数据, ,然后比较这两个样本的平均数然后比较这两个样本的平均数, ,标准差标准差, , 以此作为两个总体之间的估计值以此作为两个总体之间的估计值. . 解解: :用计算器计算可得用计算器计算可得: : 0.0740.074s s 0.038,0.038,s s 25,4008;25,4008;x x 25.4005,25.4005,x x 乙乙甲甲 乙乙甲甲 第24页/共32页 26 从样本平均数看从样本平均数看, ,甲生产的零件内径比乙生产的更接近内甲生产的零件内径比乙生产的更接近内 径标准径标准(2

26、5.40mm),(25.40mm),但是差异很小但是差异很小; ;从样本标准差看从样本标准差看, ,由于由于 。, 。,ss 乙的高一些乙的高一些甲生产的零件的质量比甲生产的零件的质量比于是可以作出判断于是可以作出判断 比乙的稳定程度高得多比乙的稳定程度高得多因此甲生产的零件内径因此甲生产的零件内径 乙乙甲甲 从上述例子我们可以看到从上述例子我们可以看到, ,对一名工人生产的零件内径对一名工人生产的零件内径( ( 总体总体) )的质量判断的质量判断, ,与我们抽取的内径与我们抽取的内径( (样本数据样本数据) )直接相关直接相关. .显显 然然, ,我们可以从这名工人生产的零件中获取许多样本我们可以从这名工人生产的零件中获取许多样本( (为什么为什么 ?).?).这样这样, ,尽管总体是同一个尽管总体是同一个, ,但由于样本不同但由于样本不同, ,相应的样本频相应的样本频 率分布与平均数率分布与平均数, ,标准差等都会发生改变标准差等都会发生改变, ,这就会影响到我们这就会影响到我们 对总体情况的估计对总体情况的估计. .如果样本的的代表性差如果样本的的代表性差, ,那么对总体所作那么对总体所作 出的估计就会产生偏差出的估计就会产生偏差; ;样本没有代表性时样本没有代表性时, ,对总体作出错误对总体作出错误 估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论