版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、众数、中位数、平均数与频率分布直方 图的关系 用样本数字特征估计总体数字特征用样本数字特征估计总体数字特征 (制作老师制作老师: 欧阳文丰欧阳文丰) 一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按大小依次排列,:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的间两个数据的平均数)叫做这组数据的 中位数中位数 众数众数:在一组数据中,出现次数最多:在一组数据中,出现次数最多 的数据叫做这组数据的众数的数据叫做这组数据的众数 众数、中位数、平均数都是描述一组众数、中位数、平均
2、数都是描述一组 数据的集中趋势的特征数,只是描述的角数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛度不同,其中以平均数的应用最为广泛. 平均数: 一组数据的算术平均数,即 x= )xxx( n 1 n21 1、 平均数平均数 :由数据及频率计算平均数由数据及频率计算平均数,即即 x = x1f1+x2f2+xkfk (其中其中fk是是xk的频率。的频率。) 2、加权、加权平均数平均数 :由数据及其权数和样本容量计算平均数由数据及其权数和样本容量计算平均数, 即即 x = (x1n1+x2n2+xknk)/n (其中其中nk是是xk的权数的权数, n为样本容量为样本容量
3、, 且且n1+n2 +nk=n. ) 3、 已知已知xn的平均数为的平均数为x, 则则kxn+b的平均数为的平均数为kx+b。 平均数平均数: 一组数据的算术平均数一组数据的算术平均数,即即 二二 、 众数、中位数、平均数众数、中位数、平均数 与频率分布直方图的关系与频率分布直方图的关系 (在只有频率分布直方图的情况下,也可以估计总体特征在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观而且直方图比较直观 便于形象地进行分析。便于形象地进行分析。) 1、众数在样本数据的频率分布直方图中,众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标
4、。 当最高矩形的数据组为当最高矩形的数据组为a, b) 时时, 那那 么么(a+b)/2就是众数。就是众数。 频率频率 组距组距 0.1 0.2 0.3 0.4 0.5 o 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 例题分析:月均用水量的众数是月均用水量的众数是2.25t.如图所示:如图所示:(2+2.5)/2=2.25 当最高矩形的数据组为当最高矩形的数据组为a, b) 时时, 设中位设中位 数为数为(a+x),根据中位数的定义得知,根据中位数的定义得知, 中位中位 数左边立方图的小矩形面积为数左边立方图的小矩形面积为0.5, 列方程列方程 得:得: 当最高
5、矩形的数据组之当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率频率直方图的面积计算,即组距乘以频率/组距。)组距。) x*最高矩形的最高矩形的(频率频率/组距组距)+ fm=0.5 求解x, 那么a+x即为中位数。即为中位数。 思考题:如何从频率分布直方图中估计思考题:如何从频率分布直方图中估计中位数中位数? 中位数左边立方图的小矩形面积为中位数左边立方图的小矩形面积为0.5 02的小矩形面积之和为: 0.5(0.08+0.16+0.30+0.44)=0.49 0.20 0.40 0.10 0 0.5 1 1.522.53 3.5 4 4.5 0.50
6、 0.30 频率频率/组距组距 月均用水量月均用水量 /t 0.08 0.16 0.44 0.50.490.010.01/0.5=0.02 如图在直线t2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02 练习练习.(广东(广东11变式题变式题1)为了调查某厂工人生产为了调查某厂工人生产 某种产品的能力,随机抽查某种产品的能力,随机抽查 了了20位工人某天生位工人某天生 产该产品的数量产该产品的数量.产品数量的分组区间为产品数量的分组区间为45,55 55,65 , 65,75 , 75,8585,95 , , 分布直方图如图分布直方图如图3,则这,则这20名工人中一天生产名工人
7、中一天生产 的中位的中位 数数 . 该产品该产品 数量在数量在 由此得到频率由此得到频率 3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”. 是直方图的平衡点是直方图的平衡点. n 个样本数据的平均数由个样本数据的平均数由 公式公式: )xxx( n 1 n21 x= 假设每组数据分别为假设每组数据分别为a1, b1)、)、 a2, b2)、)、 ak, bk)时)时, 且每组数据相应的且每组数据相应的 频率分别为频率分别为f1、 f2 、 fk;那么样本的平那么样本的平 均数均数(或总体的数学期望或总体的数学期望)由下列公式计算即由下列公式计算即 可。可。 x =( a1+b
8、1)/2* f1+ (a2+b2)/2* f2+ (ak+bk)/2* fk (其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率/组距。)组距。) 练习练习.(广东(广东11变式题变式题2)为了调查某厂工人生产为了调查某厂工人生产 某种产品的能力,随机抽查某种产品的能力,随机抽查 了了20位工人某天生位工人某天生 产该产品的数量产该产品的数量.产品数量的分组区间为产品数量的分组区间为45,55 55,65 , 65,75 , 75,8585,95 , , 分布直方图如图分布直方图如图3,则这,则这20名工人中一
9、天生产名工人中一天生产 的平均的平均 数数 . 该产品该产品 数量在数量在 由此得到频率由此得到频率 练习:对某电子元件进行寿命追踪调查,情况如下:练习:对某电子元件进行寿命追踪调查,情况如下: 寿命寿命 个数个数 100200200300300400400500500600 20 30 80 40 30 (1)列出频率分布表;)列出频率分布表; (2)画出频率分布直方图;)画出频率分布直方图; (3)估计电子元件寿命在)估计电子元件寿命在100h400h以内的概率;以内的概率; (4)估计电子元件寿命在)估计电子元件寿命在400h以上的概率;以上的概率; (5)估计总体的数学期望)估计总体的
10、数学期望. 100200 200300 300400 400500 500600 寿命寿命 合计合计 频率频率频数频数累积频率累积频率 20 30 80 40 30 200 0.10 0.15 0.40 0.20 0.15 1 0.10 0.25 0.65 0.85 1 100200300400500600 )寿命(寿命(h h 频率频率/组距组距 0 .65. 0:400100 65. 0: 4001003 的的概概率率为为元元件件寿寿命命在在 ,所所以以我我们们估估计计电电子子为为的的电电子子元元件件出出现现的的频频率率 出出,寿寿命命在在)由由频频率率分分布布表表可可以以看看( hh h
11、 .:h .: h 350400 350150200 4004 以以上上的的概概率率为为估估计计电电子子元元件件寿寿命命在在 ,故故我我们们元元件件出出现现的的频频率率为为 以以上上的的电电子子命命在在由由频频率率分分布布表表可可知知,寿寿)( . . . . . . 365 3655829014015150 2 600500 200 2 500400 400 2 400300 150 2 300200 100 2 200100 5 期期望望值值(总总体体均均值值)为为 子子元元件件的的寿寿命命的的我我们们估估计计总总体体生生产产的的电电 样样本本的的期期望望值值为为: . . ).( 思考:
12、思考:从样本数据可知,所求得该样本的众从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一分布直方图得出的结论有偏差,你能解释一 下原因吗?下原因吗? 频率分布直方图损失了一些样本数据,得频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组到的是一个估计值,且所得估值与数据分组 有关有关. . 注注: :在只有样本频率分布直方图的情况下,我在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特
13、征数,并由此估计总体特征. . 三、用频率分布直方图估计总体数字的特征 的利弊:利弊: 总体的各种数值特征都可以由两种途径来估计,总体的各种数值特征都可以由两种途径来估计, 直接利用样本数据或由频率分布直方图来估计。直接利用样本数据或由频率分布直方图来估计。 两种方法各有利弊;比如:两种方法各有利弊;比如: 1、通过频率分布直方图的估计精度低;、通过频率分布直方图的估计精度低; 2 2、通过频率分布直方图的估计结果与数据分组、通过频率分布直方图的估计结果与数据分组 有关;有关; 3 3、在不能得到样本数据,只能得到频率分布直、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体
14、特征方图的情况下,也可以估计总体特征, ,而且直方而且直方 图比较直观便于形象地进行分析。图比较直观便于形象地进行分析。 (1 1)众数体现了样本数据的最大集中点)众数体现了样本数据的最大集中点, (2 2)中位数是样本数据所占频率的等分线,它不受)中位数是样本数据所占频率的等分线,它不受 少数几个极端值的影响,这在某些情况下是优点,少数几个极端值的影响,这在某些情况下是优点, (3 3)由于平均数与每一个样本的数据有关,所以任)由于平均数与每一个样本的数据有关,所以任 何一个样本数据的改变都会引起平均数的改变,这何一个样本数据的改变都会引起平均数的改变,这 是众数、中位数都不具有的性质。是众
15、数、中位数都不具有的性质。 1 1、在一次歌手大奖赛上,七位评委为歌手打出的分数、在一次歌手大奖赛上,七位评委为歌手打出的分数 如下:如下: 9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去掉一个最高分,去掉一个最高分 和一个最低分后,所剩数据的平均值和方差分别为和一个最低分后,所剩数据的平均值和方差分别为 _; 2 2、已知数据、已知数据 的平均数是的平均数是3 3,方差为,方差为2 2,求,求 数据数据 的平均数、方差、标准差?的平均数、方差、标准差? 123 ,a a a 123 2 ,2,2aaa 9.5,0.016 解:平均数是解:平均数是6,方差是,方差是8,标准差是,标准差是 . 去掉最高分和最低分合理吗? 如果求如果求 的平均数、方差、的平均数、方差、 标准差?标准差?已知已知ai的平均数的平均数x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度影视项目制作时间安排合同3篇
- 2024年度专业乒乓球教练团队聘用服务合同书3篇
- 吉林师范大学《聚合过程与原理》2023-2024学年第一学期期末试卷
- 2024年绿色环保仓储租赁合同3篇
- 2024年度软件许可合同服务内容详述2篇
- 2024年度演出合同:某演艺公司与某活动主办方合作的详细规定3篇
- 2024年度户外耐候壁纸采购合同范本3篇
- 2024年工程项目招投标价格确定3篇
- 2024年度餐饮业媒体合作合同范本3篇
- 2024年度充电桩产业链上下游企业合作框架合同3篇
- GSV2.0反恐安全管理手册
- 物联网设计实战智慧树知到课后章节答案2023年下青岛滨海学院
- 东建材市场调查报告
- 直流稳压电源的安装与调试
- 选矿厂专题安全培训1
- 定制旅游行业深度洞察报告
- 义务教育数学课程标准《统计与概率》课程分享
- 财务报表分析-国家开放大学电大学习网形考作业题目答案
- 2023年北京探矿工程研究所招聘高校应届毕业生(共500题含答案解析)笔试必备资料历年高频考点试题摘选
- 质量员之设备安装质量基础知识通关题库带答案
- 散装油实名登记治安管理信息系统汇报专题培训课件
评论
0/150
提交评论