版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一 众数、中位数、平均数概念 中位数:将一组数据按大小依次排列,把处于最中间位置一个数据(或最中间两个数据平均数)叫做这组数据中位数 众数:在一组数据中,出现次数最多数据叫做这组数据众数 众数、中位数、平均数都是描述一组数据集中趋势特征数,只是描述角度不一样,其中以平均数应用最为广泛.第1页平均数: 一组数据算术平均数,即 x= 1、 平均数 :由数据及频率计算平均数,即 x = x1f1+x2f2+xkfk (其中fk是xk频率。) 2、加权平均数 :由数据及其权数和样本容量计算平均数,即x = (x1n1+x2n2+xknk)/n(其中nk是xk权数, n为样本容量, 且n1+n2 +nk
2、=n. ) 3、 已知xn平均数为x, 则kxn+b平均数为kx+b。平均数: 一组数据算术平均数,即 第2页 二 、 众数、中位数、平均数与频率分布直方图关系(在只有频率分布直方图情况下,也能够预计总体特征,而且直方图比较直观便于形象地进行分析。) 1、众数在样本数据频率分布直方图中,就是最高矩形中点横坐标。 当最高矩形数据组为a, b) 时, 那么(a+b)/2就是众数。第3页频率组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)例题分析:月均用水量众数是2.25t.如图所表示:(2+2.5)/2=2.25第4页2、从频率分布直
3、方图中预计中位数 (中位数是样本数据所占频率等分线。)当最高矩形数据组为a, b) 时, 设中位数为(a+X),依据中位数定义得知, 中位数左边立方图小矩形面积为0.5, 列方程得:当最高矩形数据组之前全部小矩形面积之和为fm;(频率直方图面积计算,即组距乘以频率/组距。) x*最高矩形(频率/组距)+ fm=0.5求解X, 那么a+X即为中位数。第5页思索题:怎样从频率分布直方图中预计中位数?中位数左边立方图小矩形面积为0.502小矩形面积之和为:0.5(0.08+0.16+0.30+0.44)=0.490.200.400.1000.511.522.533.544.50.500.30频率/组
4、距月均用水量 /t0.080.160.440.50.490.010.01/0.5=0.02如图在直线t2.02之前全部小矩形面积为0.5所以该样本中位数为2.02第6页练习.(广东11变式题1)为了调查某厂工人生产某种产品能力,随机抽查 了20位工人某天生产该产品数量.产品数量分组区间为,分布直方图如图3,则这20名工人中一天生产中位数 .该产品数量在由此得到频率第7页 3、平均数是频率分布直方图“重心”.是直方图平衡点. n 个样本数据平均数由公式:X=假设每组数据分别为a1, b1)、 a2, b2)、 ak, bk)时, 且每组数据对应频率分别为f1、 f2 、 fk;那么样本平均数(或
5、总体数学期望)由以下公式计算即可。第8页由频率分布直方图预计样本平均数(或总体数学期望)公式: X =( a1+b1)/2* f1+ (a2+b2)/2* f2+ (ak+bk)/2* fk(其中每组数据频率还能够由频率直方图面积计算而得,即组距乘以频率/组距。) 第9页练习.(广东11变式题2)为了调查某厂工人生产某种产品能力,随机抽查 了20位工人某天生产该产品数量.产品数量分组区间为,分布直方图如图3,则这20名工人中一天生产平均数 .该产品数量在由此得到频率第10页总体分布预计练习:对某电子元件进行寿命追踪调查,情况以下:寿命个数1002002003003004004005005006
6、002030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)预计电子元件寿命在100h400h以内概率;(4)预计电子元件寿命在400h以上概率;(5)预计总体数学期望.第11页总体分布预计100200200300300400400500500600寿命累计频率频数累积频率20308040302000.100.150.400.200.1510.100.250.650.851频率/组距第12页总体分布预计第13页思索:从样本数据可知,所求得该样本众数、中位数和平均数,这与我们从样本频率分布直方图得出结论有偏差,你能解释一下原因吗? 频率分布直方图损失了一些样本数据,得到是一个预
7、计值,且所得估值与数据分组相关.注:在只有样本频率分布直方图情况下,我们能够按上述方法预计众数、中位数和平均数,并由此预计总体特征.第14页 三、用频率分布直方图预计总体数字特征利弊:总体各种数值特征都能够由两种路径来预计, 直接利用样本数据或由频率分布直方图来预计。 两种方法各有利弊;比如:1、经过频率分布直方图预计精度低;2、经过频率分布直方图预计结果与数据分组相关;3、在不能得到样本数据,只能得到频率分布直方图情况下,也能够预计总体特征,而且直方图比较直观便于形象地进行分析。第15页四、三种数字特征优缺点 :(1)众数表达了样本数据最大集中点,但它显然对其它数据信息忽略使得无法客观地反应总体特征。(2)中位数是样本数据所占频率等分线,它不受少数几个极端值影响,这在一些情况下是优点,但它对极端值不敏感有时也会成为缺点.(3)因为平均数与每一个样本数据相关,所以任何一个样本数据改变都会引发平均数改变,这是众数、中位数都不含有性质。但平均数受数据中极端值影响较大,使平均数在预计总体时可靠性降低。第16页1、在一次歌手大奖赛上,七位评委为歌手打出分数以下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据平均值和方差分别为_; 2、已知数据 平均数是3,方差为2,求数据 平均数、方差、标准差? 9.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 定制化代运营服务合同模板
- 退休人员聘用合同书模板
- 老年文化中心合同模板
- 家电产品赠与协议
- 快乐读书综合实践活动方案
- 礼品代销协议
- 工厂供电合作协议
- 清表工程协议书
- 普通柴油发电机组自启动、自切换改造方案
- 清洁能源供热合同
- 保险行业2024年市场发展趋势
- 艾滋病机会性感染治疗临床路径全套
- 《中秋节来历》课件
- 2023-2024学年天津市和平区七年级上学期期中质量调查数学试题(含答案)
- 湖南省长沙市长郡集团五校联考2023-2024学年八年级上学期期中地理试题( 含答案解析 )
- 服装品牌运作西班牙快速时尚品牌ZARA-案例研究
- 信息化运维项目评分办法及评分标准
- 新青岛版科学四年级上册全册实验汇总实验专项
- 2023-2024学年上海市高二上册期中合格考地理学情调研试题(含解析)
- 文件更改记录表
- 小班绘本教学《藏在哪里了》课件
评论
0/150
提交评论