中位数平均数众数方差省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件_第1页
中位数平均数众数方差省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件_第2页
中位数平均数众数方差省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件_第3页
中位数平均数众数方差省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件_第4页
中位数平均数众数方差省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.2

用样本数字特征预计总体数字特征

1/351.频率分布直方图在频率分布直方图中,纵轴表示

,数据落在各小组内频率用

表示,全部长方形面积之和

.提醒:注意频率分布条形图和频率分布直方图是两个不一样概念.即使它们横轴表示内容是相同,不过频率分布条形图纵轴(矩形高)表示频率;频率分布直方图纵轴(矩形高)表示频率与组距比值,其对应组距上频率等于该组距上矩形面积.频率与组距比值小长方形面积等于12/352.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端

,就得频率分布折线图.(2)总体密度曲线:伴随样本容量增加,作图时全部组数增加,

减小,对应频率分布折线图会越来越靠近于一条光滑曲线,即总体密度曲线.中点组距3.茎叶图当样本数据较少时,茎叶图表示数据效果很好,一是从统计图上没有

丢失,二是方便统计与表示,但当样本数据较多或数据位数较多时,茎叶图就不太方便了.原始数据3/354.众数、中位数、平均数(1)在一组数据中,出现次数

数据叫做这组数据众数.(2)将一组数据按大小依次排列,把处于

位置一个数据(或中间两个数据平均数)叫做这组数据中位数.(3)假如有n个数x1,x2,…,xn,那么 叫做这n个数平均数.较多中间5.标准差和方差 (1)标准差是样本数据到平均数一个 . (2)s=

. (3)方差: (xn是样本数据,n是样本容量,是样本平均数).平均距离4/35【思索】

总体平均数与总体方差分别反应了总体什么特征,有哪些区分?答案:总体平均数即总体期望值,是反应总体平均水平一个值;而总体方差是反应总体波动情况一个量,二者反应角度不一样,不可相互比较,但有些问题在总体期望值差距不大时,可考虑用总体方差深入区分.5/351.(·福建卷)一个容量为100样本,其数据分组与各组频数以下:则样本数据落在(10,40]上频率为(

)A.0.13B.0.39C.0.52D.0.64解析:由列表可知样本数据落在(10,40]上频数为52,故其频率为0.52.答案:C组别(0,10](10,20](20,30](30,40](40,50](50,60](60,70]频数12132415161376/352.右图是依据《山东统计年鉴》中资料作成1997年至本省城镇居民百户家庭人口数茎叶图.图中左边数字从左到右分别表示城镇居民百户家庭人口数百位数字和十位数字,右边数字表示城镇居民百户家庭人口数个位数字.从图中能够得到1997年至本省城镇居民百户家庭人口数平均数为()A.304.6B.303.6C.302.6D.301.6解析: =303.6.答案:B7/353.从某项综合能力测试中抽取100人成绩,统计如表,则这100人成绩标准差为(

)A. B. C.3 D.解析:由标准差公式计算可得.答案:B分数54321人数20103030108/354.(·湖北卷)如图是样本容量为200频率分布直方图.依据样本频率分布直方图预计,样本数据落在[6,10)内频数为________,数据落在[2,10)内概率约为________.解析:200×0.08×4=64;(0.02+0.08)×4=0.4.答案:64

0.49/355:

甲、乙两台机床同时加工直径为10mm零件,为了检验产品 质量,从产品中各随机抽取6件进行测量,测得数据以下 (单位mm) 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据平均数和方差; (2)依据(1)计算结果,说明哪一台机床加工这种零件更符合要求.10/35思维点拨:已知一组数据x1,x2,…,xn,其平均数为,方差为

标准差为解:(1)

[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=

11/35[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)因为

,说明甲机床加工零件波动比较大,所以乙机床加工零件更符合要求.12/351.平均数与方差都是主要数字特征,是对总体一个简明描述,它们所反应情况有着主要实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.附注:13/352.平均数、方差公式推广(1)若数据x1,x2,…,xn平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a平均数是m+a.(2)数据x1,x2,…,xn方差为s2.①s2=②数据x1+a,x2+a,…,xn+a方差也为s2;③数据ax1,ax2,…,axn方差为a2s2.14/35

二、众数、中位数、平均数与频率分布直方图关系

1、众数在样本数据频率分布直方图中,就是最高矩形中点横坐标。比如,在上一节调查100位居民月均用水量问题中,从这些样本数据频率分布直方图能够看出,月均用水量众数是2.25t.如图所表示:15/35频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)16/35

2、在样本中,有50%个体小于或等于中位数,也有50%个体大于或等于中位数,所以,在频率分布直方图中,中位数左边和右边直方图面积应该相等,由此能够预计中位数值。下列图中虚线代表居民月均用水量中位数预计值,此数据值为2.02t.17/35频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)18/35说明:2.02这个中位数预计值,与样本中位数值2.0不一样,这是因为样本数据频率分布直方图,只是直观地表明分布形状,不过从直方图本身得不出原始数据内容,所以由频率分布直方图得到中位数预计值往往与样本实际中位数值不一致.19/35

3、平均数是频率分布直方图“重心”.是直方图平衡点.n个样本数据平均数由公式:X=值为:在频率分布直方图中每个小矩形度面积乘以小矩形底边中点横坐标之和20/35频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)21/35三三种数字特征优缺点

1、众数表达了样本数据最大集中点,但它对其它数据信息忽略使得无法客观地反应总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t居民数比月均用水量为其它数值居民数多,但它并没有告诉我们多多少.22/35

2、中位数是样本数据所占频率等分线,它不受少数几个极端值影响,这在一些情况下是优点,但它对极端值不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽略。23/35

3、因为平均数与每一个样本数据相关,所以任何一个样本数据改变都会引发平均数改变,这是众数、中位数都不含有性质。也正因如此,与众数、中位数比较起来,平均数能够反应出更多关于样本数据全体信息,但平均数受数据中极端值影响较大,使平均数在预计时可靠性降低。24/35在频率分布直方图中,中位数、众数与平均数怎样确定?提醒:在频率分布直方图中,中位数左边和右边直方图面积相等,由此能够预计中位数值,而平均数预计值等于频率分布直方图中每个小矩形面积乘以小矩形底边中点横坐标之和.众数是最高矩形中点横坐标.25/351.(上海高考)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染标志为“连续10天,天天新增疑似病例不超出7人”,依据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为326/35【解析】因为甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数平均数为4,因今后面人数能够大于7,故甲地不符合.乙地中总体均值为1,所以这10天感染人数总和为10,又因为方差大于0,故这10天中不可能天天都是1,能够有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现最多,而且能够出现8,故丙地不符合.故丁地符合.【答案】D27/352:(·安徽高考)某良种培育基地正在培育一个小麦新品种A.将其与原有一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)以下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成数据茎叶图;(2)用茎叶图处理现有数据,有什么优点?(3)经过观察茎叶图,对品种A与B亩产量及其稳定性进行比较,写出统计结论.28/35【解】(1)29/35(2)因为每个品种数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不但清楚明了地展示了数据分布情况,便于比较,没有任何信息损失,而且还能够随时统计新数据.(3)经过观察茎叶图能够看出:①品种A亩产平均数(或均值)比品种B高;②品种A亩产标准差(或方差)比品种B大,故品种A亩产稳定性较差.30/353.从甲、乙两品种棉花中各抽测了25根棉花纤维长度(单位:mm),结果以下:甲品种:271273280285285287292294295301303303307308310314319323325325328331334337352乙品种:284292295304306307312313315315316318318320322322324

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论