




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、4 数据的数字特征,小王去某公司应聘.公司经理说,我们这里报酬不错, 月平均工资是3000元,技术员A说,我的工资是1500元,在公司算中等收入,小王感觉待遇不错,第二天就去上班了.一周后,小王发现了问题,去找经理,“经理,你说的不对,我已问过其他技术员,没有一个技术员的工资超过3000元.经理说:“没错,平均工资确实是每月3000元.不信可看看公司的工资报表.”小王糊涂了,这是怎么回事呢?,下表是该公司月工资报表:,经理是否忽悠了小王?为什么呢?,思考1.什么叫平均数?有什么意义? 思考2.什么叫中位数?有什么意义? 思考3.什么叫众数?有什么意义? 思考4.什么叫极差?有什么意义? 思考5
2、.什么叫方差?有什么意义? 思考6.什么叫标准差?有什么意义?,第一类:用样本的某种数字特征(例如平均数、标准差等)去估计总体的相应数字特征.,例1 某公司员工的月工资情况如表所示:,(1)分别计算该公司员工月工资的平均数、中位数和众数. (2)公司经理会选取上面哪个数来代表该公司员工的月工资情况?税务官呢?工会领导呢?,解:(1)该公司员工的月工资平均数为 即该公司员工月工资的平均数为1 373元.,中位数为800元,众数为700元. (2)公司经理为了显示本公司员工的收入高,采用平均数1 373元作为月工资的代表;而税务官希望取月工资中位数800元,以便知道目前的所得税率对该公司的多数员工
3、是否有利;工会领导则主张用众数700元作为代表,因为每月拿700元的员工数最多.,例2 在上一节中,从甲、乙两个城 市随机抽取的16台自动售货机的销 售额可以用茎叶图表示,如图所示: (1)甲、乙两组数据的中位数、众 数、极差分别是多少? (2)你能从图中分别比较甲、乙两组数据的平均数和方差的大小吗?,解:(1) 观察茎叶图,我们不难看出:甲城市销售额的中位数为20,众数为10,18,30,极差为53;乙城市销售额的中位数为29,众数为23,34,极差为38.,(2)从茎叶图中我们可以看出:甲城市销售额分布主要在茎叶图的上方且相对较散,而乙城市的销售额分布则相对集中在茎叶图的中部.由此,我们可
4、以估计:甲城市销售额的平均数比乙城市的小,而方差比乙城市的大.,分别计算上面从甲、乙两台机床抽取的10件产品直径的标准差.,解:从数据容易得到甲、乙两台机床生产的这10件产品直径的平均值: 我们分别计算它们直径的标准差:,/mm,/mm,例3甲、乙两台机床同时生产直径是40 mm的零件.为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如表所示.,由上面的计算可以看出:甲、乙两台机床生产的产品直径的平均值相同,而甲机床生产的产品直径的标准差为0.161 mm,比乙机床的标准差 0.077 mm大,说明乙机床生产的零件更标准些,即乙机床的生产过程更稳定一些.,(2014陕西高考)
5、某公司10位员工的月工资(单 位:元)为 ,其均值和方差分别为 和s2, 若从下月起每位员工的月工资增加100元,则这10位 员工下月工资的均值和方差分别为( ) A. ,s2+1002 B. +100, s2+1002 C. ,s2 D. +100, s2,D,3.下表是某班40名学生参加“环保知识竞赛”的得分统计表:,请参照这个表解答下列问题: (1)用含x,y的式子表示该班参加“环保知识竞赛”的班平均分f.(2)若该班这次竞赛的平均分为2.5分,求x,y的值.,一、估计总体的分布,例1 . 为了了解某地区高二学生的身体发育情况, 抽查了地区100名年龄为15.5岁至17岁的男生的体重情况
6、, 结果如下(单位:kg):,60.5 69.5 65 61.5 64.5 66.5 64 64.5 62 58.5 73.5 59 67 70 57.5 65.5 68 71 75 68.5 62.5 66 59.5 63.5 64.5 67.5 73 68 72 66.5 74 63 60 55 70 64.5 58 64 70.5 57 62.5 65 69 71.5 73 62 58 74 71 66 63.5 60.5 59.5 63.5 65 70 74.5 68.5 64 55.5 72.5 66.5 68 76 61 60 68 57 69.5 74 64.5 59 61.5
7、67 68 63.5 58 59 65.5 62.5 69.5 72 64.5 61 68.5 64 62 65.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5,请你估计该地区年龄为15岁至16岁的男生体重的分布情况.,第二类:用样本的频率分布去估计总体分布;,解:,这里, 如果把总体看作是该地区年龄为15.5岁至17岁的男生体重,那么我们就要通过上面的样本信息, 来估计总体的分布,情况.但从抽样的数据很难直接估计出总体的分布情况.,60.5 69.5 65 61.5 64.5 66.5 64 64.5 62 58.5 73.5 59 67 70 57.5 65.
8、5 68 71 75 68.5 62.5 66 59.5 63.5 64.5 67.5 73 68 72 66.5 74 63 60 55 70 64.5 58 64 70.5 57 62.5 65 69 71.5 73 62 58 74 71 66 63.5 60.5 59.5 63.5 65 70 74.5 68.5 64 55.5 72.5 66.5 68 76 61 60 68 57 69.5 74 64.5 59 61.5 67 68 63.5 58 59 65.5 62.5 69.5 72 64.5 61 68.5 64 62 65.5 58.5 67.5 70.5 65 66 6
9、6.5 70 63 59.5,为此, 我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表:,解:,这里, 如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息, 来估计总体的分布情况.,但从抽样的数据很难直接估计出总体的分布情况.,但是, 这些关于分布情况的描述仍不够直观形象, 为了得到更为直观的信息, 我们可以再将表中的数据按照下表的方式分组.,为此, 我们可以先将抽样的数据按照下表进行分组:,解:,这里, 如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息, 来估计总体的分布情况.,但从抽样的数据很难直接估计出
10、总体的分布情况.,频数分布直方图,为此, 我们可以先将抽样的数据按照下表进行分组:,解:,这里, 如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息, 来估计总体的分布情况.,但从抽样的数据很难直接估计出总体的分布情况.,思考交流,1.体重位于哪个区间的人数最多?,2.体重在64.566.5kg的频率约是多数?,3.体重小于64.5kg的频率约是多数?,4.体重在63.565.5kg的频率约是多数?,64.5,66.5),16%,42%,15%,频率分布直方图,抽象概括:,上图中, 每个小矩形的宽度为xi(分组的宽度), 高为 , 小矩形的面积恰为相应的频
11、率 fi . 各小矩形面积之和为1,通常称这样的图形为频率分布直方图.,当样本容量较大时, 样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.,因此, 我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的概率, 也即总体的分布情况.,频率折线图,注意:,折线与横轴所围成的面积是1.,如果样本容量取得足够大, 分组的组距取得足够小, 则相应的频率折线图将趋于一条光滑的曲线.,我们称这条光滑的曲线为总体的密度曲线.,练习:为了了解一大片经济林生长情况. 随机测量其中的100株树木的底部周长, 得到如下数据表(单位:cm),(1)编制频率分布表; (2)绘制频率分布直方图
12、; (3)估计该片经济林中底部周长小于100cm的树木约占多少, 周长不小于120cm的树木约占多少.,解:,(1)这组数据的最大值是135, 最小值是80, 全距是55.,可将其分为11组, 组距为5.,解:,(1)这组数据的最大值是135, 最小值是80, 全距是55.,可将其分为11组, 组距为5.,(2)直方图如图:,(3)样本小于100的频率为:,0.21,样本不小于120的频率为:,0.19,估计该片经济林中底部周长小于100cm的树木约占21%, 周长不小于120cm的树木约占19%.,3.抽象概括,用样本估计总体时, 如果抽样的方法比较合理, 那么样本可 以反映总体的信息, 但
13、从样本得到的信息会有偏差.,在随机抽样 中, 这种偏差是不可避免的.,虽然我们从样本数据得到的分布、平均数和标准差(通常 称之为样本分布、样本平均数和样本标准差)并不是总体真正 的分布、平均数和标准差. 而只是总体的一个估计, 但这种估计 是合理的, 特别是当样本容量很大时, 它们确实反映了总体的信 息.,练习.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图,(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价,(2)由s甲2s乙2,可知乙的成绩较稳定,从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高 【点评】当总体容量较大时,用样本的数字特征去估计总体的数字特征,方差和标准差都是刻画数据的离散程度的,但在实际问题中多采用标准差,如生产中当样本的平均数或标准差超过了规定界限时,说明这批产品质量距生产要求有了较大偏离,应及时进行检查解决,1. 画频率分布直方图的步骤 (1)计算最大值与最小值的差(知道这组数据的变动范围) ; (2)决定组距与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 期货市场绿色金融发展的政策支持考核试卷
- 木材加工厂的灾害防范考核试卷
- 电力工程电力监控系统施工考核试卷
- 焙烤食品制造工艺流程控制与优化考核试卷
- 火工品生产过程中的安全技术考核试卷
- 冷藏车运输冷链体系建设与优化考核试卷
- 2025年轧钢刀项目可行性研究报告
- 2025年调压阀组项目可行性研究报告
- 钢轨维修施工方案
- 2025-2030中国自行车喇叭行业市场发展趋势与前景展望战略研究报告
- 中国主要水域资源分布及开发利用
- 《中电联团体标准-220kV变电站并联直流电源系统技术规范》
- 2024年郑州黄河护理职业学院单招职业技能测试题库及答案解析文档版
- 非机动车交通管理及规划研究
- 劳务派遣及医院护工实施预案
- 华电行测题库及答案2024
- 产后病(中医妇科学)
- 苏州市2023-2024学年高一上学期期末考试数学试题(原卷版)
- 社区获得性肺炎教学演示课件
- 农村蓝莓树补偿标准
- 市级临床重点专科申报书(麻醉科)
评论
0/150
提交评论