级用样本数字特征估计总体数字特征_第1页
级用样本数字特征估计总体数字特征_第2页
级用样本数字特征估计总体数字特征_第3页
级用样本数字特征估计总体数字特征_第4页
级用样本数字特征估计总体数字特征_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、“样本数据的频率分布表”列表步骤第一步,求极差.2一、复习回顾

(极差=样本数据中最大值与最小值的差)第二步,定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)

第三步,定分点,将数据分组.第四步,统计频数,计算频率,制成表格.

(频数=样本数据落在各小组内的个数:频率=频数÷样本容量)1)、作图步骤:2、频率分布直方图3频率分布直方图步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图2)、作图方法:(1)、作直角坐标系,以横轴表示数据,纵轴表示“频率/组距”;(2)、把横轴分为若干段,每一线段对应一个组距,区间通常取左闭右开,最后一组取闭区间

(3)、以横轴组距为底“频率/组距”为高作矩形,所得矩形的面积即是该组上的频率.43、频率分布折线图

将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,得到的一条折线,就叫频率分布折线图.

若样本容量足够大,组距取得足够小,频率折线图将趋于一条曲线,这一曲线叫总体分布的密度曲线.总体密度曲线总体在区间内取值的概率4、总体分布的密度曲线.55、茎叶图及作图步骤

第一步:将数据分为“茎”(高位)和“叶”(低位)两部分;

第二步:将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;

第三步:将各个数据的叶按大小次序写在茎右(左)侧.25

用来表示数据的一种图,茎是中间的一列数,叶是从茎上生长出来的数.步骤:

茎叶图一定程度能够反应数据的集中程度及趋势,能否有这样的数用很少就可反应样本数据的特征?6二、新课教学1、众数、中位数、平均数

一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数

一组数据中出现次数最多的那个数据叫做这组数的众数1)中位数:2)众数:3)平均数:

将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数7月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5

分组频率

[0,0.5)0.04[0.5,1)0.08[1,1.5)0.15[1.5,2)0.22[2,2.5)0.25[2.5,3)0.14[3,3.5)0.06[3.5,4)0.04[4,4.5)0.02

例:在上一节调查的100位居民的月均用水量的问题中,样本数据的频率分布直方图如下,你能由图得到月均用水量的众数,中位数,平均数吗?8月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5众数为最高矩形的中点众数为2.25t9月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5

分组频率

[0,0.5)0.04[0.5,1)0.08[1,1.5)0.15[1.5,2)0.22[2,2.5)0.25[2.5,3)0.14[3,3.5)0.06[3.5,4)0.04[4,4.5)0.020.5-0.04-0.08-0.15-0.22=0.01,0.01÷0.5=0.02,中位数是2.02.10中位数是?月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.50.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t).平均数是2.02.11

分组频率

[0,0.5)0.04[0.5,1)0.08[1,1.5)0.15[1.5,2)0.22[2,2.5)0.25[2.5,3)0.14[3,3.5)0.06[3.5,4)0.04[4,4.5)0.024)、三种数字特征的比较:

(1)众数:体现了样本数据的最大集中点,但对其它数据的忽视使得无法客观的反映总体特征。

(2)中位数:它不受少数几个极端值影响,在某些情况下是优点,但有时也会是缺点。

(3)平均数:可以反映出更多关于样本数据全体信息,但受极端值影响大。12问题引入

有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:甲78795491074乙9578768677问:该如何评价甲、乙两人的这次射击水平?

两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?1345678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数(乙)发现什么?

为此,我们还需要从另外一个角度去考察这2组数据!频率14

直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图,统计表时提到过的极差.

甲的环数极差=10-4=6

乙的环数极差=9-5=4.

它们在一定程度上表明了样本数据的分散程度,与平均数比较,显然,极差对极端值非常敏感

一般情况数据的离散程度用极差、方差或标准差来描述15

1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是

来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。那么我们用它们的平均数,即2、方差、标准差16

2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。3)标准差的计算方法:(2)算出每个样本数据与样本平均数的差(i=1,2,……,n);(1)算出样本数据的平均数x;17(3)算出(i=1,2,…,n);(4)算出(i=1,2,…,n)这n个数的平均数,即为样本方差s2;(5)算出方差的算术平方根,即为样本标准差s18例1.某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?3、巩固运用19解:(1)由表格可知:众数为200,中位数为220。平均数为300(元/周)。(2)虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.20例2.右面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间。睡眠时间人数频率[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.02100121解2:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h)

故平均睡眠时间约为7.39h解1:求各组中值与对应频率之积的和,6.25×0.05+6.75×0.17+7.25×0.33+7.75×37+8.25×0.06+8.75×0.02=7.39(h)

估计该校学生的日平均睡眠时间约为7.39h22例3.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1)解:.

所以这组数据的方差为5.5,标准差为2.3.231、众数、中位数、平均数的概念1)中位数、一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数2)众数、一组数据中出现次数最多的那个数据叫做这组数的众数三、小结或作业3)平均数:

将频率分布直方图中每个小矩形的面积与小矩形底边

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论