版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计(公式、定理、结论图表)
抽样
►样本
估计I
总体的取值规律一样本频率分布
普查
I估计
总体的百分位数vj一样本的百分位数
总体数据,!样本观漏数据
总体的平均值、估计!样本的平均数、
中位数、众数,中位数、众数
估计
总体标准差、样本标准差、
方差、极差方差、极差
决策与建议
1.全面调查和抽样调查
调查方式全面调查(普查)抽样调查
对每一个调查对象都进行调根据一定目的,从总体中①抽取一部分个体
定义查的方法,称为全面调查,又称进行调查,并以此为依据对总体的情况作出
i'Kt估计和推断的调查方法,称为抽样调查
总体:在一个调查中,我们把调
样本:把从总体中抽取的那部分个体称为样
查对象的全体称为总体.
相关概念本.
个体:组成总体的每一个调查
样本量:样本中包含的个体数称为样本量
对象称为个体
2.简单随机抽样的概念
放回简单随机抽样不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中②逐仝抽取n(14n<N)个个体作为样
本
如果抽取是放回的,且每次抽取时总体内如果抽取是不放回的,且每次抽取时总体内
的各个个体被抽到的概率都③相等,我们⑷未进入样本的各个个体被抽到的概率都
把这样的抽样方法叫做放回简单随机抽相等,我们把这样的抽样方法叫做不放回简
样单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获
得的样本称为简单随机样本
3.抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、
小球等)上作为号签,并将这些小纸片放在一个⑤丕迪的盒里,充分搅拌.最后从盒中不放回地
逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
4.随机数法
(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的
随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的
个体数.
(2)产生随机数的方法:⑴用随机试验生成随机数;(ii)用信息技术生成随机数.
5.总体均值和样本均值
⑴总体均值:一般地,总体中有N个个体,它们的变量值分别为YI,Y2,...,YN,则称F=@
%+丫2;..+汴%*匕为总体均值,又称总体平均数.
1—1
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k4N)个,不妨记
为Yi,Y2,.,Yk,其中Yi出现的频数£(i=l,2,...,k),则总体均值还可以写成加权平均数的形式"⑧
*11kfiYi-
Ni=l
⑶如果从总体中抽取一个容量为n的样本,它们的变量值分别为W2,…,yn,则称产⑨
左若包为样本均值,又称样本平均数.
6.分层随机抽样的相关概念
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体
属于且仅属于一个子总体.在每个子总体中独立地进行①简单随机抽样.再把所有子总体中抽取
的样本②合在一起作为总样本.这样的抽样方法称为分层随机抽样,每一个子总体称为层.
⑵比例分配:在分层随机抽样中.如果每层③样本量都与层的大小成比例.那么称这种样本
量的分配方式为比例分配.
7.画频率分布直方图的步骤
⑴求极差:极差为一组数据中①最大值与②最小值的差:
(2)决定组距与组数:当样本容量不超过100时,常分成③拉组,为方便起见,一般取等长组
距,并且组距应力求"取整”;
(3)将数据分组;
(4)列频率分布表:一般分四列:分组、④频数累计、频数、⑤频率.其中频数合计应是样本容
量,频率合计是⑥上
(5)画频率分布直方图:横轴表示分组,纵轴表示陪.
小长方形的面积=组距X端暮⑨好,各小长方形的面积的总和等于1.
组距
8.其他统计图表
统计图表主要应用
扇形图直观描述各部分数据在全部数据中所占的比例
条形图和直方图直观描述不同类别或分组数据的频数和频率
反映统计对象在不同时间(或其他合适情形)的发展变化
折线图
情况
9.第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有①也的数据小于
或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
10.计算一组n个数据的第p百分位数的步骤
第1步.按②从小到大排列原始数据.
第2步,计算[=③许%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,
则第p百分位数为第i项与第(i+1)项数据的④壬场效.
11.四分位数
⑤第25百分位数.⑥第50百分位数.⑦第75百分位数,这三个分位数把一组由小到大排列
后的数据分成四等份,因此称为四分位数.
12.众数、中位数和平均数的定义
(I)众数:一组数据中①出现次数最多的数.
⑵中位数:一组数据按大小顺序排列后.处于②中间位置的数.如果这组数据是偶数个.则取
③中间两个数据的平均数.
(3)平均数:一组数据的④虫除以数据个数所得到的数.
13.众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中.样本平均数可以用每个小矩形底边中点的⑤横坐标与小
矩形的⑥面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中.中位数左边和右边的直方图的面积应该⑦相等.
(3)众数:众数是⑧最高小矩形底边的中点所对应的数据.
【特别提醒】
众数、中位数和平均数的比较
名称优点缺点
与中位数相比,平均数反映出样本任何一个数据的改变都会引起
平均数数据中更多的信息,对样本中的极平均数的改变.数据越"离群",对
端值更加敏感平均数的影响越大
不受少数几个极端数据(即排序靠
中位数对极端值不敏感
前或靠后的数据)的影响
众数只能传递数据中信息很少
众数体现了样本数据的最大集中点
的一部分,对极端值不敏感
14.一组数据Xl,X2,...,Xn的方差和标准差
数据—的方差为%卒同2=稣纣荷标准差为③即至
15.总体方差和总体标准差
(1)总体方差和标准差:如果总体中所有个体的变量值分别为YI,Y2,...,YN,总体的平均数为匕
则称S』I(匕*)2为总体方差,S=⑤府为总体标准差.
N(=1
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k4N)个,不妨记为
2
Yi,Y2,...,Yk淇中Yi出现的频数为fi(i=l,2,...,k),则总体方差为S=®ilh(YrYy.
16.样本方差和样本标准差
如果一个样本中个体的变量值分别为yi,y2,...,yn,样本平均数为歹,则称s』®I(y「兄)2为样
ni=l
本方差,点为样本标准差.
17.标准差的意义
标准差刻画了数据的⑨离散程度或⑩波动幅度.标准差越大.数据的离散程度越⑪大:标准
差越小,数据的离散程度越⑫小.
【特别提醒】
对标准差和方差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程
度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+oo).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标
准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
18.分层随机抽样的方差
设样本容量为n,平均数为元其中两层的个体数量分别为mg,两层的平均数分别为元1,为,方
222
差分别为s:刀,则这个样本的方差为s=0^-rs?+(xi-%)i+^rs^+(x7-x)i.
〈解题方法与技巧》
1.使用分层随机抽样法应遵循的原则
(1)将相似的个体归入一类,即为一层,分层栗求每层的各个个体互不交叉,即遵循不重复、不
遗漏的原则;
(2)分层随机抽样为保证每个个体等可能人样,需在各层中进行简单随机抽样,每层样本数
量与每层个体数量的比等于抽样比.
2.进行分层随机抽样的相关计算时,常用到的关系
.)样本容量该层抽取的个体数.
■,总体容量该层的个体数'
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;
(3)样本的平均数和各层的样本平均数的关系:
典例1:某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调
查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有
20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这
两项调查宜采用的抽样方法依次是()
A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法
【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采
用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样:当总体中个
体较少时,宜采用随机抽样.
【解析】依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.
【总结升华】采川什么样的抽样方法要依据研究的总体中的个体情况来定.
3.频率分布直方图的性质
(1)因为小长方形的面积=组距><篝=频率,所以各小长方形的面积表示相应各组的频率.这
样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.
(2)在频率分布直方图中,各小长方形的面积的总和等于1.
—
4.频率分布直方图中第p百分位数的计算方法
方法一:(1)确定百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别
为fa%,fb%,则第p百分位数为a+/笠x(b-a).
方法二:设出百分位数的值,利用百分位数的定义计算.
典例2:为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁—18岁的男
【答案】C;
【解析】根据运算的算式:体重在(56.5,64.5)学生的累积频率为2X0.03+2X0.05+2X0.05+2
X0.07=0.4,则体重在(56.5,64.5)学生的人数为0.4X100=40.
5.利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、
方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
6.利用样本数字特征进行决策时的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响较大;中位数
是样本数据所占频率的等分线,不受极端值的影响;众数只能体现数据的最大集中点,无法客观
反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多
较小的极端值.
7.众数、中位数'平均数与频率分布直方图的关系
众数是最高小长方形底边的中点所对应的数据,表示样本数据的
众数
中心值
①在频率分布直方图中,中位数左边和右边的直方图面积相等,
中位数由此可以估计中位数的值,但是有偏差;
②表示样本数据所占频率的等分线
①平均数等于每个小长方形的面积乘小长方形底边中点的横坐
平均数标之和;
②平均数是频率分布直方图的重心,是频率分布直方图的平衡点
8.计算分层随机抽样的方差s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 会计从业资格考试考卷
- 慢性心力衰竭护理常规
- 2024年秋季学期新人教版三年级上册英语课件 Unit 2 Part C 第8课时 Reading time
- 2024年秋季学期新人教版七年级上册英语课件 Unit 6 Section A (1a-1e) (第1课时)
- 2024届新疆莎车县中考英语押题卷含答案
- 立式铣床产品市场需求分析报告
- 糖果产品市场需求分析报告
- 锅炉炉膛安全监控装置商业机会挖掘与战略布局策略研究报告
- 特种定制电源产品市场环境与对策分析
- 电子枪镀膜机产品市场需求分析报告
- 关于欧亚牛奶的分析报告
- 现在进行时(全国一等奖)
- 面部风水培训课件
- 实体书店与文化产业市场前景分析
- 慢性肾脏病高血压指南解读
- 民族宗教法律知识讲座
- 2024年重庆联合产权交易所集团招聘笔试参考题库含答案解析
- 关于胃肠道健康知识讲座
- 人文关怀与老年护理
- 文明出行拍摄方案
- 市立医院院级患者安全专项行动方案根据患者安全专项行动方案2023-2025年制订
评论
0/150
提交评论