大高考2017版高考数学一轮总复习第10章计数原理概率与统计第七节统计与统计案例课件理_第1页
大高考2017版高考数学一轮总复习第10章计数原理概率与统计第七节统计与统计案例课件理_第2页
大高考2017版高考数学一轮总复习第10章计数原理概率与统计第七节统计与统计案例课件理_第3页
大高考2017版高考数学一轮总复习第10章计数原理概率与统计第七节统计与统计案例课件理_第4页
大高考2017版高考数学一轮总复习第10章计数原理概率与统计第七节统计与统计案例课件理_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七节统计与统计案例知识点一随机抽样与总体分布1.简单随机抽样(1)抽取方式:_;(2)每个个体被抽到的概率:_;(3)常用方法:_、_.逐个不放回抽取相等抽签法随机数法2.系统抽样将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取_个体,得到所需要的样本,这种抽样的方法叫做系统抽样.3.分层抽样当已知总体由差异明显的几部分组成时,将总体分成几部分(各部分互不交叉),然后按照_进行抽样,这种抽样方法叫做分层抽样,所分成的部分叫做层.一个各部分所占的比例4.统计图表的含义总体频率分布极差分组(2)频率分布直方图:能够反映样本的_的直方图.(3)频率分布折线图:将频率分布直方图中各相

2、邻的矩形的_的中点顺次连接起来,就得到频率分布折线图.(4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,即总体密度曲线.频率分布规律上底边(5)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧.5.样本的数字特征(1)众数:一组数据中_的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于_位置的一个数据或两个数据的平均数叫做这组数据的中位数.出现次数最多最中间三种抽样:简单随机抽样;系统抽样;分层抽样.

3、一个易错点:频率分布直方图纵轴意义.解析成绩在80,90)的矩形的面积为10.0061030.01100.0541010.820.18,所以10 x0.18,解得x0.018.答案0.018知识点二变量间的相关关系与统计案例1.两个变量的线性相关(1)正相关在散点图中,点散布在从_到_的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从_到_的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在_,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.左下角左上角右下角一条直线附近右上角2.回归方程(

4、1)最小二乘法求回归直线使得样本数据的点到回归直线的_最小的方法叫做最小二乘法.(2)回归方程方程 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中 是待定参数.距离的平方和3.回归分析相关关系(3)相关系数当r0时,表明两个变量_;当r0时,表明两个变量_.r的绝对值越接近于1,表明两个变量的线性相关性_.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于_时,认为两个变量有很强的线性相关性.正相关负相关越强0.754.独立性检验(1)分类变量:变量的_表示个体所属的不同类别的变量叫做分类变量.(2)列联表:列出的

5、_称作列联表.假设有两个分类变量X,Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表为: y1y2总计x1ababx2cdcd总计acbdabcd不同“值”两个变量的频数表两个分类变量有关系(3)三个特征数据:回归方程 中的 表示x增加一个单位时, 的变化量约为 .R2越大,残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.当K23.841时,则有95%的把握说事件A与B有关;当K26.635时,则有99%的把握说事件A与B有关;当K22.706时,则认为事件A与B无关在研究气温和热茶销售杯数的关系时,若求得相关指数R2_,表明“气温解释了8

6、5%的热茶销售杯数变化”或者说“热茶销售杯数差异有85%是由气温引起的”.bby答案0.85一条规律:回归直线恒过样本点的中心, x y解析回归直线必过样本中心,故其方程为y51.23(x4),即y1.23x0.08.答案y1.23x0.08(1)系统抽样又称“等距抽样”,所以依次抽取的样本对应的号码就组成一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码,但有时也不是按一定间隔抽取的.随机抽样突破方略(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.(3

7、)分层保证每个个体等可能被抽取,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.【例1】 (1)(2015山东青岛二模)高三(3)班共有学生56人,座号分别为1,2,3,56,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知3号,17号,45号同学在样本中,那么样本中另外一个同学的座号是()A.30 B.31 C.32 D.33(2)(2016豫南九校模拟)淘宝网站对购物情况做了一项调查,收回的有效问卷共500 000份,其中购买下列四种商品的人数统计为:服饰鞋帽198 000人;家居用品94 000人,化妆品116 000人;家用电器

8、92 000人.为了解消费者对商品的满意度,淘宝网站用分层抽样的方法从中选出部分问卷进行调查,已知在购买“化妆品”这一类中抽取了116份,则在购买“家居用品”这一类中取抽取的问卷份数为()A.92 B.94 C.116 D.118答案(1)B(2)B点评首先确定抽样方法,然后利用该抽样方法特点求解.频率分布直方图与茎叶图求解方略(2)茎叶图由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似,它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.【例2】 (1)有一个容量为200的样本,其频率分

9、布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()A.18 B.36 C.54 D.72(2)在某电脑杂志的一篇文章中,每个句子中的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含字的个数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.将这两组数据用茎叶图表示;将这两组数据进行比较分析,能得到什么结论?(1)解析设样本数据落在区间10,1

10、2)内的频率与组距的比为x,则(0.020.05x0.150.19)21得x0.09,所以样本数据落在区间10,12)内的频数为0.09220036.答案B(2)解茎叶图如图所示.从茎叶图中可以看出电脑杂志文章中每个句子的字数集中在1030之间,中位数为22.5,而报纸文章中每个句子的字数集中在2040之间,中位数为27.5,还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要简明,通俗易懂.点评茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直

11、方图则损失了样本的一些信息,必须在完成抽样后才能制作.回归直线方程与独立性检验突破方略(2)独立性检验的一般步骤根据样本数据制成22列联表;根据K2公式计算K2的值;比较K2与临界值的大小关系,作统计判断选择接受假设还是拒绝假设.【例3】 (2015江西师大附中、鹰潭一中联考,第18题) 某大学的一个社会实践调查小组,在对大学生的良好“光盘习惯”的调查中,随机发放了120份问卷.对收回的100份有效问卷进行统计,得到如下22列联表: 做不到光盘能做到光盘总计男451055女301545总计7525100(1)现已按是否能做到光盘分层从45份女生问卷中抽取了9份问卷,若从这9份问卷中随机抽取4份

12、,并记其中能做到光盘的问卷的份数为,试求随机变量的分布列和数学期望;(2)如果认为良好“光盘习惯”与性别有关犯错误的概率不超过P,那么根据临界值表P的值应为多少?请说明理由.P(K2k0)0.250.150.100.050.025k01.3232.0722.7063.8415.024点评独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.变量相关关系综合应用【示例】 为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下表格:日期4月1日4月7日4月15日4月21日4月30日温差x/C101113128发芽数y/颗2325302616(1)从这5天中任

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论