新教材2023年高中数学第八章成对数据的统计分析章末知识梳理课件新人教A版选择性必修第三册_第1页
新教材2023年高中数学第八章成对数据的统计分析章末知识梳理课件新人教A版选择性必修第三册_第2页
新教材2023年高中数学第八章成对数据的统计分析章末知识梳理课件新人教A版选择性必修第三册_第3页
新教材2023年高中数学第八章成对数据的统计分析章末知识梳理课件新人教A版选择性必修第三册_第4页
新教材2023年高中数学第八章成对数据的统计分析章末知识梳理课件新人教A版选择性必修第三册_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析章末知识梳理知识结构•理脉络要点梳理•晰精华素养突破•提技能知识结构•理脉络

要点梳理•晰精华变量的相关关系1.相关关系两个变量有关系,但又没有确切到可以由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.散点图为了直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则每一对成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.知识点13.相关关系的分类:正相关和负相关.4.线性相关与非线性相关(1)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.(2)非线性相关一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关.样本相关系数1.样本相关系数(1)计算公式:知识点22.样本相关系数的意义样本相关系数r是一个描述成对样本数据的数字特征,r的符号反映了相关关系的正负性;|r|的大小反映了两个变量相关的程度,具体如下:(1)r的正负当r>0时,称成对数据正相关;当r<0时,称成对数据负相关.(2)r的绝对值当|r|越接近于1时,成对数据的线性相关程度越强;|r|越接近于0,成对数据线性相关程度越弱.3.判断相关关系的两种方法(1)通过作散点图,观察由所给的数据描出的点是否在一条直线附近来判定,直观方便.(2)利用相关系数.一元线性回归模型参数的最小二乘估计1.最小二乘估计知识点3分类变量与列联表(1)分类变量(2)2×2列联表知识点4

y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d(3)等高堆积条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.分别计算出中间四个数各自的频率,可以用等高堆积条形图直观展示上述计算结果.如右表所示,我们将给出成对分类变量数据的交叉分类频数的表格,称为2×2列联表.独立性检验的基本思想1.独立性检验的定义一般地,假设有两个分类变量X和Y,其样本频数知识点5XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+dα0.10.050.010.0050.001xα2.7063.8416.6357.87910.8283.应用独立性检验的主要环节(1)提出零假设H0:分类变量X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.素养突破•提技能1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,也是本章的重点、高考的热点,主要考查线性回归分析.题型既有选择、填空题,也有解答题.2.回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析.因此,回归分析的方法主要还是指线性回归分析的方法.要注意理解以下几点:①确定线性相关系数,判断变量是否线性相关的依据是观察样本点的散点图和线性回归系数的大小;②模型的合理性的刻画,确定线性相关程度的方法是通过计算相关系数r进行判断.要点一回归分析

连锁经营公司所属5个零售店某月的销售额利润资料如表:典例1商品名称ABCDE销售额x/千万元35679利润额y/百万元23345(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,试计算利润额y对销售额x的经验回归直线方程;(3)估计要达到1000万元的利润额,销售额约为多少万元.[解析]

(1)根据表中所给的5对数据,在平面直角坐标系中画出散点图,如图所示.[规律方法]

1.建立经验回归模型的步骤(1)确定研究对象,明确变量x,y.(2)画出变量的散点图,观察它们之间的关系.(3)确定经验回归方程的类型.(4)按一定规则估计经验回归方程中的参数(如最小二乘法).(5)得出经验回归方程.2.分析两个变量线性相关的常用方法(1)散点图法,该法主要是用来直观地分析两变量间是否存在相关关系.(2)相关系数法,该法主要是从量上分析两个变量间相互联系的密切程度,|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.独立性检验的基本思想是:先作出零假设H0,即假设两个分类变量没有关系,再根据这个假设应用统计的方法进行分析,得到一个统计量χ2的值,再由统计学得到的各临界值,确定我们的假设是否成立,以及假设的不合理程度.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.要点二独立性检验的基本思想与方法

(2)两个分类变量是否有关系的直观判断.一是根据2×2列联表计算|ad-bc|,值越大两变量的相关性越强.二是观察等高堆积条形图,两个深色条的高度相差越大,两变量的相关性越强.(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.某校为了探索一种新的教学模式,

进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50人,一年后对两班进行测试,成绩如下表(总分:150分).甲班典例2成绩[80,90)[90,100)[100,110)[110,120)[120,130]频数42015101乙班成绩[80,90)[90,100)[100,110)[110,120)[120,130]频数11123132(1)现从甲班成绩位于[90,120)内的试卷中抽取9份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果;(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8,请你估计乙班的平均分,并计算两班平均分相差几分;(3)完成下面2×2列联表,依据小概率值α=0.05的独立性检验,分析这两个班在这次测试中成绩的差异与实施课题实验是否有关,并说明理由.

成绩小于100分成绩不小于100分总计甲班2650

乙班12

50总计3664100(3)补全列联表如下:

成绩小于100分成绩不小于100分总计甲班242650乙班123850总计3664100零假设H0:两个班的成绩差异与实施课题实验无关.概率、统计与独立性检验的综合问题在高考中常常出现,一般为解答题,难度中等.有时古典概型与独立性检验综合,有时样本的分布与独立性检验综合,更有三者融合在一起的综合性较强的题目出现.(1)独立性检验中的统计量χ2的计算公式中分母是列联表中除了总合计的四个合计量的乘积,分子是总合计量与样本频数中四个数的交叉乘积之差的平方的乘积,解题时要正确使用列联表中的数据,对照公式把它们放到应该放的地方.要点三概率、统计与独立性检验的综合问题

注意确定性思维和统计思维的差异,确定性思维作出的是完全确定的、百分之百正确的结论,但统计思维作出的是带有随机性的、不能完全确定的结论.若在解题时忽视了这两种思维方式的差异,就可能对统计计算的结果作出错误的解释.(2)求解此类综合问题时要充分运用样本的分布、古典概型分布列、均值、独立性检验等相关知识.某电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查.根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图如图所示:典例3将日均收看该体育节目的时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,试根据小概率值α=0.05的独立性检验,分析“体育迷”是否与性别有关.

性别电视观众合计非体育迷体育迷男

1055合计

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论