高中数学知识点总结 统计_第1页
高中数学知识点总结 统计_第2页
高中数学知识点总结 统计_第3页
高中数学知识点总结 统计_第4页
高中数学知识点总结 统计_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高中数学知识点总结统计一、三种抽样方法1.三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等从总体中逐个抽取—总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成2.抽样方法的选取方法(1)若总体由差异明显的几个层次组成,则选用分层抽样.(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样.特别提醒利用系统抽样的两个关键步骤:(1)分组,当总体个数N能被样本容量n整除时,分为n个组,分段间隔k=eq\f(N,n);(2)获取样本用简单随机抽样在第一组抽取起始数s,通常把起始数s加上间隔k得到第2个个体编号(s+k),再加上k得第3个个体编号(s+2k),依次进行下去,直到获取样本.二、用样本估计总体1.数字特征(1)众数、中位数、平均数数字特征定义与频率分布直方图的关系众数出现次数最多的数据最高的小长方形中的某个(些)点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数左边和右边的小长方形的面积和是相等的平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)极差、方差和标准差极差:即一组数据中最大值与最小值的差.方差:.标准差:.(3)性质①若的平均数为,那么的平均数为.②数据与数据的方差相等,即数据经过平移后方差不变.③若的方差为s2,那么的方差为.2.统计表(1)频率分布的估计:频率分布是指各个小组数据在样本中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.(2)尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变化而变化的,因此不能用样本的频率分布折线图得到准确的总体密度曲线.(3)估计总体分布的步骤是:①选择适当的抽样方法从总体中抽取样本,即收集数据.②利用样本数据画出统计图或计算数字特征.③结合统计图分析样本取值的分布规律.④用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那么样本与总体取值的分布规律近似,有时也可看成相同.⑤利用总体分布解决有关问题.(4)各种统计表的优点与不足优点不足频率分布表表示数据较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据特别提醒频率分布表、频率分布直方图、频率分布折线图、总体密度曲线都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:三、变量间的相关关系1.相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.2.散点图将样本中的n个数据点描在平面直角坐标系中,所得图形叫做散点图.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为负相关.具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2.3.回归分析如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).4.回归方程的求解(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.若变量x与y具有线性相关关系,有n个样本数据,则回归方程中,.其中,称为样本点的中心.(2)线性回归模型,其中称为随机误差,自变量称为解释变量,因变量称为预报变量.特别提醒①回归直线必过样本点的中心,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.②利用回归直线方程不但可以预测在x取某一个值时,y的估计值,同时也能知道x每增加1个单位,的变化量.③在回归直线方程中,既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变量.5.相关系数(1)样本相关系数r的计算公式我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为.(2)样本相关系数r的性质①;②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;③|r|越接近于1,表明两个变量的线性相关性越强;④|r|越接近于0,表明两个变量的线性相关性越弱.6.非线性回归分析对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究.在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决.特别提醒求非线性回归方程的步骤:①确定变量,作出散点图.②根据散点图,选择恰当的拟合函数.③变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.④分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.⑤根据相应的变换,写出非线性回归方程.7.刻画回归效果的方式方式方法计算公式刻画效果越接近于1,表示回归的效果越好残差图称为相应于点的残差,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高.残差平方和残差平方和越小,模型的拟合效果越好四、独立性检验1.独立性检验利用随机变量(也可表示为)(其中为样本容量)来判断“两个变量有关系”的方法称为独立性检验.2.独立性检验的一般步骤(1)根据样本数据列出列联表;(2)计算随机变量的观测值k,查下表确定临界值k0:(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”.特别提醒(1)通常认为时,样本数据就没有充分的证据显示“X与Y有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论