




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七编统计考纲要求(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法.2.用样本估计总体茎叶图,体会它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算术据标准差(不要求记忆公式).(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)能从样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.变量的相关性 (1)会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式求出线性回归方程(线性回归方程系数公式不要求记忆).(4)了解回归的基本思想、方法及其简单应用.(5)了解独立性检验的思想、方法及其初步应用.第一讲统计知识能力解读知能解读(一)抽样方法简单随机抽样(1)一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体的每个个体有相同的可能性被抽到,那么这种抽样方法就叫做简单随机抽样.这样抽取的样本叫做简单随机样本.(2)常用的简单随机抽样方法有抽签法和随机数表法.(3)简单随机抽样的特点①被抽取样本的总体的个数有限;②从总体中逐个地进行抽取,使抽样便于在实践中操作;③它是不放回抽样,这使其具有广泛的应用性;④每一次抽样时,每个个体等可能地被抽到,保证了抽样方法的公平性.(4)实施抽样的方法①抽签法.方法简单,易于理解.随机数表不唯一,只要符合各个位置上等可能地出现各个数字的要求就可以构成随机数表.随机数表中各个位置上出现各个数字的等可能性,保证了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.利用随机数表时应注意的问题如下:第一步,将总体中各个个体进行编号,因此整体中个体的个数不宜太大.第二步,选定开始数字,要保证所选数字的随机性.第三步,确定读数方向并获取样本号码.读数方向是任意的;样本号码不重复,若有重复则舍去.2系统抽样(1)概念的规则,从每一部分抽取一个个体,得到所需要的样本,这样抽样的方法叫做系统抽样.由于系统抽样的间隔相等,因此系统抽样也被称为等距抽样.①系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样显得不方②系统抽样与简单随机抽样之间存在这密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.(2)系统抽样的操作步骤①利用随机的方式将总体中的个体编号.②为将总体的号码分段,要确定分段间隔k,当N(N为总体中的个体数,n为样本nnn能被n整除,这时k=N.n③第一段用简单随机抽样确定起始个体编号l.④按照事先确定的规则抽取样本,通常是将l加上间隔k得到第2个编号(l+k),将(l+k)加上l,得到第3个编号(l+2k)......这样继续下去,知道获取整个样本.(3)系统抽样的公平性进行系统抽样的间隔.如果不能被整除,那么可能用简单随机抽样的方法从总体中剔除若干段的起始号,继而确定整体个样本.性相等,可知在整个抽样过程中每个个体被抽取的可能性仍然相等.3分层抽样使抽取的样本更好地反映总体的情况,,在各层中按层在总体中所占比例进行简单随机抽样,这样抽样方法叫做分层抽样.(2)分成抽样的过程①确定样本容量与总体中个体数的比;②计算各层需抽取的个体数;③采用简单随机抽样或系统抽样在各层中抽取个体;④将各层中抽取的个体合在一起,就是所要抽取的样本.(3)分层抽样的特点①适用于总体由差异明显的几部分组成的情况;②更充分反映了总体的情况;③是等可能抽样,每个个体被抽到的可能性度是Nn(n为样本容量,N为总体中的个体数).知能解读(二)数据的收集(1)做试验就可做抛掷骰子试验.(2)查阅资料有些数据不易直接调查到,可通过查阅图书馆文献或通过搜索因特网上的相关资料等办法获得所需数据或相关数据.(3)设计调查问卷问卷一般由一组有目的、有系统、有顺序的题目组成.知能解读(三)用样本估计总体1用样本的频率分布估计总体的分布(1)频率分布表、频率分布直方图当总体中个体数较多,甚至无限时,用样本的频率分布估计总体分布,主要步骤如下:⑤绘制频率分布直方图.(2)频率分布直方图的特点形的高,横轴上以相邻两点为端点的线段为矩形的底.②矩形的面积表示频率,各矩形的面积和为1.③有频率分布直方图进行相关计算时,需掌握下列关系是:样本容量频率(3)茎叶图茎叶图只便于表示有两位有效数字的数据,它有以下两个突出优点;①统计图上没有原始信息的缺失;②可随时记录,方便记录与表示.(4)茎叶图制作从小到大的顺序从上向下列出,共茎的叶一般按从小到大(或从小到大)的顺序同行列出.(5)总体密度曲线总体密度曲线反映了总体的分布,即反映了总体在各个范围内取值的百分比.根据这条的面积.2用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数①众数:在样本数据中,出现次数最多的那个数据.②中位数:将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两数的平均数为中位数.n注意通常,我们是用样本平均数取估计总体平均数.样本容量越大,这种估计的可靠性越高;平均数只是总体平均数的近似值.(2)方程与标准差①方差:在一组数据x,x,...,x中,各数据与它们的平均数x的差的平方的平均数,叫12n做这组数据的方程,通常用s2表示,即nn②标准差:方差的算术平方根叫做这组数据的标准差,通常用s表示,即来比较两组数据的波动大小.方程大的波动较大,方差小的波动较小.所以,当两组数据的平均数相等或比较接近时,就常用方差来比较两组数据的波动情况.知能解读(四)变量的相关系数变量与变量之间的关系常见的有两类:一类是确定的函数关系,另一类是相关关系.(1)函数关系函数关系是一种确定性关系,如一次函数、二次函数.(2)相关关系变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系带有随机性.售额与广告费之间、家庭的支出和收入之间都是相关关系.(3)散点图图.通过散点图可初步判断两个之间是否具有相关关系,它反映了个数据的密切程度.知能解读(五)两个变量的线性相关关系1两个变量的线性相关关系相似成线性相关关系.其中相关关系包含正相关与负相关.2回归直线方程的求法(1)列表计算;(2)使用函数计算器计算.解题方法荟萃思想方法数学结合思想规律技巧(一)系统抽样的应用少个个体,就分成多少组,每组中的个体数即为样本间距.规律技巧(二)分层抽样的应用个体数站总体个体数的比确定各层应抽取的样本容量.三种抽样的方法的比较(见下表):各各自特点从总体中逐个抽取将总体均分几定的规划在各部分中抽取先将总体分成行抽取适用范围数较少体数较多分组成相互联系在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样类别简单随机抽样系统抽样分层抽样共同点抽样过程中每个个体被抽到的可能性相同规律技巧(三)用样本频率分布估计总体分布从一个总体得到一个包含大量数据的样本时,我们很难从一个数字中直接看出样本所含,从而估计总体的分布情况.本题考查频率分布直方图和频率公式,属中等难度题规律技巧(四)用样本数字特征估计总体数字特征(1)样本众数通常用来表示分类变量的中心值,易计算,但它只能表达样本数据中较少的一部分信息.中位数不受少数几个极端数据的影响,易计算,但它仅利用了数据中排在中间位置的数据的信息.平均数受样本中的每一个数据的影响,但它受极端值的影响较大,平均数代表了数据的更多信息.(2)样本标准差描述了数据对平均数的偏离程度.标准差越大,数据的离散程度越大;标准差越小数据的离散程度越小.情况.另外,据此也可估计其他同类班级的情况.规律技巧(五)利用散点图判断两变量的相关关系画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径.Ⅲ.易混易错辨析易混易错忽略频率分布直方图纵轴的意义而致误高考命题研究在近几年的高考中,主要考查:系统抽样、分层抽样的简单应用,频率分布直方图、茎叶图、相关性、线性回归方程、平均数、方差等计算.多以选择题、填空题的形式出现,有时以解答的形式出现,属容易题.高考热点(一)随机抽样掌握基本知识的应用和基本题型的求解,对三种抽样方法的考查以分层抽样为主.考查三种抽样方法的特征,试题难度较小.知识:茎叶图和系统抽样.能力:考查了应用意识及数据处理能力.试题难度:易.高考热点(二)统计图表的应用息并加以整理是今年来高考命题的热点.知识:本题主要考查对柱形图的理解.能力:读图能力.试题难度:易.识:频率和频数的概念及频率分布直方图的性质.能力:在求a的过程中,考查了方程思想和运算求解能力.试题难度:中.知识:茎叶图、数据的平均数和标准差等数字特征.能力:通过对茎叶图中数据数字特征的判断考查了推理论证能力和创新应用意识.试题难度:中.高考热点(三)样本的数字特征平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.高考热点(四)变量间的相关关系及回归方程对两个变量的样本数据进行相关性分析,可发现存在与生活的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.对两个变量之间的线性关系所进行的统计分析称为线性回归分析.z推导出x与z负相关,考查了推理论证能力.试题难度:易.知识:回归直线方程,散点图的应用.能力:通过散点图确定斜率、截距与0的大小关系,考查数形结合的思想方法.试题难度:易.本题考查了正相关的定义,考查了样本点的中心一定在回归直线上的性质.试题难度较小.小附录常用符号x——平均数s2——方差s——标准差——求和符号2常用公式x=1(x+x+...+x)n12nnnini=1nini=1=i=1ii=yxii=1第二讲统计案例知识能力解读知能解读(一)回归分析它是对具有相关关系的两个变量进行统计分析的一种常用方法.机误差3样本点的中心a1122nnnxxyy)和截距的最小二乘估计分别为=i=1in(xxi)2,=yx,其中ii=1i=1ninii=1i=1注意 (1)回归直线必过样本点的中心(x,y);(2)的意义:当x每增加(或减少)1个单位时,y就平均增加(或减少)个单位.4相关系数iiii=1(2)当r>0时,表明两个变量正相关;当r>0时,表明两个变量负相关.r越接近于0,线性相关程度越弱.通常,当r大于0.75时,认为两个变量有很强的线性相关性.知能解读(二)残差分析在回归分析中,测定值与按回归方程预测的值之差,即=y为相对于点(x,y)的iiiii残差.2残差平方和n(y-)2.iii=13相关指数iiii=1RR2的值越小,说明残差平方和越大,即模型的拟合效果越差.在线性回归模型中,R2表示解释变量对于预报知能解读(三)独立性检验变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.列出量分类变量的频数表,称为列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为x,x}和y,y},其样本频1212数列联表(称为22列联表)为yy1y2xab1xcd2 n(ad-bc)2构造一个随机变量K2=(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.3独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.解题方法荟萃思想方法数形结合思想画散点图判断相关性,简便易行,便于操作,但往往不易,便于操作,但往往不易准确解题时可直接画散点图进行判断.规律技巧(一)独立性检验的基本方法解决一般的独立性检验问题的步骤:(1)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省聊城第一中学新校区、高铁校区2024-2025学年高一下学期第一次阶段性检测语文试题(原卷版+解析版)
- 强化废旧光伏板组件处理规范
- 茶叶的种植技术与管理
- 电脑售后服务协议书二零二五年
- 二零二五版简易技术咨询服务合同模板
- 公司设立协议书
- 房地产项目委托代建协议合同书
- 连锁餐饮后勤管理制度
- 餐饮公司财产管理制度
- 车间生产准备管理制度
- GB 5908-2024阻火器
- 某医院精神卫生中心信息化建设方案
- 自编MSA(计数型)自动分析表
- 购房律师陪同服务合同
- 家用电动啤酒酿造设备市场发展现状调查及供需格局分析预测报告
- GB/T 2624.6-2024用安装在圆形截面管道中的差压装置测量满管流体流量第6部分:楔形装置
- 危重患者护理与观察
- 2024年浙江省中考英语试题卷(含答案解析)
- 人教版(2019)必修 第二册Unit 2 Wildlife Protection Reading for writing教学设计
- AIGC视域下非遗文创产品的数字化转型升级路径研究
- 推广绿色用电活动方案
评论
0/150
提交评论