高一数学必修3统计知识梳理及检测_第1页
高一数学必修3统计知识梳理及检测_第2页
高一数学必修3统计知识梳理及检测_第3页
高一数学必修3统计知识梳理及检测_第4页
高一数学必修3统计知识梳理及检测_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 统计(1)命题人:万明君 审核人:刘文宝一、随机抽样三种常用抽样方法:1简单随机抽样:一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。(1)抽签法制签 抽签 成样抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。(2)随机数表法编号 数数 成样简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。2系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统

2、抽样(也称为机械抽样)。系统抽样的步骤可概括为:(1)将总体中的个体编号。(2)将整个的编号进行分段。为将整个的编号进行分段,要确定分段的间隔.当N/n是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的个体数N´能被整除,这时k=N/n;(3)确定起始的个体编号。在第1段用简单随机抽样确定起始的个体边号;(4)抽取样本。按照先确定的规则(常将加上间隔)抽取样本:。3分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。特点:(1)分层抽样是等概率抽样,它也是公平的。(2

3、)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践的应用更为广泛。巩固练习:1、某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适A.系统抽样 B.简单随机抽样 C.分层抽样 D.随机数表法2、从N个编号中要抽取n个号码入样,若采用系统抽样方法抽取,则分段间隔应为A. B.n C. D.+13、下列说法正确的个数是总体的个体数不多时宜用简单随机抽样法在总体均分后的每一部分进行抽样时,采用的是简单随机抽样百货商场的

4、抓奖活动是抽签法整个抽样过程中,每个个体被抽取的机率相等(有剔除时例外)A.1 B.2 C.3 D.44、一批灯泡400只,其中20 W、40 W、60 W的数目之比为4,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为_.5、从总体容量为N的一批零件中用分层抽样抽取一个容量为的样本,若每个零件被抽取的机率为.25,则N等于A.150B.200C.120D.1006、一个总体的60个个体的编号为0,1,2,59,现要从中抽取一个容量为10的样本,请根据编号按被6除余3的方法,取足样本,则抽取的样本号码是_.二、用样本估计总体一频率分布直方图:画频率分布直方图一般步骤为:1、

5、决定组距与组数2、将数据分组3、列频率分布表4、画频率分布直方图二频率分布折线图、总体密度曲线1频率分布折线图的定义:2总体密度曲线的定义:根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。总体分布密度密度曲线函数y=f(x)的两条基本性质:f(x) 0(xR);由曲线y=f(x)与x轴围成面积为1。<四>茎叶图画法:特点:图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。<五>样本的数字特征1、众

6、数、众数、中位数2、从频率分布直方图中估计众数、中位数、平均数:(1)众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。(2)在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。3、方差、标准差(1)方差的计算公式:_ (2)标准差的计算公式:_ (3)方差和标准差的意义:考察样本数据的分散程度的大小。次数90100110120130140150o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.03

7、6巩固练习:1、为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?2、从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm) 设计了如下茎叶图:甲乙31277550284542292587331304679403123556888553320224797413313672356根据以上茎叶图,对甲乙两品种棉花的纤

8、维长度作比较,写出两个统计结论:_三、变量间的相关关系1、相关关系的概念:函数关系是一种非常确定的关系,而相关关系是一种非确定性关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2、散点图的概念:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。(1)线性相关关系的概念:如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系。(2)正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。3、最小二乘法:回归直线的定义,使离差的平方和Q

9、=最小的那条直线,这种使“离差的平方和为最小”的方法叫做最小二乘法,要掌握用最小二乘法求回归直线系数a、b的公式: 求回归直线方程的步骤:(1)将已知的数据列表,列出x,y,并求出x2,y2,xy.(2)利用公式b=,a=b,计算回归系数b,a.(3)写出回归直线方程=bx+a.巩固练习:1、设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系 B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加

10、0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg2、回归方程=1.5x15,则A.=1.515 B.15是回归系数a C.1.5是回归系数a D.x=10时,y=03、下面变量是负相关关系的是A.出租车费与行驶的里程 B.房屋面积与房屋价格C.汽车的重量与汽车每消耗1L汽油所行驶的平均路程 D.一个家庭的收入与支出4、线性回归方程=bx+a过定点_.第二章 统计检测题(2)命题人:万明君 审核人:刘文宝一、选择填空:1、在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数

11、据,则A,B两样本的下列数字特征对应相同的是()A众数 B平均数C中位数 D标准差2、某初级中学有学生人,其中一年级人,二、三年级各人,现要利用抽样方法取人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2, ,270;使用系统抽样时,将学生统一随机编号1,2, ,270,并将整个编号依次分为段 如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173

12、,200,227,254;30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是( )A 、都不能为系统抽样B 、都不能为分层抽样0.1500.1250.1000.0750.050O96克98100102104106频率/组距C 、都可能为系统抽样 D 、都可能为分层抽样3、某工厂对一批产品进行了抽样检测右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36

13、,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A90 B75 C 60 D454.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为,样本标准差分别为sA和sB,则(A) ,sAsB(B) ,sAsB(C) ,sAsB(D) ,sAsB5、“吸烟有害健康”,那么吸烟与健康之间存在什么关系( )A、正相关B、负相关C、无相关 D、不确定6、某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为(A)7 (B)15 (C)25 (D)357

14、、右图是2010年在惠州市举行的全省运动会上,七位评委为某跳水比赛项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A84,4.84 B84,1.6C85,1.6 D85,48.、在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A甲地:总体均值为3,中位数为4 B乙地:总体均值为1,总体方差大于0C丙地:中位数为2,众数为3 D丁地:总体均值为2,总体方差为39、关于统计数据的分析,有以下几个结论:

15、一组数不可能有两个众数;将一组数据中的每个数据都减去同一个数后,方差没有变化;调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;一组数据的方差一定是正数;如下图是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在50,60)的汽车大约是60辆则这5种说法中错误的个数是()A2 B3 C4 D510、某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1 300样本容量130由于不小心,表格中A、C产品的有关数据已被污染看不清楚了,统计员只

16、记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是_件11、一个总体中有100个个体,随机编号0,1,2,99,依编号顺序平均分成10个小组,组号依次为1,2,3,10,现用系统抽样法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同.若m6,则在第7组中抽取的号码是_.12、如图14是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24

17、.5,25.5),25.5,26.5已知样本中平均气温低于22.5的城市个数为11,则样本中平均气温不低于25.5的城市个数为_13、下图甲是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为4000在样本中记月收入在1000,1500),1500,2000),2000,2500),2500,3000),3000,3500),3500,4000的人数依次为A1、A2、A6图乙是统计图甲中月工资收入在一定范围内的人数的算法流程图,则样本的容量n=_;图乙输出的S=_(用数字作答)14、下表是某数学老师及他的父亲和儿子的身高数据:父亲身高x(cm

18、)173170176儿子身高y(cm)170176182因为儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_参考数据: (xi)218, (xi)(yi)18.二、解答题:15、某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程bxa,其中b20,ab;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)16、某校100名学生期中考试

19、语文成绩的频率分布直方图如图14所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100图14(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数分数段50,60)60,70)70,80)80,90)xy1121344517、随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图7.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差(3)现从乙

20、班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.18、某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373xy男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?(3)已知y245,z245,求初三年级中女生比男生多的概率.19、若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结

21、果发现有50件不合格品计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组频数频率3,2)0.102,1)8(1,20.50(2,310(3,4合计501.00(1)将上面表格中缺少的数据填在答题卡的相应位置(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品,据此估算这批产品中的合格品的件数20、高三年级有500名学生,为了了解数学学科的学习情况,现从中随机抽取若干名学生在一次测试中的数学成绩,制成如下频率分布表:分组频数频率85,95)95,105

22、)0.050105,115)0.200115,125)120.300125,135)0.275135,145)4145,1550.050合计(1)根据上面图表,处的数值分别为_、_、_、_;(2)在所给的坐标系中画出85,155的频率分布直方图;(3)根据题中信息估计总体平均数和中位数,并估计总体落在129,155中的频率21、为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样检查,测得身高情况的统计图如下:()估计该校男生的人数;()估计该校学生身高在170185cm之间的概率;()从样本中身高在180190cm之间的男生中任选2人,求至少有1人身高在185190cm

23、之间的概率.第二章 统计检测题(2)答案一、选择填空:1、D 2、D 3、A 4、B 5、B 6、B 7、C 8、D 9、B 10、800 11、63 12、9 13、10000 6000 14、185cm二、解答题:15、解:(1)由于(x1x2x3x4x5x6)8.5,(y1y2y3y4y5y6)80.所以ab8020×8.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1000202361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润16、解:(1)由频

24、率分布直方图可知(0.040.030.022a)×101.所以a0.005.(2)该100名学生的语文成绩的平均分约为0.05×550.4×650.3×750.2×850.05×9573.(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段50,60)60,70)70,80)80,90)x5403020xy11213445y5204025于是数学成绩在50,90)之外的人数为100(5204025)10.17、(1)由茎叶图可知:甲班身高集中于之间,而乙班身高集中于 之间。因此乙班平均身高高于甲班; (2) 甲班的样本方差为 57 (3)设身高为176cm的同学被抽中的事件为A; 从乙班10名同学中抽中两名身高不低于173cm的同学有:(181,173) (181,176) (181,178) (181,179) (179,173) (179,176) (179,178) (178,173) (178, 176) (176,173)共10个基本事件,而事件A含有4个基本事件; ;18、解 (1) (2)初三年级人数为yz2000373377380370)500, 现用分层抽样的方法在全校抽取48名学生,应在初三

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论