版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、章末复习学习目标1.会根据不同的特点选择适当的抽样方法获得样本数据.2.能利用图、表对样本数据进行整理分析, 用样本和样本的数字特征估计总体的数字特征.3.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测1抽样方法(1) 当总体容量较小,样本容量也较小时,可采用抽签法(2) 当总体容量较大,样本容量较小时,可用随机数表法(3) 当总体容量较大,样本容量也较大时,可用系统抽样法(4) 当总体由差异明显的几部分组成时,可用分层抽样法2总体分布的估计用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图当样本只有两组数据且样本容量比较小时,用茎叶图刻
2、画数据比较方便3总体特征数的估计样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、 中位数和平均数;另一类是反映样本波动大小的,包括极差、方差及标准差4线性回归方程(1) 两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系 )(2) 求回归方程的步骤:先把数据制成表,从表中计算出x ,n xi yin x ybi 1n计算 a,b.公式为i1xi2 n x 2nny ,i1x2i,i1xi yi.,a y b x .写出回归方程y bx a.1 简单随机抽样是不放回抽样()2随机数表只有一张,并且读数时只能按照从左向右
3、的顺序读取,否则产生的随机样本就不同了,对整体的估计就不准确了(×)3一组数据一定存在众数,且不可能有两个众数(×)4在频率分布直方图中,每个小组的频率等于相应小长方形的高度(×)第 1页类型一抽样方法的应用例 1某政府机关有在编人员100 人,其中副处级以上干部10 人,一般干部 70 人,干事 20人,上级机关为了了解机关人员对政府机构的改革意见,要从中抽取一个容量为20 的样本,试确定用何种方法抽取,如何抽取?解用分层抽样抽取 20 100 1 5, 105 2, 705 14, 205 4,即从副处级以上干部中抽取2 人,一般干部中抽取14 人,干事中抽取
4、4 人副处级以上干部与干事人数都较少,他们分别按110 编号和 1 20 编号,然后采用抽签法分别抽取2 人和 4 人,对一般干部采用00,01, , 69 编号,然后用随机数表法抽取14人反思与感悟三种抽样方法并非截然分开,有时你中有我, 我中有你, 它们都能保证个体被抽到的机会相等跟踪训练1 (2019 ·淮安高二检测 )为了解淮安地区高三年级学生的学习情况,从1 000 名高三毕业生中,采用系统抽样的方法抽取容量为40 的样本,则分段间隔为 _答案25解析由1 00040 25,可得分段间隔为 25.类型二用样本的频率分布估计总体分布例 2有1 个容量为 100 的样本,数据
5、(均为整数 )的分组及各组的频数如下:12.5,15.5) , 6; 15.5,18.5) , 16; 18.5,21.5) , 18;21.5,24.5) , 22; 24.5,27.5) , 20;27.5,30.5) , 10;30.5,33.5 , 8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计小于 30 的数据约占多大百分比解(1) 样本的频率分布表如下:分组频数频率12.5,15.5)60.0615.5,18.5)160.1618.5,21.5)180.18第 2页21.5,24.5)220.2224.5,27.5)200.2027.5,30.5)100.10
6、30.5,33.580.08合计1001.00(2) 频率分布直方图如图:(3) 小于 30 的数据占 0.060.16 0.18 0.220.20 0.10 0.92 92%.反思与感悟借助图表, 可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流跟踪训练2为了了解某校高三学生的视力情况,随机地抽查了该校100 名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5 组频数和为62,视力在 4.6 到 4.8 之间的学生数为a,最大频率为0.32,则 a 的值为 _答案54解析4.7,4.8) 之间频率为0.32, 4.6,4.7) 之间频率为1
7、 0.620.05 0.111 0.780.22. a (0.22 0.32)× 100 54.类型三用样本的数字特征估计总体的数字特征例 3为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30 名高三年级学生,以他们的数学成绩(百分制 )作为样本,样本数据的茎叶图如图(1) 若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60 分及 60 分以上为及格 );(2) 设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1, x 2,估计 x 1 x 2 的值解 (1) 设甲校高三年
8、级学生总人数为n.30由题意,知n 0.05,解得 n 600.样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为5 51 30 6.(2) 设甲、乙两校样本平均数分别为x1 , x 2 .第 3页根据样本茎叶图知,30( x 1 x 2 ) 30 x 1 30 x 2 (7 5) (55 814) (24 12 65) (26 24 79) (22 20) 92 2 49 53 77 2 92 15.因此 x 1 x 2 0.5,所以 x 1 x 2 的估计值为0.5 分反思与感悟样本的数字特征就像盲人摸到的象的某一局部特征,只有把它们结合起来才能
9、看到全貌跟踪训练 3对甲、乙的学习成绩进行抽样分析,各抽5 门功课,得到的观测值如下:甲6080709070乙8060708075问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?解甲的平均成绩为x 甲 74,乙的平均成绩为x 乙 73.所以甲的平均成绩好2122222212甲 5( 14) 6( 4) 16(4) 104,乙的方差是乙× 7 (甲的方差是ss513)2 (3)2 72 22 56.22,所以乙的各门功课发展较平衡因为 s甲 >s乙类型四线性回归方程的应用例 4 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数
10、x(个 )2345加工的时间y(小时 )2.5344.5(1) 在给定的坐标系中画出表中数据的散点图;(2) 求出 y 关于 x 的线性回归方程 y bxa,并在坐标系中画出回归直线;(3) 试预测加工 10 个零件需要多少小时?nxiyi n xyi1(注: b, a y b x )nx2i n x 2i 1解 (1) 散点图如图第 4页4(2) 由表中数据得:xi yi 52.5,i 14xi2 54,x 3.5, y 3.5,i1 b 0.7, a 1.05,y 0.7x 1.05,回归直线如图所示(3) 将 x 10 代入线性回归方程,得y0.7× 101.05 8.05,故
11、预测加工10 个零件约需要8.05 小时反思与感悟散点图经最小平方法量化为线性回归方程后,更便于操作(估计、预测 ),但得到的值仍是估计值跟踪训练42019 年元旦前夕,某市××局统计了该市2019 年 10 户家庭的年收入和年饮食支出的统计资料如下表:年收入24466677810x(万元 )年饮食支0.91.41.62.02.11.91.82.12.22.3出 y(万元 )(1) 如果已知 y 与 x 成线性相关关系,求线性回归方程;(2) 若某家庭年收入为9 万元,预测其年饮食支出1010(参考数据: xiyi 117.7, xi2 406)i 1i 1解 (1) 依题
12、意可计算得: x 6, y 1.83, x 2 36,1010 406,i i 117.7, i2x y 10.98,又 x yi 1xi 110 xiyi10 xyi1 0.17, a y b x 0.81,b 10 xi2 10 x 2i 1 y 0.17x0.81.所求的线性回归方程为y 0.17x 0.81.第 5页(2) 当 x9 时, y 0.17× 90.81 2.34(万元 )可估计大多数年收入为9 万元的家庭每年饮食支出约为2.34 万元1问题:某小区有800 户家庭,其中高收入家庭200 户,中等收入家庭480 户,低收入家庭 120 户,为了了解有关家用轿车购买
13、力的某个指标,要从中抽取一个容量为100 的样本;从 10 名学生中抽取3 人参加座谈会 方法:(1)简单随机抽样; (2) 系统抽样;(3) 分层抽样则问题与方法的配对是_答案 (3), (1)解析问题 中的总体是由差异明显的几部分组成的,故可采用分层抽样方法; 问题 中总体的个数较少,故可采用简单随机抽样2某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A,B, C, D 四个单位回收的问卷数依次成等差数列,且共回收了1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为 150的样本,若在 B 单位抽取30 份,则在 D 单位抽取的问卷是 _份答案60解析由题意依次设在 A
14、,B,C, D 四个单位回收的问卷数分别为a1, a2,a3, a4,则 30a21501 000, a2 200,又 a1 a2 a3 a4 1 000,即 3a2 a4 1 000, a4 400,设在 D 单位n 150抽取的问卷数为 n,则 400 1 000,解得 n 60.3 为了解儿子身高与其父亲身高的关系,随机抽取5 对父子的身高数据如下:父亲身高 x(cm)174176176176178儿子身高 y(cm)175175176177177则 y 对 x 的线性回归方程为 _ 1答案 y 2x 88解析由已知得x 176, y 176,利用公式可得a,b. 1从而求出 y 2x
15、88.4随机抽取某学校甲、乙两班各10 名同学的一模数学成绩,获得数学成绩的茎叶图如图,则根据茎叶图可估计一模数学平均成绩较高的班级是_答案甲班解析根据茎叶图可看出所有的数据,茎上是百位数和十位数,再利用求平均数的公式,求第 6页出成绩的平均数,由茎叶图可计算甲班10 名同学的平均成绩是(129112 115 101 104108 95 97 82 77) ÷10 1 020 ÷10 102,乙班 10 名同学的平均成绩是(121124 117 103 103 105 91 88 89 76) ÷10 1 017÷10 101.7.所以由此估计甲班的数学
16、平均成绩大于乙班的数学平均成绩5某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为20,40) ,40,60) ,60,80) , 80,100 若低于60 分的人数是15,则该班的学生人数是_答案50解析由频率分布直方图,得低于60 分的频率为(0.01 0.005)× 20 0.3.该班学生人数n 015.3 50.1 应用抽样方法抽取样本时,应注意以下几点:(1) 用随机数表法抽样时,对个体所编的号码位数要相等当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0” ,凑齐位数N(2) 用系统抽样法抽样时,如果总体容量N 能被样本容量 n 整除,
17、抽样间隔为 k n ,如果总N体容量 N 不能被样本容量n 整除,先用简单随机抽样法剔除多余个体,抽样间隔为k nNNn 表示取 n 的整数部分.2用样本的频率分布估计总体分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计直方图能够很容易地表示大量数据,非常直观地表明分布的形状, 使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线, 它能给我
18、们提供更加精细的信息在样本数据较少时,用茎叶图表示数据的效果较好, 它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都带来方便第 7页3用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计平均数就是所有样本数据的平均值,用 x表示;标准差是反映样本数据分散程度大小的最常用统计量,有时也用标准差的平方s2 方差来代替标准差,实质一样4线性回归方程的应用分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出线性回归方程,并利用线性回
19、归方程进行估计和预测一、填空题1对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则 p1, p2,p3 的大小关系为 _ 答案p1 p2 p3解析三种抽样方法都能保证每个个体被抽到的机会相等2某市电视台为调查节目收视率,想从全市3 个区按人口数用分层抽样的方法抽取一个容量为 n 的样本,已知 3 个区人口数之比为23 5,如果人口最多的一个区抽出的个体数是60,那么这个样本的容量为 _答案120解析由题意知, 3 个区人口数之比为2 35,第三个区所抽取的人口数最多,所占比例为 50%.
20、又因为第三个区抽取的人数为60,所以三个区所抽取的总人数为60÷50% 120,即这个样本的容量为120.3现有 10 个数,其平均数是4,且这 10 个数的平方和是200,那么这组数的标准差是_答案2解析设这 10 个数为 a1, a2,a10,则有 a21 a22 a210 200,且 a1 a2 a1040,a1 4 2 a24 2 a104 2所以10a21 a22 a210 8 a1 a2 a10 16010第 8页200 8× 40 160 4, 标准差为4 2.104如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均分为_答案75解析利用组中值估
21、算平均分,则有x 55× 0.1 65× 0.2 75× 0.4 85×0.2 95×0.175,故估计这次考试的平均分为75.5根据如下样本数据:x345678y4.02.500.5 2.0 3.0得到的线性回归方程为y bx a,则 ab_0.(填“ >”“ <”或“” )答案<解析作出散点图如下:由图象不难得出,回归直线y bx a 的斜率 b 0,截距 a 0.6某电子商务公司对 10 000 名网络购物者在 2019 年度的消费情况进行统计,发现消费金额( 单位:万元 )都在区间 0.3,0.9 内,其频率分布直方图
22、如图所示(1) 直方图中的a_;(2) 在这些购物者中,消费金额在区间0.5,0.9 内的购物者的人数为_答案(1)3(2)6 000解析由频率分布直方图及频率和等于1 可得0.2× 0.1 0.8×0.1 1.5× 0.1 2× 0.12.5× 0.1 a× 0.1 1,解得 a3.所以消费金额在区间0.5,0.9 内的频率为0.2×0.1 0.8×0.1 2×0.1 3× 0.1 0.6,所以消费金额在区间 0.5,0.9 内的购物者的人数为0.6× 10 000 6 000.7下
23、列说法:一组数据不可能有两个众数;一组数据的方差必须是正数;将一组数据中的每一个数据都加上或减去同一常数后,方差不变; 在频率分布直方图中,每个小长方形的面积等于相应小组的频率其中错误的是_答案解析 错,众数可以有多个; 错,方差可以为 0.8某公司 10 位员工的月工资 (单位:元 )为 x1,x2, ,x10,其平均数和方差分别为x 和 s2,若从下月起每位员工的月工资增加100 元,则这 10 位员工下月工资的平均数和方差分别为_ 答案x 100, s2第 9页解析据已知易得1 x2 x1010× 100x x 100,y 10又 sy2x1 100 x 100 2 x1010
24、0 x 100 210 s2.9设样本数据 x1,x2, , x10的平均数和方差分别为1 和 4,若 yi xi a( a 为非零常数, i1,2, , 10),则 y1, y2, , y10 的平均数和方差分别为 _答案1 a,4x1x2 x10解析 因为 1, yi xi a,10所以 y1, y2, , y10 的平均数为 1 a,方差不变仍为4.10为了了解一片经济林的生长情况,随机抽测了其中60 株树木的底部周长(单位: cm),所得数据均在区间 80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.答案24解析由频率分布直方图可得
25、树木底部周长小于100cm 的频率是 (0.025 0.015)× 10 0.4,又样本容量是 60,所以频数是0.4× 60 24.11一个样本 a,3,5,7 的平均数是 b,且 a,b 是方程 x2 5x 4 0 的两根,则这个样本的方差是 _答案5解析x2 5x 4 0 的两根是 1,4.当 a 1 时, a,3,5,7 的平均数是 4,当 a 4 时, a,3,5,7 的平均数不是1. a 1, b 4.则方差 s214× (1 4)2 (3 4)2 (5 4)2 (7 4)2 5.12已知一个线性回归方程为y 1.5x 45(xi1,5,7,13,19
26、) ,则 y _.答案58.5解析因为 xi 1,5,7,13,19 ,1所以 x 5(1 5 7 13 19) 9,又因线性回归方程y1.5x 45 经过点 ( x , y ),第10 页所以 y 1.5×9 45 58.5.二、解答题13从某企业生产的某种产品中抽取100 件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85 , 95)95 , 105)105 ,115)115, 125频数62638228(1) 在相应位置上作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
27、(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95 的产品至少要占全部产品 80%”的规定?解 (1) 频率分布直方图如图(2) 质量指标值的样本平均数为x 80× 0.06 90× 0.26 100× 0.38 110× 0.22 120× 0.08 100.质量指标值的样本方差为s2 ( 20)2× 0.06 ( 10)2× 0.26 0× 0.38 102× 0.22 202× 0.08 104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3) 质量指标值不低于 95 的产品所占比例的估计值为0.38 0.22 0.08 0.68.由于该估计值小于0.8,故不能认为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度汽车抵押民间借款合同
- 融资担保合同范本
- 居间付款合同范本
- 物流公司合作合同
- 安置房合同违约金
- 个人经营贷款购销合同 范本版
- 日租房合同协议具体版
- 2024年度互联网金融对外担保合同2篇
- 员工入职保密合同签订流程
- 基于2024年度预算的办公设备采购与租赁合同
- 2024年刑法知识考试题库含答案【满分必刷】
- 50万吨生物柴油建设项目可行性研究报告
- 【核心素养目标】统编版 选必1 第一单元 第1课 中国古代政治制度的形成与发展 教学设计
- 教师专业发展支持系统
- 八年级历史上册(部编版)第六单元中华民族的抗日战争(大单元教学设计)
- 《诗意的色彩》课件 2024-2025学年人美版(2024)初中美术七年级上册
- 非遗文化走进数字展厅+大数据与互联网系创业计划书
- 2022年7月贵州省高中学业水平考试语文试题(含答案解析)
- 2024年全国职业院校技能大赛高职组(动物疫病检疫检验赛项)考试题库(含答案)
- 社区普法法讲座
- 部编版(新人教版)小学一年级上册道德与法治教学设计(第一、第二单元)
评论
0/150
提交评论