版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学案一.随机抽样(一)总体、个体、样本把所考察对象的某一数值指标的全体构成的集合看成总体,构成总体的每一个元素为个体.从总体中随机抽取若干个个体构成的集合叫做总体的一个样本.(二)抽样方法1 .简单随机抽样(1)定义:设一个总体含有 N个个体,从中不放回地抽取 n个个体作为样本(nWN),如果每 次抽取时,总体内的各个个体被抽到的机会都相等,称这种抽样方法为简单随机抽样.(2)简单随机抽样的特点如下:它要求被抽取样本的总体中个体数有限.它是从总体中逐个地进行抽取.它是一种不放回抽样.它每一次抽取时,总体中的各个个体有相同的可能性被抽到.(3)常用的简单随机抽样方法抽签法先将总体中的所有 N
2、个个体编号,并把号码写在形状、大小相同的号签上,然后将这些号签放在同一个容器里,搅拌均匀.抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的优点是简单易行.缺点是当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌得不均匀,可能导致抽样的不公平.随机数表法a.随机数表:随机数表是由0,1,2,,9这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.b.用随机数表抽样的步骤:第一步:将总体中的个体编号.为了保证抽取样本有很好的 代表性,编号时位数要相同.第二步:选定开始的数字.为了保证所选定数字的随机性,应在面对随机数表之前就指出开始数字的纵横
3、位置.第三步:获取样本号码.随机确定一个读数方向,读数的方向可以向右,也可以向左、向上、向下等,重复的号码跳过.2 .系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.(2)系统抽样的步骤:编号.采用随机的方式将总体中的个体编号.分段.先确定分段的间隔k.当*N为总体中的个体数,n为样本容量)是整数时,k = N;当N不是整数时,通过从总体中随机剔除 n n一些个体使剩下的总体中个体总数 N'能被n整除,这时k= %.确定起始个体编号.在 第1段用简单随机抽样确
4、定起始的个体编号 S.按照事先确定的规则抽取样本. 通常是将 S加上间隔k,得到第2个个体编号S+k,再将(S+ k)加上k,得到第3个个体编号S+ 2k, 这样继续下去,获得容量为 n的样本.其样本编号依次是: S, S+ k, S+ 2k,,S+(n 1)k.3 .分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个 体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分 层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个
5、体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限 和数目,分层要恰当.各层抽取时采用简单随机抽样或系统抽样.(2)分层抽样的步骤分层;按比例确定每层抽取个体的个数;各层抽样(方法可以不同);汇合成样本.分层抽样的优点分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具 有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层 抽样在实践中有着非常广泛的应用.6.三种抽样方法的比较类别共同点各自特点相互联系适用范围笥单随机抽 羊抽样过程中每个 个体被抽取的机 会均等从总体中逐个抽 取总体中的个体数较少,我样将总体均匀分
6、成 几部分,按事先确 定的规则在各部 分抽取在起始部分 抽样时采用 简单随机抽 样总体中的个体数较多样将总体分成几层, 分层进行抽取各层抽样时 采用简单随 机抽样或系 统抽样总体由差异明 显的几部分组 成练1.(2010安徽文,14)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000 户.从普遍家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有 120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 .练2
7、.将一个总体为100的个体编号为0, 1, 2, 3,99,并依次将其分为10个小组,组号为0,1,9,要用系统抽样的方法抽取一个容量为10的样本,规定如果在第 0组(号码为09)随机抽取的号码为 2,则所抽取的10个号码为 .练3. 2010年高考湖北卷将参加夏令营的600名学生编号为:001, 002,,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从 001到300在第I营区,从 301到495在第H营区,从 496到600在第出营 区,三个营区被抽中的人数依次为()A.26 , 16, 8B.25, 17, 8C.25,练4.
8、一个社会调查机构就某地居民的月收入调查了16, 9D.24, 17, 9A. 25B. 30C. 35D. 4010000人,并根据所得数据画了样本 的频率分布直方图(如下图),为了分 析居民的收入与年龄、学历、职业等 方面的关系,要从这10000人中再用 分层抽样方法抽出 100人作进一步 调查,则在(2500,3000)(元)月收入段 应抽出的人数为()二.用样本估计总体1 .编制频率分布直方图的步骤如下:求极差:极差是一组数据的最大值与最小值的差.决定组距和组数:当样本容量不超过100时,常分成512组.组距=旅.将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以
9、将样本数据多取一位小数分组;列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组所占比例的大小.绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的 磊,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.2 .频率分布折线图(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分
10、布折线图.(2)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总 体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑的曲线就叫总体密度曲线.3 .茎叶图:统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶 是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示 数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.4 .平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有
11、奇数个时,处在最中间 的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组 数据的中位数.(3)众数:出现次数最多的数 (若有两个或几个数据出现得最多,且出现的次数一样,这些 数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据 没有众数).(4)在频率分布直方图中, 最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平 均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.5 .方差、标准差1222设样本数据为X1,X2,,Xn样本平
12、均数为 X,则5=彳(*1 x) +(X2 x) + (xn一 o 1o oo oX)2 =n( X12+X22+ Xn2) - n X 2叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.练5. (2011青岛)一组数据20,30,40,50,50,60,70,80的平均数、中位数、众数的大小关系是A.平均数 中位数众数B.平均数中位数众数C.中位数 众数平均数D.众数=中位数=平均
13、数练6 .(2011安徽名校联考一)关于统计数据的分析,有以下几个结论:一组数不可能有两个众数;将一组数据中的每个数据都减去同一个数后,方差没有变化;调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;一组数据的方差一定是正数;如图是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在50,60)的汽车大约是60辆.则这5种说法中错误的个数是()A. 2 B. 3C. 4D. 5练7. (2010 山东文)在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分
14、后,所剩数据的平均值和方差分别为()A. 92,2B. 92,2.8 C , 93,2D. 93,2.8练8.(2010合肥工大附中)某市共有5000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分 布表:分组频数频率80,90)90,100)0.050100,110)0.200110,120)360.300120,130)0.275130,140)12140,1500.050合计频率. 面0旧30 00.027 501)25 00.022 50.020 00.017 5, 0.015 0 0,012 5 (kOK) 0
15、-0,007 5 - 0.005 00.002 5O 90 100 110 120 130 140 150 成绩(分)(1)根据上面的频率分布表,求,处的数值;(2)在所给的坐标系中画出区间80,150上的频率分布直方图;(3)从整体中任意抽取 3个个体,成绩落在105,120中的个体数目为 E,求E的分布列 和数学期望.练9. (2011广东广州)某校高三(1)班的一次数学测试成绩的茎叶图如图所示和频率分布直 方图如图所示,都受到不同程度的破坏,但可见部分如下,据此回答如下问题:(1)求全班人数;(2)求分数在80,90)之间的人数;并计算频率分布直方图中80,90)间的矩形的高;(3)若要
16、从分数在80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在90,100之间的概率.三.统计案例(一)变量间的相关关系(1)散点图直观反映了两变量的成对观察值之间存在的某种关系,利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大致在一条直线的附近, 我们说变量x和y具有线性相关关系. 人人人(2)最小二乘法求回归直线的方程:设线性回归方程为y = bx+a.一. A 八一其中,b是回归直线的斜率,a是截距.xi x y yA b=n2Xi X 2i = 1xiyi n x y i= 1n 4 4x2 n x2i=1注意:回归直线一定
17、经过样本的中心点a= y b x 一 (x, y),据此性质可以解决有关的计算问题.3.回归分析ny yxi xi=1(2)相关性检验的步骤作统计假设.假设x与y不具有线性相关关系.根据小概率0.05与n 2在附表中查出r的一个临界值0.05 ;根据样本相关系数计算公式算出r的值;作统计推断.如果|r|>r0.05,表明有95%的把握认为x与y之间具有线性相关关系;如果 |r|<r0.05,则没有理由拒绝原来的假设.(二)独立性检验1.若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.2.两个分类变量 X与Y的频数表,称作2X2列联表.y1y2合计K1nnn12n1
18、+K2n21n22n2+合计n+1n+2n在2X2列联表中,随机变量f=nniin22-ni2n21 2,其中n为样本容量,声的取值范ni+ n2+ n+1 n+2围可以判断“ X与Y有关系”的可信度,如表,用它的大小可以决定是否拒绝原来的统计 假设H)如果算出的 卡值较大,就拒绝H),也就是拒绝事彳A与B无关",从而就认为 它们是有关的.3.两个临界值:3.841与6.635经过对X2统计量分布的研究,已经得到了两个临界值:3.841与6.635.当根据具体的数据算出的x2>3.841时,有95%勺把握说事件A与B有关;当x2>6.635练10.(2011山东理,7)某
19、产品的广告费用x与销售额y的统计数据如下表时,有99%勺把握说事件 A与B有关;当X2W3.841时,认为事件 A与B是无关的.(其中频数 nn、m2、01、n22都不小于5)P( X 2>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828第9页A. 63.6万元B. 65.5万元 C. 67.7万元D. 72.0万元练11.(2011湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动, 得到如下的列联表:由K2=男女总计爱好40
20、2060不爱好203050总计60501102n ad bca+ b c+ d a+ c b+ d算得,K2 =110X 40X30 20X20 260X 50X 60X 507.8.附表:P(K2>k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是 ()A.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”练12.(2011广东理,13)某数学老师
21、身高176cm,他爷爷、父亲和儿子的身高分别是 173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.练13.(2011郑州二次质检)某中学对高二甲、乙两个同类班级进行“加强语文阅读理解训练对提高数学应用题得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学 应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下6170分7180分8190分91100分甲班(人数)36111812乙班(人数)48
22、131510现规定平均成绩在 80分以上(不含80分)的为优秀.(1)试分析估计两个班级的优秀率;(2)由以上统计数据填写下面2X2列联表,并问是否有 75%的把握认为“加强语文阅读理解训练对提高数学应用题得分率”有帮助优秀人数非优秀人数合计甲班乙班合计2参考公式及数据:K2= a c +d+c b ,P(K2> k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2> k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828练14.为了比较注射 A, B两种药物后产生的皮肤
23、疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物 A,另一组注射药物 B.下表1和表2分别是注射药物 A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表庖疹面积60,65)65,70)70,75)75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表庖疹面积60,65)65,70)70,75)75,80)80,85)频数1025203015(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;频率0. 08Q. 07 0. 06 0. 05 0, 04 0. 03 0.
24、 020. 01I1 I-I* 1>1t»|i)I-i中1 1«4«4 耳h J m : a q: 4 n.P/tQ11i .41» *11R1- - - nJV - . 1 1 1*P192i16065 70 7580 85 疱挣面枳图1注射药物A后皮肤疱疥面枳的频率分布直方图病Q. 08 0. 97 0. 06 氏05Q 04Q. 03D, 02 0, 01111 1119 1|一 一-一1F' , 1.1 V , i*JIft H* 1r * W* 一FII6065 70 75£0 85 疱爰面枳图2沆射药物R后皮肤疱势面积的频率分布直方图(2)完成下面2X2列联表,并回答能否有 99.9%的把握认为“注射药物 A后的疱疹面积与 注射药物B后的疱疹面积有差异”.疱疹面积小于70mm2疱疹面积不小于70mm2合计生射药物Aa =b=生射药物Bc=d =合计n =2n ad bca+b c+d a + c b + dP(x>k)0.1000.05
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 北京版四年级上册数学第一单元 大数的认识 测试卷及参考答案【培优】
- 北师大版一年级下册数学第五单元 加与减(二) 测试卷附答案(巩固)
- 新生杯篮球赛活动总结
- 计划保证协议
- 设计施工招标总承包条件
- 财务收款声明保证
- 购房补充协议的编写方法
- 购销合同中的渠道拓展
- 购销合同印花税的减免条件解读
- 趣味小学语文阅读教学方法
- 药学服务培训课题
- 无人机集群作战分析报告
- 《水力发电》课件
- 口腔护理会阴护理ppt
- 培养自我驱动力的训练
- 即食鸡肉行业前景分析
- 3-4岁幼儿情绪和社会发展特点
- 分布式光伏高处作业专项施工方案
- 江苏省南京市建邺区2023-2024学年五年级上学期期末数学试卷.1
- 保密管理的组织架构与职责分工
- 主题班会《感恩父母·老师》课件
评论
0/150
提交评论