




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计、统计案例一、基础知识要记牢抽样方法主要有简单随机抽样、系统抽样和分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.二、经典例题领悟好例1 (1)(2013陕西高考)某单位有840名职工,现采用系统抽样方法抽取 42人做问 卷调查,将840人按1,2,840随机编号,则抽取的 42人中,编号落入区间481,720 的人数为()A. 11B . 12C. 13D. 14某工厂在12月份共生产了 3 600双皮靴,在出厂前要检查这批产品的质量,决定采 用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数
2、分别为a, b, c,且a, b,c构成等差数列,则第二车间生产的产品数为()A . 800B . 1 000C. 1 200D. 1 500解析抽样间隔为¥0 = 20.设在1,2,,20中抽取的号码记为 X0(x°q1,20),在 481,720之间抽取的号码记为 20k+ X0,贝U 481 < 20k+ x°w 720, k6*.1X0.24 w k+二 w 36.202020 20, 1,/k= 24,25,26,35,k值共有35- 24+ 1 = 12(个),即所求人数为12.(2)因为a, b, c成等差数列,所以 2b = a+ c,即第二
3、车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占总数的三分之一,即为1 200双皮靴.答案(1)B(2)C方法技巧1系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的 号码和组距唯一确定每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列a.,第k组抽取样本的号码 ak= m+ k- 1 d.2分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比一一样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总 数与抽样比的乘积三、预测押题不能少1. 某工厂甲、乙、丙三个
4、车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为 n的样本进行调查,其中从丙车间的产品中抽取了 3件,则n=( )A . 9B . 10C. 12D. 13解析:选D 由分层抽样可得, 3 = £,解得n = 13.60 260(2)将某班的60名学生编号为:01,02,,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是 .解析:依据系统抽样方法的定义知,将这60名学生依次按编号每 12人作为一组,即0112、1324、4960,当第一组抽得的号码是04时,剩
5、下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).答案:16,28,40,52马澄二用样本估计总体、基础知识要记牢(1)频率分布直方图中横坐标表示组距,纵坐标表示频率频率 组距.16 / 15(2)频率分布直方图中各小长方形的面积之和为1.二、经典例题领悟好例2(2013四川高考)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示以组距为5将数据分组成0,5) , 5,10),,30,35) , 35,40时,所作的频率分布直方图是()AS10 15 20 25B频数样本容量解析借助已知茎叶图得出各小组的频数,再由
6、频率=求出各小组的频率,频率进一步求出 并得出答案. 组距法一:由题意知样本容量为 20,组距为5.列表如下:分组频数频率频率组距0,5)1丄200.015,10)11200.0110,15)4150.0415,20)2丄100.0220,25)4150.0425,30)3200.0330,35)3_3_200.0335,402丄100.02合计201观察各选择项的频率分布直方图知选A.法二:由茎叶图知落在区间0,5)与5,10)上的频数相等,故频率、频率也分别相等比组距较四个选项知A正确.答案A方法技巧求解频率分布直方图中的数据问题,最容易出现的问题就是把纵轴误以为是频率导致错频率误在频率分
7、布直方图中,纵轴表示组距,我们用各个小矩形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高与小矩形的宽样本数据的组距 的乘积三、预测押题不能少2. (1)某中学高三年级从甲、乙两个班级各选出7名学生参加数_学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班''学生的平均分是85,乙班学生成绩的中位数是83,则x+ y的值为 ''6 29116解析:依题意,甲班学生的平均分85= 78+ 79 + 85+ 80 + x + 80+ 92+ 96,故x= 5,乙班学生成绩的中位数为83,故其成绩为76,81,81,83,91,91,96,所以
8、y= 3, x+ y= 8答案:8(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第一次第二次第三次第四次第五次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为 .解析:对于甲,平均成绩为x = 90,所以方差为s2=(87 90)2 + (91 90)2 + (90 2 2 2 2 1 290) + (89 90) + (93 90) = 4;对于乙,平均成绩为x = 90,方差为 s =(89 90) +(90 90)2 + (91 90)2+ (88 90)2 + (92 90)2 = 2由于 2<4,所以
9、乙的成绩较为稳定.答案:2|统计案例、基础知识要记牢n v'xiyi nxy匸1(1)方程y=bx+ a称为线性回归方程,其中AA A b =, a= y b x ; ( x , y )n、x2 ni = 1称为样本中心点.(2)随机变量J, 2a + b+ c+ d ad bc 2K ( x)=(a+ b (c+ d (a + c (b + d)若K2( ;)>3.841,则有95%的把握说两个事件有关;若K2( X)>6.635,则有99%的把握说两个事件有关.二、经典例题领悟好例3 (2013福建高考)已知x与y之间的几组数据如下表:x123456y021334假设根
10、据上表数据所得线性回归直线方程为y= bx+ a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为 y= b' x+ a',则以下结论正确的是()A.b>b', a>a'B.b>b', a<a'C.b<b', a>a'D.b<b', a<a'解析由(1,0), (2,2)求 b' , a',贝U2 0b' = 2, a' = 0 2x 1 = 2.2 1由上表数据求b, a,6' Xiyi= 0 + 4 +
11、3+ 12 + 15 + 24= 58,i_1x = 3.5,6、xi= 1 + 4+ 9+ 16+ 25 + 36= 91,i_11358 6x 3.5X57,6291 6 x 3.5A 13 513 51a= x 3.5 = 一一 =一,6 76 23AA'b<b' , a>a'.答案C方法技巧进行线性回归分析时应注意的问题(i) 正确理解计算b, a的公式和准确的计算是求线性回归方程的关键.(2) 在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是 否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.三、预
12、测押题不能少100名性3. (1)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问 别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘能做到“光盘男4510女3015附:P(K2> k)0.100.050.025k2.7063.8415.024n ad be 2a+ b c+ d a+ c b+ d参照附表,得到的正确结论是关”关”A .在犯错误的概率不超过B .在犯错误的概率不超过C.有90%以上的把握认为D .有90%以上的把握认为1%的前提下,认为“该市居民能否做到1%的前提下,认为“该市居民能否做到“该市居民能否做到光盘与性别有关”“该市居民能否做到
13、光盘与性别无关”'光盘''光盘'与性别有与性别无2n ad bc解析:选C 由公式可计算K2的观测值k =(a+ b c+ d a + c b+ d )100 45X 15 30X 1055 x 45 x 75 x 253.03>2.706,所以有90%以上的把握认为“该市民能否做到光盘'与性别有关”,故选C.(2)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地右干户家庭的年收入x(单元:万元)和年教育支出y(单位:万元),调查显示年收入 x与年教育支出y具有线性相关关系,并由调查数据得到 y对x的回归直线方程:y= 0.15x+ 0.2.
14、由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加 万元.解析:由题意知,0.15(x+ 1) + 0.2-0.15X 0.2= 0.15.答案:0.15把握命题甬度,怵现命題高度拉分题一分分必抢统计与概率的交汇统计与统计案例的主要内容是随机抽样、样本估计总体、变量的相关性、回归分析和独立性检验,该部分内容在高考中占有一定的位置,近两年高考中由单纯考查统计及统计案例转化为与概率交汇命题且背景贴近生活,角度新颖,试题多为解答题,难度中档.一、经典例题领悟好例(2013北京高考)下图是某市3月1日至14日的空气质量指数趋势图.空气质量 指数小于100表示空气质量优良,空气质量指数大于
15、200表示空气重度污染.某人随机选择 3月1日至3月13日中的某一天到达该市,并停留 2天.空气质址鼎数(1) 求此人到达当日空气重度污染的概率;(2) 设X是此人停留期间空气质量优良的天数,求X的分布列与数学期望;(3) 由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)解设Ai表示事件“此人于3月i日到达该市” (i = 1,2,,13) 根据题意,P(Ai)丄13,且 Ai n Aj = ? (i 工 j).(1)设B为事件“此人到达当日空气重度污染”,则B = A5UA8.所以 P(B)= P(A5UA8) = P(A5)+ P(A8)=由题意可知,X的所有可能取值为
16、0,1,2,且P(X = 1) = P(A3UA6lA7lAii)= P(A3)+ P(A6)+ P(A7)+ P(Aii)= £,P(X= 2) = P(Ai IA2IA12 IA13)= P(Ai) + P(A2)+ P(A + P(Ai3)= 13,P(X= 0) = 1-P(X= 1)- P(X = 2) = 153.1213.所以X的分布列为X012P_5_131313故X的期望EX= 0 X + 1 X + 2 X ° =131313(3) 从3月5日开始连续三天的空气质量指数方差最大.方法技巧本题考查统计图及概率的知识,意在考查考生的识图能力和数据处理能力,解
17、答此类问题应注意:1明确频率与概率的关系,频率可近似替代概率;2此类问题中的概率模型多是古典概型,在求解时,要明确基本事件的构成二、预测押题不能少国IV标准规定:轻型汽车的氮氧化物排放量不得超过80 mg/km.根据这个标准,检测单位从某出租车公司运营的 A, B两种型号的出租车中分别抽取 5辆,对其氮氧化物的排放 量进行检测,检测结果记录如下: (单位:mg/km)A8580856090B70x95y75由于表格被污损,数据x, y看不清,统计员只记得A, B两种出租车的氮氧化物排放量的平均值相等,方差也相等.(1) 求表格中x与y的值;(2) 从被检测的5辆B种型号的出租车中任取2辆,记“
18、氮氧化物排放量超过80 mg/km ”的车辆数为E,求E的分布列和数学期望.解:依题意得X a= X B , SA = SB.1 1又 x a= 5(85 + 80 + 85 + 60 + 90) = 80, x b= 5(70 + x + 95 + y + 75),+ 0+ 25 + 400 + 100)= 110, sB =151002 2+ (x 80) + 225 + (y 80) + 25,x+ y= 160,所以22x 80 + y 80 = 200, x= 70,x= 90,解得s或彳y= 90,y= 70.由可得B种型号出租车中氮氧化物排放量超过80 mg/km的车辆数为2,随
19、机变量 =0,1,2,贝U2 1 1C33C3C26P(=0)=C3=帀 p(e= (2013新课标全国卷I )为了解某地区的中小学生的视力情况,拟从该地区的中小学 生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是 ( )A .简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A ;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行
20、分层抽样,排除B和D.=N=帀,P(=(2013石家庄模拟)设随机变量E服从正态分布N(1,"),若P(&2) = 0.8,则P(0氏1)的值为()A . 0.2B . 0.3C. 0.4D. 0.6=Ci=秸故E的分布列为E012P_3_6丄1010103 614所以 E(8= 0x +1 x 160+ 2X110= 5.解析:选 B P(&2) = 0.8,.P(炉2) = 0.2,又 P(&0) = P( &2) = 02P(O< W2) = 1 P( W0) P( &2) = 061.p(0< <1) = (Ov 氏2
21、) = 0.3.3. (2013福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩C. 450D. 120解析:选B 由频率分布直方图可得,该模块测试成绩不少于60分的学生人数为 600(0.005 + 0.015) X 10 X 600= 480.4. (2013湖北高考)四名同学根据各自的样本数据研究变量x, y之间的相关关系,并求得回归直线方程,分别得到以下四个结论: y与x负相关且y = 2.347X 6.423; y与x负相关且y = 3.476X+ 5.648; y与x正相关且y = 5.437x+ 8.493; y与x正相关且y = 4.326x 4.578.其
22、中一定不正确的结论的序号是 ()A .B .C.D .解析:选D 中y与x负相关而斜率为正,不正确;中y与x正相关而斜率为负,不正确.5. (2013湖南五市十校联考)通过随机询问110名性别不同的大学生是否爱好某项运动, 得到如下的列联表:男女总计爱好402060P(K2> k)0.0500.0100.001k3.8416.63510.828由k2=n ad be附表:不爱好203050总计60501102K2_ 110X(-40 X 30 20X 2060 X 50 X 60 X 50a+ b e + d a+ e b+ d 算得,7.8.参照附表,得到的正确结论是()A 有99%以
23、上的把握认为“爱好该项运动与性别有关”B 有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D 在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A 因为6.635<7.8<10.828,所以有99%以上的把握认为 “爱好该项运动与性 别有关”,故选A.6某实验中学共有职工 150人,其中高级职称的职工 15人,中级职称的职工 45人, 一般职员90人,现采用分层抽样抽取容量为 30的样本,则抽取的高级职称、中级职称、- 般职员的人数分别为()A 5、10、15B 3、9、18C.
24、3、10、17D 5、9、16解析:选B 在150人中抽取30人,分层抽样时应按1 :5的比例抽取,故抽取的高级职称、中级职称、一般职员的人数分别为3、9、18.7. (2013 东滨州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组书画组乐器组r=r*.冋4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法, 从参加这三个兴趣小组的学生中抽取 30人,结果篮球组被抽出 12人,则a的值为解析:由题意知2 = 汇,解得a = 30.45+ 15120+ a答案:30&以下四个命题,其中正确的是 20分钟从中抽
25、取一件产品进行某项指标 从匀速传递的产品生产流水线上,质检员每检测,这样的抽样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1; 在回归直线方程y= o.2x+12中,当解释变量x每增加一个单位时,预报变量y平均增 加0.2个单位; 对分类变量X与Y,它们的随机变量 K2(X)的观测值k来说,k越小,“ X与Y有关 系”的把握程度越大.解析:是系统抽样;对于,随机变量K2( 3的观测值k越小,说明两个变量有关系 的把握程度越小.答案:9. (2013湖北八校联考)对某市“四城同创”活动中 800名志愿者的年龄抽样调查统计 后得到频率分布直方图(2)据此估计该市“四城同创”活动
26、中志愿者年龄在25,35)的人数为(1)25,30)年龄组对应小矩形的高度为则 5(0.01 + h + 0.07+ 0.06 + 0.02) = 1,解析:设25,30)年龄组对应小矩形的高度为h, h= 0.04.(2)志愿者年龄在25,35)的频率为 5(0.04+ 0.07) = 0.55,故志愿者年龄在 25,35)的人 数约为 0.55X 800 = 440.答案:(1)0.04(2)440频率0,0280J016O 5060708090100数10. (2013成都诊断性检测)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直 方图都受到不同程度的破坏,可见部分如下:5 36
27、686 0133 344 5677 8B98 1 3344 5679 3667试根据图表中的信息解答下列问题:(1)求全班的学生人数及分数在70,80)之间的频数;为快速了解学生的答题情况,老师按分层抽样的方法从位于70,80) , 80,90)和90,100分数段的试卷中抽取 8份进行分析,再从中任选3人进行交流,求交流的学生中,成绩位于 70,80)分数段的人数X的分布列和数学期望.解:(1)由茎叶图可知,分数在50,60)上的频数为4,频率为0.008 X 10= 0.08,故全班4的学生人数为0-08=50.分数在70,80)之间的频数等于 50- (4 + 14+ 8 + 4) =
28、20.(2)按分层抽样原理,三个分数段抽样数之比等于相应人数之比.又70,80) , 80,90)和90,100分数段人数之比等于5 : 1,由此可得抽出的样本中分数 在70,80)之间的有5人,分数在80,90)之间的有2人,分数在90,100之间的有1人.从中任取3人,共有C8= 56种不同的结果.被抽中的成绩位于70,80)分数段的学生人数 X的所有取值为0,1,2,3.它们的概率分别是:C3 1P(x=0) = C6=56,c!c2P(x =1)=CC" =1556,213C5C3 30 15 c、 C5 105P(X= 2) = C5C3 = 30=云,P(X= 3) =
29、C = 56=云.X的分布列为X0123P11515556562828X的数学期望为E(X) = 0X 56 + 1X豊+ 2X齐3X詁晋=贾11. (2013湖北高考)假设每天从甲地去乙地的旅客人数X是服从正态分布N(800,502)的随机变量记一天中从甲地去乙地的旅客人数不超过900的概率为P0.(1) 求P0的值;(参考数据:若 XN(仏(T),有P(厂o< XW叶扌=0.682 6, P(卩2VX< 叶 2扌=0.954 4, Pg 3 < X< 叶 3 扌=0.997 4)(2) 某客运公司用 A、B两种型号的车辆承担甲、乙两地间的长途客运业务,每车每天往返一
30、次.A、B两种车辆的载客量分别为36人和60人,从甲地去乙地的营运成本分别为1 600元/辆和2 400元/辆公司拟组建一个不超过21辆车的客运车队,并要求B型车不多于A型车7辆若每天要以不小于P0的概率运完从甲地去乙地的旅客,且使公司从甲地去乙地的营运成本最小,那么应配备A型车、B型车各多少辆?解:由于随机变量 X服从正态分布 N(800,502),故有 尸800, (= 50, P(700<X< 900)=0.954 4.由正态分布的对称性,可得1 1po= p(xw 900) = P(XW 800) + P(800<X< 900)= 2+ 2卩(70。<乂< 900)= 0.977 2.设A型、B型车辆的数量分别为 x, y辆,则相应的营运成本为 1 600x+ 2 400y. 依题意,x,y还需满足x+ yw 21, yw x+ 7,P(X< 36x+ 6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025ABB电动升降服务车
- 平行缝焊机行业分析:光电器件是最大的下游领域占有33%份额
- 房地产行业中期策略:企稳中谋转型
- 社群经济赋能女性跨境出海可持续发展白皮书
- 2025年食品冷链物流温控技术与冷链物流企业员工培训体系报告
- 2025年互联网医疗平台在线问诊平台与医疗机构合作案例研究报告
- 电商行业2025年知识产权保护与网络版权保护法律咨询报告
- 普惠金融背景下2025年金融科技应用对农村金融服务能力提升报告
- 钢铁产业绿色转型路径与2025年产能优化布局分析报告
- 农村土地流转规范化管理对农业生产效率提升报告
- 《流行性感冒辨证论治》课件
- JJG(交通) 208-2024 车货外廓尺寸动态现场检测设备
- 2024年山西焦煤集团招聘考试真题
- 工厂精细化管理全案
- 镀铝技能考试试题及答案
- 车间工艺报警管理制度
- 中建二测2025题库
- 天津公务员考试真题2024
- 重点人口管理工作规定
- 肾挫伤患者护理查房
- 山东省烟台市、龙口市2025届中考生物考试模拟冲刺卷含解析
评论
0/150
提交评论