版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题18.统计与统计案例
抽样方法
[核心提炼]
1.简洁随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体
数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
例1」(1)(2024•西安八校联考)某班对八校联考成果进行分析,利用随机数表法抽取样本时,先将60个
同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数起先向右读,则选出的第6个个
体是()
(注:下表为随机数表的第8行和第9行)
第8行
63016378591695556719981050
717512867358074439523879
第9行
33211234297864560782524207
443815510013429966027954
A.07B.25
C.42D.52
⑵某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的
质量,现用分层抽样的方法从以上全部的产品中抽取60件进行检验,则应从丙种型号的产品中抽取
件.
【答案】(DD(2)18
【解析】(1)依题意得,依次选出的个体分别是12,34,29,56,07,52,…因此选出的第6个个体是
52,选D.
⑵应从丙种型号的产品中抽取
300/…
60*200+400+300+100=18(件)*
回国阻倒
抽样方法主要有简洁随机抽样、系统抽样和分层抽样三种,这三种抽样方法各自适用不同特点的总体,但
无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.
【对点训练】
1.某公司有一批专业技术人员,对他们进行年龄状况和接受教化程度(学历)的调查,其结果(人数分布)
如下表:
学历35岁以下35―50岁50岁以上
本科803020
探讨生X20y
在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取“个人,其中35岁以下48人,50岁以上
5x
10人,再从这“个人中随机抽取1人,此人的年龄为50岁以上的概率为而,则7的值为—
答案:8
解析:由题苣,得¥二至,解有
所以35-50岁中神脚R的人的为78-48-10=20,
峪停x=40,y=5
2.已知某商场新进3000袋奶粉,为检查是否达标,现采纳系统抽样的方法从中抽取150袋进行检查,将
3000袋奶粉按1,2,3000随机编号,若第一组抽出的号码是11,则第六十一组抽出的号码为
答案:1211
解析:由题意知抽样间隔为黑=20,又第一组抽出的号码是11,则11+60X20=1211,故第六十
150
一组抽出的号码为1211.
用样本估计总体
考向1用统计图表估计总体
直方图的两个结论
⑴小长方形的面积=组距><频益率=频率.
(2)各小长方形的面积之和等于1.
前㈤某公司为了解用户对其产品的满足度,从A,B两地区分别随机调查了40个用户,依据用户对产品的
满足度评分,得到A地区用户满足度评分的频率分布直方图和B地区用户满足度评分的频数分布表.
A场区用户,厦度伸分的履率分布立方图
0.040-
o.(nsL
o.(no»
0.025r
0.020>
0.01S>
aoio>
0.0054
40)060708090100,怎度评分
图①
B地区用户满足度评分的频数分布表
满足度评
[50,60)[60,70)[70,80)[80,90)[90,100]
分分组
频数2814106
(1)在图②中作出B地区用户满足度评分的频率分布直方图,并通过直方图比较两地区满足度评分的平均值
及分散程度(不要求计算出详细值,给出结论即可).
11地1*用户*童应洋分的国率分6(I方网
图②
(2)依据用户满足度评分,将用户的满足度分为三个等级:
满足度评分低于70分70分到89分不低于90分
满足度等级不满足满足特别满足
估计哪个地区用户的满足度等级为不满足的概率大?说明理由.
【解析】(1)如图所示.
通过两地区用户满足度评分的频率分布直方图可以看出,B地区用户满足度评分的平均值高于A地区用户满
足度评分的平均值;B地区用户满足度评分比较集中,而A地区用户满足度评分比较分散.
(2)A地区用户的满足度等级为不满足的概率大.
记册表示事务:“A地区用户的满足度等级为不满足”;合表示事务:“B地区用户的满足度等级为不满
足”.由直方图得尸(G)的估计值为(0.01+0.02+0.03)X10=0.6,/(金)的估计值为(0.005+0.02)X10
=0.25.所以A地区用户的满足度等级为不满足的概率大.
考向2用样本的数字特征估计总体
统计中的四个数字特征
(1)众数:在样本数据中,出现次数最多的那个数据.
⑵中位数:在样本数据中,将数据按大小排列,位于最中间的数据.假如数据的个数为偶数,就取中间
两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即
一1
矛=-(荀+热+~+人).箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产
n
量(单位:kg),其频率分布直方图如下:
⑴记/表示事务“旧养殖法的箱产量低于50kg”,估计力的概率;
(2)填写下面列联表,并依据列联表推断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg箱产量250kg
旧养殖法
新养殖法
(3)依据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
0.0500.0100.001
k3.8416.63510.828
o_____________nQad-be)'__________
(a+6)(c+d)(a+c)(6+d).
【解析】(1)旧养殖法的箱产量低于50k.g的频率为
(0.012+0.014+0.024+0.034+0.040)X5=0.62.
因此,事务力的概率估计值为0.62.
⑵依据箱产量的频率分布直方图得列联表
箱产量〈50kg箱产量》50kg
旧养殖法6238
新养殖法3466
,200义(62X66—34X38)2
K=100X100X96X104--15.705.
由于15.705>6,635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法
的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产
量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
前尚因匐
独立性检验的一般步骤
(1)依据样本数据制成2X2列联表;
n(方d—hd2
⑵依据公式段=>、八一⑶计算接的值;
ka+b)kc+d)ka+c)kb十d)
(3)查表比较代与临界值的大小关系,作出统计推断.
【对点训练】
(2024•郑州第一次质量预料)近年来郑州空气污染较为严峻,现随机抽取一年(365天)内100天的空气中
PM2.5指数的检测数据,统计结果如下:
PM2.5(50)(100,(150)(200,(250)
[0,50]>300
指数100]150]200]250]300]
空气稍微轻度中度中度重重度
优良
质量污染污染污染污染污染
天数413183091115
记某企业每天由空气污染造成的经济损失为S(单位:元),PM2.5指数为x.当x在区间[0,100]内时对企业
没有造成经济损失;当x在区间(100,300]内时对企业造成的经济损失成直线模型(当PM2.5指数为150时
造成的经济损失为500元,当PM2.5指数为200时,造成的经济损失为700元);当PM2.5指数大于300时
造成的经济损失为2000元.
⑴试写出S(x)的表达式;
(2)试估计在本年内随机抽取一天,该天经济损失S大于500元且不超过900元的概率;
(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面列联表,并推断是否有
95%的把握认为郑州市本年度空气重度污染与供暖有关?
附:
户(百人)0.250.150.100.050.0250.0100.0050.001
ko1.3232.0722.7063.8415.0246.6357.87910.828
n(ad-be)廿上,,,
(a+6)(c+d)(a+c)(b+d)'.其中a+6+c+d.
非重度污染重度污染合计
供暖季
非供暖季
合计100
’0,xG[0,100]
【解析】:⑴依题意,可得S(x)=<4x—100,xG(100,300].
、2000,xW(300,+8)
(2)设“在本年内随机抽取一天,该天经济损失S大于500元且不超过900元”为事务4
39
由500<SW900,得150〈启250,频数为39,P(A)=—
(3)|R据题中/据用到如下2X2歹我*表:
非*度污染重,度再染合计
脚粹830
-
非供睐季6370
合计8515100
100X《63X8—”X7):
始即见测值15X30X70独3川,
所以有95。•的把握认为空气重度石染与供暖育关.
课时作业
[基础达标]
1.(2024•南昌第一次模拟)某校为了解学生学习的状况,采纳分层抽样的方法从高一1000人、高二1200
人、高三〃人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么〃=()
A.860B.720
C.1020D.1040
【答案】D.
【解析】依据分层抽样方法,得丁而甘%=X81=30,解得〃=1040.故选D.
1.UUU-IL-UUI11
2.(2024•广西三市联考)
|
20IS
3II■4
423S7>
在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之
和为61,则被污染的数字为()
A.1B.2
C.3D.4
【答案】B.
【解析】由图可知该组数据的极差为48—20=28,则该组数据的中位数为61—28=33,易得被污染的数字
为2.
3.(2024•长春质量检测(二))如图是民航部门统计的2024年春运期间十二个城市售出的来回机票的平均
价格以及相比去年同期改变幅度的数据统计图表,依据图表,下面叙述不正确的是()
12M46运榜函机票平均情福
A.深圳的改变幅度最小,北京的平均价格最高
B.深圳和厦门的春运期间来回机票价格同去年相比有所下降
C.平均价格从高到低居于前三位的城市为北京、深圳、广州
D.平均价格.的涨幅从高到低居于前三位的城市为天津、西安、厦门
【答案】D.
【解析】由图可知深圳对应的小黑点最接近0%,故改变幅度最小,北京对应的条形图最高,则北京的平均
价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所
下降,故B正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知
平均价格的涨幅由高到低居于前三位的城市分别为天津、西安和南京,故D错误.选D.
4.(2024.湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x和
销售额y进行统计,得到统计数据如下表(单位:万元):
C.111.2万元D.118.2万元
【答案】C.
【解析】根据尻计物据表,可湖1=g'(2+3+4+3+6)=4,.1=1x(29+41+50+59+71)=50,而回归
直线)=102x+阂过样本点的中心(4,50),
HHiZ50=102X4+(1,
解得口=9.2,
所以回归方程为)=102x+92,
所以当x=l0时,]=10.2X10+9.2=111.2,故选C
5.(2024•宝鸡质量检测(一))对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为
检测结果的频率分布直方图,依据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)
和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为()
事率.
OM25......................j
O.QSOO.................p-l
OLOHS......彳一,卜
OJX250............H
0.012।|||*|*-|
«(10IS202$1035
A.5B.7
C.10D.50
【答案】D.
【解析】依据题中的频率分布直方图可知,三等品的频率为1—(0.0500+0.0625+0.0375)义5.=0.25,
因此该样本中三等品的件数为200X0.25=50,选D.
6.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是
从随机数表第1行的第5列数字起先由左到右依次选取两个数字,则选出来的第5个个体的编号为
78166572080263140702436997280198
32049234493582003623486969387481
答案:01
解析:由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编
号是01.
7.(2024•长沙模拟)
4S
50
754
910
11?S
21”
空气质量指数(AirQualityIndex,简称AQI)是定量描述空气质量状况的指数,空气质量依据AQI大小分
为六级,0〜50为优;51〜100为良;101〜150为轻度污染;151〜200为中度污染;201〜300为重度污
染;大于300为严峻污染.一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如
图.依据该统计数据,估计此地该年AQI大于100的天数为.(该年为365天)
答案:146
99
解析:该样本中AQI大于100的频数为4,频率为F以此估计此地全年AQI大于100的频率为‘故此地该
55
2
年AQI大于100的天数约为365X-=146.
5
8.(2024•石家庄质量检测(二))设样本数据xi,xz,…,xzou的方差是4,若乃=2右一2,…,2
017),则为,先,…,及on的方差为.
答案:16
——1
解析:设样本数据的平均数为x,贝"力=2为一1的平均数为2x—1,贝ij%,及,…,乃。"的方差为行正
[(2xi—1—2x+1)2+(2自一1—2x+1)2H---1-(2蜃on—1—2x+1)=4X‘017]—x)'+(莅-x)2
4----F(四on—x)2]=4X4=16.
9.(2024•福州五校其次次联考)为了参与某数学竞赛,某高级中学对高二年级理科、文科两个数学爱好
小组的同学进行了赛前模拟测试,成果(单位:分)记录如下:
理科:79,81,81,79,94,92,8.5,89
文科:94,80,90,81,73,84,90,80
(1)画出理科、文科两组同学成果的茎叶图;
IIXM
71
8
9
⑵计算理科、文科两组同学成果的平均数和方差,并从统计学的角度分析,哪组同学在此次模拟测试中
发挥比较好;
(3)若在成果不低于90分的同学中随机抽出3人进行培训,求抽出的3人中既有理科组同学又有文科组同
学的概率.
(参考公式:样本数据荀,物……的方差:…+(k、)1,其中:为样本
平均数)
【解析】:(1)理科、文科两组同学成果的茎叶图如下:
(2)从平均数和方差的角度看,理科组同学在此次模拟测试中发挥比较好.理由如下:
—1
X理=^X(79+81+81+79+94+92+85+89)=85,
O
—1
£文=三义(94+80+90+81+73+84+90+80)=84.
O
si=1x[(79-85)2+(81-85)2+(81-85)2+(79~85)2+(94-85/+(92—85尸+(85-85)2+(89-85)2]
O
=31.25,
[(94-84)2+(80-84)2+(90—84尸+(81-84)2+(73-84)2+(84-84)2+(90-84)2+(80-8.4)2]
O
=41.75.
由于了理>了文,媪<s,,
所以理科组同学在此次模拟测试中发挥比较好.
(3)设理科组同学中成果不低于90分的2人分别为A,B,文科组同学中成果不低于90分的3人分别为a,
b,c,则从他们中随机抽出3人有以下10种可能:ABa,ABb,ABc,Aab,Aac,Abe,Bab,Bae,Bbc,abc.
其中全是文科组同学的状况只有a6c一种,没有全是理科组同学的状况..
1Q
记“抽出的3人中既有理科组同学又有文科组同学”为事务〃,则户(励=1—正=U.
10.(2024.张掖第一次诊断考试)中心政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台
“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的看法,责成人社部进行调研.人社部从
网上年龄在15〜65的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年
龄的统计结果如下:
年龄[15,25)[25,35)[35,45)[45,55)[55,65]
支持“延迟退休”的人数155152817
(1)由以上统计数据填2X2列联表,并推断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退
休年龄政策”的支持度有差异;
45岁以下45岁以上合计
支持
不支持
合计
(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参与某项活动.现从这8
人中随机抽2人,求至少有1人是45岁以上的概率.
参考数据:
P(百kJ0.1000.0500.0100.001
k。2.7063.8416.63510.828
2
o_nQad—be)
(a+6)(c+d)(a+c)(6+d)
【解析】:(1)2X2歹U联表如下:
45岁以下45岁以上合计
支持354580
不支持15520
合计5050100
100X(35X5-45X15)225
因为片=50X50X80X20=T=6-25>3'841,
所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.
(2)从不支持“延迟退休”的人中,45岁以下应抽6人,45岁以上应抽2人.
记45岁以下的为1,2,3,4,5,6;45岁以上的为4B,
则有1-2,3,4,5,6,A,B,
2f3,4,5,6,A,B,
3-4,5,6,A,B,
4—5,6,A,B,
5-6,A,B,
6-4B,
Ai,
151R
故所求概率为1-蕨=狼.
ZoZo
[实力提升]
1.(2024•高考山东卷)为了探讨某班学生的脚长x(单位:厘米).和身高y(单位:厘米)的关系,从该班随
机抽取10名学生,依据测量数据的散点图可以看出y与x之间有线性相关关系,设其回来直线方程为y=6
1010-
22x1=225,£H=I600,£=4
x+a.己知,=,该班某学生的脚长
为24,据此估计其身高为()
A.160B.163
C.166D.170
【答案】C.
【解析】由题意可知P=4x+a,又x=22.5,y=160,因此160=22.5X4+8所以a=70,因此y=4x+
70.当x=24时,尸4X24+70=96+70=166.
2.(2024•陕西质量检测(一))己知一组正数荀,X”xs,X4的方差s2=](xi+M+^+£—16),则数据国十
2,照+2,冬+2,苞+2的平均数为.
答案:4
解析:由方差公式s(XLx)”+(42—x)”+(矛3—x)"+(X4—X)1,
1—
得S?=](荒+■+■+■)—X、
又已知S2=;(X:+'+#+/-16)=;(发+■+■+舅)—4,
所以:2=4,
—1—
所以x=2,故彳[(xi+2)+(至+2)+(^3+2)+(普+2)]=x+2=4.
3.(2024•福州综合质量检测)在国际风帆竞赛中,成果以低分为优胜,竞赛共11场,并以最佳的9场成
果计算最终的名次.在一次国际风帆竞赛中,前7场竞赛结束后,排名前8位的选手积分如下表:
运动竞赛场次总
员1234567891011分
A322242621
B1351104428
C986111228
D784431835
E3125827542
F4116936847
G10121281210771
H12126127121273
(1)依据表中的竞赛数据,比较运动员4与8的成果及稳定状况;
(2)从前7场平均分低于6.5分的运动员中,随机抽取2个运动员进行兴奋剂检查,求至少1个运动员平均
分不低于5分的概率;
(3)请依据前7场竞赛的数据,预料冠亚军选手,并说明理由.
【解析】:(1)由表中的数据,我们可以分别计算运动员/和6前7场竞赛积分的平均数和方差,作为两运
动员竞赛的成果及衡量两运动员稳定状况的依据.
一—1
运动员A的平均分^i=yX21=3,
方差:(3-3)2+(2-3)2X4+(4-3)2+(6-3)2]=2;
—
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度年福建省高校教师资格证之高等教育心理学押题练习试卷B卷附答案
- 2024年度山西省高校教师资格证之高等教育法规题库与答案
- 2024年度年福建省高校教师资格证之高等教育学能力检测试卷B卷附答案
- 2023年有机废水沼气系统投资申请报告
- 第七章 新生儿及患病新生儿的护理课件
- 五年级数学(小数四则混合运算)计算题专项练习及答案
- 体育运动教练岗位招聘面试题与参考回答2024年
- 2024年城市道路施工合作协议
- 产品代理权2024年度专享协议
- 2024专业纪实摄影师服务协议
- 人教版四年级数学上册《角的度量复习课》复习教案
- 通达OA基本功能及使用课件
- 天文学入门一
- 托管班标准化流程
- astm_b盐雾试验标准中文
- Module 5 外研版英语九(上)模块主题写作详解与训练
- 高低压配电室运行巡查表
- 竹荪种植项目可行性研究报告写作范文
- starter安装教程
- 小班综合活动《出生的秘密》
- 制程品质保证权责及工作重点
评论
0/150
提交评论