版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录
概率与统计......................................................................2
模块一:统计..................................................................2
考点1:抽样方法...................................................2
考点2:样本数字特征...............................................4
模块二:线性回归分析.........................................................9
考点3:线性回归..................................................10
模块三:概率.................................................................12
考点4:古典概型..................................................12
考点5:几何概型..................................................13
课后作业:...................................................................14
概率与统计
模块一:统计
简单随机抽样〔而心法
-随机抽样系统抽样(等距抽样)
、分层抽样
频率分布直方图与茎叶图
-用样本估计总正一数字特征平均数
:方差与标准差
考点1:抽样方法
例1.(1)(2019春•龙潭区校级月考)完成下列两项调查:①从某社区70户高收入家庭、
335户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从
某中学的15名艺术特长生中选出3名调查学习负担情况.这两项调查宜采用的抽样方法依
次是()
A.①简单随机抽样,②系统抽样B.①分层抽样,②简单随机抽样
C.①系统抽样,②分层抽样D.①②都用分层抽样
【解答】解:在①中,从某社区70户高收入家庭、335户中等收入家庭、95户低收入家庭
中选出100户,调查社会购买能力的某项指标,
应该采用分层抽样;
在②中,从某中学的15名艺术特长生中选出3名调查学习负担情况.
应该采用的同学虚报的机抽样.
故选:B.
(2)(2019春•浙河区校级月考)为了了解学生学习的情况,某校采用分层抽样的方法从高
一1200人、高二1000人、高三〃人中,抽取90人进行问卷调查.已知高一被抽取的人数
为36,那么高三被抽取的人数为()
A.20B.24C.30D.32
【解答】解:根据题意抽取比例为:<8=二,故总人数为:90x—=3000,
12001003
3
IWJ三被抽取的人数为:——x(3000-1200-1000)=24.
100
故选:B.
(3)(2019春•信州区校级月考)某班有40位同学,座位号记为01,02,40,用下面
的随机数表选取5组数作为参加青年志愿者活动的5位同学的座位号
4954445482173793237887352096
4384263491645724550688770474
4767217633502583921207675086
选取方法是从随机数表第一行的第11列和第12列数字开始,由左到右依次选取两个数字,
则选出来的第5个志愿者的座位号是()
A.09B.20C.37D.38
【解答】解:根据题意,从随机数表第一行的第11列和第12列数字17开始,由左到右依
次选取两个数字,
即为:17,37,23,35,20,...;
则选出来的第5个志愿者的座位号20.
故选:B.
(4)(2019春•香洲区校级月考)一个总体中有600个个体,随机编号为001,002,
600,利用系统抽样方法抽取容量为25的一个样本,总体分组后在第一组随机抽得的编号为
006,则在编号为049与120之间抽得的编号为()
A.056,080,104B.054,078,102C.054,079,104D.056,081,106
【解答】解:样本间隔为600+25=24,
若在第一组随机抽得的编号为006,
则所有号码为6+24(〃-1)=24"-18
则当〃=2时,号码为30,
当“=3时,号码为54,
当〃=4时,号码为78,
当〃=5时,号码为102,
当〃=6时,号码为126,
故在编号为049与120之间抽得的编号为054,078,102,
故选:B.
(5)(2018秋•岳麓区校级月考)将参加夏令营的400名学生编号为:001,002,400,
采用系统抽样的方法抽取一个容量为40的样本,且随机抽得的号码为003,这400名学生
分住在三个营区,从001至I]180在第一营区,从181至1J295在第二营区,从296到400在第
三营区,三个营区被抽中的人数分别为()
A.18,12,10B.20,12,8C.17,13,10D.18,11,11
【解答】解:根据系统抽样特点,抽样间隔为幽=10,被抽到号码/=10左+3,keN.
40
由题意可知,第一营区可分为18个小组,每组抽取1人,共抽取18人,
由第二营区的编号为181到295,可知18掇10左+3295,keN,可得18领上29,
因此第二营区应有12人,第三营区有10人,所以三个营区被抽中的人数分别为18,12,
10.
故选:A.
考点2:样本数字特征
例2.(1)(2019春•博望区校级月考)踢建子是中国民间传统的运动项目之一,起源于汉朝,
至今已有两千多年的历史,是一项简便易行的健身活动.某单位组织踢毯子比骞,把20人
平均分成甲、乙两组,并把每人在1分钟内踢建子的数目用茎叶图记录如下(其中中间的数
字表示十位数,两侧的数字表示个位数).则下列判断正确的是()
甲组乙组
8722
01318
31545774
20530
265
A.甲组中位数大,乙组方差大B.甲组方差大,乙组极差大
C.甲组平均数大,乙组方差大D.甲组极差大,乙组中位数大
【解答】解:依题意,甲的中位数为空士生=44,乙的中位数为竺±土=46
22
——1
甲的平均数为峰=而(27+28+31+30+45+41+43+50+52+62)=40.9,
一I
乙的平均数为:殳=—(22+30+38+44+45+47+47+50+53+65)=44.2,
甲的极差为:62-27=35,
乙的极差为:65-22=43.
从茎叶图看,乙更集中,甲更分散,故甲的方差更大,
故选:B.
(2)(2019春•南陵县校级月考)从某地区年龄在25~55岁的人员中,随机抽出100人,
了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确
的是()
00o
0.05
o.oifJHJILLL^
30354C45so554^rr
A.抽出的100人中,年龄在40~45岁的人数大约为20
B.抽出的100人中,年龄在35~45岁的人数大约为30
C.抽出的100人中,年龄在40~50岁的人数大约为40
D.抽出的100人中,年龄在35~50岁的人数大约为50
【解答】解:年龄在40~45岁的频率为:
1-<0.01+0.05+0.06+0.02+0.02)*5=0.2,
二.抽出的100人中,年龄在40~45岁的人数大约为:100x0.2=20人,
年龄在35~45岁频率为:
1-(0.01+0.05+0.02+0.02)x5=0.5,
,抽出的100人中,年龄在35~45岁的人数大约为100*0.5=50人,
故A正确,B,C,。均错误.
故选:A.
(3)(2019春•天元区校级月考)在一次200千米的汽车拉力赛中,50名参赛选手的成绩全
部介于13分钟到18分钟之间,将比赛成绩分为五组:第一组[13,14),第二组[14,15),
…,第五组[17,18],其频率分布直方图如图所示,若成绩在口3,15)之间的选手可获奖,
则这50名选手中获奖的人数为()
【解答】解:由频率分布直方图得成绩在[13,15)之间的频率为:
1-(0.38+0.32+0.08)=0.22,
.•.这50名选手中获奖的人数为:50x0.22=11.
故选:D.
(4)(2019春•洪北区校级月考)从某地区随机抽取100名高中男生,将他们的体重(单位:
侬)数据绘制成频率分布直方图(如图).若要从体重在[60,70),[70,80),[80,90]三
组内的男生中,用分层抽样的方法选取12人参加一项活动,再从这12人中选两人当正、副
队长,则这两人体重不在同一组内的概率为()
【解答】在[60,70),[70,80),[80,90]三组内的男生中抽取的人数之比为
0.3:0.2:0.1=3:2:1,
故这三组内的男生中抽取的人数分别为12x—--=6,12x---=4,12x—1—=2
3+2+13+2+13+2+1
所有的选法有a=66种,
这两人身高不在同一组内的选法有6x4+6x2+4x2=44种,
故这两人身高不在同一组内的概率为2=2
663
故选:D.
(5)(2019春•和平区校级月考)在某次数学测验后,将参加考试的500名学生的数学成绩
制成频率分布直方图(如图),则在该次测验中成绩不低于100分的学生数是()
【解答】解:由频率分布直方图得:
在该次测验中成绩不低于100分的学生的频率为:
1-(0.012+0.018+0.030)x10=0.4,
・•・在该次测验中成绩不低于100分的学生数为:
500x0.4=200.
故选:C.
(6)(2019春•叶集区校级月考)已知数据玉,%oi9的平均数是100,则2占+1,2X2+1,
...2尤2019+I的平均数是()
A.100B.2019C.200D.201
【解答】解:数据为,9…Woi9的平均数是1。。,
贝1]2玉+1,2x,2+1,…2W019+I的平均数是2x100+1=201.
故选:D.
(7)(2019春•袁州区校级月考)甲乙两名同学6次考试的成绩统计如图,甲乙两组数据的
平均数分别为焉,与,方差分别为端,砖则()
23456曲)
A.无甲〉生,焉<cr:B.海>尤乙,端〉七
C.x甲<尤乙,b<b乙D■尤甲<尤乙,b甲>b7、
【解答】解:甲乙两组数据的平均数分别为焉,与,方差分别为端,(T£,
由甲乙两名同学6次考试的成绩统计如图,知:
甲组数据靠上,乙组数据靠下,
甲组数据相对集中,乙组数据相对分散分散布,
由甲乙两组数据的平均数分别为蒲,看,方差分别为
端,cr|,
1f寸x用>无乙,b甲<b乙.
(8)(2019春•江城区校级月考)某高校调查了200名学生每周的自习时间(单位:小时),
制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为
[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200
名学生中每周的自习时间不少于22.5小时的人数是—.
【解答】解:由频率分布直方图得:
这200名学生中每周的自习时间不少于22.5小时的频率为:
1-(0.02+0.10)x2.5=0.7,
这200名学生中每周的自习时间不少于22.5小时的人数为:
200x0.7=140.
故答案为:140.
模块二:线性回归分析
1.两个变量之间的关系:函数关系与相关关系.
相关关系:变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定
随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关
系叫做相关关系.
2.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;
反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.
3.散点图:将样本中的〃个数据点(%'=2,…,力描在平面直角坐标系中.
散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个
变量的关系.
散点图可以判断两个变量之间有没有相关关系.
4.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分
析就是寻找相关关系中这种非确定关系的某种确定性.
回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性
相关关系,这条直线叫做回归直线.
5.最小二乘法:
记回归直线方程为:y=a+bx,称为变量y对变量X的回归直线方程,其中6叫做回归系
数.
亍是为了区分y的实际值y,当X取值无,时,变量y的相应观察值为%,而直线上对应于尤,
的纵坐标是%=。+bxt.
设x,y的一组观察值为(%,%),i=l,2,…,n,且回归直线方程为9=a+bx,
当x取值七时,丫的相应观察值为%,差%-白刻画了实际观察值外与回归直线上相应点的
纵坐标之间的偏离程度,称这些值为离差.
我们希望这〃个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点.
记,回归直线就是所有直线中。取最小值的那条.这种使“离差平方和
Z=1
为最小”的方法,叫做最小二乘法.
2(%一尤)(%-y)X%%-nxy
可以得到的计算公式为B--------z——=十-------a=y-bx,其中
£(%-尤了0;_心)2
z=l1=1
_1»_1«
x=-X%,一由此得到的直线9=4+意就称为回归直线,其中方,B分别为
n,=in,=i
。的估计值.
由&=歹-加知,回归直线一定过平均值点,即一定过(土,丁).
考点3:线性回归
例3.(1)(2009海南3)对变量x,y有观测数据(%,%)(,=1,2,•••,10),得散点图1;
对变量M,v有观测数据他,匕)(力=1,2,…,10),得散点图2.由这两个散点图可以判断
yV
30
60
2550
2040
1530
1O20
510
01234567X0123456711
图1图2
A.变量x与y正相关,〃与v正相关B.变量x与y正相关,M与v负相关
C.变量x与y负相关,a与v正相关D.变量x与y负相关,〃与v负相关
【解答】C
(2)(2019春•渝水区校级月考)某产品的广告费用x与销售额y的统计数据如表:
广告费用X(万元)1245
销售额y(万元)6142832
根据上表中的数据可以求得线性回归方程£=〃+&中的g为6,据此模型,当销售额为80
万元时预报广告费用为()
A.13万元B.14万元C.15万元D.16万元
【解答】解:钎虫产=3,尹心!%=2。'
则样本中心点为(3,20),
又成=6,<2=y-fox=20-6x3=2,
则线性回归方程为$=6x+2,取y=80,可得x=13(万元).
故选:A.
(3)(2019春•红塔区校级月考)某车间为了规定工时定额,需要确定加工零件所花费的时
间,为此进行了5次试验,根据收集到的数据(如表),
零件数X个1020304050
加工时间y(miri)62附酬758189
由最小二乘法求得回归直线方程j=0.68.x+54.4.
由于后期没有保存好,导致表中有一个数据模糊不清,请你推断出该数据的值为()
A.67B.68.2C.68D.67.2
【解答】解:设表中模糊看不清的数据为沉,
由表中数据得:于=g*(10+20+30+40+50)=30,
1777+2
y=-x(62+m+75+81+89)=61+^—,
由于由最小二乘法求得回归方程(=0.68%+54.4,
将元=30,y=61+3代入回归直线方程,解得机=67.
5
故选:A.
(4)(2019春•龙潭区校级月考)已知x与y之间的几组数据如表:则y与x的线性回归方
程9=取+&必过点()
X0123
y0257
37
A.(1,2)B.(2,6)C.(|,;)D.(3,7)
1317
【解答】解:元=7(°+1+2+3)=5,9=[(0+2+5+7)=/,
即y与x的线性回归方程y=bx+a必过点(|,1),
故选:C.
(5)(2019春•葫芦岛月考)两个线件相关变量x,y,满足如下关系
24568
y2.24.34.86.57.2
则y与x的线性问归直线-定过其样本点的中心,其坐标为()
A.(5,5)B.(4,5)C.(4,4)D.(5,4)
【解答】解:线性回归直线的样本点的中心为(无,歹),
_2+4+5+6+8「_2.2+4.3+4.8+6.5+7.2「
':x=--------------------=5,y=--------------------------------=5,
55
,线性回归直线的样本点的中心为(5,5).
故选:A.
模块三:概率
随机事优
[基本事件
[事件)一:互斥事件与对立事件
、事件的交与事件的并
概率的统计定义
互斥事件的概率加法公式
概率on:
特征:有限性与等可能性
1古典概型,一概率的古典定义
I儿何概型]
考点4:古典概型
例4.(1)(2019春•博望区校级月考)某工厂生产的A,B,C三种不同型号的产品数量
之比为2:3:5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C
三种产品中抽出样本容量为〃的样本,若样本中A型产品有10件,则〃的值为()
A.15B.25C.50D.60
【解答】解:某工厂生产的A,B,C三种不同型号的产品数量之比为2:3:5,
用分层抽样的方法从该工厂生产的A,B,C三种产品中抽出样本容量为"的样本,
...样本中A型产品有10件,
(2)(2018秋•静宁县校级月考)从一箱产品中随机地抽取一件,设事件4={抽到一等品},
事件B={抽到二等品},事件C={抽到三等品},且已知尸(A)=0.65,P(B)=0.21
P(C)=0.1.则事件“抽到的是二等品或三等品”的概率为()
A.0.7B.0.65C.0.35D.0.3
【解答】解:从一箱产品中随机地抽取一件,设事件A={抽到一等品},事件3={抽到二
等品},事件C={抽到三等品},
P(A)=0.65,P(B)=0.2,P(C)=0.1.
则事件“抽到的是二等品或三等品”的概率为:
P(B]JC)=P(B)+P(C)=0.2+0.1=0.3.
故选:D.
(3)(2017秋•翠屏区校级月考)甲、乙两人下棋,两人下成和棋的概率是工,甲获胜的概
6
率是g,则甲不输的概率为()
A.-B.-C.-D.-
5263
【解答】解:♦.■甲、乙两人下棋,两人下成和棋的概率是工,甲获胜的概率是1,
63
,甲不输的概率为夕=工+工=
632
故选:B.
考点5:几何概型
例5.(1)据报告,俄罗斯人造卫星Kosmos-1220或已于2014年2月16日坠落地球,由于
坠落地点无法确定,可能会掉在任何地方,专家警告可能会非常危险.在地球上海洋占70.9%
的面积,陆地占29.1%的面积,你认为卫星落在陆地的概率约为,落在我国国土内
的概率为.(地球的面积约为5.1亿平方千米)(结果保留两位有效数字)
【解答】29.1%,0.019.
(2)已知x是卜5,5]上的一个随机数,则使x满足/一工一2力0的概率为.
【解答】-
10
(3)一个正三角形的外接圆的半径为1,向该圆内随机投一点尸,点P恰好落在正三角形
外的概率是
【解答】I一空
4兀
课后作业:
1.(2017春•滩溪县期末)现有以下两项调查:①某装订厂平均每小时大约装订图书362册,
要求检验员每小时抽取40册图书,检查其装订质量状况;②某市有大型、中型与小型的
商店共1500家,三者数量之比为1:5:9.为了调查全市商店每日零售额情况,抽取其中
15家进行调查.完成①、②这两项调查宜采用的抽样方法依次是()
A.简单随机抽样法,分层抽样
B.分层抽样法,简单随机抽样法
C.分层抽样法,系统抽样法
D.系统抽样法,分层抽样法
【解答】解:在①中,某装订厂平均每小时大约装订图书362册,
要求检验员每小时抽取40册图书,检查其装订质量状况,
因为时间间隔相等,都是1小时,故应该利用系统抽样;
在②中,某市有大型、中型与小型的商店共1500家,三者数量之比为1:5:9.
为了调查全市商店每日零售额情况,抽取其中15家进行调查.
因为大型、中型与小型的商店层次分明,故应该采用分层抽样.
故选:D.
2.(2019•唐山三模)为了调查某工厂生产的一种产品的尺寸是否合格,现从500件产品中
抽出10件进行检验先将500件产品编号为000,001,002,499,在随机数表中任选一
个数开始,例如选出第6行第8列的数4开始向右读(为了便于说明,下面摘取了随机数表,
附表1的第6行至第8行),即第一个号码为439,则选出的第4个号码是()
162277943949544354821737932378
844217533157245506887704744767
630163785916955567199810507175
A.548B.443C.379D.217
【解答】解:选出第6行第8列的数4开始向右读(为了便于说明,下面摘取了随机数表,
附表1的第6行至第8行),
即第一个号码为439,则选出的前4个号码是:439,495,443,217,
.•.选出的第4个号码
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年新版中国银亮钢丝项目可行性研究报告(甲级资质)
- 2024-2030年新版中国不锈钢预成方丝弓项目可行性研究报告(甲级资质)
- 科技投资合作协议合同
- 加工制作合同(31篇)
- 企业产品升级换代策略报告
- 建筑结构工程师述职报告
- 2024年养老项目规划申请报告模稿
- 标准合同协议别墅购销合同
- 2024年买卖合同担保条款在跨境贸易中的应用与风险防范3篇
- 2024年度区块链技术研发与应用于合同2篇
- Unit 1 Making friends Part B Lets learn(说课稿)-2024-2025学年人教PEP版(2024)英语三年级上册
- 湖南省2025届高三九校联盟第一次联考 生物试卷(含答案详解)
- 广东省广州市越秀区2022-2023学年八年级上学期期末历史试题(含答案)
- 2024年初级招标采购从业人员《招标采购专业实务》考前必刷必练题库600题(含真题、必会题)
- 辽宁省大连市沙河口区2022-2023学年八年级上学期物理期末试卷(含答案)
- 腰穿术护理常规
- 2021-2022学年统编版道德与法治五年级上册全册单元测试题及答案(每单元1套共6套)
- 2024政府采购评审专家知识题库(含答案)
- 中国文化概论智慧树知到答案2024年绍兴文理学院
- 人力资源外包投标方案
- GB/T 3863-2008工业氧
评论
0/150
提交评论