高中数学人教B版(2019)选择性必修第二册第四章《概率与统计》知识点清单_第1页
高中数学人教B版(2019)选择性必修第二册第四章《概率与统计》知识点清单_第2页
高中数学人教B版(2019)选择性必修第二册第四章《概率与统计》知识点清单_第3页
高中数学人教B版(2019)选择性必修第二册第四章《概率与统计》知识点清单_第4页
高中数学人教B版(2019)选择性必修第二册第四章《概率与统计》知识点清单_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

新教材人教B版2019版数学选择性必修第二册

第四章知识点清单

目录

第四章概率与统计

4.1条件概率与事件的独立性

4.1.1条件概率

4.1.2乘法公式与全概率公式

4.1.3独立性与条件概率的关系.

4.2随机变量

4.2.1随机变量及其与事件的联系

4.2.2离散型随机变量的分布列

4.2.3二项分布与超几何分布

4.2.4随机变量的数字特征

4.2.5正态分布

4.3统计模型

4.3.1-元线性回归模型

4.3.2独立性检验

4.4数学探究活动:了解高考选考科目的确定是否与性别有关

第四章概率与统计

4.1条件概率与事件的独立性

4.1.1条件概率

一、条件概率

1.条件概率的概念:设A,B为两个事件,一般地,当事件B发生的概率大于。时

(即P(B)>0),已知事件B发生的条件下事件A发生的概率,称为条件概率,记作

P(A|B),而且P(A|B)=端,.

注意:P(A|B)与P(B|A)的意义不一样,一般情况下,它们也不相等.

二、条件概率的性质

假设A,B,C都是事件,且P(A)>0,则条件概率满足如下性质:

(1)P(B|A)G[O,1];

(2)P(A|A)=1;

(3)如果B与C互斥,则P((BUC)|A)=P(B|A)+P(C|A).

三、条件概率的求解

1.利用定义,分别求P(A)和P(AAB),得P(B|A)二噜黑,这是通用的求条件概率的

方法.

2.借助古典概型的概率公式,先求事件A包含的样本点个数n(A),再求在事件A发

生的条件下事件B包含的样本点个数,即n(AB),得P(B|A)=喘.

2/19

4.1.2乘法公式与全概率公式

一、乘法公式

1.由条件概率的计算公式P(B|A尸霭可知,P(BA)=P(A)P(B|A).一般地,这个结论

称为乘法公式.

2.乘法公式的推广

假设A表示事件,匚1,2,3,且P(A1)>0,P(A1A2)>0,则

P(A1A2A3)=P(A1)-P(A2|A1)P(A3|A1A2),其中P(A3AA2)表示已知Al与A2都发生时A3发生

的概率,而P(AiA2A3)表示Ai,A2,A3同时发生的概率.

二、全概率公式

L一般地,如果样本空间为Q,而A,B为事件,则P(B):P(A)P(B|A)+P(1)P(B|彳).这

称为全概率公式.

2,全概率公式的推广

若样本空间Q中的事件A],A2,4满足:

⑴任意两个事件均互斥,即AA尸i,j=l,2,…,n,iXj;

(2)Ai+A2T—4An二Q;

(3)P(A)〉0,i=l,2,n.

则对Q中的任意事件B,都有B=BA1+BA2+-+BAn,

且P(B)二毙iP(BA尸毙iP(ADP(B|Ai).

三、贝叶斯公式*

P(A)P(B|A)_P(A)P(B|A)

1.一般地,当1〉P(A)〉O且P(B)〉O时,有P(A|B)=

P(B)-P(A)P(B|A)+P(A)P(B|A)

这称为贝叶斯公式.

3/19

2.贝叶斯公式的推广

若样本空间Q中的事件A],A2,A,、满足:

⑴任意两个事件均互斥,即AAi,i,j=l,2,…,n,iXj;

(2)Ai+A2T—卜An=Q,

(3)l>P(Ai)>0,i=l,2,…,n.

则对Q中的任意概率非零的事件B,有P(AJB)二等给=JR黑窑A)

四、乘法公式及其应用

1.乘法公式实质上是条件概率公式的变形,当P(A)>0时,已知P(A),P(B|A),P(AB)

中的两个就可以求得第三个.

2.在利用公式P(AiA2-An)=P(A1)P(A2|A1)P(A3|AiA2)--P(An|A1A2-An-i)(P(A1)>0,P(AA…

AQ>0)计算概率时,注意根据题意正确表示出相关事件并求出其中涉及的概率.

五、全概率公式的应用

全概率公式针对的是某一个过程中已知条件求最后结果的概率,解题步骤如下:

⑴求划分后的每个小事件的概率,即P(A,),i=1,2,n;

⑵求每个小事件发生的条件下,事件B发生的概率,即P(B|A);

⑶利用全概率公式计算P(B),即P(B)=通P(A,)P(B|A,).

六、贝叶斯公式的应用*

贝叶斯公式是在条件概率的基础上寻找事件发生的原因,在运用贝叶斯公式时,一般已知和

未知条件如下:

(1)A的多种情况中到底哪种情况发生是未知的,但是每种情况发生的概率已知,即P(A)已知;

⑵事件B是已经发生的确定事实,且A的每种情况发生的条件下B发生的概率已知,即P(B|A)已

知;

⑶P(B)未知,需要使用全概率公式计算得到;

⑷求解的目标是用A的某种情况A的无条件概率求其在B发生的条件下的有条件概率P(A,|B).

4/19

4.1.3独立性与条件概率的关系.

一、事件的相互独立性

当P(B)>0时,A与B独立的充要条件是P(A|B)=P(A).

二、相互独立事件的概率的求解

求相互独立事件同时发生的概率的方法

⑴利用相互独立事件的定义直接求解.

⑵正面计算较烦琐或难以入手时,可从其对立事件入手计算.

4.2随机变量

4.2.1随机变量及其与事件的联系

4.2.2离散型随机变量的分布列

一、随机变量

1.定义:一般地,如果随机试验的样本空间为0,而且对于Q中的每一个样本点,

变量X都对应有唯一确定的实数值,就称X为一个随机变量.随机变量所有可能的

取值组成的集合,称为这个随机变量的取值范围.

2.表示:随机变量一般用大写英文字母x,Y,z,…或小写希腊字母[n,4…表示

3.分类

⑴离散型随机变量:如果随机变量X的所有可能的取值是可以一一列举出来的,则

称X为离散型随机变量.

⑵连续型随机变量:如果随机变量X的取值范围包含一个区间,则称X为连续型随

机变量.

5/19

二、随机变量之间的关系

一般地,如果X是一个随机变量,a,b都是实数且aWO,则丫=aX+b也是一个

随机变量.由于X=t的充要条件是丫=at+b,因此P(X=t)=P(Y=at+b).

三、离散型随机变量的分布列

1.⑴定义:一般地,当离散型随机变量X的取值范围是{Xl,X2,X.时,如果对任

意k£{l,2,n),概率P(X二Xk尸Pk都是已知的,则称X的概率分布是已知的.离

散型随机变量X的概率分布可以用表格表示为

这个表格称为X的概率分布或分布列.

⑵离散型随机变量X的概率分布还可以用图1或图2来直观表示,其中,图1中,

Xk上的矩形宽为1、高为po因此每个矩形的面积也恰为p二图2中,Xk上的线段长

为Pk.P,

Pk

Pn

/-I

x\芍…X匹既...

X,...xnx

2.性质

(l)Pk、O,k=l,2,n;

(2)Sk=iPk=pi+p2+-+pn=l.

四、两点分布

1.两点分布的定义

一般地,如果离散型随机变量X的分布列为

X10

PP1-P

其中0<p<l,则称离散型随机变量X服从参数为p的两点分布(或0-1分布).

6/19

2.伯努利试验

一个所有可能结果只有两种的随机试验,通常称为伯努利试验.因此两点分

布也常称为伯努利分布,两点分布中的P也常被称为成功概率.

五、离散型随机变量的分布列

1.求离散型随机变量X的分布列的步骤

⑴理解随机变量X的意义,写出随机变量X可能取的全部值;

⑵求随机变量X取每个值的概率;

⑶写出随机变量X的分布列.

2.两个相关的随机变量的分布列

一般地,若X是随机变量,则Y=f(X)也是随机变量.已知随机变量X的分布列,

求随机变量Y=f(X)的分布列,其关键是弄清X取每个值时相对应的Y的值,若f(X)的

取值出现重复,则需要把它们的相应概率相加,所求即为Y的取值概率.

4.2.3二项分布与超几何分布

一、二项分布

1.n次独立重复试验

在相同条件下重复n次伯努利试验时,人们总是约定这n次试验是相互独立的,此

时这n次伯努利试验也常称为n次独立重复试验.

2.二项分布

一般地,如果一次伯努利试验中,出现“成功”的概率为P,记q=l-p,且n次独

立重

复试验中出现“成功”的次数为X,则X的取值范围是{0,1,k,n),而且

P(X=k)=Cjpkqn-k,k=0,1,n,因此X的分布列如下表所示.

X01kn

7/19

p喘p°qn禺pd"C轲qn”CJJP'V

8/19

由于表中的第二行恰好是二项展开式(q+p)三C:p°q"+禺pd、…+C&pkqn"+…+

喘p"q°中对应项的值,因此称X服从参数为n,p的二项分布,记作X~B(n,p).

注意:两点分布是一种特殊的二项分布,即n=l时的二项分布.

二、超几何分布

一般地,若有总数为N件的甲、乙两类物品,其中甲类有M件(M<N),从所有

物品中随机取出n件(nWN),则这n件中所含甲类物品数X是一个离散型随机变

量,X能取不小于t且不大于s的所有自然数,其中s是M与n中的较小者,t在n

不大于乙类物品件数(即门忘1\1-171)时取0,否则t取n减乙类物品件数之差(即t=n-

(N-M)),而且P(X=k)=CM泮M,k=t,t+1,…,s,则称X服从参数为N,n,M的

超几何分布,记作X~H(N,n,M).

特别地,如果X〜H(N,n,M)且n+M-NWO,则X能取所有不大于s的自然数,此

时X的分布列如下表所示.

X01kS

「0「nplpn—1「kpn-k「Sr-n-s

PCMCN-M

rnrnrn4

CNCN

三、二项分布

1.利用二项分布模型解决实际问题的一般步骤

⑴根据题意设出随机变量;

⑵分析随机变量是否服从二项分布;

⑶若服从二项分布,则求出参数n和p的值;

⑷根据需要列出相关式子并解决问题.

9/19

四、超几何分布

1.利用超几何分布模型解决实际问题的一般步骤

⑴辨模型:结合实际情境分析是不是不放回抽样,且所求概率分布问题是由差异明

显的两部分组成,如“男生、女生”“正品、次品”等,或可转化为具有明显差异的

两部分,只有具有该特征的概率模型才可能为超几何分布模型.

⑵算概率:可以直接借助公式P(X二k)二破沪求解,也可以利用排列组合及概率

知识求解,借助公式求解时应明确参数M,N,n,k的含义.

⑶写分布列:把求得的概率通过表格表示出来.

4.2.4随机变量的数字特征

一、离散型随机变量的均值

1.定义:一般地,如果离散型随机变量x的分布列如表所示.

XX1x2XkXn

PPlP2PkPn

则称E(X)=XR+X2P2+-+XnPn=IXiXR为离散型随机变量X的均值或数学期望(简称

期望).离散型随机变量的均值刻画了随机变量的平均取值.

2.几个常见均值的计算公式

⑴若随机变量X服从参数为p的两点分布,则E(X)=p;

⑵若随机变量X服从参数为np的二项分布,即X〜B(n,p),则E(X)二np;

⑶若随机变量X服从参数为N,n,M的超几何分布,即X~H(N,n,M),则E(X)=詈;

⑷若X与丫都是随机变量,且丫=aX+b(a卢0),则E(Y)=E(aX+b)=aE(X)+b.

10/19

二、离散型随机变量的方差

1,定义:如果离散型随机变量X的分布列如下表所示.

XX1X2XkXn

PPlP2PkPn

则称D(X)=[XLE(X)]2p]+[x2-E(X)]2P2+-+[Xn-E(X)]2Pk£匕[Xi-E(X)]2p为离散型随

机变量x的方差,而为离散型随机变量x的标准差.

离散型随机变量的方差和标准差反映了随机变量的离散程度(或波动大小).

2222

2.D(X)二%1[xt-E(X)]pFSilix?p,-[E(X)]=E(X)-[E(X)].简记为“方差等于平方的

均值减去均值的平方”.

3.几个常见方差的计算公式

⑴若随机变量X服从参数为p的两点分布,则D(X)=p(l-p).

⑵若随机变量X服从参数为n,p的二项分布,即X~B(n,p),则D(X)=np(l-p).

⑶若X与丫都是离散型随机变量,且丫=aX+b(a尹0),则D(Y)=D(aX+b)=a?D(X).

三、求离散型随机变量X的数学期望、方差(标准差)

1.求离散型随机变量X的数学期望、方差(标准差)的一般步骤

(1)理解X的意义,并写出X的全部取值.

⑵求出X取每个值的概率.

(3)写出X的分布列(有时也可省略).

⑷利用定义求E(X),D(X)(VD(X)).

在随机变量X?的均值比较好计算的情况下,运用关系式D(X)=E(X2)-[E(X)F不失为

一种比较实用的方法.

2.求离散型随机变量的均值与方差(标准差)时,一般先分析随机变量的分布特征,

看其是不是常见的特殊分布,若是,直接用公式求解;若不是,按求均值与方差(标准差)的一般步

骤进行求解.

3.已知随机变量£的均值、方差,求W的一次函数n=aW+b(afO)的均值、方差,可直接用W的均

值、方差的性质求解.

11/19

4.2,5正态分布

一、正态曲线

1.正态曲线的概念

一般地,称Cp(x)=^4^e-(202(其中产E(x),即X的均值;o=JD(X),即X的

标准差)对应的图象为正态曲线(或钟形曲线),(p(x)也常常记为(pM.o(x).

2.正态曲线的性质

⑴正态曲线关于x=n对称(即以决定正态曲线对称轴的位置),具有中间高、两边低

的特点;

⑵正态曲线与x轴所围成的图形面积为1;

(3)。决定正态曲线的“胖瘦”:。越大,说明标准差越大,数据的集中程度越弱,所

曲线越"胖1•。越小,说明标准差越小,数据的集中程度越强,所以曲线越“瘦”.

二、正态分布

1.正态分布的概念

一般地,如果随机变量X落在区间[a,b]内的概率,总是等于仇,0(x)对应的正态曲线

与x轴在区间[a,b]内围成的面积,则称X服从参数为口与。的正态分布,记作

X〜Nga2),此时仇,°(x)称为X的概率密度函数.

2.若X〜Ngo2),贝IJ

P(|j-o^X^|j+a)~68.3%,

P(H-2QWXW1+2CJ)=95.4%,

P(H-3oWXW|j+3o户99.7%.

3.“3o原则”

由P(n-3oWXW|j+3o尸99.7%知,随机变量X约有99.7%的可能会落在距均值3个

标准差的范围之内,也就是说只有约0.3%的可能会落入这一范围之外(这样的事件可

12/19

看成小概率事件),这一结论通常称为正态分布的“3。原则”

13/19

三、标准正态分布

1.以=0且0=1的正态分布称为标准正态分布,记作X〜N(0,1).

2.任意正态分布丫〜N(|j,4)都可以通过X二丫转化为标准正态分布X〜N(0,1).

3.如果X~N(0,1),那么对于任意a,通常记①⑻二P(X<a),且有如下性质:

(1)0(-a)—1-0(a),

(2)P(|X|<a)=2ch(a)-l;

(3)P(|X|>a)=2[l-0)(a)].

四、正态分布的概率问题

在正态分布下求概率的关键在于恰当地利用正态曲线的对称性,把待求概率的

区间转化为已知概率的区间.当条件中无已知概率时,则要将区间转化为三个特殊区

间:[上0,|d+o],[|J-2o,|j+2o],[|J-3a,n+3o],利用随机变量X在这三个特殊区

间取值的概率进行计算.

一般地,若随机变量X服从正态分布N(u,o2),则

(l)P(X^a)=l-P(X<a);

⑵对任意的实数a,有P(XWn-a);P(X2n+a);

(3)P(aWXWb)=P(XWb)-P(X<a).

五、正态分布的实际应用

利用服从正态分布N(露V)的随机变量x在三个特殊区间上取值的概率,可以

解决两类实际问题:

一类是估计在某一范围内的数量,具体方法是先确定随机变量在该范围内取值的

概率,再乘样本容量.

另一类是利用“3。原则”作决策.决策步骤如下:①确定一次试验中取值a是否落

入范围63o,口+3o]内;②作出判断,若a£[|a-3o,n+3o],则接受统计假设,

若a用口-3o,pi+3o],则拒绝统计假设.

14/19

4.3统计模型

4.3.1一元线性回归模型

一、相关关系

1.相关关系:两个变量之间有关系,但没有达到可以互相决定的程度,它们之间的

关系带有一定的随机性,这种关系称为相关关系.

2.散点图:将成对样本数据用平面直角坐标系中的点表示出来,由这些点组成的统

计图称为散点图.

3.线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之

间的关系可以近似地用一次函数来刻画,则称x与y线性相关.如果一个变量增大,

另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变

量大体上减少,则称这两个变量负相关.

二、回归直线方程

1.回归直线方程

一般地,已知变量x与y的n对成对数据(x,y,),i=l,2,3,…,n.任意给定一个

一次函数y=bx+a,对每一个已知的x,由直线方程可以得到一个估计值,^bx+a,

AAAAAAA

如果一次函数y=bx+a能使残差平方和即EL】(yi-yj取得最小值,则y=bx+a称为y

关于x的回归直线方程,对应的直线称为回归直线.因为是使得平方和最小,所以其

中涉及的方法称为最小二乘法.

在回归直线方程〉£+3中,/前¥建(安空.”「吵,;.y.bx,其中,赢

乙i=i2ui=ixj—nx

为回归系数,实际上也就是回归直线方程的斜率.

2.回归直线方程的性质

⑴回归直线一定过点区y).

AA

(2)y与x正相关的充要条件是b>0,v与x负相关的充要条件是b<0.

(3)证勺实际意义:当x增大一个单位时,•增大1个单位.

15/19

三、相关系数

1.对于变量X与y的n对成对数据(X,y,),i=l,2,3,n,一般用

「I'匕(%-初力一刃'随修力一网来衡量丫与*的线性相关性强

J次](Xi-X)2Zn=i(yi-y)2J(%]X2-nx2)(2n=iy2_ny2)

弱,这里的r称为线性相关系数,简称为相关系数.

2.相关系数的性质

(l)|r|^l,且y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0.

(2)|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没

有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线性相关性越

强,也就是得出的回归直线方程越有价值.

(3)|r|-l的充要条件是成对数据构成的点都在回归直线上.

四、非线性回归

如果具有相关关系的两个变量x,y不是线性相关关系,那么称为非线性相关关

系,所得到的方程称为非线性回归方程(也简称为回归方程).

一般地,非线性回归方程的曲线类型可以通过作出散点图进行猜测,而回归方

程有时可以通过变量替换后,借助求回归直线的过程确定.

五、两个变量相关性的判断

1.判断两个变量相关性的方法

⑴利用散点图判断:通过散点图观察点的分布是否存在一定的规律,若点大致在一

条直线附近摆动,则对应变量线性相关,否则不具有线性相关关系.当线性相关时,

若点自左向右呈上升趋势,则变量间具有正相关关系;若点自左向右呈下降趋势,

则变量间具有负相关关系.

⑵利用样本相关系数判断:样本相关系数r是从数值上来判断变量间的线性相关程

度,是定量分析法.川刻画了样本点集中于某条直线的程度.川越接近L散点图中的

样本点分布越接近一条直线,两个变量的线性相关程度越强.

16/19

六、回归直线方程的求解与应用

1.求回归直线方程中系数的方法

⑴公式法:利用公式,求出b,a.

(2)待定系数法:利用回归直线过样本点的中心(见。求系数.

2.回归直线方程的应用

⑴利用回归直线方程进行预测:把回归直线方程看作一次函数,求函数值.

⑵利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数

七、非线性回归

1.建立非线性回归模型的基本步骤

⑴确定研究对象,明确涉及的变量;

⑵画出确定好的变量间的散点图,观察它们之间的关系(是否存在非线性关系);

⑶由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数模

型、指数函数模型、对数函数模型等);

⑷通过换元,将非线性回归方程模型转化为线性回归方程模型;

⑸按照公式计算回归直线方程中的参数,得到回归直线方程;

⑹消去新元,得到非线性回归方程.

2.常见的非线性回归方程的转换

曲线方程曲线(曲线的一部分)变换公式变换后的线性函数

y=axbF6>16=1c=lna,u=c+bv

丁「()</«:

0\ix0\iX

(a>0,6>0)(a>0,6<0)

y=aebxyc=lna,u=c+bx

aa

0X()X

(al>0,6>0)(a:>0,6<0)

17/19

Jl

byc=lna,u=c+bv

y=aexa

a

0x()\X

a>0,6>0)(a>0,6<0)

y=a+blnxv=lnx

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论