版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
苏教版2019版高考数学复习:选择性必修第二册全册知识点清
单
第9章统计知识点清单
目录
第9章统计
9.1线性回归分析
9.2独立性检验
第1页共42页
第9章统计
9.1线性回归分析
一、变量间的相关关系
1.两个变量的关系
分类函数关系相关关系
特征两变量具有确定性关系两变量没有确定性关系
2.相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.
3.散点图
将样本中的n个数据构成的点(丸y,)(i=l,2,3,…,n)描在平面直角坐标系中得到的
图形称为散点图.
4.线性相关关系
散点图中的点散布在一条直线附近,将具有这种特性的相关关系称为线性相关关系.
5.正相关与负相关
具有相关关系的两个变量的散点图如果呈从左下向右上方向发展的趋势,称这两个变
量之间正相关,如果呈从左上向右下方向发展的趋势,则称这两个变量之间负相关.
二、相关系数
1.对于变量x与y的n对数据(x“y,)(i=L2,3,…,n),一般用
r=X-i(Xi-幻(yi-刃________nZ-iXiyi-(£1iXi)(£4iYi)__________
粗匕(应一幻2也(%_"xf-GZ%)2],£匕并一(£匕丽
来衡量y与X的线性相关强弱,这里的r称为相关系数.
2.相关系数r具有的性质
Q)-lWrWl;
⑵r>0时y与x呈正相关关系,r<0时y与x呈负相关关系;
第2页共42页
⑶|r|越接近1,y与x相关的程度就越强,川越接近0,y与x相关的程度就越弱.
通常情况下,当|r|>0.5时,认为线性相关关系显著;当3时,认为几乎没有线
性相关关系.
三、线性回归方程
1.线性回归模型
散点图上的一些点在一条直线附近,但并不都在这条直线上.也就是说,这条直线并
不能精确地反映x与y之间的关系,y的值不能由x确定,在此,我们将两者之间的
关系表示为y=a+bx+j其中a+bx是确定性函数,£称为随机误差.我们将y=a+bx+e
称为线性回归模型.
2.线性回归方程
设有n对观测数据(x,y,)(i=l,2,3,…,n),根据线性回归模型,对于每一个X,对
应的随机误差项&二y「(a+bx)当£+宜+…+以取得最小值时得到的直线y=a+bx称为这
n对数据的回归直线,此直线方程称为线性回归方程,其中;称为回归截距,b称为回
A
归系数,y称为回归值.把上述方法称为“最小二乘法”.
3.线性回归方程的计算及性质
AAA
线性回归方程:y=a+bx中,
回归系数1的计算公式:1二
2々4人(”Xj-义xj1力;知Z.i=】i学Xj—整nx,
A
AA
a的计算公式:a=y-bx.
其中a,b上方加"人”表示由观察值按最小二乘法求得的估计值.
,表示实际值V的估计值.
第3页共42页
性质
⑴回归直线一定过点区y).
AA
(2)y与x正相关的充要条件是b>0,y与x负相关的充要条件是b<0.
AAA
(3)b的实际意义:当x增大一个单位时,y增大b个单位.
四、非线性回归方程
1.对于变量y与x的关系,不是线性相关关系,称为非线性相关关系,其方程称为非
线性回归方程.一般地,非线性回归方程的曲线类型可以通过作出散点图进行猜测,
而非线性回归方程有时可以通过变量替换后,借助求线性回归方程的过程确定.
五、变量间相关关系的判断
1.利用散点图判断两个变量的相关性
⑴如果变量X和y正相关,那么散点图表现为点散布的位置是从左下到右上的区域;
如果变量x和y负相关,那么散点图表现为点散布的位置是从左上到右下的区域.
⑵如果散点落在一条直线附近,则认为这两个变量线性相关.
2.利用相关系数判断两个变量相关性强弱
相关系数r是从数值上来判断变量间的线性相关程度的量,是定量分析刻画了样本
点集中于某条直线的程度.
川越接近L散点图中的样本点分布越接近一条直线,两个变量的线性相关程度越强.
六、求线性回归方程
1.利用公式[嗥誓票普;与-短求线性回归方程的一般步骤
2,i=ig-X)Z,i=iXj-nx
⑴列出x,y„x,y,;
⑵计算又,y,Silixf,ZiliXiYi;
⑶代入公式计算b,;的值;
⑷写出线性回归方程.
第4页共42页
七、非线性回归分析
1.研究两个变量的关系时,依据样本数据画出散点图,从整体上看,如果样本点没
有分布在一条直线附近,就称这两个变量之间不具有线性相关关系.当两个变量不具
有线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量
代换,利用线性回归模型建立两个变量间的非线性回归方程.常见的非线性回归方程
的转换方式如下:
曲线方程曲线(曲线的一部分)变换公式变换后的线性函数
,Lb=-l
yb=\yj6<-ic=lna,
a
b[o<ki
y=axi去ol~~i*v=lnx,u=c+bv
0u=lny
'a>O,Z»O)(a>0,6<0)
!
c=lna,
——bxa
y=ae___/u=c+bx
X()\X
0u=lny
(c>0,6>0)(a>0,6<0)
1Iac=lna,
b1
a厂,
y=aexV=x-u=c+bv
X()\X
0u=lny
(a>0,6>0)(a>0,6<0)
V
y=a+blnxav=lnxy=a+bv
1)[1%7)
(a>0,6>0)(a>0,6<0)
2.建立非线性回归模型的基本步骤
⑴确定研究对象,明确涉及的变量;
⑵画出确定好的变量间的散点图,观察它们之间的关系(是否存在非线性关系);
⑶由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反
比例函数模型、指数函数模型、对数函数模型等);
⑷通过换元,将非线性回归方程模型转化为线性回归方程模型;
⑸按照公式计算线性回归方程中的参数,得到线性回归方程;
(6)消去新元,得到非线性回归方程.
第5页共42页
9.2独立性检验
一、2x2列联表
假设两个分类变量X和Y,它们的可能取值分别为仅,X2}和{九y2},其2x2列联表为
Y
V、V2合计
X1aba+b
X
X2Cdc+d
合计a+cb+da+b+c+d
2x2列联表给出了成对分类变量数据的交叉分类频数.
二、与独立性检验相关的概念
1.X,公式
一般地,对于两个分类变量I和II,I有两类取值,即类A和类B(如吸烟与不吸烟);
II也有两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).
我们得到2x2列联表所示的抽样数据:
II
类1类2合计
类Aaba+b
1类Bcdc+d
合计a+cb+da+b+c+d
_n(ad-bc)2
记n=a+b+c+d,贝叱
(a+b)(c+d)(a+c)(b+d)
2.独立性检验
用X,统计量研究两类变量是否有关的方法称为独立性检验.
第6页共42页
三、独立性检验的思想
1.要推断“I与II有关系”,可按下面的步骤进行
⑴提出假设H。:I与II没有关系;
n(ad-bc)2
⑵根据2x2列联表与X?计算X2的值;
(a+b)(c+d)(a+c)(b+d)
⑶根据临界值(如下表所示),做出判断
P(X2^Xo)0.500.400.250.150.10
Xo0.4550.7081.3232.0722.706
P(X2^Xo)0.050.0250.0100.0050.001
Xo3.8415.0246.6357.87910,828
2.常用检验结论
⑴若干>10.828,则有99.9%的把握认为“I与II有关系”;
(2)若X2>6.635,则有99%的把握认为“I与II有关系”;
⑶若X2>2.706,则有90%的把握认为"I与II有关系”;
⑷若X?W2.706,则认为没有充分的证据显示“I与II有关系”,但也不能得出结论
“H。成立”,即I与II没有关系.
四、由于进行独立性检验
1.独立性检验的关注点
在2义2列联表中,如果两个分类变量没有关系,则应满足ad-bc=0,事实上,|ad-bc|
越小,两个分类变量的关系越弱;|ad-bc|越大,两个分类变量的关系越强.
五、独立性检验与统计、概率的综合应用
解决与独立性检验有关的统计、概率综合问题,一般有以下几个步骤
⑴厘清题意,理解问题中的条件和所要得出的结论,尤其是直方图中给定的信息,
找关键量.
第7页共42页
⑵分析数据,列出2x2列联表.
⑶利用独立性检验的步骤进行判断.
⑷利用概率公式求事件的概率.
⑸反思回顾、检查关键点、易错点及答题规范.
第8页共42页
第7章计数原理知识点清单
目录
第7章计数原理
7.1两个基本计数原理
7.2排列
7.3组合
7.4二项式定理
第9页共42页
第7章计数原理
7.1两个基本计数原理
一、分类计数原理(加法原理)
1.如果完成一件事,有n类方式,在第1类方式中有种不同的方法,在第2类方
式中有m2种不同的方法……在第n类方式中有种不同的方法,那么完成这件事共
有N=mi+m2+“・+rrin种不同的方法.
二、分步计数原理(乘法原理)
1.如果完成一件事,需要分成n个步骤,做第1步有皿种不同的方法,做第2步有
m2种不同的方法……做第n步有rrin种不同的方法,那么完成这件事共有N=rriiXmaX-
xn%种不同的方法.
三、两个基本计数原理的比较
1.分类计数原理与分步计数原理的比较
分类计数原理分步计数原理
分类完成,类类相加分步完成,步步相乘
不同点
每类方式中的每一种方法都能独立完成这件事每步依次完成才算完成这件事
相同点都可用来计算完成某件事的方法种数,最终的目的都是完成某件事
注意点类类独立,不重不漏步步相依,步骤完整
四、两个基本计数原理的选择与应用
1.应用分类计数原理解题的一般思路
分为将完成二件事的方法分成若干娄
计数求出每一类中的方法数
占」将每一类中的方法数相加彳岫
结论一结果
第10页共42页
2.应用分步计数原理解题的一般思路
分步将完成一件事的过程分成若干步
计数•求出每二步中的方法数
将每一步中的方法数相乘,得出
结论
结果
应用分步乘法原理时,要确定好顺序,还要注意元素是否可以重复选取.
3.两个计数原理的综合应用
⑴类中有步
从A—B共有(mixmzXiTh+iTuxms)种方法.
(2)步中有类
从A-D共有rriix(m2+m3+m4)xm5种方法.
“类”用"+"连接,"步"用"连接,“类”独立,“步”连续,“类"标志一
件事的完成,“步”则缺一不可.
五、解决计数问题的常用方法
1.在计数问题中常涉及元素与位置,解题时要分析清楚要完成的事是元素选择位置还
是位置选择元素.
2.当涉及元素数目不大时,一般选择用列举法、数形图法.当涉及元素数目较大或情
况比较复杂时,一般有两种方法:
⑴直接法:直接应用分类计数原理或分步计数原理解题.
⑵间接法:先去掉限制条件,计算方法总数,然后减去所有不符合条件的方法数,从
而得到正确答案.
第11页共42页
3.涂色(种植)问题一般是直接利用两个基本计数原理求解,常用方法如下:
⑴根据区域的不同,以区域为主分步计数,用分步计数原理分析;
⑵以颜色(种植作物)为主分类讨论,用分类计数原理分析.
7.2排列
一、排歹k排列数与排列数公式
一般地,从n个不同的元素中取出m(mWn)个元素,按照一定的顺序
排列
排成一列,叫作从n个不同元素中取出m个元素的一个排列
一般地,从n个不同元素中取出m(mWn)个元素的所有排列的个数,
排列数
叫作从n个不同元素中取出m个元素的排列数,用符号A鲁表示
排列数公式A™=n(n-l)(n-2)---(n-m+l),其中n,mGN*,且mWn
二、全排列、阶乘的概念及相关结论
1.全排列:n个不同元素全部取出的一个排列,叫作n个不同元素的一个全排列.
2.n的阶乘
在排列数公式中,当m二n时,即有A*n(n-l)(n-2)x…x3x2x1,n(n-l).(n-2)x-x3
x2xl称为n的阶乘,通常用n!表示,即AR=n!.
3.阶乘的相关结论
⑴规定:0!=1;
⑵排列数公式的另一种形式:AJ?二1J(其中n,mGN;且mWn).
Qn-mj:
三、排列数及其运算
1.排列数运算的方法与技巧
⑴拆项技巧
①m=(n+D!-n!;骋二卷』
第12页共42页
⑵化简技巧
①n!=n-(n-l)!=n(n-lMn-2)!;
②A曹二nAkf;A*mA/i=Ad1.
2.解有关排列数的方程或不等式的步骤
将有关排列数的方程或不等式
转化
转化为普通方程或不等式
求转化后的普通方程或不等式
求解
的解或解集
代入原方程或原不等式中检验,
检验尤其注意条件鼠>m,且EN,
对未知数取值的限制
四、有限制条件的排列问题
1.“在"与"不在”的问题
常见的“在”与“不在”的有限制条件的排列问题是典型的特殊元素或特殊位置问题.
解决“在”与“不在”的排列问题的原则是谁“特殊”谁优先.解题思路如下:
以元素为主,优先
元素分析法
考虑特殊元素
直接法
位置分析法以位置为主,优先
考虑特殊位置
若解题时分类太多,用直接法
间接法求解较为麻烦,则往往采用间
接法来解决
2.“相邻”与“不相邻”问题
限制条件解题策略
通常采用“捆绑法”,即把相邻元素看成一个整体并与其他元素进行排
元素相邻
列
通常采用“插空法”,即先考虑不受限制的元素的排列,再将不相邻元
元素不相邻
素插在前面元素形成的空中
第13页共42页
3.“定序”问题
在排列问题中,某些元素在题意中已排定了顺序,对这些元素进行排列时,不再考虑
其顺序.在具体的计算过程中,可采用“除阶乘法”解决,即n个元素的全排列中有
m(m<n)个元素的顺序固定,则满足题意的排法有今种.
Am
7.3组合
一、组合、组合数的概念
1.组合:一般地,从n个不同元素中取出m(mWn)个元素并成一组,叫作从n个不
同元素中取出m个元素的一个组合.
2.组合数:从n个不同元素中取出m(mWn)个元素的所有组合的个数,叫作从n个
不同元素中取出m个元素的组合数,用符号表示.
二、组合数公式与性质
L公式.5-蕊-----------------赢F?(n,mGN-并且mWn)
2.特殊组合数:Cj=l,禺=n,"=1.
3.组合数的性质:C铲=C『m,cmi=cm-i+cm
三、组合数的性质与运算
1.组合数公式的主要适用范围
形式主要适用范围
而和小「m_n(n_l)(n_2)...(n_m+l)
为4>\球n-m(m-l)(m-2)x...x3x2xl含具体数字的组合数的求值
阶乘式qp二含字母的组合数的有关变形及证明
第14页共42页
2.组合数的性质及应用
⑴性质"C铲二印一加的意义及作用
反映的是组合数的对称性,即从〃
育7个不同元素中取出m个元素的组
息合数与取出剩下的M-m)个元素
的组合数相同
当机>3时,计算C:通常转化为
作用-2
计算CL
⑵性质"c^FCHT+qr的顺用、逆用、变形用
顺用是将一个组合数拆成两个;
逆用则是“合二为一”;
变形式C7二Cdi-qr】,为某些项相互抵消提供了方便,在解题时要注意灵活运用.
四、分组与分配问题
分组问题和分配问题是有区别的,前者是组与组之间只要元素个数相同,就是不可区
分的,而后者即使两组元素个数相同,但因元素不同,仍然是可区分的.
1.分组问题的求解策略
常见形式处理方法
将n个不同元素分成m组,每组元素数目均不相同,且不考虑各组
非均匀不编号
间的顺序,不管是否分尽,分法种数为
分组
A二心1.心2,「013...rmm
,L,L,,L,
―一5n-m1n-(m1+m2)n-(m1+m2+---+mnl-1)
将n个不同元素分成不编号的m组,假定其中r组元素个数相等,
均匀不编号分不管是否分尽,其分法种数为玲(其中A为非均匀不编号分组中的分
组
法数).如果再有k组均匀分组,"则应再除以A"
非均匀编号分将n个不同元素分成m组,各组元素数目均不相等,
组且考虑各组间的顺序,其分法种数为AA器
将n个不同元素分成m组,其中r组元素个数相同且考虑各组间的
均匀编号分组顺序,其分法种数为供“
Ar
第15页共42页
2.相同元素分配问题的处理策略
"n个相同元素分成m组(每组的任务不同)”的问题,一般可用隔板法求解.
⑴当每组至少含一个元素时,其不同分组方式有CW1种,即给n个元素中间的(n-l)
个空隙中插入(m-1)个隔板.
⑵任意分组,可出现某些组含0个元素的情况,其不同分组方式有(:有,1种,即将n
个相同元素与(m-1)个相同隔板进行排序,在(n+m-1)个位置中选(m-1)个安排隔板
五、排列、组合的综合应用问题
1.正确区分“有序"与“无序”
区分排列与组合的重要标志是“有序”和“无序”,无序的问题用组合的知识解答,有
序的问题用排列的知识解答.
2.辩证看待"元素”与“位置”
排列、组合问题中的元素与位置没有严格的界定标准,哪些事件看成元素或位置,随
解题者的思维方式的变化而变化,要视具体情况而定.有时“元素选位置”解决问题
更简捷,有时“位置选元素”效果会更好.
第16页共42页
7.4二项式定理
7.4.1二项式定理
一、二项式定理及相关的概念
1.公式(a+by;CRaU禺ai】b+…+(:河*+…+*blnEN)叫作二项式定理,右边的多项
式叫作(a+b)"的二项展开式,它一共有n+1项,其中喘a-H叫作二项展开式的第r+1
项(也称通项),用Ta表示,即"其病一匕.喘(r=0,1...............n)叫作第r+1项的
二项式系数.
二、求二项展开式中的特定项(项的系数)
1.求二项展开式的特定项的常用方法
⑴对于常数项,隐含条件是字母的指数为0(即0次项).
⑵对于有理项,一般先写出展开式的通项,然后令其所有的字母的指数都等于整数.
解这类问题必须合并通项中同一字母的指数,根据具体要求,令其为整数,再根据数
的整除性来求解.
⑶对于二项展开式中的整式项,其通项中同一字母的指数合并后应是非负整数,求解
方式与求有理项一致.
三、三项展开式问题
1.三项式求特定项的方法
⑴因式分解法:先通过因式分解将三项式变成两个二项式,然后用二项式定理分别展
开.
⑵逐层展开法:先将三项式分成两组(一项组和两项组),用二项式定理展开,再把其
中的两项组展开.
⑶利用组合知识:把三项式(a+b+cy看成n个式子(a+b+c)的积,利用组合知识分析
项的构成,注意最后把各个同类项合并.
第17页共42页
四、求展开式的系数和(赋值法)
“赋值法”是解决二项展开式中项的系数问题常用的方法,根据题目要求,
灵活赋予字母不同的值.一般地,若f(x)=ao+aiX+a2x2+…+aW,贝ijf(x)展开式中各项系
数之和为f(l),奇数项系数之和为a0+a2+a4+⑴偶数项系数之和为
ai+a3+as+…=S);(一I
7.4.2二项式系数的性质及应用
一、二项式系数的性质
在(a+b)n的展开式中,与首末两端“等距离”的两个二项式系数相等,
对称性
即C7二C丁1n(mEN,nGN*,mWn)
增减性:当时,的<的+1;当r>等时,喘+i<C]
增减性与最最大值:当n为偶数时,中间一项的二项式系数点最大;
大值
nTn+l
当n为奇数时,中间两项的二项式系数C;,C苗n相等,且最大
各二项式系⑴二项展开式中,各二项式系数的和CR+禺+鬃+…+*=2r1;
数的和(2)C[+鬣+墨+…:仁+/+端+…=2--
在杨辉三角中,除1以外的每一个数都等于它“肩上”两个数的和,
特殊情况
即呼+盘一1二喘1
二、二项式系数与系数的最大项
1.展开式中二项式系数最大项的确定方法
⑴当n为偶数时,中间一项(第畀1项,即《)的二项式系数最大;
n—1n+l
(2)当n为奇数时,中间两项(第等项和第等+1项,即和C/)的二项式系数
相等且最大.
第18页共42页
2.展开式中系数最大的项的确定方法
⑴在系数符号相同的前提下,求系数的最大(小)值只需比较两组相邻两项系数的大小,
Tr+l—%Tr+i<T,
根据通项正确列出不等式组r即可.
Tr+i>Tr+2Tr+i—、+2
⑵当各项系数正负相间时,求系数的最大值应在系数都为正的各项系数间构造不等式
组;求系数的最小值应在系数都为负的各项系数间构造不等式组.
三、二项式定理的应用
1.利用二项式定理解决整除或求余数问题
利用二项式定理解决整除或求余数问题,关键是要巧妙构造二项式,通常把底数写成
除数(或与除数密切相关的数)与某数的和或差的形式,再用二项式定理展开,只考虑
后面(或前面)一两项就可以了.
2.利用二项式定理进行近似计算
利用二项式定理进行近似计算,其关键在于构造恰当的二项式(p+q)n(nEN*,pGZ,
|q|<l),并根据近似要求,对其展开式的项合理取舍,从而确定其近似值(p+q))
3.利用二项式定理证明有关不等式
利用二项式定理证明组合数不等式,通常表现为二项式定理的正用或逆用,再结合不
等式证明的方法进行论证.证明不等式时,应注意运用放缩法,可将对结论不构成影
响的若干项去掉.
四、杨辉三角问题
解决与杨辉三角有关的问题的一般思路
对数据要横看、竖看、隔行看、
视"''连续看,多角度观察
铁律通过观察找出每一行的数据之
规律间、行与行的数据之间的规律
表在将发现的规律用数学式子表达
结论用数学表达式写出结论
第19页共42页
第8章概率知识点清单
目录
第8章概率
8.1条件概率
8.2离散型随机变量及其分布列
8.3正态分布
第20页共42页
第8章概率
8.1条件概率
8.1.1条件概率
一、条件概率
L一般地,设A,B为两个事件,P(A)>0,我们称鬻为事件A发生的条件下事件B
发生的条件概率,记为P(B|A),读作“A发生的条件下B发生的概率”,即P(B|A)=鬻
(P(A)>0).
二、概率的乘法公式
1,由条件概率公式可知P(AB)=P(B|A)-P(A).
说明:假设A表示事件,i=l,2,3,且P(A)>0,P(A1A2)>0,
则P(A1A2A3)=R(A1)-P(A2|A1)P(A3|A1A2),其中P(A3|AA)表示已知Al与A2都发生时A3发
生的概率,而P(AiA2A3)表示Ai,A2,A3同时发生的概率.
三、条件概率的性质
(1)P(Q|A)=1(Q为样本空间);
(2)P(0|A)=O;
⑶若Bl,B2互斥,则P((B]+B2)|A)=P(B1|A)+P(B2|A).
四、条件概率的计算方法
1.计算条件概率的方法一般有两种
⑴利用定义计算,先分别计算概率P(AB)和P(A),然后代入公式P(B|A)=9黑计算.
⑵利用缩小样本空间法计算(局限在古典概型内),即P(B|A尸啮.
五、求较复杂事件的概率
1.当所求事件的概率比较复杂时,往往把该事件分成两个(或多个)互斥的较简单的事
件,求出这些简单事件的概率,再利用公式便可求得较复杂事件的概率.
第21页共42页
2.求较复杂事件的概率的一般步骤
⑴列出题中涉及的各个事件,并且用适当的符号表示;
⑵厘清事件之间的关系(两个事件是互斥事件还是对立事件),列出关系式;
⑶根据事件之间的关系准确选取概率公式进行计算;
⑷当直接计算符合条件的事件的概率较复杂时,可先间接计算其对立事件的概
率,再求出符合条件的事件的概率.
六、乘法公式及其应用
1.乘法公式的特点及注意事项
⑴知二求一:若P(A)>0,P(B)>0,则①已知P(A),P(B|A),P(AB)中的两个值就可以求
得第三个值;②已知P(B),P(A|B),P(BA)中的两个值就可以求得第三个值.
⑵P(B)与P(B|A)的区别在于两者发生的条件不同,它们是两个不同的概念,在数值
上一般也不同.
第22页共42页
8.1.2全概率公式
8.1.3贝叶斯公式*
一、全概率公式
L一般地,若事件A】,A2,二两两互斥,且它们的和£字1A,=Q,P(A,)>0,i=l,
2,3,n,则对于Q中的任意事件B,有P(B尸2kP(Aj)P(B|AD.这个公式称为
全概率公式.
二、贝叶斯公式
1.一般地,若事件Al,A2,…,An两两互斥,且A1UA25UA产Q,P(A)>0,i=l,
2,n,则对于Q中的任意事件B,P(B)〉O,有P(A|B)P(B尸P(B|A)P(A).因此P(A|B尸
吗臀.再由全概率公式得P(A|B):-P(黑(篇;AY这个公式称为贝叶斯公式.
.特别地,当且时,有P(A)P(B|A)_P(A)P(B|A)
2O<P(A)<1P(B)>0P(A|B)=P(B)-P(A)P(B|A)+P(A)P(B|A)
三、全概率公式及其应用
1.全概率公式的意义在于,当直接计算事件B发生的概率P(B)较为困难时,可以先找
到样本空间Q的一个划分。:AiUAzU-UAn,Ai,A2,•••,4两两互斥,将Ai,A21…,
An看成是导致B发生的一组原因,这样事件B就被分解成了n个部分,分别计算P(B|
Ai),P(B|A2),P(B|An),再利用全概率公式求解.
2.运用全概率公式计算事件B发生的概率P(B)时,一般步骤如下:
⑴求划分后的每个小事件的概率,即P(A,),i=L2,n;
⑵求每个小事件发生的条件下,事件B发生的概率,即P(B|A),i=l,2,n;
⑶利用全概率公式计算P(B),即P(B)=IXiP(Ai)P(B|AD.
第23页共42页
四、贝叶斯公式及其应用
1.贝叶斯公式是在条件概率的基础上寻找事件发生的原因,在运用贝叶斯公式时,一
般已知和未知的条件如下:
(1)A的多种情况中到底哪种情况发生是未知的,但是每种情况发生的概率已知,即
P(A)已知;
⑵事件B是已经发生的确定事实,且A的每种情况发生的条件下B发生的概率已
知,即P(B|A)已知;
⑶P(B)未知,需要使用全概率公式计算得到;
⑷求解的目标是用A的某种情况A的无条件概率求其在B发生的条件下的有条件
概率P(A|B).
8.2离散型随机变量及其分布列
8.2.1随机变量及其分布列
一、随机变量
1.随机变量的概念
一般地,对于随机试验样本空间。中的每个样本点3,都有唯一的实数X(3)与之对
应,则称X为随机变量.
2.随机变量的表示
随机变量通常用大写英文字母x,Y,z(或小写希腊字母W,n,。等表示,而用小写英
文字母x,y,z(加上适当下标)等表示随机变量的取值.
3.随机变量的分类
离散型随机变量取值为离散的数值的随机变量
连续型随机变量取值为连续的实数区间的随机变量
第24页共42页
二、随机变量的概率分布
1.概率分布列
一般地,随机变量X有n个不同的取值,它们分别是Xi,X2,Xn,且P(X=x)=p,,
i=l,2,n,称上式为随机变量X的概率分布列,简称为X的分布列.
2.概率分布表
XXiX2Xn
PPiP2Pn
将上表称为随机变量X的概率分布表,概率分布列和概率分布表都叫作随机变量X的
概率分布.
3.概率分布的性质
概率分布里的p,(i=l,2,n)满足条件:
(l)Pi^O;(2)Pl+p2+--+Pn=l.
三、两点分布
I.随机变量X只取两个可能值0和1,我们把这一类概率分布称为0-1分布或两点分
布.
四、两个相关的随机变量的概率分布问题
1.一般地,若X是随机变量,则丫;f(X)也是随机变量.
2.已知随机变量X的概率分布,求随机变量Y=f(X)的概率分布,其关键是弄清X取每
一个值时相对应的丫的值,若f(X)的取值出现重复,则需要把它们的相应概率相加,
所求即为Y的取值概率.
第25页共42页
五、求离散型随机变量的概率分布
1.求离散型随机变量的概率分布的步骤(其中i=l,2,n)
第一员——确定随机变量X的可能取值现
笫二步求出相应的概率=〃,
第三步列出概率分布表
2.求离散型随机变量概率分布时应注意的问题
⑴确定离散型随机变量X的概率分布的关键是要弄清X取每一个值对应的随机事件,
进一步利用排列、组合知识求出X取每一个值时的概率.当随机变量X取值较多时,
应由简单情况先导出一般的通式,从而简化过程.
⑵在求离散型随机变量X的概率分布时,要充分利用概率分布的性质,这样不但可
以减少运算量,还可以验证概率分布是否正确.
8.2.2离散型随机变量的数字特征
一、离散型随机变量的均值
1.一般地,随机变量X的概率分布如下表所示,
XXiX2Xn
概率PPiP2Pn
其中P,,0,i=L2,n,Pl+p2+---+Pn=l,我们将PlXl+p2X2+-“+PnXn称为随机变量
X的均值或数学期望,记为E(X)或H,
2.离散型随机变量X的均值或数学期望反映了离散型随机变量取值的平均水平.
3.若X与Y都是随机变量,且丫=aX+b(aWO),则由X与丫之间概率分布的关系可知
E(Y)=E(aX+b)=aE(X)+b.
第26页共42页
二、离散型随机变量的方差与标准差
L一般地,若离散型随机变量X的概率分布如下表所示,
XX1X2Xn
PP1P2Pn
其中,Pi^o,i=l,2,•••,n,P1+P2+…+Pn=l,贝lJ(Xi-u)2(产E(X))描述了Xi(i=l,2,•••,
n)相对于均值H的偏离程度,故(X】f)2p1+(X2刘2P2+…+%-日心刻画了随机变量X与其
均值U的平均偏离程度,我们将其称为离散型随机变量X的方差,记为D(X)或。2,即
2222
D(X)=a=(xi-|d)pi+(x2-n)p2+■•,+(xn-n)pn.
2.随机变量X的方差也称为X的概率分布的方差,X的方差D(X)的算术平方根称为
X的标准差,即。二河0
3.随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度.方差
或标准差越小,随机变量偏离于均值的平均程度就越小.
4,若X和丫都是离散型随机变量,且丫=aX+b(aK0),则由X和Y之间概率分布和均
值的关系可知D(Y)=D(aX+b)=a2D(X).
三、两点分布的均值和方差
1,随机变量X的概率分布如下表所示.
X01
p1-pp
贝IJE(X)=p,D(X)=p(l-p),o=Jp(l-p).
四、求离散型随机变量的均值与方差
1.求离散型随机变量的均值与方差的类型及解决方法
⑴已知概率分布型:直接利用定义求解.
⑵未知概率分布型:求解时可先借助已知条件等求得概率分布,然后利用定义求解.
⑶已知E(X),D(X),求E(aX+b),D(aX+b)型:利用E(aX+b)=aE(X)+b和D(aX+b)=a2D(X)
求解.
第27页共42页
五、实际生活中的离散型随机变量的数字特征
I.求实际生活中离散型随机变量X的均值与方差的步
1理解X的意义,写出X的所有可能取值
2求X取每个值时的概率
3写出X的概率分布
4由均值的定义求E(㈤
5由方差的定义求。(㈤
六、数学期望与方差在实际生活中的应用
1.在实际生活中存在许多决策问题,在确定性现象中,我们决策和优化的目的通常是
使损失最小或利益最大.
2.离散型随机变量的均值反映了离散型随机变量取值的平均水平,而方差反映了离散
型随机变量的取值相对于均值的离散程度(或波动大小).因此,在利用均值和方差的意
义去分析、解决实际问题时,两者都要考虑.
⑴若我们希望实际的平均水平较理想时,则先求随机变量X1,X2的均值,当E(XI)=E(X2)
时,不应认为它们一样好,还需要用D(XJ,D(X3来比较这两个随机变量的偏离程度,
偏离程度越小越好.
⑵若我们希望随机变量的取值比较稳定时,则应先考虑方差,再考虑均值是否相等或
接近.
第28页共42页
8.2.3二项分布
一、二项分布
L伯努利试验
我们把只包含两个可能结果的试验叫作伯努利试验,将一个伯努利试验独立地重复进
行n次所组成的随机试验称为n重伯努利试验.
2.二项分布
若随机变量X的分布列为P(X=k)=C'pkq”其中o<p<i,p+q=l,k=0,1,2,•••,
一般地,当X~B(n,p)时,E(X)=np,D(X)=np(l-p),Jnp(l-p).
三、二项分布的实际应用
1.利用二项分布模型解决实际问题的一般步骤
⑴根据题意设出随机变量;
⑵分析随机变量是否服从二项分布;
⑶若服从二项分布,则求出参数n和p的值;
(4)根据需要列出相关式子并解决问题.
2.解决二项分布问题的两个关注点
⑴公式P(X=k)=C^pkqnk(O<p<l,p+q=l,k=0,1,2,…,n)必须在满足“独立重复
试验”时才能运用,否则不能应用该公式.
⑵判断一个随机变量是否服从二项分布,关键有两点:一是对立性,即一次试验中,
事件发生与否,二者必居其一;二是重复性,即试验是否独立重复地进行了n次
第29页共42页
四、二项分布中的最大值
1.求二项分布中的最大值的步骤
⑴由X〜B(n,p),得P(X二k)=C^pk(l-p)n-k,k=0,1,2,n.
⑵令P(X=k)-P(X=k-l)20或给求出k的取值区间,此区间即为P(X=k)
的单调递增区间,它的补集区间为单调递减区间.
⑶结合P(X=k)的单调性确定P(X二k)的最大值和对应的k值.
8.2,4超几何分布
一、超几何分布
L对一般情形,一批产品共N件,其中有M件不合格品,随机取出的n件产品中,
不合格品数X的概率分布如表所示.
X0121
「0「n「1「n-1「2「n-2「n-]
Prn
CNCNUN1
其中l=min{n,M}.
2.一般地,若一个随机变量X的分布列为P(X=r)=齿沪,其中r=0,1,2,3,
CN
I,l-min{n,M),则称X服从超几何分布,记为X〜H(n,M,N),并将P(X二r)二弓甲
LN
记为H(r;n,M,N).
二、超几何分布的均值
1.当X〜H(n,M,N)时,E(X)=Sk=okPk=詈,其中I=min{n,M}.
第30页共42页
三、超几何分布的应用
1.解决超几何分布问题的关键点
⑴超几何分布是概率分布的一种形式,一定要注意公式中字母的范围及其意义,解决
问题时可以直接利用公式求解,但不能机械地记忆.
⑵超几何分布中,只要知道M,N,n,就可以利用公式求出X取不同值时的概率,
从而求出X的概率分布.
四、二项分布与超几何分布的区别
1,判断是不是二项分布就是看它是不是n次独立重复试验,随机变量是不是在这n
次独立重复试验中某事件发生的次数,满足这两点的随机变量才服从二项分布,否则
不服从二项分布.
2.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.
超几何分布的特征是:
①对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数X的概率分布.超几何分布主要用于抽检
产品、摸不同类别的小球等概率模型,其实质是古典概型.
第31页共42页
8.3正态分布
一、正态密度曲线
1.概率密度曲线
在频率直方图中,如果数据无限增多且组距无限缩小,那么频率直方图上的折线将趋
于一条光滑的曲线,将此曲线称为概率密度曲线.
2.正态密度曲线
1(X—)2
将函数P(x)二卷e-k(xER)的图象称为正态密度曲线.这里有两个参数口和
其中o>0,(JGR.
3.正态密度曲线的特征
⑴当X<|J时,曲线上升;当x>pi时,曲线下降;当曲线向左右两边无限延伸时,以x
轴为渐近线.
⑵曲线关于直线x=n对称.
(3)。越大,曲线越扁平;。越小,曲线越尖陡.
⑷在曲线下方和x轴上方范围内的区域面积为1.
二、正态分布
1.正态分布
设X是一个随机变量,若对任给区间(a,b],P(a<XWb)是正态密度曲线下方和x
轴上(a,b]上方所围成的图形的面积(如图所示),则称随机变量X服从参数为口和4
的正态分布,简记为X~N(n,o2).
第32页共42页
2.标准正态分布
尸0且的正态分布称为标准正态分布,记作X~N(0,1).
若X〜N(|d,O2),则平〜N(0,1).
三、正态总体在三个特殊区间内的取值
如图,随机变量X的取值
落在区间(pi-o,|1+。)内的概率约为68.3%;
落在区间(H-2O,H+2O)内的概率约为95.4%;
落在区间(上3。,口+3。)内的概率约为99.7%.
事实上,口就是随机变量X的均值,4就是随机变量x的方差,它们分别反映X取值
的平均大小和稳定程度.
四、正态分布的概率问题
1.利用正态分布求概率的三种方法
⑴对称法:由于正态曲线是关于直线x=n对称的,且概率的和为L故关于直线x二口
对称的区间上概率相等.如:
①P(X<a)=l-P(X2a);
(2)P(X<(j-a)=P(X>n+a).
⑵转化法:若X〜N(H,o2),则呼〜N(0,1).
⑶“3o”法:利用随机变量X取值落在区间(口-o,口+o),(上2o,口+2。),(氏3o,口+3。)
内的概率分别约是68.3%,95.4%,99.7%求解.
第33页共42页
五、正态分布的实际应用
利用服从正态分布N(|J,。2)的随机变量X取值落在三个特殊区间内的概率,可以解决
两类实际问题:
一类是估计在某一范围内的数量.具体方法是先确定随机变量的取值在该范围内的概
率,再乘样本容量即可;
另一类是利用3。原则作决策.决策步骤如下:①确定一次试验中取值a是否落入范
围(口-3。,n+3o);②作出判断,若(口-3o,口+3。),则接受统计假设,若响口-3。,
口+3。),则拒绝统计假设.
第34页共42页
第9章统计知识点清单
目录
第9章统计
9.1线性回归分析
9.2独立性检验
第35页共42页
第9章统计
9.1线性回归分析
一、变量间的相关关系
1.两个变量的关系
分类函数关系相关关系
特征两变量具有确定性关系两变量没有确定性关系
2.相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.
3.散点图
将样本中的n个数据构成的点(丸y,)(i=l,2,3,…,n)描在平面直角坐标系中得到的
图形称为散点图.
4.线性相关关系
散点图中的点散布在一条直线附近,将具有这种特性的相关关系称为线性相关关系.
5.正相关与负相关
具有相关关系的两个变量的散点图如果呈从左下向右上方向发展的趋势,称这两个变
量之间正相关,如果呈从左上向右下方向发展的趋势,则称这两个变量之间负相关.
二、相关系数
1.对于变量x与y的n对数据(x“y,)(i=L2,3,…,n),一般用
r=X-i(Xi-幻(yi-刃________nZ-iXiyi-(£1iXi)(£4iYi)__________
粗匕(应一幻2也(%_"xf-GZ%)2],£匕并一(£匕丽
来衡量y与X的线性相关强弱,这里的r称为相关系数.
2.相关系数r具有的性质
Q)-lWrWl;
⑵r>0时y与x呈正相关关系,r<0时y与x呈负相关关系;
第36页共42页
⑶|r|越接近1,y与x相关的程度就越强,川越接近0,y与x相关的程度就越弱.
通常情况下,当|r|>0.5时,认为线性相关关系显著;当3时,认为几乎没有线
性相关关系.
三、线性回归方程
1.线性回归模型
散点图上的一些点在一条直线附近,但并不都在这条直线上.也就是说,这条直线并
不能精确地反映x与y之间的关系,y的值不能由x确定,在此,我们将两者之间的
关系表示为y=a+bx+j其中a+bx是确定性函数,£称为随机误差.我们将y=a+bx+e
称为线性回归模型.
2.线性回归方程
设有n对观测数据(x,y,)(i=l,2,3,…,n),根据线性回归模型,对于每一个X,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年公共厕所施工进度与付款协议
- 2024年双边借款协议:个人之间的资金互助合同
- 2024年公交车广告投放协议
- 2024年公对公科研借款协议
- 2024年修订版自然人贷款协议
- 2024年临时借款协议:急用之选责任明确
- 2024年办公用品买卖协议(公对公)
- 教育培训课程设计方案
- 郎酒制曲培训课程设计
- 礼仪常识与技巧课程设计
- “数字三品”应用场景典型案例申报书
- 2024秋三年级语文上册第二次月考达标检测卷第三四单元新人教版
- 2024年下半年辽宁事业单位高频500题难、易错点模拟试题附带答案详解
- 中医人工智能
- 人教版(2024)八年级上册物理第3章《物态变化》单元测试卷(含答案解析)
- 金属冶炼(铅、锌冶炼)主要负责人安全资格考试题库及答案
- 2024中国铁路集团全国招聘高频考题难、易错点模拟试题(共500题)附带答案详解
- (全册各类齐全)二年级数学上册100道口算题大全54份(100题)
- 2024至2030年中国少儿口才培训行业竞争格局及投资战略规划研究报告
- 2024山东港口青岛港社会招聘42人(高频重点提升专题训练)共500题附带答案详解
- 智能机器人设计与实践智慧树知到答案2024年北京航空航天大学
评论
0/150
提交评论