概率统计复习专题.doc_第1页
概率统计复习专题.doc_第2页
概率统计复习专题.doc_第3页
概率统计复习专题.doc_第4页
概率统计复习专题.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率统计 【重点知识回顾】 概率 (1) 事件与基本事件: 随机事件:在条件s下,可能发生也可能不发生的事件 事件 為宀越皿 不可能事件:在条件ST, 一定不会发生的事件 确定事件 必然事件:在条件S下,一定会发生的事件 基本事件:试验中不能再分的最简单的“单位”随机事件;一次试验等可能的产生一个 基本事件;任意两个基本事件都是互斥的; 试验中的任意事件都可以用基本事件或其和的形 式来表示. (2) 频率与概率:随机事件的频率是指此事件发生的次数与试验总次数的比值.频率往往 在概率附近摆动,且随着试验次数的不断增加而变化,摆动幅度会越来越小. 随机事件的概 率是一个常数,不随具体的实验次数的变

2、化而变化. (3 )互斥事件与对立事件: 事件 定义 集合角度理解 关系 互斥事件 事件A与B不可能同时 发生 两事件交集为空 事件A与B对立,则A 与B必为互斥事件; 事件A与B互斥,但不 一是对立事件 对立事件 事件A与B不可能同时 发生,且必有一个发生 两事件互补 (4 )古典概型与几何概型: 古典概型:具有“等可能发生的有限个基本事件”的概率模型. 几何概型:每个事件发生的概率只与构成事件区域的长度(面积或体积)成比例. 两种概型中每个基本事件出现的可能性都是相等的,但古典概型问题中所有可能出现的 基本事件只有有限个,而几何概型问题中所有可能出现的基本事件有无限个. (5) 古典概型与

3、几何概型的概率计算公式: 古典概型的概率计算公式: P(A) A包含的基本事件的个数 基本事件的总数 几何概型的概率计算公式: ()构成事件A的区域长度(面积或体积) P A 试验全部结果构成的区域长度(面积或体积) 两种概型概率的求法都是“求比例” ,但具体公式中的分子、分母不同. (6) 概率基本性质与公式 事件A的概率P(A)的范围为:0 P(A) 1 . 互斥事件A与B的概率加法公式:P(AUB) P(A) P(B). 对立事件A与B的概率加法公式:P(A) P(B) 1. (7) 如果事件A在一次试验中发生的概率是p,则它在n次独立重复试验中恰好发生k次 的概率是pn(k) = Cp

4、k(1 p)n k实际上,它就是二项式(1 p)+pn的展开式的第k+1项. (8) 独立重复试验与二项分布 一般地,在相同条件下重复做的n次试验称为n次独立重复试验注意这里强调 了三点:(1)相同条件;(2)多次重复;(3)各次之间相互独立; 二项分布的概念:一般地,在 n次独立重复试验中,设事件 A发生的次数为 X, 在每次试验中事件 A发生的概率为p,那么在n次独立重复试验中, 事件A恰好发生k次的 概率为P(X k) Cn pk(1 p)n :(k 0,1,2丄,n) 此时称随机变量 X服从二项分布,记作 X B(n, p),并称p为成功概率. 统计 (1) 三种抽样方法 简单随机抽样

5、 简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回 和不放回我们在抽样调查中用的是不放回抽取. 简单随机抽样的特点:被抽取样本的总体个数有限.从总体中逐个进行抽取,使抽样便 于在实践中操作它是不放回抽取,这使其具有广泛应用性.每一次抽样时,每个个体等可 能的被抽到,保证了抽样方法的公平性. 实施抽样的方法:抽签法:方法简单,易于理解随机数表法:要理解好随机数表,即 表中每个位置上等可能出现 0, 1, 2,,9这十个数字的数表.随机数表中各个位置上出 现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可 能性. 系统抽样 系统抽样适用于总

6、体中的个体数较多的情况. 系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中 进行抽样时,采用的是简单随机抽样. 系统抽样的操作步骤:第一步,利用随机的方式将总体中的个体编号;第二步,将总体 的编号分段,要确定分段间隔 k,当N (N为总体中的个体数,n为样本容量)是整数时, n k N ;当N不是整数时,通过从总体中剔除一些个体使剩下的个体个数N能被n整除, n n 这时k N ;第三步,在第一段用简单随机抽样确定起始个体编号,再按事先确定的规则 n 抽取样本.通常是将加上间隔k得到第2个编号(I k),将(I k)加上k,得到第3个编号 (I 2k),这样继续下去

7、,直到获取整个样本. 分层抽样 当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个 体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例 进行简单随机抽样. 分层抽样的过程可分为四步:第一步,确定样本容量与总体个数的比;第二步,计算出 各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步, 将各层中抽取的个体合在一起,就是所要抽取的样本. (2) 用样本估计总体 样本分布反映了样本在各个范围内取值的概率, 我们常常使用频率分布直方图来表示相 应样本的频率分布,有时也利用茎叶图来描述其分布, 然后用样本的频率分布去估

8、计总体分 布,总体一定时,样本容量越大,这种估计也就越精确. 用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处 理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求 全距t决定组距与组数t分组t列频率分布表t画频率分布直方图. 茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于 记录和表示,但数据位数较多时不够方便. 平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程 度,其计算公式为s J- 0 ( X)2 .有时也用标准差的平方方差来代替标准差, n i i 两者实质上是一样的. (3) 两个变量

9、之间的关系 变量与变量之间的关系, 除了确定性的函数关系外, 还存在大量因变量的取值带有一定 随机性的相关关系. 在本章中,我们学习了一元线性相关关系, 通过建立回归直线方程就可 以根据其部分观测值,获得对这两个变量之间的整体关系的了解. 分析两个变量的相关关系 时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘估 计求出回归直线方程.通常我们使用散点图,首先把样本数据表示的点在直角坐标系中作出, 形成散点图.然后从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大 致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这 条直线

10、叫做回归直线, 其对应的方程叫做回归直线方程.在本节要经常与数据打交道,计算 量大,因此同学们要学会应用科学计算器. (4) 求回归直线方程的步骤: 第一步:先把数据制成表,从表中计算出 nn 2 x,y,Xiyi, x ; i ii i 6 第二步:计算回归系数的 a, b,公式为 nnn n Xiyi (x)( yi) i 1i 1i 1 nn 2 2 n x ( Xi) i ii i a y bx; 第三步:写出回归直线方程y bx a . (4)独立性检验 2 2列联表:列出的两个分类变量 X和Y,它们的取值分别为X1,X2和yi,y2的 样本频数表称为2 2列联表1 构造随机变量 (

11、a b)(咒)咒b d)(其中n 3 分类 y 1 y2 总计 X 1 a b a b X2 c d c d 总计 a c b d a b c d 得到K2的观察值k常与以下几个临界值加以比较: 如果 k 2.706, 就有90。的把握因为两分类变量 X和Y是有关系; 如果 k 3.841 就有95的把握因为两分类变量 X和Y是有关系; 如果 k 6.635 就有99的把握因为两分类变量 X和Y是有关系; 如果低于k 2.706,就认为没有充分的证据说明变量X和Y是有关系. 常用的统计图表 频率咕步 (1)频率分布直方图小长方形的面积=组距X组距=频率; 各小长方形的面积之和等于1; 、 亠

12、频率、 亠1 小长方形的咼= 组距,所有小长方形的咼的和为组距. (2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两 个数据的平均数) 把频率分布直方图划分左右两个面积 相等的分界线与X轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中 点的横坐标之和 1 方差:s2= n【(X1 X )2+(X2 x )2+ + (Xn X

13、)2. 标准差: s=n X1 X 2+ X2 X 2+ Xn X 2. 【典型例题】 考点:概率 【内容解读】概率试题主要考查基本概念和基本公式, 对等可能性事件的概率、 互斥事件的 概率、独立事件的概率、事件在n次独立重复试验中恰发生 k次的概率、离散型随机变量分 布列和数学期望等内容都进行了考查。掌握古典概型和几何概型的概率求法。 例1、在平面直角坐标系 xoy中,设D是横坐标与纵坐标的绝对值均不大于2的点构成的区 域,E是到原点的距离不大于 1的点构成的区域,向 D中随意投一点,则落 入E中的概率为。 例2某公交公司对某线路客源情况统计显示,公交车从每个停靠点出发后, 车上的乘客人数及

14、频率如下表: 人数 06 712 1318 1924 2530 31人以上 频率 0.1 0.15 0.25 0.20 0.20 0.1 (1) 从每个停靠点出发后,乘客人数不超过24人的概率约是多少? (II)全线途经10个停靠点,若有2个以上(含2个)停靠点出发后,车上乘客人数超过 18人的概率大于0.9,公交公司就要考虑在该线路增加一个班次,请问该线路需要增加班次 吗? 考点:统计 【内容解读】理解简单随机抽样、系统抽样、分层抽样的概念,了解它们各自的特点及步骤.会 用三种抽样方法从总体中抽取样本.会用样本频率分布估计总体分布.会用样本数字特征估 计总体数字特征.会利用散点图和线性回归方

15、程,分析变量间的相关关系;掌握独立性检验 的步骤与方法。 例3 (1) 一个总体分为 A, B两层,用分层抽样方法从总体中抽取一个容量为10的样本. 1 已知B层中每个个体被抽到的概率都为,则总体中的个体数为 12 J5 1 (2) 设矩形的长为a,宽为b,其比满足b : a =一请画出上表数据的散点图; 请根据上表提供的数据,崩最小二乘法求出丫关于x的线性回归方程Y=bx+a; 已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据 求出的线性回归方 程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? 0.618,这种矩形给人以美感, 2 称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的 初加工矩形宽度与长度的比值样本: 甲批次:0.5980.6250.6280.5950.63

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论