版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章随机变量及其分布简介
李勇,北京师范大学数学科学院
随机变量是研究随机现象的重要工具之一,他建立了连接随机现象和实数空
间的一座桥梁,使得我们可以借助于有关实数的数学工具来研究随机现象的本
质,从而可以建立起应用到不同领域的概率模型,如二项分布模型、超儿何分布
模型、正态分布模型等。
在本章中将通过具体实例,帮助学生理解取有限值的离散型随机变量及其分
布列、均值、方差的概念,理解超几何分布和二项分布的模型并能解决简单的实
际问题,使学生认识分布列对于刻画随机现象的重要性,认识正态分布曲线的特
点及曲线所表示的意义。
一、内容与要求
1.随机变量及其分布的概念。
通过具体实例使学生理解随机变量及其分布列的概念,认识随机变量及其分
布对于刻画随机现象的重要性。要求学生会用随机变量表达简单的随机事
件,并会用分布列来计算这类事件的概率。
2.超儿何分布模型及其应用。
通过实例,理解超几何分布及其导出过程,并能进行简单的应用。
3.二项分布模型及其应用。
通过具体实例使学生了解条件概率和两个事件相互独立的概念,理解n次独
立重复试验和二项分布模型,并能解决一些简单的实际问题。
4.离散随机变量的均值与方差。
通过实例使学生理解离散型随机变量均值、方差的概念,能计算简单离散型
随机变量的均值、方差,并能解决一些实际问题。
5.正态分布模型。
借助直观使学生认识正态分布曲线的特点及含义。
二、内容安排及说明
1.全章共安排了4个小节,教学约需12课时,具体内容和课时分配如下(仅供
参考):
2.1离散型随机变量及其分布列约3课时
2.2二项分布及其应用约4课时
2.3离散型随机变量的均值与方差约3课时
2.4正态分布约1课时
小结约1课时
2.本章知识框图
3.对内容安排的说明。
研究一个随机现象,可以借助于随机变量,而分布描述了随机变量取值的概
率分布规律。二项分布和超儿何分布是两个应用广泛的概率模型.为了使学生能
够更好地理解它们,并能用来解决一些实际问题,教科书在内容安排上作了如下
考虑:
(1)为学生把注意力集中在随机变量的基本概念和方法的理解上,通过取有
限个不同值的随机变量为载体介绍这些概念,以便他们能更好的应用这
些概念解决实际问题。例如,如何定义随机变量来描述所感兴趣的随机
事件;一个具体的随机变量都能表达什么样的事件,如何表达这些事件;
如何用分布列来表达随机事件发生的概率等。
(2)介绍超儿何分布模型及其应用,其目的是
i.让学生了解它的广泛应用背景,并使学生能够应用该分布设计一些
能够丰富学生课外活动的摸奖游戏,引发学习兴趣;
ii.另外该模型还可以帮助理解二项分布模型的背景;
iii.在产品的质量控制方面有广泛的应用。
(3)介绍条件概率和独立性的概念,主要是为引入二项分布模型打基础,另
外这些概念在实际中也有广泛应用。
(4)为了使学生更容易理解二项分布的产生背景,教材通过简单实例的讨论,
向学生们展示从独立重复实验到二项分布的推导过程。
(5)对于离散型随机变量的均值与方差的含义及其计算公式,重点是概念的
理解,而不是均值与方差的计算。因此教材中借助于很简单的离散型随
机变量来介绍均值与方差的概念,以避免复杂的计算冲淡概念的理解。
(6)关于正态分布模型,仅需要学生们了解正态分布密度曲线的特征,密度
曲线与相应的随机变量落在某个区间的概率之间的关系,参数〃和。的
含义,以及3b准则。
4.本章的重点和难点
(1)离散型随机变量的分布列、均知和方差概念的理解;
(2)条件概率、两事件相互独立的概念;
(3)二项分布、超几何分布模型及其应用.
三、教材编写中考虑的几个问题
1.知识的引入的变化
•注重利用学生熟悉的实例和具体情景引入知识,以促发学生们的
兴趣;
•通过思考或探究栏目提出问题,以调动学生解决问题的积极性。
例如,我们通过学生们熟悉的掷骰子为背景提出问题,
引导学生思考,以得到随机变量的概念。又如,我们以抽奖
券为背景,设计了一套问题,引导学生体会概率和条件概率
的区别。再如,我们通过混合糖果定价的问题,引入数学离
散型随机变量均值的定义。
2.具体内容的变化
•知识载体的变化:以取限值离散型随机变量为知识载体。
•使学生的注意力更集中在有关随机变量的均值、方差概念的
理解;
•不影响二点分布、超几何分布、二项分布的知识理解,他们
都是取有限值的随机变量。
•增加了超几何分布。
•贴近学生们的生活。如在模球和扑克牌游戏中,都会出现超
几何分布。而同学们又很熟悉这些游戏,由此可提升他们学
习概率知识的兴趣。
•应用广泛。如抽样中。
•可以帮助正确理解二项分布产生的背景。
3.更注重知识的应用
•体现概率统计的应用价值。
•利用思考、探究等栏目提高学生解决实际问题能力。
如,例1.3演示了超儿何分布在设计抽奖游戏中的应用,
该例后的思考引导学生动手设计抽奖游戏;例2.2体现了条
件概率在破译密码中的应用;例2.3给出了独立性在抽奖活
动中的应用;例2.4给出了二项分布在射击中的应用;例3.3
给出了离散型随机变量在制定减灾方案中的应用。
四、教学建议
1.在教学过程中要交待引入随机变量的原因(章引言中);
2.通过与函数的比较加深对随机变量的理解;
3.在介绍有关随机变量的概念过程中,重点在在于概念的理解及应用,不
宜引入过于复杂的计算,以免喧宾夺主;
4.注意产生超儿何分布与二项分布的背景差别,以帮助学生更好地理解两
个模型以及两个事件间独立性的概念。
•超儿何分布:从。个红球和b个黑球中,不放回模出m个球中的
红球个数,结果导致“第z•次摸出红球”与“第J次摸出红球”不
相互独立(,*,);
•二项分布:从a个红球和b个黑球中,有放回模出m个球中的红
球个数,结果导致“第i次摸出红球”与“第j次摸出红球”相互
独立Ci^j)o
5.注意解释随机变量与样本均值(方差)的关系:
•两者都表示各自的平均位置(变化剧烈程度);
•样本均值(方差)是随机变量,具有随机性,而随机变量的均值(方
差)是实数,没有随机性;
•样本均值(方差)的极限是总体均值(方差)。
6.在高尔顿钉板试验中,课文中说“随着试验次数的增加,这个频率直方图
的形状会越来越像一条钟形曲线”的含义为:随着试验次数的增加,这个
频率直方图的形状会越来越接近于钟形曲线的离散化。
第三章统计案例简介
李勇,北京师范大学数学科学院
回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地
位。本章是在《数学3(必修)》的统计知识的基础上,通过对典型案例的讨论,
进一步学习线性回归分析模型及其应用,并初步了解独立性检验的基本思想,认
识统计思想的应用价值。
一、内容与要求
1.通过典型案例进一步介绍线性回归模型的有关知识,包括残差变量的来源,
模型诊断的初步知识,以及应用线性回归模型解决非线性相关关系问题等,
使学生进一步了解回归分析的基本思想、方法及其初步应用。
2.通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生能够
应用独立性检验的方法解决一些最简单分类变量的独立性检验问题。
二、内容安排及说明
1.本章共10课时,具体内容和课时分配如下(仅供参考):
3.1回归分析的基本思想及其初步应用约4课时
3.2独立性检验的基本思想及其初步应用约3课时
实习作业约2课时
小结约1课时
2.本章知识框图
本章介绍两种不同的统计方法,每种方法涉及的知识范围不同,下面分别列
出这两种方法的知识框图。
•回归分析知识框图
•独立性检验知识框图
3.对内容安排的说明。
回归分析的部分内容在《数学3(必修)》中已出现过,比如画散点图,最小
二乘估计的计算公式,建立回归方程并进行预报等。在此基础上,本章通过典型
案例进一步讨论一元线性回归模型.,分析产生模型中随机误差项的原因;从残差
分析的角度探讨异常数据的识别方法,以及所选用的回归模型是否可以改进的问
题;介绍一个刻画模型拟合效果的指标,即相关指数,引导学生体会模型诊断的
思想。作为线性回归模型的一个应用,教科书给出了一个讨论非线性相关关系的
实例。
第二节的独立性检验内容对于老师和同学来讲都是新的内容,因此教科书通
过典型案例的研究过程,介绍了独立性检验的基本思想、方法和初步应用。
独立性检验的步骤是固定的,仿照教科书的例题,学生不难完成习题,但独
立性检验的思想对学生来说是比较难理解的,它来源于统计上的假设检验思
想.考虑到对高中生而言,假设检验的思想难于理解,所以在教科书上仅从反正
法的角度介绍独立性检验思想。
三、编写中考虑的几个问题
由于在《数学3(必修)》中已经介绍了线性回归方程相关知识与应用,教材
在这些知识的基础上增加了有关模型诊断的思想介绍,使学生使学生知到解决实
际问题不仅仅是建立经验方程,还需要对样本数据、模型的拟合效果等方面进行
考察,以求尽可能准确描述数据间的关系。
事实上,数据本身不能直接告诉我们它来自什么模型,我们所能做的仅是在
一定的规则下努力寻找效果更好的模型来刻画这些数据。
在独立性检验内容的编写过程中,遇到的问题主要是知识背景的问题。传统
上,都是以假设检验思想为基础来介绍独立性检验,这样就可以把独立性检验处
理成一种特殊的假设检验。在没有假设检验知识为基础的情况下,我们采用类比
于反正法的思路,对于典型案例进行分析,使得独立性检验的思想得以体现。
四、教学建议
在第一节的教学过程中需要注意如下问题。
I.函数模型与“回归模型''的关系。
中丽蹴懈
因变量y完全山自
函数模型:y=/(x)样本点在函数曲线y=/(尤)上
变量X确定
预报变量y完全山
回归模型:y=/(x)+e样本点不全在函数曲线丁=/(x)上解释变量X和模型
误差e确定
2.引进残差变量的作用:虽然无法得到残差变量e的值,但却可以估计它,对它进行分析,
从而可以发现异常数据,可以做模型诊断。
3.散点图与模型的选择:若散点分布在函数曲线族y=/(x;a)中的某条曲线附近,则可
以用
y=/(x;a)+e
拟合数据。如在“红铃虫的产卵数与温度”的案例中,散点图如下
案例2:红铃虫的产卵数与温度
这说明两个变量很有可能近似呈现二次和数关系或指数函数关系,所以此时直接用线性
回归模型不能达到最好效果。
4.残差变量与模型选择
a)残差图的作用:残差图帮助确定异常点,以及模型的改进方向。
b)残差图的制作及特点:
■坐标纵轴为残差变量,横轴可以有不同的选择。
v横轴为编号,可以考察残差与编号次序之间的关系,常用于调查数据错
误。
v横轴为解释变量,可以考察残差与解释变量的关系,常用于研究模型是
否有改进的余地。
■若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域。
C)在残差图中寻找异常点(可能山错误数据引起,也可能山我们没有注意到的因素所
引起),即远离坐标横轴的点。
d)解释残差变量的来源
■其它因素的影响。如影响身高y的因素不只是体重x,可能还包括遗传基因、
饮食习惯、生长环境等因素。
■选用的回归模型近似真实模型所引起的误差。
■预报变量的观测误差。身高y的测量有误差。
e)正确理解相关指数的含义
■相关指数是度量模型拟合效果的一种指标,它越小,模型拟合效果越好。
★=I_卫------------
£(%-于
f=l
■在线性模型中,它代表解释变量刻画预报变量的能力。
f)注意提炼案例所蕴含的统计思想
■如在例1结尾提到“用身高预报体重时,需要注意下列问题:......”,这些论述
适用于所有的回归模型。
V模型适用的总体;
V模型的时间性;
V样本的取值范围对模型的影响;
V模型预报结果的正确理解。
■又如教科书上所列“建立回归模型的基本步骤”,不仅适用于线性回归模型,也
适用于所有的回归模型。
V对研究对象的背景分析;
V利用散点图判断模型类别;
V估计模型参数;
V残差分析,模型诊断。
■案例2蕴含如下的思想:
对于同样的数据,有不同的统计分析方法可供选
择,要用最有效的方法分析数据。
在讲完例2通过引导学生们讨论“是不是还有其它的效果更好的模型来拟合例
2中的数据?”,获得上述结论。
在第二节的教学过程中应该注意如下问题
1.反证法原理与假设检验原理比较。
反证法原理:假设检验原理:
在假设一个论述不成立的前提在假设一个论述不成立
下,如果推出一个矛盾,就证明的前提下,如果一个与该
了这个论述成立。假设矛盾的小概率事件
发生,就推断这个论述成
立。
2.独立性检验相当于建立一个判另!J“两个分类变量之间有关系”这一结论
是否成立的规贝!J,并且给出该规则把“两个分类变量之间没有有关系”错判成“两
个分类变量之间有关系”的概率。
3.通过图形直观判断,只能定性地判断两个分类变量是否有关系,无法知道所得结论的可
信程度,因此需要用列联表检验。
4.推导统计量/用意是建立判定吸烟与患肺癌是否有关系的指标,以便根据指标的实际
含义建立判别规则。使同学了解统计量K2的实际含义:/越大,结论“吸烟与患肺
癌没有关系”成立的可能性就越小。
5.在教学的过程中强调:只是在上述统计量/的实际含义之下,才能建立如下的判别规
贝I」:
如果火大于或等于匕),就判断•“吸烟与患肺癌有关系”成立;否则就
判断这个结论不成文。
其中临界值即需要在收集数据之前确定。
6.要根据把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的概率确定临界值,
即根据
P(K』°)
的概率大小来确定金。判别规则的错判概率是通过这种想法来控制的。
7.在教学的过程中,对于概率的近似计算公式
产依26.635)=0.01
要强调如下的几个问题:
a)这个公式是在“吸烟与患肺癌没有关系”成立的条件下成立的。这意味着如果我们按
照如卜的规则来判断“吸烟与患肺癌有关系”是否成立:
如果由样本数据计算出的K2值大于6.635,就判断“吸烟与患肺癌有
关系”成立;否则就判断•这个结论不成立。
b)强调这个概率公式是一个近似公式。样本数据的个数越大,公式中的概率越近似等
于0.01。为保证公式的近似程可以接受,在实际应用中要求min{a力,c,d}25,
即列联表的各个格子中的数据都要大于或等于5。
8.结果的解释:女254.721>6.635解释为有99%的把握断定“吸烟与患肺癌有关”即:
若按如下规则
若产26.635,就断定“吸烟与患肺癌有关
进行判断,则把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的可能性不
超过0.01。
9.总结“两个分类变量独立性检验”的木质:
a)要解决的问题:建立判断结论
H,:分类变量x与y之间有关系
是否成立的规则。
n(ad-6cI
b)判别指标:
(a+b\c+d\a+c\b+d)
c)判别规则心:如果K?判定Ho成立;否则认为Ho不成立。该规则把“吸烟与
患肺癌没有关系”错判成“吸烟与患肺癌有关系”的概率为
P依洛)
10.表3-10的用处是给出了一些规则的犯把“吸烟与患肺癌没有关系”错判成“吸烟与患肺
癌有关系”错误的概率。
11.归纳两个分类变量独立性检验的基本思想:
当K?=7——
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 方程人生北师大初一应用题
- 人教版七年级语文学习攻略
- 北师大版整式乘除计划制定
- 拨一拨激发孩子的学习热情
- 人教版写字课写出漂亮汉字
- 数学八年级人教版几何题型总结
- 苏教版三年级数学年月日的秘密
- 五年级北师大版数学学习策略
- 六年级上册苏教版数学教案教学案例分析
- 苏教版二年级钟表易错题练习与解析
- 专题15热学(讲义)-
- 初二家长会概况课件
- DB37T 4696-2024 烟花爆竹批发企业安全生产风险管控和隐患排查治理体系实施指南
- 系统可行性方案论证要点
- 碎石筛分自动计算绘制曲线
- 反强迫劳动、反歧视、反骚扰培训
- HXD3、HXD3CA型电力机车应急故障处理
- 金融服务业的风险评估方法
- 合理用血持续改进QCC品管圈PDCA案例3例
- 陕西师范大学学士学位英语考试题
- 蛟龙探海完整
评论
0/150
提交评论