版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章概率统计基础第一页,共七十四页,2022年,8月28日提要介绍计量经济分析的概率统计基础知识包括随机性和概率、随机变量和概率分布、参数估计和假设检验在相同的概率统计知识平台上学习计量对于学习和理解计量经济分析方法有启发有较好概率统计基础的读者阅也会有所收获。
第二页,共七十四页,2022年,8月28日随机现象事件事件概率随机现象:事前不可预言的现象,即在相同条件下重复对一个现象进行观察,每次观察的结果具有多种可能性,而且在每次观察之前都无法预言会出现哪一个结果,这种现象称为随机现象。事件:对现象观察(试验)的结果。对某种自然现象作一次观察称为一个试验。
第三页,共七十四页,2022年,8月28日事件在一次观察(试验)中是否发生是不确定的,但在大量重复观察(试验)中,它的发生具有统计规律性。当试验的次数很大时,事件A发生的频率具有一定的稳定性,当事件A发生的频率稳定地在某一常数p附近摆动,则称常数p为事件A的概率。第四页,共七十四页,2022年,8月28日概率的频率定义概率定义:第五页,共七十四页,2022年,8月28日条件概率和统计独立性
条件概率
已知事件B发生的条件下,事件A发生的概率,称为A以B为条件的“条件概率”。第六页,共七十四页,2022年,8月28日事件独立性若果事件A发生的可能性不受事件B发生与否的影响则称它们是“统计独立的”。
第七页,共七十四页,2022年,8月28日随机变量和概率分布在概率统计和计量经济分析中,人们更关心的是有随机性的经济指标水平,都是数量化的随机事件。例如某时刻的股票价格,某天某银行吸收的存款数量,某商场某月的销售额,某商品的市场价格水平等。第八页,共七十四页,2022年,8月28日随机事件都可以采取数量标识,扔骰子的点数、某地区的降雨量。对随机现象观察的结果有多种可能性(多个事件),每一个可能结果(每一事件),都对应一个实数,这个实数随观察的结果而改变,观察的结果是一个变量,称之为随机变量。第九页,共七十四页,2022年,8月28日例如:(1)射击击中目标记为1分,未中目标记0分。用ξ表示射击的得分,它是随机变量,可取0和1两个值。(2)抛一枚硬币,ξ表示正面出现的次数,它是随机变量,可取0和1两个值。(3)某段时间内候车室旅客数目记为ξ,它可取0及一切不大于最大容量M的自然数。(4)一块土地上农作物的产量ξ是随机变量,它可以取区间[0,T]的一切值。第十页,共七十四页,2022年,8月28日随机变量按取值情况分为两类:(1)离散型随机变量只可能取有限个或无限可列个值。(2)非离散型随机变量可以在整个数轴上取值,或至少有一部分值取某实数区间的全部值。非离散型随机变量中最常用的是连续型随机变量。即取值于一个连续区间全部数值的随机变量。第十一页,共七十四页,2022年,8月28日(二)概率分布随机变量重要的是它们取特定值的可能性,称为随机变量的“概率分布”(Probabilitydistribution)(概率函数)。离散型随机变量只能取有限或可数个值,概率分布可以用罗列、表格、图形表示等。连续要用分布函数。第十二页,共七十四页,2022年,8月28日
ξ123456P 1/61/61/61/61/61/6
连续型随机变量要用分布函数和概率密度函数第十三页,共七十四页,2022年,8月28日(三)分布函数连续型随机变量可能的取值无穷多,每个取值(每个事件)的概率无穷小,无法用罗列概率方法表达研究。只能用反映随机变量的取值在某个特定范围内的概率“分布函数”来描述。分布函数——随机变量取值不大于给定水平的概率构成的函数:
第十四页,共七十四页,2022年,8月28日分布函数反应的是随机变量取值落在(-∞,x)这个区间的概率大小。已知随机变量的分布函数就知道了随机变量在任何区间上取值的概率,分布函数完整地描述了随机变量的情况,掌握分布函数就等于掌握了随机变量的随机性规律。第十五页,共七十四页,2022年,8月28日(四)密度函数连续型随机变量概率分布另一个概念,“密度函数”(Densityfunction)或称“概率密度函数”。密度函数密度与分布函数关系第十六页,共七十四页,2022年,8月28日
1.定义(p33)
对于随机变量X,若存在非负函数f(x),(-<x<+),使对任意实数x,都有则称X为连续型随机变量,f(x)为X的概率密度函数,简称概率密度或密度函数.常记为X~f(x),(-<x<+)第十七页,共七十四页,2022年,8月28日密度函数的几何意义为第十八页,共七十四页,2022年,8月28日三、随机变量的数字特征
(一)期望
(二)方差
(三)期望和方差的性质
(四)协方差和相关系数
第十九页,共七十四页,2022年,8月28日(一)数学期望的定义例1设某班40名学生的概率统计成绩及得分人数如下表所示:分数4060708090100人数1691572则学生的平均成绩是总分÷总人数。即数学期望——描述随机变量取值的平均特征(集中趋势)第二十页,共七十四页,2022年,8月28日为X的数学期望,简称期望或均值。第二十一页,共七十四页,2022年,8月28日例:掷一颗均匀的骰子,以X表示掷得的点数,求X的数学期望。定义3若X~f(x),-<x<,
为X的数学期望。则称第二十二页,共七十四页,2022年,8月28日(二)方差方差是衡量随机变量取值波动程度的一个数字特征。?如何定义?第二十三页,共七十四页,2022年,8月28日1.
定义若E(X),E(X2)存在,则称E[X-E(X)]2为r.v.X的方差,记为D(X),或Var(X).称 为的标准差可见第二十四页,共七十四页,2022年,8月28日(四)协方差和相关系数1.协方差定义若X的期望E(X)和Y的期望E(Y)存在,则称COV(X,Y)=E{[XE(X)][YE(Y)]}.当COV(X,Y)=0时,称X与Y不相关。?“X与Y独立”和“X与Y不相关”有何关系?第二十五页,共七十四页,2022年,8月28日
2.定义若X,Y的方差和协方差均存在,且DX>0,DY>0,则称为X与Y的相关系数.
3.相关系数的性质
(1)|XY|1;(2)|XY|=1存在常数a,b使P{Y=aX+b}=1;(3)X与Y不相关XY=0;第二十六页,共七十四页,2022年,8月28日四、常见分布
(一)正态分布
(二)分布
(三)t分布
(四)F分布
第二十七页,共七十四页,2022年,8月28日正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。A,B间真实距离为,测量值为X。X的概率密度应该是什么形态?AB(一)正态分布第二十八页,共七十四页,2022年,8月28日其中为实数,
>0,则称X服从参数为,2的正态分布,记为N(,2),可表为X~N(,2).若随机变量第二十九页,共七十四页,2022年,8月28日
(1)单峰对称
密度曲线关于直线x=对称; f()=maxf(x)=.正态分布有两个特性:第三十页,共七十四页,2022年,8月28日(2)的大小直接影响概率的分布越大,曲线越平坦,越小,曲线越陡峻,。正态分布也称为高斯(Gauss)分布第三十一页,共七十四页,2022年,8月28日4.标准正态分布
参数=0,2=1的正态分布称为标准正态分布,记作X~N(0,1)。第三十二页,共七十四页,2022年,8月28日分布函数表示为其密度函数表示为第三十三页,共七十四页,2022年,8月28日一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值。如,若Z~N(0,1),(0.5)=0.6915,P{1.32<Z<2.43}=(2.43)-(1.32)注:(1)(x)=1-(-x);(2)若X~N(,2),则第三十四页,共七十四页,2022年,8月28日例:一种电子元件的使用寿命X(小时)服从正态分布N(100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率.解:设Y为使用的最初90小时内损坏的元件数,故则Y~B(3,p)其中第三十五页,共七十四页,2022年,8月28日判断正态分布根据密度函数的形态进行判断:用频数直方图的上方边缘作为密度函数的近似,判断随机变量是否服从正态分布。
根据偏度、峰度特征检验:利用观测样本计算三阶矩和四阶矩的近似值(与后面讲的抽样分布有关),偏度和峰度近似值,如果接近0和3,则认为随机变量服从正态分布,也称“通过了正态性检验”。
第三十六页,共七十四页,2022年,8月28日第三节参数估计和假设检验
随机变量取值往往无穷多,不可能通过全面调查了解总体分布,只能根据从总体抽取的部分样本推断总体情况。这称为“统计推断”,包括参数估计和假设检验等。计量经济分析的观测数据相当于随机变量总体抽取的样本,计量经济的回归分析就是根据样本推断总体情况,因此计量经济分析与统计推断有非常密切的联系。第三十七页,共七十四页,2022年,8月28日一、总体与样本
1.总体:研究对象的全体。通常指研究对象的某项数量指标。组成总体的元素称为个体。从本质上讲,总体就是所研究的随机变量或随机变量的分布。第三十八页,共七十四页,2022年,8月28日2.样本:来自总体的部分个体X1,…,Xn如果满足:(1)同分布性:
Xi,i=1,…,n与总体同分布.(2)独立性:
X1,…,Xn
相互独立;则称为容量为n的简单随机样本,简称样本。而称X1,…,Xn
的一次取值为样本观察值,记为x1,…,xn
第三十九页,共七十四页,2022年,8月28日3.总体、样本、样本观察值的关系总体样本样本观察值?理论分布统计是从手中已有的资料——样本观察值,去推断总体的情况——总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体第四十页,共七十四页,2022年,8月28日二、统计量定义:称样本X1,…,Xn的函数g(X1,…,Xn)是总体X的一个统计量,如果g(X1,…,Xn)不含未知参数几个常用的统计量:
第四十一页,共七十四页,2022年,8月28日三、抽样分布
统计量的分布称为抽样分布。数理统计中常用到如下三个分布:
2—分布、
t—分布F—分布。第四十二页,共七十四页,2022年,8月28日(一)
2—分布第四十三页,共七十四页,2022年,8月28日2.2—分布的密度函数曲线a.分布可加性若X
~2(n1),Y~2(n2),X,Y独立,则
X
+
Y
~2(n1+n2)b.期望与方差
若X~2(n),则E(X)=n,D(X)=2n第四十四页,共七十四页,2022年,8月28日1.构造若~N(0,1),~2(n),与独立,则t(n)称为自由度为n的t—分布。(二)t—分布第四十五页,共七十四页,2022年,8月28日t(n)
的概率密度为第四十六页,共七十四页,2022年,8月28日2.基本性质:
(1)f(t)关于t=0(纵轴)对称。
(2)f(t)的极限为N(0,1)的密度函数,即
3.分位点设T~t(n),若对:0<<1,存在t(n)>0,满足P{Tt(n)}=,则称t(n)为t(n)的上侧分位点第四十七页,共七十四页,2022年,8月28日注:第四十八页,共七十四页,2022年,8月28日(三)F—分布
1.构造若1
~2(n1),2~2(n2),1,2独立,则
称为第一自由度为n1,第二自由度为n2的F—分布,其概率密度为第四十九页,共七十四页,2022年,8月28日2.F—分布的分位点对于:0<<1,若存在F(n1,n2)>0,满足P{FF(n1,n2)}=,则称F(n1,n2)为F(n1,n2)的上侧分位点;第五十页,共七十四页,2022年,8月28日四、正态总体的抽样分布定理证明:是n个独立的正态随机变量的线性组合,故服从正态分布第五十一页,共七十四页,2022年,8月28日(3)证明:且U与V独立,根据t分布的构造得证!第五十二页,共七十四页,2022年,8月28日五、参数估计的概念
定义设X1,…,Xn是总体X的一个样本,其分布函数为F(x;),。其中为未知参数,为参数空间,若统计量g(X1,…,Xn)可作为的一个估计,则称其为的一个估计量,记为注:F(x;)也可用分布律或密度函数代替.第五十三页,共七十四页,2022年,8月28日若x1,…,xn是样本的一个观测值。
由于g(x1,…,xn)
是实数域上的一个点,现用它来估计,故称这种估计为点估计。
点估计的经典方法是矩估计法与极大似然估计法。第五十四页,共七十四页,2022年,8月28日估计量的评选标准第五十五页,共七十四页,2022年,8月28日区间估计
一、概念
定义:设总体X的分布函数F(x;)含有未知参数,对于给定值(0<<1),若由样本X1,…,Xn确定的两个统计量使则称随机区间为的置信度为1的置信区间注:F(x;)也可换成概率密度或分布律。第五十六页,共七十四页,2022年,8月28日第五十七页,共七十四页,2022年,8月28日
正态总体参数的区间估计1、2已知第五十八页,共七十四页,2022年,8月28日/2/21-可取第五十九页,共七十四页,2022年,8月28日(1-)1-的置信度为1的置信区间为注:的1置性区间不唯一。都是的1置性区间.但=1/2时区间长最短.第六十页,共七十四页,2022年,8月28日求正态总体参数置信区间的解题步骤:
(1)根据实际问题构造样本的函数,要求仅含待估参数且分布已知;(2)令该函数落在由分位点确定的区间里的概率为给定的置信度1,要求区间按几何对称或概率对称;(3)解不等式得随机的置信区间;(4)由观测值及值查表计算得所求置信区间。第六十一页,共七十四页,2022年,8月28日
2、2未知m的1-a置信区间为1-即得第六十二页,共七十四页,2022年,8月28日第六十三页,共七十四页,2022年,8月28日六、统计检验(一)统计检验基本原理(二)假设检验第六十四页,共七十四页,2022年,8月28日(一)假设检验的原理首先设想H0是真的,然后考虑在H0成立的条件下,将观测到的样本应出现的区间(样本以很大的概率落入的区间)。如果样本落入该区间,则接受原假设。如果样本没有落入该区间,则称一个小概率事件发生了,根据小概率原理,概率很小的事件在一次试验中是不可能发生的,因此否定原假设。第六十五页,共七十四页,2022年,8月28日(一)假设检验的原理第六十六页,共七十四页,2022年,8月28日由样本推断总体,可能会犯错误第一类错误:原假设H0符合实际情况,检验结果将它否定了,称为弃真错误。第二类错误:原假设H0不符合实际情况,检验结果无法否定它。称为取伪错误。第六十七页,共七十四页,2022年,8月28日对于给定的一对H0和H1,总可找出许多临界域,人们自然希望找到这种临界域W,使得犯两类错误的概率都很小。奈曼—皮尔逊(Neyman—Pearson)提出了一个原则:“在控制犯第一类错误的概率不超过指定值的条件下,尽量使犯第二类错误小”按这种法则做出的检验称为“显著性检验”,称为显著性水平或检验水平。第六十八页,共七十四页,2022年,8月28日?怎样构造的拒绝域方可满足上述法则?如:对总体X~N(,1),要检验H0:=0;H1:=1显著性检验的思想和步骤:(1)根据实际问题作出假设H0与H1;(2)构造统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 毕业实习生自我鉴定
- 银行安全生产会议
- 在医院的实习报告范文集合七篇
- 感恩主题演讲稿锦集5篇
- 幼儿园防空防灾安全教育
- 防止金融诈骗讲座
- 学生会成员工作总结
- 2022年大学生积极分子思想汇报
- 教学设计方案范文集锦7篇
- 捐资助学倡议书范文汇编10篇
- Rexroth (博世力士乐)VFC 3610系列变频器使用说明书
- 黑龙江龙江森工集团招聘笔试题
- 大班美术教案:拉手小人教案及教学反思
- 《Python Web 企业级项目开发教程(Django 版)》课后答案
- 铜及铜合金物理冶金基础-相图、紫铜
- 智慧酒店无人酒店综合服务解决方案
- 考研英语一新题型历年真题(2005-2012)
- 健身房会籍顾问基础培训资料
- 9脊柱与四肢、神经系统检查总结
- 秀场内外-走进服装表演艺术智慧树知到答案章节测试2023年武汉纺织大学
- 【高分复习笔记】王建《现代自然地理学》(第2版)笔记和课后习题详解
评论
0/150
提交评论