计量经济学的统计学基础知识_第1页
计量经济学的统计学基础知识_第2页
计量经济学的统计学基础知识_第3页
计量经济学的统计学基础知识_第4页
计量经济学的统计学基础知识_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节 常用的统计量平均数、方差 第二节 常用的概率分布 复习: 什么是计量经济学? 计量经济学与其他学科有什么关系? 计量经济学研究现实问题的程序是什么? 第一节 常用的统计量平均数、方差 一、算术平均 算术平均(arithmetic mean)就是我们日 常生活中使用的普通的平均数,其定义如 下式: n X n XXX X n 21 二、加权算术平均 n加权平均(weighted arithmetic mean)是将 各数据先乘以反映其重要性的权数(w),再 求平均的方法。其定义如下式: w Xw www XwXwXw X ii n nn w 21 2211 三、变化率 n变化率的定义如下

2、式: ), 3 , 2( 1 1 nt X XX t tt 四、几何平均 几何平均(geometric mean)是n个数 据连乘积的n次方根,其定义如下式: n n XXXG 21 五、移动平均 n 所谓移动平均(movingaverage), 就是对时间序列数据的前后数据求平均, 将不必要的变动( 循环变动、季节变动 和不规则变动)平滑(smoothing),也 即剔除这些变动,从而发现长期变化方向 的一种方法。 n通常,移动平均大多用简单的奇数项来计算,下面 是3项移动平均和5项移动平均的定义。 n3项移动平均: 3 11 ttt t XXX X 5项移动平均: 5 2112 ttttt

3、 t XXXXX X EXCEL演示 三项移动平均 五项移动平均 六、方差与标准差 n为了了解数据的结构,有必要考察数据的集 中趋势和分散的程度。对于集中的趋势,我们 从前面学习过的算术平均中已经大体有所了解 ,而对于分散的程度,通过对方差(variance )与标准差(standard deviation),以及下 一节将要介绍的变动系数的计算,能够得到很 多信息。 方差的计算方法是,先将每个数据与算术平 均数之差(即离差)的平方相加求和,再除于样 本数减一。而标准差是方差的正的平方根。由于 方差是通过平方计算的,它与原数据的次数有所 不同,而标准差由于是方差的平方根,因而又与 原数据的次数

4、相同。因此,标准差与原数据的单 位相同,而方差则不附加单位。 方差S2的定义分别如下式(样本): 1 )()()( 22 2 2 12 n XXXXXX s n 2 )( 1 1 XX n i 标准差S的的定义分别如下式: 2 SS方差 七、变动系数 变动系数(coefficient of variation)又称变异 系数,它用标准差S除于算术平均数的商来表示。 变动系数CV的定义如下式: X S CV 算术平均数 标准差 八、标准化变量 标准差变量(standardized variable),又称基准化 变量,它是用来测量某个数据的数值与算术平均数的 偏离程度,是标准差s的多少倍。借此可

5、以看出该数 据在全体数据所处的位置。标准化变量z的定义如下 式: s XXX z 标准差 算术平均数 九、相关系数 所谓相关系数(correlation coefficient)是 用来测量诸如收入与消费、气温和啤酒的消费 量、汇率与牛肉的进口价格等两个变量X、Y之 间的相互关系的大小和方向(正或负)的系数。 通过计算相关系数,可以知道X与Y之间具有多 大程度的线性(linear)关系。相关系数R的定 义如下式: 相关系数的R的取值范围为,R的取值具有以下 的不同含义: (1)R=1完全正相关 (perfect positive correlation) (2)R0 正相关(positive

6、correlation) (3)R=0 不相关(no correlation) (4)R0 负相关(negative correlation) ( 5 ) R = - 1 完 全 负 相 关 ( p e r f e c t negative correlation) 为什么会有上述结果?请结合公式思考。 第二节 常用的概率分布 经济计量模型研究具有随机性特征的经济变量关 系。本节将对数理统计中常用的随机变量分布及 一些概念作一简单回顾。 一、概率分布 二、总体与样本 三、正态分布 四、抽样分布 一、概率分布 随机变量在各个可能值上出现的概率的大小的情况, 叫概率分布。概率分布可用概率函数描述。

7、 离散性随机变量X的可能取值为xi,P为概率,则概 率函数为 P(X= xi ) i=1,2,3, n 概率函数满足 P(X= xi )0; 1)( 1 n i i xXP 一、概率分布 连续性的随机变量概率函数 1)(0)( )( )( dxxfxf xf xdxxfbXaP b a b a ; 函数满足条件为概率密度函数。密度其中 )( dxxfxXPxF xXPxF xFxxX x i xx i i )()()( )()( . 连续性随机变量, 离散性随机变量, )(的函数,记为值的累积概率是取小于某个随机变量 率的累积,即数表示。分布函数是概概率分布还可用分布函 二、总体与样本 数理统

8、计中把所研究对象的全部单位所组成的 集合,叫做总体。从总体中抽出的部分单位所 组成的集合,叫做样本。 三、正态分布 当连续的随机变量的概率密度函数形式为 时,称X的分布为正态分布,记为X , 密度函数中 和 是X的数学期望和方差。 2 2 2 )( 2 1 )( x exf ),( 2 N 2 三、正态分布(总体分布) 当 和 时,称X服从标准正态 分布,记为X 。 对于非标准正态分布的X,总可以作如下变 换, ,使Z服从标准正态分布。 0 1 2 ),( 10N X Z 四、抽样分布 1、 分布 2、 t 分布 3、 F 分布 注:正态母体子样分布性质: 2 i i ii i aUD aUE

9、 XaU X 22 )( )( 子样是来自正态母体的随机 1、 分布 2 2 n i i X 1 22 )(统计量定义为 Xi符从正态分布。 xi服从标准正态分布, 服从自由度为n的卡方分布,卡方分布其实 就是残差平方和。 n i i x 1 2 2 2 2 00 0)( ) 2 (2 1 )( 2 2 1 2 2 2 2 2 2 2 当 当 n n n n e n g 分布的密度函数为: nnE 22 )( nnD22)( 22 其数学期望 其方差为 , 2 S 2 统计量的条件,所以 服从自由度为n-1的分布。 2 S 2 样本方差符合 N=4 N=15 如果随机变量X服从标准正态分布N(

10、0,1);随机 变量 服从自由度为n、方差为2n的 分布。并且 X和 相互独立,则统计量: 2 2 2 n X t 2 服从t分布(注:可以 将分子理解为符合正 态分布的参数,分母 看作其标准差。 2、 t分布 t分布的密度函数为 2 1 2 )1 ( ) 2 ( ) 2 1 ( )( n n n t n n n tf 其数学期望E(t)=0,方差 2 2 n n t分布的特点是: 左右对称;当n很大时,非常接近正态分布。 对于从标准正态分布中的总体中抽的容量为n的简 单随机样本,其样本均值 与样本标准差S构成如 下统计量。 x 1/ nS x t 服从自由度为n-1的t分布,记为tt(n-1

11、)。 注意:这里的分母是子样标准差除以自由度 ,实际上是子样均值的标准差!只有这样才 与分子保持一致性。分子被平均了,分母当 然也要平均! t分布在小样本(n30)统计推断中占有重要的地位。 T分布图形:正态分布相当于标准差为1的t分布。 而t分布的标准差多小于1。因而出现这种尾部肥 大的现象。 正态分布 T分布 如果随机变量Xi(i=1,2,3,n),Yi(i=1,2,3,n)是相互 独立的,而且服从相同的正态分布 。 令 3、F分布 ),( 2 N 2 2 2 2 1 2 2 1 3 , 2 , 1,)( 3 , 2 , 1,)( niYYS niXXS i i ) 1/( ) 1/( 2

12、 2 2 1 2 1 nS nS F 1 1 n 1 2 n 1 1 n1 2 n 则统计量 服从第一自由度 、第二自由度 的F分布。记为FF(,) 3、F分布 注:F分布在方差分析中有着重要的作用。例如判断 两个正态分布总体的方差是否有显著差异,需要利 用F分布。其分子与分母其实是两个方差,在进行回 归检验时正是利用F函数这个特点。 F分布图形 例1:正态分布检验 设甲、乙两台机床生产同类型产品,其产品重 量分别服从方差为70克( )与90克 ( ) 的正态分布。从甲机床中随机地取出35件,其 平均重量是137克,独立地从乙机床随机取出 45件,其平均重量130克,问在显著性为0.01 时,

13、两台机床的产品就重量而言有无显著差异? 2 1 2 2 解: 理论: 1 222 2 2 1 1 0 2 2 1 1 21 2 2 1 1 21 2 2 2 1 1 1 211210 2 2 1 1 2 22 1 11 )1 ,0( , )1 ,0( )( ),( ),(),( :;: , ),( ),( H,uU,uuUP N nn YX U rightHif N nn YX U nn NYX n Y n NX HH if NY NX 则接受如果查附表知 已知 例2:比较两种安眠药A、B的疗效, 以10个患者为实验对象,数据如下: 患者12345678910 X0.1-0.

14、4.63.4 Y 0.7-1.6-0.2-1.2-0.802 z=x- y 1.301.4 问:在显著性水平为0.01时,两种药的 疗效是否相同?(T分布) 解:由于患者相同,可以建立z变量, 然后假设z的均值是0,对其进行t单 侧检验 即两种药效不同接受拒绝, 062. 425. 3)9( 062. 4 39. 0 58. 1 1/ ,01. 0 0: 0: ),( 10 01. 0 1 0 2 H,H t ns z t H H Nz YXz 例3(卡方分布):设已知维尼纶纤度在正常 生产条件下服从正态分布N(1.4

15、05, 0.002304)。在生产某段时间,抽取了5根纤 维,测得其纤度为1.32, 1.55, 1.36, 1.4, 1.44. 问该段时间母体方差是否正常?(显著性水平是0.1) 解: 纤度方差有变化拒绝,H xx ns xn H i 2 2 0 2 0 2 95. 0 2 2 95. 0 2 05. 0 22 0 2 2 0 2 2 2 2 0 2 0 048. 0: )4( 488. 9)4(,711. 0)4( 5 .13 048. 0 0312. 0 )( 414. 1, 5 048. 0: 9.4913.5 例4(F):甲乙两台机床加工同一种轴。 从这两台机床加工的轴中随机抽取若干 根,没得直径(单位为毫米)为: 假定各台机床加工轴的直径分别服从正态分布,试 比较甲乙两台机床加工的精度有无显著差异。显 著性取0.05(拒绝原假设水平)。如果是单侧检 验呢? 机床 甲20.519.719.820.420.1201919.9 机床 乙9.720.820.519.819.420.619.2 解: 0025. 0 025. 0 1 2* 2 2* 12 1 2* 2 2* 2 2* 22 1 2* 11 2 2 2 10 ),7 , 6( 17. 5)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论