版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计量经济学第一章 概率论基础 一、随机现象、随机试验和随机事件 1.统计规律性、随机现象、随机试验 确定性现象 有一类现象,在一定条件下必然发 生。这类现象称为确定性现象。不确定现象 有一类现象,在一定条件下不一定发生。 这类现象称为不确定性现象A. 统计规律性 统计规律性 在一定条件下,不确定现象可能出现,可 能不出现,但在大量的重复试验中,它按照一 定的规律分布。这种在大量重复试验或观察 中所显现出的固有规律性,称为统计规律。 B随机现象 在个别试验中其结果显出不确定性,但大量重复试验中其结果又具有统计规律性的现象,称为随机现象。 在相同条件下试验可以重复进行。在每次试验之前不能准确地预言
2、该次试验将 出现哪一种结果。C随机试验一般用E表示随机试验每次试验的结果具有多种可能性,而且在试验 之前可以明确试验的所有可能结果。 2. 随机事件 A. 样本空间、样本点 样本空间 将随机试验的所有可能结果组成的集合称为的样本空间,记为 样本点 样本空间中的元素,即试验E的每个结果,称为样本点。 随机试验E的样本空间的子集称为随机事件, 简称为事件。基本事件 由一个样本点组成的单点集,称为基本事件。 B.随机事件、基本事件必然事件 在每次试验中它总是发生,称它为必然事件。不可能事件 在每次试验中都不会发生,称之为不可能事件。随机事件C事件间的关系及事件的运算 1. 事件包含。若事件A发生必然
3、导致事件B 发生, 则称事件B包含事件A。 2. 事件和。3.事件积。 称为事件A与事件B的积事件 称事件A与事件B的和事件4.事件 称为A事件和B事件的差事件 则称事件A与事件B是互不相容事件, 或互斥事件,也就是事件A和事件B不能同时发生。 5.若 6.若 且 则称事件A与事件B是互为逆事件,也称事件A与事件B互为对立事件。 D. 随机事件运算法则设A、B、C 为事件 交换律: 结合律: 分配律:德.摩根定律: 二、随机事件的频率与概率 1. 随机事件的频率A.随机事件频率的一般定义在相同的条件下,进行了n次试验,在试验中,事件A发生的次数记为nA,称为事件A发生的频数. nA /n 称为
4、事件A发生的频率,并记成fn(A)B频率的基本性质: 01.2. 是两两不相容的事件,则 3. 2. 随机事件的概率 (1)概率的定义如果集合函数P(A)满足下列条件:1.对于每个事件A,有 3.设是两两不相容的事件,即对于则有:A.随机事件概率的一般定义2.则称P(A)为事件A的概率此式称为概率的可列可加性(2)概率的性质 12 3 更有 ,则有若 是两两不相容的事件,则有 若5 对于任意的事件A、B,有 此性质推广到任意的n个事件 之和,则有:4 B.随机事件古典概型(1)古典概型的定义 若试验具有如下特点:a. 试验的样本空间的元素只有有限个;b. 试验中每个基本事件发生的可能性相同,
5、C. 条件概率、随机事件的独立性1条件概率 设A、B是两个事件,且 称为事件A发生的条件下事件B发生的条件概率。 2乘法定理 设则有 一般情况下,设 为n个事件,且 则有 3事件的独立性 设A、B是两个事件,如果等式 成立,则称事件A、B为相互独立的事件 D全概公式、贝叶斯(Bayes)公式(1)全概公式设E的样本空间为,A为E的一个事件, 为的一个划分 则 设E的样本空间为,A为E的一个事件, 为的一个划分 则 (2)贝叶斯(Bayes)公式三、 随机变量 1随机变量的定义2分布函数 设 X是一个随机变量,x是任意实数,称为X的分布函数 函数如果对于每一个 ,有一个实数 与之对应,这样就得到
6、一个定义在上的单实值 ,称它为随机变量. 函数3离散型随机变量、连续型随机变量 A离散型随机变量设随机变量X所有可能的取值为 X取各个可能值的概率 ,即事件的概率,为上式为离散型随机变量X的概率分布或分布律 B. 连续型随机变量 对于随机变量X的分布函数 F(x),若存在非负函数f(x),使对于任意实数x,有则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称为概率密度。C. 均匀分布、正态随机变量4 二维随机变量 A联合分布函数设E是一个随机试验,它的样本空间是设 X和Y是定义在上的随机变量,由它们构成的一个向量(X,Y),叫做二维随机向量或二维随机变量。 设(X,Y)是二维随
7、机变量,对于任意实数(x,y),二元函数 称为二维随机变量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。=W(1)二维离散型的随机变量 如果二维随机变量(X,Y)所有可能取的值是有限个或可数无限个,则称(X,Y)是离散型的随机变量。如果存在非负的二元函数f(x,y)使对于任意x和y则称(X,Y)是二维连续型随机变量,函数f(x,y)联合概率密度,或称为随机变量X和Y的联合概率密度。有连续型随机变量的边际分布: 离散型随机变量的边际分布: B 边际分布 由(X,Y)的联合分布函数F(x,y)确定: C. 条件分布、随机变量的独立性(一)条件分布 (1)离散型 (X,Y)是二维离散型随
8、机变量,对于固定的j, ,则为在Y=yi条件下随机变量Y的条件分布律 若为在X=xi条件下随机变量Y的条件分布律 (2)连续型 设 (X,Y)的分布函数为F(x,y), 概率密度为f(x,y)。同样对于固定的i,若,则则称 为在条件Y=y下X的条件分布函数为Y=y条件下X的条件概率密度。 若在点(x,y)处f(x,y)连续, 边际概率密度f Y (y)连续,且若边际概率密度fx(x)连续,且则为在条件X=x下Y的条件分布函数,为X=x下Y的条件概率密度 (二) 随机变量的相互独立性 设 F(x,y)及Fx(x), Fy(y)分别是二维随机变量(X,Y)的分布函数及边际分布函数。 若对所有x,y
9、有 则称随机变量X和Y是相互独立的 随机变量常用的数字特征有:数学期望,方差,相关系数。四、 随机变量的数字特征 若级数绝对收敛,则称级数 的值为随机变量X的数学期望即 记为EX,A定义(1) 离散型随机变量的数学期望设 离散型随机变量X的分布律为: 1.数学期望则称积分 记为EX,若积分绝对收敛的值为随机变量X的数学期望 (2)连续型随机变量的数学期望 设 连续型随机变量X的概率密度函数为 f(x)即:a) d) 若X,Y相互独立,则期望的性质及其应用 (1)期望的性质 设X,Y的数学期望存在,C为常数,则:b)c) (2) 数学期望在经济中的应用(例) C. 条件期望(1)定义引入条件数学
10、期望的定义:称E(Yx)为X=x条件下,Y的条件期望,又记若 我们在前面已经定义在条件X=x下,随机变量Y的条件概率密度函数存在 若(x,y)为离散型随机变量则条件期望分别由下式给出: 称E(Xy)为Y=y条件下,X的条件数学期望。(2)离散型随机变量的条件期望记则为标准差或均方差。 2. 方差 A定义 方差记为 DX 或 Var(x)称在经济研究中常常把它作为衡量一个经济行为风险大小的标准。方差是刻画一个随机变量偏离它的均值大小的一个量。B方差的性质a)d)DX=0的充要条件是X以概率1取常数C,即b)c)设X,Y相互独立,则C契比雪夫不等式 这一不等式称为契比雪夫不等式(chebyshev
11、)。成立。设随机变量X具有限的 数学期望 EX = , 不等式 和方差 DX=2 , 则对任意的正数D 随机变量的变异系数 如果 EX0,定义函数 则称V(X)为随机变量X的变异系数 E几种主要随机变量的分布及其数字特征 (1) 两点分布(2) 二项分布 称X为服从参数为n,p的二项分布。(3) Poisson分布 (4) 正态分布和对数正态若随机变量X的概率密度函数为: 则称X服从正态分布,记为: 若随机变量的概率密度为则称X服从对数正态分布。 (5) 分布和指数分布 3 协方差及相关系数 A协方差及相关系数的定义 设X,Y为两个随机变量它们之间的相互关系用它们 之间的相关系数来描述 称为随
12、机变量X,Y的协方差,记为:即 称为随机变量X,Y的相关系数 C. 相关系数性质 的充要条件是,存在常数a,b使(2)(1)当时,X与Y之间以概率1存在线性关系。 B 协方差的性质即A. k阶原点矩定义存在,称它为X的k阶原点矩。B. k阶中心矩 存在,则称它为X的k阶中心矩。4. 随机变量的矩设 X和Y是随机变量,若若C. k+L阶混合矩 存在,称它为X和Y的k+L阶混合矩。D. k+L阶混合中心矩 存在,称它为X和Y的k+L阶混合中心矩。若若n维随机变量的协方差矩阵设n维随机变量(X1 X2 Xn)的二阶混合中心矩都存在,则称矩阵为n维随机变量(X1 ,X2 Xn)的协方差矩阵。 因而上述
13、矩阵是一个对称矩阵,一般假定C为正定的. 由于五、n维正态变量具有以下三条重要性质(证明略) 1. n维随机变量(X1 X2Xn)服从n维正态分布 的充要条件是X1 X2 Xn的任意的线性组合 服从一维正态分布。2. 若(X1 ,X2 ,Xn)服从n维正态分布 设 Y1,Y2 ,Yk是Xj(j=1,2,n)的线性函数, 则 Y1 , Y2,Yk也服从多维正态分布。这一性质称为 正态变量的线性变换不变性设(X 1 ,X 2,X n)服从n维正态分布,则 “X1, X 2, ,X n相互独立” 与 “X 1, X 2, ,X n 两两 不相关”是等价的六大数定律、中心极限定理 1大数定律 设X1
14、X2 Xn,., 是相互独立,且具有相同分布 的随机变量。 前n个随机变量的算术平均值记为则对任意的 0,有称该随机序列服从大数定律。 它在理论上表明了当试验次数很大,以频率代替概率的合理性设它们的数学期望为方差为2中心极限定理 定理 设随机变量X1 ,X2 , , Xn ,相互独立,且 服从同一分布,并具有有限的数学期望和方差:则对一切实数都有 第一章小结 本章简要地介绍了概率论的基本概念、基本定理和公式。主要内容包括: 一、随机现象、随即试验、样本空间、随机事件及其关系,随机事件的运算法则,事件的概率与频率,古典概型,乘法公式、全概公式和逆概公式,随机事件的独立性。 二、在介绍以上基本内容
15、之后,本章还介绍了一维随机变量,二维随机变量以及它们的分布函数,还分别介绍了离散型随机变量与连续型随机变量,条件分布,边际分布和随机变量的独立性。 三、这一章的第三部分介绍的内容为随机变量的数字特征。主要内容有:随机变量的数学期望、条件数学期望及它们的性质,随机变量的方差及其性质。在这同时还介绍了随机变量的数字特征和变异系数,切比雪夫不等式等。 五、这一章最后介绍了n维正态分布随机向量的性质、大数定律以及随机事件发生的频率与概率之间的关系,中心极限定理。 四、本章第四部分内容包括随机变量的协方差、相关系数、随机变量各阶矩概念及其随机向量的矩阵表示方法。 本章要点1. 随机事件、随机事件的概率2
16、. 条件概率、全概率公式、贝叶斯公式3. 随机变量及其分布,多维随机变量及其分布,条件分 布4. 随机变量的数字特征期望和方差、协方差、相关 系数5. 条件期望、切比雪夫不等式6. 多元正态分布随机变量的性质7. 大数定律及中心极限定理8. 随机变量矩的概念第二章 矩阵代数 矩阵是数学中一个极其重要的、应用广泛的概念,它是线性代数的一个重要研究对象,也是研究线性方程组解结构的主要工具。 在计量经济学研究中,它也占有非常特殊的地位,应用矩阵代数理论有时可使计量经济学问题表述简洁明了,尤其重要的是许多表面上看起来不相同的、较为复杂的结果,在实际上具有同样的结构,而且相对简单。 为了更好地理解本书后
17、面的一些内容,在这一章介绍有关矩阵代数的内容,这些内容包括矩阵的定义,矩阵的运算,矩阵的逆,线性方程组的解,矩阵的特征根和特征向量,线性交换,正交变换等基本概念和结论。一、矩阵的定义第一节矩阵及其运算 矩阵是一些符号(数)的排列,一般用大写字母A,B,C,表示,如:其中:元素aij的下标i表示这个元素在矩阵中的第i行,j表示这个元素在矩阵中的第j列,k表示矩阵A中有行k,n表示矩阵A中有n列。矩阵A中,当n=k时,称A为方阵;当 aij=aji时,称A为对称阵 当ij时,aij=0,或当ji时aij=0,则A分别称为下三角阵和上三角阵。当ij时,aij=0 ,则称A为对角阵; 特别地,当ij时
18、,aij=o,当ij时,aij=1,则称A为单位阵, 记为I或E。设 。如果m=k,n=L,且 aij=bij 对一切i=1,2,j=1,2,n都成立,则称A=B,即矩阵A与矩阵B相等。二、矩阵的运算(一)加法 (二)零矩阵、负矩阵及矩阵的减法1零矩阵。矩阵中元素全为零的矩阵称为零矩阵。定义2.1 设 是两个sn阶 矩阵,则 矩阵称为矩阵A与B之和。2负矩阵。矩阵3矩阵的减法。矩阵的减法定义为: A-B=A+(-B) A+(-A)=0称为矩阵A的负矩阵,记为-A。显然有 (三)矩阵乘法称为矩阵与数k的数量乘积,记为kA。(四)矩阵的数量乘法定义2.3 矩阵 (五)矩阵的转置定义2.4 设 所谓
19、A的转置就是指矩阵显然,sn阶矩阵的转置就是ns阶矩阵。定义2.5 n阶方阵A称为可逆的,如果有n阶方阵B,使得AB=BA=E 这里E是n阶单位矩阵, 矩阵B称为A的逆矩阵。记为A-1 2逆矩阵的求法。逆矩阵的求法一般有三种方法:(1)行变换法 求A-1。设六、矩阵的逆将单位矩阵与A矩阵并排构成一个新矩阵,把第一行与第二行互换,使矩阵第一行的第一个元素为非零元素。 将第一行元素乘-2加到第三行,使得第三行第一个元素为零。第二行元素乘3加到第三行;第三行乘1加到第二行,使第二行第三个元素为0。第三行乘2加到第一行使第一行第三个元素为0。第二行乘-1加到第一行,使第一行第二个元素为0。第三行乘以-
20、12,使第三行第三个元素为1。(2)列变换。同样以例子说明此方法: 设求A-1。(3)代数余子式法。a逆序、逆序数定义2.6 在一个排列中,如果一对数的前后位置与大小 顺序相反,即前面的数大于后面的数,那么它们就称 为一个逆序,一个排列中逆序的总数就称为这个排列 的逆序数。定义2.7 逆序数为偶数的排列称为偶排列,逆序数为 奇数的排列称为奇排列。 b行列式的计算设方矩阵它所对应的n阶行列式定义为:等于所有取自不同行不同列的n个元素的乘积的代数和 c代数余子式定义2.8 在矩阵中划去元素aij所在的第i行与第j列,剩下的(n-1)个元素按原来的排法构成一个n-1阶的行列式 称为元素aij的余子式
21、,记为Mij,称 Aij=(-1)i+j Mij为元素aij的代数余子式d矩阵A的逆矩阵A的逆可表示为:其中 (4)逆矩阵的性质如果矩阵A,B可逆,则 与AB也可逆,且第二节 线性方程组一、线性相关与线性无关(一)线性相关、线性无关定义2.9 向量称为向量组1,2s的一个线性组合, 如果存在k1,k2ks,使得当向量是向量组1,2s的一个线性组合时,也称可以由向量组1,2s线性表出。定义2.10 如果向量组1,2, s, (s2)中有一向量可以经其余向量线性表出,则向量组1,2, s, 称为线性相关的。定义2.11 一向量组的一个部分向量组称为一个极大线性无关组,如果这个部分向量组是线性无关的
22、,并且从这个向量组中任意添一个向量(如果还有的话),所得的部分向量组线性相关。定义2.12 向量组的极大线性无关组所含向量的个数称为这个向量组的秩.(二)矩阵的秩1、矩阵的行秩与列秩 定义2.13 所谓矩阵的行秩就是指矩阵的行向量组的秩;矩阵的列秩就是矩阵的列向量组的秩。2、矩阵秩的判别定理2.2 一个矩阵的秩为r的充分必要条件为矩阵中一个r阶子式不为零,同时所有(r+1)阶子式全为零。 定理2.1 矩阵的行秩与列秩相等。 定义2.14 在一个n阶的行列式D中,任意选 k行k列,位于这些行和列的交点上的 k2个元素按照原来的位置组成一个k阶行列式M,称为行列式D的一个 k阶子式,在D中划去这k
23、行k列之后,余下的元素按照原来的位置,组成的 (n-k)阶行列式称为k阶子式M的余子式。二、线性方程组(一) 一般线性方程一般线性方程是指形式为的方程组(二)线性方程组有解判别定理引入向量 于是线性方程组 可改写成向量方程 线性方程组有解判别定理 线性方程组 有解的充分必要条件为它的系数矩阵与增广矩阵有相同的秩。(三)线性方程组解的结构1. 齐次线性方程组当b=0时,则上述方程称为齐次线性方程组。齐次线性方程组有下列两个性质: (1) 两个解的和还是方程组的解(2)一个解的倍数还是方程组的解2. 线性方程组(1) 线性方程组的任意两个解之差,就是对应的齐次线性方程组的解。(2)上述线性方程组的
24、解与它对应的齐次线性方程组解 之和仍然是上述线性方程组的解。(3)如果0是上述线性方程组的解,则上述方程组的任 一解都可表示成 其中是齐次线性方程组的一个解 (4)线性方程组(5)当s=n时,方程组(2.11)有唯一解的充分必要 条件是系数矩阵可逆。有解的条件下,解唯一的充分必要条件是对应的齐次线性方程组只有零解. (四)最小二乘解1、 向量到子空间的距离定义2.16 设v是一个非空集合,P是一个数域。在集合V的元素之间定义了一种代数运算,叫做加法, 就是说,给出一个法则,对于V中任意两个元素与,在V中都有唯一的一个元素与它们对应,称为与的和,记为 =+ 。在数域P与集合V的元素之间还定义了一
25、个运算,叫做数量乘法;就是说,对于数域P中任一数k与V中任一元素,在V中都有唯一的一个元素与它们对应,称为k与的数量乘积,记为=k,如果加法与数量乘法满足下述规则,那么V 称为数域P上的线性空间。定义 2.17 设V是实数域R上的一个线性空间,在V上定义了一个二元函数,称为内积,记作(,) ,它是有以下性质:这里,,是V中任一的向量,k是任一实数。这样的线性空间V称为欧几里德空间。当且仅当=0时,(,)=0(1)(2)(3)(4)定义2.18 长度-称为向量和的距离 记为的d(,)。 距离满足三条基本性质:并且当且=仅当时等号才成立; (三角不等式)。 a.b.c.一个点到一个平面(或一条直线
26、)上所有点的距离以垂线为最短 1. 最小二乘问题。线性方程组可能无解。即任何一组数x1,x2,.,xs都可能使不等于零,我们设法找 使得上式最小。这样的称 为方程组的最小二乘解。这种问题就叫最小二乘法问题。第三节 二次型与正交变换一、二次型及正交变换定义2.19 设P是一个数域,一个系数在数域P中的二 次齐次多项式 定义2.20 设x1,x2,.,xn, y1,y2,.,yn是两组变量,系数在数域P中的一组关系式称为由y1,y2,.,ys到x1,x2,.,xs的一个线性变换,如果对应的系数行列式则称上式线性变换是非退化的 二、二次型及线性变换的矩阵表示(一)二次型的矩阵表示(二)线性变换的矩阵
27、表示(三)二次型的关系四)二次型的类型三、特征根与正交变换(一)特征根定义2.23 设A是一个线性变换,如果对于数0,存在 一个非零向量X(实际上一个向量的坐标), 使得AX=0X, 则称0为A的一个特征值,而X成为A的属于特征值0的一个特征向量。定义2.24 设A是一个n阶矩阵,是一个参数,矩阵E-A 行列式称为A的特征多项式,E-A=0的解就是A的特征根。(二)特征向量求特征向量的一般步骤:1. 求A的特征多项式E-A=0的全部根;2. 把所求的特征值逐个代入方程组对每一个特征根,解以上方程,求出一组基础解系, 它们就是属于这个特征值的k个线性无关特征向量的坐标。这样就求出了属于每个特征值
28、的全部线性无关的特征向量。四、二次型的正交变换定义2.25 如果向量、的内积为0,即(,)=0 , 则称、 为正交或垂直,记为。 定义2.26 一组非零向量,如果它们两两正交,就称它为 一正交向量组。 定义2.27 n阶实数矩阵A称为正交矩阵,如果 定理2.4 对于任意一个n阶实对称矩阵A,都存在一个n阶 正交矩阵Q,使成为对角型。定理2.5 任意一个实二次型 都可以经过正交的线性变换成平方和,其中平方项的系数就是矩阵A的特征多项式全部的根。如本章小结 矩阵代数是线性代数中的一个重要研究对象,它在计量经济学研究中占据非常重要的地位。 本章从矩阵代数的基本内容入手,系统地、简明扼要地介绍了矩阵代
29、数的主要内容。 这一章分成三节: 第一节包括矩阵的定义,矩阵运算的定义,以及逆矩阵的概念,并介绍了求逆矩阵的三种常用方法:行变换法,列变换法,代数余子式法,同时也介绍了行列式的计算方法。 第二节,介绍了向量的线性相关和线性无关的概念,矩阵的秩和余子式的概念,在这同时还介绍了矩阵秩的辨别方法。这一节的第二部分讨论了线性方程的一般理论。 从介绍齐次线性方程组基础解系开始,讨论方程组解的结构理论,方程组有无解的判别定理。最后还介绍了最小二乘法的思想及其所满足的代数条件,同时也给了最小二乘解的存在唯一性条件。 第三节介绍二次型和正交变换。这一节首先介绍二次型及线性变换的定义和它们的矩阵表示方法。在这同
30、时还介绍了矩阵合同的概念,正定二次型,半正定、负定、半负定、不定型的有关定义。这一节的最后,讨论了线性变换的特征根和特征向量,把对二次型的讨论进一步引向深入,给出了有关二次型的主要定理,并用例子说明如何寻找一个二次型的正交变换,使二次型矩阵与一个对角矩阵合同,而对角线上的元素是该矩阵的特征根。本章要点1.矩阵加法、乘法的规则。2.矩阵逆的求法。3.矩阵对应的行列式计算方法。4.一个数列逆序的概念。5.向量组的线性相关和线性无关。6.齐次线性方程组解的结构。7.非齐次线性方程组的表示法。8.线性方程组有解的充分必要条件。9.矩阵的秩。10.最小二乘解的概念及几何意义。11.二次型的定义、正定、负
31、定、不定的二次型。12.正交变换。13.特征值、特征向量。14.二次型变换成对角型的方法。第三章 数据分析方法与参数统计推断在计量经济分析推断中,其主要是根据观察到的数据进行整理,然后做出判断。因此,根据观察到的数据探讨对某些参数的估计方法是计量经济学中的主要内容之一。在介绍常用的一些估计方法及评价估计标准之前,我们先介绍一些常用的数据的平滑技术: 第一节 数据的分析方法一、算术平均(arithmetic mean) 二、加权算术平均法(weighted arithmetic mean) 三、几何平均法(geometric mean) 四、移动平均法 1、算术移动平均法 2. 移动几何平均法香
32、港股票价格指数与3年移动平均附加例1图百货店销售额原数列与中心化4项移动平均附加例2 图日元 3. k的选择 在时间序列的估计中,应用移动平均法时,观察值得到平滑,移动平均数的变化趋势也同样被平滑,以消除原时间序列的不规则变动和周期变动,其平滑程度取决于k,当k较大时,灵敏度较差,有显著的滞后现象发生;当k值较小时,预测结果可以灵敏地反映出时间序列的变化趋势。但是当k过小时,又达不到消除不规则变动和周期性变动的目的,另外还可能因为随机干扰反映过快而造成错觉,一般是利用不同的k,对估计对象进行实际试验,从中选择最佳的k。五、指数平滑法 第二节 抽样分布一、总体的分布 对任意的实数集合S,令P(S
33、)为属于S 的个体在总体中所占的比率。 当S确定后,P(S)也就唯一的确定,称这个对应的关系为总体的分布。因此可用一个随机变量X来表示总体, X的分布就是总体的分布。分布函数记为F(x), 概率密度记为f(x)。总体、个体 定义3.1 简单随机样本 设 X为具有分布函数F(x)的随机变量。若 X 1 X 2 X n 为具有同一分布函数F(x)的相互独立的随机变量,则称X 1 X 2 X n 为从总体X得到的容量为n简单随机样本,简称样本。它们的观测值x 1x 2x n为样本观测值。 设 X 1,X 2 , X n为是来自总体X的样本,g(X 1 ,X 2 Xn)是X 1,X 2 , X n 的
34、函数, 若g是连续函数且g中不含任何未知参数, 则称g(X 1, X 2 X n)是一统计量。定义3.2 统计量 二、样本的矩估计样本平均值样本方差样本标准差样本k阶(原点)矩样本k阶中心矩OLS条件: 设 是一个随机序列, 相同方差且互不相关,将这种不相关称作无序列相关。这三种特征称作最小平方条件(OLS条件) 。具有相同的期望值,三、正态总体的几个常用统计量统计量是样本的函数,它是一个随机变量。统计量的分布称为抽样分布。(一) 2分布 A. 2 统计量 C上分位点对于给定的正数, 称满足条件 分布的概率密度: B.的为上分位点(二)t分布At统计量:Bt(n) 分布的概率密度函数 C上分位
35、点(三) F分布 AF统计量BF(n1 n 2)的分布的概率密度C上分位点及其性质:(1)上分位点的定义(2)F分布的上分位点有如下的性质四、正态总体的样本均值与样本方差的分布 :方差存在)的均值为,方差为2,X 1 ,X 2 ,Xn设 令 于是,对于正态总体的 命题3.1设总体X(不管服从什么分布,只要均值和是X的一个样本,则总有有 定理3.1 设 是总体 的样本, 分别是样本均值和样本方差,则有2).与S2独立 定理 3.2 设 是总体 的样本, 分别是样本均值和样本方差,则有 定理 3.3 第三节 参数的统计推断一、参数的估计(一)、估计量的选择标准(1)无系统误差 (2)在一切无系统误
36、差的估计量中,应该选择取值最集 中的估计量.(3)当样本容量n无限增大时,它的值趋于稳定在参数 的真值附近. 我们选择估计量的原则是:在一切可能的估计量中选择具有无偏性(或相合性)和最小方差的估计量。一般估计量的相合性是大数定律的推论,无偏性和最小方差性的要求,无论在理论上还是从实际应用的观点来说都是合理的。因此,选择最优估计量的问题就集中到在一切无偏估计中选择具有最小方差的无偏估计的问题上,最小方差无偏估计又叫最优无偏估计。(二)矩估计法 (三)极大似然估计法(四)贝叶斯估计与极大极小估计1. 决策论的基本概念 2极大极小估计3贝叶斯估计 (一)假设检验的基本思想假设检验有参数假设检验和非参
37、数假设检验之分。假设检验就是通过样本获取数据对所提出的假设作出判断:是接受、还是拒绝原假设。1假设检验的两类错误假设检验的推断只用一个样本观察值作为判断的依据,因此将产生以下两个问题: 1.) 当 H0 为真时,仍可能做出拒绝H0的判断, 称为犯第一类错误.(这种可能性是无法消除的) 2.) 当H1为真时仍有可能接受H0 ,称为犯第二类错误. 二、 假设检验显著性检验 :一般来说,控制犯第一类错误的概率,使它小于或等 , 通常取0.1,0.05,0.01等值。这种只对犯第一 类错误的概率加以控制,而不考虑犯第二类错误的概率检验问题,称为显著性检验问题。 2. K值的确定给出一个较小的数,使犯第
38、一类错误的概率不超过,即使得 P拒绝为真数k是检验上述假设的一个门槛。如果:与 0的差异是显著的,这时拒绝H0 则称反之,如果:与 0的差异是不显著的,这时接受H0 则称数称为显著性水平。显著差异的判断是在显著性水平下做出的。F. 显著性水平、检验统计量称为检验统计量。统计量上面关于 与 0有无(二) 双边检验在显著性水平下,假设检验H 0称为原假设或零假设 H 1称为备择假设。 拒绝域 为临界点 (三) 单边假设检验 1. 单边假设检验的思想我们需要检验假设 2. 单边检验拒绝域的确定拒绝域为: 左边检验问题拒绝域形式为 (四) 参数假设检验问题的步骤1.根据实际问题的要求, 提出原假设H
39、0及备择假设H1 ;2.给定显著性水平及样本容量n;3.确定检验统计量以及拒绝域的形式;4.按P拒绝H0 |H0为真=求出拒绝域;5.取样,根据样本观测值确定接受还是拒绝H0 ;(五) 正态总体均值假设检验的进一步讨论1 2已知,关于的检验(1) U检验利用在H 0为真时,总体服从N(0,1)分布的统计量来确定拒绝域的,这种检验方法常称为u检验法。(2) 原假设为不等式情形需要检验的问题写成以下的形式, 取显著性水平为,现在要求检验问题(3.3.24)的拒绝域。 (3.3.24)从而得检验问题 (3.3.24) 的拒绝域为这与前面得到的检验问题的拒绝域是一致的。比较正态总体 对均值两种检验问题
40、和 我们看到尽管两者原假设H0的形式不同, 实际意义也不一样,但对于相同的显著性水平, 它们的拒绝域是相同的 在方差2 已知时2 2未知,关于的检验(t检验)检验问题的拒绝域(显著性水平为)采用作为检验统计量。 拒绝域的形式为:上述利用t 统计量得出的检验法则称为t 检验法 第四节 方差分析方法 一、单因素试验概念1因素 在试验中,考察的指标称为试验指标。影响试验指标的条件称为因素。因素可分为两类, 一类是人们可以控制的(可控因素); 一类是人们不能控制的。2. 水平 因素所处的状态,称为该因素的水平。如果一次试验中只有一个因素在改变,称为单因素试验; 如果多于一个因素在改变的试验称为多因素试
41、验。 二、方差分析方法(试验数据的分析方法)将各个总体的均值依次记为 需要检验假设: 不全相等,设因素A有S个水平 在水平A j (j=1,2,s)下,进行nj次独立试验,得到如表中所给出的结果。例3-18例3-19(一) 基本假定及模型设各个水平 下的样本 来自同方差 2 ,均值分别为 的正态总体 且设不同水平A j下的样本之间相互独立。, j与2未知。各 ij独立 其中 j与2均为未知参数,称(3.4.1)式为单因素试验方差分析的数学模型(3.4.1)(二) 方差分析的任务 1. 检验s个总体 的均值是否相等,即检验假设不全相等 2. 作出未知参数 三、平方和的分解引入总平方和其中 分解成
42、为: 其中 四、 的统计特性 且当H 0为真时 五、假设检验问题的拒绝域拒绝域具有形式拒绝域为六、未知参数的估计第四章 一元线性回归一、 回归分析1. 确定性关系2. 相关关系3. 回归分析4. 回归分析的类型一元线性回归分析 一元非线性回归分析 二元或多元回归线性(非线性)分析 第一节 一元线性回归分析 二、 一元线性回归分析一元回归考虑的只是两个变量之间的关系其中是一个随机变量,它服从正态分布 有时也称它为噪声或随机干扰项, f(x)是x的函数, 当f(x)是x的线性函数时,(一) 线性回归方程通过一组 的观察值来确定 y与x的(线性)经验关系表达式。就是本节所要研究的线性回归设的内容。
43、例4-1 假设某地区职工平均消费水平和平均收入如表4-1所示:年份平均消费支出(y)平均收入(x)年份平均消费支出(y)平均收入(x)199325.1030.00199947.1065.20199427.3035.00200053.8070.00199535.5041.20200155.5080.00199633.2051.30200266.1092.10199737.0055.20200375.00102.00199845.1060.40200480.00120.30表4-1 在平面上选定一直角坐标系,把这12对数据相应的点画在坐标系上,就可以得到散点图。 从图上可以看出,这些点大致分布在某
44、一条直线的两侧,平均收入与平均消费水平之间大体上成线性关系。如果配以一条直线,则可写成: y上方加记号“”,这是为了区别于的实际值, 是由经验公式得到的得y估计值。如果 a和b确定了, Y和X关系式就确定了 (二) a 和b 的最小二乘估计 在散点图上随便画一条直线,这条直线在y轴上的截距就是所求的a,直线的斜率就是所求的b. 把这条直线作为y与x的关系式的估计,它的准确度如何?用什么标准来衡量一条直线作为Y与X关系式效果是好的? 用所找的直线,最“接近”于这12个点作为衡量所找的直线好坏的标准,那怎样才能找到的直线与12个点最接近呢?通用的作法就是最小二乘法。实际观测值与 的差异:取平方得到
45、把所有观测值 与 差异的平方加总 这个量反映了直线与各点之间总的偏离程度,它随着不同的直线而变化的。也就是随着a和b的不同而不同,所以它是a、b的二元函数, 记为: 要找到两个数 和 ,使二元函数在 在 , 处达到最小, 即总的偏离程度最小。 (1)(2)根据例题4-1给定的12对数据 其中常数项表明当收入为零时的必要消费;而系数0.65表明收入每增加一个单位,消费平均增加0.65个单位。a=4.93b=0.65 例4-2 假设某国的货币供应量与国民收入的历史数据如表4-2所示:年份货币供应量(x)国民收入(y)年份货币供应量(x)国民收入(y)199320501999428419942555
46、200046901995326020014897199636702002501001997337220035211219984077200456117表4-2所求的回归方程为:(三)一元线性回归分析的假设条件假设1 随机误差项服从均值为0,方差为的正态分布。 假设2 随机误差项两两不相关 假设3 随机误差项与解释变量X之间不相关 回归线斜率的值为1.9927,表示货币供应量每增加1个单位,国民收入就增加1.9227个单位。 第二节 线性回归的方差分析1. 总的平方和分解其中 对 进行分解 是回归值 与y的观测值的平均 之差的平方和。其中 一、数值分析它反映了由于x与y之间存在线性相关关系而引起
47、的回归值的分散程度,我们称之为回归平方和。 而称为剩余平方和,它反映了观测值y 偏离回归直线的程度,这种偏离是由于观测误差等随机因素所引起的。 这样通过平方和的分解把引起数据yi波动的两种原因在数值上基本上分开了。二、 线性回归方程的显著性检验统计量检验假设 是否成立。 如果假设H0 成立, 则统计量 服从自由度为n-1的x 2分布 可以证明:服从自由度为 (1, n-2) 的F分布。对于给定的显著性水平,可以由附表5查得F的临界值F ,如果 则拒绝假设H 0 ,即认为x与y之间的线性关系显著。 反之,如果 则接受假设H0,即认为y与x之间不存在线性相关关系。 若存在线性相关关系时,回归效果显
48、著,反之回归效果不显著。三、方差分析表 的计算公式(一)(二) 方差分析表 (见教材)例4-3第三节 t检验(直接检验法)一、 检验假设t 检验统计量的构造: 当 ,此时 且 即得 H0的拒绝域为: 二、检验统计量三、线性回归效果不显著的原因(一) 影响y取值的,除x外,还有其他不可忽略的因素。(二) y与x的关系不是线性的,而存在着其他关系。 (三) y与x不存在关系。例4-4 例4-2的分析样本的相关系数第四节 相关系数及其显著性检验 x 和 y 的相关系数是 xy ,要检验它们之间线性相关是否显著,可以对下列假设进行检验: 1线性回归方程的相关系数显著性检验 为了检验这个假设, 用 xy
49、 的估计值,样本的相关系数 r来构造一个检验统计量 一、由t分布确定的拒绝域(1) 用样本观测数据计算样本相关系数rxy (2) 计算统计量(3) 对给定的以及自由度(n-2),查t分布表得到 使 2. 线性相关的显著性检验步骤如下:(4)若 则否定假设 H0,即x与y的线性相关关系显著 若 则假设 H0成立 ,说明x与y之间不存在线性相关,这时,所求的回归方程没有意义。 例4-5 利用t分布来检验,由例4-3中算出的相关系数的显著性。为了检验方便,也可以由t与相关系数的关系式解出 得 对给定不同的显著水平及不同的自由度,由t分布表按上式关系式求得对应的样本相关系数 rxy的临界值,再由这些临
50、界值制成相关系数检验表 。二、相关系数表的构成及应用 例4-6 求商品的需求量同商品自身的价格的关系式(假定其他变量固定不变)。一、 系数b的置信区间。 对系数b作区间估计。事实上,可由(4.3.3)式得到b的置信度为1-的置信区间为 :二、 预测回归方程的一个重要应用是,对于给定的点 可以以一定的置信度预测对应的的观测值的取值范围,即所谓预测区间。第五节 回归分析的其它问题对于给定的置信度1-,有 区间称为y0的置信度为1-的预测区间。(1)置信度为0.95的预测区间近似地为 (2)置信度为0.997的预测区间近似地为 例4-7 续例4-2,求x=45时,y的预测区间 三、控制 控制是预测的
51、反问题,即要求观察值y在某区间 内取值时,问x应控制在什么范围?的预测区间 (3)第五章 多元线性回归第一节 经典多元线性回归模型的概念一、回归模型二、多元线性回归模型三、线性回归模型的假设条件(一)关于矩阵的X假定(二)关于随机扰动项的假定第二节 最小平方估计一、 关于矩阵的微分运算的一些性质二、的估计三、2的估计例5-1例5-2第三节 估计量的性质一、 的性质(二)无偏性(三) 的协方差阵(四)最小方差性(一)线性性(五)关于概率极限的几点注释1. 概率极限的概念2.概率极限的运算3.概率极限存在的一个充分条件 4.多维情形 5.经典线性模型的性质性质1性质2性质3经典线性模型还有如下的一
52、致性。二、 的性质(一)无偏性(二)一致性 三、 和 分布(一) 的分布(二)有关 的分布第六章 虚拟变量的回归 虚拟变量(Dummy Variable),又称名义变量。 另外还有一些名称是: 指标变量(Indicator Variable) 、 二值变量(Binary Variable) 、定性变量(Qualitative Variable) 和二分变量(Dichotomous Variable)。 这些都指的是一个取值为0或1的变量。第一节 虚拟变量一、 作为解释变量的虚拟变量对于线性回归模型其中 在回归分析中,被解释变量不仅常受一些在尺度上明确量化好的解释变量的影响,而且还受实质上是定性
53、性质的变量的影响。 在这种情况下,不能简单地用最小二乘法进行参数估计,需要另一些模型来研究。 当D作为被解释变量时,我们就可以对以下线性回归模型进行分析: 二、 作为被解释变量的虚拟变量 虚拟变量不仅可作为解释变量,它也可作为被解释变量,例如银行研究是否给企业贷款,结果只有两个:贷或不贷。 三、虚拟变量模型的类型和解释变量个数的选择(一)含虚拟变量回归模型的分类1ANOVA模型 一个回归模型可以只含有虚拟变量或定性的解释变量, 这一类模型称为方差分析(Analysis-of-variance,简记为ANOVA)模型。2ANCOVA模型 兼含有定量和定性解释变量的回归模型叫做协方差分析 (Ana
54、lysis-of-covariance,简记ANCOA)模型。例6-2(二)虚拟变量个数的选取规则1. (虚拟变量个数的选取)问题的提出 2. 虚拟变量个数的选取 一般的规则是: 如果一个定性变量有m个类别,则只需引入m-1个虚拟变量。 例子: 为了区分两个类别:男性和女性,我们只需引进了一个虚拟变量D。 解决多重共线性问题的方法有各种各样,最简单的方法就是当定性变量有两个分类或两个水平时,仅用一个虚拟变量 。3. 虚拟变量有关名词的定义 (1) 基底 虚拟变量被赋予零值的那个组别、类别或级别常被喻为是基底(base)、基准(benchmark)、对比(comparison)、参考(refer
55、ence)或省略(omitted)类。 共同的截距项就是基底类的截距 (2) 级差截距系数 附着于虚拟变量Di ,的系数 称为级差截距系数(differential intercept coefficient) 四、 一个定量变量和一个多分定性变量的回归 在横截面数据的基础上,做个人保健支出对个人收入和教育水平的回归,考虑三个互相排斥的教育水平:低于中学、中学和大学 。 按照虚拟变量的个数比变量分类数少一的规则,我们需要引进两个虚拟变量,以处理教育的三个水平。 其中,表示保健年度支出,表示年度收入 , 五、 一个定量变量和多个定性变量的回归(一) 一个定量变量和两个定性变量的回归(二) 一个定
56、量变量和多个定性变量的回归 虚拟变量的方法易于推广,以便处理多于一个定性变量的情况。在学院教授的薪金回归模型(6.1.4)中,除了教龄和性别之外,如果肤色也是一个重要的薪金决定因素。则模型需要改为(6.1.14)。 多个定量变量和多个定性变量的回归与一个定量变量和两个定性变量的回归没有本质的区别,这里只给出一个例子加以说明。例6-3第二节 虚拟变量的应用一、 应用虚拟变量改变回归直线的截距二、应用虚拟变量改变回归直线的斜率三、分段线性回归 图62表示两种情况下,中国通货膨胀率的变化的情况。 我们仍然研究通货膨胀率和国民总产值增长率之间的相互关系,这一回假设1998年与普通年份的预期基点相同,但
57、变化幅度不同,也就是斜率不同。 虚拟变量的另一个用途,可以从图6-4看出。 例6-4 四、 检验回归模型结构的稳定性 一般情况两个或两个以上回归方程的差异在于 截矩,也许在于斜率或者两者都有。 设重建时期收入与储蓄的理论模型为: 设重建后时期收入与储蓄的理论模型为: (一)回归模型的结构的稳定性问题的提出1、 和 就是说两个回归相同(重合回归 Coincident regression) 2、但 就是说两个回归的差异仅在于位置即截距的不同(平行回归parallel regression) 回归模型(6.2.4),(6.2.5)代表以下四种可能情形 3、 但 就是说,两个回归的截距相同但斜率相异
58、(汇合回归 Concurrent regression)。4、 且 就是说,两个回归完全不同(相异回归 Dissimilar regression)。 图6-6 给出了所有这些可能的情形 邹检验的基本假设:(a) 和(b) 和 是独立分布(相互独立的) 邹检验按下列步骤进行 (二)传统判别结构稳定性方法存在的缺陷步骤1:合并全部n1和n2次观测值,用以估计模型中的参数(即 将(6.2.4),(6.2.5)合并)步骤2:分别估计(6.2.4)和(6.2.5)中的参数 即分别求出模型(6.2.4),(6.2.5)的线性回归方程),并求得它们的残差平方和,且分别记为 和 步骤3:求出服从自由度为()
59、的分布。 步骤4: 在邹检验的基本假设下,可以证明: 服从自由度为: 的F分布。 固定资产投资与GDP的例子步骤1: 步骤2,紧缩政策前、紧缩政策后步骤3: 步骤4:(三) 虚拟变量法比较两个回归方程的结构注意: (1) 按相加性(additive)形式,将虚拟变量引入 能使我们区分两个时期的截距。 (2)按乘积性(multiplicative)形式,将虚拟 变量 引入能使我们区分两个时期的级差系数 通过虚拟变量的使用可大大简化上面介绍的邹检验步骤。虽然在任一种情况下应用邹检验和应用虚拟变量检验法得到的一般结论都一样的,但虚拟变量法有些优越性 虚拟变量技术比邹检验优越: 1 我们只需求出单一的
60、回归方程(6.2.9),两个时期的回归方程可由取D的不同值而 得到。 2 所求的单一的回归方程(6.2.9),可用做各种假设检验。比方说,对级差系数 作假设检验: 若接受 ,就可接受两个回归方程有相同截距的假设。否则,则认为两个回归方程有不同的截距。类似地,对级差斜率系数 作假设检验: ,若接受 ,则我们认为两个回归方程有相同的斜率;若拒绝 ,则我们就不能接受两个回归方程有相同斜率的假设。整个回归方程结构的稳定性的检验,可用F检验来判断 3. 邹检验没有明白地告诉我们 哪一个系数、 截距或斜率在这两个时期相异; 或者两个 系数均相异。 虚拟变量法有着明显的优势,因为它不仅告诉我们两个回归是否有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年行政车辆租赁合规合同样本
- 2024年度健康养生产品销售结算与市场拓展合同3篇
- 2024年特许经营合同详细条款与标的
- 2024年版:房屋买卖违约金索赔协议
- 2024年货车租赁合同(带维修责任规定)
- 2024年纪录片创作与制作服务合同版B版
- 2024年绿化工程苗木种植养护合同2篇
- 2025年度环保仓储仓单质押反担保服务协议3篇
- 2024年离婚合同书:女方放弃财产分割版版
- 运维服务能力指标体系
- 医院骨科2025年带教计划(2篇)
- 2024-2025学年北京市东城区高一上学期期末考试数学试卷(含答案)
- 销售总监年度总结规划
- 生物安全柜的使用及维护培训
- 机械制造企业风险分级管控手册
- 地系梁工程施工方案
- 《NOIP图的基础算法》课件
- 《建筑工程QC课题》课件
- 病历质控流程
- 藏文基础-教你轻轻松松学藏语(西藏大学)知到智慧树章节答案
- 政府采购评审专家考试试题库(完整版)
评论
0/150
提交评论