计量经济学课件_第1页
计量经济学课件_第2页
计量经济学课件_第3页
计量经济学课件_第4页
计量经济学课件_第5页
已阅读5页,还剩1064页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年1月8日星期一1高級計量經濟學

2024年1月8日星期一2計量經濟學概論第一節計量經濟學第二節建立計量經濟模型的步驟與要點第三節計量經濟模型的應用2024年1月8日星期一3第一節計量經濟學

計量經濟學是應用經濟學的一個分支學科,是以揭示經濟活動中客觀存在的數量關係為內容的分支學科。挪威經濟學家弗裏希(R.Frish)將它定義為經濟理論、統計學和數學三者的結合。英文”Econometrics”最早是由R.Frish於1926年模仿“Biometrics”(生物計量學)提出來的,標誌著計量經濟學的誕生。官方學術刊物:Econometrica(1933年)

2024年1月8日星期一4世界計量經濟學會(EconometricSociety)於1930年12月29日成立,實際上相當於世界經濟學會,也是全球規模最大、水準最高的經濟學會。除了每5年召開一次世界大會外,還在各個地區召開經常性的學術會議。

TheEconometricSocietyisaninternationalsocietyfortheadvancementofeconomictheoryinitsrelationtostatisticsandmathematics.ThemainactivitiesoftheSocietyare:1.PublicationofthejournalsEconometrica,QuantitativeEconomics,andTheoreticalEconomics.2.PublicationofaresearchMonographSeries.3.Organizationofscientificmeetingsinsixregions2024年1月8日星期一5WelcometotheEconometricSocietyWebsite/2024年1月8日星期一6國內的計量經濟學會?數量經濟學會中國社會科學院數量經濟研究所計量經濟學的地位?計量經濟模型類型

[1]回歸模型(線性、非線性)

[2]時間序列模型

[3]面板數據模型、空間面板數據模型2024年1月8日星期一7第二節建立計量經濟模型的步驟與要點(一)理論模型的設計根據研究目的,利用經濟行為理論和樣本數據所顯示的變數之間的關係,設定描述這些變數的數學運算式,即理論模型。例如,生產函數就是一個理論模型。理論模型的設計主要包括三方面的工作:選擇變數、確定變數之間的數學關係、估計模型參數2024年1月8日星期一8(二)樣本數據的收集

[1]常用的樣本數據:時間序列數據、截面數據、虛擬變數數據。

[2]樣本數據的品質:可靠性、完整性、可比性(數據口徑問題)和一致性(總體與樣本的一致性)。(三)模型的參數估計2024年1月8日星期一9(四)模型的檢驗

[1]經濟意義的檢驗:主要檢驗模型參數估計量在經濟意義上的合理性。主要方法是將模型參數的估計量與預先約定的理論期望值進行比較,包括參數估計量的符號、取值大小、變數之間的相互關係,據此判斷模型的合理性。例如煤炭產量=-108.5427+0.00067×固定資產原值+0.01527×職工人數-0.00681×電力消耗量+0.00256×木材消耗量該模型合理否?

Ln(煤炭產量)=2.69+1.85Ln(固定資產原值)+0.51Ln(職工人數)對數線性模型2024年1月8日星期一10[2]統計檢驗[3]計量經濟學檢驗:主要檢驗準則包括模型隨機誤差的序列相關性、異方差,以及解釋變數的多重共線性性問題。[4]模型預測檢驗:確定所建立的模型是否可以用於樣本觀測值以外的範圍,方法包括:利用擴大後的樣本中新估計模型參數;將所建立的模型用於樣本以外某一時期的實際預測,比較預測值與實際觀測之之間的差異是否顯著。(五)計量經濟模型成功的要素理論、方法、數據2024年1月8日星期一11(六)目的

[1]結構分析

[2]經濟預測

[3]政策評價

[4]經濟理論檢驗2024-1-812●

什麼是統計分佈?

用隨機變數所有可能取值及其對應的概率來對隨機變數的變化進行描述的分佈。概率分佈可分為離散隨機變數概率分佈和連續隨機變數概率分佈。前者簡稱離散分佈,後者為連續分佈2024-1-813●

常用統計分佈(1)正態分佈(2)卡方分佈(3)t分佈(4)F分佈2024-1-814■

正態分佈(1)密度函數記作標準正態分佈:μ=0,σ2=12024-1-815標準正態分佈概率密度函數2024-1-816標準正態分佈的直方圖■x=rnorm(10000,0,1)hist(x,breaks=100)■x=rnorm(100000,0,1)hist(x,breaks=100,freq=FALSE)lines(density(x),col=“blue”)#添加密度函數曲線■x=rnorm(100000,10,5)hist(x,breaks=100,freq=FALSE)lines(density(x),col="blue")#添加密度函數曲線2024-1-8172024-1-8182024-1-8192024-1-820標準正態分佈的分佈函數:Φ(x)Φ(0)=0.50Φ(1)=0.8413Φ(2)=0.9972Φ(3)=0.99872024-1-821二元正態分佈2024-1-822#基於R軟體的二維正態分佈密度函數圖的構建程式/157659228.html2024-1-823■

t

分佈

如果隨機變數X具有如下形式的分佈密度函數則稱X服從自由度為n的t分佈,記作X~t(n)2024-1-824

t

分佈的密度函數圖(自由度=9)2024-1-825x=rt(100000,9)

hist(x,breaks=100)2024-1-826x=rt(100000,9)hist(x,breaks=100,freq=FALSE)lines(density(x),col="blue")#添加密度函數曲線2024-1-8272024-1-828●

卡方分佈如果隨機變數X具有如下密度函數

則稱X服從自由度卡方分佈,記作2024-1-829

卡方分佈的密度函數圖(自由度=9)2024-1-830x=rchisq(100000,9)hist(x,breaks=100,freq=FALSE)lines(density(x),col="blue")#添加密度函數曲線2024-1-8312024-1-832●

F分佈如果隨機變數X具有如下密度函數則稱X服從第一自由度:n1,第二自由度:n2的F分佈,記作X~F(n1,n2)2024-1-833F分佈的密度函數圖(n1=8,n2=12)2024-1-834●

分佈之間的關係(1)當自由度趨向於無窮大時,t分佈趨向於標準正態分佈(2)相互獨立標準正態變數的平方和服從分佈卡方分佈(3)t=N(0,1)/(卡方變數/自由度)1/2(4)2024-1-835●

分佈的應用[1]正態分佈:正態分佈應用最廣泛的概率分佈,其分佈密度函數特徵是“鐘”形曲線。例如,同一種生物體的身長、體重等指標;在生產條件不變的情況下,產品的強力、抗壓強度、口徑、長度等指標2024-1-836[2]t分佈:用於正態分佈均值的檢驗,(注:總體方差未知)例如,比較南方人與北方人的平均身高是否相同?兩所大學學生的四六級考試平均成績是否一樣?2024-1-837[3]卡方分佈:用於單個正態總體的方差檢驗,以及分佈擬合問題[4]F分佈:用於兩個正態總體方差是否相等的檢驗,以及方差分析中。2024-1-8382.2參數估計●點估計●估計量的優良性準則●極大似然估計●區間估計2024-1-839●

點估計◆

矩估計矩估計的基本原則(K.Pearson,1900年)用樣本矩替代總體矩,用樣本矩函數替代總體矩函數設X1,X2,…,Xn是來自總體X的樣本,則樣本的k階原點矩2024-1-840

如果總體X的k階原點矩存在,則用去估計,記作2024-1-841

例設X1,X2,…,Xn是來自總體,由於

所以,µ的矩估計量

2024-1-842

所以,方差的矩估計2024-1-843●

點估計優劣的矩評價標準◆

無偏性設是參數的估計量,如果

則稱是的無偏估計量;否則,稱為有偏的。2024-1-844

定義若統計量滿足條件

則稱是的漸近無偏估計量。顯然,樣本方差Sn2

是總體方差σ2

的漸近無偏估計量。2024-1-845◆

有效性設與都是參數的無偏估計,如果

且至少存在一個,使得則稱比有效。2024-1-846◆均方誤差準則定義設與是參數的兩個估計量,如果

且至少存在一個,使得

則稱在均方誤差意義下,優於。2024-1-847◆

相合性定義3.2.4設是參數的一個估計量,如果對任意的,有則稱是的相合估計。注:樣本k階矩是總體k階矩的相合估計。2024-1-848

定理(辛欽大數定理)設X1,X2,…,Xn,…,是獨立同分佈的隨機變數序列,若其期望有限,則

當總體k階矩存在時,由X1,X2,…,Xn,…,獨立同分佈,也獨立同分佈,所以2024-1-849

這說明是的相合估計。當分別是的相合估計時,若為連續函數,則是的相合估計。2024-1-850●極大似然估計

極大似然估計的基本思想:在參數的一切可能取值之中,選擇使樣本觀測值出現的概率最大的參數取值作為的估計,記作。2024-1-851(1)離散分佈參數的極大似然估計

設X的分佈是離散的,參數未知,X的概率分佈

現從總體中抽取容量大小為n的樣本,其觀測值為則該樣本出現的概率為2024-1-852

由於樣本觀測值出現了,當然要求對應的似然函數的取值達到最大,應該選擇滿足如下條件的作為參數的估計,即

稱為的極大似然估計。2024-1-853(2)連續分佈參數的極大似計當總體X的分佈是連續時,其概率分佈密度函數為現從該總體中抽取容量為n的樣本觀測值則樣本的聯合分佈密度函數為2024-1-854

對於不同的,同一組樣本觀測值聯合密度函數的取值是不同的,因此,的選擇應該使到達最大,即此時,是參數的極大似然估計。2024-1-855極大似然估計的方法方法一:通過求導獲得參數的極大似然估計記

則與在同一點上達到最大值;若對於的每一個分量可微,稱2024-1-856

的解為參數的極大似然估計,該方程稱為似然方程,此處k是參數的維數。

2024-1-857

方法二:根據定義求參數的極大似然估計

例設總體X服從均勻分佈,從中獲得容量為n的樣本X1,X2,…,Xn,其觀察值為x1,x2,…,xn

,求的極大似然估計。2024-1-858解似然函數由於是參數的嚴格單調遞減函數,而參數的取值範圍為,所以當時,最大,故極大似然估計為2024-1-859可以證明,的概率密度函數為其期望2024-1-860●

區間估計

定義設θ是總體的一個參數,其參數空間為,X1,X2,…,Xn是來自該總體的一個樣本,對給定的,確定兩個統計量

若對任意,有2024-1-861

則稱隨機區間是的置信水準為的置信區間,或簡稱是參數的置信區間,與分別稱為參數的置信下限與置信上限。2024-1-862

基本含義:設法構造一個隨機區間,它能蓋住未知常數θ的概率為1-α。這個區間會隨著樣本觀察值的不同而不同,但100次運用這個區間估計,大約有100(1-α)個區間能蓋住θ,或者說,大約有100(1-α)個區間含有θ。2024-1-8632.3假設檢驗

統計假設定義關於隨機變數的分佈的每一個命題稱為統計假設,以拉丁字母“H”表示統計假設。根據問題的提法、條件和特點的不同,統計假設又有參數假設和非參數假設、簡單假設和複合假設以及基本假設和對立假設之分。2024-1-864兩類錯誤及其概率

由於“樣本值落入否定域”及“樣本值落入接受域”都是隨機事件,因此檢驗可能出現兩類錯誤:

第一類錯誤:否定了真實假設,即H0本來真實,卻被否定了;

第二類錯誤:接受了不真實假設,即H0本來不真實,卻被接受了。2024-1-865第一類錯誤概率:α=P(否定H0|H0是真實的)第二類錯誤概率:β=P(接受H0|H0是錯誤的)檢驗的功效函數:

π=1-β=P(否定H0|H0是錯誤的)2024-1-866正態總體均值的假設檢驗(σ2已知

)2024-1-867正態總體均值的假設檢驗(σ2未知

)2024-1-868正態總體方差的假設檢驗2024-1-869兩個正態總體方差的假設檢驗2024-1-870兩個正態總體均值的檢驗檢驗問題(1)(2)(3)2024-1-871第六章回歸分析3.1一元線性回歸模型

背景從定量的角度來看,變數之間的關係可以分為兩類:一類變數之間的關係是完全確定的,可以用函數的形式表達另一類變數之間有關系,但不能用函數形式表達,例如人的體重與身高有關,一般而言,較高的人體重也重,但同樣身高的人體重卻不完全相同,這樣的變數間關係在統計上稱為相關關係。回歸分析是研究變數之間相關關係的一種統計方法。2024-1-872模型的基本形式設是的未知線性函數:。今對在點上進行試驗,測得函數的試驗值為

由於受隨機誤差因素的影響,試驗結果為此處為未知參數。2024-1-873

隨機誤差項滿足條件(1)獨立性:相互獨立,因而也相互獨立。(2)無偏性:,因而2024-1-874

(3)等方差性:,因而(4)正態性:,因而上述四個條件可簡化為:獨立同分佈2024-1-875回歸直線的確定

參數與的估計應使殘差平方和達到最小,即令2024-1-8762024-1-877

此为正规方程组2024-1-878

參數的最小二乘估計其中2024-1-879

為簡單起見,令2024-1-880

於是

因此,回歸直線

2024-1-881回歸方程的統計性質

定理在一元線性回歸模型假設下,回歸係數具有以下性質

(1)(2)(3)2024-1-882

證明根據線性模型的假定,為相互獨立的正態變數,且

另一方面,均是的線性函數,即故均為正態變數。2024-1-883

求的數學期望2024-1-8842024-1-885求的方差2024-1-8862024-1-887

求與的相關矩2024-1-888結論

2024-1-889

定理線上性模型的假定條件下,(1);(2)相互獨立。其中2024-1-890證明2024-1-8912024-1-892對作如下線性變換2024-1-893此處滿足條件顯然2024-1-894

從而

由於相互獨立,都服從正態分佈,所以均服從正態分佈,且2024-1-895

以上表明相互獨立同分佈,從而

所以並且根據的獨立性,知三者相互獨立。2024-1-896

回歸方程的顯著性檢驗在實際工作中,我們不能斷定因變數與引數間確有線性關係,線性模型只是一種假設,儘管這種假設不是沒有根據的,但還是需要對這種線性回歸方程同實際觀察或試驗數據擬合的效果進行檢驗。2024-1-897t檢驗檢驗問題檢驗統計量

其中2024-1-898因為相互獨立,並且所以2024-1-899也就是說,所以拒絕域根據分佈與分佈之間的關係,有因而拒絕域也可以寫為。2024-1-8100相關係數檢驗二維樣本的相關係數定義為2024-1-8101

當成立時,應該比較小,從而值較小;因此,當較大時,應拒絕。拒絕域其中滿足條件2024-1-8102

利用回歸方程作預測當線性係數經過檢驗確認不等於零,即回歸直線效果是顯著的,此時,便可以利用所得的回歸直線,給定引數的值來預報因變數的值:給定和置信水準,預報隨機變數的取值範圍。2024-1-8103當時,的估計值2024-1-81042024-1-8105而所以,的置信水準為的置信區間為2024-1-8106

國家

國民經濟增長率x(%)

失業率y(%)

美國3.25.8

日本5.62.1

法國3.56.1

西德4.53.0

義大利4.93.9

英國1.45.7

以下是六個工業發達國家在1979年的失業率與國民經濟增長率的數據2024-1-8107

(1)研究與之間的關係;

(2)建立關於的一元線性回歸方程;

(3)對所求得的回歸方程作顯著性檢驗,在作檢驗時做了什麼假定?(取)(4)若一個工業發達國家的國民經濟增長率為,求其失業率的預測值。2024-1-81082024-1-81092024-1-81102024-1-8111Eviews6運行結果2024-1-8112回歸方程失業率y(%)=7.9427-0.9115×國民經濟增長率x(%)

(5.9361)(-2.7821)R2=0.6592AdjustedR2=0.5741,DW=3.1287,F=7.74042024-1-8113擬合值、觀察值、殘差obs Y YFResid 1 5.8000 5.0258 0.77412 2.10002.8381-0.738133 6.1000 4.75231.3476 4 3.00003.8408-0.84085 3.9000 3.47620.4238 6 5.70006.6666 -0.96662024-1-8114殘差分析圖2024-1-8115殘差分佈圖2024-1-81162SE區間估計2024-1-8117

可化為一元線性回歸的曲線回歸(1)雙曲線令,則。(2)冪函數令,則。2024-1-8118(3)指數函數若,則令,於是若,則令,同樣有2024-1-8119(4)對數函數令,則有。(5)S曲線令,則有。2024-1-81203.2多元線性回歸模型

multivariateregression●多元的含義:多個解釋變數?多個因變數(被解釋變數)?例如,血壓與年齡、體重之間的關係消費支出與收入、價格之間的關係其他………?●線性的含義:變數的線性組合

2024-1-8121●

建模目的①分析變數之間的結構關係②預測分析:給定引數的取值,預測因變數Y將來取值的大小2024-1-8122●模型結構分析

設是個變數的線性函數現對多元變數

在個點上進行試驗,結果如下2024-1-8123

此處為隨機誤差項,它滿足條件(1)獨立性:相互獨立,因而也相互獨立。(2)無偏性:,因而2024-1-8124(3)等方差性:,因而(4)正態性:,因而

上述四個條件等價於:2024-1-8125●

模型參數估計

模型係數估計:設所求回歸方程為其中為參數的估計,稱為回歸係數,它使殘差平方和取最小值2024-1-8126

根據多元函數求極值的必要條件,應滿足下列線性方程組

2024-1-81272024-1-8128寫成矩陣形式2024-1-8129記2024-1-8130則2024-1-81312024-1-8132因此,正規方程組從而,未知參數向量的最小二乘估計量

2024-1-8133●方差的無偏估計量

並且此處2024-1-8134其中,殘差序列為2024-1-8135●回歸方程優劣的評價模型的擬合程度:

回歸係數是否顯著不等於零2024-1-8136●回歸方程的顯著性檢驗檢驗問題檢驗統計量2024-1-8137

●模型係數的顯著性檢驗若考慮變數是否對因變數有顯著影響,則檢驗問題

檢驗統計量

2024-1-8138

拒絕域判斷:對於給定的顯著水準,若,則拒絕原假設,即認為;若則接受,認為2024-1-8139

例題考慮我國31個省市自治區的城鎮居民人均食品消費支出與其人均收入,糧食價格的依賴關係回歸模型:

人均消費支出(Y)=β0+β1糧食價格(X1)+β2人均收入2024-1-8140多元回歸分析的建模數據2024-1-8141變數之間的相關係數分析

食品支出與糧價相關係數=0.730

食品支出與收入相關係數=0.9212024-1-8142參數估計β0=-87.386,β1=213.423,β2=0.3522024-1-8143回歸方程的運算式:2024-1-8144

常數項的經濟涵義不清晰,原因:可能有重要的解釋變數未引入方程中;因此,需再尋找其他解釋變數

2024-1-8145殘差分佈圖2024-1-8146F檢驗的解釋在回歸分析中,觀測數據的總波動,用每個觀測值與總平均的差異平方和表示,即2024-1-8147

是觀測值與回歸值的離差平方和,反映了誤差的大小,稱為誤差平方和;其取值越小越好;它的自由度=31-3=28

是回歸值與總平均離差平方和,它表示x與y的線性關係引起y的變化;稱為回歸平方和,它的自由度=3-1=22024-1-8148模型的經濟涵義

①在保持收入水準不變的條件下,糧價上漲1元,則人均食品消費支出將增加213.423元②在糧價保持不變的情況下,收入每增加1元,將有其中的0.352元用於食品消費支出2024-1-8149

例題根據經驗,在人的身高相等的情況下,血壓的收縮壓Y與體重X1(kg)、年齡X2(歲數)有關。現在收集了13個男子的數據,試建立Y關於X1,X2的回歸方程2024-1-8150序號X1X2Y176.050120291.520141385.520124482.530126579.030117680.550125774.560123879.050125985.0401321076.5551231182.0401321295.0401551392.5201472024-1-8151R軟體運行程式blood<-data.frame(X1=c(76.0,91.5,85.5,82.5,79.0,80.5,74.5,79.0,85.0,76.5,82.0,95.0,92.5),X2=c(50,20,20,30,30,50,60,50,40,55,40,40,20),Y=c(120,141,124,126,117,125,123,125,132,123,132,155,147))lm.sol<-lm(Y~X1+X2,data=blood)summary(lm.sol)2024-1-8152結果Call:lm(formula=Y~X1+X2,data=blood)Residuals:Min1QMedian3QMax-4.0404-1.01830.46400.69084.3274Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)-62.9633616.99976-3.7040.004083**X12.136560.1753412.1852.53e-07***X20.400220.083214.8100.000713***---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:2.854on10degreesoffreedomF-statistic:87.84on2and10DF,p-value:4.531e-072024-1-8153模型運算式

Y=-62.96+2.136X1+0.4002X2

(-3.704)(12.185)(4.810)2024-1-81542024-1-8155參數的區間估計source(".R")(lm.sol)EstimateLeftRight(Intercept)-62.9633591-100.8411862-25.0855320X12.13655811.74587092.5272454X20.40021620.21480770.58562462024-1-81563.3多元逐步回歸

在實際問題中,人們總是希望從對因變數有影響的諸多變數中選擇一些變數作為引數,應用多元回歸分析的方法建立“最優”回歸方程,以便對因變數進行預報或控制2024-1-8157●所謂“最優”回歸方程,主要是指在回歸方程中包含所有對因變數影響顯著的引數而不包含對影響不顯著的引數的回歸方程●逐步回歸分析的主要思路是在所考慮的全部引數中按其對的作用大小,顯著程度大小,或者說貢獻大小,由大到小地逐個引入回歸方程,而對那些對作用不顯著的變數可能始終不被引人回歸方程2024-1-8158●另外,己被引人回歸方程的變數在引入新變數後也可能失去重要性,而需要從回歸方程中剔除出去。引入一個變數或者從回歸方程中剔除一個變數都稱為逐步回歸的一步,每一步都要進行檢驗,以保證在引人新變數前回歸方程中只含有對影響顯著的變數,而不顯著的變數已被剔除2024-1-8159

例題某種水泥在凝固時放出的熱能Y與水泥的四種化學成分X1,X2,X3,X4有關,現測得13組數據,希望從中選出主要的變數,建立Y關於它們的線性回歸方程2024-1-8160序號X1X2X3X4Y172666078.52129155274.331156820104.34113184787.6575263395.961155922109.27371176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.3131068812109.42024-1-8161cement<-data.frame(X1=c(7,1,11,11,7,11,3,1,2,21,1,11,10),X2=c(26,29,56,31,52,55,71,31,54,47,40,66,68),X3=c(6,15,8,8,6,9,17,22,18,4,23,9,8),X4=c(60,52,20,47,33,22,6,44,22,26,34,12,12),Y=c(78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,93.1,115.9,83.8,113.3,109.4))lm.sol<-lm(Y~X1+X2+X3+X4,data=cement)summary(lm.sol)2024-1-8162主要結果Call:lm(formula=Y~X1+X2+X3+X4,data=cement)Residuals:Min1QMedian3QMax-3.1750-1.67090.25081.37833.9254Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)62.405470.07100.8910.3991X11.55110.74482.0830.0708.X20.51020.72380.7050.5009X30.10190.75470.1350.8959X4-0.14410.7091-0.2030.8441---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:2.446on8degreesoffreedomF-statistic:111.5on4and8DF,p-value:4.756e-07

2024-1-8163從上述計算中可以看出,如果選擇全部變數作回歸方程,效果不好,因為回歸方程的係數沒有一項通過檢驗,下麵用函數step()作逐步回歸2024-1-8164lm.step<-step(lm.sol)Start:AIC=26.94Y~X1+X2+X3+X4DfSumofSqRSSAIC-X310.10947.97324.974-X410.24748.11125.011-X212.97250.83625.728<none>47.86426.944-X1125.95173.81530.576Step:AIC=24.974Y~X1+X2+X4DfSumofSqRSSAIC<none>47.9724.97-X419.9357.9025.42-X2126.7974.7628.74-X11820.91868.8860.632024-1-8165名詞解釋●

AIC準則:赤池資訊量準則(Akaikeinformationcriterion,簡稱AIC)是衡量統計模型擬合優良性的一種標準,是由日本統計學家赤池弘次創立和發展的;赤池資訊量準則建立在熵的概念基礎上,可以權衡所估計模型的複雜度和此模型擬合數據的優良性

AIC=2k-log(L)其中:k是參數的數量,L是似然函數2024-1-8166●從程式運行結果來看,用全部變數作回歸方程時,AIC的值為26.94,接下來的數據表明:如果去掉X3,得到回歸方程AIC的值為24.974,如果去掉X4,AIC的值為25.011,依次類推;由於去掉X3可以使AIC達到最小,因此去掉X3進入下一輪計算。●在下一輪計算中,無論去掉那一個變數,AIC的值均會升高,因此中止逐步回歸,進入回歸建模。2024-1-8167summary(lm.step)Call:lm(formula=Y~X1+X2+X4,data=cement)Residuals:Min1QMedian3QMax-3.0919-1.80160.25621.28183.8982Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)71.648314.14245.0660.000675***X11.45190.117012.4105.78e-07***X20.41610.18562.2420.051687.X4-0.23650.1733-1.3650.205395---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:2.309on9degreesoffreedomF-statistic:166.8on3and9DF,p-value:3.323e-082024-1-8168

殘差分佈圖

lm.sol<-lm(Y~X1+X2+X4,data=cement)

res<-residuals(lm.sol)

plot(res)2024-1-81693.4多重線性回歸分析

主要討論多個因變數與多個引數之間的線性函數關係,當然多個因變數之間具有相關性;否則,就是多個多元線性回歸模型問題2024-1-8170多對多的問題①發電量、工業總產值與鋼材產量、水泥產量和機械工業總產值之間的關係②麥當勞、肯德基消費與居民收入、價格等因素之間的關係③?????2024-1-8171模型結構因變數:y1,y2,…,ym解釋變數:x1,x2,…,xk函數關係2024-1-8172矩陣形式2024-1-8173n組觀察值其運算式為2024-1-81742024-1-81752024-1-8176例題數據NOy1y2x1x2x3x4x511.477.310.90.80.146.630.2421.257.4212.10.157.070.4632.0511.132.96.30.337.61.0242.4916.0854.40.7812.881.6153.1622.868.213.31.1815.861.6363.8729.5213.116.81.5618.791.9374.534.5423.817.82.1114.632.3186.0941.2234.827.33.0919.793.3296.7847.5435.422.13.5816.54.441010.73604732.27.3126.227.181117.657862.633.29.61288.771226.8496.26855.612.8527.569.891324.252.3735.324.46.7610.955.581420.0837.7731.317.95.0810.156.031519.2840.0735.224.85.5414.237.181622.8950.3645.337.87.1420.388.81728.9465.3349.578.811.226.5610.451839.0583.6459.7101.615.8933.1812.511939.0968.1647.874.910.8623.911.422026.8141.6417.740.25.117.569.032137.1967.33673.313.1427.28.052254.09103.5762138.625.5436.2810.32377.39135.89724731.3141.5314.182484.02118.195.227028.7940.2415.192588.39119.62118.4233.528.0338.215.772686.32112.3999.920526.531.5412.2927107.94144.4115128838.6146.8717.3628102.76130.66108262.231.4638.6215.129118.84175.1162.5358.646.2152.4820.4830139.3214.44238.2454.855.8655.9626.42024-1-8177利用MATLAB可以計算模型係數2024年1月8日星期一178

第一節隨機變數分位數與損失函數

一、隨機變數的分佈函數與分位數2024年1月8日星期一179二、經驗分佈函數2024年1月8日星期一180二、損失函數2024年1月8日星期一1812024年1月8日星期一182不同損失函數圖形比較2024年1月8日星期一183三、損失函數的數學期望及其極小值點2024年1月8日星期一184四、損失函數的數學期望的估計2024年1月8日星期一185第二節分位數與分位回歸2024年1月8日星期一186

分位數回歸(QuantileRegression)最早由Koenker和Bassett於1978年提出,它提供了回歸變數X和因變數Y的分位數之間線性關係的估計方法。絕大多數的回歸模型都關注因變數的條件均值,但是人們對於因變數條件分佈的其他方面的模擬方法也越來越有興趣,尤其是能夠更加全面地描述因變數的條件分佈的分位數回歸。利用分位數回歸解決經濟學問題的文獻越來越多,尤其是在勞動經濟學中取得了廣泛應用。如在教育回報和勞動市場歧視等方面都出現了很好的研究成果。在經濟學中的應用研究還包括諸如財富分配不均問題、失業持續時間問題、食品支出的恩格爾曲線問題、酒精需求問題和日間用電需求問題等。在金融學領域也湧現出大量使用分位數回歸的應用研究成果,主要應用領域包括風險價值(ValueatRisk,VaR)研究和刻畫共同基金投資類型的指數模型。2024年1月8日星期一187分位數回歸的基本思想和係數估計

假設隨機變數Y的概率分佈為:

Y的

分位數定義為滿足F(y)

的最小y值,即:的分位點可以由最小化關於的目標函數得到,即:其中,argmin

{

}函數表示取函數最小值時

的取值,

(u)

u(

I(u<0))稱為檢查函數(checkfunction),依據u取值符號進行非對稱的加權。2024年1月8日星期一188

考察此最小化問題的一階條件為:

即F(

)=

,也就是說F(Y)的第

個分位數是上述優化問題的解。

F(y)

可以由如下的經驗分佈函數替代:

其中y1,y2,…,yn為Y的N個樣本觀測值;I(z)是指示函數,z是條件關係式,當z為真時,I(z)=1;當z為假時,I(z)=0。2024年1月8日星期一189

相應地,經驗分位數為:式(4.7.3)可以等價地表示為下麵的形式:

2024年1月8日星期一190

現假設Y的條件分位數由k個解釋變數組成的矩陣X線性表示:

其中,xi

=(x1i,x2i,…,xki)

為解釋變數向量,

(

)=(

1,

2,…,

k

)

分位數下的係數向量。當

在(0,1)上變動時,求解下麵的最小化問題就可以得到分位數回歸不同的參數估計:

特別地,當

=0.5時為最小絕對值離差法(LeastAbsoluteDeviations,LAD)。另外,分位數回歸的係數估計需要求解線性規劃問題,很多種方法可以對此問題進行求解。

2024年1月8日星期一191係數協方差的估計1.獨立同分佈設定下協方差矩陣的直接估計方法(1)Siddiqui差商法(2)稀疏度的核密度估計量2.獨立但不同分佈設定下協方差矩陣的直接估計方法3.自舉法(Bootstrap)(1)X-Y自舉法(2)殘差自舉方法(3)馬爾可夫鏈邊際自舉法2024年1月8日星期一192模型評價和檢驗1.擬合優度

與傳統的回歸分析的擬合優度R2類似,分位數回歸模型也可以計算擬合優度。在分位數回歸中,參數估計是通過

得到的。將數據寫為xi=(1,x

i1)

(

)=(

0(

),

1(

)

)

,可以寫為

最小化

分位數回歸的目標函數(objectivefunction),得到

2024年1月8日星期一193

回歸方程中只包含常數項情形下,最小化分位數回歸的目標函數(objectivefunction),得到

定義分位數回歸方程的Machado擬合優度為

R1(

)位於0~1之間,R1(

)越大說明模型估計的越好,反之R1(

)越小模型估計越差。可以看出,這與用普通最小二乘法估計的傳統回歸方程中定義的擬合優度R2類似,分位數回歸擬合優度的計算是基於分位數回歸方程目標函數的最小值與只用常數項作為解釋變數時的分位數回歸方程目標函數最小值的關係。2024年1月8日星期一1942.擬似然比檢驗(Quasi-LRTest)

3.分位數過程檢驗(QuantileProcessTesting)

(1)斜率相等檢驗(SlopeEqualityTesting)(2)對稱檢驗(SymmetryTesting)

2024年1月8日星期一195

在EViews中進行分位數回歸1.方法選擇

為了使用分位數回歸方法估計方程,在方程設定對話框的估計方法中選擇“QREG”,打開分位數回歸估計對話框:圖4.15分位數回歸

“Quantiletoestimate”後面輸入值,可以輸入0~1之間的任意數值,默認值是0.5,即進行中位數回歸。

2024年1月8日星期一196

利用消費和收入數據,我們建立如下的回歸方程研究政府支出對居民消費的影響:其中,cs為實際居民消費,inc為實際可支配收入,fe為財政支出,考慮到財政政策通常具有時滯的特點,模型中採用滯後一期的財政支出作為解釋變數。所有變數均為剔除了價格因素的年度數據,樣本區間為1978~2006年。為了進行比較,我們同時給出最小二乘法以及三個不同分位點的分位數回歸估計結果。2024年1月8日星期一197注:括弧內為彈性係數的t值;Quant20,Quant50,Quant80分別代表20%,50%,80%分位數。係數估計結果OLSQuant20Quant50Quant800.28(5.78)0.21(2.78)0.25(3.44)0.28(3.17)0.47(7.22)0.49(4.49)0.38(2.33)0.45(2.93)0.47(7.57)0.44(4.22)0.56(3.55)0.49(3.43)0.027

(1.65)0.048(1.62)0.034(1.196)0.026(0.82)R20.9990.970.970.98最小二乘法和分位數回歸結果

2024年1月8日星期一198

從估計結果可以看出,對於不同的估計方法,居民實際可支配收入、前期消費水準兩個變數的彈性係數變化不大。儘管在以往的研究中,政府支出對居民消費的影響還沒有得出一致的結論,但是在本例中三種估計的結果表明政府支出對居民消費的彈性值均為正,說明在我們所分析的樣本區間內政府支出與居民消費之間是互補的,政府支出的增加有利於加強基礎設施建設和提高社會保障水準,使居民減少儲蓄,尤其是預防性儲蓄,從而增加消費。最小二乘估計給出的是政府支出對消費的平均影響效果,而分位數回歸給出的是消費處於不同分位水準時,政府支出對居民消費的影響。在20%,50%和80%的分位點上政府支出的彈性分別為0.048,0.034,0.026,並且後兩個水準的估計是不顯著的,說明當消費水準較低時,政府支出的影響相對較大,而對於較高的消費水準,政府支出的影響變小,並且是不顯著的。因為當消費水準較高時,進一步提升的空間變小,政府支出對其影響也變小。2024年1月8日星期一199結果(以0.2分位數的估計結果為例)分位數回歸的輸出結果

DependentVariable:LOG(CSP)Method:QuantileRegression(tau=0.2)CoefficientStd.Errort-StatisticProb.

C0.2095580.0752572.7845470.0103LOG(INC)0.4853830.1082084.4856300.0002LOG(EXPFP(-1))0.0475700.0293631.6200650.1183LOG(CSP(-1))0.4381560.1039404.2154700.0003PseudoR-squared0.972919

Meandependentvar8.536631AdjustedR-squared0.969534

S.D.dependentvar0.604396S.E.ofregression0.029215

Objective0.125904Quantiledependentvar7.990470

Objective(const.only)4.649230Sparsity0.084695

Quasi-LRstatistic667.5910Prob(Quasi-LRstat)0.0000002024年1月8日星期一200

輸出結果的上方顯示了設定的內容,本例中設定用“HuberSandwich”方法估計係數協方差,用“Siddiqui(meanfitted)”方法得到稀疏度,用“Hall-Sheather”方法計算帶寬。下麵顯示了係數估計值、標準差、t檢驗值和相應的p值。最下方顯示了擬合優度和調整值、稀疏度數值、目標函數的最小值(“objective”)、僅包含常數的目標函數的最小值(“Objective(const.only))、因變數序列的經驗分位數(“Quantiledependentvar”)、擬似然比檢驗值(“Quasi-LRstatistic”)和相應的p值(“Prob(Quasi-LRstat)”)等。2024年1月8日星期一201分位數回歸中的視圖和過程分位數回歸中的多數視圖和過程都與用OLS法估計的方程對象中提供的功能相同,但有些地方還是值得注意,如冗餘變數檢驗、遺漏變數檢驗和“RamseyRESET”檢驗將都用到擬似然比檢驗。而在分位數過程(“Quantileprocess”)裏,提供了分位數回歸中特有的三個功能:過程係數(“ProcessCoefficients”)、斜率相等檢驗(“SlopeEqualityTest”)和對稱檢驗(“SymmetricQuantilesTest”)。8January2024202第一節異方差性一、異方差的概念二、異方差的類型三、實際經濟問題中的異方差性四、異方差性的後果五、異方差性的檢驗六、異方差的修正七、案例8January2024203對於模型如果出現即對於不同的樣本點,隨機誤差項的方差不再是常數,而互不相同,則認為出現了異方差性(Heteroskedasticity)。一、異方差的概念8January2024204二、異方差的類型

同方差:

i2=常數

f(Xi)

異方差:

i2=f(Xi)異方差一般可歸結為三種類型:

(1)單調遞增型:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论