版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
導論1第一節什麼是計量經濟學
本節基本內容:●計量經濟學的產生與發展●計量經濟學的性質●計量經濟學與其他學科的關係
233什麼是計量經濟學?
實例1:對中國經濟增長的定量研究●中國經濟總量的度量及增長的狀況怎樣?(GDP的度量、增長速度、波動)●分析影響中國GDP增長的因素有哪些?(如投資、消費、出口、貨幣供應量等)●中國GDP與各種影響因素關係的性質是什麼?(如增加、減少)●各種因素對中國GDP影響的程度和具體數量規律是什麼?
(各種因素變動具體會引起GDP變動多少)●所作數量分析結果的可靠性如何?●對經濟增長的政策效應分析、對中國GDP發展趨勢的預測等3從感性認識到理性認識——先看實例:44實例2:中國家庭用汽車市場的研究
●家用汽車市場狀況如何?(用銷售量觀測)●影響汽車銷量的主要因素是什麼?
(如收入、價格、費用、道路狀況、政策、消費行為特徵等)●各種因素對汽車銷量影響的性
質怎樣?(正、負)●各種因素影響汽車銷量的具體
數量關係是什麼?●所得的分析結論是否可靠?●今後汽車市場的發展前景怎樣?應如何制定汽車的產業政策?455實例3:中國股票價格波動的研究●股票價格變動的情況怎樣?
(用股價指數觀測)●影響股票價格變動的主要因素是什麼?
(基本面、資金、政策、利率、公司業績、投資者信心等)●股價與各種影響因素的關係是什麼?
(利空、利多)●各種因素影響的具體數量規律是什麼?●所得的數量分析結果可不可靠?●今後股票價格的發展趨勢可能會怎樣?6這類實例需要研究的共性問題:●提出所研究的經濟問題及度量方式(如GDP、股票價格、汽車)
確定作為研究對象的經濟現象的變數●分析主要影響因素(根據經濟理論、實際經驗)
選擇若干作為影響因素的變數
●
分析各種影響因素與所研究經濟現象的相互關係
決定相互聯繫的數學關係式
●
確定所研究的經濟問題與各種影響因素間的數量規律
需要有科學的數量分析方法
●
分析和檢驗所得數量結論的可靠性
需要運用統計檢驗方法
●
運用數量研究的結果作經濟分析和經濟預測
對數量分析的實際應用結論:以上問題的研究具有普遍性,需要有一門學科去研究67
產生的歷史:起因:對經濟問題的定量研究名詞:1926年弗瑞希仿造出
“Biometrics”
“”
標誌:1930年成立計量經濟學會說明:“計量經濟學”
“經濟計量學”一、計量經濟學的產生與發展特點
計量經濟學的重要特點是它自身並沒有固定的經濟理論,計量經濟學中的各種計量方法和技術,大多來自數學和統計學。計量經濟學產生的意義
從定性研究到定量分析的發展,是經濟學更精密、更科學的表現,是現代經濟學的重要特徵8
計量經濟學的發展
●電腦應用●模型的變數和方程
由少到多,又趨向較少,多個模型歸併為整體模型●應用領域的拓展宏觀、微觀經濟領域應用,由預測為主轉向更多地對經濟理論假設和政策假設的檢驗9●理論與方法的新突破
除了經典線性計量經濟學模型以外,出現非線性模型、非參數、半參數模型、動態模型、時間序列模型、協整理論、PanelData數據模型、空間計量經濟模型等新的研究領域10
二、計量經濟學的性質若干代表性表述:●“計量經濟學是統計學、經濟學和數學的結合。”
(弗瑞希)●“計量經濟學是用數學語言來表達經濟理論,以便通過統計方法來論述這些理論的一門經濟學分支。”
(美國現代經濟詞典)●“計量經濟學可定義為:根據理論和觀測的事實,運用合適的推理方法使之聯繫起來同時推導,對實際經濟現象進行的數量分析。”(薩謬爾遜等)各種表述的共性:
計量經濟學與經濟理論、統計學、數學都有關系11
一般性定義
計量經濟學是以經濟理論和經濟數據的事實為依據,運用數學和統計學的方法,通過建立數學模型來研究經濟數量關係和規律的一門經濟學科。
研究的主體(出發點、歸宿、核心):
經濟現象及數量變化規律
研究的工具(手段):
模型數學和統計方法必須明確:
方法手段要服從研究對象的本質特徵(與數學不同),
方法是為經濟問題服務12注意:計量經濟研究的三個方面理論:即說明所研究對象經濟行為的經濟理論
——計量經濟研究的基礎數據:對所研究對象經濟行為觀測所得到的資訊
——計量經濟研究的原料或依據方法:模型的方法與估計、檢驗、分析的方法
——計量經濟研究的工具與手段三者缺一不可
1314計量經濟學研究的基本概述:
准備階段計量過程運用階段
根據數據運用方法對模型估計、檢驗結構分析經濟預測政策評價經濟計量模型經濟模型數量化經濟理論加工的數據統計數據經濟計量方法數理統計事實反映為補充改造計量經濟學的學科類型
●理論計量經濟學研究經濟計量的理論和方法●應用計量經濟學應用計量經濟方法研究某些領域的具體經濟問題15三、計量經濟學與其他學科的關係1、計量經濟學與經濟學的關係聯繫:●計量經濟學研究的主體—經濟現象和經濟關系的數量規律 ●計量經濟學必須以經濟學提供的理論原則和經濟運行規律為依據 ●經濟計量分析的結果:對經濟理論確定的原則加以驗證、充實、完善
16
17區別:●經濟理論重在定性分析,並不對經濟關係提供數量上的具體度量●計量經濟學對經濟關係要作出定量的估計,對經濟理論提出經驗的內容聯繫:●經濟統計側重於對社會經濟現象的描述性計量●經濟統計提供的數據是計量經濟學據以估計參數、驗證經濟理論的基本依據●經濟現象不能作實驗,只能被動地觀測客觀經濟現象變動的既成事實,只能依賴於經濟統計數據182、計量經濟學與經濟統計學的關係區別:●經濟統計學主要用統計指標和統計分析方法對
經濟現象進行描述和計量●計量經濟學主要利用數理統計方法對經濟變數
間的關係進行計量19
聯繫:●數理統計學是計量經濟學的方法論基礎
區別:
●數理統計學是在標準假定條件下抽象地研究一般的隨機變數的統計規律性;●計量經濟學是從經濟模型出發,研究模型參數的估計和推斷,參數有特定的經濟意義,標準假定條件經常不能滿足,需要建立一些專門的經濟計量方法
203、計量經濟學與數理統計學的關係
第二節計量經濟學的研究方法
需要做的工作
選擇變數和數學關係式——
模型設定
確定變數間的數量關係——
估計參數
檢驗所得結論的可靠性——
模型檢驗
作經濟分析和經濟預測——
模型應用21
一、模型設定經濟模型及設定模型:對經濟現象或過程的一種數學模擬設定(Specification):
▲模型只能抓主要因素和主要特徵,不得不捨棄某些因素▲對所研究經濟變數之間的關係選用適當的數學關係式近似地、簡化地表達出來▲模型的設計和形式的取捨具有一定主觀性
22
構成計量經濟模型的基本要素經濟變數不同時間、不同空間的表現不同,取值不同,是可以觀測的因素。是模型的研究對象或影響因素。經濟參數表現經濟變數相互依存程度的、決定經濟結構和特徵的、相對穩定的因素,通常不能直接觀測。隨機擾動項模型中沒有包含的所有因素的代表例如:
Y—消費支出X—收入、—參數u—隨機誤差項23
設定計量經濟模型的基本要求
●要有科學的理論依據 ●選擇適當的數學形式
類型:單一方程、聯立方程線性形式、非線性形式
●模型要兼顧真實性和實用性
兩種不好的模型:太過複雜—真實但不實用過分簡單—不真實
●包含隨機誤差項
經濟模型與計量經濟模型的重要區別●方程中的變數要具有可觀測性24
二、估計參數為什麼要對參數作估計?
一般來說參數是未知的,又是不可直接觀測的。由於隨機項的存在,參數也不能通過變數值去精確計算。只能通過變數樣本觀測值選擇適當方法去估計。
(如何通過變數樣本觀測值去科學地估計總體模型的參數是計量經濟學的核心內容)
25兩個概念
參數的估計值:所估計參數的具體數值
參數的估計式:估計參數數值的公式參數估計的常用方法普通最小二乘、廣義最小二乘、極大似然估計、二段最小二乘、三段最小二乘、其他估計方法26
三、模型檢驗為什麼要檢驗?●建模的理論依據可能不充分●統計數據或其他資訊可能不可靠●樣本可能較小,結論只是抽樣的某種偶然結果●可能違反計量經濟方法的某些基本假定對模型檢驗什麼?對模型和所估計的參數加以評判,判定在理論上是否有意義,在統計上是否可靠27
對計量經濟模型檢驗的方式►經濟意義檢驗
所估計的模型與經濟理論是否相符
►統計推斷檢驗
檢驗參數估計值是否抽樣的偶然結果
►計量經濟學檢驗
是否符合計量經濟方法的基本假定
►預測檢驗
將模型預測的結果與經濟運行的實際對比28四、模型應用►經濟結構分析
分析變數之間的數量比例關係(如:邊際分析、彈性分析、乘數分析)
例:分析消費增加對GDP的拉動作用►經濟預測由預先測定的解釋變數去預測應變量在樣本以外的數據(動態預測、空間預測)
例:預測股票市場價格的走勢29►政策評價
用模型對政策方案作模擬測算,對政策方案作評價把計量經濟模型作為經濟活動的實驗室)
例:分析道路收費政策對汽車市場的影響►驗證理論驗證既有理論的正確性,發現新的理論3031經濟理論實際經濟活動搜集統計數據設定計量模型參數估計模型檢驗是否符合標準模型應用經濟預測結構分析政策評價修訂模型符合不符合計量經濟學的研究過程驗證理論第三節變數、參數、數據與模型
本節基本內容:
將貫穿於全部課程的基本概念和基本問題●計量經濟模型中的變數●參數的估計方法●計量經濟學中應用的數據●計量經濟模型的建立32一、計量經濟模型中的變數
從變數的因果關係區分:
被解釋變數(應變量)——要分析研究的變數解釋變數(引數)—說明應變量變動主要原因的變數(非主要原因歸入隨機誤差項)33
從變數的性質區分
內生變數—其數值由模型所決定的變數,是模型求解的結果
外生變數—其數值由模型以外決定的變數(相關概念:前定內生變數、前定變數)
注意:
外生變數數值的變化能夠影響內生變數的變化,內生變數卻不能反過來影響外生變數34二、參數的估計方法單一方程模型最常用的是普通最小二乘法、極大似然估計法等聯立方程模型常用二段最小二乘法和三段最小二乘法等準則:參數估計值應符合“盡可能地接近總體參數真實值”的準則”。35三、計量經濟學中應用的數據數據的來源:各種經濟統計數據專門調查取得的數據人工製造的數據數據類型:
時間數列數據(同一空間、不同時間)截面數據(同一時間、不同空間)混合數據(面板數據PanelData)虛擬變數數據數據的要求:
真實性、完整性、可比性
36四、計量經濟模型的建立經濟模型是對實際經濟現象或過程的一種數學模擬,是對複雜經濟現象的簡化與抽象特點:只能在一定假定前提下忽略次要因素,突出主要因素3738
第一節
回歸分析與回歸函數
一、相關分析與回歸分析(對統計學的回顧)1、經濟變數之間的相互關係
性質上可能有三種情況:◆確定性的函數關係
Y=f(X)可用數學方法計算◆不確定的統計關係—相關關係
Y=f(X)+ε(ε為隨機變數)可用統計方法分析
◆沒有關係不用分析
◆相關關係的描述
最直觀的描述方式——座標圖(散佈圖、散點圖))
39函數關係相關關係(線性)沒有關係相關關係(非線性)2、相關關係4040
相關關係的類型
●
從涉及的變數數量看
簡單相關多重相關(複相關)●
從變數相關關係的表現形式看
線性相關——散佈圖接近一條直線非線性相關——散佈圖接近一條曲線●
從變數相關關係變化的方向看
正相關——變數同方向變化,同增同減負相關——變數反方向變化,一增一減不相關41
3、相關程度的度量—相關係數
如果和總體的全部數據都已知,和的方差和協方差也已知,則
X和Y的總體線性相關係數:
其中:X的方差Y的方差X和Y的協方差特點:●總體相關係數只反映總體兩個變數
和
的線性相關程度●對於特定的總體來說,
和
的數值是既定的,總體相關系數
是客觀存在的特定數值。●總體的兩個變數
和的全部數值通常不可能直接觀測,所以總體相關係數一般是未知的。
42如果只知道X和Y的樣本觀測值,則X和Y的樣本線性相關係數為:
其中:和分別是變數X和Y的樣本觀測值,和分別是變數X和Y樣本值的平均值注意:是隨抽樣而變動的隨機變數。X和Y的樣本線性相關係數:相關係數較為簡單,也可以在一定程度上測定變數間的數量關係,但是對於具體研究變數間的數量規律性還有局限性。
●
X和Y都是相互對稱的隨機變數,●
線性相關係數只反映變數間的線性相關程度,不能說明非線性相關關係●
樣本相關係數是總體相關係數的樣本估計值,由於抽樣波動,樣本相關係數是隨抽樣而變動的隨機變數,其統計顯著性還有待檢驗
43對相關係數的正確理解和使用444、回歸分析回歸的古典意義:
高爾頓遺傳學的回歸概念
(父母身高與子女身高的關係)子女的身高有向人的平均身高"回歸"的趨勢回歸的現代意義:一個被解釋變數對若干個解釋變數依存關係的研究回歸的目的(實質):由解釋變數去估計被解釋變量的平均值45●被解釋變數Y的條件分佈和條件概率:
當解釋變數X取某固定值時(條件),Y的值不確定,Y的不同取值會形成一定的分佈,這是Y的條件分佈。
X取某固定值時,Y取不同值的概率稱為條件概率。●被解釋變數Y的條件期望:對於X
的每一個取值,對Y所形成的分佈確定其期望或均值,稱為Y的條件期望或條件均值,用表示。注意:Y的條件期望是隨X的變動而變動的
YX明確幾個概念(為深刻理解“回歸”)46●回歸線:對於每一個X的取值,都有Y的條件期望
與之對應,代表Y的條件期望的點的軌跡形成的直線或曲線稱為回歸線。●回歸函數:被解釋變數Y的條件期望
隨解釋變數X的變化而有規律的變化,如果把Y的條件期望表現為X的某種函數
,這個函數稱為回歸函數。回歸函數分為:總體回歸函數和樣本回歸函數
X
Y47每月家庭可支配收入
X2000250030003500400045005000550060006500131215301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每1548175018352265241926813156380240264345月1688181418852367252228873300408741654812家173819851943248526653050332142984380庭180020412037251527993189365443124580消19022186207826892887335338424413費220021792713291335344074支231222982898303837104165出2316292331673834
Y238730533310249831873510268932861591191520922586275430393396385340364148舉例:假如已知由100個家庭構成的總體的數據
(單位:元)二、總體回歸函數(PRF)48消費支出的條件期望與收入關係的圖形對於本例的總體,家庭消費支出的條件期望與家庭收入基本是線性關係,可以把家庭消費支出的條件均值表示為家庭收入的線性函數:49
1.總體回歸函數的概念
前提:假如已知所研究的經濟現象的總體的被解釋變數Y和解釋變數X的每個觀測值(通常這是不可能的!),那麼,可以計算出總體被解釋變數Y的條件期望,並將其表現為解釋變數X的某種函數
這個函數稱為總體回歸函數(PRF)
本質:
總體回歸函數實際上表現的是特定總體中被解釋變量隨解釋變數的變動而變動的某種規律性。計量經濟學的根本目的是要探尋變數間數量關係的規律,也就要努力去尋求總體回歸函數。50
●條件期望表現形式例如Y的條件期望是解釋變數X的線性函數,可表示為:
●個別值表現形式(隨機設定形式)對於一定的,Y的各個別值並不一定等於條件期望,而是分佈在的周圍,若令各個與條件期望的偏差為,顯然是個隨機變數則有
2.總體回歸函數的表現形式PRF●作為總體運行的客觀規律,總體回歸函數是客觀存在的,但在實際的經濟研究中總體回歸函數通常是未知的,只能根據經濟理論和實踐經驗去設定。計量經濟學研究中“計量”的根本目的就是要尋求總體回歸函數。●我們所設定的計量模型實際就是在設定總體回歸函數的具體形式。●總體回歸函數中Y與X的關係可以是線性的,也可以是非線性的。
513.如何理解總體回歸函數52計量經濟學中,線性回歸模型的“線性”有兩種解釋:◆就變數而言是線性的——Y的條件期望(均值)是X的線性函數
◆就參數而言是線性的
——Y的條件期望(均值)是參數β的線性函數例如:
對變數、參數均為“線性”對參數“線性”,對變數”非線性”對變數“線性”,對參數”非線性”注意:在計量經濟學中,線性回歸模型主要指就參數而言是“線性”的,因為只要對參數而言是線性的,都可以用類似的方法去估計其參數,都可以歸於線性回歸。“線性”的判斷◆概念
在總體回歸函數中,各個的值與其條件期望的偏差有很重要的意義。若只有的影響,
與
不應有偏差。若偏差存在,說明還有其他影響因素。實際代表了排除在模型以外的所有因素對Y
的影響。◆性質
是其期望為0有一定分佈的隨機變數重要性:隨機擾動項的性質決定著計量經濟分析結
果的性質和計量經濟方法的選擇53
三、隨機擾動項●是未知影響因素的代表(理論的模糊性)●
是無法取得數據的已知影響因素的代表(數據欠缺)●
是眾多細小影響因素的綜合代表(非系統性影響)●
模型可能存在設定誤差(變數、函數形式的設定)●
模型中變數可能存在觀測誤差(變數數據不符合實際)●
變數可能有內在隨機性(人類經濟行為的內在隨機性)54引入隨機擾動項的原因樣本回歸線:
對於X的一定值,取得Y的樣本觀測值,可計算其條件均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數:如果把被解釋變數Y的樣本條件均值
表示為解釋變數X的某種函數,這個函數稱為樣本回歸函數(SRF)
55XYSRF四、樣本回歸函數(SRF)56
樣本回歸函數如果為線性函數,可表示為
其中:是與相對應的Y的樣本條件均值和分別是樣本回歸函數的參數
個別值(實際值)形式:被解釋變數Y的實際觀測值不完全等於樣本條件均值,二者之差用表示,稱為剩餘項或殘差項:則或樣本回歸函數的函數形式條件均值形式:●樣本回歸線隨抽樣波動而變化:每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,(SRF不唯一)
●樣本回歸函數的函數形式應與設定的總體回歸函數的函數形式一致。
●樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸線,它至多只是未知的總體回歸線的近似表現。57樣本回歸函數的特點
SRF1SRF2
YX
A
X
58PRFSRF樣本回歸函數與總體回歸函數的關係
如果能夠通過某種方式獲得和的數值,顯然:●和是對總體回歸函數參數和的估計●是對總體條件期望的估計●
在概念上類似總體回歸函數中的,可視
為對的估計。59對比:
總體回歸函數
樣本回歸函數對樣本回歸的理解60
目的:
計量經濟分析的目標是尋求總體回歸函數。即用樣本回歸函數SRF去估計總體回歸函數PRF。由於樣本對總體總是存在代表性誤差,SRF總會過高或過低估計PRF。要解決的問題:尋求一種規則和方法,使其得到的SRF的參數和盡可能“接近”總體回歸函數中的參數和的真實值。這樣的“規則和方法”有多種,如矩估計、極大似然估計、最小二乘估計等。其中最常用的是最小二乘法。回歸分析的目的用樣本去估計總體回歸函數,總要使用特定的方法,而任何估計參數的方法都需要有一定的前提條件——假定條件
一、簡單線性回歸的基本假定
為什麼要作基本假定?●只有具備一定的假定條件,所作出的估計才具有良好的統計性質。●模型中有隨機擾動項,估計的參數是隨機變數,顯然參數估計值的分佈與擾動項的分佈有關,只有對隨機擾動的分佈作出假定,才能比較方便地確定所估計參數的分佈性質,也才可能進行假設檢驗和區間估計等統計推斷。假定分為:◆對模型和變數的假定◆對隨機擾動項的假定
61第二節
簡單線性回歸模型的最小二乘估計例如對於
●假定模型設定是正確的(變數和模型無設定誤差)●假定解釋變數X在重複抽樣中取固定值。
●假定解釋變數X是非隨機的,或者雖然X是隨機的,但與擾動項u是不相關的。(從變數X角度看是外生的)注意:解釋變數非隨機在自然科學的實驗研究中相對容易滿足,經濟領域中變數的觀測是被動不可控的,X非隨機的假定並不一定都滿足。621.對模型和變數的假定
假定1:零均值假定:
在給定X的條件下,的條件期望為零
假定2:同方差假定:
在給定X的條件下,的條件方差為某個常數
63X
Y2.對隨機擾動項u的假定64
假定3:無自相關假定:
隨機擾動項的逐次值互不相關
假定4:解釋變數是非隨機的,或者雖然是隨機的但與擾動項不相關
(從隨機擾動角度看)
65假定5:對隨機擾動項分佈的正態性假定,即假定服從均值為零、方差為的正態分佈
(說明:正態性假定並不影響對參數的點估計,所以有時不列入基本假定,但這對確定所估計參數的分佈性質是需要的。且根據中心極限定理,當樣本容量趨於無窮大時,的分佈會趨近於正態分佈。所以正態性假定有合理性)由於其中的和是非隨機的,是隨機變數,因此Y是隨機變數,
的分佈性質決定了的分佈性質。
對的一些假定可以等價地表示為對的假定:
假定1:零均值假定
假定2:同方差假定假定3:無自相關假定
假定5:正態性假定
66在對的基本假定下Y的分佈性質1.OLS的基本思想
●對於,不同的估計方法可以得到不同的樣本回歸參數和,所估計的也就不同。●理想的估計結果應使估計的與真實的的差(即剩餘)總的來說越小越好●因可正可負,總有,所以可以取最小,即在觀測值Y和X確定時,的大小決定於和。要解決的問題::如何尋求能使
最小的
和。67二、普通最小二乘法(OLS)
(OrdinaryLeastSquares)用克萊姆法則求解得以觀測值表現的OLS估計量:
68取偏導數並令其為0,可得正規方程或整理得即2.正規方程和估計量69
為表達得更簡潔,或者用離差形式的OLS估計量:容易證明由正規方程:
注意:其中:
本課程中:大寫的和均表示觀測值;小寫的和均表示觀測值的離差而且由樣本回歸函數可用離差形式寫為
用離差表現的OLS估計量
●剩餘項的均值為零
●OLS回歸線通過樣本均值●估計值的均值等於實際觀測
值的均值
70(由OLS第一個正規方程直接得到)(由OLS正規方程兩邊同除n得到)3.OLS回歸線的數學性質
●解釋變數與剩餘項不相關
由OLS正規方程有:
●被解釋變數估計值與剩餘項不相關
72
面臨的問題:
參數估計值參數真實值對參數估計式的優劣需要有評價的標準
為什麼呢?
●參數無法直接觀測,只能通過樣本去估計。樣本的獲得存
在抽樣波動,不同樣本的估計結果不一致。●估計參數的方法有多種,不同方法的估計結果可能不相同,
通過樣本估計參數時,估計方法及所確定的估計量不一定
完備,不一定能得到理想的總體參數估計值。對各種估計方法優劣的比較與選擇需要有評價標準。估計準則的基本要求:參數估計值應"盡可能地接近"總體參數真實值”。
什麼是“盡可能地接近”原則呢?
用統計語言表述就是:無偏性、有效性、一致性等4.OLS估計量的統計性質73
(1)無偏性
前提:重複抽樣中估計方法固定、樣本數不變、由重複抽樣得到的觀測值,可得一系列參數估計值,的分佈稱為的抽樣分佈,其密度函數記為概念:如果,則稱是參數
的無偏估計量,如果,則稱是有偏的估計,其偏倚為(見下頁圖)74
概率密度
估計值偏倚75(2)有效性
前提:樣本相同、用不同的方法估計參數,可以找到若幹個不同的無偏估計式
目標:
努力尋求其抽樣分佈具有最小方差的估計量(見下頁圖)既是無偏的同時又具有最小方差特性的估計量,稱為最佳(有效)估計量。76
概率密度
估計值思想:當樣本容量較小時,有時很難找到方差最小的無偏估計,需要考慮樣本擴大後的性質(估計方法不變,樣本數逐步增大)一致性:
當樣本容量n趨於無窮大時,如果估計式依概率收斂於總體參數的真實值,就稱這個估計式是
的一致估計式。即或
(漸近無偏估計式是當樣本容量變得足夠大時其偏倚趨於零的估計式)
(見下頁圖)漸近有效性:當樣本容量n趨於無窮大時,在所有的一致估計式中,具有最小的漸近方差。773、漸近性質(大樣本性質)78
概率密度
估計值
圖4先明確幾點:●
由OLS估計式可以看出
都由可觀測的樣本值和唯一表示。●
因存在抽樣波動,OLS估計是隨機變數●
OLS估計式是點估計量
79OLS估計是否符合“盡可能地接近總體參數真實值”的要求呢?4.分析OLS估計量的統計性質
2、
無偏特性
可以證明
(證明見教材P38)
80OLS估計式的統計性質——高斯定理(注意:無偏性的證明中用到了基本假定中零均值等假定)1、
線性特徵
是Y的線性函數3、
最小方差特性
(有效性)
(證明見教材P68附錄2·1)可以證明:在所有的線性無偏估計中,OLS估計具有最小方差(注意:最小方差性的證明中用到了基本假定中的同方差、無自相關等假定)結論(高斯定理):
在古典假定條件下,OLS估計量是最佳線性無偏估計量(BLUE)81概念:樣本回歸線是對樣本數據的一種擬合。●不同的模型(不同函數形式)可擬合出不同的樣本回歸線●相同的模型用不同方法去估計參數,也可以擬合出不同的回歸線擬合的回歸線與樣本觀測值總是有偏離。樣本回歸線對樣本觀測數據擬合的優劣程度,可稱為擬合優度。如何度量擬合優度呢?擬合優度的度量建立在對Y的總變差分解的基礎上82
第三節擬合優度的度量
分析Y的觀測值、估計值與平均值有以下關係將上式兩邊平方加總,可證得(提示:交叉項)
(TSS)(ESS)(RSS)
或者表示為
總變差(TSS):被解釋變數Y的觀測值與其平均值的離差平方和(總平方和)(說明Y的總變動程度)
解釋了的變差(ESS):被解釋變數Y的估計值與其平均值的離差平方和(回歸平方和)
剩餘平方和(RSS):被解釋變數觀測值與估計值之差的平方和(未解釋的平方和)83
一、總變差的分解
Y
X
84變差分解的圖示(以某一個觀測值為例)
以TSS同除總變差等式
兩邊:
或
定義:回歸平方和(解釋了的變差ESS)在總變差(TSS)中所占的比重稱為可決係數,用或表示:
85或
二、可決係數
可決係數越大,說明在總變差中由模型作出瞭解釋的部分占的比重越大,模型擬合優度越好。反之可決係數越小,說明模型對樣本觀測值的擬合程度越差。
可決係數的特點:
●可決係數取值範圍:
●隨抽樣波動,樣本可決係數是隨抽樣而變動的隨機變數
●可決係數是非負的統計量86可決係數的作用聯繫:數值上可決係數是相關係數的平方87可決係數與相關係數的關係區別:
可決係數相關係數
是就模型而言是就兩個變數而言說明解釋變數對被解釋說明兩變數線性依存程度
變數的解釋程度
度量不對稱的因果關係度量對稱的相關關係取值0≦≦1取值-1≦r≦1
有非負性可正可負8889第四節
回歸係數的區間估計和假設檢驗為什麼要作區間估計?
運用OLS法可以估計出參數的一個估計值,但OLS估計只是通過樣本得到的點估計,它不一定等於真實參數,還需要尋求真實參數的可能範圍,並說明其可靠性。為什麼要作假設檢驗?OLS估計只是用樣本估計的結果,是否可靠?是否抽樣的偶然結果呢?還有待統計檢驗。區間估計和假設檢驗都是建立在確定參數估計值概率分佈性質的基礎上。90
一、OLS估計的分佈性質
基本思想
是隨機變數,必須確定其分佈性質才可能進行區間估計和假設檢驗
怎樣確定的分佈性質呢?
是服從正態分佈的隨機變數,決定
了
也是服從正態分佈的隨機變數;
是的線性函數,決定了也服從正態分佈
正態正態正態
只要確定的期望和方差,即可確定的分佈性質線性特徵(線性估計的重要性)91●的期望:
(已證明是無偏估計)●的方差和標準誤差
(證明見P39、P40)
(標準誤差是方差的平方根)
注意:以上各式中均未知,但是個常數,其餘均是已知的樣本觀測值,這時和都不是隨機變數。
的期望和方差92
基本思想:
是的方差,而不能直接觀測,只能從由樣本得到的去獲得有關的某些資訊,去對作出估計。可以證明(見附錄2.2)其無偏估計為
(這裏的n-2為自由度,即可自由變化的樣本觀測值個數)注意區別:是未知的確定的常數;是由樣本資訊估計的,是個隨機變數對隨機擾動項方差的估計93對作標準化變換為什麼要對作標準化變換?在正態性假定下,由前面的分析已知但在對一般正態變數作實際分析時,要具體確定的取值及對應的概率,要通過正態分佈密度函數或分佈函數去計算是很麻煩的,為了便於直接利用“標准化正態分佈的臨界值”,需要對作標準化變換。標準化的方式:
標準正態分佈函數94
●在已知時對
作標準化變換,所得Z統計量為標準正態變數。
1.已知時,對作標準化變換注意:這時和都不是隨機變數(X、、都是非隨機的)95
條件:
當未知時,可用(隨機變數)代替去估計
參數的標準誤差。這時參數估計的標準誤差是個隨機變數。
●樣本為大樣本時,作標準化變換所得的統計量Zk,也可以
視為標準正態變數(根据中心极限定理)。
●樣本為小樣本時,
用估計的參數標準誤差對作標準化變換,所得的統計量用t表示,這時t將不再服從正態分佈,而是服從t分佈(注意這時分母是隨機變數)
:
2.未知時,對作標準化變換基本思想:
對參數作出的點估計是隨機變數,雖然是無偏估計,但還不能說明這種估計的可靠性和精確性。如果能找到包含真實參數的一個範圍,並確定這樣的範圍包含參數真實值的可靠程度,將是對真實參數更深刻的認識。方法:如果在確定參數估計式概率分佈性質的基礎上,可找到兩個正數δ和,能使得這樣的區間包含真實的概率為,即這樣的區間稱為所估計參數的置信區間。
討論:“如果已經得出了的特定估計值,並確定了某個置信區間,這說明真實參數落入這個區間的概率為1-α”。這種說法對嗎?96
二、回歸係數的區間估計
97樣本容量充分大樣本容量較小總體方差已知總體方差
未知Z將接近標準正態分佈服從
t分佈三種情況基本思想:利用標準化後統計量的分佈性質去尋求:置信區間:標準正態分佈(1)
當總體方差已知時(Z服從正態分佈)
取定(例如=0.05),查標準正態分佈表得與對應的臨界值z(例如z為1.96),則標準化變數Z*(統計量)
因為
或
即98回歸係數的區間估計
(分三種情況尋找合適的)
方法:可用無偏估計去代替未知的,由於樣本容量充分大,標準化變數Z*(統計量)將接近標準正態分佈注意:這裏的“
^”,表示“估計的”,這時區間估計的方式也可利用標準正態分佈只是這時992.當總體方差未知,且樣本容量充分大時
方法:用無偏估計去代替未知的,由於樣本容量較小,“標準化變數”
t(統計量)不再服從正態分佈,而服從t分佈。這時可用t分佈去建立參數估計的置信區間。選定α,查t分布表得顯著性水準為,自由度為n-2的臨界值(n-2)
,則有即
1003、當總體方差未知,且樣本容量較小時
例1:研究某市城鎮居民人均鮮蛋需求量Y(公斤)與人均可支配收入X(元,1980年不變價計)的關係設定模型:
1995-2005年樣本數據:估計參數:年份19951996199719981999200020012002200320042005Y14.414.414.414.717.016.318.018.518.219.317.1X847.3821.0884.2903.7984.11035.31200.91289.81432.91539.01633.6計算可決係數例1:由前面的估計結果可計算出由數據Y可計算出:則估計結果:估計:給定查df=n-2=9的t分佈臨界值參數區間估計:若給定查df=9的t分佈臨界值103若給定則若給定則則104104統計量t計算的統計量為:相對於顯著性水準的臨界值為:
(單側)或
(雙側)基本概念回顧:
臨界值與概率、大概率事件與小概率事件0(大概率事件)(小概率事件)目的:簡單線性回歸中,檢驗X對Y是否真有顯著影響三、回歸係數的假設檢驗
105
回歸係數的檢驗方法
確立假設:原假設為備擇假設為
(本質:檢驗是否為0,即檢驗是否對Y有顯著影響)
(1)當已知或樣本容量足夠大時
可利用正態分佈作Z檢驗
給定,查正態分佈表得臨界值Z▼
如果則不拒絕原假設▼如果
或
則拒絕原假設106(2)當未知,且樣本容量較小時
只能用去代替,可利用t分佈作t檢驗:
給定,查t分佈表得▼如果或者則拒絕原假設而不拒絕備擇假設▼如果則不拒絕原假設用P值判斷參數的顯著性假設檢驗的p值:
p值是基於既定的樣本數據所計算的統計量,拒絕原假設的最低顯著性水準。統計分析軟體中通常都給出了檢驗的p值
P統計量t計算的統計量:相對於顯著性水準的臨界值:或注意:t檢驗是比較和P值檢驗是比較和p與相對應與P相對應108用P值判斷參數顯著性的方法方法:將給定的顯著性水準與p值比較:►若值,必有,則在顯著性水準下拒絕原假設,即認為X對Y有顯著影響►若值,必有,則在顯著性水準下不拒絕原假設,即認為X對Y沒有顯著影響規則:當時,P值越小,越能拒絕原假設109舉例:對例1參數的顯著性檢驗給定查df=9的t分佈臨界值計算統計量判斷:因拒絕說明顯著不為0,X對Y確有顯著影響用P值檢驗:
(需要確定與
對應的P值)由,df=9,查t分佈表知道P<0.0005(t=4.781時)因t=5.00時的P值<0.0005(t=4.781)
<<則在顯著性水準下更應拒絕原假設即認為X對Y有顯著影響第五節
回歸模型預測
一、回歸分析結果的報告
經過模型的估計、檢驗,得到一系列重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国多肽药物行业发展环境分析及投资战略研究报告
- 2024-2030年中国地坪行业发展态势与投资建议分析报告
- 小学班主任工作考核方案
- 2024年环保节能厂房分租服务合同模板下载3篇
- 2024年版:数字音乐版权许可合同(许可范围、使用方式及许可费用)
- 2024年区二手房买卖交易安全协议范本2篇
- 2024年生态旅游度假区开发与运营合同
- 马鞍山师范高等专科学校《新生专业导读课程》2023-2024学年第一学期期末试卷
- 2024年度财富传承代客理财专项协议3篇
- 2025电脑销售合同样本
- 民办学校教职工入职背景审查制度
- 2024年新人教版四年级数学上册《教材练习21练习二十一(附答案)》教学课件
- 2024年湛江市农业发展集团有限公司招聘笔试冲刺题(带答案解析)
- 商业伦理与社会责任智慧树知到期末考试答案2024年
- MOOC 创新思维与创业实验-东南大学 中国大学慕课答案
- 二级公立医院绩效考核三级手术目录(2020版)
- 6人小品《没有学习的人不伤心》台词完整版
- GB/T 16865-1997变形铝、镁及其合金加工制品拉伸试验用试样
- 自闭症儿童行为检核表学前版
- 五年级上册数学专项练习高的画法 全国通用
- 民警个人季度小结范文(3篇)
评论
0/150
提交评论