因果推论新思维反事实分析架构_第1页
因果推论新思维反事实分析架构_第2页
因果推论新思维反事实分析架构_第3页
因果推论新思维反事实分析架构_第4页
因果推论新思维反事实分析架构_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因果推论新思维反事实分析架构第一页,共一百零二页,2022年,8月28日1因果推論:從古到今參考JudeaPearl(professorofComputerScienceandStatisticsanddirectoroftheCognitiveSystemsLaboratory,UCLA)第二页,共一百零二页,2022年,8月28日1因果推論:從古到今從亞當與夏娃說起:亞當與夏娃吃過智慧樹的果子後,他們已經是因果解釋的專家。當上帝問亞當你是否吃了智慧樹的果子時(詢問事實),亞當的回答是:「祢給我的那個女人,從樹上拿了果子讓我吃了」(不只是說明事實,還做了解釋);上帝問夏娃,夏娃回答是:「我是吃了,可是是蛇誘惑和欺騙了我」。第三页,共一百零二页,2022年,8月28日1因果推論:從古到今聖經故事的意涵:因果解釋是一個man-madeconcept。因果解釋是拿來歸咎責任的。只有神(為了某些目的)、人與動物(有自有意志)可以讓事情發生,而不是東西(objects)或物理的過程(physicalprocesses)。第四页,共一百零二页,2022年,8月28日1因果推論:從古到今但當工程師開始建造有許多滑輪及繩纜的system來幫人做事後,physicalobjects開始有了因果的特性。當系統無法運作時,歸咎於神或人並沒有用,比較有效的解釋是滑輪或繩纜壞了,只要加以替換後,系統就可再運作。至此,causes之概念有雙重意義:thetargetsofcreditandblamethecarriersofphysicalflowofcontrolontheother

第五页,共一百零二页,2022年,8月28日1因果推論:從古到今至文藝復興時,當上帝做為finalcause逐漸被人的科學知識所取代時,這雙重意義遇到困難與挑戰。Galileo在1638年出版Discorsi(兩門新科學的對話)這本書後,有了革命性的轉變。此書有兩項重要的格言(maxims):第六页,共一百零二页,2022年,8月28日1因果推論:從古到今1.先描述,後解釋(Descriptionfirst,explanationsecond):Thehowprecedesthewhy.Asknot,saidGalileo,whetheranobjectfallsbecauseitispulledfrombeloworpushedfromabove.Askhowwellyoucanpredictthetimeittakesfortheobjecttotravelacertaindistance,andhowthattimewillvaryfromobjecttoobject,andastheangleofthetrackchanges.

2.以數學(方程式)來描述,而不是語言:如d=t2

。第七页,共一百零二页,2022年,8月28日1因果推論:從古到今從此,物理學充滿了有用但未被解釋的經驗法則,如Snelllaw,Hooke’slaw,Ohm’slaw,Joule’slaw。另一項比預測實驗結果更重要的是代數方程式的運用,因為工程師除了可以問“howto”外,還可以問“whatif”。第八页,共一百零二页,2022年,8月28日1因果推論:從古到今至啟蒙時代,DavidHume將Galileo的第一項格言發揮至極致,他認為

theWHYisnotmerelysecondtotheHOW,butthattheWHYistotallysuperfluousasitissubsumedbytheHOW。Onpage156ofTreatiseofHumanNature:"ThusweremembertohaveseenthatspeciesofobjectwecallFLAME,andtohavefeltthatspeciesofsensationwecallHEAT.Welikewisecalltomindtheirconstantconjunctioninallpastinstances.Withoutanyfartherceremony,wecalltheoneCAUSEandtheotherEFFECT,andinfertheexistenceoftheonefromthatoftheother."第九页,共一百零二页,2022年,8月28日1因果推論:從古到今從實證主義的角度來看,Hume是在說“AcausedB”與“WheneverAoccurs,thenBdoes”相同。但是我們都知道雞啼是伴隨著朝陽,但雞啼並不是讓太陽出來的原因。大難題1:如果如Hume所說,我們的知識是來自於經驗,而經驗是以相關的形式存於我們的心靈中,那我們如何得到因果方面的知識?Ifregularityofsuccessionisnotsufficient;whatWOULDbesufficient?

第十页,共一百零二页,2022年,8月28日1因果推論:從古到今大難題2:我們知道某些關連有或沒有因果間的關係,有何差別嗎?知道因果又有何用?當然知道因果關係,就可以做某些事。如果雞啼是造成太陽升起的原因,那我們要縮短夜晚的話,就可以讓雞早些啼。Ifcausalinformationhasanempiricalmeaningbeyondregularityofsuccession,thenthatinformationshouldshowupinthelawsofphysics.Butitdoesnot!

第十一页,共一百零二页,2022年,8月28日1因果推論:從古到今Russell(1913)認為“Allphilosophersimaginethatcausationisoneofthefundamentalaxiomsofscience,yetoddlyenough,inadvancedsciences,theword'cause'neveroccurs...Thelawofcausality,Ibelieve,isarelicofbygoneage,surviving,likethemonarchy,onlybecauseitiserroneouslysupposedtodonoharm...”“Itcouldnotpossiblybeanabbreviation,becausethelawsofphysicsareallsymmetrical,goingbothways,whilecausalrelationsareuni-directional,goingfromcausetoeffect.”第十二页,共一百零二页,2022年,8月28日1因果推論:從古到今但另一位科學哲學家PatrickSuppes則指出“ThereisscarcelyanissueofPhysicalReviewthatdoesnotcontainatleastonearticleusingeither‘cause’or‘causality’initstitle.”物理學家一方面寫無因果意涵的方程式,但另一方面卻大談因果關係。統計學一百多年前發現相關(correlation)的概念後,卻無法忽略相關與因果間的區辨。第十三页,共一百零二页,2022年,8月28日1因果推論:從古到今FrancisGalton於1888年進行個人的前臂與其頭大小關係的測量,企圖瞭解一個數值預測另一個數值的程度時,發現到:Ifyouplotonequantityagainsttheotherandscalethetwoaxesproperly,thentheslopeofthebest-fitlinehassomenicemathematicalproperties:Theslopeis1onlywhenonequantitycanpredicttheotherprecisely;itiszerowheneverthepredictionisnobetterthanarandomguessand,mostremarkably,theslopeisthesamenomatterifyouplotXagainstYorYagainstX."我們開始可以根據資料客觀的測量兩個變項間的關係,而不是根據我們的意見或判斷。第十四页,共一百零二页,2022年,8月28日1因果推論:從古到今Galton的發現震撼了其學生KarlPearson(公認是現代統計學之父),使他終其一生認為我們只需要「相關」這個更廣泛的概念,而不需要另一個獨立的因果關係的概念。他也從不在其論文內提到因果的概念。這一直要到SirRonaldFisher建立randomizedexperiment的研究設計後,才成為唯一被主流統計學所接受,並認為這是唯一可從資料驗證因果間關係的科學方法。但這種謹慎的看法使得無法做實驗,而需靠統計分析為引導的社會科學處於近乎癱瘓的狀態。第十五页,共一百零二页,2022年,8月28日1因果推論的新典範Pearl認為這樣的困境是源自統計學的官方語言:機率的語言。因為cause並不是機率的字彙。我們無法以機率的語言表達:Muddoesnotcauserain。我們只能說兩者相關。Naturally,ifwelackalanguagetoexpressacertainconceptexplicitly,wecan'texpecttodevelopscientificactivityaroundthatconcept.Scientificdevelopmentrequiresthatknowledgebetransferredreliablyfromonestudytoanotherand,asGalileohasshown350yearsago,suchtransferencerequirestheprecisionandcomputationalbenefitsofaformallanguage.第十六页,共一百零二页,2022年,8月28日1因果推論的新典範當研究者開始企圖使用電腦來建立因果關係時,對於先前兩大難題有了新的想法。從概念層次來說,機器人所遇到的問題是與經濟學家企圖建立稅收及預算模式,或流行病學家企圖建立流行病的模式是一樣的。不論是機器人、經濟學家或流行病學家都需要在行動受限制的條件下,依據充滿雜音的資訊,從環境中找出因果的關係。這就是先前的第一個大難題:HOW?第十七页,共一百零二页,2022年,8月28日1因果推論的新典範機器人的世界也與第二大難題有關。如果我們教導機器人關於因果的知識,機器人要如何組織及運用這些知識呢?對機器人而言,這兩大難題是具體而實際的問題,就是如何從與環境的互動中得到因果的知識,以及如何運用從創造者/程式設計師得到的因果知識?第十八页,共一百零二页,2022年,8月28日1新典範與新語言J.Pearl的答案:第二個難題可以結合graphs與equations的方式解決,如此則第一個難題也比較容易解決。解題的主要關鍵概念是:(1)treatingcausationasasummaryofbehaviorunderinterventions.(2)usingequationsandgraphsasamathematicallanguagewithinwhichcausalthoughtscanberepresentedandmanipulated.(3)Treatinginterventionsasasurgeryoverequations.第十九页,共一百零二页,2022年,8月28日1新典範與新語言社會科學家過去75年來不時使用graphs,如structuralequationsmodeling及pathdiagrams。但是由於代數方程式的便利性,因而壓抑了圖型的使用,也進而失去了圖型帶來的好處。這些diagrams事實上捕捉了因果的本質─預測不正常情況或是新的操弄狀態下,會產生什麼結果。這種預測是代數或相關分析無法做到的。第二十页,共一百零二页,2022年,8月28日1新典範與新語言第二十一页,共一百零二页,2022年,8月28日1新典範與新語言從這樣的角度來看因果關係,可以理解為何科學家如此熱衷於因果解釋,因為建立因果模式會得到一種“deepunderstanding”及“beingincontrol”的感覺。Deepunderstanding的意思是“knowing,notmerelyhowthingsbehavedyesterday,butalsohowthingswillbehaveundernewhypotheticalcircumstances,controlbeingonesuchcircumstance”.第二十二页,共一百零二页,2022年,8月28日1新典範與新語言即使我們無法實際上控制事情,我們也因理解因果關係而得到“incontrol”的感覺。例如,我們無法控制星體的運轉,但萬有引力的理論,讓我們能夠理解並獲得假設性控制(hypotheticalcontrol)的感覺。我們也可以預測當萬有引力改變時,對潮汐會產生什麼影響。因果模式也是做為區辨有意識的論證(deliberatereasoning)及被動或本能的反應(reactiveorinstinctiveresponse)的試金石。前者可在即使不真正去從事新的操弄(manipulation)下,也可以預期新的操弄可以得到什麼結果。第二十三页,共一百零二页,2022年,8月28日1新典範與新語言Equationsvs.Diagrams(J.Pearl)第二十四页,共一百零二页,2022年,8月28日1新典範與新語言DefinitionofCausation:YisacauseofZifwecanchangeZbymanipulatingY,namely,ifaftersurgicallyremovingtheequationforY,thesolutionforZwilldependonthenewvaluewesubstituteforY.THEDIAGRAMTELLSUSWHICHEQUATIONISTOBEDELETEDWHENWEMANIPULATEY.INTERVENTIONAMOUNTSTOASURGERYONEQUATIONS,GUIDEDBYADIAGRAM,ANDCAUSATIONMEANSPREDICTINGTHECONSEQUENCESOFSUCHASURGERY.第二十五页,共一百零二页,2022年,8月28日1新典範與新語言INTERVENTIONASSURGERY-CONTROLLEDEXPERIMENTS

假定我們要研究某種藥物是否能幫助病人從某些疾病復原。但影響復原的因素不只是藥物治療,還有其他的因素,如社經地位、年齡、生活方式等。這對我們判斷藥物的效果來說是個問題,因為我們不知道影響復原的程度是那個因素造成的。因此,我們希望能夠比較背景相同的病人,而這就是Fisher的RandomizedExperiment能夠做到的。但隨機分派的實驗設計如何做到這種比較呢?第二十六页,共一百零二页,2022年,8月28日1新典範與新語言這種實驗設計實際上有兩個部份:RandomizationandIntervention.Intervention就是我們將藥物給一些在正常情況下不會需要這種治療的病人,另一方面我們給一些尋求治療的病人安慰劑(placebo)。這也是先前提及的SURGERY的概念,因為我們將一個functionallink(如SES)切斷,而用另一種替代。Fisher的偉大貢獻是connectingthenewlinktoarandomcoinflip,以此保證我們想要切斷的link是確實被切斷了,因為我們可以假定這個randomcoin是不受任何我們可以測量到的因素所影響的。第二十七页,共一百零二页,2022年,8月28日1新典範與新語言第二十八页,共一百零二页,2022年,8月28日1新典範與新思維在新典範下,我們可以如何在無法從事實驗的情況下,利用observationalstudies(如調查或病歷)的資料思考因果關係呢?第二十九页,共一百零二页,2022年,8月28日1發問方式兩類探索因果關係的研究問題第一類研究問題:X對Y的影響為何?研究目的是要知道:X對Y有影響嗎?有的話,影響有多大?這是實驗設計所問的研究問題第二類研究問題:影響Y的因素有哪些?研究目的是要知道:所有可能解釋Y的因素有哪些。第三十页,共一百零二页,2022年,8月28日1如何認定因果關係?參考Morgan,StephenL.&ChristopherWinship(2007).CounterfactualsandCausalInference:MethodsandPrinciplesforSocialResearch.NewYork,NY:CambridgeUniversityPress.第三十一页,共一百零二页,2022年,8月28日1如何認定因果關係?XY(HadXtakenadifferentvalue,thenYwouldhavetakenadifferentvalue)ThecausalrelationshipbetweenXandYisconfoundedif:Z

XY第三十二页,共一百零二页,2022年,8月28日1如何認定因果關係?ZA

XYZA(unobserved)

XY第三十三页,共一百零二页,2022年,8月28日1如何認定因果關係?XY

C(collider)ZA(unobserved)

XY

第三十四页,共一百零二页,2022年,8月28日1StatisticalRelationsvs.

CausalRelationsStatisticaldependencemayreflectRandomfluctuation(c.i.&p-value)XcausedYYcausedX(temporalorder;longitudinaldata)XandYshareacommoncause(covariateadjustment)AssociationbetweenXandisinducedbyconditioningonacommoneffectofXandY(selectionbias;colliderbias)第三十五页,共一百零二页,2022年,8月28日1如何推估theeffectofXonY?當X與Y有commoncauses時,如能認定X與Y間的因果路徑,可以因有效的控制一組共變項Z,且Z內沒有受X影響時,則我們可以清楚的推估theeffectofXonY。Pearl’sBack-doorCriterion第三十六页,共一百零二页,2022年,8月28日1如何推估theeffectofD(treatment)onY?

V(unobserved)AFGU(unobserved)BD

YC第三十七页,共一百零二页,2022年,8月28日1Pearl’sBack-doorCriterionIfoneormoreback-doorpathsconnectsthecausalvariabletotheoutcomevariable,Pearlshowsthatthecausaleffectisidentifiedby

conditioningonasetofvariablesZ

ifandonlyifallback-doorpathsbetweenthecausalvariableandtheoutcomevariableareblockedafterconditioningonZ.第三十八页,共一百零二页,2022年,8月28日1Pearl’sBack-doorCriterionAback-doorpathofDandYisblockedbyZ

ifandonlyiftheback-doorpathsatisfiesanyoneofthefollowing:

containsachainofmediationA→Z→B,orcontainsaforkofmutualdependenceA←Z→B;containsaninvertedforkofmutualcausationA→C*←B,whereC*andallitsdescendantsarenotinZ.第三十九页,共一百零二页,2022年,8月28日1如何推估theeffectofDonY?

(控制B&F即可,Why?)

V(unobserved)AFGU(unobserved)BD

YC第四十页,共一百零二页,2022年,8月28日1Pearl’sBack-doorCriterion(continued)從Pearl的Back-doorCriterion來看,並不是控制越多變項就好,因為要是控制了colliders反而會有問題,因為本來X與Y沒有相關或因果關係的,控制這類變項後,反而會產生相關。Example如果collider是申請入學時是否被一所菁英學校接受(adm:1-接受;0-拒絕)是否被接受是根據兩個獨立變項:SAT及面試時對動機的評估(Motivation)因此:adm是的兩個causes是SAT及Motivation,而SAT及Motivation間是獨立的。第四十一页,共一百零二页,2022年,8月28日1Exampleofcontrollingacollider第四十二页,共一百零二页,2022年,8月28日1Exampleofcontrollingacollider第四十三页,共一百零二页,2022年,8月28日1Exampleofcontrollingacollider第四十四页,共一百零二页,2022年,8月28日1如何推估theeffectofDonY?AFGBD

Y

CH第四十五页,共一百零二页,2022年,8月28日1如何有效的控制confoundingvariables(Z)呢?如果D只有兩個值:0及1,我們可以用實驗設計的方式,將兩組相同特性的人,隨機分配到控制組(D=0)及實驗組(D=1),即可達到前述的狀態。Why?如果無法用實驗設計,而是用調查方法蒐集資料時,如何推估呢?條件性控制(conditioning)或是配對(matching):byholding<something>constantorbybalancing/homogenizingthetreatment&controlgroups.第四十六页,共一百零二页,2022年,8月28日1TheCounterfactualFrameworkGroupPotentialOutcomesY1Y0Treatmentgroup(D=1)

ObservableCounterfactualControlgroup(D=0)CounterfactualObservable反事實因果推論的想像第四十七页,共一百零二页,2022年,8月28日1TheCounterfactualFramework反事實分析架構的想像可看成是一種thoughtexperiment。要想像的是同一個個體或群體在不同的狀態下,會有什麼可能的結果(potentialoutcomes)。這些可能結果間的差異,即為不同狀態(因)的效果。Counterfactualsshouldbereasonable!

第四十八页,共一百零二页,2022年,8月28日1TheCounterfactualFrameworkQ:什麼是unreasonable的counterfactuals呢?有什麼狀態不適合看成為causes的嗎?有什麼樣的結果不適合想像counterfactual情況的嗎?第四十九页,共一百零二页,2022年,8月28日1TheCounterfactualFramework個人層次的真正因果效應:

δi=Yi1─Yi0TheFundamentalProblemofCausalInference:無法觀察同一個人同時在實驗組及控制組。加上一些假定,如SUTVA,則可推估群層次的因果效應。第五十页,共一百零二页,2022年,8月28日1TheCounterfactualFrameworkSUTVA:TheStableUnitTreatmentValueAssumption–aprioriassumptionthatthevalueofYforunituwhenexposedtotreatmenttwillbethesamenomatterwhatmechanismisusedtoassigntreatmentttounituandnomatterwhattreatmentstheotherunitsreceive.第五十一页,共一百零二页,2022年,8月28日1TheCounterfactualFramework實驗設計是假設我們能夠將觀察到的替代無法觀察到的。如隨機分派到實驗組與控制組的個體的特性相同,則我們可以假定:如果實驗組的個人沒有接受treatment的話,其結果與控制組觀察到的相同;如果控制組的個人接受treatment的話,其結果與實驗組觀察到的相同。第五十二页,共一百零二页,2022年,8月28日1TheCounterfactualFramework當使用調查方法得到資料時,即observationaldata,個人為何會接受或不接受treatment,往往不是一個隨機的現象。Observationaldata通常有兩個問題:接受treatment者與不接受者有baselinedifferences,以及heterogeneityoftreatmenteffect.可能有些影響接受treatment與否的變項,並未觀察到,亦即omittedvariables的問題。第五十三页,共一百零二页,2022年,8月28日1TheCounterfactualFrameworkGroupPotentialOutcomesY1Y0Treatmentgroup(D=1)

ObservableE[Y1|D=1]CounterfactualE[Y0|D=1]

Controlgroup(D=0)CounterfactualE[Y1|D=0]

ObservableE[Y0|D=0]

第五十四页,共一百零二页,2022年,8月28日1TheCounterfactualFramework以反事實架構的觀點來看,母群體層次的真正因果效應(ATE;AverageTreatmentEffect)為:E[δ]=E[Y1–Y0]=E[Y1]–E[Y0]={πE[Y1|D=1]+(1–π)

E[Y1|D=0]}– {πE[Y0

|D=1]+(1–π)E[Y0|D=0]}=π{E[Y1

|D=1]–E[Y0|D=1]

}+(1–π){E[Y1|D=0]–E[Y0|D=0]}=πE[δ|D=1]+(1–π)

E[δ|D=0]第五十五页,共一百零二页,2022年,8月28日1TheCounterfactualFrameworkπ:母群體中接受treatment的比例不同組的因果效應:ATT(AverageTreatmentEffectontheTreated): E[Y1|D=1]–E[Y0|D=1]

,即E[δ|D=1]

ATU(AverageTreatmentEffectontheUntreated):

E[Y1|D=0]–E[Y0|D=0],即E[δ|D=0]Q:我們可以假定不同組的人有同樣的因果效應嗎?如果我們能夠做此假定的話,則E[Y1|D=0]=E[Y1|D=1]

第五十六页,共一百零二页,2022年,8月28日1TheCounterfactualFramework基準線的差異:

E[Y0|D=1]–E[Y0|D=0]Q:我們可以假定不同組的人在未接受treatment前是一樣的嗎?

如果我們能夠做此假定的話,則E[Y0|D=1]=E[Y0|D=0]第五十七页,共一百零二页,2022年,8月28日1TheCounterfactualFramework

如果我們只以觀察到接受treatment的組與觀察到未接受treatment的組之間的差異做為CausalEffect的估計時,此估計是一種NaïveEstimate:

NaïveEstimateE[Y1|D=1]–E[Y0|D=0]=averagecausaleffect=E(δ)+baselinebias+{E(Y0|D=1)−E(Y0|D=0)}+differentialeffectbias+{E(δ|D=1)−E(δ|D=0)}(1−π)第五十八页,共一百零二页,2022年,8月28日1TheCounterfactualFramework:AReview反事實分析架構的五個關鍵概念:Potential/HypotheticalStates&Outcomes:因果效應(causaleffect)是利用“potential”或“hypothetical”的概念,而不是只用到actualobservations。.Theceterisparibuscondition其他條件相同的條件下,也就是將其他因素控制成等同(equal)、固定不變(fixed)或是constant。第五十九页,共一百零二页,2022年,8月28日1TheCounterfactualFramework:AReviewHeterogeneity:個人對於treatment的反應是因人而異的。亦即因果效應在個人層次即被認定是有差異的。每個人的因果效應是:

[potentialoutcomeunderthepotentialtreatmentstate] ─[potentialoutcomeunderthepotentialcontrolstate]FundamentalProblemofCausalInference:由於thecounterfactualdefinitionofcausaleffect意涵著評估個人層次的因果效應會有missingdata的問題。但是如果我們願意做一些假定的話,我們可以評估幾種AverageCausalEffects。第六十页,共一百零二页,2022年,8月28日1TheCounterfactualFramework:AReviewBasicParametersofInterest:ATT:AverageTreatmenteffectontheTreatedATU:AverageTreatmenteffectontheUntreatedATE:AverageTreatmentEffectthemostbasiconeisATT,andthereareothermeaningfulcausalparametersofinterestthanthesethree.第六十一页,共一百零二页,2022年,8月28日1反事實分析架構下分析

觀察資料的方法假設控制影響treatment之共變項後,就能達成ignorability,這也稱為selectiononobservables)propensityscorematching如果此假定不成立的話:instrumentalvariableHeckmanselectionmodel利用長期追蹤資料的特性,使用如fixedeffectmodel,changescoremodel不同的分析方法,要做不同的假定第六十二页,共一百零二页,2022年,8月28日1傾向分數配對法介紹

關秉寅政治大學社會學系IntroductiontoPropensityScoreMatching第六十三页,共一百零二页,2022年,8月28日1OLS迴歸分析的問題一般多元OLS迴歸分析,是一種ATE的估計,其作法假定其控制足夠的共變項後,可以消除基準線差異,並假定接受treatment者的因果效應與未接受者相同。這些假定合理嗎?OLS迴歸分析通常無法克服自我選擇的問題。OLS迴歸分析可能將接受treatment及沒接受treatment兩組中無法比較的人納入分析。如果兩組人的特性(基準線)相當不同,則OLS的推估會有大問題,因為其無法比較的部份是以imputation的方式來推估。第六十四页,共一百零二页,2022年,8月28日1反事實分析架構下分析

觀察資料的方法假設只有omittedvariables,且是可以用控制觀察到之變項來控制的話(即控制影響treatment之共變項後,就能達成ignorability,這也稱為selectiononobservables)propensityscorematching(PSM)是這類假定下發展出來的分析方法。第六十五页,共一百零二页,2022年,8月28日1反事實分析架構下分析

觀察資料的方法selectiononobservablesZDY

U(unobservable)第六十六页,共一百零二页,2022年,8月28日1PropensityScoreMatching(PSM)假定:如果接受及不接受treatment兩種人的差異能夠被一組共變項(Z)完美解釋,那麼我們就可以用這些共變項進行分層配對,使得每層內有兩種人:接受者及不接受者,且這些人在各層中唯一的不同是他們是否接受treatment。然後,我們觀察這兩種人在outcome的差異為何。我們再進一步將各分層的差異,以及分層所佔的比例做適當加權,則可得到好的ATE,ATT,ATU的估計。第六十七页,共一百零二页,2022年,8月28日1PropensityScoreMatching(PSM)(Y1,Y0)╨

D|Z實際上如果有許多共變項時,配對過程很麻煩,且在樣本有限的情況下,有些分層會沒有個案。PaulRosenbaum及DonaldRubin在一系列的論文中,證明用所謂的「傾向分數」(propensityscore)將是否會接受視為一種機率,然後以此分數來從事分層配對是可行的。第六十八页,共一百零二页,2022年,8月28日1PropensityScoreMatching(PSM)如何得到傾向分數?找到有意義可解釋是否會接受treatment的共變項,然後做Logit或Probit迴歸,應變項為是否接受treatment。根據傾向分數將接受者及不接受者進行配對,並找到commonsupport。在commonsupport

的樣本中,兩組人的分配是balanced(檢視matchingquality)。第六十九页,共一百零二页,2022年,8月28日1PropensityScoreMatching(PSM)實際從事PSM的運算方法有四大類:ExactMatchingNearestNeighborMatchingIntervalMatchingKernelMatching

不同運算方法的差異:WithorwithoutreplacementHowmanyunitstomatch第七十页,共一百零二页,2022年,8月28日1PropensityScoreMatching(PSM)選擇不同運算法的兩難要能maximize精準的配對(如用strictly“nearest”orcommon-supportregion),可能會有比較多的樣本個案會被排除於分析之外。要能包括比較多的配對樣本個案(如擴大配對的範圍),就會有比較多不精準的配對。用bootstrapping方式求得PSM估計值的standarderrors第七十一页,共一百零二页,2022年,8月28日1PropensityScoreMatching(PSM)實際可從事PSM的程式:Stata:psmatch2等SPSS:SPSSMacroforPropensityScoreMatching()SAS:“GREEDY”Macro()R:“MatchIt”()第七十二页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?

研究問題:國三補習數學有用嗎?ATT:如果國三補數學的人,沒補的話,數學成就會有差異嗎?ATU:如果國三沒補數學的人,補習的話,數學成就會有差異嗎?ATE:如果所有的人國三都補數學的話,數學成就會有差異嗎?參考:關秉寅、李敦義(2008)。補習數學有用嗎?一個「反事實」的分析。台灣社會學刊,41,97-148。

第七十三页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?研究使用的資料:TEPS國中樣本(公開使用版)2001(N=13,978)2003(N=13,247)分析樣本:公立國中生;withcommonsupport

(N=10,013)第七十四页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?應變項:國三數學能力IRT,轉換成NCE(normalcurveequivalence)分數(Range:1–99;Mean:50;S.D.:21.06)自變項(Treatment):國三補習數學26個配對變項:個人特性及學習特質:性別、補習經驗、W1數學IRT等(motivation,ability)家庭背景:父母教育程度、職業、教育期待等班級/學校學習氣氛及環境第七十五页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?分析策略:只研究國三數學補習的效果國三補習主要是為了準備基測學校教育對數學能力的培養比較有影響力以階層性模型探討國三補習的參與及補習效果,以瞭解過往補習研究可能有的限制,以及比較OLS及PSM兩者估計ATE可能有的差異比較有及沒有W1數學IRT做為配對變項的差異第七十六页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?使用Stata(version9以上版本)的指令:psmatch2及bootstrapPSMATCH2:StatamoduletoperformfullMahalanobisandpropensityscorematching,commonsupportgraphing,andcovariateimbalancetesting(byEdwinLeuven&BarbaraSianesi)Bootstrap用來估計standarderroroftheestimate第七十七页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?useD:\w2w1all01,clearsetseed19123584psmatch2w2s1102w1s502mathtimew1s535-w1s550w1tms1w1tms3/// w1s507dw2s1121dcram1-cram3ethn2-ethn4paedu2paedu3/// paocc1-paocc2w1p5152-w1p5154nuintactsibsize/// eduexp2eduexp3groupingw1s309-w1s318w1urban32-w1urban33/// w1m3p29c,out(w2m3p28NCE)kernelcommonlogitategenps=_pscore第七十八页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?第七十九页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?

誰參加國三數學補習?個人特性及學習特質:先備能力較佳、過去沒補習經驗者、回家會複習功課、自己沒有補習的意願家庭背景:非原住民、與雙親同住、父母不是研究所學歷、白領職業、高收入、高父母教育期望、手足人數少

班級/學校情況:位於在都市化程較高地區、班上讀書風氣盛、學業競爭激烈程度高第八十页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?VariableSample|TreatedControlsDifferenceS.E.T-statw2m3p28NCEUnmatched|57.149242144.428517512.7207246.4005282931.76<observed><potential><outcome>ATT|57.124278654.8661212.25815756.4797762174.71ATU|44.684442448.26441023.57996779ATE|2.95584959+Note:S.E.forATTdoesnottakeintoaccountthatthepropensityscoreisestimated.psmatch2:|psmatch2:CommonTreatment|supportassignment|OffsuppoOnsuppor|Total++Untreated|615,263|5,324Treated|74,708|4,715++Total|689,971|10,039第八十一页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?pstestw2s1102w1s502mathtimew1s535-w1s550w1tms1w1tms3///w1s507dw2s1121dcram1-cram3w1m3p29cethn2-ethn4///paedu3paocc1-paocc2w1p5152-w1p5154nuintactsibsize///eduexp2eduexp3groupingw1s309-w1s318///w1urban32-w1urban33,summarytreated(_treated)第八十二页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?第八十三页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?setseed19123584psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)mahal(w2stwt1)///

addkernelcommonlogit

VariableSample|TreatedControlsDifferenceS.E.T-stat+w2m3p28NCEUnmatched|57.149242144.428517512.7207246.4005282931.76ATT|57.104426854.98457362.11985317.492394954.31+Note:S.E.forATTdoesnottakeintoaccountthatthepropensityscoreisestimated.psmatch2:|psmatch2:CommonTreatment|supportassignment|OffsuppoOnsuppor|Total++Untreated|05,324|5,324Treated|264,689|4,715++Total|2610,013|10,039第八十四页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?psgraph,bin(50)treated(_treated)support(_support)///pscore(_pscore)檢視有commonsupport的分析樣本的balance第八十五页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?bsr(att):psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)///mahal(w2stwt1)addkernelcommonlogitBootstrapresultsNumberofobs=10039Replications=50command:psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)mahal(w2stwt1)addkernelcommonlogit_bs_1:r(att)|ObservedBootstrapNormal-based|Coef.Std.Err.zP>|z|[95%Conf.Interval]+_bs_1|2.11783.46678194.540.0001.2029543.032706第八十六页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?

國三補習數學有用嗎?Grosseffect(OLS):12.243(分析樣本withcommonsupport)Aftercontrollingallmatchingvariables(OLS):3.017–anestimateofATEPSMresults(allmatchingvariablesincluded):Totalpopulation(ATE):2.956Treated(ATT):2.258Untreated(ATU):3.580第八十七页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?

階層性模型分析結果顯示PSM的ATE估計大多比OLS的估計小ATT比ATU小都會受到未納入重要自變項的影響第八十八页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?

PSMstratifiedbypropensityscores1ststratum(lowest) 3.5192ndstratum 4.0633rdstratum 3.3844thstratum 1.9975thstratum(highest) 2.950 1st–3rdstratum 3.292 4th–5thstratum 2.557第八十九页,共一百零二页,2022年,8月28日1運用PSM的實例:補習數學有用嗎?

PSMstratifiedbypriormathabilityscores1ststratum(lowest) 3.6002ndstratum 4.4063rdstratum 2.1014thstratum 3.2155thstratum(highest) 2.108

1st–3rds

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论