Identifikation tak!

Econometric Game er en konkurrence i økonometri, hvor 30 universiteter fra hele verden deltager. Konkurrencen består af to cases, hvor de ti bedste fra den første case går videre til nummer to, hvorefter en dommerkommite af økonometriprofessorer udvælger de tre bedste. Førstepladsen gik i år til holdet fra Københavns Universitet, som bestod af Anna Folke Larsen, Andreas Noack-Jensen, Line Elvstrøm Ekner, Rasmus Søndergaard Pedersen og Anders Munk-Nielsen. 

Identifikation, tak!

Dette er et eventyr om godt og ondt, endogenitet og identifikation, Aarhus og København, Polit og alle de andre. Dette er historien om en gruppe hærdede veteraner, som huskede identifikationen og gav et oplæg til en ny rangering af verdens universiteter.

Blodet pumper i ørerne og Nørrebrogade flyver forbi. En gammel dame er ved at træde ud på cykelstien og gnisterne flyver fra bremserne. “Fuck, hvor er det dumt!” ringer det i hovedet. Hvordan kan man glemme sit pas når man skal ud at flyve? Heldigvis var biblen pakket (Voksen Wooldridge, red.), det var trippeltjekket, men hvad skal man med den, hvis man har glemt sin identifikation?

Senere på aftenen landede flyet KL1134 i Amsterdam, en gold og forladt by, hvor gaderne lå tomme hen af frygt for det kommende opgør. Og med et hørtes et skærende skrig gennem natten, alle blev stille, et barn begyndte at græde og skærmene i sporvognen gik i Windows Blue Screen --- de mørke ryttere fra Aarhus var landet!

Den lille gruppe københavnske økonometririddere fandt frem til hotellet, hvor det hurtigt stod klart, at de snu franskmænd spillede beskidt. Bandende måtte det konstateres, at ørepropper ikke stod mål mod den lille pariser, som kunne snorke som et defekt airconditionanlæg. Natten gik dog, og næste morgen kom og bød på hvidt toastbrød med lyserød skinke efterfulgt af oplæg på Uniferschitäitisch van Amschterdamsch (University of Amsterdam, red.). Dernæst kom en repræsentant fra Model Falidation fra banken I-N-Ghrrei (ING, red.) med en obligatorisk snak om markeder og muligheder. Det var sikkert spændende nok, men ingen trak vejret --- lugten af blod og økonometri hang tykt i luften.

Endelig kom turen til case makeren, som beskrev emnet --- effekten af rygning under gravidieten på vægten af nyfødte børn. Med beskrivelsen fulgte et par artikler som inspiration fra emnet samt et par ord om, at der ikke var noget rigtigt svar, og at kommiteen ville se frem til at se kreative bud på løsninger. Og kampen var i gang.

Alle grupperne spænede nu gennem Amsterdams gader i et vildt kapløb om tiden. I en bygning 20 minutters gang væk var der så nogle timer til at gennemlæse artikler og søge videre på litteratur samt gøre overvejelser om, hvilket artilleri, der skulle bringes i stilling. Der var lagt kraftigt op til at arbejde med kvantilregressioner; Et hårdt bæst at arbejde med numerisk og stik modsat alle likelihood besværgelserne, som flere af de københavnske riddere havde svoret evig troskab til. Men endnu var mange døre åbne og alle fælder var stadig i spil --- det hele var et spørgsmål om data: ville det være tværsnit eller panel, ville der være oplagte instrumenter, osv.

Om aftenen var der kinesisk mad og fast bordplan så man var tvunget til at mingle. En fantastisk mulighed for at snakke med ligesindede nørder fra hele verden, men også en anspændt situation, hvor naboens mindste bevægelser blev iagttaget nøje, og hvor knoerne blev hvide af at kramme om computeren i tasken, klar til at flå den frem, hvis det skulle komme til metodologiske blodsudgydelser.

1 Case A

Efter en god nat i køjesengene, en kop kaffe og en lyserød skinkemad gik turen mod slagmarken. Bevæbnet til tænderne med så mange økonometribøger deres akademikerrygge kunne slæbe, gik det mod det hermetisk aflukkede lokale, hvor slaget skulle stå. Den nervøse spændte stemning var hurtigt glemt da casen blev udleveret på ING-reklamepåklistrede usb nøgler og luften blev elektrisk af de godt 100 computere, som gav sig til at regne gennem de 114.175 mødre, som der var data på. Et gisp gik gennem salen og blodet forlod de københavnske krigere --- det var tværsnitsdata, og der var intet oplagt instrument! Annas magiske computer, som lyser blåligt når der er endogenitet i nærheden, blussede op i et blændende skær, og de fems øjne mødte hinanden over bordet. Hvilken vej kunne man gå, når der var fælder og endogenitet alle vejne? Kunne man overhovedet finde noget kausalt?

Med et kampskrig satte de mod Abrevaya & Dahls (2008) kvantiltilgang og en vild diskussion brød ud. Hvad kunne i det hele taget sådan en kvantilregression, som en OLS model med interaktionsled mellem rygning og alle de andre forklarende variable ikke kunne? Og hvilke effekter var der at holde øje med? Det blev hurtigt klart, at der var to systematikker at adressere. En gennemsnitseffekt og noget ruskumsnusk i den venstre hale af fordelingen.

Efter lang tids hård kamp begyndte ilten i lokalet at være suget ud, og presset på tindingerne var næsten fysisk. Det syntes klart, at rygning påvirkede dels vægten af barnet direkte, men også længden af graviditeten, hvilket igen påvirkede vægten. Men hvor estimaterne blev upræcise for 1% kvantilen når man ikke kontrollerede for længden af graviditeten, var de tilsyneladende præcise nok, når denne kom med. Ridderne øjnede et lys i horisonten og kæmpede sig vej mod den konklusion, at hvis man ville undersøge effekten på den nederste del af halen var det nødvendigt at splitte eksplicit op i de to kanaler, gennem hvilke rygningen kunne påvirke vægten. Med de sidste mundfulde ilt i lokalet blev den interagerede OLS beskrevet og fortolket på og krøller blev sat på maskineriet, før det som en katapult blev slynget mod opgavestillerne.

Gispende efter vejret kom ridderne til sig selv uden for bygningen igen og med regnbuefarvede paraplyer drog flokken af udmattede økonometrikere sig mod aftenens restaurant, som bød på lækker mad og mere minglen med fjenden. Derfra gik turen til en nærliggende bar, hvor case makerne ville annoncere, hvilke 10 hold ud af de 30, der var kommet levende ud af dagens labyrint. Nogle øl senere blev der helt stille i lokalet og en efter en blev universiteterne råbt op. “Bristol!”. En gruppe britter hoppede op og ned. “Aarhus!”. En dør gik op og en iskold vind stod gennem lokalet. Aarhusianerne stirrede med deres iskolde, mørke, tomme øjne frem under deres kutter. Oplæsningerne fortsatte. “Oxford”, “LSE”, “Harvard”, og som det sidste navn nærmede sig sank de københavnske frihedskæmpere ned i stolene. Havde de tabt? Var det slut? Alt, hvad de havde kæmpet for? “Copenhagen!” Et sus af glæde løb gennem bordet, men de mørke mareridt fra tysklands-odde stirrede fortsat med deres kolde øjne, og københavnerne skyndte sig hjem for at få et par timers søvn inden morgendagens marathon.

2 Case B

Med lyserød skinke mellem tænderne og sitrende hænder red københavnerne gennem det mennesketomme Amsterdam. I det ilttomme vakuum blev dagens case udleveret, og datasættet blev fordelt. Det knitrede i luften, og det stod klart, at vi havde fået et paneldatasæt med lidt over 12,000 mødre, hvor vi observerede 3 fødsler per mor. Et lettelsens suk. Det betød, at der var plads til at lave fixed effects, og dermed et spinkelt håb om at finde noget kausalt. Med funklende blå computer stormede en gruppe af ridderne mod identifikationen bag First Difference estimaterne. De lave estimater kunne skyldes heterogenous treatment effects, og dette blev eftervist ved estimation på subsamples. En anden gruppe satte mod Abrevaya & Dahl's blanding af kvantilregression og Chamberlain Correlated Random Effects. Den firkernede Dell laptop var skoldhed og iterationsresultater fløj gennem luften, mens varm luft væltede ud i det iltfattige rum.

Gruppen kørte nu endnu et våben i stilling, instrument variable i en kvantilregression. En Stata pakke blev installeret og der blev fyret los mod datasættet. Beklageligvis var estimaterne vanvittigt store, i overensstemmelse med litteraturen, men det affødte en diskussion om identifikationen og validiteten af instrumentet. Ridderne overvejede en GMM baseret simultan modelleringsstrategi af graviditetslængden eksplicit sammen med vægten af barnet, men det blå skær flammede op; Identifikationen var for svag. Og i samme nu opdagede gruppen en svaghed i Abrevaya & Dahl's mægtige artilleri. En del af Chamberlain estimatorens maskineri til at proxye for den uobserverede “sundhedstype” bestod i at inkludere rygning. Men de fleste andre kovariater var insignifikante for type. Hvor vigtig var rygningsdummyen her? Godt nok var alder og et par andre variable også signifikante, men var det forskellen på økonomisk og statistisk signifikans, der spøgte? Med rystende hænder blev rygning hevet ud af Chamberlain-motoren og med et brag fløj estimaterne tilbage til Pooled OLS lignende tilstande. De flotte First Difference lignende resultater (omkring 70 gram lettere spædbørn når moderen røg under graviditeten) var væk, og vi var tilbage på de 250 gram fra tværsnitsresultaterne. Hvad betød det for identifikationen? Krævede det, at rygning både identificerede effekten af den uobserverede type og effekten af rygningen selv?

Tiden var knap, og i de allersidste sekunder truede en LaTeX compiler fejl med at slynge københavnerne ud over afgrundens rand, men med gnister flyvende op af tastaturet fik Andreas ved hjælp af Sublimetext (seriøst, tjek den editor ud!) reddet en tabel fra den visse død, og der blev afleveret. Nu var der bare 15 minutter til at forberede en præsentation og få det overstået.

3 Afgørelsen

Resten af dagen var gået stærkt. Præsentationen var gået godt, men det var mægtige krigere, de københavnske helte var oppe imod. Især Bristol University havde et overraskende bredt arsenal af hårdtslående økonometri i spil. Værst af alt havde københavnerne glemt en sjov titel, og aarhusianernes overskrift, “Honey, I shrunk the kids!”, ramte som en iskold, giftig kniv. Men ikke mange havde diskuteret og stillet spørgsmål ved identifikationen. Det var et lille lysglimt i mørket.

Tiden gik i stå og i et vakuum af nerver måtte heltene holde livskraften i kroppen ved øllets helende kraft. Nu dukkede dommerne op, og der blev helt stille. Tredjepladsen gik til Harvard. En gruppe nørdede amerikanere gik stolt på scenen. Og så skete det. Lyset blev suget ud af rummet, en flok krager baskede op, og dommerne erklærede, at andenpladsen gik til Aarhus. Temperaturen dalede, og de kolde skikkelser, der kom på scenen, lod deres mørke, rungende latter rulle ud over de rystende økonometrikere. Den højeste placering, Aarhus nogensinde havde fået, en kraftpræstation af disse frygtindgydende kæmper fra Vesten. En evighed gik. Hjælpere blev takket og rost. Stemningen faldt blandt Københavnerne.

Vinderne var hold nummer 9. Ingen reaktion. “Copenghhrrragen” rungede det på godt Amscherdamsch. Vild jubel, ekstase, glinsende medaljer om halsen, champagne i pokalen, midnatsopringning til Danmark og fejring natten lang. Verden var igen et sikkert sted at være.

The end.

Partnervirksomheder

Stort tak til alle virksomheder i ALT ANDET LIGEs partnerprogram. Hør mere om programmet, skriv til partner@altandetlige.dk