Korrelation eller kausalitet? BCG har svaret

Hvis du har skrevet en større, skriftlig opgave på økonomistudiet, har du sikkert oplevet følgende. 

Du har brugt timevis på at komme op med en virkelig interessant vinkel på en relevant, samfundsvidenskabelig problemstilling. Du har inddraget forskellige teorier og tilbragt alt for mange ensomme aftner på læsesalen for at indsamle data. Du har kørt flere regressionsanalyser end du kan holde styr på. Men din lykke er gjort, for de viser alle sammen (stort set…) det samme: Der er en signifikant sammenhæng mellem din afhængige variabel og din primære uafhængige variabel. 

Hvilken triumf! 

Nu handler det blot om at sætte det hele lidt pænt op med overskrifter til underafsnit, sidetal osv., hvorefter det sikre 12-tal skal fejres med kæresten og implikationerne deles med verden i Econometrica – og måske også i en artikel på altandetlige.dk!

Men så sker det: Til det mundtlige forsvar spørger censor pludselig om man ikke kunne forestille sig, at den statistisk signifikante sammenhæng skyldes, at der er en helt tredje variabel – som ikke er inkluderet i den økonometriske model – der har en sammenhæng med både den afhængige variabel og den interessante uafhængige variabel.

Dit hjerte stopper med at slå i et kort øjeblik. 

Du ved udmærket godt, at censor bare spørger for at starte en diskussion vedrørende din analyses antagelser og validitet. 12-tallet var hjemme for et kvarter siden, da der blev nikket anerkendende til den flotte figur på slide otte i din PowerPoint-præsentation.

Men hvad nu, hvis det faktisk er tilfældet, at din analyse blot har fundet en korrelation og ikke en kausal sammenhæng? Kan din model stadig bruges som beslutningsgrundlag?

Ude i den virkelige verden er spørgsmålet om korrelation og kausalitet utrolig afgørende. Virksomheder har adgang til mere detaljeret data end nogensinde før, og hvis de er i stand til at omsætte denne data til viden, så kan ledelsens evne til at træffe beslutninger, der tillader, at virksomheden (for)bliver profitabel, styrkes betydeligt.

Det har The Boston Consulting Group (BCG) for længst indset

I 2014 udarbejdede BCG en tilgang til at arbejde med data, der kan hjælpe alle typer af ledere (i virksomheder, ministerier, nødhjælpsorganisationer m.fl.) med at afgøre, hvornår simple korrelationer er tilstrækkelige til at træffe beslutninger.

Der er to grundlæggende faktorer, der spiller ind. 

1: Sandsynligheden for, at korrelationen også findes i fremtiden.
Her er tankegangen blot, at hvis fx boligpriser og privatforbrug har været korrelerede de sidste 50+ år, så er der givetvis større sandsynlighed for, at de også er det næste år. Og dermed vil udviklingen i den ene variabel altså være et mere pålideligt tegn på, at der vil ske en udvikling i den anden variabel. 

Denne pålidelighed påvirkes desuden af, hvor mange plausible forklaringer på korrelationen, man kan komme på. Hvis der er utallige årsager til, at boligpriser og privatforbrug er korrelerede, så er vores viden om deres indbyrdes forhold begrænset. Men hvis vi i stedet er relativt sikre på, at korrelationen skyldes, at begge størrelser påvirkes af udviklingen i renten, så er vores forståelse bedre, og vi kan være mere sikre på, at korrelationen er stabil.

2: Forholdet mellem afkast og risiko ved at handle på baggrund af korrelationen.
I tilfælde, hvor det er særdeles kostbart at træffe en forkert beslutning, er man nødsaget til at stille større krav til sit beslutningsgrundlag. Og i de tilfælde er korrelationer mindre tilbøjelige til at være tilstrækkelige.

Tilgangen kan illustreres i nedenstående figur.

Betragt følgende eksempel. Du overvejer, hvorvidt du skal (forsøge at) lave ugesedlen inden din næste øvelsestime i mikroøkonomi. 

Du ved, at der er en positiv sammenhæng mellem at forsøge at lave opgaverne og udbyttet af at møde op til timen. Men du er også klar over, at sammenhængen ikke nødvendigvis er kausal: Relativt dygtige studerende kunne potentielt være mere tilbøjelige til både at få et stort udbytte af timerne og til at forberede sig. 

Du overvejer naturligvis først at foretage et eksperiment, hvor du forberede dig til tilfældigt udvalgte timer - men ikke til andre - for på den måde at bestemme om der er en kausal effekt. Men givet det begrænsede antal undervisningsgange opgiver du hurtigt, idet dine standardafvigelser åbenlyst bliver for store til at finde signifikante resultater.

Derfor bruger du BCGs tilgang. 

Du vurderer først, baseret på intellektuelt stimulerende samtaler (…) med ældre studerende i Cafélitten, at der historisk set er en ret konsistent korrelation, samt et begrænset antal potentielle kausale forklaringer, mellem forberedelse og udbytte. Dermed befinder vi os i den øverste halvdel af figuren.

Nu mangler du blot at vurdere, hvordan du påvirkes, hvis du forbereder dig og i) opnår et større udbytte eller ii) ikke opnår et større udbytte. 

Vurderingen er naturligvis lidt tricky, men en realistisk antagelse er formentlig, at den typiske økonomistuderende ikke bliver specielt dårligt stillet, hvis vedkommende forgæves bruger tid på at løse mikroøkonomiske opgaver – mikro er jo helt objektivt set et fantastisk sjovt fag og opgaveløsning bærer dermed lønnen i sig selv! 

Derimod er den potentielle nytte ved at opnå en bedre forståelse for mikroens fantastiske univers nærmest uendeligt stor, hvorfor fordelene ved forberedelse oftest må vurderes at overgå ulemperne.

Det følger, at vi i det konkrete eksempel må være i det øverste højre hjørne af figuren, hvorfor det utvivlsomt er optimalt at forberede sig.

Det virker simpelt, men tilgangen er et umådeligt stærkt værktøj i en verden, hvor vigtige beslutninger nødvendigvis må træffes under usikkerhed. Og efterhånden som brugen af store datamængder bliver mere almindelig, vil anvendeligheden kun blive større. 

BCGs tilgang er en pragmatisk måde, hvorpå dyderne fra solide, økonometriske metoder kan kombineres med en verden, hvor der ikke er tid eller mulighed for at finde et naturligt eksperiment eller en stærk instrumentvariabel. Det handler med andre ord om at træffe den rigtige beslutning baseret på det tilgængelige data – det handler om at løse beslutningstagerens problem, ikke om at overbevise vejledere, censorer eller andre medlemmer af det frygtede endogenitets-Taliban.

Virksomheder

Partnervirksomheder

Stort tak til alle virksomheder i ALT ANDET LIGEs partnerprogram. Hør mere om programmet, skriv til partner@altandetlige.dk