Kan en polit slå markedet?

I mit sidste indlæg nævnte jeg Haralabos Voulgaris, der har udviklet en model (i øvrigt i R - hvis det ikke indikerer, at polit skal skifte fra SAS, hvad gør så?), som gør det muligt for ham at leve af at vædde på basketball-kampe*. Hans liv er naturligvis intet match for tilværelsen som ph.d.-studerende - han får jo ikke engang lov til at opleve glæden ved at rette hjemmeopgaver i mikroøkonomi - så det er åbenlyst ikke fordi jeg misunder ham. Men for at overbevise mig selv om, at jeg selvfølgelig sagtens kunne leve af at vædde på sport, hvis jeg da bare gad, har et af mine projekter på dette semester været at finde en faktor, der påvirker udfaldet af basketball-kampe, men som ikke er identificeret af betting markedet**.

Jeg fik ideen på forrige semester, da jeg sad til en time i Electoral Politics. Vi diskuterede Steven Levitts (1994) paper***, hvor han betragter valgkampe, hvor de samme to kandidater stiller op mod hinanden mere end én gang. Det udnytter Levitt til at estimere effekten af at bruge penge under valgkampen, da han kan holde kandidaternes kvalitet uændret. Det er smart! Årsagen er at kvalificerede kandidater er bedre til at samle penge ind, hvorfor de også bruger flere penge. Men de får også flere stemmer alene fordi de er mere kvalificerede. Så når Levitt kan holde kvalitet konstant, og lade penge brugt variere, slipper han af med den onde endogenitet, der har præget tidligere undersøgelser, og han kan estimere den forventede stigning i stemmeandel per Dollar brugt i valgkampen uden bias. Levitt finder i øvrigt, at penge brugt under valgkampe betyder forsvindende lidt, når man først tager højde for kandidatens kvalitet.

Det siger nok en del om mig, men min første tanke var, at jeg kunne udnytte samme metode til at øge mit forventede afkast ved at vædde på basketball-kampe. Årsagen er, at hvert af de 30 hold i den professionelle amerikanske liga, NBA, spiller 82 kampe i den regulære sæson. Dermed er der altså tilfælde, hvor det samme hjemmehold spiller mod det samme udehold mere end én gang per sæson. Det tillader mig at bygge et dataset svarende til Levitts. Bare med basketball-kampe i stedet for valgkampe. Så langt, så godt. Problemet er bare, at jeg skal finde noget, der varierer mellem kampene i en regulær NBA sæson, og som betting markedet potentielt ikke tager højde for. Jeg kan ikke rigtig huske, hvad Ansolabehere og Snyder talte om efter Levitt (1994) den dag i Electoral Politics, men jeg kan huske, at jeg tænkte grundigt over dette problem. Og at jeg fandt et svar. Jeg ville kigge på variation i TV-dækningen af kampene.

Argumentet er enkelt. Betragt følgende meget stiliserede ”model”. Antag at en offensiv spiller får nytte s>0 ved at score. Og at han får disnytten p>0 ved at kollidere med en modspiller. Den offensive spiller kan skyde fra mellemdistancen og score med sandsynlighed j>0. Eller han kan tage bolden til kurven og score med sandsynlighed d>j. Hvis han tager bolden til kurven vil han dog også kollidere med modspilleren og få disnytten p. Det følger, at den offensive spiller tager bolden til kurven, hvis og kun hvis (d-j)s>p. Antag nu at den offensive spillers beslutning overvåges af en TV-seer. Seeren belønner, gennem anerkendelse, berømmelse, stemmer til All-Star hold etc., den offensive spiller for at score. Belønningen har værdien r>0. Det følger, at når seeren overvåger den offensive spiller, vil den offensive spiller tage bolden til kurven hvis og kun hvis (d-j)(s+r)>p. Det er altså tilfældet, at den offensive spiller er villig til at tage bolden til kurven for større værdier af p, når han overvåges af en TV-seer. Derfor scorer han med en højere sandsynlighed, og for et givent antal forsøg vil han også score flere point, når der er en seer. Pointen er naturligvis blot, i det større perspektiv, at øget medieopmærksomhed omkring kampen fører til flere scorede point.

Nå, men vi skal tilbage til den virkelige verden – selvom den er mindre smuk end den vi kan modellere. Alle kampe i NBA transmitteres på amerikansk TV. Langt størstedelen af dem på regionale kanaler, hvor der er relativt få seere (ud over mig). Enkelte vises på landsdækkende TV, hvor der er betydeligt flere seere. Min hypotese er nu, som forklaret ovenfor, at NBA spillere yder en større indsats, når de spiller på landsdækkende TV. Og at holdene derfor scorer flere point, når kampen transmitteres landsdækkende. Det lyder ikke helt utænkeligt, men dog tilpas mystisk til, at bookmakere ikke tager højde for det. Som vi skal se nedenfor, er begge udsagn korrekte. Sådan da.

Efter at have dedikeret en del sene aftner på kontoret til at bygge det perfekte dataset, ender jeg ud med at have 1.657 kampe fra 2006 til 2011, hvor det samme hjemmehold møder det samme udehold i en given regulær sæson. Jeg har information om 1) alle tænkelige statistikker for hvert hold i disse kampe, 2) hvor mange dage det er siden, at holdene hver især har spillet en kamp 3) hvorvidt kampen blev vist på landsdækkende TV og 4) betting markedets forventning til antal point scoret af hvert hold.

Herfra er det præcis som at være tilbage i de gode gamle dage med HC i kvantitative metoder 2, og jeg kører en simpel OLS-regression af nedenstående ligning

Hvor Dpointij er ændringeni points scoret af hold i i observation j, alfa er en konstant, DTVer ændringen i TV-dækning, Drester ændringen i hold i’s hvile (dage siden sidste kamp), Doprest er ændringen i hold i’s modstanders hvile og Dexpoints er ændringen i bookmakernes forventning til antal point scoret. Epsiloner fejlleddet.

Jeg kører regressionen for hjemme- og udehold separat, da jeg forventer, at der kunne være forskelle, hvilket da også er tilfældet. Nedenstående tabel viser resultaterne.

Konklusionen er, at udehold i gennemsnit scorer ca. 2 point mere per kamp, når de spiller på landsdækkende TV, mens ændringen i antal point scoret af hjemmehold ikke er signifikant forskellig fra nul. Bemærk at ændringen i udeholdenes scoring er signifikant efter jeg kontrollerer for ændringer i betting markedet. Det betyder, at jeg faktisk har identificeret en faktor, der har betydning for udfaldet af basketball-kampe, men som markedet ikke tager højde for. Og vigtigere: Det betyder også, at jeg nu med sindsro kan (blive ved med at) fortælle mig selv, at jeg da sagtens kunne leve det vilde liv som sports bettor!

Jeg har ikke nogen rigtig god forklaring på, hvorfor det kun er udehold, der præsterer bedre, når de er på TV. Mit bedste bud er, at hjemmehold allerede yder tæt på deres maksimale, når de spiller på regionalt TV, da deres hjemmepublikum disciplinerer/belønner dem via tilråb mv. Eller at udehold også øger deres defensive indsats, når de spiller på TV, hvilket tilfældigvis neutraliserer hjemmeholds øgede offensive indsats.

For dem, der går op i den slags, kan det nævnes, at min R^2 er lav. Det, mener jeg, er et tegn på, at jeg har fat i den rigtige model. Hvorfor? Hele udgangspunktet for min analyse er, at antallet af point scoret i de to kampe, hvor samme hjemmehold møder samme udehold, skal være tilfældige udtræk fra ens fordelinger. Hvis det er korrekt bør jeg netop ikke kunne forklare særlig meget af variationen i point scoret. Den er simpelthen tilfældig af natur. En tanke er dog, naturligvis, at den kan forklares af, hvor meget chokolade spillerne spiser inden kampen (se Anders Munk-Nielsens blogindlægom chokolades forklaringskraft). På dette område forhindrer mangel på data mig dog i at konkludere noget. Endnu et eksempel på, at vi lever i en second best verden!

Til basketball-nørderne kan jeg kort nævne, at jeg også identificerer de aspekter af spillet, der gør at udehold øger deres scoring. Først og fremmest passer de bedre på bolden, og begår derfor færre uprovokerede fejl (turnovers). Mit præcise estimat er 0,74 færre turnovers per 100 boldbesiddelser. Reduktionen i turnovers muliggør, at udeholdene øger deres gennemsnitlige antal skudforsøg inden for trepointslinjen med omkring 0,82 per 100 boldbesiddelser. Endelig scorer udeholdene på en større andel af deres topointforsøg. Mit estimat er, at
deres scoringsprocent stiger med 1.19 procentpoint, når de spiller på
landsdækkende TV. Bemærk at den overordnede historie, at holdene tager flere skud tæt på kurven, og derfor øger deres scoringsprocent, er helt i overensstemmelse med den meget simple ’model’ fra tidligere.

Afslutningsvis vil jeg, inden nogen af de letpåvirkelige politter smider deres SU eftervæddemål på NBA-kampe, gerne understrege, at jeg ikke påstår, at jeg kan slå betting markedet alene på baggrund af dette blogindlæg. Det følger af simpel underspilsperfektion, at jeg ikke skrev indlægget, hvis det var tilfældet. Mit indlæg illustrerer, derimod, at markedet kan slås. Og jeg vurderer, at den gennemsnitlige polit ville kunne gøre det, hvis denne dedikerede tilstrækkeligt med tid til at bygge et fyldestgørende dataset og en solid, velfunderet økonometrisk model. Når det er sagt, er det nok sjovere, og betydeligt mindre risikabelt på kort/mellemlangt sigt, at være studentermedhjælper i Finansministeriet. Da jeg engang lavede en fejl i min analyse af det forventede afkast af et væddemål, kostede det mig et ikke-ubetydeligt beløb. Da jeg som studentermedhjælper i Finansministeriet lavede en fejl i en analyse betød det derimod, at en fuldmægtig måtte blive sent og lave det om.

* Og leve godt! Se ham vise rundt i sit hjem her.

** Dette er ikke helt rigtigt. Jeg lavede analysen som et projekt i Labor Economics, som jeg har fulgt på dette semester. Så den officielle begrundelse var, at jeg ville undersøge incitamentsstrukturerne for professionelle basketballspillere. En af mine kontrolvariable var så, tilfældigvis (…), bookmakernes forventninger. Og ja. Det var svært at gå til office hours og sælge denne idé til professoren.

*** Levitt, Steven D. (1994). Using Repeat Challengers to Estimate the Effects of Campaign Spending on Election Outcomes in the U.S. House. Journal of Political Economy, Vol. 102, 4, 777-798.



Partnervirksomheder

Stort tak til alle virksomheder i ALT ANDET LIGEs partnerprogram. Hør mere om programmet, skriv til partner@altandetlige.dk