Andreas Madum

Kan en polit slå markedet?

I mit sidste indlæg nævnte jeg Haralabos Voulgaris, der har udviklet en model (i øvrigt i R - hvis det ikke indikerer, at polit skal skifte fra SAS, hvad gør så?), som gør det muligt for ham at leve af at vædde på basketball-kampe*. Hans liv er naturligvis intet match for tilværelsen som ph.d.-studerende - han får jo ikke engang lov til at opleve glæden ved at rette hjemmeopgaver i mikroøkonomi - så det er åbenlyst ikke fordi jeg misunder ham. Men for at overbevise mig selv om, at jeg selvfølgelig sagtens kunne leve af at vædde på sport, hvis jeg da bare gad, har et af mine projekter på dette semester været at finde en faktor, der påvirker udfaldet af basketball-kampe, men som ikke er identificeret af betting markedet**.

Jeg fik ideen på forrige semester, da jeg sad til en time i Electoral Politics. Vi diskuterede Steven Levitts (1994) paper***, hvor han betragter valgkampe, hvor de samme to kandidater stiller op mod hinanden mere end én gang. Det udnytter Levitt til at estimere effekten af at bruge penge under valgkampen, da han kan holde kandidaternes kvalitet uændret. Det er smart! Årsagen er at kvalificerede kandidater er bedre til at samle penge ind, hvorfor de også bruger flere penge. Men de får også flere stemmer alene fordi de er mere kvalificerede. Så når Levitt kan holde kvalitet konstant, og lade penge brugt variere, slipper han af med den onde endogenitet, der har præget tidligere undersøgelser, og han kan estimere den forventede stigning i stemmeandel per Dollar brugt i valgkampen uden bias. Levitt finder i øvrigt, at penge brugt under valgkampe betyder forsvindende lidt, når man først tager højde for kandidatens kvalitet.

Det siger nok en del om mig, men min første tanke var, at jeg kunne udnytte samme metode til at øge mit forventede afkast ved at vædde på basketball-kampe. Årsagen er, at hvert af de 30 hold i den professionelle amerikanske liga, NBA, spiller 82 kampe i den regulære sæson. Dermed er der altså tilfælde, hvor det samme hjemmehold spiller mod det samme udehold mere end én gang per sæson. Det tillader mig at bygge et dataset svarende til Levitts. Bare med basketball-kampe i stedet for valgkampe. Så langt, så godt. Problemet er bare, at jeg skal finde noget, der varierer mellem kampene i en regulær NBA sæson, og som betting markedet potentielt ikke tager højde for. Jeg kan ikke rigtig huske, hvad Ansolabehere og Snyder talte om efter Levitt (1994) den dag i Electoral Politics, men jeg kan huske, at jeg tænkte grundigt over dette problem. Og at jeg fandt et svar. Jeg ville kigge på variation i TV-dækningen af kampene.

Argumentet er enkelt. Betragt følgende meget stiliserede ”model”. Antag at en offensiv spiller får nytte s>0 ved at score. Og at han får disnytten p>0 ved at kollidere med en modspiller. Den offensive spiller kan skyde fra mellemdistancen og score med sandsynlighed j>0. Eller han kan tage bolden til kurven og score med sandsynlighed d>j. Hvis han tager bolden til kurven vil han dog også kollidere med modspilleren og få disnytten p. Det følger, at den offensive spiller tager bolden til kurven, hvis og kun hvis (d-j)s>p. Antag nu at den offensive spillers beslutning overvåges af en TV-seer. Seeren belønner, gennem anerkendelse, berømmelse, stemmer til All-Star hold etc., den offensive spiller for at score. Belønningen har værdien r>0. Det følger, at når seeren overvåger den offensive spiller, vil den offensive spiller tage bolden til kurven hvis og kun hvis (d-j)(s+r)>p. Det er altså tilfældet, at den offensive spiller er villig til at tage bolden til kurven for større værdier af p, når han overvåges af en TV-seer. Derfor scorer han med en højere sandsynlighed, og for et givent antal forsøg vil han også score flere point, når der er en seer. Pointen er naturligvis blot, i det større perspektiv, at øget medieopmærksomhed omkring kampen fører til flere scorede point.

Nå, men vi skal tilbage til den virkelige verden – selvom den er mindre smuk end den vi kan modellere. Alle kampe i NBA transmitteres på amerikansk TV. Langt størstedelen af dem på regionale kanaler, hvor der er relativt få seere (ud over mig). Enkelte vises på landsdækkende TV, hvor der er betydeligt flere seere. Min hypotese er nu, som forklaret ovenfor, at NBA spillere yder en større indsats, når de spiller på landsdækkende TV. Og at holdene derfor scorer flere point, når kampen transmitteres landsdækkende. Det lyder ikke helt utænkeligt, men dog tilpas mystisk til, at bookmakere ikke tager højde for det. Som vi skal se nedenfor, er begge udsagn korrekte. Sådan da.

Efter at have dedikeret en del sene aftner på kontoret til at bygge det perfekte dataset, ender jeg ud med at have 1.657 kampe fra 2006 til 2011, hvor det samme hjemmehold møder det samme udehold i en given regulær sæson. Jeg har information om 1) alle tænkelige statistikker for hvert hold i disse kampe, 2) hvor mange dage det er siden, at holdene hver især har spillet en kamp 3) hvorvidt kampen blev vist på landsdækkende TV og 4) betting markedets forventning til antal point scoret af hvert hold.

Herfra er det præcis som at være tilbage i de gode gamle dage med HC i kvantitative metoder 2, og jeg kører en simpel OLS-regression af nedenstående ligning

Hvor Dpointij er ændringen i points scoret af hold i i observation j, alfa er en konstant, DTV er ændringen i TV-dækning, Drest er ændringen i hold i’s hvile (dage siden sidste kamp), Doprest er ændringen i hold i’s modstanders hvile og Dexpoints er ændringen i bookmakernes forventning til antal point scoret. Epsilon er fejlleddet.

Jeg kører regressionen for hjemme- og udehold separat, da jeg forventer, at der kunne være forskelle, hvilket da også er tilfældet. Nedenstående tabel viser resultaterne.

Konklusionen er, at udehold i gennemsnit scorer ca. 2 point mere per kamp, når de spiller på landsdækkende TV, mens ændringen i antal point scoret af hjemmehold ikke er signifikant forskellig fra nul. Bemærk at ændringen i udeholdenes scoring er signifikant efter jeg kontrollerer for ændringer i betting markedet. Det betyder, at jeg faktisk har identificeret en faktor, der har betydning for udfaldet af basketball-kampe, men som markedet ikke tager højde for. Og vigtigere: Det betyder også, at jeg nu med sindsro kan (blive ved med at) fortælle mig selv, at jeg da sagtens kunne leve det vilde liv som sports bettor!

Jeg har ikke nogen rigtig god forklaring på, hvorfor det kun er udehold, der præsterer bedre, når de er på TV. Mit bedste bud er, at hjemmehold allerede yder tæt på deres maksimale, når de spiller på regionalt TV, da deres hjemmepublikum disciplinerer/belønner dem via tilråb mv. Eller at udehold også øger deres defensive indsats, når de spiller på TV, hvilket tilfældigvis neutraliserer hjemmeholds øgede offensive indsats.

For dem, der går op i den slags, kan det nævnes, at min R^2 er lav. Det, mener jeg, er et tegn på, at jeg har fat i den rigtige model. Hvorfor? Hele udgangspunktet for min analyse er, at antallet af point scoret i de to kampe, hvor samme hjemmehold møder samme udehold, skal være tilfældige udtræk fra ens fordelinger. Hvis det er korrekt bør jeg netop ikke kunne forklare særlig meget af variationen i point scoret. Den er simpelthen tilfældig af natur. En tanke er dog, naturligvis, at den kan forklares af, hvor meget chokolade spillerne spiser inden kampen (se Anders Munk-Nielsens blogindlæg om chokolades forklaringskraft). På dette område forhindrer mangel på data mig dog i at konkludere noget. Endnu et eksempel på, at vi lever i en second best verden!

Til basketball-nørderne kan jeg kort nævne, at jeg også identificerer de aspekter af spillet, der gør at udehold øger deres scoring. Først og fremmest passer de bedre på bolden, og begår derfor færre uprovokerede fejl (turnovers). Mit præcise estimat er 0,74 færre turnovers per 100 boldbesiddelser. Reduktionen i turnovers muliggør, at udeholdene øger deres gennemsnitlige antal skudforsøg inden for trepointslinjen med omkring 0,82 per 100 boldbesiddelser. Endelig scorer udeholdene på en større andel af deres topointforsøg. Mit estimat er, at
deres scoringsprocent stiger med 1.19 procentpoint, når de spiller på
landsdækkende TV. Bemærk at den overordnede historie, at holdene tager flere skud tæt på kurven, og derfor øger deres scoringsprocent, er helt i overensstemmelse med den meget simple ’model’ fra tidligere.

Afslutningsvis vil jeg, inden nogen af de letpåvirkelige politter smider deres SU efter væddemål på NBA-kampe, gerne understrege, at jeg ikke påstår, at jeg kan slå betting markedet alene på baggrund af dette blogindlæg. Det følger af simpel underspilsperfektion, at jeg ikke skrev indlægget, hvis det var tilfældet. Mit indlæg illustrerer, derimod, at markedet kan slås. Og jeg vurderer, at den gennemsnitlige polit ville kunne gøre det, hvis denne dedikerede tilstrækkeligt med tid til at bygge et fyldestgørende dataset og en solid, velfunderet økonometrisk model. Når det er sagt, er det nok sjovere, og betydeligt mindre risikabelt på kort/mellemlangt sigt, at være studentermedhjælper i Finansministeriet. Da jeg engang lavede en fejl i min analyse af det forventede afkast af et væddemål, kostede det mig et ikke-ubetydeligt beløb. Da jeg som studentermedhjælper i Finansministeriet lavede en fejl i en analyse betød det derimod, at en fuldmægtig måtte blive sent og lave det om.

 

* Og leve godt! Se ham vise rundt i sit hjem her.

** Dette er ikke helt rigtigt. Jeg lavede analysen som et projekt i Labor Economics, som jeg har fulgt på dette semester. Så den officielle begrundelse var, at jeg ville undersøge incitamentsstrukturerne for professionelle basketballspillere. En af mine kontrolvariable var så, tilfældigvis (…), bookmakernes forventninger. Og ja. Det var svært at gå til office hours og sælge denne idé til professoren.

*** Levitt, Steven D. (1994). Using Repeat Challengers to Estimate the Effects of Campaign Spending on Election Outcomes in the U.S. House. Journal of Political Economy, Vol. 102, 4, 777-798.



7 kommentarer


Christian Brøns Schnohr

Christian Brøns Schnohr @ d. 01. maj 2013 #1

Hej Anders, du gør det svært at bestemme sig for, hvorvidt det er dig eller Anders Munk som er den bedste blogger på AAL. Keep up the good work!


Jens Nielsen

Jens Nielsen @ d. 01. maj 2013 #2

Hej Andreas,
spændende indlæg.
Ift dine estimationer, kunne man så ikke lige så godt forestille sig det omvendte, netop at tætte kampe er mere tilbøjelige til at blive dækket på nationalt tv?
Tv dækning er jo en choice variabel for profitmaksimerende networks - og det forestiller jeg mig er big business. Da der er stor hjemmebanefordel i basket kan det forklare hvorfor dit TV estimat er positivt for udehold (og en smule negativt for hjemmehold) - networks dækker tætte kampe, og det er som regel kampe hvor udeholdet scorer flere points.
Hvis det er rigtigt ligger der altså noget ude i fejlleddet vi kan kalde "kvalitet", der varierer over tid, og det invaliderer vel dine estimater? et Chicago bulls hold er trods alt ret forskelligt afhængigt af om Derrick Rose er med eller ej, uanset om de spiller mod samme modstander.
Et problem Levitt (1994) så vidt jeg husker deler ift incumbency advantage, learning by doing, etc.

Hvis vi kunne få et par måneder hvor vi kunne tvinge de amerikanske networks til at trække lod om hvilke kampe de ville dække ville TV være ret oplagt eksogen, og så satte jeg gerne sparepengene baseret på din model (altså, hvis vi lader som om markedet ikke læser med).

Tak for god blog!


Andreas Madum

Andreas Madum @ d. 01. maj 2013 #3

@ Christian.

Takker! Men hvis vi antager, at det er et Freudian Slip, at du kalder mig Anders, så må det naturligvis følge, at Anders er den bedste blogger!

@ Jens.

Fremragende pointer! Jeg har et længere afsnit i mit paper om bl.a. disse problemer. Det er dog afgjort for tørt til at se dagens lys på denne blog. Her er mine umiddelbare tanker. Som altid bliver dette et alt for langt svar.

Det største problem er, som du skriver, at det ikke er tilfældigt, hvilke kampe, der er på landsdækkende TV. Jeg går faktisk hele vejen og antager, at fx ESPN vælger at sende de kampe, hvor der, alt andet lige, scores flest point, da amerikanerne godt kan lide at se den slags. Men hvis ESPN kan forudsige, hvilke kampe, der er højt scorende (eller tætte), så burde markedet også kunne gøre det. Derfor får jeg fat i langt størstedelen af (hele?) denne endogenitet ved at kontrollere for ændringer i markedets forventning. Dette er i øvrigt årsagen til, at jeg bruger markedets forventninger til at starte med.
Hvis man er fancy, hvilket Levitt jo per definition er, så leder man efter en instrumentvariabel i stedet. Hvis vi skal være slaver af litteraturen, kunne vi fx bruge nedbør under TV transmissionen, naturkatastrofer e.l., som et instrument. Jeg synes dog dette er lidt overkill. Hvorfor skulle ESPN være bedre til at forudsige udfaldet af kampene end markedet? Og hvis de faktisk er bedre til det, hvorfor dropper de så ikke transmissionerne og trykker penge via væddemål i stedet?
Din pointe med Rose er også god. Jeg bruger selv handlen af Carmelo Anthony fra Denver til New York som et eksempel. Jeg gør to ting for at imødekomme dette problem. 1) Igen bør markedet blot justere, og ændringerne afspejler sig i markedets forventning. 2) Jeg kører en regression udelukkende for observationer, hvor begge hold har samme 5 startere i begge kampe. Denne regression har desværre begrænset power, da jeg ikke har så mange datapunkter at estimere ud fra – tror jeg har 7 ændringer i TV dækning for denne subsample - men effekten af TV bliver større, dog uden at være signifikant forskellig fra nul grundet store standardfejl.

Om ovenstående argumenter er overbevisende skal jeg ikke kunne afgøre. Jeg synes selv, at det er overbevisende, at ESPN ikke kan forudsige bedre end markedet, hvorfor kausaliteten går fra TV til point. Men det virker måske mere hult, at jeg bare siger, at markedet bør justere for alle ændringer, når der er skader, handler osv., hvorefter jeg finder, at markedet ikke justerer for ændringer i TV-dækning. Omvendt er det nok mere oplagt for aktører på markedet, at ændringer i hvilke spillere et hold har til rådighed betyder noget for udfald af kampe end hvorvidt kampen er på landsdækkende TV.


Johan Mathiesen Dam

Johan Mathiesen Dam @ d. 02. maj 2013 #4

Tak for et meget interessant og godt blogindlæg Andreas! Det vil straks blive delt på diverse NBA forums, jeg kender til.

Jeg har videre et spørgsmål omkring dit grundlag for din model. Nu fremgår det af indlægget, at din model ønsker at forklare scoring i kampe fra den regulære sæson. Men de NBA kampe, der er mest mediedækket, er jo play-off kampene. Videre har Play-off kampene et lavere scoringsgennemsnit end kampene i den regulære sæson, og derved er disse play-off kampe ikke i overensstemmelse med dit argument om, at større mediedækning giver flere points. Så hvilke ændringer vil du lave i din model, hvis du skulle forklare scoringen i en play-off kamp?


Christian Brøns Schnohr

Christian Brøns Schnohr @ d. 02. maj 2013 #5

Ja, det var vist ret tydeligt Freudian slip. Men tillykke med 2. pladsen så :)


Andreas Madum

Andreas Madum @ d. 02. maj 2013 #6

@ Johan

Jeg er (som fan) enig i, at slutspillet er mere interessant. Som økonom er den regulære sæson dog klart at foretrække. Årsagen er, at der i den regulære sæson er mere variation i TV-dækningen, mens slutspilskampe, mere eller mindre, altid vises landsdækkende, hvilket gør det svært at estimere effekten af at spille på landsdækkende TV, da vi så at sige ikke har en kontrolgruppe. Det er årsagen til, at jeg bruger den regulære sæson i mit paper.

Desuden tror jeg, at opmærksomhed fra medierne har forskellig effekt i den regulære sæson og i slutspillet. Derfor bør øget TV-dækning ikke nødvendigvis medføre samme adfærdsændring i de to tilfælde. I den regulære sæson er det ikke (så) vigtigt, hvilket hold, der vinder, men derimod, hvilke spillere, som scorer flest point. Se bare på de priser, der deles ud. NBA All-Stars er ofte offensive spillere. Kobe Bryant(!) var på årets forsvarshold mange år i træk. Og året bedste reservespiller (sixth man) er altid en, der scorer mange point. Er fx helt væk, at Jamal Crawford var i betragtning til denne pris i år. Han er spektakulær, men relativt ineffektiv på angreb, og er direkte dårlig på forsvar. I slutspillet, derimod, betyder det kun noget, hvem der vinder. LeBron James var fx (også) et monster for Cleveland i slutspillet i mange år, men var på dårlige hold, og fik derfor aldrig rigtig kredit for sine vanvittige præstationer. Han var en ’choker’. Hvor vanvittigt det end lyder. Hvad er min pointe? I den regulære sæson vil fans se scoring, og spillerne øger deres offensive indsats, når de er på landsdækkende TV. I slutspillet vil fans se vindere, og spillerne øger deres sandsynlighed for at vinde ved både at øge deres offensive og defensive indsats. Afhængigt af produktionsfunktionen for sejre i basketball kan øget TV-dækning i slutspillet føre til både flere, færre og uændrede point scoret. Da jeg oprindeligt tænkte over disse problemer, og fordi det er sjovt, byggede jeg en spilteoretisk model, hvor produktionsfunktionen, naturligvis, var en Cobb-Douglas. Matematikken bliver dog ikke så pæn, og ratioen af insights over matematik er ret lav. Grundlæggende ender modellen ud i et par halvlange udtryk, der blot beskriver, hvad jeg har forklaret ovenfor.

Og så er der i øvrigt ikke så stor forskel på scoring i den regulære sæson og slutspillet, når vi tager højde for antal boldbesiddelser. Ifølge mit dataset scorer det gennemsnitlige hold 107,56 point per 100 boldbesiddelser i den regulære sæson, mens det gennemsnitlige hold scorer 106,80 point per 100 boldbesiddelser i slutspillet. Uden at have undersøgt det forventer jeg, at forskellen - der ikke er statistisk forskellig fra nul - skyldes, at de hold, som ikke kommer i slutspillet, ofte er dem, der tillader modstanderen at score mange point.


Johan Mathiesen Dam

Johan Mathiesen Dam @ d. 02. maj 2013 #7

Tak for svaret! Jeg er ikke så overrasket over, at differencen i points er så lille mellem play-off og den regulære sæson set per 100 boldbesiddelser. Siden man 1) spiller i et lavere tempo i play-off. Videre 2) holdene spiller bedre forsvar og derved falder modstanderens scoringsprocent fra gulvet, men samtidig 3) får holdene flere skud op, da de begår færre turnovers. Det er hvert fald de forklaringer, jeg vil tænke mig til.


Tak for din kommentar!
Skriv venligst en kommentar der er længere end 5 tegn

Skriv en kommentar

Log ind for at kommentere - eller opret en bruger

Andreas Madum

Andreas Madum er cand.polit. og ph.d. fra Københavns Universitet. Han har undervist i en række makro- og mikroøkonomiske fag på polit., mat-øk og HA(mat) og har tidligere været fuldmægtig i Finansministeriet. Han arbejder i dag hos The Boston Consulting Group.