Statistik på tapetet

På min vej til SAS Forum 2013 bliver jeg fanget i en tordenbyge og ankommer derfor til Tivolis kongressal gennemblødt. Det er dog hurtigt glemt, da jeg træder ind ad døren og en velasorteret morgenbuffet springer mig i øjnene. Første punkt på dagsordenen er en kop kaffe og en kanelsnegl i selskab med min kollega Peter.

Efter en kort hyggestund bliver der ringet med en klokke og med høj, nærmest storfilmsagtig musik i baggrunden vandrer forummets mange deltagere ind i den store sal, hvor velkomsten finder sted. Et vue ud over salen afslører hurtigt, at majoriteten af deltagerne er gråhårede. Bør SAS være bekymrede?

Peter noterer sig desuden den praktiske omstændighed, at der ikke er internetforbindelse på stedet. Efter oplægget får han dog hurtigt styr på det og kan igen slappe af.

En varm velkomst

Dagen skydes i gang med en varm velkomst, hvor vi som publikum får at vide, at det vi alle har til fælles er, at vi elsker data. Og det er jo ikke helt forkert.

Mikael Hagstrom – ansvarlig for mere end halvdelen af SAS’ indtægter world wide – er første taler på podiet. Han er blandt andet kommet for at tale om Big Data. Hvad er det, hvad kan det bruges til og hvad er det værd? Volume, velocity og value er nøgleordene. Han fortæller, hvordan man i gamle dage praktisk talt kun få kunne få persondata fra telefonregninger, men i dag sætter vi elektroniske spor over alt, hvor vi færdes. Når vi handler i supermarkedet, når vi bruger vores mail, Facebook og så videre.

Fra 2000 til 2013 er SAS’ indtægter blevet firedoblede, og Mikael Hagstrom lægger vægt på i sin tale, at væksten i høj grad bygger på et dybere kendskab til alle klienter. As if you has coffee with them several times, som han siger. Det handler om hyperconnetivity, hvilket vil sige, at man har forbindelse til klienterne konstant via flere forskellige medier såsom Facebook, Twitter, telefon og computer.

Evaluering

Efter oplægget diskuterer Peter og jeg dagens første præsentation. Peter bemærker, at man ikke bare kan starte en konference med at råbe BIG DATA og så forvente, at alle er imponerede. Det har eksisteret i langt tid, påpeger han. Jeg vælger at eksponere min ignorance og hævder til deres forsvar, at jeg aldrig har hørt om begrebet før. Bagud for min tid åbenbart.

Vi bliver dog enige om, at vi savner noget helt nyt og måske lidt mere fængende i oplægget. Vi vil gerne have at vide, om og i så fald hvorfor, SAS er forrest i bussen. Resten af dagen bruger vi derfor på at blive klogere på øvrige dele af SAS-imperiet – mit kendskab til SAS begrænser sig på forhånd til statistikprogrammet, som anvendes på studiet. Nedenstående følger et referat af dagens mest interessante og oplysende foredrag. Begge oplæg beskæftiger sig med SAS-produkter, som er nye for mig.

1. SAS Marketing Automation hos Kræftens Bekæmpelse

Stine Raaholt er cand.merc. i økonomisk markedsføring, og hun er kommet for at tale om, hvordan Kræftens bekæmpelse har implementeret SAS Marketing Automation. Værktøjet skal – som det ligger i ordlyden – automatisere marketingsprocessen i organisationen.

Stine påpeger initialt, at de fleste kender Kræftens Bekæmpelse særligt på grund af deres mange anbefalinger om at undgå solarium, rygning, spiser sundt osv. Samtidig er mange berørt at kræft enten direkte eller indirekte. En ud af fem danskere får kræft, resten er pårørende, som de plejer at sige hos Kræftens bekæmpelse. 40 danskere dør af kræft om dagen, hvilket svarer til, at en HT-bus kører galt hver eneste dag, eksemplificerer Stine.

Kræftens bekæmpelse finansierer 50 % af alt kræftforskning. Finansieringen af organisationen er privat, og det er kernen i Kræftens Bekæmpelses nye strategi. De skal udnytte, at de har donorer, der har meget forskellige karakterer. Nogle har selv mistet og er følelsesmæssigt involveret, mens andre bare godt kan lide de der støt-brysterne gummistøvler. Densiteten af fremmeord som scope og users er høj, når repræsentanten fra Kræftens Bekæmpelse taler, hvilket bekræfter hendes udsagn om, at hun er fra Handelshøjskolen. Jeg er ikke et sekund i tvivl.

Det er vigtigt, at kunderne forstår vækststrategien, da det også skal styrke de budskaber, som donorer skal bruge til at argumentere for, at de støtter Kræftens Bekæmpelse.

Kræftens Bekæmpelse har valgt at investere i SAS Marketing Automation, fordi organisationen fremover skal vækste. De får flere datakilder og flere kontaktpunkter, hvilket kræver større integration. De har tre af landets fem største Facebook-hjemmesider, og de vil gerne udnytte alt deres information bedre til marketing.

Ifølge Stine Raaholt kræver det en investering som denne for at kunne udnytte data. Når det for netop Kræftens bekæmpelse er svært at målrette og automatisere deres marketing, så skyldes det blandet andet, at de har meget data, som de skal være ømme omkring. Mange af deres donorer dør, fordi målgruppen er ældre, men nogle dør også af kræft.

Kampagnerne skal blandt andet automatiseres ud fra, at de har mange bidragsydere, der har meget kontakt med organisationen. Desuden er der mange processor i deres marketing, som bliver gentaget. Det drejer sig for eksempel om 10 årlige lotteriudsendelser. Alt sammen processor som kan automatiseres.

Men giver denne investering ekstra indtægter for Kræftens bekæmpelse? Svaret er ja. Kræftens Bekæmpelse forventer, at de kan femdoble deres indtægter over de næste fem år fra eksisterende donorer som følge af implementeringen af SAS Marketing Automation.

2. SAS Enterprise Miner og det danske arbejdsmarked

Michael Sperling er seniorkonsulent i SAS institute. Til daglig arbejder han med analytiske problemstillinger i SAS’ afdeling for den offentlige sektor. I dag er han kommet for at præsentere en analytisk problemstilling, der tager særligt udgangspunkt i et projekt, som skal definere, hvem der bliver langtidsledige. I analysen ser man på sandsynligheden for at komme tilbage i job samt på karakteristika for de personer, som har svært ved det.

I den udelukkende deskriptive analyse kigger Michael Sperling og hans hold på dem, som bliver ledige andet halvår af 2010. Hvilke karakteristika har de på deres første dag i dagpengeperioden: alder, civilstand, a-kasse, kommune, køn, herkomst og så videre.

Desuden kigger de på, hvad der sker med individerne i de seks måneder, før de bliver arbejdsløse på en række parametre såsom branche, gennemsnitsløn, udbetalere af løn, størrelse af virksomhed, sygedagpengehistorie, forudgående ledighed og så videre. Derefter betragter Michael og hans folk de næste tolv måneder, idet de karakteriserer individer, som går én måned uden ledighed som om, de er kommet ud af ledighed. Ellers er man langtidsledig.

Analysen er et eksempel på en helt generel økonomisk problemstilling, hvor centrale spørgsmål er:

  1. Hvilke forklarende variable er vigtigst? 
  2. Hvordan skal vi gruppere individerne fx løn, alder osv.? 
  3. Hvordan virker krydseffekterne?

En krydsning af samtlige kategorier giver sammenlagt knapt 700 millioner kasser til kun knapt 65.000 nyledige. Hvor meget skal man dele op? Vi vil ikke ende med 700 mio. kasser, men variablene skal have signifikant betydning, og vi ønsker et minimum antal personer hver kasse. Det er her, at SAS-løsningen kommer i spil.

SAS Enterprise Miner har en integreret del, som hedder det statistiske beslutningstræ. Træet kan på få sekunder finde ud af, hvilke variable, som er mest centrale for, om man er arbejdsløs. I dette eksempel er den vigtigste variabel branche. Dernæst er det alder første dag i dagpengeperioden og løn i byggeanlægsbranchen.

Med beslutningstræet finder man derfor hurtigt en række brugbare informationer:

  • Ledige fra bygge og anlæg samt primære erhverv skiller sig ud ved at lettere at komme væk fra dagpenge
  • Yngre arbejdsløse finder generelt lettere arbejde
  • Forudgående løn har betydning for ældre og ansætte i byggebranchen
  • Etniske danskere har lettere ved at finde tilbage i job
  • Medlemmer af A-kassen Dansk Metal klarer sig bedre end gennemsnittet
  • Kommune betyder intet (ingen rådden-banan-effekt)

På kort tid kan man derfor få overblik over et stort datasæt med mange både relevante og ikke-relevante variable i forhold til det, man ønsker at undersøge. Persontligt ser jeg meget frem til at prøve kræfter med træet.

Dagens afslutning - lidt mere Big Data

Vi slutter dagens foredragsrække af med at blive underholdt af Anders Milhøj, der sætter lattermusklerne på arbejde. Han er kommet for at tale om nyheder i SAS 9.4, men dem er der ikke umiddelbart nogen af. Men det kan man jo også snakke om, som han selv siger.

Anders demonstrerer blandet andet dennye geografisk kortfunktion i 9.3. Efter eget udsagn er Anders en pervers, gammel mand, så han vil gerne besøge alle toiletter i Københavns kommune – ved hjælp af SAS. Men han skal ikke gå fra toilet til, men flyve som en due, og inden tilhørerne får set sig om, har SAS beregnet den hurtigste luftrute mellem samtlige toiletter i Københavns kommune.

Anders kommer desuden med en opsang til SAS, som han mener bør udvikle en udgave til Mac, så de kvindelige (underforstået ikke-it-kyndige) studerende ikke behøver prostituere sig for at få en falsk udgave af Windows til at køre det i. Vi takker og bukker for opsangen på de studerendes rækker.

Iden aftensmaden kommer på bordet, runder Vice President, Jill Dyché, af med blandt andet lidt mere om BIG DATA. Et begreb jeg ikke glemmer foreløbig. Oven på lækker mad og et enkelt glas vin, takker vi på Altandetlige.dk af for en spændende dag. 

Virksomheder

Faktaboks

Vil du høre mere om SAS for studerende, så besøg deres facebook gruppe

Partnervirksomheder

Stort tak til alle virksomheder i ALT ANDET LIGEs partnerprogram. Hør mere om programmet, skriv til partner@altandetlige.dk