Web scraping seminar

Over de sidste 10 år har giganter som Facebook og Google fået en indflydelse på vores liv, som kan måle sig med politikkerne i Folketinget. Hvordan har de opnået på så kort tid at få denne magt på tværs af landegrænser?

Svaret er BIG DATA. Med big data kan få multinationale virksomheder styre vores liv og indsamle uanede mængder information om os.

Er disse muligheder forbeholdt de store virksomheder? Nej, alle kan tage fordel af big data, som ligger frit tilgængeligt på nettet. Hvis bare man ved hvordan. Det er netop problemet med big data. Det er sjældent tilgængeligt, så det let kan downloades til en excel fil. 

Her kommer web scraping ind i billedet. Web scraping dækker over den proces, det er automatisk at udtrække informationer fra en hjemmeside, som ligger offentligt tilgængeligt. Hvis du vil forudsige udviklingen på boligmarkedet ud fra priserne på boliga.dk, eller se om, der er en sammenhæng mellem antallet af seere af Den Store Bagedyst og indslag på hestenet.dk, så er web scraping din ven. Kun fantasien sætter grænser.

De samfundsfaglige studier er ved at få øjnene op for, hvilke muligheder der gemmer sig i den uendelige strøm af information, der er på nettet, og her er web scraping første skridt til at udnytte denne information. 

Derfor inviterer Altandetlige.dk til seminar om web scraping d. 12. november kl. 11 - 16. Ph.d.-studerende ved Sociologisk Institut Snorre Ralund, som for nyligt har undervist i sommerskolefaget Social Data Science, vil stå for undervisningen. Du vil få undervisning i principperne bag samt praktiske øvelser i web scraping. 

For at få mest ud af kurset anbefales kendskab til programmeringssprogene R eller Python. Det er dog ikke et krav, og vi vil forsøge at gøre det lærerigt for alle uanset niveau. Undervisningen vil tage udgangspunkt i Python. Hvis man ingen kendskab til Python har, anbefaler vi, at man sætter sig en smule ind i sproget på forhånd. Ved tilmelding sender vi en guide til at installere Python samt information om Python, som er godt at læse på forhånd.


Tilmeld dig her, så du selv kan komme i gang med web scraping:

Faktaboks

Big data

Man er ikke enig i, hvad der kendetegner "big data". En løs definition kan være; Big data er datasæt, som er så store og komplekse, at traditionelle analyseredskaber og -programmer ikke er tilstrækkelige.

SAS er behjælpelig med en mere detaljeret beskrivelse af big data. Se blandt andet, hvem der kan bruge det (alle).

Web scraping

Web scraping går ud på at opbygge en algoritme/bot/program, som kan udtrække indhold og data fra en hjemmeside automatisk. Det kan f.eks. være folketingspolitkkernes facebookposts og tweets eller information om bilpriserne på bilbasen.dk

Klik her for at læse om, hvordan virksomheder kan bruge webscraping



Partnervirksomheder

Stort tak til alle virksomheder i ALT ANDET LIGEs partnerprogram. Hør mere om programmet, skriv til partner@altandetlige.dk