Internet is een verzameling van data. Wat we lezen, wat we kijken, wat we klikken, wat we kopen, wat we doen. En dan niet op één site, maar overal online. Op de computer, op de mobiel. Thuis en onderweg. We laten een spoor van gegevens achter. En wie van die data chocola kan maken, is koning. Wie kan verzamelen, interpreteren en concluderen, zorgt voor toegevoegde waarde. Dat is één van de belangrijke trends van het moment.

Echonest

The Echonest bijvoorbeeld. Het bedrijf is een dataverzamelaar op muziekgebied. Niet alleen interpreteert de onderneming muziektracks (beats per minute, klankpalet, sfeer e.d.) ook verzamelt ze alles wat er op internet te vinden is rondom een nummer of artiest. Van aantallen plays op YouTube tot berichten over een artiest tot emoties van luisteraars tot relaties met andere muziek. Een nummer is in MP3-formaat niet groter dan 5Mb,
maar Echonest verzamelt in totaal 95 Mb aan gerelateerde data. Het bedrijf weet daarmee veel en veel meer van een nummer dan de artiest of de platenmaatschappij. Natuurlijk, die hebben cijfers over sales en vrienden en volgers, maar Echonest weet veel meer en kan de cijfers in perspectief plaatsen.
En dus kan het bedrijf die gegevens weer te gelde maken en verkopen aan de maker of diens vertegenwoordiger. The Echonest bouwt een business bovenop de data rondom andermans inhoud. En maakt die data weer beschikbaar middels een API zodat anderen weer nieuwe diensten met die gegevens kunnen ontwikkelen.

Dit is een voorbeeld uit de muziek, maar voorbeelden over de kracht van datamining zijn er natuurlijk te over. Van de sentiment analyse van Twitter als voorspeller van beurskoersen tot Google searches als maat voor een oprekkende griepepidemie. Big data was een belangrijk onderwerp in 2011 en zal dat de komende jaren blijven.

Personal data

Net als small data, of beter: personal data. The Quantified Self is het fenomeen dat mensen steeds meer gegevens over zichzelf vastleggen, vergelijken en analyseren. De sporter die zijn hardlooproutes en tijden in een database stopt en met de wereld deelt om zijn progressie te kunnen volgen en trainingsprogramma’s te delen. De lijner die zijn eetpatroon vastlegt om op gewicht te blijven en en passant badges probeert te halen voor goed gedrag. De zieke die medische gegevens inklopt en die met de dokter deelt om een beter beeld van voor- of achteruitgang te krijgen.

Zeker, dat kon vroeger al in een schrift of op de achterkant van een bierviltje, maar dat kan nu veel eenvoudiger. Frictionless, zoals ze zeggen. De weegschaal is aan internet gekoppeld en kan zo gewicht automatisch opslaan en de hardloop-app zit in de smartphone die je toch al bij je draagt. Het wordt steeds eenvoudiger om informatie over jezelf te monitoren en op te slaan. En op basis van die gegevens te handelen. Andere trainingsschema’s, betere dieten, noem maar op.

Dat kan omdat de verzameling van die persoonlijke small data een partij big data oplevert die vergeleken en geïnterpreteerd kan worden. Die met de juiste interpretatie mensen kan helpen.

Kop in het zand

Mooi.

Maar ook: vermoeiend. Hoeveel van jezelf wil je weten? Hoeveel van jezelf wil je bewaren? Maakt weten gelukkig? Ik rij wekelijks mijn rondjes op de Jaap Edenbaan in Amsterdam. De keren dat ik in het verleden gemeten heb, heb ik geleerd dat er heel vaak geen relatie is tussen gevoel en feit. Soms schaats je heerlijk rondjes, voelt de slag af en goed, maar blijkt dat niet overeen te komen met (voor jou) snelle tijden. Een andere keer blijk je snel te rijden, maar had je daarvoor het gevoel dat de slagen niet aankwamen.

Op mijn veertiende heb ik een horloge afgezworen toen ik merkte dat ik alles bijna dwangneurotisch op tijd ging doen. Hetzelfde geldt voor de meter van mijn rondetijden. Ik wil weten hoe het voelt, dat is mijn graadmeter, die tijden kunnen me gestolen worden.

Ik vind data een mooie trend. Maar ik steek mijn kop af en toe met liefde in het zand.

Deze column verscheen eerder in Bright

De foto is van het Smithsonian Institution