De data-economie is geen all-you-can-eat-buffet meer

4 december 2018
De data-economie is geen all-you-can-eat-buffet meer

Elke technologiedeskundige die ik heden ten dage spreek, voorspelt hetzelfde voor de toekomst. Geen cyborgs of andere wereldschokkende ontwikkelingen, maar data, data en nog eens data. Volgens de overgrote meerderheid van die experts zouden data op steeds grotere schaal worden toegepast, en zal het woordje ‘data-economie’ deel uitmaken van onze dagelijkse woordenschat.

Data is de nieuwe munteenheid

De data-economie bestaat vandaag echter al, en duidt op het feit dat het meest kostbare goed vandaag geen goud, geld, olie, of – God forbid – zelfs tijd meer is, maar data. In ons informatietijdperk sturen data economische groei en verandering aan, en verbeteren ze onze levenskwaliteit.

Een voorbeeld daarvan zijn de vele toepassingen van big data binnen de gezondheidssector, waar data steeds meer gebruikt worden om epidemieën te voorspellen, om ziekten te voorkomen en om medische behandelingen te verbeteren.

Het World Economic Forum gaat zelfs zo ver om te beweren dat praktisch alle onderdelen van onze moderne digitale maatschappij gebaat zouden zijn bij een betere toegang tot data. Dat creëert uiteraard ook immense economische kansen omtrent data. Zo schat de Europese Commissie in dat de Europese dataeconomie in 2016 zo’n 300 miljard euro waard was, en dat die waarde tegen 2020 zou stijgen naar een 739 miljard euro.

Maar de dataeconomie komt niet altijd even gunstig in het nieuws. Zo hoor je elke maand wel over een datalek hier of daar, hebben bevooroordeelde algoritmen het maar al te vaak op de zwakkeren in de maatschappij gemunt en zijn we Cambridge Analytica nog steeds niet vergeten.

Een manusje van alles

Tijd dus om mijn licht op te steken bij SAS Analytics, gespecialiseerd in – je raadt het al – big data en analytics. Van 22 tot 24 oktober organiseerde SAS de Analytics Experience in Milaan, waar de laatste inzichten op het gebied van analytics uitgebreid werden toegelicht.

Als er één ding is wat ik op de SAS-conferentie heb geleerd, is het wel dat je data voor zowat alles kan gebruiken. En dat gebeurt ook effectief. Zo kan je uiteraard data inzetten om als bedrijf je marketing gerichter aan te pakken, zoals ik leerde tijdens de presentatie van Serhat Keçici, data scientist bij Türkcell.

Keçici liet me inzien dat deep learning uitzondelijk veel voordelen bevat voor marketingdoeleinden. Zo kan via deep learning voorspeld worden voor hoeveel Turkse lira een Turkcell-klant zal willen herladen, en wordt via lineaire regressie voorspeld wanneer een gebruiker precies zal herladen. Op basis van die inzichten worden er pushberichtjes gestuurd naar de consumenten die lezen als “herlaad nu voor 30 Turkse Lira en krijg dagelijks 1 gigabyte / wekelijks 100 belminuten gratis”.

Ook Matthias Coopmans en Véronique van Vlasselaer van SAS België maakten me attent op die boodschap; namelijk dat we big data en analytics kunnen gebruiken om marketingboodschappen op maat te maken en zo uiteindelijk betere verkoopcijfers te genereren.

GDPR, big data en analytics: an unlikely brotherhood

Wat echter het meest van al mijn interesse wegdraagt op het vlak van big data en analytics, is het overduidelijke spanningsveld tussen de dataeconomie en de recent geïmplementeerde GDPR. Want data is de brandstof van AI en innovatie in het algemeen, maar hoe innoveren wanneer die data nu extra worden beschermd door de verhoogde bezorgdheid over onze privacy.

Olivier Penel van SAS stelde tijdens zijn breakout sessie luidop de vraag die ik me ook al meermaals heb gesteld: “is privacy wel compatibel met innovatie?” Penel gaf het voorbeeld van Predpol, een software waarbij een algoritme kan bepalen of een persoon al dan niet een misdaad zal begaan. “Hoe?” zul je enigszins verbouwereerd bij jezelf denken, “kan een algoritme ervoor zorgen dat je gearresteerd wordt?”

Predpol baseert zich daar simpelweg voor op kwantificeerbare gegevens zoals je postcode en of je ooit in een bende hebt gezeten en werd al toegepast door de LAPD. “Preventive policing” wordt Predpol ook wel genoemd, terwijl de aard van politiewerk per definitie niet preventief is. Daarenboven hoeft het ook geen betoog dat die algoritmen niet altijd even objectief zijn.

Volgens Penel maakt de GDPR innovatie niet onmogelijk, maar is het een bijkomend obstakel waar vooral data scientists rekening mee moeten houden. In de context van GDP moeten ze een legale basis hebben om die data te gebruiken. Dat kan de expliciete toestemming zijn van die data subjects.

Hoewel Penel een fervent voorstander is van de GDPR, waarschuwt hij voor te strikte regels; “te strenge regels kunnen een data-economie net schade toebrengen. We moeten daarom op zoek naar een goede balans tussen privacy en innovatie.”
“Om toch op legale wijze innovatie door te voeren moet je data dus uitermate goed beheren.” Maar dat is niet de enige tip die Penel heeft. “Je moet privacy in feite al in je datawetenschap zelf verwerken.” Privacy is dus geen stap die aan het einde van het hele dataproces nog snel eventjes wordt toegevoegd om aan alle richtlijnen te voldoen, maar is eerder een ethisch besef dat al in het begin van je dataverwerkingsproces aanwezig dient te zijn.

“Voorheen was er een beetje een ‘all you can eat’ aanpak, waar je gewoon alle data gebruikte die je maar kon vinden. Nu moeten we effectief nadenken of we wel het recht hebben om die data te gebruiken”, aldus Penel.