Het algoritme

De schijnbare strijd tegen het algoritme
Zoekt men met Google naar “algoritme facebook”, dan is het resultaat indrukwekkend:
“Ongeveer 7.650.000 resultaten (0,61 seconden)”
Zoekt men naar de Engelse variant, dan is het resultaat nog indrukwekkender:
“Ongeveer 242.000.000 resultaten (0,83 seconden)”
Klaarblijkelijk speelt het algoritme een belangrijke rol in het leven van de consument van social media. Die rol wordt niet altijd gewaardeerd. Zo zijn er talloze artikelen te vinden met titels die duidelijk maken dat het een strijd gaande is, influencers (en bedrijven) tegen het algoritme. We presenteren een kleine bloemlezing.
- “DE STRIJD TEGEN HET ALGORITME” (Sanne van der Schee)
- “Inhakers: dé manier om het algoritme op social media te verslaan” (Danny van Zon)
- “Kom uit je bubbel en versla de algoritmes van social media” (John van Schagen)
- “Hoe versla ik het algoritme van Facebook?” (Lisa van Oort)
- “Facebook’s nieuwe algoritme: zo verdwijn je niet uit de tijdlijn van je volgers” (vH Media)
- “DOORBREEK HET NIEUWE FACEBOOK ALGORITME EN CREËER MEER BEREIK MET JE FACEBOOKBERICHTEN!” (www.2bfound.nl)
- “Het algoritme van Instagram verslaan? Dat kan, maar je moet er iets voor over hebben” (www.metrotime.be)
De strijd wordt ook beschreven in boeken, waaronder “Gouden bergen” van Doortje Smithuijsen. Enkele citaten van jonge vrouwelijke influencers over de strijd tegen het algoritme en de frustratie die dat oplevert.
“Als ik Shady tijdens een Uberritje vertel over de bochten waarin Noortje en Marlou zich wringen om in de gratie te komen bij het algoritme, ….”
“‘Het is echt een kutsysteem.”
“Ik haat het.”
“Het is zo oneerlijk en frustrerend.”
Als je het boek van Doortje leest, begrijp je dat die influencers gefrustreerd raken. Maar het wordt ook duidelijk dat ze de rol van het algoritme miskennen. Het algoritme is geen tegenstander waartegen je strijdt. Het algoritme is een jury, een jury die in de strijd tussen alle influencers onderling, elke seconde nieuwe winnaars en verliezers uitroept. Om dat proces te begrijpen gaan we in dit artikel nader in op algoritmes. We leggen uit wat een algoritme is. Verder gaan we in op de algoritmes die worden gebruikt worden door de social media. Ons uitstapje naar algoritmes begint met een doolhof.

Wie vindt de uitgang in dit doolhof
Wie vindt de uitgang in dit doolhof? De ingang is aan de onderkant en het doel is om aan de bovenkant van het doolhof uit te komen. We maken het niet al te moeilijk, het is een simpel doolhof. 



Even kijken, even denken, even proberen en het probleem is opgelost. Praktisch iedereen ziet meteen de te volgen weg.

Een algoritme voor een doolhof
Praktisch iedereen ziet meteen de weg. Voor hen die dat niet zien, zowel letterlijk als figuurlijk, kunnen we een algoritme ontwerpen die aangeeft hoe je bij de uitgang komt. Dat algoritme is verbluffend eenvoudigg. Ga het doolhof in en volg met je rechterhand de rechtermuur totdat je bij de uitgang bent. Hieronder is in de vorm van een rode lijn aangegeven wat in het begin de te volgen weg is.



Als we in gedachten de rode lijn verder doortrekken, met de rechterhand tegen de rechtermuur, dan komen we even later uit bij de uitgang. Zou het doolhof 1000 keer zo groot zijn en ook nog veel ingewikkelder, dan zou het algoritme nog steeds naar de uitgang leiden, geen doolhof is te groot.

Definitie van algoritme
Een algoritme is een set van formele regels om een bepaald probleem op te lossen of een doel te bereiken. Het is daarmee de beschrijving van een oplossing. Specifieker, een algoritme is een serie stappen die één voor één uitgevoerd moeten worden en gedeeltelijk herhaald moeten worden, meestal tot aan een bepaalde conditie is voldaan.

Een algoritme zelf is geen computerprogramma, het is meestal de basis voor een computerprogramma. Zo zou een algoritme voor een koffieautomaat als volgt kunnen luiden:
1 controleer of er koffie aanwezig is
2 controleer of er waterdruk is
3 controleer of er bekertje aanwezig zijn
4 als alle drie de controles positief zijn: weergave van “druk op start” op het scherm
5 als dat niet het geval is: weergave van “buiten werking” op het scherm
Elke keer als een kopje koffie is geproduceerd, dient dit algoritme uitgevoerd te worden, zodat een koffieklant alleen kan bestellen als er voldoende voorraad is. Dit algoritme getransformeerd tot een computerprogramma zou omvangrijk zijn, te groot om hier weer te geven. Om een idee te geven hoe de vertaling van een algoritme in een programmeertaal eruit ziet, keren we weer terug naar ons doolhof. Dat doen we via een bezoek aan de site www.rosettacode.org. Daar is een uitgebreide verzameling programma’s te vinden, in vele verschillende programmeertalen, die alle een algoritme implementeren om de weg in een doolhof te vinden. De implementatie in de programmeertaal Red ziet er als volgt uit.
Red ["Maze solver"]

do %mazegen.red print [
"start:" start: random size - 1x1
"end:" end: random size - 1x1
]
isnew?: function [pos] [not find visited pos]
open?: function [pos d] [
o: pos/y * size/x + pos/x + 1
0 = pick walls/:o d
]
expand: function [pos][
either any [
all [pos/x > 0 isnew? p: pos - 1x0 open? p 1]
all [pos/x < (size/x - 1) isnew? p: pos + 1x0 open? pos 1]
all [pos/y > 0 isnew? p: pos - 0x1 open? p 2]
all [pos/y < (size/y - 1) isnew? p: pos + 0x1 open? pos 2]
][append visited p insert path p][remove path]
path/1
]
path: reduce [start]
visited: []
until [end = expand path/1]
print reverse path
DIt voorbeeld laat zien dat een simpel algoritme een groot aantal programmaregels vergt om te implementeren. Is er sprake van vele ingewikkelde sub-algoritmes en overkoepelende algoritmes, zoals bijvoorbeeld bij social media, dan worden het honderdduizenden tot miljoenen programmaregels.

Een voorbeeld van social media algoritme
We kunnen, ter illustratie, een simpel algoritme voor social media ontwikkelen. Daarbij concentreren we ons op slechts één aspect van de social media, namelijk welke posts weer te geven op enig moment voor een bepaalde gebruiker en wel gebruiker Jan. Jan heeft in zijn profiel opgegeven dat zijn taal Nederlands is en zijn woonland Nederland.

Het algoritme, toegesneden op Jan, bestaat uit de volgende stappen.
1 Selecteer alle posts die de afgelopen 24 uur zijn gepubliceerd
2 Verwijder alle posts in een taal ongelijk aan Nederlands
3 Verwijder alle posts komend uit een land ongelijk aan Nederland
4 Plaats in deze verzameling alle posts van accounts die Jan volgen bovenaan
5 Geef deze verzameling weer op de homepage van Jan

Dit algoritme dient vervolgens als basis voor de programmeur om het programmaonderdeel te ontwikkelen die de posts daadwerkelijk weergeeft.

In de praktijk van de social media zijn de algoritmes veel gecompliceerder. Daarnaast wordt bij deze applicaties tegenwoordig een beroep gedaan op de Artificial intelligence (AI), waardoor de complexiteit toeneemt.

Artificial intelligence
Klassieke computerprogramma’s kunnen allerlei soorten complexe taken snel en foutloos uitvoeren. Maar er zijn grenzen. Bepaalde vraagstukken zijn simpelweg niet op te lossen, terwijl ze nota bene zo eenvoudig lijken. Jan herkent zijn partner op 100 meter afstand en als die partner, eenmaal dichtbij gekomen, met een bepaalde intonatie zegt, “je bent een verwend jongetje” weet Jan dat het liefkozend is bedoeld. Geen enkel klassiek computerprogramma kan die partner ooit herkennen en “je bent een verwend jongetje” kan maar op een manier worden geïnterpreteerd. Om dergelijke vraagstukken toch met de computer te kunnen oplossen, moet een beroep worden gedaan op Artificial intelligence.

Artificial intelligence is tegenwoordig overal aanwezig, bijvoorbeeld op een Android telefoon. Wordt de applicatie Photos van Google geladen, dan kan onderaan op het icoon Zoeken worden getapt, waarna een zoekterm kan worden opgegeven. We geven op sneeuw, waarna de AI-applicatie van Google alle foto’s doorneemt en “kijkt” of er sprake is van sneeuw. De resultaten zijn als volgt. 



De resultaten zijn ook correct, 30 september (2020) was de laatste keer dat met dat telefoontje foto’s waren genomen van sneeuwlandschappen. Google kan dus “zien”. Of in het algemeen geformuleerd, computers kunnen “zien”.

Dankzij dat “zien” is bijvoorbeeld gezichtsherkenning mogelijk. Pak je telefoontje op en de ingebouwde camera controleert of het gezicht bekend is en, zo ja, geeft toegang tot de telefoon. Een alternatief is die waarbij de telefoon wordt “geopend” door de vingerafdruk te lezen. Ook dat is een AI-toepassing.

Een ander voorbeeld van AI op de smartphone is Google Lens. Deze applicatie laat de AI door de lens meekijken en vertelt bijvoorbeeld welk kerkgebouw het ziet, wanneer die kerk open is, wat de Duitse tekst op de kerkdeur betekent en welke plant naast de kerkdeur groeit.

Een voorbeeld uit de wereld van de social media is de face recognition van Facebook. Deze AI-tool herkent personen op foto’s , met andere woorden, Facebook kan een naam verbinden aan een gezicht op een willekeurige foto. Daardoor kan Jan een seintje van Facebook krijgen, als een vriend een foto publiceert waarop zijn gezicht te vinden is. De volgende schermkopie van Facebook zelf demonstreert deze functie.



Zet iemand een fake-account op compleet met profielfoto, dan krijgt Jan ook een seintje als een van zijn foto’s is gebruikt voor die profielfoto.
AI kan krachtige, handige, efficiënte en fraaie tools opleveren, maar de medaille heeft ook een keerzijde.

AI is een black box, je kan niet nagaan hoe het resultaat is voortgebracht. Je stopt wat in de black box en aan de andere kant wordt het resultaat gegeven. De tussenstappen zijn niet zichtbaar. Dat is verontrustend. Als bijvoorbeeld je leningaanvraag door de bank wordt afgewezen omdat hun AI-applicatie een negatief antwoord geeft, kan je dus niet achterhalen waarom. Datzelfde geldt voor de afgewezen claim van de verzekering, de baby-sitter die niet wordt aangenomen omdat de app van Predictim een negatieve score gaf en de recruiter die nee zegt omdat HireVue dat in zijn oor fluisterde. De laatste (www.hirevue.com) is een AI-service, te gebruiken tijdens het recruitment proces, om de menselijke vooroordelen te elimineren. Een en ander wordt als volgt verwoord.
“Unconscious bias compounds at every step of the traditional hiring process. HireVue’s AI-driven approach mitigates bias by eliminating unreliable and inconsistent variables like selection based on resume and phone screens, letting you focus on more job-relevant criteria.”
Die black box is niet onfeilbaar, dat is ook verontrustend, maar het kan gelukkig wel leren. Het leert net als een kind. Laat een kleuter tien maal een banaan zien en vervolgens zal ze nooit meer een komkommer voor een banaan aanzien. Op dezelfde manier kan een AI-applicatie leren. Laat de applicatie tien maal een banaan zien en vervolgens zal ze niet vaak meer een komkommer voor een banaan aanzien. Maar ze blijft fouten maken, zo kan ze ook een HEMA-worst voor een half verrotte banaan aanzien. Maar na 10000 keer banaan kijken, worden er geen fouten meer gemaakt.

De training om plaatjes te herkennen gebeurt mede dankzij de miljarden gebruikers die vaak worden geconfronteerd met Google’s eCAPTCHA service. Om te voorkomen dat robots een site bezoeken en vervuilen kan de toegang worden beveiligd met een serie foto’s en de simpele opdracht “klik op de foto’s die een brug/fiets/stoplicht laten zien”.



Dankzij de menselijke classificatie van die miljoenen foto’s, kunnen bij Google de verschillende AI-applicaties worden getraind. Dit uitstapje naar Artificial intelligence maakt duidelijk dat AI problemen kan oplossen die met de traditionele manier van programmeren onoplosbaar zijn.

Het algoritme binnen social media
Veel openbare en uitgebreide kennis over de werking van de algoritmes van de diverse social media is niet aanwezig. Die aanwezige kennis komt uit vier bronnen.Ten eerste de social media zelf. Deze geven zo nu en dan de nodige informatie. Een tweede bron is de mening van de verzamelde experts over de werking van de algoritmes. Ten derde worden er statistisch georiënteerde onderzoeken uitgevoerd die blootleggen hoe bepaalde onderdelen van een algoritme werken. Ten vierde kan een analyse van gedeponeerde patenten de nodige informatie opleveren.
Op al die kennis wordt nader ingegaan in de specifieke artikelen over de verschillende social media. Hier wordt volstaan met enkele voorbeelden.

1 Social media
Facebook licht zo nu en dan een tipje van de sluier op. Onder de titel “Bringing People Closer Together” werd in de “Newsroom” van Facebook door Adam Mosser ingegaan op de veranderingen die Mark Zuckerberg op 12 januari 2018 in een post aankondigde. Die veranderingen komen kort gezegd op het volgende neer. Een hogere prioriteit voor posts die een hogere kans hebben dat er op wordt gereageerd. Verder een hogere prioriteit voor posts van vrienden en familie en, als complement, een lagere prioriteit voor die van bedrijven (pagina’s).
Een andere bijdrage is een video, getiteld “On How Machine Learning and Auction Theory Power Facebook Advertising”. De video is te vinden bij concurrent YouTube.


 

2 Experts
Een van de experts is Paige Cooper die in het artikel “How the Instagram Algorithm Works in 2020 (And How to Work With It)” ingaat op de werking van het algoritme van Instagram.
Een ander artikel, van Aaron Ward, een andere expert, is “Exactly How The Instagram Algorithm Works in 2020”. Dit artikel geeft ook fijntjes aan hoe Instagram geld verdient aan haar miljoenen gebruikers dankzij dat algoritme.
Tenslotte, als derde voorbeeld, het artikel “How to optimize for the Instagram algorithm in 2020” van Julia Miashkova.

3 Onderzoeken
De journalisten Nicolas Kayser-Bril en Judith Duportail hebben voor het Franse Mediapart, gespecialiseerd in onderzoeksjournalistiek, een onderzoek uitgevoerd om te bepalen of het algoritme van Instagram gecharmeerd is van semi-naaktfoto’s (“Sur Instagram, la prime secrète à la nudité: se déshabiller pour gagner de l’audience”, 15 juni 2020). Pikant detail, Instagram houdt niet van naakt, ze schrijft daarover het volgende.
“We know that there are times when people might want to share nude images that are artistic or creative in nature, but for a variety of reasons, we don’t allow nudity on Instagram. This includes photos, videos, and some digitally-created content that show sexual intercourse, genitals, and close-ups of fully-nude buttocks.”
In hun onderzoek geven de journalisten aan dat de door hen geïnterviewde influencers allen vonden dat een foto van hun met weinig kleren aan (bikini/ondergoed) het beter deed dan geheel gekleed. Simpel gezegd: hoe minder kleren, hoe meer likes. Dit is goed mogelijk omdat Instagram de “naaktheid” van een foto kan vaststellen. Dat gebeurt via een bepaalde methode die uiteen wordt gezet in een van de brevets van Facebook, de moeder van Instagram.
“API 160 may estimate the state of undress of the people in photo 200, by detecting large swaths of a set of common colors, such as identified skin tones”.
De journalisten hebben de proef op de som genomen aan de hand van een steekproef van 2400 foto’s van vrouwen en mannen, zowel gekleed als bijna naakt. De verschillen bleken opvallend. Een bijna-naaktfoto van een vrouw wordt 60% vaker vertoond dan de geklede variant. Voor mannen is dat 30 procent. Het technische gedeelte van het onderzoek, onder de titel “Undress or fail: Does Instagram favour posts that show more skin?”, is op deze pagina te raadplegen.

 4 Patenten
Een van de patenten van Facebook gaat over de wijze waarop een foto kan worden geanalyseerd. Bij die wijze wordt een foto geanalyseerd met als doel allerlei kenmerken van die foto te verzamelen. Tot die vele vele kenmerken behoren onder andere het aantal zichtbare personen, hun geslacht, wie het zijn, hun ras en hun graad van naaktheid. Vervolgens worden al die kenmerken verwerkt tot een score die aangeeft hoe groot de kans is dat anderen op die foto reageren. Oftewel, zoals in het patent beschreven.
“A method comprising, by one or more computing systems: extracting one or more features from a photo; calculating an engagement metric for the photo based on the one or more extracted features, wherein the engagement metric represents the probability that one or more users will interact with the photo; and applying one or more policies to the photo based on the engagement metric.”
Deze methode maakt duidelijk dat de strijd van influencers tegen het algoritme hoogstens virtueel is. De echte strijd is tussen de influencers onderling en de score van het algoritme bepaalt wie wint.

De Europese commissie wil meekijken
Onder het fraaie motto “Shaping Europe’s digital future” maakt de Europese Commissie plannen voor de zogenaamde “Digital Services Act package”. Doel is om de innovatie en de concurrentie te stimuleren in Europa voor de digitale dienstensector. Dat werd tijd, de zogenaamde ”E-Commerce Directive” werd van kracht in het jaar 2000 en is nog steeds actief. Twintig jaar is lang op digitaal gebied, zo bestonden twintig jaar geleden de social media nog niet eens. Met andere woorden, veel veranderingen en die moeten legaal in goede banen worden geleid, oftewel:
“The European Single Market therefore requires a modern legal framework to ensure the safety of users online and to allow innovative digital businesses to grow, while respecting the basic principles underpinning the current legal framework of the e-Commerce Directive.”
Europees commissaris Margrethe Vestager ging nader in op dit onderwerp in een voordracht voor AlgorithmWatch (www.algorithmwatch.org). Daarbij vuurde ze haar eerste schot voor de boeg af richting grote social media, ze gebruikt de term “biggest platforms”.
“So the rules we’re preparing would give all digital services a duty to cooperate with regulators. And the biggest platforms would have to provide more information on the way their algorithms work, when regulators ask for it. They’d also have to give regulators and researchers access to the data they hold – including ad archives.”
De ACM wil ook meekijken
De Autoriteit Consument & Markt is ook geïnteresseerd in algoritmes. Ze wil weten hoe ze in de toekomst algoritmes kan controleren bij marktpartijen. Daartoe is ze in december 2020 een praktijkproef gestart, ze gaat kijken hoe het algoritme bij Muziekweb (www.muziekweb.nl) in de praktijk functioneert.

Volgens de ACM kunnen algoritmes misbruikt worden door bedrijven, bijvoorbeeld door consumenten op zo’n manier te sturen bij hun aankopen dat het nadelig is voor de consument. Daarnaast vraagt ze zich af in hoeverre er nog zicht is op de werking van die algoritmes.

De ACM ziet toe op het goed functioneren van de markten, dat betekent eerlijke concurrentie tussen de bedrijven onderling en geen oneerlijke praktijken. In dat kader kan de ACM onderzoeken bij bedrijven die een algoritme gebruiken en wel hoe deze functioneren en waar deze worden ingezet als mogelijk spelregels worden overtreden. In het vizier van de ACM komen dan:
“De rol van het algoritme bij de mogelijke overtreding;
Het doel waarvoor het algoritme wordt ingezet;
De uitgangspunten die ten grondslag liggen aan het ontwerp en/of de implementatie van het algoritme;
De input voor en uitkomsten van het algoritme.”