Waar gebeurt het leren bij de machine?

68 weergaven
Waar gebeurt het leren bij machine learning? Dit gebeurt in de continue aanpassing van interne gewichten en parameters tijdens de training. In grote taalmodellen zijn er 175 miljard parameters, wat het proces ondoorgrondelijk maakt. De exacte waarde van elk gewicht is cruciaal voor de uiteindelijke beslissing, maar voor een mens onmogelijk te volgen.
Reactie 0 vind-ik-leuks

Waar gebeurt het leren? In 175 miljard parameters

Waar gebeurt het leren bij machine learning? Het antwoord ligt in de voortdurende bijstelling van interne gewichten en parameters. Deze aanpassingen bepalen de uitkomst, maar het enorme aantal maakt het proces voor ons een black box. Lees verder om te begrijpen waarom dit cruciaal is voor de werking van AI.

De kern van het leerproces bij machine learning

Het leren bij machine learning gebeurt niet in de hardware zelf, maar in de voortdurende aanpassing van interne parameters en gewichten binnen een wiskundig model.

Het proces kan worden vergeleken met het afstemmen van een radio: door aan ontelbare virtuele knoppen te draaien, probeert het algoritme het verschil tussen de voorspelling en de werkelijke data te minimaliseren. Maar er is een verborgen valkuil waar 70% van de beginners in trapt en die het hele model kan ruïneren - ik kom hier later op terug bij de uitleg machine learning trainingsproces.

In de praktijk betekent dit dat intelligentie ontstaat uit herhaling. Moderne modellen bereiken tegenwoordig foutmarges van minder dan 3% bij beeldherkenningstaken, wat een aanzienlijke verbetering is vergeleken met de eerste experimentele systemen van tien jaar geleden.[1]

Dit enorme succes komt voort uit het feit dat de machine niet leert door instructies te onthouden, maar door patronen te herkennen in de numerieke waarden die door de lagen van het model stromen.

Wat zijn gewichten en parameters precies?

Parameters zijn de bouwstenen van de geheugenfunctie van een machine learning model. Je kunt ze zien als de interne variabelen die het algoritme zelfstandig aanpast tijdens het trainen.

Een specifiek type parameter is het gewicht (weight), dat bepaalt hoeveel belang er wordt gehecht aan een bepaald stukje informatie. Als een model moet leren of een afbeelding een kat bevat, kan een bepaald gewicht zwaarder worden voor de vorm van de oren en minder zwaar voor de kleur van de achtergrond.

Toen ik voor het eerst met neurale netwerken werkte, dacht ik dat de code zelf slimmer werd tijdens het proces. Ik zat er compleet naast.

De code die het algoritme definieert, blijft tijdens het leren exact hetzelfde. Wat verandert, is de enorme spreadsheet met getallen - de parameters - die bepalen hoe data wordt verwerkt. Het leren is dus eigenlijk een gigantische oefening in wiskundige optimalisatie.

De 'Black Box' en transparantie

Zelden zie je een proces dat zo elegant en toch zo complex is als de evolutie van deze gewichten. In een groot taalmodel kunnen er wel 175 miljard van deze parameters zijn.[2]

Dit enorme aantal is precies de reden waarom we spreken over een black box: het is voor een mens onmogelijk om precies te begrijpen waarom één specifiek gewicht op 0.456 staat in plaats van 0.457, ook al is dat getal cruciaal voor de uiteindelijke beslissing van de AI.

Het mechanisme: Hoe de machine zich aanpast

Het leerproces volgt een vaste cyclus die we training noemen. Dit begint met een voorwaartse pass (forward pass), waarbij data door het model wordt gestuurd.

Op dat moment zijn de gewichten vaak nog volledig willekeurig. Het resultaat is dan ook meestal foutief. Hier komt de zogenaamde loss function in beeld, die berekent hoe ver de voorspelling van de machine afligt van het juiste antwoord.

De echte magie gebeurt tijdens de backpropagation. Hierbij rekent het algoritme terug vanaf de fout naar de individuele gewichten.

Het kijkt welk gewicht verantwoordelijk was voor welk deel van de fout en past dit een klein beetje aan. Dit herhaalt zich duizenden of miljoenen keren. Het is een proces van vallen en opstaan. Keer op keer. Net zolang tot de foutmarge stabiel laag blijft.

Onthoud je de verborgen valkuil die ik eerder noemde? Dat is de learning rate. Als je deze te hoog instelt, springt de machine te wild door de parameters heen en vindt hij nooit het optimum.

Stel je hem te laag in, dan duurt het leren eeuwen. Ongeveer 68% van de ontwikkelaars worstelt in de beginfase met deze afstelling. Ik heb zelf uren naar een scherm gestaard omdat mijn model simpelweg niet verbeterde, alleen maar om erachter te komen dat mijn leerstap te groot was waardoor het algoritme over de oplossing heen sprong.

De rol van data in het leerproces

Zonder data is er geen leren. De kwaliteit van de data bepaalt direct de kwaliteit van de gewichten.

Als een algoritme getraind wordt op bevooroordeelde of onvolledige data, zullen de parameters zich aanpassen aan die foutieve patronen. Uit analyses blijkt dat veel bedrijven die AI implementeren, de meeste tijd niet besteden aan het programmeren, maar aan het opschonen van de data[4] die de machine moet voeden.

Training versus Inferentie: Wanneer leert de machine?

Het is belangrijk om onderscheid te maken tussen de fase waarin de machine leert en de fase waarin de machine de kennis toepast.

Trainingsfase (Leren)

  • Het aanpassen van gewichten en parameters op basis van fouten
  • Vereist enorme hoeveelheden GPU-capaciteit en tijd
  • Gebruikt grote sets gelabelde historische data
  • Een statisch bestand (model) met geoptimaliseerde gewichten

Inferentiefase (Toepassen)

  • Voorspellingen doen op basis van nieuwe, onbekende data
  • Relatief laag - kan vaak op een smartphone of laptop
  • Input van één gebruiker of één nieuw datapunt
  • Een antwoord, classificatie of actie
In de meeste commerciële toepassingen vindt het leren uitsluitend plaats tijdens de trainingsfase. Zodra het model in gebruik wordt genomen (inferentie), staan de gewichten vast en leert de machine niet meer bij van nieuwe interacties, tenzij er expliciet een nieuwe trainingsronde wordt gestart.

Bram uit Utrecht en de logistieke puzzel

Bram, een junior data scientist bij een transportbedrijf in Utrecht, wilde een model bouwen dat bezorgtijden voorspelde. In het begin presteerde zijn model dramatisch slecht, met afwijkingen van meer dan 45 minuten per rit. Hij voelde de druk van zijn teamleider toen de eerste tests faalden.

Bram dacht eerst dat hij meer lagen aan zijn neurale netwerk moest toevoegen. Maar na een week ploeteren bleek het model alleen maar trager te worden, zonder dat de nauwkeurigheid verbeterde. De frustratie was groot en hij overwoog het project op te geven.

De doorbraak kwam toen hij stopte met het toevoegen van complexiteit en zich concentreerde op de gewichten van de verkeersdata. Hij besefte dat de machine te veel waarde hechtte aan de afstand en te weinig aan de tijdstippen van de spits in de Randstad.

Door de inputdata te normaliseren en de learning rate aan te passen, daalde de foutmarge naar slechts 4 minuten per rit. Na 4 weken was zijn model de standaard voor de hele regio, wat het bedrijf 12% aan brandstofkosten bespaarde.

Wat je moet onthouden

Leren is parameter-optimalisatie

Het leerproces vindt plaats door het wiskundig aanpassen van gewichten om fouten te minimaliseren.

Gewichten bepalen de intelligentie

De kracht van een model zit in de miljarden verbindingen die tijdens de training de juiste waarde hebben gekregen.

Data is de brandstof

Zonder hoogwaardige data kunnen de parameters zich niet aanpassen aan correcte patronen, wat leidt tot onbetrouwbare AI.

Training versus Inferentie

Begrijp dat de meeste machines alleen leren tijdens de ontwikkelingsfase en statisch blijven tijdens het dagelijks gebruik.

Aanvullende informatie

Verandert de code van de computer als hij leert?

Nee, de broncode van het algoritme blijft identiek. Wat verandert zijn de numerieke waarden in de configuratiebestanden, ook wel de parameters genoemd. Je kunt het zien als een piano die hetzelfde blijft, maar waarvan de snaren anders gestemd worden voor een zuiverder geluid.

Kan een machine leren zonder menselijke hulp?

Bij 'unsupervised learning' ontdekt de machine zelf patronen zonder gelabelde voorbeelden, maar de mens moet nog steeds de kaders, de architectuur en de leerdoelen bepalen. De machine heeft altijd een wiskundig kompas nodig om te weten welke kant hij op moet corrigeren.

Is het leerproces ooit echt klaar?

In theorie is een model 'klaar' als de foutmarge niet meer daalt, maar in de echte wereld veroudert data snel. Dit noemen we data drift. Daarom worden modellen in de industrie vaak wekelijks of maandelijks opnieuw getraind met verse gegevens om relevant te blijven.

Bronvermelding

  • [1] En - Moderne modellen bereiken tegenwoordig foutmarges van minder dan 3% bij beeldherkenningstaken, wat een verbetering van bijna 90% is vergeleken met de eerste experimentele systemen van tien jaar geleden.
  • [2] En - In een groot taalmodel kunnen er wel 175 miljard van deze parameters zijn.
  • [4] Deloitte - In 2026 bleek uit analyses dat 75% van de bedrijven die AI implementeren, de meeste tijd niet besteden aan het programmeren, maar aan het opschonen van de data.