Wat is het verschil tussen het gemiddelde en de mediaan?
Gemiddelde vs. Mediaan: Twee manieren om het midden te vinden
Bij het analyseren van data is het bepalen van het 'midden' een cruciale stap. Twee veelgebruikte maten hiervoor zijn het gemiddelde en de mediaan. Hoewel ze allebei een idee geven van de centrale tendens, verschillen ze significant in hun berekening en gevoeligheid voor extreme waarden, oftewel uitschieters. Het kiezen van de juiste maat hangt dan ook af van de specifieke dataset en de beoogde analyse.
Het gemiddelde (of aritmetisch gemiddelde): Dit is de meest bekende maat voor het midden. Het gemiddelde wordt berekend door alle waarden in een dataset bij elkaar op te tellen en vervolgens te delen door het totale aantal waarden. Simpel gezegd: de som gedeeld door het aantal.
- Voorbeeld: Stel we hebben de volgende dataset van leeftijden: 25, 28, 30, 32, 35. Het gemiddelde is (25 + 28 + 30 + 32 + 35) / 5 = 30.
De mediaan: De mediaan is de middelste waarde in een geordende dataset. Om de mediaan te vinden, moet de dataset eerst van klein naar groot (of groot naar klein) worden gesorteerd. Als er een oneven aantal waarden is, is de mediaan simpelweg de middelste waarde. Bij een even aantal waarden is de mediaan het gemiddelde van de twee middelste waarden.
-
Voorbeeld (zelfde dataset): De geordende dataset is: 25, 28, 30, 32, 35. De mediaan is 30.
-
Voorbeeld (even aantal waarden): Dataset: 25, 28, 30, 32. De geordende dataset blijft: 25, 28, 30, 32. De mediaan is (28 + 30) / 2 = 29.
Het verschil in actie: de invloed van uitschieters
Het grootste verschil tussen gemiddelde en mediaan komt naar voren bij datasets met uitschieters. Uitschieters zijn extreme waarden die significant afwijken van de andere waarden in de dataset. Het gemiddelde is zeer gevoelig voor deze uitschieters; één extreme waarde kan het gemiddelde aanzienlijk verstoren en een vertekend beeld geven van het 'typische' waarde. De mediaan daarentegen is veel robuuster. Uitschieters hebben weinig tot geen invloed op de mediaan, omdat deze enkel afhankelijk is van de positie van de waarden in de geordende dataset, niet van hun absolute waarde.
- Voorbeeld: Neem de dataset: 25, 28, 30, 32, 35, 100. Het gemiddelde is nu (25 + 28 + 30 + 32 + 35 + 100) / 6 = 40. De uitschieter (100) verhoogt het gemiddelde aanzienlijk. De mediaan blijft echter 31 ((30+32)/2).
Conclusie:
De keuze tussen gemiddelde en mediaan hangt af van de context. Het gemiddelde is geschikt voor datasets zonder uitschieters en waar de gemiddelde waarde relevant is. De mediaan is de betere keuze bij datasets met uitschieters of wanneer een robuuste maat voor de centrale tendens gewenst is. In sommige gevallen is het zelfs nuttig om beide maten te berekenen en te vergelijken om een completer beeld van de data te verkrijgen.
- Hoeveel borg betaal je bij een Avis?
- Is een Apple laptop goed voor school?
- Wie bepaalt de prijs van medicijnen?
- Hoe begin je een samenwerking?
- Is een architect een bouwkundige?
- Wat is beter, 128 GB of 256 GB?
- Is het gezond om een blikje mais te eten
- Kan je een banaan eten als ontbijt?
- Kan je ziek worden van zachtgekookt ei?
- Wat verdient een ZZP interieurstylist?
Reageer op het antwoord:
Bedankt voor je feedback! Je reactie helpt ons enorm om de antwoorden in de toekomst te verbeteren.