Guide
Mittelwert, Median, Modus: wann welcher der richtige Durchschnitt ist
Derselbe Datensatz, drei 'Durchschnitte'. Den richtigen zu wählen ist der Unterschied zwischen Informieren und Irreführen.
By Buğra SözeriPublished Updated
„Durchschnitt“ meint im Alltagsgebrauch meist das arithmetische Mittel. In der Statistik ist es ein unschärferes Wort, das mindestens drei verschiedene Maße umfasst: Mittelwert, Median und Modus. Jedes misst „den typischen Wert“ in einem Datensatz, doch sie beantworten unterschiedliche Fragen und weichen bei schiefen Daten dramatisch voneinander ab. Dieser Ratgeber erklärt, wann welches das richtige Werkzeug ist.
Die drei Definitionen, schnell
- Mittelwert – Summe aller Werte geteilt durch die Anzahl. Die Voreinstellung. Gleiche Einheit wie die Daten.
- Median – der mittlere Wert des sortierten Datensatzes. Die Hälfte darüber, die Hälfte darunter.
- Modus – der am häufigsten vorkommende Wert. Der einzige, der mit nicht-numerischen Daten funktioniert.
Die klassische Divergenz: Einkommen
US-Haushaltseinkommen, 2023 (American Community Survey):
- Mittelwert: 111.000 $
- Median: 80.610 $
- Modus: rund 40.000–50.000 $ (die zahlenstärkste Spanne)
Drei Zahlen, die alle die Frage „Was verdient ein typischer US-Haushalt?“ beantworten – und sich um bis zu einen Faktor drei unterscheiden. Der Mittelwert wird von den Verdienern der obersten 1 % nach oben gezogen; der Median liegt in der tatsächlichen Mitte der Verteilung; der Modus spiegelt wider, wo die größte Spanne liegt.
Für politische Debatten und Schlagzeilen ist der Median fast immer die richtige Zahl – er ist robust gegen Ausreißer und repräsentiert einen tatsächlich erreichbaren Haushalt. Der Mittelwert führt in die Irre, außer bei arithmetischer Budgetierung (erhobene Steuer = Haushalte × Durchschnittseinkommen).
Wann welcher zu verwenden ist
Verwenden Sie den MITTELWERT, wenn
- Die Verteilung annähernd symmetrisch ist. Körpergrößen, IQ-Werte, Messfehler. Mittelwert und Median stimmen eng überein; der Mittelwert ist unbedenklich anzugeben.
- Sie Summen aus Durchschnitten berechnen müssen. Der Mittelwert (× Anzahl) ergibt die Summe exakt. Der Median nicht. Für Budgetierung, Buchhaltung und Integrale ist der Mittelwert zwingend.
- Sie ihn in weitere Statistiken einspeisen. Varianz, Standardabweichung und Konfidenzintervalle bauen alle auf dem Mittelwert auf. Wählen Sie den Median, verlieren Sie das nachgelagerte Instrumentarium.
Verwenden Sie den MEDIAN, wenn
- Die Verteilung schief ist. Einkommen, Immobilienpreise, Antwortzeiten, Dateigrößen, Krankenhausaufenthalte, Projektkosten. Der Median ist das, was echte Menschen erleben; der Mittelwert ist das, was ein Milliardär / ein Marathon-Ausreißer aufbläht.
- Ausreißer wahrscheinlich und unkontrolliert sind. Sensordaten mit gelegentlichen Störungen, manuell eingegebene Zahlen mit Tippfehlern, Web-Analytics mit Bot-Traffic. Der Median filtert sie automatisch heraus.
- Sie die „typische Erfahrung“ möchten. Mediane Wartezeit beim Amt, mediane Pendelzeit, mediane Antwortzeit Ihres Kundenservices. Das sind Fragen zu typischen Einzelpersonen, nicht zum aggregierten Durchsatz.
Verwenden Sie den MODUS, wenn
- Die Daten kategorial sind. Lieblingsfarbe, verwendeter Browser, Herkunftsland. Mittelwert und Median sind hier undefiniert; der Modus ist die einzige Zusammenfassung.
- Sie den häufigsten Fall möchten. Beliebtestes Produkt, häufigster Fehlertyp, meistversandte Paketgröße. Der Modus ist das einzige Maß, das dies direkt beantwortet.
- Sie eine bimodale Verteilung vermuten. Kombinierte Körpergrößen von Männern und Frauen, Heiß-Kalt-Wetterdaten, Spitzen-/Schwachlast-Netzwerkverkehr. Zwei Modi anzugeben erfasst die Struktur, die ein Mittelwert verbergen würde.
Die Falle der schiefen Verteilung
Nachrichtenartikel berichten routinemäßig vom mittleren Einkommen, mittleren Immobilienpreis, mittleren Antwortzeit. Alle drei sind rechtsschiefe Verteilungen; in allen dreien liegt der Mittelwert durchgängig höher als der Median; den Mittelwert anzugeben überzeichnet systematisch das „Typische“.
Schnelltest: Hat der Datensatz eine harte Untergrenze (null) und keine harte Obergrenze, ist er wahrscheinlich rechtsschief. Verwenden Sie den Median.
Beispiele nach Typ:
| Datensatz | Form | Verwenden |
|---|---|---|
| Körpergröße Erwachsener | Annähernd normal | Mittelwert ok |
| Einkommen | Rechtsschief | Median |
| Vermögen | Stark rechtsschief | Median (Mittelwert führt drastisch in die Irre) |
| API-Antwortzeit | Rechtsschief | Median + Perzentile |
| Krankenhausaufenthaltsdauer | Rechtsschief | Median |
| Dateigrößen in einem Ordner | Rechtsschief | Median |
| Testergebnisse (gut konzipierter Test) | Annähernd normal | Mittelwert ok |
| Tagestemperatur | Annähernd normal | Mittelwert ok |
Wie man die Täuschung erkennt
Drei Sätze, auf die man bei Behauptungen mit „Durchschnitt“ achten sollte:
- „Der durchschnittliche Amerikaner verdient X $.“ Wenn X > 90.000 $, ist es der Mittelwert. Der Median liegt bei rund 80.000 $. Der Mittelwert ist technisch korrekt, beantwortet aber eine andere Frage.
- „Durchschnittliche Antwortzeit: 200 ms.“ Bei einer API ist das fast sicher der Mittelwert, den eine Handvoll langsamer Anfragen aufgebläht hat. Der Median liegt wahrscheinlich bei 50–100 ms; das p99 könnte 2000 ms betragen. Der Mittelwert allein sagt wenig.
- „Beliebtestes X ist …“ Das ist der Modus. Korrekt verwendet ist er unbedenklich; anstelle von Mittelwert oder Median verwendet, führt er in die Irre.
Wann alle drei anzugeben sind
Eine ehrliche Datenpräsentation zeigt meist Mittelwert, Median und ein Streuungsmaß (Standardabweichung oder Interquartilsabstand). Der Unterschied zwischen Mittelwert und Median verrät dem Leser sofort, wie schief die Verteilung ist. Ein Mittelwert von 111.000 $ und ein Median von 81.000 $ sagen mehr als jede Zahl für sich – nämlich, dass die Verteilung einen langen rechten Ausläufer hat.
Berechnen Sie alle drei (plus Perzentile, Standardabweichung und ein Histogramm) in einem Durchgang mit unserem Statistik-Rechner. Für den Hintergrund des praktizierenden Statistikers zu Varianz und Standardabweichung siehe Standardabweichung erklärt.
Durchgang: Antwortzeit-Monitoring
Sechs API-Anfragen heute Morgen, gemessen in Millisekunden: [42, 51, 48, 55, 47, 2.800]. Die letzte ist ein Cold-Start-Ausreißer. Drei Zusammenfassungen:
- Mittelwert: (42+51+48+55+47+2800)/6 = 507 ms.
- Median: sortiert zu [42, 47, 48, 51, 55, 2800], Durchschnitt der beiden mittleren Werte = 49,5 ms.
- Modus: alle Werte kommen einmal vor, der Modus ist für diese Stichprobe also undefiniert.
Nur den Mittelwert anzugeben („durchschnittliche Antwortzeit: 507 ms“) würde einen Stakeholder davon überzeugen, die API sei kaputt. Nur den Median anzugeben („typische Antwort: 49,5 ms“) verbirgt das Cold-Start-Problem. Die ehrliche Zusammenfassung sind beide Zahlen plus das p99: „Median 50 ms, p99 ~2,8 s – schnell im Normalfall, gelegentliche Cold-Start-Ausschläge.“ Das ist umsetzbar; keine Zahl allein ist es.
Häufige Fehler
- Den „Durchschnitt der Durchschnitte“ berechnen. Der Mittelwert der Mittelwerte dreier Gruppen ist nicht der Mittelwert der zusammengefassten Daten, es sei denn, die Gruppen sind gleich groß. Berechnen Sie stets aus den Rohdaten neu, oder verwenden Sie einen gewichteten Mittelwert mit den Gruppengrößen als Gewichten.
- Den Median ohne Streuungsmaß angeben. Zwei Datensätze mit identischen Medianen können völlig unterschiedliche Formen haben. Ergänzen Sie den Interquartilsabstand (Q3 − Q1) oder eine Quartilszusammenfassung; eine Fünf-Zahlen-Übersicht (Min, Q1, Median, Q3, Max) ist eine günstige, ehrliche Einzeile.
- Eine bimodale Verteilung „den Durchschnitt“ nennen. Eine kombinierte Körpergrößenverteilung von Männern und Frauen hat zwei Spitzen bei ~168 cm und ~178 cm. Der Mittelwert (~173 cm) beschreibt niemanden. Disaggregieren Sie nach Gruppe und berichten Sie jede Teilpopulation getrennt.
- Den Modus für kontinuierliche Daten verwenden. Bei wirklich kontinuierlichen Messungen (Körpergrößen, Gewichte, Antwortzeiten) ist technisch jeder Wert eindeutig; der Modus ist entweder undefiniert oder ein Artefakt der Messgranularität. Verwenden Sie stattdessen ein Histogramm und bestimmen Sie das dichteste Intervall.
- Mittelwerte über gekappte Stichproben vergleichen. Mittelwerte reagieren extrem empfindlich darauf, ob Ausreißer eingeschlossen sind. Berichten zwei Studien unterschiedliche Mittelwerte und eine schloss Ausreißer über dem 99. Perzentil aus, kann der Unterschied vollständig artefaktisch sein.
Für die verwandte Streuungsfrage (wie stark die Daten um die Mitte streuen) geht es weiter mit unserem Leitfaden zur Standardabweichung. Für die Prozentänderungs-Einordnung, die oft auf zusammenfassende Statistiken folgt, siehe Prozent vs. Prozentpunkt.
Quellen: US Census Bureau American Community Survey 2023; NIST/SEMATECH e-Handbook of Statistical Methods §1.3.5.3 (Measures of Location); Tukey, Exploratory Data Analysis (1977); OECD Income Distribution Database (Ausgabe 2024).
Frequently asked questions
- Was ist der Unterschied zwischen Mittelwert, Median und Modus?
- Der Mittelwert ist die Summe geteilt durch die Anzahl. Der Median ist der mittlere Wert bei sortierten Daten – die Hälfte der Werte liegt darüber, die Hälfte darunter. Der Modus ist der am häufigsten vorkommende Wert. Alle drei sind 'Durchschnitte', weichen bei schiefen Daten aber erheblich voneinander ab.
- Warum verwendet der US-Zensus das Median-Haushaltseinkommen statt des Mittelwerts?
- Einkommen ist rechtsschief – wenige Spitzenverdiener ziehen den Mittelwert weit über das, was die meisten Haushalte tatsächlich verdienen. 2023 lag das durchschnittliche US-Haushaltseinkommen bei rund 111.000 $, während der Median 80.610 $ betrug. Der Median bildet die Erfahrung des typischen Haushalts besser ab.
- Wann sollte ich den Median statt des Mittelwerts verwenden?
- Verwenden Sie den Median, wenn die Daten eine harte Untergrenze bei null und keine Obergrenze haben (Einkommen, Immobilienpreise, Antwortzeiten, Dateigrößen), unkontrollierte Ausreißer enthalten oder wenn Sie die typische individuelle Erfahrung abbilden möchten. Weichen Mittelwert und Median deutlich voneinander ab, sind die Daten schief und der Median ist meist aussagekräftiger.
- Wann ist der Modus nützlicher als Mittelwert oder Median?
- Der Modus ist das einzige Lagemaß, das mit kategorialen (nicht-numerischen) Daten funktioniert – Lieblingsfarbe, Browsertyp, Herkunftsland. Er ist auch die richtige Wahl, wenn die Frage lautet 'Was ist der häufigste Wert' – beliebteste Produktgröße, häufigster Fehlercode.
- Kann ein Datensatz mehr als einen Modus haben?
- Ja. Eine bimodale Verteilung hat zwei Modi – etwa die kombinierten Körpergrößendaten von Männern und Frauen mit Spitzen bei rund 168 cm und 178 cm. Ein einzelner Mittelwert von ~173 cm beschreibt niemanden im Datensatz; zwei Modi anzugeben offenbart die Struktur.
Sources & references
Authoritative references cited by this piece. Verified by Buğra Sözeri on the dates shown and re-checked at every deploy.
- NIST/SEMATECH e-Handbook of Statistical Methods — Measures of Location — Maßgebliche US-Referenz für die Lagemaße und wann jedes anzuwenden ist(as of )
- US Census Bureau — Methodik zum Median-Haushaltseinkommen — Referenz für das kanonische Beispiel Median-vs-Mittelwert bei schiefen Einkommensdaten(as of )
- American Statistical Association — Guidelines for Assessment and Instruction in Statistics Education — Didaktische Referenz für die Wann-welches-Einordnung dieses Artikels(as of )
- OECD Income Distribution Database — Länderübergreifende Quelle für Median-vs-Mittelwert-Einkommensvergleiche zur Veranschaulichung der Schiefe(as of )
- BLS — Quartile und ausgewählte Dezile der üblichen Wochenverdienste — Perzentildaten des US Bureau of Labor Statistics für die Diskussion Streuung vs. Mitte(as of )
Related
Published May 16, 2026 · Last reviewed May 31, 2026