Skip to content

Glossary

Median

Die Mitte eines sortierten Datensatzes

By Published Updated

Der Median ist der mittlere Wert eines sortierten Datensatzes. Für [3, 4, 5, 6, 7, 8] (sechs Werte) ist der Median 5,5 (das Mittel der beiden mittleren Werte). Für [3, 4, 5, 6, 7] (fünf Werte) ist der Median 5. Die Hälfte der Daten liegt darunter, die Hälfte darüber.

Der Median ist bekanntlich robust: Ein einzelner Extrem-Ausreißer kann ihn nicht ziehen. Der Median von [1, 2, 3, 4, 5] ist 3. Der Median von [1, 2, 3, 4, 1000] ist immer noch 3. Das macht den Median zur richtigen Zusammenfassung für schiefe Verteilungen – Einkommen, Hauspreise, Antwortzeiten, Dateigrößen – bei denen ein oder zwei Extremwerte das arithmetische Mittel dominieren würden.

Er entspricht dem 50. Perzentil. Ihn direkt zu berechnen (sortieren, die Mitte nehmen) ist O(n log n); für sehr große Datensätze findet ein Quickselect-Algorithmus den Median in erwartet O(n).

Nutzen Sie den Statistikrechner für Median, Mittelwert, Modalwert und Quartile in einem Durchgang.

Warum „Median-Haushaltseinkommen“ die Zahl ist, die Ökonomen tatsächlich nennen: Das US Census Bureau berichtet das Median-Haushaltseinkommen, weil es die ehrliche Ein-Zahl-Zusammenfassung einer stark rechtsschiefen Verteilung ist. Laut der ACS 2023 lag das US-Median-Haushaltseinkommen bei rund 80.000 $, während der Mittelwert bei rund 112.000 $ lag – die Lücke ist der Einfluss des oberen Endes der Verteilung auf das arithmetische Mittel. Dieselbe Lücke zeigt sich bei Hauspreisen (die NAR berichtet Mediane, keine Mittelwerte), Gehaltsumfragen und der Antwortzeitüberwachung in Software (jedes Observability-Dashboard nennt p50 = Median, nicht die durchschnittliche Latenz). Wenn eine Zahl bei schiefen Daten ohne Zusatz „durchschnittlich“ ist, fragen Sie, welcher Durchschnitt – der Unterschied zwischen beiden ist oft die eigentliche Geschichte.

Der Median ist ein robuster Lageschätzer – aber mit einem Preis: Der Median hat einen Bruchpunkt von 50 % (man müsste mehr als die Hälfte der Daten verfälschen, um den Median beliebig weit zu verschieben), während der Mittelwert einen Bruchpunkt von 0 % hat (eine einzige Unendlichkeit verschiebt den Mittelwert ins Unendliche). Der Kompromiss ist die statistische Effizienz: Unter einer sauberen Normalverteilung ist das Konfidenzintervall des Medians bei gleicher Stichprobengröße etwa 25 % breiter als das des Mittelwerts. Für saubere, symmetrische Daten ist der Mittelwert also aussagekräftiger; für unordentliche Daten aus der realen Welt ist der Median sicherer. Getrimmte Mittelwerte (die oberen und unteren 5 % weglassen) und der Hodges-Lehmann-Schätzer liegen auf dem Spektrum zwischen beiden. Verwandt: Mittelwert, Perzentil, IQR.

Durchgerechnetes Beispiel

Elf Hausverkaufspreise in einem Vorort (in Tausend Dollar): [280, 295, 310, 320, 340, 355, 360, 380, 410, 450, 2400]. Sortieren Sie die Liste (bereits sortiert). Mit n = 11 ist der Median der 6. Wert: 355.000 $. Der Mittelwert ist Summe/11 = 5900/11 ≈ 536.000 $. Die einzelne 2,4-Mio.-Dollar-Villa am Wasser hat den Mittelwert ~180.000 $ über jedes der zehn realistischen Vergleichsobjekte gehoben – ein Käufer, der den „Durchschnittspreis“ zur Einschätzung der Gegend heranzieht, würde um 50 % überschätzen. Der Median ignoriert diesen Ausreißer vollständig. Fügen Sie einen 12. Verkauf zu 370.000 $ hinzu: Jetzt ist n = 12, der Median ist das Mittel des 6. und 7. Werts, (355 + 360)/2 = 357.500 $. Die Technik verallgemeinert sich: Jede einzelne Extrembeobachtung in einer großen Stichprobe verschiebt den Median um höchstens eine Position in der sortierten Liste.

Wann und warum es zählt

Der Median ist die richtige Kennzahl, wann immer die Verteilung einen langen Schwanz hat und Sie eine Zahl wollen, die „den typischen Fall“ repräsentiert. Das deckt die meisten operativen Kennzahlen ab, die Menschen interessieren – Haushaltseinkommen, Hauspreise, Bearbeitungszeit von Support-Tickets, Ladezeiten von Seiten, Dateigrößen in einem Repository, Wörter pro Satz in einem Dokumentenkorpus. Bei der Überwachung von Software-Latenz ist es Standardpraxis, p50 (Median) und p99 zusammen im Dashboard zu zeigen: Der Median sagt Ihnen, ob der typische Nutzer zufrieden ist; p99 sagt Ihnen, ob das Ende der Verteilung akzeptabel ist. Nur einen Durchschnitt zu berichten kann eine bimodale Verteilung verschleiern (zwei Cluster von Nutzern mit sehr unterschiedlichen Erfahrungen), die der Median plus einige Perzentile sofort sichtbar machen. Quelle: US Census Bureau — Income in the United States: 2023.

Frequently asked questions

Was ist der Median?
Der Median ist der mittlere Wert eines Datensatzes, wenn dieser der Reihe nach sortiert ist. Bei einer ungeraden Anzahl von Werten ist es der zentrale Wert; bei einer geraden Anzahl ist es der Durchschnitt der beiden mittleren Werte.
Wann sollte ich den Median statt des Mittelwerts verwenden?
Verwenden Sie den Median für schiefe Verteilungen oder Daten mit Ausreißern – Einkommen, Hauspreise, Antwortzeiten. Ein einzelner Extremwert kann den Median nicht um mehr als einen Rang verschieben, während er den Mittelwert dramatisch bewegen kann.
Was ist der Unterschied zwischen Median und Perzentil?
Der Median ist das 50. Perzentil – der Punkt, an dem die Hälfte der Daten darunter und die Hälfte darüber liegt. Jedes Perzentil teilt die Daten ähnlich: Das 90. Perzentil ist der Wert, unter dem 90 % der Beobachtungen liegen.
Wie finde ich den Median eines Datensatzes mit gerader Anzahl?
Sortieren Sie die Werte, nehmen Sie die beiden mittleren Elemente und bilden Sie deren Durchschnitt. Für [3, 7, 10, 14] sind die beiden mittleren Werte 7 und 10, der Median ist also (7+10)/2 = 8,5.

Related

Published May 16, 2026 · Last reviewed May 31, 2026