Skip to content

Glossary

Modalwert (Mode)

Der häufigste Wert

By Published Updated

Der Modalwert ist der häufigste Wert in einem Datensatz. Für [1, 2, 2, 3, 4, 4, 4, 5] ist der Modalwert 4 (kommt dreimal vor; nichts anderes tut das). Er ist das einzige Maß der zentralen Tendenz, das für nicht-numerische Daten funktioniert – der Modalwert von [„rot“, „blau“, „rot“, „grün“, „rot“] ist „rot“.

Drei Sonderfälle:

  • Unimodal – genau ein häufigster Wert. Der Standardfall.
  • Bimodal – zwei Werte teilen sich den Rang des häufigsten. Deutet auf eine Verteilung gemischter Populationen hin (z. B. ergeben die kombinierten Körpergrößen erwachsener Männer + Frauen eine bimodale Verteilung).
  • Kein Modalwert – jeder Wert kommt genau einmal vor. Der Modalwert ist technisch undefiniert; manche Konventionen berichten „kein Modalwert“, andere berichten jeden Wert als Modalwert.

Verwenden Sie den Modalwert, wenn: die Daten kategorial sind (Farben, Marken, Typen) oder Sie sich speziell für den häufigsten Wert interessieren, nicht für die zentrale Tendenz. Bei numerischen Daten ohne sich wiederholende Werte (Körpergrößen, Gehälter) ist der Modalwert nutzlos – verwenden Sie Mittelwert oder Median.

Unser Statistikrechner berichtet den Modalwert neben Mittelwert und Median und behandelt den bimodalen Fall, indem er alle häufigsten Werte auflistet.

Warum bimodale Verteilungen eine Diagnose sind, nicht nur eine Kuriosität: Wenn ein Histogramm kontinuierlicher Daten zwei deutliche Spitzen zeigt, bedeutet das fast immer, dass der Datensatz eine Mischung aus zwei zugrunde liegenden Populationen ist. Das klassische Beispiel sind die Körpergrößen erwachsener Menschen – das Zusammenfassen von Männern und Frauen erzeugt eine bimodale Kurve; eine Aufteilung nach Geschlecht erzeugt zwei saubere unimodale Kurven. Bimodalität in Kundenausgaben-Verteilungen bedeutet meist eine vermischte Free-Tier- und Paid-Tier-Population. Bimodalität in Antwortzeit-Verteilungen bedeutet oft, dass ein schneller Pfad und ein langsamer Pfad (Cache-Treffer vs. Cache-Fehlschlag) getrennt behandelt werden müssen. Den Gesamtmittelwert über eine bimodale Verteilung zu berichten ist selten nützlich – passen Sie zuerst ein Mischmodell an oder trennen Sie die Segmente.

Modalwert für kontinuierliche Daten – Kerndichteschätzung: In einem kontinuierlichen Datensatz, in dem die exakte Wiederholung von Werten selten ist, wird der „Modalwert“ üblicherweise als die Spitze der Kerndichteschätzung (KDE) definiert statt als der häufigste Rohwert. Statistikpakete (Rs density(), Pythons scipy gaussian_kde) berechnen KDEs hierfür standardmäßig. Der Bandbreitenparameter – wie breit sich der Beitrag jedes Datenpunkts zur Dichte verteilt – ist der Haupthebel, und Silvermans Faustregel funktioniert gut für unimodale Daten. Für bimodale Daten wählen Sie die Bandbreite klein genug, dass die beiden Spitzen aufgelöst bleiben. Verwandt: Mittelwert, Median. Quelle: NIST/SEMATECH e-Handbook — Measures of Central Tendency.

Durchgerechnetes Beispiel

Ein Bekleidungshändler erfasst die über 200 Transaktionen verkauften Größen: {XS: 12, S: 38, M: 64, L: 51, XL: 28, XXL: 7}. Modalwert = M (64 Vorkommen). Der Modalwert ist die einzige Kennzahl, die diese Spalte sinnvoll zusammenfasst – „mittlere Größe“ oder „Mediangröße“ erfordern eine Kodierung von XS–XXL als Zahlen, und jede gewählte Kodierung ist willkürlich. Stellen Sie sich nun vor, derselbe Händler fügt eine Kinderlinie hinzu und fasst die Daten zusammen: Das neue Größen-Histogramm ist {2T: 30, 4T: 28, 6: 22, S: 38, M: 64, L: 51, XL: 28}. Die Verteilung ist bimodal (Spitze bei 2T–6 für Kinder, Spitze bei M–L für Erwachsene), und die „häufigste verkaufte Größe“ (M) führt jede Entscheidung über das Inventar der Kinderlinie aktiv in die Irre. Eine Segmentierung vor der Berechnung des Modalwerts – einmal für Kinder, einmal für Erwachsene – stellt das richtige Inventarsignal wieder her: 2T ist die modale Kindergröße, M ist die modale Erwachsenengröße.

Wann und warum es zählt

Modalwerte treiben operative Entscheidungen im Einzelhandel (welche Größe/Farbe/SKU am stärksten zu bevorraten ist), bei Wahlen (der modale Kandidat gewinnt ein Mehrheitswahlsystem, auch ohne absolute Mehrheit), in Empfehlungssystemen (meistgesehenes Element pro Kategorie) und in der Sprachanalyse (das modale Wort/N-Gramm in einem Korpus verrät das Thema). Die Falle ist die Annahme, dass ein einzelner Modalwert existiert, wenn die zugrunde liegende Population gemischt ist. Umfrageforscher, A/B-Tester und Produktanalysten stoßen ständig darauf: Jeder Datensatz, der Nutzer über Segmente hinweg zusammenfasst (Geografie, Tarifstufe, Gerätetyp), zeigt oft eine Bimodalität, die verschwindet, sobald man facettiert. Die defensive Gewohnheit: Plotten Sie immer das Histogramm, bevor Sie irgendeine einzelne „zentrale Tendenz“-Zahl berichten. Quelle: NIST/SEMATECH e-Handbook — Histogram Interpretation: Bimodal.

Frequently asked questions

Was ist der Modalwert?
Der Modalwert ist der Wert, der in einem Datensatz am häufigsten vorkommt. Für [1, 2, 2, 3, 4] ist der Modalwert 2. Ein Datensatz kann unimodal (ein Modalwert), bimodal (zwei Modalwerte) oder multimodal (mehrere Spitzen) sein.
Wann ist der Modalwert nützlich?
Der Modalwert ist am nützlichsten für kategoriale Daten – die häufigste verkaufte Schuhgröße, die beliebteste Support-Ticket-Kategorie, die häufigste bestellte Farbe. Er ist der einzige Durchschnitt, der auf nominale (nicht-numerische) Daten anwendbar ist.
Was ist der Unterschied zwischen Modalwert, Mittelwert und Median?
Der Mittelwert ist das arithmetische Mittel, empfindlich gegenüber Ausreißern. Der Median ist der mittlere Wert, robust gegenüber Ausreißern. Der Modalwert ist der häufigste Wert, nützlich für diskrete oder kategoriale Daten. Bei einer symmetrischen Verteilung wie einer Glockenkurve sind alle drei gleich.
Was bedeutet es, dass eine Verteilung bimodal ist?
Eine bimodale Verteilung hat zwei deutliche Spitzen in ihrem Häufigkeitsdiagramm, was bedeutet, dass zwei Werte (oder Bereiche) besonders häufig sind. Sie deutet oft auf zwei Teilgruppen in den Daten hin – zum Beispiel ein Größendatensatz, der erwachsene Männer und Frauen mischt.

Related

Published May 16, 2026 · Last reviewed May 31, 2026