Glossary
Perzentil
Eine Statistik der relativen Rangordnung
By Buğra SözeriPublished Updated
Ein Perzentil ist der Wert, unter den ein bestimmter Prozentsatz der Beobachtungen in einem Datensatz fällt. Das 90. Perzentil ist der Wert, der 90 % der Daten übertrifft; der Median ist das 50. Perzentil.
Perzentile sind nützlich, wenn die Verteilung nicht normalverteilt ist – also meistens. Mittelwert und Standardabweichung beschreiben eine Normalverteilung gut; Perzentile beschreiben jede Verteilung, indem sie angeben, wo ihre Masse sitzt. Einkommensverteilung, Latenzmessungen und Testergebnisse werden aus diesem Grund häufig über Perzentile berichtet.
Ein Perzentil zu berechnen ist im Konzept einfach, in der Praxis fummelig. Der naive Ansatz „der Wert am Rang p × n in den sortierten Daten“ funktioniert, wenn p × n eine ganze Zahl ist; andernfalls muss interpoliert werden. Die häufigste Methode ist die lineare Interpolation zwischen den zwei nächstgelegenen Rängen, die der Standard in NumPy (linear) und der NIST-Referenz ist. R unterstützt neun verschiedene Perzentilalgorithmen über den type-Parameter – sie weichen typischerweise um weniger als einen halben Perzentilpunkt voneinander ab.
Quartile sind das 25., 50. und 75. Perzentil (Q1, Q2 = Median, Q3). Der Interquartilsabstand (IQR) = Q3 − Q1 ist ein robustes Streuungsmaß – robust, weil es die äußeren 25 % der Daten an jedem Ende ignoriert, wo Ausreißer ihren Schaden anrichten.
Nutzen Sie unseren Statistik-Rechner für jedes Perzentil gegen einen eingefügten Datensatz.
Perzentil vs. Perzentilrang – die leichte Verwechslung: ein Perzentil ist ein Wert aus dem Datensatz (das 90. Perzentil der Testergebnisse ist „das Ergebnis, unter das 90 % der Schüler fallen“, z. B. 87). Ein Perzentilrangist die Umkehrung – gegeben ein Wert, welcher Anteil der Daten darunter liegt (Alice erreichte 87 → ihr Perzentilrang ist 90). Standardisierte Testberichte (SAT, GMAT, GRE) berichten fast immer den Perzentilrang statt das rohe Perzentil des Ergebnisses, was für die Testperson die nützlichere Zahl ist. Die beiden hängen zusammen, doch die Unterscheidung zählt beim Lesen veröffentlichter Verteilungen.
Warum p99 und p99,9 zu Service-Level-Standards wurden: bei Webdiensten erfassen das 99. und 99,9. Perzentil der Latenz die Erfahrung von Nutzern, die die langsamsten Pfade treffen. Ein Dienst mit durchschnittlich 100 ms, aber einem p99 von 5 s, fühlt sich für das 1 % der Anfragen, die das Tail-Ende treffen, kaputt an. SLOs (Service Level Objectives) werden typischerweise als „99 % der Anfragen unter 200 ms über ein 28-Tage-Fenster“ ausgedrückt – die Google-SRE-Konvention – weil Nutzer Tail-Latenz stärker bemerken als die durchschnittliche Latenz. Referenz: NIST/SEMATECH e-Handbook — Percentile.
Durchgerechnetes Beispiel
Berechnen Sie das 90. Perzentil von 20 Antwortzeiten (ms): [12, 15, 18, 19, 22, 24, 25, 28, 30, 33, 36, 40, 44, 48, 55, 62, 75, 90, 140, 410] (bereits sortiert). Mit der NumPy-Methode linear: die Position ist (n−1) × p = 19 × 0,9 = 17,1. Interpolieren Sie zwischen dem 18. und 19. Wert (nullindexiert: Indizes 17 und 18 = 90 und 140): 90 + 0,1 × (140 − 90) = 95 ms. Also p90 = 95 ms. Das arithmetische Mittel derselben Daten ist 64,8 ms – nach oben gezogen durch den 410-ms-Ausreißer – und der Median (p50) ist 34,5 ms. Diese drei zusammen zu berichten (p50 = 34,5, p90 = 95, Max = 410) erzählt eine schlüssige Latenzgeschichte; nur den Mittelwert zu berichten würde das lange Tail-Ende vollständig verdecken.
Wann und warum es zählt
Perzentilbasierte SLOs sind die operative Sprache der modernen SRE, weil mittelwertbasierte SLOs über die Nutzererfahrung täuschen. Ein Dienst mit Mittelwert 100 ms und p99 von 200 ms ist ein anderes Produkt als ein Dienst mit Mittelwert 100 ms und p99 von 5 Sekunden, doch beide berichten denselben Durchschnitt. Ein als „p99 < 300 ms über 28 Tage“ geschriebenes Latenzbudget sagt Ihnen, worauf Sie alarmieren und was Sie optimieren sollten. Außerhalb der SRE: standardisierte Tests (das „75. Perzentil für die Körpergröße“ eines Kindes auf einer pädiatrischen Wachstumskurve), Wirtschaftspolitik (der Einkommensanteil des obersten 1 % ist eine Perzentilaussage) und ML-Evaluation (Fehlerraten je Perzentil legen Worst-Case-Fairness-Probleme offen, die für den Mittelwert unsichtbar sind). Die defensive Gewohnheit beim Konsum jeder „Durchschnitts“-Zahl ist, nach der Verteilung oder mindestens nach p50/p90/p99 zu fragen. Referenz: Google SRE Book — Service Level Objectives.
Frequently asked questions
- Was ist ein Perzentil?
- Ein Perzentil ist ein Wert, unter den ein bestimmter Prozentsatz der Beobachtungen in einem Datensatz fällt. Das 90. Perzentil eines Datensatzes bedeutet, dass 90 % der Werte unter diesem Punkt liegen.
- Wie werden Perzentile in der Praxis verwendet?
- Pädiatrische Wachstumskurven drücken Größe und Gewicht als Perzentile aus, sodass Eltern sehen können, wie ein Kind im Vergleich zu einer Referenzpopulation abschneidet. Die Serverleistung wird typischerweise als Latenz des 95. oder 99. Perzentils berichtet, um Worst-Case-Verhalten zu erfassen, das Mittelwerte verbergen.
- Was ist der Unterschied zwischen einem Perzentil und einem Prozentsatz?
- Ein Prozentsatz ist ein auf 100 bezogenes Verhältnis (z. B. ein Ergebnis von 80 %). Ein Perzentil ist eine Rangposition innerhalb einer Verteilung: im 80. Perzentil zu liegen bedeutet, dass man 80 % der Gruppe übertroffen hat – unabhängig vom absoluten Ergebnis.
Related
Published May 14, 2026 · Last reviewed May 31, 2026