Glossary
Percentil
Una estadística de clasificación relativa
By Buğra SözeriPublished Updated
Un percentil es el valor por debajo del cual cae un porcentaje dado de observaciones en un conjunto de datos. El percentil 90 es el valor que supera al 90% de los datos; la mediana es el percentil 50.
Los percentiles son útiles cuando la distribución no es normal — que es la mayoría de las veces. La media y la desviación estándar describen bien una distribución normal; los percentiles describen cualquier distribución informando dónde se concentra su masa. La distribución de ingresos, las mediciones de latencia y las puntuaciones de exámenes se reportan habitualmente mediante percentiles por esta razón.
Calcular un percentil es sencillo en concepto, pero complicado en la práctica. El enfoque ingenuo de “el valor en el rango p × n en los datos ordenados” funciona cuando p × n es un entero; en caso contrario hay que interpolar. El método más común es la interpolación lineal entre los dos rangos más cercanos, que es el predeterminado en NumPy (linear) y la referencia NIST. R admite nueve algoritmos de percentil diferentes a través del parámetro type — típicamente discrepan en menos de medio punto percentil.
Los cuartiles son los percentiles 25, 50 y 75 (Q1, Q2 = mediana, Q3). El rango intercuartílico (IQR) = Q3 − Q1 es una medida robusta de dispersión — robusta porque ignora el 25% exterior de los datos en cada extremo, donde los valores atípicos hacen su daño.
Usa nuestra calculadora de estadísticas para cualquier percentil sobre un conjunto de datos pegado.
Percentil vs rango percentil — la confusión fácil: un percentiles un valor del conjunto de datos (el percentil 90 de las puntuaciones de un examen es “la puntuación por debajo de la que caen el 90% de los estudiantes”, por ejemplo, 87). Un rango percentiles el inverso — dado un valor, qué fracción de los datos se sitúa por debajo de él (Alicia obtuvo 87 → su rango percentil es 90). Los informes de exámenes estandarizados (SAT, GMAT, GRE) casi siempre reportan el rango percentil en lugar del percentil bruto de la puntuación, que es el número más útil para el examinando. Los dos están relacionados pero la distinción importa al leer distribuciones publicadas.
Por qué p99 y p99,9 se convirtieron en estándares de nivel de servicio: para los servicios web, el percentil 99 y 99,9 de la latencia capturan la experiencia de los usuarios que dan con los caminos más lentos. Un servicio con una media de 100 ms pero con un p99 de 5 s se siente roto para el 1% de las solicitudes que dan con la cola. Los SLO (Objetivos de Nivel de Servicio) se expresan típicamente como “el 99% de las solicitudes por debajo de 200 ms en una ventana de 28 días” — la convención de Google SRE — porque los usuarios notan más la latencia de cola que la latencia promedio. Referencia: Manual electrónico NIST/SEMATECH — Percentil.
Ejemplo práctico
Calcula el percentil 90 de 20 tiempos de respuesta (ms): [12, 15, 18, 19, 22, 24, 25, 28, 30, 33, 36, 40, 44, 48, 55, 62, 75, 90, 140, 410] (ya ordenados). Usando el método linear de NumPy: la posición es (n−1) × p = 19 × 0,9 = 17,1. Interpola entre los valores 18 y 19 (con índice base cero: índices 17 y 18 = 90 y 140): 90 + 0,1 × (140 − 90) = 95 ms. Entonces p90 = 95 ms. La media aritmética de los mismos datos es 64,8 ms — elevada por el valor atípico de 410 ms — y la mediana (p50) es 34,5 ms. Reportar estos tres juntos (p50 = 34,5, p90 = 95, máx = 410) cuenta una historia de latencia coherente; reportar solo la media ocultaría completamente la cola larga.
Cuándo y por qué importa
Los SLO basados en percentiles son el lenguaje operacional del SRE moderno porque los SLO basados en la media mienten sobre la experiencia del usuario. Un servicio con media de 100 ms y p99 de 200 ms es un producto diferente de un servicio con media de 100 ms y p99 de 5 segundos, pero ambos reportan el mismo promedio. Un presupuesto de latencia escrito como “p99 < 300 ms en 28 días” te dice qué alertar y qué optimizar. Fuera del SRE: pruebas estandarizadas (el “percentil 75 de altura” de un niño en una gráfica de crecimiento pediátrico), política económica (la participación en los ingresos del 1% superior es una declaración de percentil), y evaluación de ML (las tasas de error por percentil exponen problemas de equidad en el peor caso invisibles para la media). El hábito defensivo al consumir cualquier número “promedio” es pedir la distribución o al menos p50/p90/p99. Referencia: Libro de Google SRE — Objetivos de nivel de servicio.
Frequently asked questions
- ¿Qué es un percentil?
- Un percentil es un valor por debajo del cual cae un porcentaje dado de observaciones en un conjunto de datos. El percentil 90 de un conjunto de datos significa que el 90% de los valores están por debajo de ese punto.
- ¿Cómo se usan los percentiles en la práctica?
- Las gráficas de crecimiento pediátrico expresan la altura y el peso como percentiles para que los padres puedan ver cómo se compara un niño con una población de referencia. El rendimiento de los servidores se suele reportar como latencia en el percentil 95 o 99 para capturar el comportamiento en el peor caso que los promedios ocultan.
- ¿Cuál es la diferencia entre un percentil y un porcentaje?
- Un porcentaje es una razón expresada sobre 100 (por ejemplo, una puntuación del 80%). Un percentil es una posición de rango dentro de una distribución: estar en el percentil 80 significa que superaste al 80% del grupo, independientemente de la puntuación absoluta.
Related
Published May 14, 2026 · Last reviewed May 31, 2026