Glossary
Mediana
El valor central de un conjunto de datos ordenado
By Buğra SözeriPublished Updated
Mediana es el valor central de un conjunto de datos ordenado. Para [3, 4, 5, 6, 7, 8] (seis valores), la mediana es 5,5 (la media de los dos valores centrales). Para [3, 4, 5, 6, 7] (cinco valores), la mediana es 5. La mitad de los datos está por debajo y la otra mitad por encima.
La mediana es conocidamente robusta: un valor atípico extremo no puede desplazarla. La mediana de [1, 2, 3, 4, 5] es 3. La mediana de [1, 2, 3, 4, 1000] sigue siendo 3. Esto hace que la mediana sea el resumen correcto para distribuciones asimétricas: ingresos, precios de viviendas, tiempos de respuesta, tamaños de archivos, donde uno o dos valores extremos dominarían la media aritmética.
Es equivalente al percentil 50. Calcularla directamente (ordenar, tomar el valor central) es O(n log n); para conjuntos de datos muy grandes, un algoritmo quickselect encuentra la mediana en O(n) esperado.
Usa la calculadora de estadística para la mediana, media, moda y cuartiles en una sola operación.
Por qué el “ingreso mediano de los hogares” es la cifra que realmente citan los economistas: la Oficina del Censo de EE. UU. informa el ingreso mediano de los hogares porque es el resumen honesto de un número para una distribución con fuerte sesgo hacia la derecha. Según la ACS 2023, el ingreso mediano de los hogares en EE. UU. era de unos $80.000, mientras que la media era de unos $112.000: la brecha es la influencia de la parte alta de la distribución en la media aritmética. La misma brecha aparece en los precios de las viviendas (la NAR informa medianas, no medias), en las encuestas salariales y en el monitoreo de tiempos de respuesta en software (cada panel de observabilidad cita p50 = mediana, no latencia promedio). Cuando un número es “promedio” sin calificativo sobre datos asimétricos, pregunta qué promedio: la diferencia entre los dos suele ser la historia.
La mediana es un estimador robusto de ubicación, pero con un coste: la mediana tiene un punto de ruptura del 50% (necesitarías corromper más de la mitad de los datos para moverla arbitrariamente), mientras que la media tiene un punto de ruptura del 0% (un solo valor infinito mueve la media al infinito). La compensación es eficiencia estadística: bajo una distribución normal limpia, el intervalo de confianza de la mediana es aproximadamente un 25% más amplio que el de la media para el mismo tamaño de muestra. Por ello, para datos limpios y simétricos la media es más informativa; para datos del mundo real desordenados, la mediana es más segura. Las medias recortadas (eliminar el 5% superior e inferior) y el estimador de Hodges-Lehmann se sitúan en el espectro entre ambas. Relacionado: media, percentil, IQR.
Ejemplo práctico
Once precios de venta de viviendas en un barrio (en miles de dólares): [280, 295, 310, 320, 340, 355, 360, 380, 410, 450, 2400]. Lista ya ordenada. Con n = 11, la mediana es el 6.º valor: $355.000. La media es suma/11 = 5900/11 ≈ $536.000. La única mansión frente al mar de $2,4 millones ha empujado la media ~$180.000 por encima de cualquiera de los diez comparables realistas: un comprador que use el “precio promedio” para evaluar el barrio sobreestimaría un 50%. La mediana ignora ese valor atípico por completo. Añade una 12.ª venta a $370.000: ahora n = 12, la mediana es la media del 6.º y 7.º valores, (355 + 360)/2 = $357.500. La técnica se generaliza: cualquier observación extrema en una muestra grande desplaza la mediana como máximo una posición en la lista ordenada.
Cuándo y por qué importa
La mediana es la métrica correcta cuando la distribución tiene una cola larga y se quiere un número que represente “el caso típico”. Eso abarca la mayoría de las métricas operacionales que les importan a las personas: ingreso de los hogares, precios de viviendas, tiempo de resolución de tickets de soporte, tiempos de carga de páginas, tamaños de archivos en un repositorio, palabras por oración en un corpus documental. Al monitorear la latencia del software, la práctica estándar es mostrar p50 (mediana) y p99 juntos: la mediana indica si el usuario típico está satisfecho; p99 indica si la cola es aceptable. Informar solo un promedio puede enmascarar una distribución bimodal (dos grupos de usuarios con experiencias muy diferentes) que la mediana más algunos percentiles revela de inmediato. Referencia: US Census Bureau — Income in the United States: 2023.
Frequently asked questions
- ¿Qué es la mediana?
- La mediana es el valor central de un conjunto de datos ordenado. Para una cantidad impar de valores es el valor central; para una cantidad par es el promedio de los dos valores centrales.
- ¿Cuándo debo usar la mediana en lugar de la media?
- Usa la mediana para distribuciones asimétricas o datos con valores atípicos: ingresos, precios de viviendas, tiempos de respuesta. Un solo valor extremo no puede desplazar la mediana más de una posición, mientras que puede mover la media drásticamente.
- ¿Cuál es la diferencia entre mediana y percentil?
- La mediana es el percentil 50: el punto en el que la mitad de los datos cae por debajo y la otra mitad por encima. Cualquier percentil divide los datos de forma similar: el percentil 90 es el valor por debajo del cual cae el 90% de las observaciones.
- ¿Cómo encuentro la mediana de un conjunto de datos con cantidad par?
- Ordena los valores, toma los dos elementos centrales y promédialos. Para [3, 7, 10, 14], los dos valores centrales son 7 y 10, por lo que la mediana es (7+10)/2 = 8,5.
Related
Published May 16, 2026 · Last reviewed May 31, 2026