Guide
Media, mediana, moda: cuándo cada una es el promedio correcto
El mismo conjunto de datos, tres 'promedios'. Elegir el correcto es la diferencia entre informar y engañar.
By Buğra SözeriPublished
“Promedio” en el habla cotidiana generalmente significa la mediaaritmética. En estadística es una palabra más vaga que cubre al menos tres métricas distintas: media, mediana y moda. Cada una mide “el valor típico” en un conjunto de datos, pero responden preguntas diferentes y discrepan dramáticamente en datos sesgados. Esta guía explica cuándo cada una es la herramienta correcta.
Las tres definiciones, rápido
- Media — suma de todos los valores dividida por el recuento. La predeterminada. Mismas unidades que los datos.
- Mediana — el valor central del conjunto de datos ordenado. La mitad por encima, la mitad por debajo.
- Moda — el valor que aparece con mayor frecuencia. La única que funciona con datos no numéricos.
La divergencia clásica: el ingreso
Ingreso familiar de EE. UU., 2023 (Encuesta de la Comunidad Americana):
- Media: $111.000
- Mediana: $80.610
- Moda: aproximadamente $40.000-50.000 (el tramo más poblado)
Tres números que todos responden “¿cuánto gana un hogar típico de EE. UU.?” — y discrepan hasta en un factor de tres. La media es jalada hacia arriba por los contribuyentes del 1% superior; la mediana se sitúa en el medio real de la distribución; la moda refleja dónde está el tramo más grande.
Para discusiones de políticas y titulares de noticias, la mediana es casi siempre el número correcto — es robusta frente a los valores atípicos y representa un hogar real alcanzable. La media engaña excepto para la presupuestación aritmética (impuesto recaudado = hogares × ingreso medio).
Cuándo usar cada una
Usa la MEDIA cuando
- La distribución es aproximadamente simétrica. Estaturas, puntuaciones de IQ, error de medición. La media y la mediana coinciden estrechamente; la media está bien para reportar.
- Necesitas calcular totales a partir de promedios. La media (× recuento) te da la suma exactamente. La mediana no. Para presupuestación, contabilidad e integrales, la media es obligatoria.
- La alimentarás en estadísticas adicionales. La varianza, la desviación estándar y los intervalos de confianza se basan en la media.
Usa la MEDIANA cuando
- La distribución está sesgada. Ingresos, precios de casas, tiempos de respuesta, tamaños de archivo, estancias hospitalarias, costos de proyectos. La mediana es lo que las personas reales experimentan.
- Los valores atípicos son probables y no están controlados. Datos de sensores con fallos ocasionales, números ingresados manualmente con errores tipográficos, análisis web con tráfico de bots. La mediana los filtra automáticamente.
- Quieres la “experiencia típica”. Tiempo de espera mediano, tiempo de desplazamiento mediano, tiempo de respuesta mediano al servicio al cliente.
Usa la MODA cuando
- Los datos son categóricos. Color favorito, navegador usado, país de origen. La media y la mediana no están definidas para estos; la moda es el único resumen.
- Quieres el caso más común. Producto más popular, tipo de error más común, tamaño de caja UPS más enviado. La moda es la única métrica que responde esto directamente.
- Sospechas una distribución bimodal. Estaturas combinadas de hombres y mujeres, datos climáticos caliente-frío, tráfico de red en horas pico/fuera de pico.
La trampa de la distribución sesgada
Los artículos de noticias rutinariamente reportan el ingreso medio, el precio mediano de la casa, el tiempo de respuesta medio. Las tres son distribuciones sesgadas a la derecha; en las tres la media es consistentemente mayor que la mediana; reportar la media sobrestima sistemáticamente “lo típico”.
Prueba rápida: si el conjunto de datos tiene un piso duro (cero) y sin techo duro, probablemente esté sesgado a la derecha. Usa la mediana.
| Conjunto de datos | Forma | Usar |
|---|---|---|
| Estatura de adultos | Aproximadamente normal | Media OK |
| Ingresos | Sesgado a la derecha | Mediana |
| Patrimonio neto | Fuertemente sesgado a la derecha | Mediana (la media engaña dramáticamente) |
| Tiempo de respuesta de API | Sesgado a la derecha | Mediana + percentiles |
| Duración de hospitalización | Sesgado a la derecha | Mediana |
| Tamaños de archivos en una carpeta | Sesgado a la derecha | Mediana |
| Puntuaciones de examen (prueba bien diseñada) | Aproximadamente normal | Media OK |
| Temperatura diaria | Aproximadamente normal | Media OK |
Cómo detectar el engaño
Tres oraciones que hay que vigilar en afirmaciones que usan “promedio”:
- “El estadounidense promedio gana $X.”Si $X > $90.000, es la media. La mediana es ~$80k. La media es técnicamente correcta pero responde una pregunta diferente.
- “Tiempo de respuesta promedio: 200ms.”Para una API, esto es casi con certeza la media, que un puñado de solicitudes lentas infló. La mediana es probablemente 50-100ms; el p99 podría ser 2000ms.
- “El X más popular es...”Esa es la moda. Si se usa correctamente, está bien; si se usa en lugar de la media o la mediana, es engañoso.
Cuándo reportar las tres
La presentación honesta de datos generalmente muestra la media, la mediana y una medida de dispersión (desviación estándar o rango intercuartílico). La diferencia entre la media y la mediana le dice al lector instantáneamente qué tan sesgada está la distribución. Una media de $111k y una mediana de $81k te dice más que cualquiera de los dos números solos.
Calcula las tres (más percentiles, desviación estándar e histograma) en una sola pasada con nuestra calculadora de estadísticas. Para el fondo del estadístico práctico sobre varianza y desviación estándar, consulta desviación estándar explicada.
Recorrido: monitoreo de tiempos de respuesta
Seis solicitudes API esta mañana medidas en milisegundos: [42, 51, 48, 55, 47, 2.800]. La última es un valor atípico de arranque en frío. Tres resúmenes:
- Media: (42+51+48+55+47+2800)/6 = 507 ms.
- Mediana: ordenar a [42, 47, 48, 51, 55, 2800], tomar el promedio de los dos valores centrales = 49,5 ms.
- Moda: todos los valores aparecen una vez, por lo que la moda está indefinida para esta muestra.
Reportar solo la media (“tiempo de respuesta promedio: 507 ms”) convencería a un interesado de que la API estaba rota. Reportar solo la mediana (“respuesta típica: 49,5 ms”) oculta el problema del arranque en frío. El resumen honesto son ambos números más el p99: “mediana 50 ms, p99 ~2,8 s — rápido en el caso común, picos ocasionales de arranque en frío.” Eso es accionable; cualquiera de los dos números solo no lo es.
Errores comunes
- Calcular el “promedio de promedios”. La media de las medias de tres grupos no es la media de los datos combinados a menos que los grupos sean del mismo tamaño. Siempre vuelve a calcular desde los datos brutos, o usa una media ponderada con los tamaños de los grupos como pesos.
- Reportar la mediana sin una métrica de dispersión. Dos conjuntos de datos con medianas idénticas pueden tener formas completamente diferentes. Añade el rango intercuartílico (Q3 − Q1); un resumen de cinco números (mín, Q1, mediana, Q3, máx) es una línea única barata y honesta.
- Llamar “promedio” a una distribución bimodal. Una distribución combinada de altura masculino+femenino tiene dos picos en ~168 cm y ~178 cm. La media (~173 cm) no describe a nadie. Desagrega por grupo e informa cada subpoblación por separado.
- Usar la moda para datos continuos. Para mediciones verdaderamente continuas (estaturas, pesos, tiempos de respuesta) cada valor es técnicamente único; la moda está indefinida o es un artefacto de granularidad de medición. Usa un histograma e identifica el bin más denso.
- Comparar medias entre muestras truncadas. Las medias son extremadamente sensibles a si se incluyen los valores atípicos. Si dos estudios reportan medias diferentes y uno excluyó valores atípicos por encima del percentil 99, la diferencia puede ser completamente artificial.
Frequently asked questions
- ¿Cuál es la diferencia entre media, mediana y moda?
- La media es la suma dividida por el recuento. La mediana es el valor central cuando los datos están ordenados — la mitad de los valores están por encima, la mitad por debajo. La moda es el valor que aparece con mayor frecuencia. Los tres son 'promedios' pero discrepan significativamente en datos sesgados.
- ¿Por qué el Censo de los EE. UU. usa el ingreso familiar mediano en lugar de la media?
- El ingreso está sesgado a la derecha — un pequeño número de personas con ingresos muy altos jala la media muy por encima de lo que ganan la mayoría de los hogares. En 2023, el ingreso familiar medio de los EE. UU. fue aproximadamente $111.000 mientras que la mediana fue $80.610. La mediana representa mejor la experiencia del hogar típico.
- ¿Cuándo debo usar la mediana en lugar de la media?
- Usa la mediana cuando los datos tienen un piso duro en cero y sin techo (ingresos, precios de casas, tiempos de respuesta, tamaños de archivo), contienen valores atípicos no controlados, o cuando quieres representar la experiencia típica del individuo. Si la media y la mediana difieren sustancialmente, los datos están sesgados y la mediana suele ser más informativa.
- ¿Cuándo es la moda más útil que la media o la mediana?
- La moda es la única medida de tendencia central que funciona con datos categóricos (no numéricos) — color favorito, tipo de navegador, país de origen. También es la elección correcta cuando la pregunta es '¿cuál es el valor más común?' — tamaño de producto más popular, código de error más frecuente.
- ¿Puede un conjunto de datos tener más de una moda?
- Sí. Una distribución bimodal tiene dos modas — por ejemplo, los datos combinados de altura masculina y femenina tienen picos en aproximadamente 168 cm y 178 cm. Reportar una sola media de ~173 cm no describe a nadie en el conjunto de datos; reportar dos modas revela la estructura.
Related
Published May 16, 2026