Skip to content

Glossary

Moda

El valor más frecuente

By Published Updated

Moda es el valor más frecuente en un conjunto de datos. Para [1, 2, 2, 3, 4, 4, 4, 5] la moda es 4 (aparece tres veces; ningún otro valor lo hace). Es la única medida de tendencia central que funciona para datos no numéricos: la moda de [“rojo”, “azul”, “rojo”, “verde”, “rojo”] es “rojo”.

Tres casos especiales:

  • Unimodal — exactamente un valor más frecuente. El caso estándar.
  • Bimodal — dos valores empatan en frecuencia máxima. Implica una distribución de población mixta (p. ej., las alturas de hombres y mujeres adultos combinadas producen una distribución bimodal).
  • Sin moda — cada valor aparece exactamente una vez. La moda está técnicamente indefinida; algunas convenciones indican “sin moda”, otras reportan todos los valores como moda.

Usa la moda cuando: los datos son categóricos (colores, marcas, tipos) o te interesa específicamente el valor más común, no la tendencia central. Para datos numéricos sin valores repetidos (alturas, salarios) la moda no es útil: usa la media o la mediana.

Nuestra calculadora de estadística informa la moda junto con la media y la mediana, gestionando el caso bimodal listando todos los valores más frecuentes.

Por qué las distribuciones bimodales son un diagnóstico, no solo una curiosidad: cuando un histograma de datos continuos muestra dos picos distintos, casi siempre significa que el conjunto de datos es una mezcla de dos poblaciones subyacentes. El ejemplo clásico son las alturas de los humanos adultos: agrupar hombres y mujeres produce una curva bimodal; dividir por sexo produce dos curvas unimodales limpias. La bimodalidad en las distribuciones del gasto de los clientes suele indicar una población de nivel gratuito y una de nivel de pago mezcladas. La bimodalidad en las distribuciones de los tiempos de respuesta a menudo indica que un camino rápido y un camino lento (acierto vs fallo en caché) necesitan tratamiento separado. Informar la media general sobre una distribución bimodal rara vez es útil: ajusta un modelo de mezcla o segmenta primero.

Moda para datos continuos: estimación por densidad de núcleo: en un conjunto de datos continuos donde la repetición exacta de valores es rara, la “moda” se define normalmente como el pico de la estimación por densidad de núcleo (KDE) en lugar del valor bruto más frecuente. Los paquetes estadísticos (density() de R, gaussian_kde de scipy en Python) calculan KDE por defecto para este propósito. El parámetro de ancho de banda (qué tan amplia se extiende la contribución de cada punto de datos a la densidad) es la palanca principal, y la regla de Silverman funciona bien para datos unimodales. Para datos bimodales, elige un ancho de banda suficientemente pequeño para que los dos picos permanezcan resueltos. Relacionado: media, mediana. Referencia: NIST/SEMATECH e-Handbook — Measures of Central Tendency.

Ejemplo práctico

Un minorista de ropa registra las tallas vendidas en 200 transacciones: {XS: 12, S: 38, M: 64, L: 51, XL: 28, XXL: 7}. Moda = M (64 ocurrencias). La moda es el único estadístico que resume significativamente esta columna: “talla media” o “talla mediana” requieren codificar XS-XXL como números, y cualquier codificación elegida es arbitraria. Ahora imagina que el mismo minorista añade una línea infantil y combina los datos: el nuevo histograma de tallas es {2T: 30, 4T: 28, 6: 22, S: 38, M: 64, L: 51, XL: 28}. La distribución es bimodal (pico en 2T-6 para niños, pico en M-L para adultos), y la “talla más vendida” (M) induce activamente a error en cualquier decisión sobre el inventario de la línea infantil. Segmentar antes de calcular la moda —una vez para niños, otra para adultos— recupera la señal de inventario correcta: 2T es la talla modal de niños, M es la talla modal de adultos.

Cuándo y por qué importa

Las modas impulsan decisiones operativas en el comercio minorista (qué talla/color/SKU almacenar con mayor volumen), en elecciones (el candidato modal gana un sistema de pluralidad, incluso sin mayoría), en sistemas de recomendación (artículo más visto por categoría) y en el análisis de lenguaje natural (palabra/n-grama modal en un corpus revela el tema). La trampa es asumir que existe una única moda cuando la población subyacente es mixta. Los investigadores de encuestas, los evaluadores de pruebas A/B y los analistas de producto se topan con esto constantemente: cualquier conjunto de datos que agrupe usuarios de distintos segmentos (geografía, nivel de plan, tipo de dispositivo) a menudo muestra bimodalidad que desaparece al segmentar. El hábito defensivo: siempre traza el histograma antes de informar cualquier número de “tendencia central”. Referencia: NIST/SEMATECH e-Handbook — Histogram Interpretation: Bimodal.

Frequently asked questions

¿Qué es la moda?
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Para [1, 2, 2, 3, 4], la moda es 2. Un conjunto de datos puede ser unimodal (una moda), bimodal (dos modas) o multimodal (múltiples picos).
¿Cuándo es útil la moda?
La moda es más útil para datos categóricos: la talla de zapato más vendida, la categoría de ticket de soporte más popular, el color pedido con más frecuencia. Es el único promedio que se aplica a datos nominales (no numéricos).
¿Cuál es la diferencia entre moda, media y mediana?
La media es el promedio aritmético, sensible a los valores atípicos. La mediana es el valor central, robusta ante los valores atípicos. La moda es el valor más frecuente, útil para datos discretos o categóricos. Para una distribución simétrica en forma de campana, los tres son iguales.
¿Qué significa que una distribución sea bimodal?
Una distribución bimodal tiene dos picos distintos en su gráfico de frecuencias, lo que significa que dos valores (o rangos) son especialmente comunes. Suele indicar dos subgrupos en los datos: por ejemplo, un conjunto de alturas que mezcla hombres y mujeres adultos.

Related

Published May 16, 2026 · Last reviewed May 31, 2026