¿Qué mide realmente la desviación estándar?

La desviación estándar mide cuán disperso está un conjunto de valores alrededor de la media. Una desviación estándar pequeña significa que los valores se agrupan estrechamente alrededor del promedio; una grande significa que están muy dispersos. La unidad es la misma que los datos — puntos, dólares, milisegundos, etc.

¿Cuál es la diferencia entre la desviación estándar de población y la de muestra?

La desviación estándar de población divide por n (todos los datos). La de muestra divide por n−1 (corrección de Bessel) para producir una estimación insesgada cuando solo se tiene una muestra. STDEV.S de Excel y statistics.stdev de Python usan n−1; numpy.std usa n por defecto.

¿Qué significa la regla 68-95-99,7 para la desviación estándar?

Para distribuciones aproximadamente normales, alrededor del 68% de los valores caen dentro de ±1 desviación estándar de la media, el 95% dentro de ±2, y el 99,7% dentro de ±3. Esto le permite convertir rápidamente una desviación estándar en una imagen mental de cuán extremo es cualquier valor individual.

¿Cuándo es la desviación estándar la herramienta incorrecta?

La desviación estándar es engañosa cuando los datos contienen valores atípicos (un valor extremo la infla dramáticamente), están muy sesgados (ingresos, precios de casas) o son categóricos. Para datos sesgados, use el rango intercuartílico o la desviación absoluta mediana en su lugar.

¿Se pueden sumar desviaciones estándar?

No. Las desviaciones estándar no se suman directamente. Las varianzas de variables independientes se suman, por lo que la fórmula correcta es DE_combinada = √(DE₁² + DE₂²). Sumar desviaciones estándar directamente sobreestima la dispersión combinada.

Guide

La desviación estándar explicada sin notación matemática

Qué mide, por qué la fórmula tiene dos versiones y cómo leer el resultado sin un grado en estadística.

By Buğra SözeriPublished May 16, 2026

La desviación estándar es un número que resume cuán disperso está un conjunto de valores. Una desviación estándar pequeña significa que los valores están estrechamente agrupados alrededor de la media. Una grande significa que están dispersos. Ese es el concepto completo. Todo lo demás — la fórmula, el debate n-1 vs n, la curva de campana — es solo la maquinaria para hacer la dispersión comparable entre diferentes conjuntos de datos y tamaños de muestra.

Qué mide realmente

Imagine dos clases que cada una tiene una puntuación media de 75 en un examen.

Clase A: las puntuaciones son 73, 74, 75, 76, 77. Desviación estándar: 1,6.
Clase B: las puntuaciones son 55, 65, 75, 85, 95. Desviación estándar: 15,8.

La misma media, distribuciones muy diferentes. La clase A es uniforme; la clase B tiene un amplio rango. La desviación estándar captura esa diferencia en un solo número.

La unidad de la desviación estándar es la misma unidad que los datos. Puntuaciones de examen en puntos → desviación estándar en puntos. Alturas en pulgadas → desviación estándar en pulgadas. Esto hace que el número sea directamente interpretable.

Cómo calcularla (en tres pasos)

Encuentre la media. Sume los valores, divida por la cantidad.
Calcule la distancia al cuadrado de cada valor respecto a la media. Para la clase A, la media es 75. Las distancias al cuadrado son: (73-75)² = 4, (74-75)² = 1, (75-75)² = 0, (76-75)² = 1, (77-75)² = 4. Suma: 10.
Divida por n-1 (muestra) o n (población), luego saque la raíz cuadrada. Clase A: 10/(5-1) = 2,5; √(2,5) = 1,58.

La elevación al cuadrado es lo que hace que las desviaciones grandes dominen a las pequeñas — una desviación de 4 contribuye 16 a la suma; una desviación de 1 contribuye 1. La raíz cuadrada al final devuelve el resultado a la unidad original.

n vs n-1: por qué existen dos fórmulas

Si tiene todos los datos (todos los valores de la población), divida por n. Si tiene una muestra extraída de una población más grande y quiere estimar la desviación estándar de esa población, divida por n-1. La versión n-1 se llama desviación estándar muestral; la versión n es la de la población.

¿Por qué la versión muestral usa n-1? Porque la media de la muestra es en sí misma un punto de la muestra, la muestra subestima la dispersión real de la población. Dividir por n-1 infla la estimación lo suficiente para corregir el sesgo en promedio. Esto se llama corrección de Bessel.

En la práctica: si está calculando la desviación estándar de una muestra (que es lo que hacen la mayoría de los cálculos del mundo real), use n-1. STDEV.S de Excel y statistics.stdev de Python usan n-1 por defecto.STDEV.P de Excel y numpy.std usan n por defecto. Elegir la función incorrecta cambia silenciosamente los resultados en algunos porcentajes en muestras pequeñas.

Cómo leer el número

Una vez que tiene la desviación estándar, aquí está la intuición utilizable:

~68% de los valores se encuentran dentro de ±1 desviación estándar de la media (para distribuciones aproximadamente normales).
~95% se encuentran dentro de ±2 desviaciones estándar.
~99,7% se encuentran dentro de ±3 desviaciones estándar.

Esta “regla 68-95-99,7” (también llamada regla empírica) se aplica a cualquier distribución aproximadamente en forma de campana. Para la clase A: media 75, DE 1,58. El intervalo [73,4, 76,6] debería contener aproximadamente el 68% de los valores — y mirando los números reales, tres de los cinco (60%) caen en ese rango. Suficientemente cerca para una muestra de cinco.

Expresar una sola observación en “cuántas desviaciones estándar de la media” es tan útil que tiene su propio nombre: la puntuación z. Para la clase A, un estudiante que obtuvo 78 tiene una puntuación z de (78 − 75) / 1,58 ≈ 1,9 — casi dos DE por encima de la media, lo que lo coloca en el 3% superior de una distribución normal.

Cuándo la desviación estándar es la herramienta incorrecta

Tres casos:

Valores atípicos. Un valor extremo infla dramáticamente la desviación estándar. Los datos de ingresos son un ejemplo clásico — un solo multimillonario en una muestra de mil personas eleva la desviación estándar mucho más allá de cualquier noción intuitiva de dispersión típica. Use el rango intercuartílico o la desviación absoluta mediana en su lugar.
Distribuciones sesgadas. Cuando la mayoría de los valores son pequeños y unos pocos son muy grandes (o al revés), la media y la desviación estándar juntas no describen la forma. Reporte percentiles o cuartiles.
Datos categóricos.La desviación estándar requiere una escala numérica donde la distancia tiene significado. No se puede calcular una desviación estándar significativa de los valores [“rojo”, “azul”, “verde”].

Varianza: el primo de la desviación estándar

La varianza es el mismo cálculo sin la raíz cuadrada final. Está en unidades al cuadrado (puntos², pulgadas²), lo que es más difícil de interpretar directamente pero más fácil de manejar matemáticamente — las varianzas se pueden sumar entre fuentes independientes, mientras que las desviaciones estándar no. En la práctica, se calcula la varianza y se reporta la desviación estándar.

Ejemplo rápido

Conjunto de datos: [4, 8, 6, 5, 3, 7]

Media: (4+8+6+5+3+7) / 6 = 5,5
Desviaciones al cuadrado: (4-5,5)² = 2,25, (8-5,5)² = 6,25, (6-5,5)² = 0,25, (5-5,5)² = 0,25, (3-5,5)² = 6,25, (7-5,5)² = 2,25
Suma de desviaciones al cuadrado: 17,5
Varianza muestral (÷ n-1): 17,5 / 5 = 3,5
Desviación estándar muestral: √3,5 = 1,87

Verifique con nuestra calculadora de estadísticas — calcula media, mediana, ambas versiones de la desviación estándar y percentiles en un solo paso.

La conclusión práctica

La desviación estándar responde a “¿cuán dispersos están estos datos?” en las propias unidades de los datos. Para datos aproximadamente normales, la regla 68/95/99,7 le permite traducir el número en una imagen mental rápida. Para datos sesgados o con muchos valores atípicos, recurra a los percentiles. Y siempre verifique si la herramienta que usa aplica el divisor n-1 (muestra) o n (población) — la diferencia es pequeña pero real.

Ejemplo: comparando dos líneas de fabricación

Dos líneas de producción que fabrican ejes de 100 mm. Veinte muestras cada una, todas las mediciones dentro de tolerancia:

Línea A: media 100,00 mm, DE muestral 0,05 mm.
Línea B: media 100,00 mm, DE muestral 0,20 mm.

Medias idénticas. La línea A es cuatro veces más consistente. Bajo la regla 68/95/99,7, la línea A mantiene el 99,7% de las piezas dentro de ±0,15 mm del nominal; el intervalo del 99,7% de la línea B es ±0,60 mm. Si la tolerancia de ingeniería es ±0,30 mm, la línea A produce cero piezas fuera de tolerancia en expectativa; la línea B produce aproximadamente el 13% fuera de tolerancia. La desviación estándar revela la diferencia en un solo número; las medias solas sugerirían que las líneas eran indistinguibles.

Errores comunes

Usar n vs n-1 de forma inconsistente en un informe.Mezclar STDEV.S de Excel con el predeterminadonumpy.std de NumPy en el mismo análisis produce discrepancias pequeñas pero reales. Elija una convención por proyecto y documéntela.
Reportar DE sin n. La desviación estándar de tres mediciones es esencialmente no informativa. Con n=3, su estimación de DE tiene su propio error estándar de ~40%. Reporte el tamaño de la muestra junto a cada DE; por debajo de n=10, trate la DE como una estimación aproximada.
Tratar los “eventos de 3 sigma” como imposibles. La cifra del 99,7% se aplica a distribuciones normales. Los datos del mundo real con colas pesadas (mercados, desastres naturales, latencias de red) producen eventos de 3 sigma órdenes de magnitud más a menudo de lo que predice el modelo normal.
Confundir DE con error estándar. La desviación estándar describe la dispersión de los datos; el error estándar de la media describe la precisión de la estimación de la media. SEM = DE / √n, y disminuye con el tamaño de la muestra. Confundirlos infla la precisión aparente.
Sumar desviaciones estándar. Las DE no se suman. Las varianzas de variables independientes se suman; saque la raíz cuadrada de la suma para obtener la DE combinada. DE_combinada = √(DE₁² + DE₂²), no DE₁ + DE₂.

Para la pregunta sobre el centro de la distribución que acompaña a la dispersión, continúe con nuestra guía de media, mediana y moda.

Fuentes: Manual de Métodos Estadísticos NIST/SEMATECH, §1.3.5.6 (Desviación Estándar). Publicación original de la corrección de Bessel: F. W. Bessel, Astronomische Nachrichten, 1819. Wasserman, All of Statistics (2004) sobre estimadores insesgados.

Frequently asked questions

¿Qué mide realmente la desviación estándar?: La desviación estándar mide cuán disperso está un conjunto de valores alrededor de la media. Una desviación estándar pequeña significa que los valores se agrupan estrechamente alrededor del promedio; una grande significa que están muy dispersos. La unidad es la misma que los datos — puntos, dólares, milisegundos, etc.
¿Cuál es la diferencia entre la desviación estándar de población y la de muestra?: La desviación estándar de población divide por n (todos los datos). La de muestra divide por n−1 (corrección de Bessel) para producir una estimación insesgada cuando solo se tiene una muestra. STDEV.S de Excel y statistics.stdev de Python usan n−1; numpy.std usa n por defecto.
¿Qué significa la regla 68-95-99,7 para la desviación estándar?: Para distribuciones aproximadamente normales, alrededor del 68% de los valores caen dentro de ±1 desviación estándar de la media, el 95% dentro de ±2, y el 99,7% dentro de ±3. Esto le permite convertir rápidamente una desviación estándar en una imagen mental de cuán extremo es cualquier valor individual.
¿Cuándo es la desviación estándar la herramienta incorrecta?: La desviación estándar es engañosa cuando los datos contienen valores atípicos (un valor extremo la infla dramáticamente), están muy sesgados (ingresos, precios de casas) o son categóricos. Para datos sesgados, use el rango intercuartílico o la desviación absoluta mediana en su lugar.
¿Se pueden sumar desviaciones estándar?: No. Las desviaciones estándar no se suman directamente. Las varianzas de variables independientes se suman, por lo que la fórmula correcta es DE_combinada = √(DE₁² + DE₂²). Sumar desviaciones estándar directamente sobreestima la dispersión combinada.

Published May 16, 2026