Glossary
Desviación estándar muestral
Dispersión de un conjunto de datos muestral
By Buğra SözeriPublished Updated
La desviación estándar muestral es la raíz cuadrada de la varianza muestral:
s = √(Σ(xᵢ − x̄)² / (n − 1))
Donde x̄ es la media muestral, n es el tamaño de la muestra, y la suma recorre todos los valores. El divisor n − 1 es la corrección de Bessel — compensa el hecho de que la media muestral está más cerca de los datos que la media poblacional verdadera (desconocida), lo que hace que la suma bruta de desviaciones al cuadradosubestime la varianza poblacional verdadera.
Usa la desviación estándar muestral cuando tu conjunto de datos se extrae de un grupo más grande que no puedes medir exhaustivamente (que es casi siempre). Usa la desviación estándar poblacional (dividir por n) solo cuando el conjunto de datos es literalmente toda la población — cada empleado de tu empresa, cada transacción en marzo.
Con tamaños de muestra grandes la diferencia es insignificante (n vs n-1 es ruido de redondeo). Con tamaños de muestra pequeños — digamos, n < 30 — la corrección importa significativamente y deberías preferir la forma muestral.
Nuestra calculadora de estadística usa por defecto la forma muestral con un interruptor para cambiar a la poblacional.
Por qué la raíz cuadrada reintroduce un pequeño sesgo: la corrección de Bessel hace que la varianza muestral sea un estimador insesgado de la varianza poblacional, pero la operación de raíz cuadrada es no lineal y la desigualdad de Jensen actúa — la desviación estándar muestral sistemáticamentesubestima la desviación estándar poblacional verdadera, incluso después de la corrección N−1. El sesgo es aproximadamente (1/4n) para datos normales, entonces 2,5% con n=10, 0,25% con n=100, e insignificante más allá de n=1000. Los paquetes estadísticos en su mayoría ignoran esto; el estimador de corrección c4 insesgada s × √((n−1)/2) × Γ((n−1)/2) / Γ(n/2) existe para aplicaciones donde importa (control de calidad con tamaños de muestra pequeños). Referencia: NIST/SEMATECH e-Handbook — Desviación estándar.
Ejemplo práctico
Cinco mediciones de un ensayo químico: 9,8; 10,1; 9,9; 10,3; 10,4. Media x̄ = 10,10. Desviaciones al cuadrado: 0,09; 0,00; 0,04; 0,04; 0,09 — suma 0,26. Varianza muestral s² = 0,26 / 4 = 0,065; desviación estándar muestral s ≈ 0,255. La desviación estándar poblacional (dividir por 5) sería 0,228 — una subestimación del 12% de la dispersión del proceso subyacente al tratar una muestra como un censo. Para un gráfico de control de calidad con límites de control en x̄ ± 3s, esa diferencia mueve el límite superior de 10,78 a 10,87, cambiando materialmente qué corridas de producción activarían una alarma fuera de control.
Cuándo importa en la práctica
Las pruebas A/B, la ciencia de laboratorio, las encuestas y las finanzas todas extraen inferencias de muestras y reportan incertidumbre como ±s o como un intervalo de confianza construido sobre s/√n. Usar la fórmula poblacional en una muestra subestima la incertidumbre e infla la significancia estadística — el pecado cardinal en los artículos de la crisis de reproducibilidad. Las hojas de cálculo reflejan esta distinción en sus nombres de función:DESVEST.M de Excel divide por n−1,DESVEST.P por n; el método.std() de pandas usa por defecto ddof=1 (muestral),np.std() de NumPy usa por defecto ddof=0(poblacional). Mezclarlos es uno de los errores numéricos silenciosos más comunes en los pipelines de datos. Ver también varianza y corrección de Bessel.
Frequently asked questions
- ¿Qué es la desviación estándar muestral?
- La desviación estándar muestral (s) mide la dispersión de los valores alrededor de la media muestral, calculada como la raíz cuadrada de las desviaciones al cuadrado promedio usando n menos 1 (no n) en el denominador. Dividir por n menos 1 (corrección de Bessel) produce una estimación insesgada de la desviación estándar poblacional.
- ¿Por qué dividir por n menos 1 en lugar de n?
- Una media muestral se calcula a partir de los mismos datos, por lo que está más cerca de los valores muestrales que lo que estaría la verdadera media poblacional. Esto hace que la suma naive de desviaciones al cuadrado subestime la varianza verdadera. Dividir por n menos 1 corrige este sesgo, produciendo un estimador insesgado.
- ¿Cuál es la diferencia entre desviación estándar muestral y poblacional?
- La desviación estándar poblacional (sigma) divide por N (todos los valores) y describe la dispersión real de una población completa conocida. La desviación estándar muestral (s) divide por n menos 1 y se usa cuando tienes un subconjunto y quieres estimar la dispersión de la población. Para n grande la diferencia es insignificante.
Related
Published May 14, 2026 · Last reviewed May 31, 2026