Glossary
Corrección de Bessel
El N−1 en la varianza muestral
By Buğra SözeriPublished Updated
La corrección de Bessel es la convención de dividir entre N−1 en lugar de N al calcular la varianza muestral y la desviación típica muestral. La corrección compensa la subestimación sistemática de la varianza poblacional que resulta de usar la media muestral (que está más próxima a los datos que la verdadera media poblacional desconocida) como punto de centrado.
Lleva el nombre de Friedrich Bessel, el astrónomo y matemático alemán del siglo XIX. La prueba matemática: E[Σ(x − x̄)²] = (N−1)σ² donde σ² es la verdadera varianza poblacional y la esperanza se calcula sobre todas las muestras posibles de tamaño N. Dividir la suma observada entre N−1 produce un estimador no sesgado de σ².
Para N grandes la corrección es despreciable (1/N frente a 1/(N−1) difieren menos del 1% para N>100). Para N pequeños importa de forma significativa — para N=5 la varianza corregida es un 25% mayor que la no corregida. Nuestra calculadora de estadística usa por defecto la forma con corrección de Bessel porque el conjunto de datos que se introduce es casi siempre una muestra, no una población completa.
Cuándo no aplicar la corrección de Bessel: cuando realmente se tiene toda la población, no una muestra extraída de ella. Si calcula la varianza de las puntuaciones de un examen para cada estudiante de una clase y solo le importa esa clase, divida entre N. Si usa esa clase para estimar la varianza en el conjunto más amplio de estudiantes, divida entre N−1. Los paquetes estadísticos no coinciden en el valor por defecto: np.var() de NumPy usa N; .var() de pandas y var() de R usan N−1. Lea la documentación antes de citar un número.
La corrección de Bessel elimina el sesgo de la varianza, pero la desviación típica muestral derivada (la raíz cuadrada) sigue siendo ligeramente sesgada — la raíz cuadrada es una función no lineal y la desigualdad de Jensen actúa. Para la mayoría de los propósitos prácticos este sesgo residual se ignora; para trabajos con muestras pequeñas donde importa, use un factor de corrección c4. Véase también desviación típica muestral y varianza.
Por qué importa: un ejemplo práctico
Considere una muestra de cinco puntuaciones de examen: 72, 78, 80, 84, 86. La media es 80. La suma de desviaciones al cuadrado de la media es (72−80)² + (78−80)² + (80−80)² + (84−80)² + (86−80)² = 64 + 4 + 0 + 16 + 36 = 120. Sin la corrección de Bessel la varianza es 120 ÷ 5 = 24; con la corrección de Bessel es 120 ÷ (5−1) = 30, una estimación un 25% mayor. Las desviaciones típicas correspondientes son √24 ≈ 4,90 y √30 ≈ 5,48. Si trata esto como una muestra extraída de una población estudiantil mayor, 5,48 es la estimación no sesgada de la dispersión poblacional; 4,90 la subestima sistemáticamente. Para N = 30 la brecha se reduce al 3,4%; para N = 100 es del 1%; para N = 1000 es del 0,1%. La corrección justifica su complejidad solo para muestras genuinamente pequeñas.
Por qué importa: intervalos de confianza y pruebas t
Cualquier procedimiento que use la desviación típica muestral como estimador sustituto de la desviación típica poblacional depende de que se haya aplicado la corrección de Bessel. Los intervalos de confianza alrededor de una media, las pruebas t de dos muestras, los estadísticos F de ANOVA y los errores estándar de regresión asumen el denominador no sesgado N−1. Olvidar la corrección produce intervalos de confianza más estrechos de lo que justifica la realidad e infla las tasas de error de tipo I — una fuente silenciosa pero real de hallazgos no reproducibles en trabajos empíricos con muestras pequeñas. Referencia: Manual electrónico de métodos estadísticos NIST/SEMATECH §1.3.5.6 — Desviación típica.
Frequently asked questions
- ¿Qué es la corrección de Bessel?
- La corrección de Bessel es el uso de N−1 (en lugar de N) en el denominador al calcular la varianza muestral. Corrige la subestimación sistemática que ocurre porque las desviaciones muestrales se miden desde la media muestral, no desde la verdadera media poblacional.
- ¿Cómo funciona la corrección de Bessel en la práctica?
- Para una muestra de 5 valores {2, 4, 4, 4, 5}, la suma de desviaciones al cuadrado de la media (3,8) es 5,2. Dividir entre N=5 da una varianza sesgada de 1,04; dividir entre N−1=4 da la varianza muestral no sesgada de 1,3, que estima mejor la varianza poblacional.
- ¿Cuál es la diferencia entre varianza poblacional y varianza muestral?
- La varianza poblacional divide entre N y es exacta cuando se tienen todos los datos. La varianza muestral divide entre N−1 (corrección de Bessel) y es un estimador no sesgado cuando solo se tiene un subconjunto. La mayoría de las funciones VAR() en hojas de cálculo usan N−1 por defecto.
- ¿Cuándo NO debe aplicarse la corrección de Bessel?
- Cuando se tiene la población completa — todos los datos — divida entre N. La corrección de Bessel solo es apropiada cuando sus datos son una muestra extraída de una población mayor y está estimando la varianza de esa población.
Related
Published May 14, 2026 · Last reviewed May 31, 2026