Glossary
Correção de Bessel
O N−1 na variância amostral
By Buğra SözeriPublished Updated
Correção de Bessel é a convenção de dividir por N−1 em vez de N ao calcular a variância amostral e o desvio padrão amostral. A correção compensa a subestimação sistemática da variância populacional que resulta do uso da média amostral (que está mais próxima dos dados do que a verdadeira média populacional desconhecida estaria) como ponto de centralização.
Nomeada em homenagem a Friedrich Bessel, o astrônomo e matemático alemão do século XIX. A prova matemática: E[Σ(x − x̄)²] = (N−1)σ² onde σ² é a variância populacional verdadeira e a expectativa percorre todas as amostras possíveis de tamanho N. Dividir a soma observada por N−1 produz um estimador não enviesado de σ².
Para N grande, a correção é insignificante (1/N vs 1/(N−1) diferem em menos de 1% além de N=100). Para N pequeno, ela importa significativamente — em N=5 a variância corrigida é 25% maior que a não corrigida. Nossa calculadora de estatísticas usa por padrão a forma com correção de Bessel porque o conjunto de dados que você cola é quase sempre uma amostra, não uma população completa.
Quando não aplicar a correção de Bessel: quando você genuinamente tem a população inteira, não uma amostra extraída dela. Se você está calculando a variância das notas de todos os alunos de uma turma e se importa apenas com aquela turma, divida por N. Se você está usando aquela turma para estimar a variância no corpo estudantil mais amplo, divida por N−1. Os pacotes estatísticos discordam sobre o padrão: o np.var() do NumPy usa N; o .var() do pandas e o var() do R usam N−1. Leia a documentação antes de citar um número.
A correção de Bessel remove o viés da variância, mas o desvio padrão amostral derivado (a raiz quadrada) ainda apresenta um leve viés — a raiz quadrada é uma função não linear e a desigualdade de Jensen entra em jogo. Para a maioria dos fins práticos, esse viés residual é ignorado; para trabalhos com amostras pequenas onde isso importa, use um fator de correção c4. Veja também desvio padrão amostral e variância.
Por que isso importa: um exemplo prático
Considere uma amostra de cinco notas: 72, 78, 80, 84, 86. A média é 80. A soma dos desvios quadráticos em relação à média é (72−80)² + (78−80)² + (80−80)² + (84−80)² + (86−80)² = 64 + 4 + 0 + 16 + 36 = 120. Sem a correção de Bessel, a variância é 120 ÷ 5 = 24; com a correção de Bessel é 120 ÷ (5−1) = 30, uma estimativa 25% maior. Os desvios padrão correspondentes são √24 ≈ 4,90 e √30 ≈ 5,48. Se você tratar isso como uma amostra extraída de uma população estudantil maior, 5,48 é a estimativa não enviesada da dispersão populacional; 4,90 a subestima sistematicamente. Em N = 30 a diferença encolhe para 3,4%; em N = 100 é 1%; em N = 1000 é 0,1%. A correção justifica sua complexidade apenas para amostras genuinamente pequenas.
Por que isso importa: intervalos de confiança e testes t
Qualquer procedimento que usa o desvio padrão amostral como estimativa plug-in do desvio padrão populacional depende da aplicação da correção de Bessel. Intervalos de confiança em torno de uma média, testes t de duas amostras, estatísticas F de ANOVA e erros padrão de regressão assumem o denominador não enviesado N−1. Esquecer a correção produz intervalos de confiança mais estreitos do que a realidade justifica e infla as taxas de erro Tipo I — uma fonte silenciosa, mas real, de resultados irreproduziveis em trabalhos empíricos com amostras pequenas. Referência: NIST/SEMATECH e-Handbook of Statistical Methods §1.3.5.6 — Desvio Padrão.
Frequently asked questions
- O que é a correção de Bessel?
- A correção de Bessel é o uso de N−1 (em vez de N) no denominador ao calcular a variância amostral. Ela corrige a subestimação sistemática que ocorre porque os desvios amostrais são medidos a partir da média amostral, não da média populacional verdadeira.
- Como a correção de Bessel funciona na prática?
- Para uma amostra de 5 valores {2, 4, 4, 4, 5}, a soma dos desvios quadráticos em relação à média (3,8) é 5,2. Dividir por N=5 dá uma variância enviesada de 1,04; dividir por N−1=4 dá a variância amostral não enviesada de 1,3, que melhor estima a variância populacional.
- Qual é a diferença entre variância populacional e variância amostral?
- A variância populacional divide por N e é exata quando você tem todos os pontos de dados. A variância amostral divide por N−1 (correção de Bessel) e é um estimador não enviesado quando você tem apenas um subconjunto. A maioria das funções VAR() em planilhas usa N−1 por padrão.
- Quando NÃO aplicar a correção de Bessel?
- Quando você tem a população completa — todos os pontos de dados — divida por N. A correção de Bessel só é apropriada quando seus dados são uma amostra extraída de uma população maior e você está estimando a variância dessa população.
Related
Published May 14, 2026 · Last reviewed May 31, 2026