Glossary
Desvio padrão amostral
Dispersão de um conjunto de dados amostral
By Buğra SözeriPublished Updated
Desvio padrão amostral é a raiz quadrada da variância amostral:
s = √(Σ(xᵢ − x̄)² / (n − 1))
Onde x̄ é a média amostral, n é o tamanho da amostra, e a soma percorre todos os valores. O divisor n − 1 é a correção de Bessel — ela compensa o fato de que a média amostral está mais próxima dos dados do que a (desconhecida) verdadeira média populacional estaria, o que faz com que a soma bruta dos desvios quadradossubestime a verdadeira variância populacional.
Use o desvio padrão amostral quando seu conjunto de dados for extraído de um grupo maior que você não pode medir exaustivamente (o que é quase sempre o caso). Use o desvio padrão populacional (divida por n) somente quando o conjunto de dados literalmente é a população inteira — todos os funcionários da sua empresa, todas as transações de março.
Em tamanhos de amostra grandes, a diferença é negligenciável (n vs n-1 é ruído de arredondamento). Em tamanhos de amostra pequenos — digamos, n < 30 — a correção importa significativamente e você deve preferir a forma amostral.
Nossa calculadora de estatísticas usa a forma amostral por padrão com uma opção para alternar para a populacional.
Por que a raiz quadrada reintroduz um pequeno viés: a correção de Bessel torna a variância amostral um estimador não viesado da variância populacional, mas a operação de raiz quadrada é não linear e a desigualdade de Jensen atua — o desvio padrão amostral sistematicamentesubestima o verdadeiro desvio padrão populacional, mesmo após a correção N−1. O viés é aproximadamente (1/4n) para dados normais, então 2,5% para n=10, 0,25% para n=100, e negligenciável acima de n=1000. Pacotes estatísticos geralmente ignoram isso; o estimador de correção c4 não viesado s × √((n−1)/2) × Γ((n−1)/2) / Γ(n/2) existe para aplicações onde importa (controle de qualidade com tamanhos de amostra pequenos). Referência: NIST/SEMATECH e-Handbook — Desvio Padrão.
Exemplo prático
Cinco medições de um ensaio químico: 9,8; 10,1; 9,9; 10,3; 10,4. Média x̄ = 10,10. Desvios quadrados: 0,09; 0,00; 0,04; 0,04; 0,09 — soma 0,26. Variância amostral s² = 0,26 / 4 = 0,065; desvio padrão amostral s ≈ 0,255. O desvio padrão populacional (dividir por 5) seria 0,228 — uma subestimativa de 12% da dispersão do processo subjacente ao tratar uma amostra como censo. Para um gráfico de controle de qualidade com limites de controle em x̄ ± 3s, essa diferença move o limite superior de 10,78 para 10,87, alterando materialmente quais execuções de produção acionariam um alarme fora de controle.
Quando isso importa na prática
Testes A/B, ciência laboratorial, pesquisas e finanças extraem inferências de amostras e relatam incerteza como ±s ou como um intervalo de confiança construído sobre s/√n. Usar a fórmula populacional em uma amostra subestima a incerteza e infla a significância estatística — o pecado cardinal nos artigos da crise de reprodutibilidade. Planilhas refletem essa distinção em seus nomes de função: o DESVPAD.A do Excel divide por n−1,DESVPAD.P por n; o.std() do pandas usa ddof=1 por padrão (amostral), o np.std() do NumPy usa ddof=0 por padrão (populacional). Misturá-los é um dos bugs numéricos silenciosos mais comuns em pipelines de dados. Veja também variância e correção de Bessel.
Frequently asked questions
- O que é o desvio padrão amostral?
- O desvio padrão amostral (s) mede a dispersão dos valores em torno da média amostral, calculado como a raiz quadrada dos desvios quadrados médios usando n menos 1 (não n) no denominador. Dividir por n menos 1 (correção de Bessel) produz uma estimativa não viesada do desvio padrão populacional.
- Por que dividir por n menos 1 em vez de n?
- A média amostral é calculada a partir dos mesmos dados, portanto está mais próxima dos valores da amostra do que a verdadeira média populacional estaria. Isso faz com que a soma ingênua dos desvios quadrados subestime a variância real. Dividir por n menos 1 corrige esse viés, produzindo um estimador não viesado.
- Qual é a diferença entre desvio padrão amostral e desvio padrão populacional?
- O desvio padrão populacional (sigma) divide por N (todos os valores) e descreve a dispersão real de uma população completa conhecida. O desvio padrão amostral (s) divide por n menos 1 e é usado quando você tem um subconjunto e quer estimar a dispersão da população. Para n grande, a diferença é negligenciável.
Related
Published May 14, 2026 · Last reviewed May 31, 2026