Guide
Desvio padrão explicado sem a notação matemática
O que ele mede, por que a fórmula tem duas versões e como interpretar o resultado sem um diploma em estatística.
By Buğra SözeriPublished
O desvio padrão é um único número que resume o quanto um conjunto de valores está disperso. Um desvio padrão pequeno significa que os valores estão firmemente agrupados em torno da média. Um grande significa que estão dispersos. Esse é o conceito inteiro. Todo o resto — a fórmula, o debate n-1 vs n, a curva em forma de sino — é apenas mecanismo para tornar a dispersão comparável entre diferentes conjuntos de dados e tamanhos de amostras.
O que ele realmente mede
Imagine duas turmas que têm uma pontuação média de teste de 75.
- Turma A: notas são 73, 74, 75, 76, 77. Desvio padrão: 1,6.
- Turma B: notas são 55, 65, 75, 85, 95. Desvio padrão: 15,8.
Mesma média, distribuições muito diferentes. A turma A é uniforme; a turma B tem uma ampla variação. O desvio padrão captura essa diferença em um único número.
A unidade do desvio padrão é a mesma unidade dos dados. Notas de teste em pontos → desvio padrão em pontos. Alturas em centímetros → desvio padrão em centímetros.
Como calculá-lo (em três etapas)
- Encontre a média. Some os valores, divida pela contagem.
- Calcule a distância quadrada de cada valor em relação à média. Para a turma A, a média é 75. As distâncias quadradas são: (73-75)² = 4, (74-75)² = 1, (75-75)² = 0, (76-75)² = 1, (77-75)² = 4. Soma: 10.
- Divida por n-1 (amostral) ou n (populacional), depois tire a raiz quadrada. Turma A: 10/(5-1) = 2,5; sqrt(2,5) = 1,58.
n vs n-1: por que existem duas fórmulas
Se você tem todos os dados (todo valor na população), divida por n. Se você tem uma amostraextraída de uma população maior e quer estimar o desvio padrão dessa população, divida por n-1. A versão n-1 é chamada de desvio padrão amostral; a versão n é o desvio padrão populacional.
Por que a versão amostral usa n-1? Porque a média amostral é ela mesma um ponto da amostra, a amostra subestima a verdadeira dispersão populacional. Dividir por n-1 infla a estimativa o suficiente para corrigir o viés em média. Isso é chamado de correção de Bessel.
Praticamente: o STDEV.S do Excel e o statistics.stdev do Python usam n-1 por padrão. O STDEV.P do Excel e o numpy.stdusam n por padrão. Escolher a função errada altera silenciosamente os resultados por alguns pontos percentuais em amostras pequenas.
Como interpretar o número
- ~68% dos valores ficam dentro de ±1 desvio padrão da média (para distribuições aproximadamente normais).
- ~95% ficam dentro de ±2 desvios padrão.
- ~99,7% ficam dentro de ±3 desvios padrão.
Esta “regra 68-95-99,7” (também chamada de regra empírica) vale para qualquer distribuição aproximadamente em forma de sino.
Expressar uma única observação em “quantos desvios padrão da média” é tão útil que tem seu próprio nome: o escore z.
Quando o desvio padrão é a ferramenta errada
- Valores discrepantes. Um valor extremo infla dramaticamente o desvio padrão. Dados de renda são um exemplo clássico. Use o intervalo interquartil ou o desvio absoluto mediano.
- Distribuições assimétricas. Quando a maioria dos valores é pequena e alguns são muito grandes, relate percentis ou quartis.
- Dados categóricos. O desvio padrão requer uma escala numérica onde a distância tem significado.
Variância: prima do desvio padrão
Variância é o mesmo cálculo sem a raiz quadrada final. Está em unidades ao quadrado (pontos², cm²), o que é mais difícil de interpretar diretamente, mas mais fácil de trabalhar matematicamente — variâncias podem ser somadas entre fontes independentes, enquanto desvios padrão não podem.
Exemplo trabalhado rápido
Conjunto de dados: [4, 8, 6, 5, 3, 7]
- Média: (4+8+6+5+3+7) / 6 = 5,5
- Desvios quadrados: (4-5,5)² = 2,25, (8-5,5)² = 6,25, (6-5,5)² = 0,25, (5-5,5)² = 0,25, (3-5,5)² = 6,25, (7-5,5)² = 2,25
- Soma dos desvios quadrados: 17,5
- Variância amostral (÷ n-1): 17,5 / 5 = 3,5
- Desvio padrão amostral: √3,5 = 1,87
Verifique com nossa calculadora de estatística — ela calcula média, mediana, ambas as versões do desvio padrão e percentis em uma única passagem.
Erros comuns
- Usar n vs n-1 de forma inconsistente em um relatório.Misturar
STDEV.Sdo Excel com o padrão do NumPynumpy.stdna mesma análise produz pequenas, mas reais, discrepâncias. - Relatar o DP sem n. O desvio padrão de três medidas é essencialmente não informativo. Com n=3, sua estimativa de DP tem seu próprio erro padrão de ~40%.
- Tratar “eventos de 3 sigma” como impossíveis.A figura de 99,7% vale para distribuições normais. Dados do mundo real com caudas pesadas (mercados, desastres naturais) produzem eventos de 3 sigma muito mais frequentemente do que o modelo normal prevê.
- Confundir DP com erro padrão. O desvio padrão descreve a dispersão dos dados; o erro padrão da média descreve a precisão da estimativa da média. EPM = DP / √n.
- Somar desvios padrão. Os DP não se somam. As variâncias de variáveis independentes se somam; tire a raiz quadrada da soma para obter o DP combinado. DP_combinado = √(DP₁² + DP₂²).
Para a questão do centro da distribuição que se combina com a dispersão, continue com nosso guia de média, mediana e moda.
Frequently asked questions
- O que o desvio padrão realmente mede?
- O desvio padrão mede o quanto um conjunto de valores está disperso em torno da média. Um desvio padrão pequeno significa que os valores se agrupam firmemente em torno da média; um grande significa que estão amplamente dispersos. A unidade é a mesma dos dados — pontos, reais, milissegundos etc.
- Qual é a diferença entre o desvio padrão populacional e o amostral?
- O desvio padrão populacional divide por n (todos os dados). O desvio padrão amostral divide por n−1 (correção de Bessel) para produzir uma estimativa não tendenciosa quando você tem apenas uma amostra. O STDEV.S do Excel e o statistics.stdev do Python usam n−1; o numpy.std usa n por padrão.
- O que a regra 68-95-99,7 significa para o desvio padrão?
- Para distribuições aproximadamente normais, cerca de 68% dos valores ficam dentro de ±1 desvio padrão da média, 95% dentro de ±2 e 99,7% dentro de ±3. Isso permite converter rapidamente um desvio padrão em uma imagem mental de quão extremo é qualquer valor individual.
- Quando o desvio padrão é a ferramenta errada a usar?
- O desvio padrão é enganoso quando os dados contêm valores discrepantes (um valor extremo o infla dramaticamente), são fortemente assimétricos (renda, preços de imóveis) ou são categóricos. Para dados assimétricos, relate o intervalo interquartil ou o desvio absoluto mediano.
- Você pode somar desvios padrão?
- Não. Desvios padrão não se somam diretamente. As variâncias de variáveis independentes se somam, então a fórmula correta é DP_combinado = √(DP₁² + DP₂²). Somar desvios padrão diretamente superestima a dispersão combinada.
Related
Published May 16, 2026