Skip to content

Guide

Desvio padrão explicado sem a notação matemática

O que ele mede, por que a fórmula tem duas versões e como interpretar o resultado sem um diploma em estatística.

By Published

O desvio padrão é um único número que resume o quanto um conjunto de valores está disperso. Um desvio padrão pequeno significa que os valores estão firmemente agrupados em torno da média. Um grande significa que estão dispersos. Esse é o conceito inteiro. Todo o resto — a fórmula, o debate n-1 vs n, a curva em forma de sino — é apenas mecanismo para tornar a dispersão comparável entre diferentes conjuntos de dados e tamanhos de amostras.

O que ele realmente mede

Imagine duas turmas que têm uma pontuação média de teste de 75.

  • Turma A: notas são 73, 74, 75, 76, 77. Desvio padrão: 1,6.
  • Turma B: notas são 55, 65, 75, 85, 95. Desvio padrão: 15,8.

Mesma média, distribuições muito diferentes. A turma A é uniforme; a turma B tem uma ampla variação. O desvio padrão captura essa diferença em um único número.

A unidade do desvio padrão é a mesma unidade dos dados. Notas de teste em pontos → desvio padrão em pontos. Alturas em centímetros → desvio padrão em centímetros.

Como calculá-lo (em três etapas)

  1. Encontre a média. Some os valores, divida pela contagem.
  2. Calcule a distância quadrada de cada valor em relação à média. Para a turma A, a média é 75. As distâncias quadradas são: (73-75)² = 4, (74-75)² = 1, (75-75)² = 0, (76-75)² = 1, (77-75)² = 4. Soma: 10.
  3. Divida por n-1 (amostral) ou n (populacional), depois tire a raiz quadrada. Turma A: 10/(5-1) = 2,5; sqrt(2,5) = 1,58.

n vs n-1: por que existem duas fórmulas

Se você tem todos os dados (todo valor na população), divida por n. Se você tem uma amostraextraída de uma população maior e quer estimar o desvio padrão dessa população, divida por n-1. A versão n-1 é chamada de desvio padrão amostral; a versão n é o desvio padrão populacional.

Por que a versão amostral usa n-1? Porque a média amostral é ela mesma um ponto da amostra, a amostra subestima a verdadeira dispersão populacional. Dividir por n-1 infla a estimativa o suficiente para corrigir o viés em média. Isso é chamado de correção de Bessel.

Praticamente: o STDEV.S do Excel e o statistics.stdev do Python usam n-1 por padrão. O STDEV.P do Excel e o numpy.stdusam n por padrão. Escolher a função errada altera silenciosamente os resultados por alguns pontos percentuais em amostras pequenas.

Como interpretar o número

  • ~68% dos valores ficam dentro de ±1 desvio padrão da média (para distribuições aproximadamente normais).
  • ~95% ficam dentro de ±2 desvios padrão.
  • ~99,7% ficam dentro de ±3 desvios padrão.

Esta “regra 68-95-99,7” (também chamada de regra empírica) vale para qualquer distribuição aproximadamente em forma de sino.

Expressar uma única observação em “quantos desvios padrão da média” é tão útil que tem seu próprio nome: o escore z.

Quando o desvio padrão é a ferramenta errada

  1. Valores discrepantes. Um valor extremo infla dramaticamente o desvio padrão. Dados de renda são um exemplo clássico. Use o intervalo interquartil ou o desvio absoluto mediano.
  2. Distribuições assimétricas. Quando a maioria dos valores é pequena e alguns são muito grandes, relate percentis ou quartis.
  3. Dados categóricos. O desvio padrão requer uma escala numérica onde a distância tem significado.

Variância: prima do desvio padrão

Variância é o mesmo cálculo sem a raiz quadrada final. Está em unidades ao quadrado (pontos², cm²), o que é mais difícil de interpretar diretamente, mas mais fácil de trabalhar matematicamente — variâncias podem ser somadas entre fontes independentes, enquanto desvios padrão não podem.

Exemplo trabalhado rápido

Conjunto de dados: [4, 8, 6, 5, 3, 7]

  • Média: (4+8+6+5+3+7) / 6 = 5,5
  • Desvios quadrados: (4-5,5)² = 2,25, (8-5,5)² = 6,25, (6-5,5)² = 0,25, (5-5,5)² = 0,25, (3-5,5)² = 6,25, (7-5,5)² = 2,25
  • Soma dos desvios quadrados: 17,5
  • Variância amostral (÷ n-1): 17,5 / 5 = 3,5
  • Desvio padrão amostral: √3,5 = 1,87

Verifique com nossa calculadora de estatística — ela calcula média, mediana, ambas as versões do desvio padrão e percentis em uma única passagem.

Erros comuns

  • Usar n vs n-1 de forma inconsistente em um relatório.Misturar STDEV.S do Excel com o padrão do NumPynumpy.std na mesma análise produz pequenas, mas reais, discrepâncias.
  • Relatar o DP sem n. O desvio padrão de três medidas é essencialmente não informativo. Com n=3, sua estimativa de DP tem seu próprio erro padrão de ~40%.
  • Tratar “eventos de 3 sigma” como impossíveis.A figura de 99,7% vale para distribuições normais. Dados do mundo real com caudas pesadas (mercados, desastres naturais) produzem eventos de 3 sigma muito mais frequentemente do que o modelo normal prevê.
  • Confundir DP com erro padrão. O desvio padrão descreve a dispersão dos dados; o erro padrão da média descreve a precisão da estimativa da média. EPM = DP / √n.
  • Somar desvios padrão. Os DP não se somam. As variâncias de variáveis independentes se somam; tire a raiz quadrada da soma para obter o DP combinado. DP_combinado = √(DP₁² + DP₂²).

Para a questão do centro da distribuição que se combina com a dispersão, continue com nosso guia de média, mediana e moda.

Frequently asked questions

O que o desvio padrão realmente mede?
O desvio padrão mede o quanto um conjunto de valores está disperso em torno da média. Um desvio padrão pequeno significa que os valores se agrupam firmemente em torno da média; um grande significa que estão amplamente dispersos. A unidade é a mesma dos dados — pontos, reais, milissegundos etc.
Qual é a diferença entre o desvio padrão populacional e o amostral?
O desvio padrão populacional divide por n (todos os dados). O desvio padrão amostral divide por n−1 (correção de Bessel) para produzir uma estimativa não tendenciosa quando você tem apenas uma amostra. O STDEV.S do Excel e o statistics.stdev do Python usam n−1; o numpy.std usa n por padrão.
O que a regra 68-95-99,7 significa para o desvio padrão?
Para distribuições aproximadamente normais, cerca de 68% dos valores ficam dentro de ±1 desvio padrão da média, 95% dentro de ±2 e 99,7% dentro de ±3. Isso permite converter rapidamente um desvio padrão em uma imagem mental de quão extremo é qualquer valor individual.
Quando o desvio padrão é a ferramenta errada a usar?
O desvio padrão é enganoso quando os dados contêm valores discrepantes (um valor extremo o infla dramaticamente), são fortemente assimétricos (renda, preços de imóveis) ou são categóricos. Para dados assimétricos, relate o intervalo interquartil ou o desvio absoluto mediano.
Você pode somar desvios padrão?
Não. Desvios padrão não se somam diretamente. As variâncias de variáveis independentes se somam, então a fórmula correta é DP_combinado = √(DP₁² + DP₂²). Somar desvios padrão diretamente superestima a dispersão combinada.

Related

Published May 16, 2026