Glossary
Mediana
O centro de um conjunto de dados ordenado
By Buğra SözeriPublished Updated
Mediana é o valor central de um conjunto de dados ordenado. Para [3, 4, 5, 6, 7, 8] (seis valores), a mediana é 5,5 (a média dos dois valores centrais). Para [3, 4, 5, 6, 7] (cinco valores), a mediana é 5. Metade dos dados está abaixo, metade acima.
A mediana é famosamente robusta: um único outlier extremo não consegue puxá-la. A mediana de [1, 2, 3, 4, 5] é 3. A mediana de [1, 2, 3, 4, 1000] ainda é 3. Isso torna a mediana o resumo correto para distribuições assimétricas — renda, preços de imóveis, tempos de resposta, tamanhos de arquivos — onde um ou dois valores extremos dominariam a média aritmética.
É o mesmo que o 50º percentil. Calculá-la diretamente (ordenar, pegar o meio) é O(n log n); para conjuntos muito grandes, um algoritmo quickselect encontra a mediana em O(n) esperado.
Use a calculadora de estatísticas para mediana, média, moda e quartis em uma única passagem.
Por que “renda domiciliar mediana” é o número que os economistas realmente citam: o Census Bureau dos EUA reporta a renda domiciliar mediana porque é o resumo honesto de um número de uma distribuição fortemente assimétrica à direita. Conforme o ACS de 2023, a renda domiciliar mediana dos EUA era de cerca de US$80.000, enquanto a média era de cerca de US$112.000 — a diferença é a influência do topo da distribuição sobre a média aritmética. A mesma diferença aparece em preços de imóveis (a NAR reporta medianas, não médias), pesquisas salariais e monitoramento de tempo de resposta em software (todo painel de observabilidade cita p50 = mediana, não latência média). Quando um número é “average” sem qualificação em dados assimétricos, pergunte qual média — a diferença entre as duas geralmente é a notícia.
A mediana é um estimador robusto de localização — mas com um custo: a mediana tem um ponto de ruptura de 50% (seria necessário corromper mais da metade dos dados para mover a mediana arbitrariamente longe), enquanto a média tem um ponto de ruptura de 0% (um único infinito move a média para infinito). O trade-off é eficiência estatística: sob uma distribuição normal limpa, o intervalo de confiança da mediana é cerca de 25% mais amplo do que o da média para o mesmo tamanho de amostra. Então, para dados limpos e simétricos, a média é mais informativa; para dados do mundo real bagunçados, a mediana é mais segura. Médias aparadas (descartar o topo e o fundo de 5%) e o estimador de Hodges-Lehmann ficam no espectro entre as duas. Relacionados: média, percentil, IQR.
Exemplo prático
Onze preços de venda de imóveis em um bairro (em milhares de reais): [280, 295, 310, 320, 340, 355, 360, 380, 410, 450, 2400]. Ordene a lista (já ordenada). Com n = 11, a mediana é o 6º valor: R$355.000. A média é soma/11 = 5900/11 ≈ R$536.000. A única mansão à beira-mar de R$2,4M empurrou a média ~R$180.000 acima de qualquer um dos dez comparáveis realistas — um comprador usando “preço médio” para avaliar o bairro superestimaria em 50%. A mediana ignora esse outlier completamente. Adicione uma 12ª venda por R$370.000: agora n = 12, a mediana é a média do 6º e 7º valores, (355 + 360)/2 = R$357.500. A técnica generaliza: qualquer observação extrema em uma grande amostra move a mediana no máximo uma posição na lista ordenada.
Quando e por que isso importa
A mediana é a métrica correta sempre que a distribuição tem uma cauda longa e você quer um número que represente “o caso típico.” Isso cobre a maioria das métricas operacionais que os humanos se importam — renda domiciliar, preços de imóveis, tempo de resolução de tickets de suporte, tempos de carregamento de página, tamanhos de arquivos em um repositório, palavras por frase em um corpus de documentos. Ao monitorar latência de software, a prática padrão é mostrar p50 (mediana) e p99 juntos: a mediana diz se o usuário típico está satisfeito; p99 diz se a cauda é aceitável. Reportar apenas uma média pode mascarar uma distribuição bimodal (dois grupos de usuários com experiências muito diferentes) que a mediana mais alguns percentis revela imediatamente. Referência: US Census Bureau — Income in the United States: 2023.
Frequently asked questions
- O que é a mediana?
- A mediana é o valor central de um conjunto de dados quando ordenado. Para uma quantidade ímpar de valores, é o valor central; para uma quantidade par, é a média dos dois valores centrais.
- Quando devo usar a mediana em vez da média?
- Use a mediana para distribuições assimétricas ou dados com outliers — renda, preços de imóveis, tempos de resposta. Um único valor extremo não pode deslocar a mediana mais do que uma posição, enquanto pode mover a média dramaticamente.
- Qual é a diferença entre mediana e percentil?
- A mediana é o 50º percentil — o ponto em que metade dos dados cai abaixo e metade acima. Qualquer percentil divide os dados de forma similar: o 90º percentil é o valor abaixo do qual 90% das observações caem.
- Como encontro a mediana de um conjunto com número par de elementos?
- Ordene os valores, pegue os dois elementos centrais e calcule a média. Para [3, 7, 10, 14], os dois valores centrais são 7 e 10, então a mediana é (7+10)/2 = 8,5.
Related
Published May 16, 2026 · Last reviewed May 31, 2026