Guide
Média, mediana, moda: quando cada uma é a média certa
Mesmo conjunto de dados, três ‘médias’. Escolher a certa é a diferença entre informar e enganar.
By Buğra SözeriPublished
“Média” na fala cotidiana geralmente significa a média aritmética. Em estatística é uma palavra mais vaga cobrindo pelo menos três métricas diferentes: média, mediana e moda. Cada uma mede “o valor típico” em um conjunto de dados, mas respondem a perguntas diferentes e discordam dramaticamente em dados assimétricos. Este guia explica quando cada uma é a ferramenta certa.
As três definições, rápido
- Média — soma de todos os valores dividida pela contagem. O padrão. Mesmas unidades que os dados.
- Mediana — o valor do meio do conjunto de dados ordenado. Metade acima, metade abaixo.
- Moda — o valor que ocorre com mais frequência. A única que funciona em dados não numéricos.
A divergência clássica: renda
Renda domiciliar dos EUA, 2023 (Pesquisa da Comunidade Americana):
- Média: $111.000
- Mediana: $80.610
- Moda: aproximadamente $40.000-50.000 (o intervalo mais populoso)
Três números que todos respondem “quanto ganha um domicílio típico dos EUA?” — e discordam por um fator de até três. A média é puxada para cima pelos 1% maiores ganhadores; a mediana fica na metade real da distribuição; a moda reflete onde está o maior intervalo.
Para discussões de política e manchetes de notícias, a mediana é quase sempre o número certo — é robusta contra valores discrepantes e representa um domicílio realmente alcançável. A média engana, exceto para orçamentos aritméticos (imposto arrecadado = domicílios × renda média).
Quando usar cada uma
Use a MÉDIA quando
- A distribuição é aproximadamente simétrica. Alturas, pontuações de QI, erro de medição. A média e a mediana concordam estreitamente; a média é adequada para reportar.
- Você precisa calcular totais a partir de médias. A média (× contagem) fornece a soma exatamente. A mediana não. Para orçamento, contabilidade e integrais, a média é obrigatória.
- Você vai alimentá-la em outras estatísticas. Variância, desvio padrão, intervalos de confiança todos se baseiam na média. Escolha a mediana e você perde o kit de ferramentas downstream.
Use a MEDIANA quando
- A distribuição é assimétrica. Renda, preços de imóveis, tempos de resposta, tamanhos de arquivos, internações hospitalares, custos de projetos. A mediana é o que as pessoas reais vivenciam; a média é o que um bilionário / um corredor de maratona extremo infla.
- Valores discrepantes são prováveis e não controlados. Dados de sensores com falhas ocasionais, números inseridos manualmente com erros de digitação, análises da web com tráfego de bots. A mediana os filtra automaticamente.
- Você quer a “experiência típica”. Tempo de espera médiano, deslocamento médiano, tempo de resposta médiano no atendimento ao cliente. Estas são perguntas sobre indivíduos típicos, não throughput agregado.
Use a MODA quando
- Os dados são categóricos. Cor favorita, navegador usado, país de origem. Média e mediana são indefinidas para estes; moda é o único resumo.
- Você quer o caso mais comum. Produto mais popular, tipo de erro mais comum, tamanho de caixa UPS mais enviado. A moda é a única métrica que responde isso diretamente.
- Você suspeita de uma distribuição bimodal. Alturas masculinas+femininas combinadas, dados de clima quente-frio, tráfego de rede em pico/fora de pico. Reportar duas modas captura a estrutura que uma única média ocultaria.
A armadilha da distribuição assimétrica
Artigos de notícias rotineiramente reportam renda média, preço médio de casas, tempo de resposta médio. Todas as três são distribuições assimétricas à direita; em todas as três a média é consistentemente mais alta do que a mediana; reportar a média sistematicamente superestima o “típico”.
Teste rápido: se o conjunto de dados tem um piso fixo (zero) e sem teto fixo, provavelmente é assimétrico à direita. Use a mediana.
Exemplos por tipo:
| Conjunto de dados | Forma | Usar |
|---|---|---|
| Altura de adultos | Aproximadamente normal | Média OK |
| Renda | Assimétrica à direita | Mediana |
| Patrimônio líquido | Muito assimétrica à direita | Mediana (média engana dramaticamente) |
| Tempo de resposta de API | Assimétrica à direita | Mediana + percentis |
| Tempo de internação hospitalar | Assimétrica à direita | Mediana |
| Tamanhos de arquivos em uma pasta | Assimétrica à direita | Mediana |
| Pontuações de teste (bem projetado) | Aproximadamente normal | Média OK |
| Temperatura diária | Aproximadamente normal | Média OK |
Como detectar a mentira
Três frases para observar em afirmações usando “média”:
- “O americano médio ganha $X.”Se $X > $90.000, é a média. A mediana é ~$80 mil. A média é tecnicamente correta, mas responde a uma pergunta diferente.
- “Tempo de resposta médio: 200 ms.”Para uma API, isso é quase certamente a média, que algumas solicitações lentas inflaram. A mediana é provavelmente 50-100 ms; o p99 pode ser 2000 ms. A média sozinha diz pouco.
- “X mais popular é...”Isso é a moda. Se usada corretamente, está bem; se usada no lugar de média ou mediana, é enganosa.
Quando reportar as três
Apresentação honesta de dados geralmente mostra média, mediana e uma medida de dispersão (desvio padrão ou intervalo interquartil). A diferença entre média e mediana diz ao leitor instantaneamente o quão assimétrica é a distribuição. Uma média de $111 mil e mediana de $81 mil diz mais do que qualquer número sozinho — ou seja, a distribuição tem uma longa cauda à direita.
Calcule os três (mais percentis, desvio padrão e um histograma) em uma única passagem com nossa calculadora de estatísticas. Para o contexto do estatístico sobre variância e desvio padrão, veja desvio padrão explicado.
Exemplo trabalhado: monitoramento de tempo de resposta
Seis solicitações de API esta manhã medidas em milissegundos: [42, 51, 48, 55, 47, 2.800]. A última é um valor discrepante de inicialização a frio. Três resumos:
- Média: (42+51+48+55+47+2800)/6 = 507 ms.
- Mediana: ordenar para [42, 47, 48, 51, 55, 2800], pegar a média dos dois valores do meio = 49,5 ms.
- Moda: todos os valores aparecem uma vez, portanto a moda é indefinida para esta amostra.
Reportar apenas a média (“tempo médio de resposta: 507 ms”) convenceria uma parte interessada de que a API estava quebrada. Reportar apenas a mediana (“resposta típica: 49,5 ms”) oculta o problema de inicialização a frio. O resumo honesto é ambos os números mais o p99: “mediana 50 ms, p99 ~2,8 s — rápido no caso comum, picos ocasionais de inicialização a frio.” Isso é acionável; qualquer número sozinho não é.
Erros comuns
- Calcular a “média das médias”. A média das médias de três grupos não é a média dos dados combinados, a menos que os grupos sejam do mesmo tamanho. Sempre recalcule a partir dos dados brutos, ou use uma média ponderada com tamanhos de grupo como pesos.
- Reportar a mediana sem uma métrica de dispersão. Dois conjuntos de dados com medianas idênticas podem ter formas completamente diferentes. Adicione o intervalo interquartil (Q3 − Q1) ou um resumo de quartis; um resumo de cinco números (mín, Q1, mediana, Q3, máx) é uma linha honesta e barata.
- Chamar uma distribuição bimodal de “a média”. Uma distribuição de altura combinada masculina+feminina tem dois picos em ~168 cm e ~178 cm. A média (~173 cm) não descreve ninguém. Desagregue por grupo e reporte cada subpopulação separadamente.
- Usar moda para dados contínuos. Para medições verdadeiramente contínuas (alturas, pesos, tempos de resposta) cada valor é tecnicamente único; a moda é indefinida ou um artefato da granularidade de medição. Use um histograma e identifique o intervalo mais denso.
- Comparar médias em amostras truncadas. Médias são extremamente sensíveis a se valores discrepantes estão incluídos. Se dois estudos reportam médias diferentes e um excluiu valores discrepantes acima do 99º percentil, a diferença pode ser totalmente artificial.
Para a questão de dispersão relacionada (quão dispersos os dados estão em torno do centro), continue com nosso guia de desvio padrão. Para o enquadramento de variação percentual que frequentemente segue as estatísticas sumárias, veja porcentagem vs. ponto percentual.
Frequently asked questions
- Qual é a diferença entre média, mediana e moda?
- Média é a soma dividida pela contagem. Mediana é o valor do meio quando os dados são ordenados — metade dos valores está acima, metade abaixo. Moda é o valor que ocorre com mais frequência. Todas as três são ‘médias’, mas discordam significativamente em dados assimétricos.
- Por que o Censo dos EUA usa a renda domiciliar mediana em vez da média?
- A renda é assimétrica à direita — um pequeno número de pessoas com renda muito alta puxa a média muito acima do que a maioria dos domicílios realmente ganha. Em 2023, a renda domiciliar média dos EUA era de cerca de $111.000, enquanto a mediana era $80.610. A mediana representa melhor a experiência do domicílio típico.
- Quando devo usar a mediana em vez da média?
- Use a mediana quando os dados têm um piso fixo em zero e sem teto (renda, preços de imóveis, tempos de resposta, tamanhos de arquivos), contêm valores discrepantes não controlados ou quando você quer representar a experiência típica individual. Se média e mediana diferem substancialmente, os dados são assimétricos e a mediana geralmente é mais informativa.
- Quando a moda é mais útil do que média ou mediana?
- A moda é a única medida de tendência central que funciona em dados categóricos (não numéricos) — cor favorita, tipo de navegador, país de origem. É também a escolha certa quando a questão é ‘qual é o valor mais comum’ — tamanho de produto mais popular, código de erro mais frequente.
- Um conjunto de dados pode ter mais de uma moda?
- Sim. Uma distribuição bimodal tem duas modas — por exemplo, dados de altura combinados masculinos e femininos têm picos em aproximadamente 168 cm e 178 cm. Reportar uma única média de ~173 cm não descreve ninguém no conjunto de dados; reportar duas modas revela a estrutura.
Related
Published May 16, 2026