Glossary
Média geométrica
A média correta para taxas de composição
By Buğra SözeriPublished Updated
A média geométrica é a raiz n-ésima do produto de n valores: GM = (x₁ × x₂ × ... × xₙ)^(1/n). Ao contrário da média aritmética, a média geométrica é a ferramenta certa para calcular a média de razões, porcentagens e taxas de crescimento composto.
Por que isso importa: imagine um investimento que retorna +50% no ano 1 e −50% no ano 2. A média aritmética de [1,5; 0,5] é 1,0 — sugerindo que o investimento ficou no zero. Mas R$ 100 investidos se tornam R$ 150 após o ano 1 e R$ 75 após o ano 2 — uma perda de 25%. A média geométrica de [1,5; 0,5] é √(1,5 × 0,5) = √0,75 ≈ 0,866, indicando corretamente uma perda anualizada de 13,4%.
Casos de uso padrão:
- Taxa de crescimento anual composta (CAGR). A média geométrica das razões ano a ano.
- Números-índice. Índices de ações ponderados por razões usam médias geométricas para evitar distorção da média aritmética.
- Comparações de razão de razões. Quando as entradas são multiplicativas em vez de aditivas (ganhos compostos, dosagem).
A média geométrica é sempre ≤ à média aritmética. A igualdade ocorre apenas quando todos os valores são idênticos. Para valores muito variados, a diferença pode ser grande — o que é precisamente por que usar a correta importa.
Exemplo prático
Você investe R$ 10.000 em um fundo. Retornos: ano 1 +30%, ano 2 −20%, ano 3 +25%, ano 4 −10%, ano 5 +15%. Média aritmética de [30, −20, 25, −10, 15] = 8% — o que o folheto de marketing citaria. Agora componha o dinheiro real: 10.000 × 1,30 × 0,80 × 1,25 × 0,90 × 1,15 = 10.000 × 1,3455 = R$ 13.455. Ganho total de 34,55% em cinco anos. A média geométrica: (1,30 × 0,80 × 1,25 × 0,90 × 1,15)^(1/5) = 1,3455^0,2 ≈ 1,0612 — um retorno anualizado de 6,12%. Esse é o “CAGR” que a SEC exige que os fundos mútuos americanos divulguem em vez da média aritmética, porque reportar 8% implicaria 1,08⁵ × 10.000 = R$ 14.693 — superestimando o desempenho real em 9%. A discrepância cresce com a volatilidade dos retornos: dois ativos com a mesma média aritmética de retorno podem ter CAGRs muito diferentes se um for mais volátil.
Mais um caso ilustrativo: um backtest de estratégia de trading algorítmico reporta retornos de [+40%, +30%, −50%, +20%, +10%] ao longo de cinco anos. Média aritmética: 10% ao ano. Média geométrica: (1,40 × 1,30 × 0,50 × 1,20 × 1,10)^(1/5) ≈ 1,2012^0,2 ≈ 1,037 — apenas 3,7% anualizado. O ano de −50% domina tudo; um único drawdown profundo destrói o retorno de longo prazo independentemente dos ganhos subsequentes. É por isso que as divulgações de fundos de hedge enfatizam o “drawdown máximo” juntamente com os retornos anualizados.
Quando e por que isso importa
A média geométrica importa em qualquer contexto onde os números se compõem: retornos de investimentos, taxas de crescimento biológico, disseminação viral (R₀) e depreciação. O erro da média aritmética é maior quando os valores individuais variam amplamente — retornos simétricos de ±50% produzem uma perda líquida porque ganhos e perdas se compõem assimetricamente (uma perda de 50% requer um ganho de 100% para se recuperar). A mesma lição se aplica a porcentagens de perda de peso, contagens de colônias bacterianas e qualquer “taxa média de variação” relatada em múltiplos períodos de tempo. O erro oposto — usar a média geométrica para quantidades aditivas como temperaturas diárias ou notas — produz números sem sentido. A regra: se os valores se multiplicam para produzir o resultado final, use a média geométrica; se se somam, use aritmética. Para cenários mistos (índices de Sharpe, médias ponderadas), existem fórmulas especializadas. Referência: Investopedia — Taxa de Crescimento Anual Composta.
O truque de estabilidade numérica — trabalhe no espaço logarítmico: calcular o produto de muitos valores diretamente causa overflow ou underflow nos doubles IEEE 754 rapidamente (10 valores de 0,1 cada produz 10⁻¹⁰, ok; 50 valores produz 10⁻⁵⁰, ok; 500 valores produz 0,0, definitivamente não ok). A solução padrão é calcular exp(mean(log(x))) em vez disso. Os logaritmos transformam o produto em uma soma, a soma permanece dentro do intervalo representável e o exp final recupera a média geométrica. Toda biblioteca estatística (NumPy, SciPy, R) implementa a média geométrica dessa forma internamente; fazer o cálculo ingenuamente é uma das formas mais comuns de produzir silenciosamente zeros para amostras grandes.
Por que a média geométrica funciona para razões — a intuição: as razões vivem em uma escala logarítmica, não linear. “Duplicado” (×2) e “reduzido à metade” (×0,5) são mudanças multiplicativas simétricas — eles devem ter média de “nenhuma mudança” (×1), não de “1,25×” como a média aritmética sugeriria. A média geométrica respeita essa simetria porque calcula o logaritmo médio das razões. É por isso que finanças, biologia (taxas de crescimento celular) e física (decaimento radioativo) usam por padrão médias geométricas para razões de séries temporais. Relacionado: média harmônica, média aritmética, juros compostos. Referência: NIST/SEMATECH e-Handbook — Média Geométrica.
Frequently asked questions
- O que é a média geométrica?
- A média geométrica de n valores é a raiz n-ésima do produto desses valores. É a média correta quando os valores se compõem multiplicativamente, como retornos de investimentos ou taxas de crescimento.
- Quando devo usar a média geométrica em vez da média aritmética?
- Use a média geométrica sempre que os valores se multiplicam para produzir um resultado — juros compostos, CAGR, crescimento populacional, R₀ viral. Para quantidades aditivas como temperaturas ou notas, use a média aritmética.
- Por que um ganho de +50% seguido de uma perda de −50% não fica no zero?
- Porque ganhos e perdas se compõem de forma assimétrica: 1,5 × 0,5 = 0,75, uma perda líquida de 25%. A média geométrica de [1,5; 0,5] é √0,75 ≈ 0,866, refletindo a perda anualizada real de −13,4%, enquanto a média aritmética de 1,0 sugere nenhuma mudança.
- Como calcular a média geométrica sem overflow de ponto flutuante?
- Use exp(mean(log(x))) em vez de calcular o produto bruto. Isso transforma a multiplicação em adição no espaço logarítmico, evitando overflow ou underflow para grandes conjuntos de dados.
Related
Published May 16, 2026 · Last reviewed May 31, 2026