Skip to content

Glossary

Intervalo interquartil

Q3 − Q1: os 50% centrais

By Published Updated

O intervalo interquartil (IQR) é a diferença entre o percentil 75 (Q3) e o percentil 25 (Q1). Ele captura os 50% centrais de um conjunto de dados — o intervalo que contém os valores “típicos”.

Para o conjunto de dados [1, 3, 4, 5, 6, 7, 8, 9, 10, 20]: Q1 = 4, Q3 = 9, IQR = 5. A metade central dos dados fica entre 4 e 9. O outlier 20 não afeta o IQR em nada.

Por que o IQR importa: é robusto a outliers de uma forma que o desvio padrão não é. Para distribuições assimétricas (renda, tempos de resposta, tamanhos de arquivo), o IQR descreve a amplitude muito melhor do que o DP. A regra comum de 1,5 × IQR define outliers como valores abaixo de Q1 − 1,5×IQR ou acima de Q3 + 1,5×IQR — a convenção de Tukey e a base dos box plots.

Use IQR quando: os dados são assimétricos, outliers são comuns, ou você quer um resumo em um número que não induza ao erro. Use desvio padrão quando: os dados são aproximadamente normais e você quer alimentar estatísticas subsequentes (intervalos de confiança, regressão).

Exemplo prático

Latências de requisições HTTP de amostra (ms): [12, 14, 18, 22, 25, 28, 31, 33, 38, 42, 45, 48, 52, 58, 64, 71, 89, 110, 180, 4200]. Média: 264 ms — puxada para cima pelo outlier de 4200 ms (provavelmente uma falha de rede ou cold-start). Mediana (Q2): 43,5 ms. Q1: 25,75 ms. Q3: 67,25 ms. IQR = Q3 − Q1 = 41,5 ms. A cerca superior de 1,5 × IQR de Tukey = Q3 + 62,25 = 129,5 ms. Então a requisição de 180 ms está na fronteira do outlier; a de 4200 ms está muito além — uma anomalia clara que vale investigar. O desvio padrão desse mesmo conjunto de dados é aproximadamente 920 ms, dominado inteiramente pelo ponto de 4200 ms, e sugeriria que a latência típica é 264 ± 920 ms — o que não faz sentido (latência não pode ser negativa). O resumo baseado em IQR (“mediana 43,5 ms, IQR de 25,75 a 67,25 ms”) é a descrição fiel do desempenho típico.

A aritmética de quartis também se generaliza: decis dividem os dados em dez partes, quintis em cinco, percentis em cem. As estatísticas de renda geralmente usam decis (“o décimo superior dos trabalhadores americanos”), a pontuação de crédito usa percentis (“seu FICO está no percentil 78”), e os gráficos de crescimento clínico plotam altura/peso infantil em relação a percentis de idade e sexo. O modelo mental é o mesmo: resumo baseado em classificação que ignora a escala dos valores.

Quando e por que importa

O IQR importa sempre que os dados são assimétricos — o que na prática é a maioria dos dados do mundo real fora de experimentos físicos. Tempos de resposta, distribuições de renda, tamanhos de arquivo, tempos de atenção, vendas por loja e quase tudo em análise de produtos de tecnologia têm uma distribuição de cauda direita onde alguns valores grandes dominam a média. Reportar “tempo médio de resposta” para uma API induz ao erro os leitores; reportar p50, p90, p99 — três percentis — comunica a forma da distribuição. Os engenheiros de confiabilidade de sites aprenderam essa lição da maneira difícil nos anos 2000; as plataformas modernas de observabilidade (Datadog, Honeycomb, histogramas Prometheus) usam por padrão métricas baseadas em percentis para latência. O erro a evitar é calcular apenas a “média” e agir com base nela: otimizar a latência média quando a dor do usuário está no p99 desperdiça esforço de engenharia. Referência: Manual NIST/SEMATECH e-Handbook — Quartis.

Por que há nove maneiras de calcular um quartil: a posição de Q1 em um conjunto de dados de N valores é ambígua quando N não é um múltiplo de 4 + 1, e estatísticos propuseram nove convenções para interpolação entre valores adjacentes. A função quantile() do R usa por padrão o Tipo 7 (interpolação linear entre estatísticas de ordem), QUARTILE.INC do Excel corresponde ao Tipo 7, np.percentile() do NumPy também usa linear por padrão, mas SAS, Minitab e o método de dobradiça original de Tukey usam fórmulas diferentes. Os IQRs diferem em alguns por cento entre métodos em amostras pequenas e convergem conforme N cresce. A calculadora de estatísticas do Convertitive usa o Tipo 7 porque corresponde às ferramentas de análise mais amplamente implantadas.

Box plots, IQR e detecção de outliers em sistemas de produção: a cerca de 1,5 × IQR de Tukey é a base dos whiskers de box plots e é amplamente usada em painéis de observabilidade (Datadog, Grafana, agregadores de quantis Prometheus) para sinalizar outliers de latência sem assumir uma distribuição normal. Para dados de cauda muito pesada (latência de requisições web, retornos financeiros), até mesmo 1,5 × IQR é muito agressivo — as latências de requisição frequentemente ficam na cauda de “outlier” por design, e sinalizá-las como anomalias gera ruído. A correção pragmática é ampliar para 3 × IQR para definições de outliers extremos ou mudar para objetivos de nível de serviço baseados em percentis (p95, p99) inteiramente. Relacionado: percentil, mediana, variância.

Frequently asked questions

O que é o intervalo interquartil (IQR)?
O IQR é a diferença entre o percentil 75 (Q3) e o percentil 25 (Q1) de um conjunto de dados. Ele mede a amplitude dos 50% centrais dos valores, ignorando os extremos.
Como o IQR é usado para detectar outliers?
A regra padrão marca qualquer valor abaixo de Q1 − 1,5×IQR ou acima de Q3 + 1,5×IQR como um outlier potencial. Box plots usam exatamente essa regra para determinar os pontos extremos dos whiskers e sinalizar pontos extremos.
Qual é a diferença entre IQR e desvio padrão?
O desvio padrão mede a amplitude em relação à média e é sensível a outliers; o IQR mede a amplitude em relação à mediana e é robusto a eles. Para distribuições assimétricas ou dados com outliers, o IQR é uma medida de amplitude mais informativa.
Quando devo reportar IQR em vez de desvio padrão?
Reporte o IQR quando os dados são assimétricos ou contêm outliers — resultados de ensaios clínicos, distribuições de renda e métricas de tempo de resposta são casos típicos. Ele combina naturalmente com a mediana, assim como o desvio padrão combina com a média.

Related

Published May 16, 2026 · Last reviewed May 31, 2026