Glossary
Percentil
Uma estatística de classificação relativa
By Buğra SözeriPublished Updated
Um percentil é o valor abaixo do qual uma determinada porcentagem de observações em um conjunto de dados cai. O 90º percentil é o valor que supera 90% dos dados; a mediana é o 50º percentil.
Os percentis são úteis quando a distribuição não é normal — o que é a maioria das vezes. Média e desvio padrão descrevem bem uma distribuição normal; os percentis descrevem qualquer distribuição relatando onde sua massa está. Distribuição de renda, medições de latência e pontuações de testes são todos comumente relatados via percentis por esse motivo.
Calcular um percentil é simples em conceito, mas complicado na prática. A abordagem ingênua de “o valor na classificação p × n nos dados ordenados” funciona quando p × n é um inteiro; caso contrário, você precisa interpolar. O método mais comum é a interpolação linear entre as duas classificações mais próximas, que é o padrão no NumPy (linear) e na referência NIST. O R suporta nove algoritmos de percentil diferentes via o parâmetro type — eles tipicamente discordam em menos de meio ponto percentil.
Quartis são o 25º, 50º e 75º percentis (Q1, Q2 = mediana, Q3). O intervalo interquartil (IQR) = Q3 − Q1 é uma medida robusta de dispersão — robusta porque ignora os 25% externos dos dados em cada extremidade, onde os outliers causam estragos.
Use nossa calculadora de estatísticas para qualquer percentil em um conjunto de dados colado.
Percentil vs rank percentual — a confusão fácil: um percentilé um valor do conjunto de dados (o 90º percentil das pontuações do teste é “a pontuação abaixo da qual 90% dos alunos ficam”, por exemplo, 87). Um rank percentual é o inverso — dado um valor, que fração dos dados fica abaixo dele (Alice marcou 87 → seu rank percentual é 90). Relatórios de testes padronizados (SAT, GMAT, GRE) quase sempre relatam rank percentual em vez do percentil bruto da pontuação, que é o número mais útil para quem faz o teste. Os dois estão relacionados, mas a distinção importa ao ler distribuições publicadas.
Por que p99 e p99,9 se tornaram padrões de nível de serviço: para serviços web, o 99º e o 99,9º percentil de latência capturam a experiência dos usuários que atingem os caminhos mais lentos. Um serviço com média de 100 ms mas com p99 de 5 s parece quebrado para o 1% das requisições que atingem a cauda. SLOs (Service Level Objectives) são tipicamente expressos como “99% das requisições abaixo de 200 ms em uma janela de 28 dias” — a convenção do Google SRE — porque os usuários percebem a latência da cauda mais do que a latência média. Referência: NIST/SEMATECH e-Handbook — Percentil.
Exemplo prático
Calcule o 90º percentil de 20 tempos de resposta (ms): [12, 15, 18, 19, 22, 24, 25, 28, 30, 33, 36, 40, 44, 48, 55, 62, 75, 90, 140, 410] (já ordenados). Usando o método linear do NumPy: a posição é (n−1) × p = 19 × 0,9 = 17,1. Interpole entre o 18º e o 19º valores (com indexação zero: índices 17 e 18 = 90 e 140): 90 + 0,1 × (140 − 90) = 95 ms. Portanto, p90 = 95 ms. A média aritmética dos mesmos dados é 64,8 ms — puxada para cima pelo outlier de 410 ms — e a mediana (p50) é 34,5 ms. Relatar esses três juntos (p50 = 34,5, p90 = 95, máx = 410) conta uma história de latência coerente; relatar apenas a média ocultaria completamente a cauda longa.
Quando e por que isso importa
SLOs baseados em percentis são a linguagem operacional do SRE moderno porque SLOs baseados em média mentem sobre a experiência do usuário. Um serviço com média de 100 ms e p99 de 200 ms é um produto diferente de um serviço com média de 100 ms e p99 de 5 segundos, mas ambos reportam a mesma média. Um orçamento de latência escrito como “p99 < 300 ms ao longo de 28 dias” diz o que alertar e o que otimizar. Fora do SRE: testes padronizados (o “75º percentil de altura” de uma criança em uma curva de crescimento pediátrica), política econômica (a participação de renda do 1% superior é uma declaração de percentil) e avaliação de ML (taxas de erro por percentil expõem problemas de justiça no pior caso invisíveis para a média). O hábito defensivo ao consumir qualquer número “médio” é pedir a distribuição ou pelo menos p50/p90/p99. Referência: Google SRE Book — Service Level Objectives.
Frequently asked questions
- O que é um percentil?
- Um percentil é um valor abaixo do qual uma determinada porcentagem de observações em um conjunto de dados cai. O 90º percentil de um conjunto de dados significa que 90% dos valores estão abaixo desse ponto.
- Como os percentis são usados na prática?
- As curvas de crescimento pediátrico expressam altura e peso em percentis para que os pais possam ver como uma criança se compara a uma população de referência. O desempenho de servidores é tipicamente relatado como latência no 95º ou 99º percentil para capturar o comportamento de pior caso que as médias escondem.
- Qual é a diferença entre um percentil e uma porcentagem?
- Uma porcentagem é uma razão expressa em 100 (por exemplo, uma pontuação de 80%). Um percentil é uma posição de classificação dentro de uma distribuição: estar no 80º percentil significa que você superou 80% do grupo, independentemente da pontuação absoluta.
Related
Published May 14, 2026 · Last reviewed May 31, 2026