Glossary
Yüzdelik dilim
Göreli sıralama istatistiği
By Buğra SözeriPublished Updated
Yüzdelik dilim, bir veri setindeki gözlemlerin belirli bir yüzdesinin altında kaldığı değerdir. 90. yüzdelik dilim, verinin %90'ını geride bırakan değerdir; medyan ise 50. yüzdelik dilimdir.
Yüzdelik dilimler, dağılımın normal olmadığı durumlarda —ki bu çoğu zaman böyledir— oldukça kullanışlıdır. Ortalama ve standart sapma normal bir dağılımı iyi tanımlar; yüzdelik dilimler ise kitlesinin nerede yoğunlaştığını raporlayarak herhangi bir dağılımı tanımlar. Gelir dağılımı, gecikme süreleri ve test puanları bu nedenle yaygın olarak yüzdelik dilimlerle raporlanır.
Yüzdelik dilim hesaplamak kavramsal olarak basit, pratikte ise biraz çetrefilli bir işlemdir. Saf yaklaşım olan "sıralı veride p × n sırasındaki değer", p × n bir tam sayı olduğunda işe yarar; aksi takdirde aradeğerleme (interpolasyon) gerekmektedir. En yaygın yöntem, NumPy'nin varsayılanı olan ve NIST referansıyla örtüşen en yakın iki sıra arasında doğrusal aradeğerlemedir. R, type parametresiyle dokuz farklı yüzdelik dilim algoritması sunar; bunlar tipik olarak yarım yüzdelik dilim puanından daha az farklılık gösterir.
Çeyrekler, 25., 50. ve 75. yüzdelik dilimlerdir (Ç1, Ç2 = medyan, Ç3). Çeyrekler arası aralık (ÇAA) = Ç3 − Ç1, yayılmanın sağlam bir ölçüsüdür; her iki uçtaki dış %25'lik kısmı görmezden gelerek aykırı değerlerin etkisini azaltır.
Yapıştırdığınız bir veri setindeki herhangi bir yüzdelik dilim için istatistik hesaplayıcımızı kullanın.
Yüzdelik dilim ve yüzdelik sıralama — sık yapılan karışıklık: yüzdelik dilim, veri setinden bir değerdir (test puanlarının 90. yüzdelik dilimi, "öğrencilerin %90'ının altında kaldığı puan"dır, örn. 87). Yüzdelik sıralama ise bunun tersidir: verilen bir değerden, verinin ne kadarının onun altında kaldığını gösterir (Ayşe 87 puan aldı → yüzdelik sıralaması 90'dır). Standartlaştırılmış sınavlar (SAT, GMAT, GRE) neredeyse her zaman ham yüzdelik dilim yerine yüzdelik sıralamayı raporlar; bu, sınava giren için daha kullanışlı olan sayıdır. İkisi birbiriyle ilişkilidir, ancak yayımlanan dağılımları okurken bu ayrım önemlidir.
p99 ve p99,9'un hizmet düzeyi standardı haline gelmesinin nedeni: web hizmetlerinde gecikme süresinin 99. ve 99,9. yüzdelik dilimi, en yavaş yolları geçen kullanıcıların deneyimini yakalar. Ortalaması 100 ms olan ancak p99'u 5 s olan bir hizmet, o 1 saniyelik isteklerde bozuk hissettirilebilir. SLO'lar (Hizmet Düzeyi Hedefleri), Google SRE geleneğine göre genellikle "28 günlük pencerede isteklerin %99'u 200 ms altında" şeklinde ifade edilir; çünkü kullanıcılar ortalama gecikme sürelerinden çok kuyruk gecikmesini fark eder. Kaynak: NIST/SEMATECH e-Kılavuzu — Yüzdelik Dilim.
Çözümlü örnek
20 yanıt süresinin (ms) 90. yüzdelik dilimini hesaplayın: [12, 15, 18, 19, 22, 24, 25, 28, 30, 33, 36, 40, 44, 48, 55, 62, 75, 90, 140, 410] (zaten sıralı). NumPy linear yöntemini kullanarak: konum (n−1) × p = 19 × 0,9 = 17,1'dir. 18. ve 19. değerler arasında aradeğerleme yapın (sıfır indeksli: indeksler 17 ve 18 = 90 ve 140): 90 + 0,1 × (140 − 90) = 95 ms. Dolayısıyla p90 = 95 ms'dir. Aynı verinin aritmetik ortalaması, 410 ms'lik aykırı değer tarafından yukarıya çekilmiş 64,8 ms'dir; medyan ise (p50) 34,5 ms'dir. Bu üçünü birlikte raporlamak (p50 = 34,5, p90 = 95, maks = 410) tutarlı bir gecikme hikâyesi anlatır; yalnızca ortalama raporlamak uzun kuyruğu tamamen gizler.
Ne zaman ve neden önem taşır
Yüzdelik dilim tabanlı SLO'lar, modern SRE'nin operasyonel dilidir; çünkü ortalama tabanlı SLO'lar kullanıcı deneyimi hakkında yalan söyler. Ortalama 100 ms ve p99 200 ms olan bir hizmet, ortalama 100 ms ve p99 5 s olan bir hizmetten farklı bir üründür; ancak her ikisi de aynı ortalamayı raporlar. "28 gün boyunca p99 < 300 ms" olarak yazılan bir gecikme bütçesi, neyi uyarıya alacağınızı ve neyi optimize edeceğinizi size söyler. SRE dışında: standartlaştırılmış sınavlar (pediatrik büyüme grafiğinde "boyun 75. yüzdelik diliminde" olan bir çocuk), ekonomi politikası (üst %1'in gelir payı bir yüzdelik dilim ifadesidir) ve makine öğrenmesi değerlendirmesi (yüzdelik dilim başına hata oranları, ortalamada görünmeyen en kötü durum adalet sorunlarını ortaya çıkarır) hepsi bunları kullanır. Herhangi bir "ortalama" sayıyı tüketirken savunmacı alışkanlık, dağılımı ya da en azından p50/p90/p99'u istemektir. Kaynak: Google SRE Kitabı — Hizmet Düzeyi Hedefleri.
Frequently asked questions
- Yüzdelik dilim nedir?
- Yüzdelik dilim, bir veri setindeki gözlemlerin belirli bir yüzdesinin altında kaldığı değerdir. Bir veri setinin 90. yüzdelik dilimi, değerlerin %90'ının o noktanın altında olduğu anlamına gelir.
- Yüzdelik dilimler pratikte nasıl kullanılır?
- Pediatrik büyüme grafikleri boy ve kiloyu yüzdelik dilim cinsinden ifade ederek ebeveynlerin çocuklarını referans popülasyonuyla karşılaştırmasını sağlar. Sunucu performansı, ortalamanın gizlediği en kötü durum davranışını yakalamak için genellikle 95. ya da 99. yüzdelik dilim gecikme süresi olarak raporlanır.
- Yüzdelik dilim ile yüzde arasındaki fark nedir?
- Yüzde, 100 üzerinden ifade edilen bir oran anlamına gelir (örn. %80 puan). Yüzdelik dilim ise bir dağılım içindeki sıralama konumudur: 80. yüzdelik dilimde olmak, mutlak puandan bağımsız olarak grubun %80'ini geride bıraktığınız anlamına gelir.
Related
Published May 14, 2026 · Last reviewed May 31, 2026