Glossary
Medyan
Sıralı veri kümesinin ortası
By Buğra SözeriPublished Updated
Medyan, sıralı bir veri kümesinin ortadaki değeridir. [3, 4, 5, 6, 7, 8] (altı değer) için medyan 5,5'tir (iki ortadaki değerin ortalaması). [3, 4, 5, 6, 7] (beş değer) için medyan 5'tir. Verinin yarısı altında, yarısı üstünde kalır.
Medyan son derece sağlamdır: tek bir aşırı aykırı değer onu çekemez. [1, 2, 3, 4, 5] kümesinin medyanı 3'tür. [1, 2, 3, 4, 1000] kümesinin medyanı da 3'tür. Bu, medyanı çarpık dağılımlar için — gelir, konut fiyatları, yanıt süreleri, dosya boyutları — doğru özet yapan şeydir; zira bir ya da iki aşırı değer aritmetik ortalamayı domine ederdi.
50. yüzdelik ile aynıdır. Doğrudan hesaplamak (sırala, ortayı al) O(n log n) karmaşıklığındadır; çok büyük veri kümeleri için quickselect algoritması medyanı beklenen O(n) karmaşıklıkla bulur.
Medyan, ortalama, mod ve çeyreklikler için tek seferde istatistik hesaplayıcıyı kullanın.
“Medyan hane geliri”nin ekonomistlerin gerçekten alıntıladığı rakam olmasının nedeni: ABD Nüfus Sayım Bürosu, medyan hane gelirini yoğun sağa çarpık bir dağılımın dürüst tek sayılı özeti olduğu için yayımlar. 2023 ACS verilerine göre ABD medyan hane geliri yaklaşık 80.000 dolarken ortalama yaklaşık 112.000 dolardı — bu fark, dağılımın üst kısmının aritmetik ortalama üzerindeki etkisidir. Aynı fark konut fiyatlarında (NAR ortalama değil medyan raporlar), maaş araştırmalarında ve yazılımda yanıt süresi izlemesinde ortaya çıkar (her gözlemlenebilirlik panosu ortalama gecikme yerine p50 = medyan gösterir). Çarpık verilerde nitelik belirtilmeden “ortalama” dendiğinde hangi ortalamanın kastedildiğini sorun — iki arasındaki fark çoğunlukla asıl hikayedir.
Medyan sağlam bir konum tahmincisidir — ancak bir bedeli vardır: medyanın %50 bozulma noktası vardır (medyanı keyfi biçimde hareket ettirmek için verinin yarısından fazlasını bozmak gerekir), oysa ortalamanın bozulma noktası %0’dır (tek bir sonsuzluk ortalamayı sonsuza götürür). Değiş tokuşu istatistiksel verimlilik: temiz normal dağılım altında medyanın güven aralığı, aynı örneklem boyutu için ortalamanınkinden yaklaşık %25 daha geniştir. Dolayısıyla temiz, simetrik veriler için ortalama daha bilgilendiricidir; gerçek dünyada dağınık veriler için medyan daha güvenlidir. Kırpılmış ortalamalar (üst ve alt %5 atılır) ve Hodges-Lehmann tahmincisi ikisi arasındaki spektrumda yer alır. İlgili: ortalama, yüzdelik, IQR.
Çalışılmış örnek
Bir semtte on bir konut satış fiyatı (bin dolar cinsinden): [280, 295, 310, 320, 340, 355, 360, 380, 410, 450, 2400]. Listeyi sıralayın (zaten sıralı). n = 11 ile medyan 6. değerdir: 355.000 dolar. Ortalama ise toplam/11 = 5900/11 ≈ 536.000 dolardır. Tek bir 2,4 milyon dolarlık kıyı köşkü ortalamayı gerçekçi on karşılaştırmadan yaklaşık 180.000 dolar yukarı çekmiştir — “ortalama fiyatı” mahalleyi ölçmek için kullanan bir alıcı %50 fazla tahmin yapardı. Medyan bu aykırı değeri tamamen yoksayar. 370.000 dolarlık 12. bir satış eklenirse: n = 12 olur, medyan 6. ve 7. değerlerin ortalaması olan (355 + 360)/2 = 357.500 dolardır. Bu teknik genelleştirilir: büyük bir örneklemdeki tek bir aşırı gözlem, medyanı sıralı listede en fazla bir konum hareket ettirir.
Ne zaman ve neden önemlidir
Medyan, dağılımın uzun bir kuyruğu olduğunda ve “tipik durumu” temsil eden bir sayı istediğinizde doğru ölçüttür. Bu, insanların önem verdiği operasyonel metriklerin büyük bölümünü kapsar — hane geliri, konut fiyatları, destek biletlerinde çözüm süresi, sayfa yüklenme süreleri, bir repodaki dosya boyutları, bir belge korpusundaki cümle başına sözcük sayısı. Yazılım gecikmesini izlerken standart uygulama p50 (medyan) ve p99’u birlikte panoya koymaktır: medyan tipik kullanıcının memnun olup olmadığını söyler; p99 kuyruğun kabul edilebilir olup olmadığını. Yalnızca bir ortalama raporlamak, medyan artı birkaç yüzdeliğin hemen ortaya koyduğu bimodal dağılımı (çok farklı deneyimlerle iki kullanıcı kümesi) gizleyebilir. Referans: ABD Nüfus Sayım Bürosu — Amerika Birleşik Devletleri’nde Gelir: 2023.
Frequently asked questions
- Medyan nedir?
- Medyan, sıralandığında bir veri kümesinin ortadaki değeridir. Tek sayıda değer için merkez değerdir; çift sayıda değer için iki ortadaki değerin ortalamasıdır.
- Ortalama yerine ne zaman medyan kullanmalıyım?
- Çarpık dağılımlar veya aykırı değerler içeren veriler için medyanı kullanın — gelir, konut fiyatları, yanıt süreleri gibi. Tek bir aşırı değer medyanı en fazla bir sıra kaydırabilirken ortalamayı dramatik biçimde değiştirebilir.
- Medyan ile yüzdelik arasındaki fark nedir?
- Medyan, 50. yüzdeliktir — verinin yarısının altında, yarısının üstünde kaldığı nokta. Her yüzdelik benzer biçimde veriyi böler: 90. yüzdelik, gözlemlerin %90'ının altında kaldığı değerdir.
- Çift elemanlı bir veri kümesinin medyanını nasıl bulabilirim?
- Değerleri sıralayın, iki ortadaki elemanı alın ve ortalamasını hesaplayın. [3, 7, 10, 14] için iki ortadaki değer 7 ve 10'dur, dolayısıyla medyan (7+10)/2 = 8,5'tir.
Related
Published May 16, 2026 · Last reviewed May 31, 2026