Guide
Ortalama, medyan, mod: her biri ne zaman doğru ortalamadır
Aynı veri kümesi, üç 'ortalama'. Doğrusunu seçmek bilgilendirme ile yanıltma arasındaki fark.
By Buğra SözeriPublished Updated
Günlük dilde “ortalama” genellikle aritmetik ortalamaanlamına gelir. İstatistikte bu daha belirsiz bir sözcüktür ve en az üç farklı ölçüyü kapsar: ortalama, medyan ve mod. Her biri veri kümesindeki “tipik değeri” ölçer; ancak farklı soruları yanıtlar ve çarpık verilerde birbirinden önemli ölçüde ayrışır. Bu rehber, her birinin ne zaman doğru araç olduğunu açıklar.
Üç tanım, kısa kısa
- Ortalama — tüm değerlerin toplamının sayıya bölümü. Varsayılan. Verilerle aynı birimde.
- Medyan — sıralanmış veri kümesinin ortadaki değeri. Yarısı üstte, yarısı altta.
- Mod — en sık görülen değer. Sayısal olmayan veriler üzerinde işe yarayan tek değer.
Klasik ayrışma: gelir
ABD hane geliri, 2023 (Amerikan Topluluk Araştırması):
- Ortalama: $111.000
- Medyan: $80.610
- Mod: yaklaşık $40.000-50.000 (en kalabalık gelir dilimi)
“Tipik bir ABD hanesi ne kadar kazanır?” sorusunu yanıtlayan ve üçe kadar bir faktörle birbirinden ayrışan üç sayı. Ortalama, en zengin %1'lik kesim tarafından yukarı çekilir; medyan dağılımın gerçek ortasında oturur; mod en büyük dilimin nerede olduğunu yansıtır.
Politika tartışmaları ve haber başlıkları için medyan neredeyse her zaman doğru sayıdır — aykırı değerlere karşı dirençlidir ve gerçekten ulaşılabilir bir haneyi temsil eder. Ortalama, aritmetik bütçeleme (toplanan vergi = hane sayısı × ortalama gelir) dışında yanıltır.
Her birini ne zaman kullanmalı
ORTALAMA'yı şu durumlarda kullanın
- Dağılım yaklaşık olarak simetrikse. Boy, IQ puanı, ölçüm hatası. Ortalama ve medyan yakın; ortalama bildirmek uygundur.
- Ortalamalardan toplamları hesaplamanız gerekiyorsa.Ortalama (× sayı) toplamı tam olarak verir. Medyan bunu yapmaz. Bütçeleme, muhasebe ve integraller için ortalama zorunludur.
- Daha ileri istatistiklere girdi sağlayacaksanız.Varyans, standart sapma, güven aralıklarının tümü ortalama üzerine inşa edilir. Medyanı seçerseniz aşağı yöndeki araç setini kaybedersiniz.
MEDYAN'ı şu durumlarda kullanın
- Dağılım çarpıksa. Gelir, ev fiyatları, yanıt süreleri, dosya boyutları, hastanede kalış süreleri, proje maliyetleri. Medyan gerçek insanların deneyimini yansıtır; ortalama, bir milyarderin ya da bir maraton aykırısının şişirdiği değerdir.
- Aykırı değerler muhtemel ve kontrolsüzse. Ara sıra bozulan algılayıcı verisi, elle girilen sayılardaki yazım hataları, bot trafiğiyle kirlenmiş web analitiği. Medyan bunları otomatik olarak filtreler.
- “Tipik deneyimi” temsil etmek istiyorsanız.Nüfus müdürlüğündeki medyan bekleme süresi, medyan işe gidiş süresi, müşteri hizmetlerindeki medyan yanıt süresi. Bunlar bireyler hakkındaki sorulardır, toplam verim hakkında değil.
MOD'u şu durumlarda kullanın
- Veriler kategorikse. Favori renk, kullanılan tarayıcı, menşe ülke. Bunlar için ortalama ve medyan tanımsızdır; mod tek özettir.
- En yaygın durumu öğrenmek istiyorsanız. En popüler ürün, en yaygın hata türü, en çok gönderilen kutu boyutu. Mod bunu doğrudan yanıtlayan tek ölçüttür.
- İki modlu bir dağılım şüpheleniyorsanız. Erkek+kadın boylarının birleşimi, sıcak-soğuk hava verisi, tepe/düşük saatli ağ trafiği. İki mod bildirmek, tek bir ortalamanın gizleyeceği yapıyı ortaya çıkarır.
Çarpık dağılım tuzağı
Haber makaleleri rutin olarak ortalama geliri, ortalama ev fiyatını ve ortalama yanıt süresini bildirir. Üçü de sağa çarpık dağılımlardır; üçünde de ortalama sürekli olarak medyanın üzerindedir; ortalamayı bildirmek sistematik biçimde “tipik”i abartır.
Hızlı test: veri setinin sert bir alt sınırı (sıfır) ve sert bir üst sınırı yoksa büyük olasılıkla sağa çarpıktır. Medyan kullanın.
Türe göre örnekler:
| Veri Kümesi | Şekil | Kullanın |
|---|---|---|
| Yetişkin boyu | Yaklaşık normal | Ortalama uygun |
| Gelir | Sağa çarpık | Medyan |
| Net değer | Güçlü sağa çarpık | Medyan (ortalama dramatik biçimde yanıltır) |
| API yanıt süresi | Sağa çarpık | Medyan + yüzdelik dilimler |
| Hastanede kalış süresi | Sağa çarpık | Medyan |
| Klasördeki dosya boyutları | Sağa çarpık | Medyan |
| Sınav puanları (iyi tasarlanmış sınav) | Yaklaşık normal | Ortalama uygun |
| Günlük sıcaklık | Yaklaşık normal | Ortalama uygun |
Yanlışı nasıl fark edersiniz
“Ortalama” kullanan iddialarda dikkat edilecek üç cümle:
- “Ortalama Amerikalı yılda X dolar kazanır.”X, 90.000 doların üzerindeyse bu ortalamalardır. Medyan yaklaşık 80.000 dolardır. Ortalama teknik olarak doğrudur ancak farklı bir soruyu yanıtlar.
- “Ortalama yanıt süresi: 200 ms.”Bir API için bu neredeyse kesinlikle az sayıdaki yavaş isteğin şişirdiği ortalamalardır. Medyan muhtemelen 50-100 ms'dir; p99 ise 2.000 ms olabilir. Ortalama tek başına az şey anlatır.
- “En popüler X...”Bu moddur. Doğru kullanılıyorsa sorun yoktur; ortalama veya medyan yerine kullanılıyorsa yanıltıcıdır.
Her üçünü birlikte raporlama
Dürüst veri sunumu genellikle ortalama, medyan ve bir yayılım ölçüsü (standart sapma veya çeyrekler arası aralık) gösterir. Ortalama ile medyan arasındaki fark okuyucuya dağılımın ne kadar çarpık olduğunu anında söyler. 111.000 dolarlık bir ortalama ile 81.000 dolarlık bir medyan, iki sayıdan herhangi birinden daha fazlasını — yani dağılımın uzun bir sağ kuyruklu olduğunu — anlatır.
Tek geçişte üçünü de (artı yüzdelik dilimleri, standart sapmayı ve bir histogramı) istatistik hesaplayıcımızla hesaplayın. Varyans ve standart sapmanın çalışan-istatistikçi arka planı için standart sapma açıklamamıza bakın.
Uygulama: yanıt süresi izleme
Bu sabah milisaniye cinsinden ölçülen altı API isteği: [42, 51, 48, 55, 47, 2.800]. Sonuncusu soğuk başlangıç aykırısı. Üç özet:
- Ortalama: (42+51+48+55+47+2.800)/6 = 507 ms.
- Medyan: [42, 47, 48, 51, 55, 2.800] olarak sırala, iki ortadaki değerin ortalamasını al = 49,5 ms.
- Mod: tüm değerler bir kez görünür; bu örnek için mod tanımsız.
Yalnızca ortalamayı raporlamak (“ortalama yanıt süresi: 507 ms”) paydaşı API'nin bozuk olduğuna inandırır. Yalnızca medyanı raporlamak (“tipik yanıt: 49,5 ms”) soğuk başlangıç sorununu gizler. Dürüst özet her iki sayı artı p99'dur: “medyan 50 ms, p99 ~2,8 sn — genel durumda hızlı, zaman zaman soğuk başlangıç zirveleri.” Bu eyleme geçirilebilir; iki sayıdan herhangi biri tek başına değildir.
Yaygın hatalar
- “Ortalamaların ortalaması”nı hesaplamak. Üç grubun ortalamasının ortalaması, gruplar eşit büyüklükte değilse birleşik verinin ortalaması değildir. Ham veriden yeniden hesaplayın ya da grup boyutlarını ağırlık olarak kullanan ağırlıklı ortalama kullanın.
- Yayılım ölçüsü olmadan medyan bildirmek. Aynı medyanlara sahip iki veri kümesi tamamen farklı şekillere sahip olabilir. Çeyrekler arası aralık (Ç3 − Ç1) veya bir çeyrek özeti ekleyin; beş sayıdan oluşan bir özet (min, Ç1, medyan, Ç3, maks) ucuz ve dürüst tek bir satırdır.
- İki modlu dağılıma “ortalama” demek.Erkek+kadın boy dağılımının birleşimi ~168 cm ve ~178 cm'de iki tepe noktasına sahiptir. ~173 cm ortalama veri kümesindeki hiç kimseyi tanımlamaz. Gruba göre ayrıştırın ve her alt nüfusu ayrı ayrı bildirin.
- Sürekli veriler için mod kullanmak. Gerçekten sürekli ölçümler (boylar, ağırlıklar, yanıt süreleri) için her değer teknik olarak benzersizdir; mod ya tanımsızdır ya da ölçüm granülaritesinin bir artefaktıdır. Bir histogram kullanın ve en yoğun dilimi belirleyin.
- Kesik örneklerde ortalamaları karşılaştırmak.Ortalamalar, aykırı değerlerin dahil edilip edilmediğine son derece duyarlıdır. İki çalışma farklı ortalamalar bildiriyor ve biri 99. yüzdelik dilimin üzerindeki aykırı değerleri dışarıda bıraktıysa fark tamamen yapay olabilir.
İlgili yayılım sorusu (verilerin merkez etrafında ne kadar dağıldığı) için standart sapma rehberimizle devam edin. Özet istatistiklerin ardından sıkça gelen yüzde değişimi çerçevesi için yüzde ve yüzde puanı arasındaki farka bakın.
Kaynaklar: ABD Nüfus Sayımı Bürosu Amerikan Topluluk Araştırması 2023; NIST/SEMATECH İstatistiksel Yöntemler e-El Kitabı §1.3.5.3 (Konum Ölçüleri); Tukey, Keşifsel Veri Analizi (1977); OECD Gelir Dağılımı Veri Tabanı (2024 yayını).
Frequently asked questions
- Ortalama, medyan ve mod arasındaki fark nedir?
- Ortalama, toplamın sayıya bölümüdür. Medyan, veriler sıralandığında ortadaki değerdir — değerlerin yarısı üstte, yarısı altta. Mod, en sık görülen değerdir. Üçü de 'ortalama' olsa da çarpık verilerde birbirinden önemli ölçüde farklılaşır.
- ABD Nüfus Sayımı Bürosu neden ortalama hane geliri yerine medyan hane gelirini kullanır?
- Gelir sağa çarpıktır — az sayıda çok yüksek kazançlı kişi, ortalamanın çoğu hanenin gerçekte kazandığının çok üzerinde kalmasına neden olur. 2023'te ABD ortalama hane geliri yaklaşık 111.000 dolar iken medyan 80.610 dolardı. Medyan, tipik hanenin deneyimini daha iyi temsil eder.
- Ortalama yerine medyanı ne zaman kullanmalıyım?
- Verinin sıfırda sert bir alt sınırı olduğunda ve üst sınırı yoksa (gelir, ev fiyatları, yanıt süreleri, dosya boyutları), kontrolsüz aykırı değerler içerdiğinde ya da tipik bireysel deneyimi temsil etmek istediğinizde medyan kullanın. Ortalama ile medyan arasında önemli bir fark varsa veriler çarpıktır ve medyan genellikle daha bilgilendiricidir.
- Mod, ortalama veya medyandan ne zaman daha kullanışlıdır?
- Mod, kategorik (sayısal olmayan) veriler üzerinde işe yarayan tek merkezi eğilim ölçüsüdür — favori renk, tarayıcı türü, menşe ülke. Ayrıca soru 'en yaygın değer nedir?' şeklindeyse — en popüler ürün boyutu, en sık görülen hata kodu — mod tek doğru ölçüttür.
- Bir veri kümesinin birden fazla modu olabilir mi?
- Evet. İki modlu bir dağılımın iki modu vardır — örneğin, erkek ve kadın boy verilerinin birleşimi yaklaşık 168 cm ve 178 cm'de zirve yapar. Tek bir ~173 cm ortalama bildirmek veri kümesindeki hiç kimseyi tanımlamaz; iki mod bildirmek yapıyı ortaya koyar.
Sources & references
Authoritative references cited by this piece. Verified by Buğra Sözeri on the dates shown and re-checked at every deploy.
- NIST/SEMATECH İstatistiksel Yöntemler e-El Kitabı — Konum Ölçüleri — Merkezi eğilim ölçüleri ve her birinin ne zaman uygulanacağı için yetkili ABD referansı(as of )
- ABD Nüfus Sayımı Bürosu — Medyan hane geliri metodolojisi — Çarpık gelir verisinde medyan-ortalama raporlamasının kanonik örneği için referans(as of )
- Amerikan İstatistik Derneği — İstatistik Eğitiminde Değerlendirme ve Öğretim Kılavuzları — Makalenin sunduğu her birini ne zaman kullanmalı çerçevesinin pedagojik referansı(as of )
- OECD Gelir Dağılımı Veri Tabanı — Çarpıklığı örneklemek için kullanılan medyan-ortalama gelir karşılaştırmaları için ülkeler arası kaynak(as of )
- BLS — Olağan haftalık kazanımların çeyrekler ve seçili desimleri — Yayılım-merkez tartışmasında kullanılan ABD Çalışma İstatistikleri Bürosu yüzdelik verisi(as of )
Related
Published May 16, 2026 · Last reviewed May 31, 2026