Skip to content

Glossary

Mod (İstatistik)

En sık görülen değer

By Published Updated

Mod, bir veri kümesindeki en sık görülen değerdir. [1, 2, 2, 3, 4, 4, 4, 5] için mod 4’tür (üç kez görünür; başka hiçbiri bu kadar görünmez). Sayısal olmayan verilerle çalışabilen tek merkezi eğilim ölçüsüdür — [“kırmızı”, “mavi”, “kırmızı”, “yeşil”, “kırmızı”] kümesinin modu “kırmızı”dır.

Üç özel durum:

  • Tek modlu (Unimodal) — tam olarak bir en sık görülen değer. Standart durum.
  • Bimodal — iki değer en sık görülme için eşit. Karma popülasyon dağılımına işaret eder (örn. yetişkin erkek + kadın boylarının birleştirilmesi bimodal dağılım üretir).
  • Mod yok — her değer tam olarak bir kez görünür. Mod teknik olarak tanımsızdır; bazı gelenekler “mod yok” raporlarken diğerleri her değeri mod olarak raporlar.

Modu şu durumlarda kullanın: veri kategorikse (renkler, markalar, türler) ya da merkezi eğilimi değil en yaygın değeri bilmek istiyorsanız. Tekrar eden değeri olmayan sayısal verilerde (boylar, maaşlar) mod işe yaramaz — ortalama veya medyan kullanın.

İstatistik hesaplayıcımız, bimodal durumu tüm en sık görülen değerleri listeleyerek işleyen bir şekilde modu ortalama ve medyanın yanı sıra raporlar.

Bimodal dağılımlar merak konusu değil, bir tanı aracıdır: sürekli verilerin histogramı iki belirgin doruk gösterdiğinde bu neredeyse her zaman veri kümesinin iki temel popülasyonun karışımı olduğu anlamına gelir. Klasik örnek yetişkin insanların boylarıdır — erkekler ve kadınlar bir arada ele alındığında bimodal eğri oluşur; cinsiyete göre ayrıldığında iki temiz tek modlu eğri ortaya çıkar. Müşteri harcama dağılımlarındaki bimodallik genellikle ücretsiz katman ve ücretli katman popülasyonlarının karışımı demektir. Yanıt süresi dağılımlarındaki bimodallik çoğu zaman hızlı yol ve yavaş yolun (önbellek isabeti ve önbellek ıskalanması) ayrı ele alınması gerektiğine işaret eder. Bimodal dağılımın genel ortalamasını raporlamak nadiren kullanışlıdır — önce karma model uydurun ya da segmentleri ayırın.

Sürekli veriler için mod — çekirdek yoğunluk tahmini: tam değer tekrarının nadir olduğu sürekli bir veri kümesinde “mod” genellikle en sık görülen ham değer yerine çekirdek yoğunluk tahmininin (KDE) doruk noktası olarak tanımlanır. İstatistiksel paketler (R’nin density() işlevi, Python’un scipy gaussian_kde’si) bu amaçla varsayılan olarak KDE hesaplar. Bant genişliği parametresi — her veri noktasının yoğunluğa ne kadar yayıldığı — temel kaldıraçtır; Silverman’ın pratik kuralı tek modlu veriler için iyi çalışır. Bimodal veriler için iki doruk çözünürlükte kalacak kadar küçük bir bant genişliği seçin. İlgili: ortalama, medyan. Referans: NIST/SEMATECH e-El Kitabı — Merkezi Eğilim Ölçüleri.

Çalışılmış örnek

Bir giyim perakendecisi 200 işlemde satılan bedenleri kayıt altına alıyor: {XS: 12, S: 38, M: 64, L: 51, XL: 28, XXL: 7}. Mod = M (64 kez). Mod, bu sütunu anlamlı biçimde özetleyebilen tek istatistiktir — “ortalama beden” veya “medyan beden”, XS-XXL’yi sayıya kodlamayı gerektirir ve seçilen her kodlama keyfidir. Şimdi aynı perakendecinin çocuk serisi ekleyip verileri birleştirdiğini düşünün: yeni beden histogramı {2T: 30, 4T: 28, 6: 22, S: 38, M: 64, L: 51, XL: 28} şeklinde olur. Dağılım bimodaldır (çocuklar için 2T-6 doruğu, yetişkinler için M-L doruğu) ve “en çok satılan beden” (M) çocuk serisi stoğuna ilişkin her kararı aktif biçimde yanıltır. Modu hesaplamadan önce segmentlere ayırın — çocuklar için ve yetişkinler için ayrı ayrı — doğru stok sinyalini elde edin: modal çocuk bedeni 2T, modal yetişkin bedeni M’dir.

Ne zaman ve neden önemlidir

Modlar perakendede operasyonel kararları yönlendirir (hangi beden/renk/SKU’yu daha fazla stoklamalı), seçimlerde (modal aday, çoğunluk olmaksızın çoğulcu sistemde kazanır), tavsiye sistemlerinde (kategori başına en çok görüntülenen öğe) ve doğal dil analizinde (bir korpustaki modal sözcük/n-gram konuyu ortaya koyar). Tuzak, altta yatan popülasyon karışıkken tek bir modun var olduğunu varsaymaktır. Anket araştırmacıları, A/B testçileri ve ürün analistleri buna sürekli düşer: segmentler genelinde kullanıcıları birleştiren her veri kümesi (coğrafya, plan katmanı, cihaz türü) çoğu zaman, facet uygulandığında kaybolan bimodallik gösterir. Savunma alışkanlığı: herhangi bir tek “merkezi eğilim” sayısı raporlamadan önce her zaman histogramu çizin. Referans: NIST/SEMATECH e-El Kitabı — Histogram Yorumlama: Bimodal.

Frequently asked questions

Mod nedir?
Mod, bir veri kümesinde en sık görülen değerdir. [1, 2, 2, 3, 4] için mod 2'dir. Bir veri kümesi tek modlu (bir mod), bimodal (iki mod) veya çok modlu (birden fazla doruk) olabilir.
Mod ne zaman kullanışlıdır?
Mod, kategorik veriler için en kullanışlıdır — en çok satılan ayakkabı numarası, en yaygın destek bileti kategorisi, en sık sipariş edilen renk. Sayısal olmayan (nominal) verilere uygulanabilen tek ortalama türüdür.
Mod, ortalama ve medyan arasındaki fark nedir?
Ortalama, aykırı değerlere duyarlı aritmetik değerdir. Medyan, aykırı değerlere karşı sağlam bir orta değerdir. Mod, ayrık veya kategorik veriler için kullanışlı en sık görülen değerdir. Çan eğrisi gibi simetrik dağılımlarda üçü birbirine eşittir.
Bimodal dağılım ne anlama gelir?
Bimodal dağılım, frekans grafiğinde iki belirgin doruk bulunması; yani iki değerin (veya aralığın) özellikle yaygın olması demektir. Genellikle verideki iki alt grubu işaret eder — örneğin yetişkin erkekler ile kadınları birleştiren bir boy veri kümesi.

Related

Published May 16, 2026 · Last reviewed May 31, 2026