Glossary
Varyans
Standart sapmanın karesi
By Buğra SözeriPublished Updated
Varyans, ortalamadan karesel sapmaların ortalamasıdır. Ortalaması 5,5 olan [4, 8, 6, 5, 3, 7] veri kümesi için: karesel sapmalar 2,25; 6,25; 0,25; 0,25; 6,25; 2,25; toplamı 17,5; örneklem varyansı (÷ n-1) = 3,5.
Varyans kareli birimlerdedir (kilogram², dolar², saniye²) ve bu doğrudan yorumlamayı güçleştirir. Karekök alındığında orijinal birimlerde olan standart sapma elde edilir. İkisi aynı bilgiyi taşır; varyans hesaplanandır, standart sapma raporlanandır.
Varyansla neden uğraşılır? Çünkü varyanslar, bağımsız varyasyon kaynakları arasında toplanabilir. X ve Y bağımsızsa, Var(X + Y) = Var(X) + Var(Y) — standart sapmaların sahip olmadığı bir özellik. Bu, varyansı varyans analizi (ANOVA), hata yayılımı ve teorik istatistiklerin büyük çoğunluğu için doğal birim yapan şeydir.
Varyans ve standart sapma arkasındaki sezgi için standart sapma açıklaması rehberimize bakın.
Evren varyansı ile örneklem varyansı — N mi N−1 mi seçimi: varyans tüm evren üzerinde hesaplandığında karesel sapmaların toplamını N'e bölün. Evren varyansını bir örneklemden tahmin ederken N−1'e bölün — Bessel düzeltmesi olarak bilinir. Düzeltme, örneklem ortalamasının bilinmeyen evren ortalamasına kıyasla veriye daha yakın olduğu gerçeğini telafi eder; bu da karesel sapmaların ham toplamını aşağı yönlü önyargılı kılar. Küçük örneklem boyutlarında fark önemlidir; büyük N'de ihmal edilebilir. R, pandas ve Excel'in VAR()'ı N−1'e varsayılan olarak ayarlıdır; NumPy'nin np.var()'ı N'e (N−1 için ddof=1 ile geçersiz kılınabilir). Bir varyans alıntılamadan önce belgeleri okuyun — sessiz N/(N−1) faktörü tutarsızlığı düzenli olarak "ama sayılar eşleşmiyor" hata raporlarına yol açar.
Varyans hesaplamada sayısal tuzaklar: ders kitabı formülü Var = E[X²] − (E[X])² matematiksel olarak doğru ama sayısal olarak kararsızdır — büyük ortalamaya sahip sıkı kümelenmiş veriler için (örn. Kelvin cinsinden sıcaklıklar, finansal fiyatlar) neredeyse eşit büyüklükte iki sayının farkını hesaplar ve hassasiyeti felaket biçimde kaybeder. Welford'ın çevrimiçi algoritması (1962) ve daha yeni Chan-Golub-LeVeque paralel varyantı, büyük neredeyse eşit terimlerden çıkarma yapmadan tek geçişte varyans hesaplar ve modern standarttır. NumPy ve pandas bunları kaputun altında uygular; üretim verilerinde ders kitabı formülüyle kendiniz yazmak bilinen bir tehlikedir. İlgili: örneklem standart sapması, istatistik hesaplayıcı.
Çözümlü örnek
İki bağımsız pozisyondan oluşan bir hisse senedi portföyüne sahipsiniz: A hissesinin yıllık getiri varyansı Var(A) = 0,04 (SD = %20), B hissesinin Var(B) = 0,09 (SD = %30). Ayrı tutulduğunda A daha az risklidir. %50-%50 birleştirin: Var(0,5·A + 0,5·B) = 0,25·Var(A) + 0,25·Var(B) = 0,01 + 0,0225 = 0,0325, dolayısıyla portföy SD ≈ √0,0325 ≈ %18. Çeşitlendirilmiş portföy, bileşenlerinden daha düşük varyansa sahiptir — Markowitz'in 1952 içgörüsü tek satır aritmetikte. Not: bu yalnızca varyanslar toplandığı için (bağımsızlık varsayımı) işe yarar. A ve B mükemmel korelasyonlu olsaydı, Var(0,5A + 0,5B) = 0,0325 + 2·0,25·0,20·0,30 = 0,0625, SD = %25 — iki SD'nin ortalaması, çeşitlendirme yararı yok.
Ne zaman ve neden önem taşır
Varyans, finansta riskin (portföy teorisi), deneysel fizikte hatanın (ölçüm belirsizliklerini karekök toplamıyla birleştirme), kalite kontrolünde (Six Sigma, ortalama kaymalar ayarlamak kolay olduğundan ortalama kayması değil varyans azaltmayı hedefler; varyans kayması süreç yeniden tasarımı gerektirir) ve makine öğrenmesinde (önyargı-varyans ikilemi: yüksek varyanslı modeller aşırı uyar, yüksek önyargılı modeller yetersiz uyar) operasyonel birimidir. Üretimdeki "süreç yeterlilik indeksi" Cpk veya fon performans raporlarındaki "izleme hatası" okunduğunda, varyans türevi bir istatistik okunmaktadır. Standart sapma raporu sezgi sağlar; varyans raporu kaynaklar arasında toplanan bir nicelik sağlar — akıcı istatistiksel iletişim için her ikisi de gereklidir. Kaynak: NIST/SEMATECH e-El Kitabı — Ölçek Ölçüleri.
Frequently asked questions
- İstatistikte varyans nedir?
- Varyans, ortalamadan karesel sapmaların ortalamasıdır: evren varyansı = (xi eksi mu)'nün karelerinin toplamı bölü N; örneklem varyansı = (xi eksi x-bar)'ın karelerinin toplamı bölü (n eksi 1). Değerlerin ne kadar yayıldığını, orijinal verinin kareli birimlerinde ölçer.
- Varyans neden kareli birimlerle ifade edilir?
- Sapmaların karesini almak onları pozitif yapar (negatifler ve pozitifler birbirini sıfırlamaz) ve büyük sapmalara daha fazla ağırlık verir. Dezavantaj, varyansın kareli birimlerde (örn. kg kare) olmasıdır; bu nedenle yorumlanabilir birimleri yeniden kazanan standart sapma — varyansın karekökü — çoğunlukla daha yaygın raporlanır.
- Varyans ile standart sapma arasındaki fark nedir?
- Varyans, ortalama karesel sapmadır; standart sapma, orijinal birimleri yeniden kazanarak onun karekökünü alır. Varyansın bağımsız değişkenler arasında toplanabilir olma gibi yararlı bir özelliği vardır; standart sapma doğrusal olarak toplamaz; bu da varyansı istatistiksel türetmelerde tercih edilen ölçü kılar.
Related
Published May 16, 2026 · Last reviewed May 31, 2026