Glossary
Korelasyon
İki değişkenin birlikte ne kadar sıkı hareket ettiği
By Buğra SözeriPublished Updated
Korelasyon, iki değişkenin birlikte hareket etme derecesini ölçer. Standart ölçü Pearson’ın r’sidir: −1 ile +1 arasında tek bir sayı olup +1 mükemmel pozitif doğrusal ilişkiyi, 0 doğrusal ilişki olmadığını ve −1 mükemmel negatif doğrusal ilişkiyi ifade eder.
Pratik yorum:
- |r| < 0,3 — zayıf
- 0,3 ≤ |r| < 0,7 — orta
- |r| ≥ 0,7 — güçlü
Korelasyon sayılarını okuyan herkesin bilmesi gereken üç şey:
- Pearson’ın r’si yalnızca doğrusal ilişkileri yakalar. Mükemmel bir kuadratik ile ilişkili iki değişken (y = x²), x hem pozitif hem negatif değerler aldığında r ≈ 0’a sahip olabilir. Doğrusal olmayan ilişkiler için Spearman’ın rho’su daha sağlam bir alternatiftir.
- Korelasyon nedensellik değildir. İki değişken güçlü biçimde ilişkili olabilir çünkü A, B’ye neden olur; B, A’ya neden olur; her ikisi de üçüncü bir değişkenden kaynaklanır ya da saf rastlantı söz konusudur (özellikle küçük örneklemlerde veya çok sayıda çift karşılaştırılırken).
- Aykırı değerler r’yi dramatik biçimde bozar. Küçük bir veri setindeki tek bir aykırı değer korelasyonun işaretini tersine çevirebilir. Sayıya güvenmeden önce her zaman veriyi görselleştirin.
Kategorik veya sıralı veriler için Pearson yerine Spearman’ın sıra korelasyonunu kullanın. İkili sonuçlar için phi katsayısına bakın. İkiden fazla düzeyi olan nominal kategorik veriler için Cramér’ın V’si uygundur.
Anscombe’un dörtlüsü — ünlü illüstrasyon: 1973’te istatistikçi Francis Anscombe, aynı ortalama, varyans, korelasyon katsayısını (0,816) ve doğrusal regresyon doğrusunu paylaşan dört küçük veri seti oluşturdu; ancak bunlar görselleştirildiğinde birbirinden tamamen farklı görünür. Biri temiz bir doğrusal eğilim, biri mükemmel bir eğri, biri tek bir aykırı değerli bir doğru, biri ise tek bir dışa düşen noktayla dikey bir çizgidir. Dörtlü hâlâ “her zaman önce veriyi görselleştir” ilkesinin kanonik örneği olarak anılır. Datasaurus Dozen (Matejka & Fitzmaurice, 2017) aynı fikri özet istatistikleri paylaşan on iki veri setine, bunlardan biri dinozor şeklinde olacak biçimde genişletir. Her ikisi de aynı noktayı vurgular: tek bir korelasyon sayısı gerekli ama hiçbir zaman yeterli değildir. Başvuru: NIST/SEMATECH e-Handbook — Doğrusal Korelasyon.
Çalışma örneği
Beş veri noktası (1,2), (2,4), (3,5), (4,4), (5,5). Ortalamalar x̄ = 3, ȳ = 4. Sapmalar x − x̄: −2, −1, 0, 1, 2. Sapmalar y − ȳ: −2, 0, 1, 0, 1. Çapraz çarpımların toplamı Σ(xᵢ − x̄)(yᵢ − ȳ) = 4 + 0 + 0 + 0 + 2 = 6. x sapmalarının kareleri toplamı: 10; y sapmalarının: 6. Pearson r = 6 / √(10 × 6) = 6 / 7,746 ≈ 0,775 — güçlü pozitif doğrusal ilişki. Dağılım grafiği bu yorumun geçerli olduğunu gösterir; üçüncü nokta (3, 5) yerine (3, 50) olsaydı, r iyi tanımlı görünmeye devam ederdi ancak doğrusal model tek bir aykırı değer tarafından domine edilirdi.
Korelasyonun karar almayı yönlendirdiği durumlar
Portföy çeşitlendirmesi: düşük ikili korelasyona sahip varlıklar, bireysel oynaklıkları yüksek olsa bile genel varyansı azaltır. 2008 finansal krizi felaketi yaratan karşı örneği gösterdi — hisse senetleri, kurumsal tahviller, gayrimenkul yatırım ortaklıkları ve altın bile likidite kuruduğunda birlikte hareket etti; sakin piyasalardan tahmin edilen korelasyon matrisleri kuyruk riskini küçümsedi. ML öznitelik mühendisliğinde, r > 0,95 olan iki öznitelik fiilen gereksizdir; birini çıkarmak model doğruluğunu nadiren düşürür ve eğitimi hızlandırır. Deneylerde, ilişkili metrikleri bağımsız olarak ele almak yanlış pozitif oranını şişirir — Bonferroni veya Benjamini-Hochberg düzeltmeleri uygulanmalıdır. İlgili: regresyon, varyans. Arka plan: Pearson korelasyon katsayısı (Vikipedi).
Frequently asked questions
- Korelasyon nedir?
- Korelasyon (Pearson r), iki değişken arasındaki doğrusal ilişkiyi −1 ile +1 arasında ölçer. +1 değeri mükemmel pozitif doğrusal ilişkiyi, −1 mükemmel negatif doğrusal ilişkiyi, 0 ise doğrusal ilişki olmadığını gösterir.
- Korelasyon pratikte nasıl kullanılır?
- Bir finans analisti, iki hisse senedinin r = 0,85 korelasyona sahip olduğunu tespit eder — bunlar birlikte güçlü biçimde hareket eder. İkinci hisseyi portföye eklemek çok az çeşitlendirme sağlar; r = −0,3 korelasyonlu bir hisse çok daha fazla çeşitlendirme faydası sunar.
- Korelasyon ile nedensellik arasındaki fark nedir?
- Korelasyon yalnızca istatistiksel birlikte hareketi ölçer, neden-sonuç ilişkisini değil. Dondurma satışları ve boğulma oranları, her ikisi de yaz aylarında artığından güçlü biçimde ilişkilidir; dondurma boğulmaya neden olmaz. Nedensellik saptamak için kontrollü deneyler veya nedensel çıkarsama yöntemleri gerekir.
- Pearson ve Spearman korelasyonu arasındaki fark nedir?
- Pearson r, doğrusal ilişkileri ölçer ve yaklaşık normal dağılımlı sürekli veriler gerektirir. Spearman rho (ρ), önce verileri sıralar ve monoton ilişkileri ölçer; bu da onu aykırı değerlere karşı sağlam ve anket değerlendirmeleri gibi sıralı veriler için uygun kılar.
Related
Published May 16, 2026 · Last reviewed May 31, 2026