Glossary
Örneklem standart sapması
Örneklem veri kümesinin yayılımı
By Buğra SözeriPublished Updated
Örneklem standart sapması, örneklem varyansının karekökünden oluşur:
s = √(Σ(xᵢ − x̄)² / (n − 1))
Burada x̄ örneklem ortalamasıdır, n örneklem büyüklüğüdür ve toplam tüm değerler üzerinde çalışır. n − 1 böleni Bessel’in düzeltmesidir — örneklem ortalamasının bilinmeyen gerçek popülasyon ortalamasından veriye daha yakın olduğunu telafi eder; bu durum ham kare sapmalar toplamının gerçek popülasyon varyansını hafife almasına yol açar.
Veri kümeniz kapsamlı biçimde ölçemediğiniz daha büyük bir gruptan çekildiğinde — ki bu neredeyse her zaman böyledir — örneklem SD’sini kullanın.Popülasyon SD’sini (n’ye bölme) yalnızca veri kümesi gerçekten tüm popülasyonu kapsadığında kullanın — şirketinizdeki tüm çalışanlar, Mart ayındaki tüm işlemler.
Büyük örneklem büyüklüklerinde fark ihmal edilebilir düzeydedir (n ile n-1 yuvarlama gürültüsüdür). Küçük örneklem büyüklüklerinde — örneğin n < 30 — düzeltme anlamlı ölçüde önem taşır ve örneklem biçimini tercih etmelisiniz.
İstatistik hesaplayıcımız popülasyona geçiş için bir geçiş düğmesiyle birlikte örneklem biçimini varsayılan olarak kullanır.
Neden karekök küçük bir yanlılık yeniden getirir: Bessel’in düzeltmesi örneklem varyansını popülasyon varyansının yansız bir tahmin edicisi yapar; ancak karekök işlemi doğrusal değildir ve Jensen’in eşitsizliği devreye girer — örneklem SD’si N−1 düzeltmesinden sonra bile gerçek popülasyon SD’sini sistematik olarak hafife alır. Yanlılık normal veriler için yaklaşık (1/4n) kadardır: n=10’da %2,5; n=100’de %0,25; n=1000’den sonra ihmal edilebilir. İstatistiksel paketler bunu çoğunlukla görmezden gelir; yansız c4-düzeltmeli tahmin edici s × √((n−1)/2) × Γ((n−1)/2) / Γ(n/2), küçük örneklem boyutlarıyla kalite kontrol gibi önem taşıdığı uygulamalar için mevcuttur. Kaynak: NIST/SEMATECH e-El Kitabı — Standart Sapma.
Çalışma örneği
Kimyasal bir analizin beş ölçümü: 9,8; 10,1; 9,9; 10,3; 10,4. Ortalama x̄ = 10,10. Kare sapmalar: 0,09; 0,00; 0,04; 0,04; 0,09 — toplam 0,26. Örneklem varyansı s² = 0,26 / 4 = 0,065; örneklem SD s ≈ 0,255. Popülasyon SD (5’e bölerek) 0,228 olurdu — örneklemi nüfus sayımı olarak ele alırken temel süreç yayılımının %12 daha az tahmin edilmesi demektir. x̄ ± 3skontrol limitleriyle bir kalite kontrol grafiği için bu fark üst limiti 10,78’den 10,87’ye taşır; bu da hangi üretim turlarının kontrol dışı alarmı tetikleyeceğini önemli ölçüde değiştirir.
Pratikte ne zaman önemlidir
A/B testi, laboratuvar bilimi, anket ve finans; hepsinde örneklemlerden çıkarım yapılır ve belirsizlik ±s veya s/√nüzerine inşa edilmiş güven aralığı olarak raporlanır. Popülasyon formülünün örneklem üzerinde kullanılması belirsizliği hafife alır ve istatistiksel anlamlılığı şişirir — yeniden üretilebilirlik krizi makalelerindeki temel hata budur. Elektronik tablolar bu ayrımı işlev adlarına yansıtır: Excel’in STDEV.S’si n−1’e,STDEV.P’si n’e böler; pandas’ın.std() işlevi ddof=1(örneklem) varsayılanını kullanırken NumPy’ın np.std() işlevi ddof=0 (popülasyon) varsayılanını kullanır. Bunları karıştırmak, veri boru hatlarındaki en yaygın sessiz sayısal hatalardan biridir. Ayrıca bkz. varyans ve Bessel’in düzeltmesi.
Frequently asked questions
- Örneklem standart sapması nedir?
- Örneklem standart sapması (s), paydada n yerine n eksi 1 kullanılarak hesaplanan, örneklem ortalaması etrafındaki değerlerin yayılımını ölçer. N eksi 1 ile bölmek (Bessel düzeltmesi), popülasyon standart sapmasının yansız bir tahminini üretir.
- Neden n yerine n eksi 1'e bölünür?
- Örneklem ortalaması aynı verilerden hesaplandığı için gerçek popülasyon ortalamasına kıyasla örneklem değerlerine daha yakındır. Bu durum, ham kare sapmalar toplamının gerçek varyansı hafife almasına neden olur. N eksi 1'e bölmek bu yanlılığı düzelterek yansız bir tahmin edici üretir.
- Örneklem standart sapması ile popülasyon standart sapması arasındaki fark nedir?
- Popülasyon standart sapması (sigma), N'ye (tüm değerler) böler ve bilinen tam bir popülasyonun gerçek yayılımını açıklar. Örneklem standart sapması (s), n eksi 1'e böler ve bir alt kümeye sahip olduğunuzda popülasyonun yayılımını tahmin etmek için kullanılır. Büyük n değerlerinde fark ihmal edilebilir düzeydedir.
Related
Published May 14, 2026 · Last reviewed May 31, 2026