Glossary
Bessel-Korrektur
Das N−1 in der Stichprobenvarianz
By Buğra SözeriPublished Updated
Die Bessel-Korrektur ist die Konvention, bei der Berechnung von Stichprobenvarianz und Stichproben-Standardabweichung durch N−1 statt durch N zu dividieren. Die Korrektur gleicht die systematische Unterschätzung der Varianz der Grundgesamtheit aus, die daraus resultiert, dass der Stichprobenmittelwert (der den Daten näher liegt als der unbekannte wahre Mittelwert der Grundgesamtheit) als Zentrierungspunkt verwendet wird.
Benannt nach Friedrich Bessel, dem deutschen Astronomen und Mathematiker des 19. Jahrhunderts. Der mathematische Beweis: E[Σ(x − x̄)²] = (N−1)σ², wobei σ² die wahre Varianz der Grundgesamtheit ist und der Erwartungswert über alle möglichen Stichproben der Größe N läuft. Die Division der beobachteten Summe durch N−1 liefert einen unverzerrten Schätzer für σ².
Bei großem N ist die Korrektur vernachlässigbar (1/N vs. 1/(N−1) unterscheiden sich jenseits von N=100 um weniger als 1 %). Bei kleinem N ist sie spürbar wichtig – bei N=5 ist die korrigierte Varianz 25 % größer als die unkorrigierte Version. Unser Statistik-Rechner verwendet standardmäßig die Bessel-korrigierte Form, weil der Datensatz, den Sie einfügen, fast immer eine Stichprobe ist und keine vollständige Grundgesamtheit.
Wann man die Bessel-Korrektur nicht anwenden sollte: wenn man tatsächlich die gesamte Grundgesamtheit hat und nicht eine daraus gezogene Stichprobe. Wenn Sie die Varianz der Testergebnisse jedes Schülers einer Klasse berechnen und sich nur für diese Klasse interessieren, dividieren Sie durch N. Wenn Sie diese Klasse nutzen, um die Varianz in der breiteren Schülerschaft zu schätzen, dividieren Sie durch N−1. Statistikpakete sind sich beim Standard uneinig: NumPys np.var() verwendet N; pandas’ .var() und Rs var() verwenden N−1. Lesen Sie die Dokumentation, bevor Sie eine Zahl zitieren.
Die Bessel-Korrektur beseitigt die Verzerrung der Varianz, aber die daraus abgeleitete Stichproben-Standardabweichung (die Quadratwurzel) ist immer noch leicht verzerrt – die Quadratwurzel ist eine nichtlineare Funktion, und die Jensensche Ungleichung greift. Für die meisten praktischen Zwecke wird diese Restverzerrung ignoriert; für Arbeiten mit kleinen Stichproben, bei denen sie zählt, verwenden Sie einen c4-Korrekturfaktor. Siehe auch Stichproben-Standardabweichung und Varianz.
Warum es zählt: ein durchgerechnetes Beispiel
Betrachten wir eine Stichprobe von fünf Testergebnissen: 72, 78, 80, 84, 86. Der Mittelwert ist 80. Die Summe der quadrierten Abweichungen vom Mittelwert ist (72−80)² + (78−80)² + (80−80)² + (84−80)² + (86−80)² = 64 + 4 + 0 + 16 + 36 = 120. Ohne Bessel-Korrektur ist die Varianz 120 ÷ 5 = 24; mit Bessel-Korrektur ist sie 120 ÷ (5−1) = 30, eine um 25 % größere Schätzung. Die entsprechenden Standardabweichungen sind √24 ≈ 4,90 und √30 ≈ 5,48. Behandelt man dies als Stichprobe aus einer größeren Schülerpopulation, ist 5,48 die unverzerrte Schätzung der Streuung der Grundgesamtheit; 4,90 unterschätzt sie systematisch. Bei N = 30 schrumpft die Lücke auf 3,4 %; bei N = 100 sind es 1 %; bei N = 1000 sind es 0,1 %. Die Korrektur rechtfertigt ihre Komplexität nur bei wirklich kleinen Stichproben.
Warum es zählt: Konfidenzintervalle und t-Tests
Jedes Verfahren, das die Stichproben-Standardabweichung als Ersatzschätzer für die Standardabweichung der Grundgesamtheit verwendet, hängt davon ab, dass die Bessel-Korrektur angewendet wird. Konfidenzintervalle um einen Mittelwert, Zwei-Stichproben-t-Tests, ANOVA-F-Statistiken und Regressions-Standardfehler setzen alle den unverzerrten N−1-Nenner voraus. Das Vergessen der Korrektur erzeugt engere Konfidenzintervalle, als die Realität rechtfertigt, und erhöht die Fehlerraten erster Art – eine stille, aber reale Quelle nicht reproduzierbarer Ergebnisse in empirischen Arbeiten mit kleinen Stichproben. Quelle: NIST/SEMATECH e-Handbook of Statistical Methods §1.3.5.6 — Standard Deviation.
Frequently asked questions
- Was ist die Bessel-Korrektur?
- Die Bessel-Korrektur ist die Verwendung von N−1 (statt N) im Nenner bei der Berechnung der Stichprobenvarianz. Sie korrigiert die systematische Unterschätzung, die entsteht, weil die Stichprobenabweichungen vom Stichprobenmittelwert und nicht vom wahren Mittelwert der Grundgesamtheit gemessen werden.
- Wie funktioniert die Bessel-Korrektur in der Praxis?
- Bei einer Stichprobe von 5 Werten {2, 4, 4, 4, 5} beträgt die Summe der quadrierten Abweichungen vom Mittelwert (3,8) gleich 5,2. Die Division durch N=5 ergibt eine verzerrte Varianz von 1,04; die Division durch N−1=4 ergibt die unverzerrte Stichprobenvarianz von 1,3, die die Varianz der Grundgesamtheit besser schätzt.
- Was ist der Unterschied zwischen Varianz der Grundgesamtheit und Stichprobenvarianz?
- Die Varianz der Grundgesamtheit dividiert durch N und ist exakt, wenn man jeden Datenpunkt hat. Die Stichprobenvarianz dividiert durch N−1 (Bessel-Korrektur) und ist ein unverzerrter Schätzer, wenn man nur eine Teilmenge hat. Die meisten Tabellen-VAR()-Funktionen verwenden standardmäßig N−1.
- Wann sollte man die Bessel-Korrektur NICHT anwenden?
- Wenn man die vollständige Grundgesamtheit hat – jeden Datenpunkt – dividiert man durch N. Die Bessel-Korrektur ist nur angebracht, wenn Ihre Daten eine aus einer größeren Grundgesamtheit gezogene Stichprobe sind und Sie deren Varianz schätzen.
Related
Published May 14, 2026 · Last reviewed May 31, 2026