Skip to content

Glossary

Stichproben-Standardabweichung

Streuung eines Stichprobendatensatzes

By Published Updated

Die Stichproben-Standardabweichung ist die Quadratwurzel der Stichprobenvarianz:

s = √(Σ(xᵢ − x̄)² / (n − 1))

Dabei ist der Stichprobenmittelwert, n der Stichprobenumfang, und die Summe läuft über alle Werte. Der n − 1-Divisor ist die Bessel-Korrektur — sie gleicht aus, dass der Stichprobenmittelwert näher an den Daten liegt als der (unbekannte) wahre Mittelwert der Grundgesamtheit, wodurch die rohe Summe der quadrierten Abweichungen die wahre Varianz der Grundgesamtheit unterschätzt.

Verwenden Sie die Stichproben-SD, wenn Ihr Datensatz aus einer größeren Gruppe gezogen ist, die Sie nicht vollständig erfassen können (was fast immer der Fall ist). Verwenden Sie die Populations-SD (Division durch n) nur, wenn der Datensatz buchstäblich die gesamte Grundgesamtheit ist – jeder Mitarbeiter in Ihrem Unternehmen, jede Transaktion im März.

Bei großen Stichprobenumfängen ist der Unterschied vernachlässigbar (n vs. n−1 ist Rundungsrauschen). Bei kleinen Stichprobenumfängen – etwa n < 30 – ist die Korrektur spürbar relevant, und Sie sollten die Stichprobenform bevorzugen.

Unser Statistikrechner verwendet standardmäßig die Stichprobenform mit einem Schalter zum Wechsel auf die Population.

Warum die Quadratwurzel eine kleine Verzerrung wieder einführt: die Bessel-Korrektur macht die Stichprobenvarianz zu einem erwartungstreuen Schätzer der Populationsvarianz, doch die Wurzeloperation ist nichtlinear, und die Jensen-Ungleichung greift – die Stichproben-SD unterschätzt systematisch die wahre Populations-SD, selbst nach der N−1-Korrektur. Die Verzerrung beträgt für normalverteilte Daten ungefähr (1/4n), also 2,5 % bei n=10, 0,25 % bei n=100 und ist jenseits von n=1000 vernachlässigbar. Statistikpakete ignorieren dies meist; der erwartungstreue c4-Korrektur-Schätzer s × √((n−1)/2) × Γ((n−1)/2) / Γ(n/2) existiert für Anwendungen, in denen er wichtig ist (Qualitätskontrolle mit sehr kleinen Stichprobenumfängen). Referenz: NIST/SEMATECH e-Handbook — Standard Deviation.

Durchgerechnetes Beispiel

Fünf Messungen eines chemischen Assays: 9,8, 10,1, 9,9, 10,3, 10,4. Mittelwert x̄ = 10,10. Quadrierte Abweichungen: 0,09, 0,00, 0,04, 0,04, 0,09 — Summe 0,26. Stichprobenvarianz s² = 0,26 / 4 = 0,065; Stichproben-SD s ≈ 0,255. Die Populations-SD (Division durch 5) wäre 0,228 – eine Unterschätzung der zugrunde liegenden Prozessstreuung um 12 %, wenn man eine Stichprobe als Vollerhebung behandelt. Für eine Qualitätsregelkarte mit Eingriffsgrenzen bei x̄ ± 3sverschiebt dieser Unterschied die obere Grenze von 10,78 auf 10,87 und ändert damit wesentlich, welche Produktionsläufe einen Außer-Kontrolle-Alarm auslösen würden.

Wann es in der Praxis zählt

A/B-Tests, Laborwissenschaft, Meinungsumfragen und Finanzwesen ziehen alle Schlüsse aus Stichproben und geben Unsicherheit als ±s oder als Konfidenzintervall auf Basis von s/√n an. Die Populationsformel auf eine Stichprobe anzuwenden, unterschätzt die Unsicherheit und bläht die statistische Signifikanz auf – die Todsünde in Arbeiten zur Reproduzierbarkeitskrise. Tabellenkalkulationen spiegeln diese Unterscheidung in ihren Funktionsnamen wider: Excels STDEV.S teilt durch n−1,STDEV.P durch n; pandas’.std() verwendet standardmäßig ddof=1 (Stichprobe), NumPys np.std() standardmäßig ddof=0(Population). Diese zu vermischen ist einer der häufigsten stillen numerischen Bugs in Datenpipelines. Siehe auch Varianz und Bessel-Korrektur.

Frequently asked questions

Was ist die Stichproben-Standardabweichung?
Die Stichproben-Standardabweichung (s) misst die Streuung der Werte um den Stichprobenmittelwert und wird als Quadratwurzel der durchschnittlichen quadrierten Abweichungen berechnet, wobei im Nenner n minus 1 (nicht n) steht. Die Division durch n minus 1 (Bessel-Korrektur) liefert eine erwartungstreue Schätzung der Standardabweichung der Grundgesamtheit.
Warum durch n minus 1 statt durch n teilen?
Ein Stichprobenmittelwert wird aus denselben Daten berechnet, liegt also näher an den Stichprobenwerten als der wahre Mittelwert der Grundgesamtheit. Dadurch unterschätzt die naive Summe der quadrierten Abweichungen die wahre Varianz. Die Division durch n minus 1 korrigiert diese Verzerrung und liefert einen erwartungstreuen Schätzer.
Was ist der Unterschied zwischen Stichproben- und Populations-Standardabweichung?
Die Populations-Standardabweichung (sigma) teilt durch N (alle Werte) und beschreibt die tatsächliche Streuung einer bekannten, vollständigen Grundgesamtheit. Die Stichproben-Standardabweichung (s) teilt durch n minus 1 und wird verwendet, wenn man eine Teilmenge hat und die Streuung der Grundgesamtheit schätzen möchte. Bei großem n ist der Unterschied vernachlässigbar.

Related

Published May 14, 2026 · Last reviewed May 31, 2026