Skip to content

Glossary

Varianz

Die quadrierte Standardabweichung

By Published Updated

Die Varianz ist das Mittel der quadrierten Abweichungen vom Mittelwert. Für den Datensatz [4, 8, 6, 5, 3, 7] mit Mittelwert 5,5 lauten die quadrierten Abweichungen 2,25, 6,25, 0,25, 0,25, 6,25, 2,25; Summe 17,5; Stichprobenvarianz (÷ n−1) = 3,5.

Die Varianz liegt in quadrierten Einheiten vor (Kilogramm², Dollar², Sekunden²), was sie unmittelbar schwer interpretierbar macht. Zieht man die Wurzel, erhält man die Standardabweichung, die in den ursprünglichen Einheiten vorliegt. Beide tragen dieselbe Information; die Varianz ist, was man berechnet, die Standardabweichung, was man berichtet.

Warum überhaupt die Varianz bemühen? Weil Varianzen über unabhängige Variationsquellen additiv sind. Sind X und Y unabhängig, gilt Var(X + Y) = Var(X) + Var(Y) — eine Eigenschaft, die Standardabweichungen nicht haben. Das macht die Varianz zur natürlichen Einheit für die Varianzanalyse (ANOVA), die Fehlerfortpflanzung und die meiste theoretische Statistik.

Für die Intuition praktizierender Statistiker hinter Varianz und Standardabweichung siehe den Leitfaden Standardabweichung erklärt.

Populations- vs. Stichprobenvarianz — die Wahl zwischen N und N−1: berechnet man die Varianz über eine ganze Population, teilt man die Summe der quadrierten Abweichungen durch N. Schätzt man die Populationsvarianz aus einer Stichprobe, teilt man stattdessen durch N−1 — bekannt als Bessel-Korrektur. Die Korrektur gleicht aus, dass der Stichprobenmittelwert näher an den Daten liegt als der (unbekannte) Populationsmittelwert, was die rohe Summe der quadrierten Abweichungen nach unten verzerrt. Bei kleinen Stichproben ist der Unterschied erheblich; bei großem N vernachlässigbar. R, pandas und Excels VAR() verwenden standardmäßig N−1; NumPys np.var() verwendet standardmäßig N (überschreibbar mit ddof=1). Lesen Sie die Dokumentation, bevor Sie eine Varianz zitieren — die stille Diskrepanz um den Faktor N/(N−1) verursacht regelmäßig „aber die Zahlen passen nicht zusammen“-Fehlerberichte.

Numerische Fallstricke bei der Berechnung der Varianz: die Lehrbuchformel Var = E[X²] − (E[X])² ist mathematisch korrekt, aber numerisch instabil — für eng beieinanderliegende Daten mit großem Mittelwert (z. B. Temperaturen in Kelvin, Finanzkurse) berechnet sie die Differenz zweier nahezu gleicher großer Zahlen und verliert katastrophal an Genauigkeit. Welfords Online-Algorithmus (1962) und die jüngere parallele Chan-Golub-LeVeque-Variante berechnen die Varianz in einem einzigen Durchlauf ohne Subtraktion großer, nahezu gleicher Terme und sind der moderne Standard. NumPy und pandas implementieren diese unter der Haube; eine Eigenimplementierung mit der Lehrbuchformel auf Produktivdaten ist eine bekannte Falle. Verwandt: Stichproben-Standardabweichung, Mittelwert, Statistik-Rechner.

Durchgerechnetes Beispiel

Angenommen, Sie besitzen ein Aktienportfolio mit zwei unabhängigen Positionen: Aktie A hat eine jährliche Renditevarianz Var(A) = 0,04 (also SD = 20 %), Aktie B hat Var(B) = 0,09 (SD = 30 %). Einzeln gehalten ist A weniger riskant. Kombiniert man sie 50/50: Var(0,5·A + 0,5·B) = 0,25·Var(A) + 0,25·Var(B) = 0,01 + 0,0225 = 0,0325, die Portfolio-SD ist also ≈ √0,0325 ≈ 18 %. Das diversifizierte Portfolio hat eine geringere Varianz als jede Komponente für sich — Markowitz’ Erkenntnis von 1952 in einer Zeile Arithmetik. Hinweis: das funktioniert nur, weil sich die Varianzen addierten (Unabhängigkeit vorausgesetzt). Wären A und B perfekt korreliert, gälte Var(0,5A + 0,5B) = 0,25·Var(A) + 0,25·Var(B) + 2·0,25·Cov(A,B) = 0,0325 + 2·0,25·0,20·0,30 = 0,0625, SD = 25 % — das Mittel der beiden SDs, kein Diversifikationsnutzen.

Wann und warum es zählt

Die Varianz ist die operative Einheit für Risiko im Finanzwesen (Portfoliotheorie), für Fehler in der Experimentalphysik (Kombination von Messunsicherheiten per Wurzel-aus-Quadratsumme), für die Qualitätskontrolle (Six Sigma zielt auf Varianzreduktion statt Mittelwertreduktion, weil sich Mittelwertverschiebungen leicht einstellen lassen, Varianzverschiebungen dagegen eine Prozessumgestaltung erfordern) und für das maschinelle Lernen (der Bias-Varianz-Tradeoff: Modelle mit hoher Varianz überanpassen, Modelle mit hohem Bias unteranpassen). Lesen Sie den „Prozessfähigkeitsindex“ Cpk in der Fertigung oder den „Tracking Error“ in Fondsberichten, lesen Sie eine aus der Varianz abgeleitete Kennzahl. Die Angabe der Standardabweichung schafft Intuition; die Angabe der Varianz liefert eine Größe, die sich über Quellen addiert — beide braucht es für eine flüssige statistische Kommunikation. Quelle: NIST/SEMATECH e-Handbook — Measures of Scale.

Frequently asked questions

Was ist die Varianz in der Statistik?
Die Varianz ist das Mittel der quadrierten Abweichungen vom Mittelwert: Populationsvarianz = Summe von (xi minus mu)^2 geteilt durch N, oder Stichprobenvarianz = Summe von (xi minus x-quer)^2 geteilt durch (n minus 1). Sie quantifiziert die Streuung der Werte, und zwar in quadrierten Einheiten der Ausgangsdaten.
Warum wird die Varianz in quadrierten Einheiten angegeben?
Das Quadrieren der Abweichungen macht sie alle positiv (sodass sich Negatives und Positives nicht aufhebt) und gewichtet große Abweichungen stark. Der Nachteil ist, dass die Varianz in quadrierten Einheiten vorliegt (z. B. kg im Quadrat), weshalb die Standardabweichung – die Wurzel der Varianz – häufiger in interpretierbaren Einheiten berichtet wird.
Was ist der Unterschied zwischen Varianz und Standardabweichung?
Die Varianz ist die mittlere quadrierte Abweichung; die Standardabweichung ist ihre Wurzel und stellt die ursprünglichen Einheiten wieder her. Die Varianz hat die nützliche Eigenschaft, über unabhängige Variablen additiv zu sein; die Standardabweichung addiert sich nicht linear, weshalb die Varianz in statistischen Herleitungen bevorzugt wird.

Related

Published May 16, 2026 · Last reviewed May 31, 2026