Was ist die Streuung in der Statistik?

Statistik löst bei vielen Studierenden erst einmal Unbehagen aus. Du hast vielleicht schon gelernt, wie man einen einfachen Durchschnitt berechnet, aber das ist nur die halbe Wahrheit deiner Daten. Um Datensätze wirklich zu verstehen, musst du wissen, wie sie sich verhalten.

Streuung (auch Dispersionsmaße genannt) bedeutet statistische Kennzahlen, die angeben, wie stark die einzelnen Werte einer Datenreihe um einen zentralen Mittelwert verteilt sind. Sie zeigen dir auf einen Blick, ob deine Daten eng beieinanderliegen oder weit auseinanderdriften.

In der Datenanalyse ist ein Mittelwert allein oft wertlos. Er verrät dir absolut nichts darüber, ob alle gemessenen Werte identisch sind oder ob extreme Ausreißer das Ergebnis verzerren. Streuung liefert dir diesen fehlenden Kontext. Sie macht deine Auswertungen belastbar und bewahren dich vor falschen Schlussfolgerungen in deiner Hausarbeit.

Definition: Was ist Streuung?

Stell dir vor, du hast eine Gruppe von Messwerten gesammelt. Die Streuung misst schlichtweg die "Breite" oder "Verteilung" dieser Werte. Wenn alle Teilnehmer deiner Studie exakt gleich antworten, gibt es keine Streuung. Sobald die Antworten abweichen, entsteht eine Streuung.

Es gibt verschiedene Kennzahlen, um dieses Phänomen zu messen. Die drei wichtigsten sind:

  • Spannweite (Range):  der einfache Abstand zwischen dem kleinsten und dem größten gemessenen Wert.
  • Varianz:  die durchschnittliche quadratische Abweichung aller Werte von ihrem Mittelwert.
  • Standardabweichung:  die Wurzel aus der Varianz. Sie zeigt die durchschnittliche Abweichung in der ursprünglichen Maßeinheit.

Ein häufiger Fehler bei der Datenanalyse ist es, nur auf den Durchschnitt zu schauen und die Variabilität komplett zu ignorieren. Lass uns an einem alltäglichen Beispiel verdeutlichen, warum das problematisch ist.

Beispiel für eine Streuung in der Mathe

Stell dir zwei Buslinien vor. Beide fahren im Durchschnitt exakt pünktlich um 08:00 Uhr ab (Mittelwert).

Bus A fährt meistens zwischen 07:59 und 08:01 Uhr ab. Die Streuung ist hier extrem gering. Du weißt genau, woran du bist.

Bus B fährt an manchen Tagen schon um 07:50 Uhr ab und an anderen erst um 08:10 Uhr. Der Mittelwert ist zwar derselbe (08:00 Uhr), aber die empirische Streuung ist riesig. Auf Bus B kannst du dich nicht verlassen.

Streuung richtig berechnen

Wie berechnet man die Streuung? Die Berechnung von Varianz und Standardabweichung wirkt auf den ersten Blick durch die vielen mathematischen Zeichen kompliziert, folgt aber einem klaren, mechanischen Muster. Du musst lediglich das Prinzip der Abweichungen verstehen.

Die Formel für die Stichprobenvarianz besagt, dass du die Summe der quadrierten Abweichungen vom Mittelwert berechnest und diese durch die Anzahl der Werte minus 1 (n-1) teilst. Für die Standardabweichung ziehst du am Ende einfach die Wurzel aus diesem Ergebnis.

Gehe bei der manuellen Berechnung immer exakt nach diesem Schema vor:

  1. Mittelwert berechnen.
    Addiere alle Werte deiner Stichprobe und teile die Summe durch die Gesamtanzahl der Werte.
  2. Abweichungen ermitteln.
    Subtrahiere den Mittelwert von jedem einzelnen Wert deines Datensatzes.
  3. Werte quadrieren.
    Multipliziere jede ermittelte Abweichung mit sich selbst. Tust du das nicht, heben sich positive und negative Abweichungen auf und die Summe ist immer exakt null. Das ist ein typischer Anfängerfehler.
  4. Varianz bestimmen.
    Addiere alle quadrierten Werte und teile diese Summe durch die Anzahl der Werte minus 1.
  5. Standardabweichung ziehen.
    Berechne die Quadratwurzel aus deiner Varianz.

Lass uns diesen Prozess an einem konkreten Datensatz durchrechnen.

Beispiel für eine Berechnung der Streuung

Du analysierst die Klausurpunkte von fünf Studierenden: 10, 12, 14, 15 und 19 Punkte.

1. Mittelwert: (10 + 12 + 14 + 15 + 19) / 5 = 14 Punkte.

2. Abweichungen: (10-14)= -4 | (12-14)= -2 | (14-14)= 0 | (15-14)= 1 | (19-14)= 5.

3. Quadrieren: 16 | 4 | 0 | 1 | 25.

4. Varianz: (16 + 4 + 0 + 1 + 25) / (5 - 1) = 46 / 4 = 11,5.

5. Standardabweichung: √11,5 ~ 3,39 Punkte.

Wichtige Aspekte von Streuung und Standardabweichung

In wissenschaftlichen Texten werden Varianz und Standardabweichung oft in einem Atemzug genannt. Obwohl sie mathematisch eng verwandt sind, erfüllen sie bei der Interpretation deiner Daten völlig unterschiedliche Zwecke.

MerkmalVarianzStandardabweichung
EinheitQuadrierte Originaleinheit (z. B. Punkte²).Originaleinheit (z. B. Punkte).
InterpretationSchwer greifbar, abstrakt.Sehr intuitiv und anschaulich.
EinsatzgebietZwischenschritt für komplexe Tests (z. B. ANOVA).Deskriptive Statistik, Tabellen, Fließtext.
Anfälligkeit für AusreißerSehr hoch (durch das Quadrieren).Hoch, aber leicht abgemildert durch die Wurzel.

Du nutzt die Varianz fast ausschließlich als mathematischen Zwischenschritt. Wenn du hingegen deinen Lesern erklären möchtest, wie homogen deine Stichprobe ist, berichtest du immer die Standardabweichung. Sie lässt sich direkt mit dem Mittelwert vergleichen, da sie dieselbe Maßeinheit besitzt.

Wichtiger Hinweis

Sowohl Varianz als auch Standardabweichung reagieren extrem empfindlich auf Ausreißer. Wenn deine Daten stark schief verteilt sind (z. B. beim Einkommen), sind diese Maße irreführend. In solchen Fällen solltest du stattdessen robuste statistische Streuung wie den Interquartilsabstand (IQR) verwenden.

Fazit und abschließende Gedanken

Streuung ist das unverzichtbare Gegenstück zum Mittelwert. Sie verratet dir, wie repräsentativ dein berechneter Durchschnitt wirklich ist und ob deine Datenpunkte eng beieinanderliegen oder stark variieren. Du weißt nun, wie du die Abweichungen mechanisch berechnest und warum die Standardabweichung meist die anschaulichere Kennzahl für deine Berichte ist.

Bevor du blind Formeln in SPSS, R oder Excel anwendest, erstelle immer zuerst ein einfaches Diagramm (z. B. ein Histogramm oder einen Boxplot) deiner Daten. Die visuelle Darstellung hilft dir enorm dabei, die berechnete Streuung sofort richtig einzuordnen und eventuelle Tippfehler bei der Dateneingabe auf einen Blick zu erkennen.