Varianz und Standardabweichung


\(\\\)

Durchschnitt

In folgender Urliste habe wir die Ergebnisse einer Klausur:

Urliste = \(\{4, 3, 5, 3, 2, 4, 3, 4, 4, 6, 4, 5, 3, 3, 3, 2, 5, 4, 4, 4\}\)

Die Verteilung ist hier in einem Diagramm dargestellt:

my image

\(\\\)

Als geordnete Tabelle sieht es also wie folgt aus:

my image

\(\\\)

Wie kann diese Verteilung nun beurteilt werden?

Ein erstes Kriterium ist die Durchschnittsnote, also das arithmetische Mittel \(\overline{x}\). Üblich ist auch die Bezeichnung Erwartungswert E(x) oder auch \(\mu\). Im Folgenden verwenden wir \(\mu\).

\( \quad \mu = \frac{1}{n}\displaystyle{\displaystyle{\sum}}_{i=1}^6 x_i \cdot h(x_i) = \frac{0 \cdot 1 + 2 \cdot 2 + 6 \cdot 3 + 8 \cdot 4 + 3 \cdot 5 + 1 \cdot 6}{20} \)

\(\\\)

Auf einfache Weise können wir das über die Tabelle berechnen.

my image

\(\\\)

Nun brauchen wir nur noch Folgendes rechnen:

\( \quad \mu = \frac{75}{20} =3{,}75 \)

\(\\\)

Das arithmetische Mittel hat diese Lage.

my image

\(\\\)

Die erzielten Noten verteilen sich gleichmäßig um diese Linie, so dass sie als das repräsentative Ergebnis der Klausur gewertet werden kann.

Nun stellt sich die Frage, ob die Durchschnittsnote den Ausgang der Klausur hinreichend beschreibt.

\(\\[2em]\)

Streuung

Es ist vorstellbar, dass es Verteilungen gibt, die genau die gleiche Durchschnittsnote aufweisen, jedoch von der Verteilung ganz anders geartet sind, also dichter am Mittelwert liegen oder weiter weg davon. Deshalb wird als weiteres Charakteristikum die Streuung betrachtet.

my image

\(\\\)

Die Streuung berechnen wir mit der Differenz der jeweils erzielter Note und der Durchschnittsnote.

\( \quad x_i - \mu \)

\(\\\)

Dabei müssen wir aber auch die Häufigkeiten berücksichtigen mit

\( \quad h(x_i) \cdot (x_i - \mu) \)

\(\\\)

Es folgt

my image

\(\\\)

Wenn wir alle Abstände addieren bekommen wir Null heraus. Dann wäre auch der Mittelwert der Abweichungen von der Durchschnittsnote Null.

Um nun einen realistischen Wert für die durchschnittliche Abweichung zu bekommen, müssten die Abweichungen alle positiv sein. Das können wir erreichen, indem wir die Abweichungen alle quadrieren.

my image

\(\\\)

Beachte:
Durch das Quadrieren werden kleine Abweichungen noch kleiner und große Abweichungen größer.

\(\\[2em]\)

Varianz

Wir bekommen

my image

\(\\\)

als Summe der quadrierten Abweichungen \(19{,}75\). Den Mittelwert der quadrierten Abweichungen nennt man die Varianz. Diese wird nun berechnet mit

\( \quad V(x) = \sigma^2 = \frac{19{,}75}{20} = 0{,}9875 \)

\(\\\)

Für die Varianz gilt also

\( \quad \begin{array}{ r c l } V(x) & = & \frac{(x_1 - \mu)^2 \cdot h(x_1) \; + \; (x_2 - \mu)^2 \cdot h(x_2) \; + \; \dots \; + \; (x_n - \mu)^2 \cdot h(x_n)}{n} \\[6pt] & = & (x_1 - \mu)^2 \cdot \frac{h(x_1)}{n} \; + \; (x_2 - \mu)^2 \cdot \frac{h(x_2)}{n} \; + \; \dots \; + \; (x_n - \mu)^2 \cdot \frac{h(x_n)}{n} \\ \end{array} \)

\(\\\)

Ersetzen wir nun die relative Häufigkeit \(\frac{h(x_i)}{n}\) durch die Wahrscheinlichkeit \(P(x_i)\), so erhalten wir die allgemeine Formel:

\( \quad \begin{array}{ r c l } V(x) & = & \displaystyle{\sum}_{i=1}^n (x_i - \mu)^2 \cdot P(x_i) \\[6pt] & = & (x_1 - \mu)^2 \cdot P(x_1) \; + \; (x_2 - \mu)^2 \cdot P(x_2) \; + \; \dots \; + \; (x_n - \mu)^2 \cdot P(x_n) \\ \end{array} \)

\(\\[2em]\)

Standardabweichung

Nehmen wir nun die Quadrierung wieder heraus, so erhalten wir die Standardabweichung.

\( \quad \sigma = \sqrt{V(x)} = \sqrt{0{,}9875} = 0{,}9937303457 \approx 0{,}99 \)

\(\\\)

Das durchschnittliche Klausurnote lautet also \(3{,}75 \pm 0{,}99\) .

\(\\\)

Hier gilt allgemein:

\( \quad \begin{array}{ r c l } \sigma & = & \sqrt{V(x)} \\[6pt] & = & \sqrt{\displaystyle{\sum}_{i=1}^n (x_i - \mu)^2 \cdot P(x_i)} \\[6pt] & = & \sqrt{(x_1 - \mu)^2 \cdot P(x_1) \; + \; (x_2 - \mu)^2 \cdot P(x_2) \; + \; \dots \; + \; (x_n - \mu)^2 \cdot P(x_n)} \\ \end{array} \)

\(\\\)

Hinweis: Diese Art von Tabellenauswertungen mit der Varianz und Standardabweichung können wir mit der Statistikfunktion des Taschenrechners auf einfache Weise anzeigen lassen.

\(\\[2em]\)

Varianz und Standardabweichung in der Binomialverteilung

In der Binomialverteilung gilt stets, dass die Wahrscheinlichkeiten einzelner Ereignisse jeweils gleich sind. Beispielsweise ist bei einem Münzwurf das Ereignis Zahl immer 50%, sofern die Münze nicht verbeult ist oder sonst wie verändert wurde. Das vereinfacht die Berechnung der Streuungsmaße erheblich.

\( \quad \boxed{ \begin{array}{ r c r } V(x) & = & n \cdot p \cdot (1 - p) \\[12pt] \sigma & = & \sqrt{n \cdot p \cdot (1 - p)} \\ \end{array} } \)

\(\\[1em]\)