Konfidenzintervall


\(\\\)

Wir betrachten zunächst die 90%ige \(\sigma\)-Umgebung mit

\( \quad \begin{array}{ r c c } n & = & 200 \\[3pt] p & = & 0{,}3 \\[3pt] k & = & 57 \\ \end{array} \)

\(\\\)

my image

\(\\\)

Um im Folgenden alles anschaulich zu gestalten ist der Sachverhalt hier als stetige Funktion (Normalverteilung) dargestellt.

my image

\(\\\)

Für das Konfidenzintervall stellt sich nun folgende Frage: Welche 90%ige \(\sigma\)-Umgebung enthält gerade noch den \(k\)-Wert?

Einen Grenzfall erhalten wir, wenn wir die Verteilung soweit nach rechts verschieben, so dass der \(k\)-Wert genau auf der linken Grenze der \(\sigma\)-Umgebung liegt.

my image

\(\\\)

Schauen wir uns die Eigenschaften von Verteilungen an. Es lässt sich feststellen, dass bei zunehmenden \(p\)-Wert eine Verteilung weiter rechts liegt.

my image

\(\\\)

Um die Verteilung nach rechts zu verschieben, muss also der \(p\)-Wert erhöht werden. Damit \(k\) auf der linken Grenze der \(\sigma\)-Umgebung liegt, muss für den linksseitigen Ablehnungsbereich gelten:

\( \quad \begin{array}{ r c l } P(x \leq 57) & < & 0{,}05 \\ \end{array} \)

\(\\[1em]\)

1. Bestimmung über gezieltes Probieren

Eine Möglichkeit den dazugehörigen \(p\)-Wert zu ermitteln besteht in dem gezielten Probieren. Der \(p\)-Wert soll nun auf 4 Nachkommastellen genau bestimmt werden.

my image

\(\\\)

Der gesuchte \(p\)-Wert muss kleiner als \(0{,}34221\) sein. Also ist

\( \quad \begin{array}{ r c l c l } p & = & 0{,}3422 & = & 34{,}22 \, \% \\ \end{array} \)

\(\\[2em]\)

2. Berechnung mit der Näherungsformel

Eine andere Möglichkeit ist die Berechnung mit der Näherungsformel. Ist die Stichprobe genügend groß, und bei \(n=200\) gehen wir davon aus, kann die folgende Formel verwendet werden. Zunächst benötigen wir die relative Häufigkeit mit

\( \quad \begin{array}{ r c l c l c l } h & = & \frac{k}{n} & = & \frac{57}{200} & = & 0{,}285 \\ \end{array} \)

\(\\\)

Für den maximalen \(p\)-Wert verwenden wir die Formel

\( \quad \begin{array}{ r c l } p_{max} & = & h + z \cdot \sqrt{\frac{h \cdot (1-h)}{n}} \\ \end{array} \)

\(\\\)

Bei einer 90%igen \(\sigma\)-Umgebung verwenden wir den Radius \(z=1{,}64\).

\( \quad \begin{array}{ r c l } p_{max} & = & 0{,}285 + 1{,}64 \cdot \sqrt{\frac{0{,}285 \cdot (1-0{,}285)}{200}} \\[4pt] & = & 0{,}3373 \\[4pt] & = & 33{,}73 \, \% \\ \end{array} \)

\(\\\)

Wie der Name schon sagt, ist die Näherungsformel nicht so genau wie das Verfahren mit dem gezielten Probieren. Dieser Näherungswert soll uns aber genügen.

Entsprechend zu dem maximalen \(p\)-Wert können wir auch einen minimalen \(p\)-Wert berechnen. Das ist der Wert, der sich ergibt, wenn wir die Verteilung soweit es geht nach links verschieben.

my image

\(\\\)

Der minimale \(p\)-Wert berechnet sich mit

\( \quad \begin{array}{ r c l } p_{min} & = & h + z \cdot \sqrt{\frac{h \cdot (1-h)}{n}} \\[4pt] p_{max} & = & 0{,}285 - 1{,}64 \cdot \sqrt{\frac{0{,}285 \cdot (1-0{,}285)}{200}} \\[4pt] & = & 0{,}2327 \\[4pt] & = & 23{,}27 \, \% \\ \end{array} \)

\(\\\)

Auf die exakte Berechnung mit dem gezielten Probieren sei hier verzichtet.

Das Intervall, in dem sich \(p\) bewegen kann nennt man das Konfidenzintervall oder Vertrauensintervall. Mit den Näherungswerten haben wir das Intervall \([0{,}2327 \, ; \, 0{,}3373]\).

\(\\[1em]\)