Normalverteilung
Beschreibung
Die Normalverteilung, oft **Glockenkurve** oder Gauß-Verteilung genannt, ist die wichtigste Wahrscheinlichkeitsverteilung in der Statistik. Sie beschreibt einen Datensatz, bei dem sich die meisten Werte um einen zentralen Durchschnitt (Mittelwert) gruppieren, wobei immer weniger Werte auftreten, je weiter man sich vom Zentrum entfernt.
Sie wird durch zwei Parameter definiert: * **Mittelwert ($\mu$):** Das Zentrum der Spitze. * **Standardabweichung ($\sigma$):** Wie breit oder gestreut die Kurve ist.
Die **Empirische Regel (68-95-99,7)** besagt, dass für eine Normalverteilung gilt: * 68% der Daten liegen innerhalb von 1 Standardabweichung vom Mittelwert. * 95% liegen innerhalb von 2 Standardabweichungen. * 99,7% liegen innerhalb von 3 Standardabweichungen.
Geschichte & Ursprünge
Die Entdeckung der Normalverteilung ist eine Geschichte von drei Mathematikern. Abraham de Moivre (1733): Er war der erste, der die Glockenform bemerkte, als er Münzwürfe (Binomialverteilung) für große Zahlen annäherte. Carl Friedrich Gauß (1809): Er wandte die Formel an, um Fehler in astronomischen Beobachtungen zu analysieren. Aufgrund seiner Arbeit wird sie oft als "Gauß-Verteilung" bezeichnet. Pierre-Simon Laplace (1812): Er bewies den Zentralen Grenzwertsatz, der erklärt, warum die Normalverteilung überall in der Natur auftritt – von menschlichen Körpergrößen bis zu Testergebnissen.
Warum die Konstante 1/√(2π)?
Die Fläche unter der gesamten Kurve muss gleich 1 (100% Wahrscheinlichkeit) sein. Um diese Konstante zu beweisen, lösen wir das berühmte Gaußsche Integral.
Sei $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.
Quadriere es: $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.
Konvertiere zu Polarkoordinaten: $x^2 + y^2 = r^2$ und $dx dy = r dr d\theta$.
Das Integral wird $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.
Löse das innere Integral durch Substitution ($u=r^2$): Es ergibt $1/2$.
Multipliziere mit $2\pi$: $I^2 = 2\pi(1/2) = \pi$.
Also $I = \sqrt{\pi}$.
Unsere Funktion hat zusätzliche Skalierungsfaktoren, die zur Normierungskonstante $\frac{1}{\sqrt{2\pi}}$ führen.
Variablen
| Symbol | Bedeutung |
|---|---|
f(x) | Wahrscheinlichkeitsdichte (Höhe der Kurve) |
μ | Mittelwert (Durchschnitt/Zentrum) |
σ | Standardabweichung (Streuung/Breite) |
x | Wert, den Sie prüfen |
Beispiel
Grundberechnung
Problem : IQ-Werte sind normalverteilt mit Mittelwert=100 und SD=15. Was ist der Z-Wert für einen IQ von 130?
Lösung :
Qualitätskontrolle in der Fabrik
Problem : Eine Maschine füllt Müslischachteln. Das mittlere Gewicht beträgt 500g mit einer Standardabweichung von 5g. Welcher Prozentsatz der Schachteln liegt zwischen 495g und 505g?
Lösung : 68%
- Identifiziere Grenzen: 495g und 505g.
- Berechne Abstand vom Mittelwert: $500 - 495 = 5$g und $505 - 500 = 5$g.
- Konvertiere in Standardabweichungen: $5\text{g} = 1\sigma$.
- Wende Empirische Regel an: Die Fläche innerhalb von $\pm 1\sigma$ beträgt ungefähr 68%.
- Fazit: Etwa 68% der Schachteln liegen in diesem Bereich.
Benotung nach Kurve (Grading on a Curve)
Problem : Ein Test hat einen Mittelwert von 70 und eine SD von 10. Um eine 1,0 (Top 2,5%) zu bekommen, welches Ergebnis brauchst du?
Lösung : ~90
- Identifiziere die Schwelle: Top 2,5%.
- Aus der 68-95-99,7-Regel liegen 95% in der Mitte. Die restlichen 5% liegen in den Enden (2,5% niedrig, 2,5% hoch).
- Die Top 2,5% beginnen bei $+2$ Standardabweichungen.
- Berechne Ergebnis: $\text{Mittelwert} + 2\sigma$.
- Einsetzen: $70 + 2(10) = 70 + 20 = 90$.
- Du brauchst ein Ergebnis von 90.
Häufige Fehler
Denken, dass der PDF-Wert die Wahrscheinlichkeit ist
Der Wert $f(x)$ ist die *Dichte*, nicht die Wahrscheinlichkeit. Wahrscheinlichkeit ist die *Fläche* unter der Kurve zwischen zwei Punkten. Für einen bestimmten Punkt $x$ ist die Wahrscheinlichkeit technisch gesehen 0.
Verwechslung von Mittelwert und Median
In einer perfekten Normalverteilung sind Mittelwert = Median = Modus. Aber in schiefen realen Daten unterscheiden sie sich. Die Glockenkurvenformel nimmt perfekte Symmetrie an.
Reale Anwendungen
Six Sigma Fertigung
In der Fertigung ist "Six Sigma" ein Qualitätsziel. Es bedeutet, dass der Prozess so präzise ist, dass Fehler nur außerhalb von 6 Standardabweichungen vom Mittelwert auftreten. Dies entspricht nur 3,4 Fehlern pro Million Möglichkeiten.
Finanzen: Value at Risk (VaR)
Banken nutzen die Normalverteilung, um das Risiko von Finanzportfolios zu modellieren. Durch die Berechnung der Standardabweichung (Volatilität) von Vermögenspreisen schätzen sie den maximalen potenziellen Verlust über einen bestimmten Zeitraum.
Häufig gestellte Fragen
Was ist ein Z-Wert?
Ein Z-Wert sagt dir, wie viele Standardabweichungen ein Datenpunkt vom Mittelwert entfernt ist. $Z = (x - \mu) / \sigma$. Er ermöglicht den Vergleich verschiedener Datensätze.
Warum heißt sie "Normal"?
Weil Statistiker des 19. Jahrhunderts fanden, dass Messfehler "normalerweise" diesem Muster folgten. Es wurde zur Standard- oder "normalen" Erwartung für zufällige Daten.