Normalverteilung

f(x)=1σ2πe12(xμσ)2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

Beschreibung

Die Normalverteilung, oft **Glockenkurve** oder Gauß-Verteilung genannt, ist die wichtigste Wahrscheinlichkeitsverteilung in der Statistik. Sie beschreibt einen Datensatz, bei dem sich die meisten Werte um einen zentralen Durchschnitt (Mittelwert) gruppieren, wobei immer weniger Werte auftreten, je weiter man sich vom Zentrum entfernt.

Sie wird durch zwei Parameter definiert: * **Mittelwert ($\mu$):** Das Zentrum der Spitze. * **Standardabweichung ($\sigma$):** Wie breit oder gestreut die Kurve ist.

Die **Empirische Regel (68-95-99,7)** besagt, dass für eine Normalverteilung gilt: * 68% der Daten liegen innerhalb von 1 Standardabweichung vom Mittelwert. * 95% liegen innerhalb von 2 Standardabweichungen. * 99,7% liegen innerhalb von 3 Standardabweichungen.

Geschichte & Ursprünge

Die Entdeckung der Normalverteilung ist eine Geschichte von drei Mathematikern. Abraham de Moivre (1733): Er war der erste, der die Glockenform bemerkte, als er Münzwürfe (Binomialverteilung) für große Zahlen annäherte. Carl Friedrich Gauß (1809): Er wandte die Formel an, um Fehler in astronomischen Beobachtungen zu analysieren. Aufgrund seiner Arbeit wird sie oft als "Gauß-Verteilung" bezeichnet. Pierre-Simon Laplace (1812): Er bewies den Zentralen Grenzwertsatz, der erklärt, warum die Normalverteilung überall in der Natur auftritt – von menschlichen Körpergrößen bis zu Testergebnissen.

Warum die Konstante 1/√(2π)?

Die Fläche unter der gesamten Kurve muss gleich 1 (100% Wahrscheinlichkeit) sein. Um diese Konstante zu beweisen, lösen wir das berühmte Gaußsche Integral.

1

Sei $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.

2

Quadriere es: $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.

3

Konvertiere zu Polarkoordinaten: $x^2 + y^2 = r^2$ und $dx dy = r dr d\theta$.

4

Das Integral wird $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.

5

Löse das innere Integral durch Substitution ($u=r^2$): Es ergibt $1/2$.

6

Multipliziere mit $2\pi$: $I^2 = 2\pi(1/2) = \pi$.

7

Also $I = \sqrt{\pi}$.

8

Unsere Funktion hat zusätzliche Skalierungsfaktoren, die zur Normierungskonstante $\frac{1}{\sqrt{2\pi}}$ führen.

Variablen

Symbol Bedeutung
f(x) Wahrscheinlichkeitsdichte (Höhe der Kurve)
μ Mittelwert (Durchschnitt/Zentrum)
σ Standardabweichung (Streuung/Breite)
x Wert, den Sie prüfen

Beispiel

Grundberechnung

Problem : IQ-Werte sind normalverteilt mit Mittelwert=100 und SD=15. Was ist der Z-Wert für einen IQ von 130?

Lösung :

Z = (130 - 100) / 15 = 2. Das bedeutet, 130 liegt 2 Standardabweichungen über dem Durchschnitt.

Qualitätskontrolle in der Fabrik

Problem : Eine Maschine füllt Müslischachteln. Das mittlere Gewicht beträgt 500g mit einer Standardabweichung von 5g. Welcher Prozentsatz der Schachteln liegt zwischen 495g und 505g?

Lösung : 68%

  1. Identifiziere Grenzen: 495g und 505g.
  2. Berechne Abstand vom Mittelwert: $500 - 495 = 5$g und $505 - 500 = 5$g.
  3. Konvertiere in Standardabweichungen: $5\text{g} = 1\sigma$.
  4. Wende Empirische Regel an: Die Fläche innerhalb von $\pm 1\sigma$ beträgt ungefähr 68%.
  5. Fazit: Etwa 68% der Schachteln liegen in diesem Bereich.

Benotung nach Kurve (Grading on a Curve)

Problem : Ein Test hat einen Mittelwert von 70 und eine SD von 10. Um eine 1,0 (Top 2,5%) zu bekommen, welches Ergebnis brauchst du?

Lösung : ~90

  1. Identifiziere die Schwelle: Top 2,5%.
  2. Aus der 68-95-99,7-Regel liegen 95% in der Mitte. Die restlichen 5% liegen in den Enden (2,5% niedrig, 2,5% hoch).
  3. Die Top 2,5% beginnen bei $+2$ Standardabweichungen.
  4. Berechne Ergebnis: $\text{Mittelwert} + 2\sigma$.
  5. Einsetzen: $70 + 2(10) = 70 + 20 = 90$.
  6. Du brauchst ein Ergebnis von 90.

Häufige Fehler

❌ Fehler

Denken, dass der PDF-Wert die Wahrscheinlichkeit ist

✅ Korrektur

Der Wert $f(x)$ ist die *Dichte*, nicht die Wahrscheinlichkeit. Wahrscheinlichkeit ist die *Fläche* unter der Kurve zwischen zwei Punkten. Für einen bestimmten Punkt $x$ ist die Wahrscheinlichkeit technisch gesehen 0.

❌ Fehler

Verwechslung von Mittelwert und Median

✅ Korrektur

In einer perfekten Normalverteilung sind Mittelwert = Median = Modus. Aber in schiefen realen Daten unterscheiden sie sich. Die Glockenkurvenformel nimmt perfekte Symmetrie an.

Reale Anwendungen

Six Sigma Fertigung

In der Fertigung ist "Six Sigma" ein Qualitätsziel. Es bedeutet, dass der Prozess so präzise ist, dass Fehler nur außerhalb von 6 Standardabweichungen vom Mittelwert auftreten. Dies entspricht nur 3,4 Fehlern pro Million Möglichkeiten.

Finanzen: Value at Risk (VaR)

Banken nutzen die Normalverteilung, um das Risiko von Finanzportfolios zu modellieren. Durch die Berechnung der Standardabweichung (Volatilität) von Vermögenspreisen schätzen sie den maximalen potenziellen Verlust über einen bestimmten Zeitraum.

Häufig gestellte Fragen

Was ist ein Z-Wert?

Ein Z-Wert sagt dir, wie viele Standardabweichungen ein Datenpunkt vom Mittelwert entfernt ist. $Z = (x - \mu) / \sigma$. Er ermöglicht den Vergleich verschiedener Datensätze.

Warum heißt sie "Normal"?

Weil Statistiker des 19. Jahrhunderts fanden, dass Messfehler "normalerweise" diesem Muster folgten. Es wurde zur Standard- oder "normalen" Erwartung für zufällige Daten.