Distribution Normale
Description
La Distribution Normale, souvent appelée **Courbe en Cloche** ou Distribution de Gauss, est la distribution de probabilité la plus importante en statistiques. Elle décrit un ensemble de données où la plupart des valeurs se regroupent autour d'une moyenne centrale, avec de moins en moins de valeurs apparaissant à mesure que l'on s'éloigne du centre.
Elle est définie par deux paramètres : * **Moyenne ($\mu$) :** Le centre du pic. * **Écart-type ($\sigma$) :** La largeur ou l'étalement de la courbe.
La **Règle Empirique (68-95-99,7)** stipule que pour une distribution normale : * 68% des données se situent à moins d'un écart-type de la moyenne. * 95% se situent à moins de 2 écarts-types. * 99,7% se situent à moins de 3 écarts-types.
Histoire & Origines
La découverte de la distribution normale est l'histoire de trois mathématiciens. Abraham de Moivre (1733) : Il fut le premier à remarquer la forme en cloche en approximant les lancers de pièces (distribution binomiale) pour de grands nombres. Carl Friedrich Gauss (1809) : Il a appliqué la formule pour analyser les erreurs dans les observations astronomiques. Grâce à ses travaux, elle est souvent appelée "Distribution Gaussienne". Pierre-Simon Laplace (1812) : Il a prouvé le Théorème Central Limite, qui explique pourquoi la distribution normale apparaît partout dans la nature — de la taille des humains aux résultats des tests.
Pourquoi la constante 1/√(2π) ?
L'aire sous toute la courbe doit être égale à 1 (100% de probabilité). Pour prouver cette constante, nous résolvons la célèbre Intégrale de Gauss.
Soit $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.
Mettez au carré : $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.
Convertir en Coordonnées Polaires : $x^2 + y^2 = r^2$ et $dx dy = r dr d\theta$.
L'intégrale devient $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.
Résoudre l'intégrale interne par substitution ($u=r^2$) : Elle vaut $1/2$.
Multiplier par $2\pi$ : $I^2 = 2\pi(1/2) = \pi$.
Donc $I = \sqrt{\pi}$.
Notre fonction a des facteurs d'échelle supplémentaires, conduisant à la constante de normalisation $\frac{1}{\sqrt{2\pi}}$.
Variables
| Symbole | Signification |
|---|---|
f(x) | Densité de Probabilité (Hauteur de la courbe) |
μ | Moyenne (Centre) |
σ | Écart-type (Étalement/Largeur) |
x | Valeur que vous vérifiez |
Exemple
Calcul de Base
Problème : Les scores de QI sont distribués normalement avec Moyenne=100 et Écart-type=15. Quel est le score Z pour un QI de 130 ?
Solution :
Contrôle Qualité en Usine
Problème : Une machine remplit des boîtes de céréales. Le poids moyen est de 500g avec un écart-type de 5g. Quel pourcentage de boîtes se situe entre 495g et 505g ?
Solution : 68%
- Identifier les limites : 495g et 505g.
- Calculer la distance à la moyenne : $500 - 495 = 5$g et $505 - 500 = 5$g.
- Convertir en Écarts-types : $5\text{g} = 1\sigma$.
- Appliquer la Règle Empirique : L'aire à $\pm 1\sigma$ est d'environ 68%.
- Conclusion : Environ 68% des boîtes sont dans cette plage.
Notation sur Courbe
Problème : Un test a une moyenne de 70 et un écart-type de 10. Pour avoir un A, vous devez être dans le top 2,5%. Quel score vous faut-il ?
Solution : ~90
- Identifier le seuil : Top 2,5%.
- D'après la règle 68-95-99,7, 95% sont au milieu. Les 5% restants sont dans les queues (2,5% bas, 2,5% haut).
- Le top 2,5% commence à $+2$ Écarts-types.
- Calculer le score : $\text{Moyenne} + 2\sigma$.
- Substituer : $70 + 2(10) = 70 + 20 = 90$.
- Vous avez besoin d'un score de 90.
Erreurs Courantes
Penser que la valeur PDF est une probabilité
La valeur $f(x)$ est la *densité*, pas la probabilité. La probabilité est l'*aire* sous la courbe entre deux points. Pour un point spécifique $x$, la probabilité est techniquement 0.
Confondre Moyenne et Médiane
Dans une distribution normale parfaite, Moyenne = Médiane = Mode. Mais dans les données réelles asymétriques, elles diffèrent. La formule de la Courbe en Cloche suppose une symétrie parfaite.
Applications réelles
Fabrication Six Sigma
Dans la fabrication, "Six Sigma" est un objectif de qualité. Cela signifie que le processus est si précis que les défauts ne se produisent qu'au-delà de 6 écarts-types de la moyenne. Cela correspond à seulement 3,4 défauts par million d'opportunités.
Finance : Valeur à Risque (VaR)
Les banques utilisent la distribution normale pour modéliser le risque des portefeuilles financiers. En calculant l'écart-type (volatilité) des prix des actifs, elles estiment la perte potentielle maximale sur une période donnée.
Questions Fréquemment Posées
Qu'est-ce qu'un score Z ?
Un score Z vous indique à combien d'écarts-types un point de données se trouve de la moyenne. $Z = (x - \mu) / \sigma$. Il permet de comparer différents ensembles de données.
Pourquoi l'appelle-t-on "Normale" ?
Parce que les statisticiens du 19ème siècle ont constaté que les erreurs de mesure suivaient "normalement" ce modèle. C'est devenu l'attente standard ou "normale" pour les données aléatoires.