Distribution Normale

f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

Description

La Distribution Normale, souvent appelée **Courbe en Cloche** ou Distribution de Gauss, est la distribution de probabilité la plus importante en statistiques. Elle décrit un ensemble de données où la plupart des valeurs se regroupent autour d'une moyenne centrale, avec de moins en moins de valeurs apparaissant à mesure que l'on s'éloigne du centre.

Elle est définie par deux paramètres : * **Moyenne ($\mu$) :** Le centre du pic. * **Écart-type ($\sigma$) :** La largeur ou l'étalement de la courbe.

La **Règle Empirique (68-95-99,7)** stipule que pour une distribution normale : * 68% des données se situent à moins d'un écart-type de la moyenne. * 95% se situent à moins de 2 écarts-types. * 99,7% se situent à moins de 3 écarts-types.

Histoire & Origines

La découverte de la distribution normale est l'histoire de trois mathématiciens. Abraham de Moivre (1733) : Il fut le premier à remarquer la forme en cloche en approximant les lancers de pièces (distribution binomiale) pour de grands nombres. Carl Friedrich Gauss (1809) : Il a appliqué la formule pour analyser les erreurs dans les observations astronomiques. Grâce à ses travaux, elle est souvent appelée "Distribution Gaussienne". Pierre-Simon Laplace (1812) : Il a prouvé le Théorème Central Limite, qui explique pourquoi la distribution normale apparaît partout dans la nature — de la taille des humains aux résultats des tests.

Pourquoi la constante 1/√(2π) ?

L'aire sous toute la courbe doit être égale à 1 (100% de probabilité). Pour prouver cette constante, nous résolvons la célèbre Intégrale de Gauss.

Soit $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.

Mettez au carré : $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.

Convertir en Coordonnées Polaires : $x^2 + y^2 = r^2$ et $dx dy = r dr d\theta$.

L'intégrale devient $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.

Résoudre l'intégrale interne par substitution ($u=r^2$) : Elle vaut $1/2$.

Multiplier par $2\pi$ : $I^2 = 2\pi(1/2) = \pi$.

Donc $I = \sqrt{\pi}$.

Notre fonction a des facteurs d'échelle supplémentaires, conduisant à la constante de normalisation $\frac{1}{\sqrt{2\pi}}$.

Variables

Symbole	Signification
`f(x)`	Densité de Probabilité (Hauteur de la courbe)
`μ`	Moyenne (Centre)
`σ`	Écart-type (Étalement/Largeur)
`x`	Valeur que vous vérifiez

Exemple

Calcul de Base

Problème : Les scores de QI sont distribués normalement avec Moyenne=100 et Écart-type=15. Quel est le score Z pour un QI de 130 ?

Solution :

Z = (130 - 100) / 15 = 2. Cela signifie que 130 est à 2 écarts-types au-dessus de la moyenne.

Contrôle Qualité en Usine

Problème : Une machine remplit des boîtes de céréales. Le poids moyen est de 500g avec un écart-type de 5g. Quel pourcentage de boîtes se situe entre 495g et 505g ?

Solution : 68%

Identifier les limites : 495g et 505g.
Calculer la distance à la moyenne : $500 - 495 = 5$g et $505 - 500 = 5$g.
Convertir en Écarts-types : $5\text{g} = 1\sigma$.
Appliquer la Règle Empirique : L'aire à $\pm 1\sigma$ est d'environ 68%.
Conclusion : Environ 68% des boîtes sont dans cette plage.

Notation sur Courbe

Problème : Un test a une moyenne de 70 et un écart-type de 10. Pour avoir un A, vous devez être dans le top 2,5%. Quel score vous faut-il ?

Solution : ~90

Identifier le seuil : Top 2,5%.
D'après la règle 68-95-99,7, 95% sont au milieu. Les 5% restants sont dans les queues (2,5% bas, 2,5% haut).
Le top 2,5% commence à $+2$ Écarts-types.
Calculer le score : $\text{Moyenne} + 2\sigma$.
Substituer : $70 + 2(10) = 70 + 20 = 90$.
Vous avez besoin d'un score de 90.

Erreurs Courantes

❌ Erreur

Penser que la valeur PDF est une probabilité

✅ Correction

La valeur $f(x)$ est la *densité*, pas la probabilité. La probabilité est l'*aire* sous la courbe entre deux points. Pour un point spécifique $x$, la probabilité est techniquement 0.

❌ Erreur

Confondre Moyenne et Médiane

✅ Correction

Dans une distribution normale parfaite, Moyenne = Médiane = Mode. Mais dans les données réelles asymétriques, elles diffèrent. La formule de la Courbe en Cloche suppose une symétrie parfaite.

Applications réelles

Fabrication Six Sigma

Dans la fabrication, "Six Sigma" est un objectif de qualité. Cela signifie que le processus est si précis que les défauts ne se produisent qu'au-delà de 6 écarts-types de la moyenne. Cela correspond à seulement 3,4 défauts par million d'opportunités.

Finance : Valeur à Risque (VaR)

Les banques utilisent la distribution normale pour modéliser le risque des portefeuilles financiers. En calculant l'écart-type (volatilité) des prix des actifs, elles estiment la perte potentielle maximale sur une période donnée.

Questions Fréquemment Posées

Qu'est-ce qu'un score Z ?

Un score Z vous indique à combien d'écarts-types un point de données se trouve de la moyenne. $Z = (x - \mu) / \sigma$. Il permet de comparer différents ensembles de données.

Pourquoi l'appelle-t-on "Normale" ?

Parce que les statisticiens du 19ème siècle ont constaté que les erreurs de mesure suivaient "normalement" ce modèle. C'est devenu l'attente standard ou "normale" pour les données aléatoires.