Distribución Normal
Descripción
La Distribución Normal, a menudo llamada **Campana de Gauss**, es la distribución de probabilidad más importante en estadística. Describe un conjunto de datos donde la mayoría de los valores se agrupan alrededor de un promedio central (media), con menos y menos valores apareciendo a medida que te alejas del centro.
Se define por dos parámetros: * **Media ($\mu$):** El centro del pico. * **Desviación Estándar ($\sigma$):** Cuán ancha o dispersa es la curva.
La **Regla Empírica (68-95-99.7)** establece que para una distribución normal: * El 68% de los datos caen dentro de 1 desviación estándar de la media. * El 95% caen dentro de 2 desviaciones estándar. * El 99,7% caen dentro de 3 desviaciones estándar.
Historia & Orígenes
El descubrimiento de la distribución normal es una historia de tres matemáticos. Abraham de Moivre (1733): Fue el primero en notar la forma de campana al aproximar lanzamientos de monedas (distribución binomial) para números grandes. Carl Friedrich Gauss (1809): Aplicó la fórmula para analizar errores en observaciones astronómicas. Debido a su trabajo, a menudo se le llama "Distribución Gaussiana". Pierre-Simon Laplace (1812): Probó el Teorema del Límite Central, que explica por qué la distribución normal aparece en todas partes en la naturaleza, desde alturas humanas hasta puntajes de exámenes.
¿Por qué la constante 1/√(2π)?
El área bajo toda la curva debe ser igual a 1 (100% de probabilidad). Para probar esta constante, resolvemos la famosa Integral Gaussiana.
Sea $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.
Elévalo al cuadrado: $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.
Convertir a Coordenadas Polares: $x^2 + y^2 = r^2$ y $dx dy = r dr d\theta$.
La integral se convierte en $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.
Resuelve la integral interna usando sustitución ($u=r^2$): Se evalúa a $1/2$.
Multiplica por $2\pi$: $I^2 = 2\pi(1/2) = \pi$.
Así que $I = \sqrt{\pi}$.
Nuestra función tiene factores de escala adicionales, llevando a la constante de normalización $\frac{1}{\sqrt{2\pi}}$.
Variables
| Símbolo | Significado |
|---|---|
f(x) | Densidad de Probabilidad (Altura de la curva) |
μ | Media (Promedio/Centro) |
σ | Desviación Estándar (Dispersión/Ancho) |
x | Valor que estás comprobando |
Ejemplo
Cálculo Básico
Problema : Los puntajes de CI están distribuidos normalmente con Media=100 y DE=15. ¿Cuál es el puntaje Z para un CI de 130?
Solución :
Control de Calidad en Fábrica
Problema : Una máquina llena cajas de cereales. El peso medio es 500g con una desviación estándar de 5g. ¿Qué porcentaje de cajas está entre 495g y 505g?
Solución : 68%
- Identificar límites: 495g y 505g.
- Calcular distancia de la media: $500 - 495 = 5$g y $505 - 500 = 5$g.
- Convertir a Desviaciones Estándar: $5\text{g} = 1\sigma$.
- Aplicar Regla Empírica: El área dentro de $\pm 1\sigma$ es aproximadamente 68%.
- Conclusión: Alrededor del 68% de las cajas están en este rango.
Calificando en Curva
Problema : Un examen tiene una media de 70 y DE de 10. Para obtener una A, necesitas estar en el 2,5% superior. ¿Qué puntaje necesitas?
Solución : ~90
- Identificar el umbral: 2,5% superior.
- De la regla 68-95-99.7, el 95% está en el medio. El 5% restante está en las colas (2,5% bajo, 2,5% alto).
- El 2,5% superior comienza en $+2$ Desviaciones Estándar.
- Calcular puntaje: $\text{Media} + 2\sigma$.
- Sustituir: $70 + 2(10) = 70 + 20 = 90$.
- Necesitas un puntaje de 90.
Errores Comunes
Pensar que el valor PDF es probabilidad
El valor $f(x)$ es la *densidad*, no la probabilidad. La probabilidad es el *área* bajo la curva entre dos puntos. Para un punto específico $x$, la probabilidad es técnicamente 0.
Confundir Media y Mediana
En una distribución normal perfecta, Media = Mediana = Moda. Pero en datos reales sesgados, difieren. La fórmula de la Campana de Gauss asume simetría perfecta.
Aplicaciones del Mundo Real
Manufactura Six Sigma
En manufactura, "Six Sigma" es un objetivo de calidad. Significa que el proceso es tan preciso que los defectos solo ocurren fuera de 6 desviaciones estándar de la media. Esto corresponde a solo 3,4 defectos por millón de oportunidades.
Finanzas: Valor en Riesgo (VaR)
Los bancos usan la distribución normal para modelar el riesgo de carteras financieras. Al calcular la desviación estándar (volatilidad) de los precios de los activos, estiman la pérdida potencial máxima durante un período de tiempo dado.
Preguntas Frecuentes
¿Qué es un puntaje Z?
Un puntaje Z te dice cuántas desviaciones estándar está un punto de datos de la media. $Z = (x - \mu) / \sigma$. Te permite comparar diferentes conjuntos de datos (como puntajes SAT vs ACT).
¿Por qué se llama "Normal"?
Porque los estadísticos del siglo XIX encontraron que los errores en la medición "normalmente" seguían este patrón. Se convirtió en la expectativa estándar o "normal" para datos aleatorios.