Distribuição Normal
Descrição
A Distribuição Normal, frequentemente chamada de **Curva em Sino** ou Distribuição Gaussiana, é a distribuição de probabilidade mais importante na estatística. Ela descreve um conjunto de dados onde a maioria dos valores se agrupa em torno de uma média central, com menos valores aparecendo à medida que você se afasta do centro.
É definida por dois parâmetros: * **Média ($\mu$):** O centro do pico. * **Desvio Padrão ($\sigma$):** Quão larga ou espalhada é a curva.
A **Regra Empírica (68-95-99.7)** afirma que para uma distribuição normal: * 68% dos dados caem dentro de 1 desvio padrão da média. * 95% caem dentro de 2 desvios padrão. * 99,7% caem dentro de 3 desvios padrão.
História & Origens
A descoberta da distribuição normal é um conto de três matemáticos. Abraham de Moivre (1733): Foi o primeiro a notar a forma de sino ao aproximar lançamentos de moedas (distribuição binomial) para números grandes. Carl Friedrich Gauss (1809): Aplicou a fórmula para analisar erros em observações astronômicas. Por causa de seu trabalho, é frequentemente chamada de "Distribuição Gaussiana". Pierre-Simon Laplace (1812): Provou o Teorema do Limite Central, que explica por que a distribuição normal aparece em toda parte na natureza — de alturas humanas a resultados de testes.
Por que a constante 1/√(2π)?
A área sob toda a curva deve ser igual a 1 (100% de probabilidade). Para provar essa constante, resolvemos a famosa Integral Gaussiana.
Seja $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.
Eleve ao quadrado: $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.
Converter para Coordenadas Polares: $x^2 + y^2 = r^2$ e $dx dy = r dr d\theta$.
A integral torna-se $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.
Resolva a integral interna usando substituição ($u=r^2$): Avalia-se em $1/2$.
Multiplique por $2\pi$: $I^2 = 2\pi(1/2) = \pi$.
Então $I = \sqrt{\pi}$.
Nossa função tem fatores de escala extras, levando à constante de normalização $\frac{1}{\sqrt{2\pi}}$.
Variáveis
| Símbolo | Significado |
|---|---|
f(x) | Densidade de Probabilidade (Altura da curva) |
μ | Média (Centro) |
σ | Desvio Padrão (Dispersão/Largura) |
x | Valor que você está verificando |
Exemplo
Cálculo Básico
Problema : Pontuações de QI são normalmente distribuídas com Média=100 e DP=15. Qual é o Z-score para um QI de 130?
Solução :
Controle de Qualidade em Fábrica
Problema : Uma máquina enche caixas de cereais. O peso médio é 500g com um desvio padrão de 5g. Qual porcentagem de caixas está entre 495g e 505g?
Solução : 68%
- Identificar limites: 495g e 505g.
- Calcular distância da média: $500 - 495 = 5$g e $505 - 500 = 5$g.
- Converter para Desvios Padrão: $5\text{g} = 1\sigma$.
- Aplicar Regra Empírica: A área dentro de $\pm 1\sigma$ é aproximadamente 68%.
- Conclusão: Cerca de 68% das caixas estão nessa faixa.
Notas na Curva
Problema : Um teste tem média de 70 e DP de 10. Para obter um A, você precisa estar no top 2,5%. Que nota você precisa?
Solução : ~90
- Identificar o limite: Top 2,5%.
- Pela regra 68-95-99.7, 95% está no meio. Os 5% restantes estão nas caudas (2,5% baixo, 2,5% alto).
- O top 2,5% começa em $+2$ Desvios Padrão.
- Calcular nota: $\text{Média} + 2\sigma$.
- Substituir: $70 + 2(10) = 70 + 20 = 90$.
- Você precisa de uma nota de 90.
Erros Comuns
Pensar que o valor PDF é probabilidade
O valor $f(x)$ é a *densidade*, não a probabilidade. Probabilidade é a *área* sob a curva entre dois pontos. Para um ponto específico $x$, a probabilidade é tecnicamente 0.
Confundir Média e Mediana
Em uma distribuição normal perfeita, Média = Mediana = Moda. Mas em dados reais distorcidos, eles diferem. A fórmula da Curva em Sino assume simetria perfeita.
Aplicações reais
Manufatura Six Sigma
Na manufatura, "Six Sigma" é uma meta de qualidade. Significa que o processo é tão preciso que defeitos só acontecem fora de 6 desvios padrão da média. Isso corresponde a apenas 3,4 defeitos por milhão de oportunidades.
Finanças: Valor em Risco (VaR)
Bancos usam a distribuição normal para modelar o risco de portfólios financeiros. Calculando o desvio padrão (volatilidade) dos preços dos ativos, eles estimam a perda potencial máxima em um determinado período.
Perguntas Frequentes
O que é um Z-score?
Um Z-score diz quantos desvios padrão um ponto de dados está da média. $Z = (x - \mu) / \sigma$. Permite comparar diferentes conjuntos de dados (como notas de diferentes exames).
Por que é chamada de "Normal"?
Porque estatísticos do século XIX descobriram que erros de medição "normalmente" seguiam esse padrão. Tornou-se a expectativa padrão ou "normal" para dados aleatórios.