Distribuição Normal

f(x)=1σ2πe12(xμσ)2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

Descrição

A Distribuição Normal, frequentemente chamada de **Curva em Sino** ou Distribuição Gaussiana, é a distribuição de probabilidade mais importante na estatística. Ela descreve um conjunto de dados onde a maioria dos valores se agrupa em torno de uma média central, com menos valores aparecendo à medida que você se afasta do centro.

É definida por dois parâmetros: * **Média ($\mu$):** O centro do pico. * **Desvio Padrão ($\sigma$):** Quão larga ou espalhada é a curva.

A **Regra Empírica (68-95-99.7)** afirma que para uma distribuição normal: * 68% dos dados caem dentro de 1 desvio padrão da média. * 95% caem dentro de 2 desvios padrão. * 99,7% caem dentro de 3 desvios padrão.

História & Origens

A descoberta da distribuição normal é um conto de três matemáticos. Abraham de Moivre (1733): Foi o primeiro a notar a forma de sino ao aproximar lançamentos de moedas (distribuição binomial) para números grandes. Carl Friedrich Gauss (1809): Aplicou a fórmula para analisar erros em observações astronômicas. Por causa de seu trabalho, é frequentemente chamada de "Distribuição Gaussiana". Pierre-Simon Laplace (1812): Provou o Teorema do Limite Central, que explica por que a distribuição normal aparece em toda parte na natureza — de alturas humanas a resultados de testes.

Por que a constante 1/√(2π)?

A área sob toda a curva deve ser igual a 1 (100% de probabilidade). Para provar essa constante, resolvemos a famosa Integral Gaussiana.

1

Seja $I = \int_{-\infty}^{\infty} e^{-x^2} dx$.

2

Eleve ao quadrado: $I^2 = \int_{-\infty}^{\infty} e^{-x^2} dx \int_{-\infty}^{\infty} e^{-y^2} dy = \int \int e^{-(x^2+y^2)} dx dy$.

3

Converter para Coordenadas Polares: $x^2 + y^2 = r^2$ e $dx dy = r dr d\theta$.

4

A integral torna-se $\int_0^{2\pi} d\theta \int_0^{\infty} e^{-r^2} r dr$.

5

Resolva a integral interna usando substituição ($u=r^2$): Avalia-se em $1/2$.

6

Multiplique por $2\pi$: $I^2 = 2\pi(1/2) = \pi$.

7

Então $I = \sqrt{\pi}$.

8

Nossa função tem fatores de escala extras, levando à constante de normalização $\frac{1}{\sqrt{2\pi}}$.

Variáveis

Símbolo Significado
f(x) Densidade de Probabilidade (Altura da curva)
μ Média (Centro)
σ Desvio Padrão (Dispersão/Largura)
x Valor que você está verificando

Exemplo

Cálculo Básico

Problema : Pontuações de QI são normalmente distribuídas com Média=100 e DP=15. Qual é o Z-score para um QI de 130?

Solução :

Z = (130 - 100) / 15 = 2. Isso significa que 130 está a 2 desvios padrão acima da média.

Controle de Qualidade em Fábrica

Problema : Uma máquina enche caixas de cereais. O peso médio é 500g com um desvio padrão de 5g. Qual porcentagem de caixas está entre 495g e 505g?

Solução : 68%

  1. Identificar limites: 495g e 505g.
  2. Calcular distância da média: $500 - 495 = 5$g e $505 - 500 = 5$g.
  3. Converter para Desvios Padrão: $5\text{g} = 1\sigma$.
  4. Aplicar Regra Empírica: A área dentro de $\pm 1\sigma$ é aproximadamente 68%.
  5. Conclusão: Cerca de 68% das caixas estão nessa faixa.

Notas na Curva

Problema : Um teste tem média de 70 e DP de 10. Para obter um A, você precisa estar no top 2,5%. Que nota você precisa?

Solução : ~90

  1. Identificar o limite: Top 2,5%.
  2. Pela regra 68-95-99.7, 95% está no meio. Os 5% restantes estão nas caudas (2,5% baixo, 2,5% alto).
  3. O top 2,5% começa em $+2$ Desvios Padrão.
  4. Calcular nota: $\text{Média} + 2\sigma$.
  5. Substituir: $70 + 2(10) = 70 + 20 = 90$.
  6. Você precisa de uma nota de 90.

Erros Comuns

❌ Erro

Pensar que o valor PDF é probabilidade

✅ Correção

O valor $f(x)$ é a *densidade*, não a probabilidade. Probabilidade é a *área* sob a curva entre dois pontos. Para um ponto específico $x$, a probabilidade é tecnicamente 0.

❌ Erro

Confundir Média e Mediana

✅ Correção

Em uma distribuição normal perfeita, Média = Mediana = Moda. Mas em dados reais distorcidos, eles diferem. A fórmula da Curva em Sino assume simetria perfeita.

Aplicações reais

Manufatura Six Sigma

Na manufatura, "Six Sigma" é uma meta de qualidade. Significa que o processo é tão preciso que defeitos só acontecem fora de 6 desvios padrão da média. Isso corresponde a apenas 3,4 defeitos por milhão de oportunidades.

Finanças: Valor em Risco (VaR)

Bancos usam a distribuição normal para modelar o risco de portfólios financeiros. Calculando o desvio padrão (volatilidade) dos preços dos ativos, eles estimam a perda potencial máxima em um determinado período.

Perguntas Frequentes

O que é um Z-score?

Um Z-score diz quantos desvios padrão um ponto de dados está da média. $Z = (x - \mu) / \sigma$. Permite comparar diferentes conjuntos de dados (como notas de diferentes exames).

Por que é chamada de "Normal"?

Porque estatísticos do século XIX descobriram que erros de medição "normalmente" seguiam esse padrão. Tornou-se a expectativa padrão ou "normal" para dados aleatórios.