domingo, 17 de febrero de 2013

Data Análisis - Distribución Normal


También llamada distribución gaussiana. La distribución normal es una de las distribuciones que una variable aleatoria continua puede poseer. Muchos fenómenos del mundo real se aproximan a la distribución normal.
La curva de la distribución normal es una campana simétrica específica (campana de gauss), que se extiende por el eje horizontal sin llegar a tocarlo. Aunque la campana nunca llegue a tocar el eje se suele considerar cero el área que se aleja de la media más de tres veces la desviación típica.

P(-∞ < x < -3σ) + P(3σ < x < ∞) = 0

La curva de una distribución normal queda definida por su media y su desviación típica. Diferentes valores de media desplazan la campana a lo largo del eje x mientras que diferentes
valores de la desviación típica achatan o estiran la campana.

Aunque la distribución normal se puede expresar con una función, los calculos sobre esta se suelen realizar utilizando tablas debido a la complejidad de la misma.

Distribución normal estándar.


La distribución normal con media igual a 0 y desviación típica igual a 1.

  • Marcas o valores z
    Marcas del eje horizontal que miden la distancia respecto a la media en función de la desviación típica.

La distribución normal estándar y sus tablas de referencia se pueden utilizar para realizar cualculos sobre cualquier distribución normal del mundo real, para ello tan solo hay que normalizar las variables a valores z de la distribución normal estándar.

z = (x - μ) / σ

El grafico ha sido generado con R utilizando el siguiente script:

png("gaussian_curve.png", height = 400, width = 650)
plot(seq(-3, 3, 0.1), dnorm(seq(-3, 3, 0.1)), lwd = 4, col = 4, type = "l",
ylab = "probability",
xlab = "z values",
main = "Gaussian curve")
dev.off()
view raw chart.r hosted with ❤ by GitHub

No hay comentarios:

Publicar un comentario