
¿Qué es la distribución normal?
La distribución normal, o distribución gaussiana, es la distribución de probabilidad en variable continua, donde la función densidad de probabilidad está descrita por una función exponencial de argumento cuadrático y negativo, que da lugar a una forma acampanada.
El nombre viene del hecho de que esta distribución es la que se aplica a mayor número de situaciones donde está involucrada alguna variable aleatoria continua en un grupo o población dada.
Como ejemplos donde se aplica la distribución normal se tienen: la altura de las personas, variaciones en la medida de alguna magnitud física o en rasgos psicológicos o sociológicos medibles, como el cociente intelectual o los hábitos de consumo de cierto producto. Con ella se pueden modelar diversos fenómenos naturales, psicológicos y sociales.
Se le llama también distribución gaussiana o campana de Gauss porque es a este genio matemático alemán a quien se le acredita su descubrimiento cuando describió el error estadístico de las mediciones astronómicas, en 1800.
Sin embargo, se afirma que esta distribución estadística fue publicada previamente por otro gran matemático de origen francés, Abraham de Moivre, en 1733.
Fórmula de la distribución normal
A la función distribución normal en la variable continua x, con parámetros μ y σ se le denota por:
N(x; μ,σ)
y explícitamente se escribe así:
N(x; μ,σ) = ∫-∞x f(s; μ,σ) ds
donde f(u; μ,σ) es la función densidad de probabilidad:
f(s; μ,σ) = (1/(σ√(2π)) Exp( – s2/(2σ2) )
La constante que multiplica a la función exponencial en la función densidad de probabilidad se llama constante de normalización, y se ha elegido de tal manera que:
N(+∞, μ,σ) = 1
La expresión anterior asegura que la probabilidad de la variable aleatoria x esté comprendida entre -∞ y +∞ sea 1, es decir, el 100% de probabilidad.
El parámetro μ es la media aritmética de la variable aleatoria continua x y σ la desviación típica o raíz cuadrada de la varianza de esa misma variable. En el caso de que μ = 0 y σ = 1 se tiene entonces la distribución normal estándar o distribución normal típica:
N( x; μ = 0, σ = 1)
Características de la distribución normal
– Forma. Tiene la clásica curva de campana, simétrica respecto a la media. Los valores se distribuyen de manera que la mayoría se concentra alrededor de la media y disminuyen hacia los extremos.
– Parámetros. Está definida por dos parámetros: Media (μ), que determina la posición del centro de la curva. Y desviación estándar (σ), que controla la dispersión o ancho de la curva.
– Simetría. Es perfectamente simétrica respecto a la media. La media, la mediana y la moda coinciden: μ = Me = Mo.
– Probabilidad. El área total bajo la curva es 1 (representa el 100% de probabilidad). Aproximadamente: 68% de los datos se encuentran dentro de ±1σ. 95% dentro de ±2σ. 99.7 % dentro de ±3σ. (Regla empírica o 68-95-99.7).
– Cola infinita. Se extiende de −∞ a +∞, aunque la probabilidad en los extremos es muy pequeña.
Aplicaciones de la distribución normal
Para aplicar la distribución normal es necesario pasar por el cálculo de la integral de la densidad de probabilidad, lo cual, desde el punto de vista analítico, no es fácil y no siempre se dispone de un programa informático que permita su cálculo numérico. Para este fin se usan las tablas de valores normalizados o tipificados, que no es más que la distribución normal en el caso μ =0 y σ =1.


Debe notarse que estas tablas no incluyen los valores negativos. Sin embargo, usando las propiedades de simetría de la función densidad de probabilidad gaussiana pueden obtenerse los valores correspondientes. En el ejercicio resuelto mostrado más adelante se indica el uso de la tabla en estos casos.
Ejemplo de distribución normal
Suponga que tiene un conjunto de datos aleatorios x que siguen una distribución normal de media 10 y desviación típica 2. Se pide encontrar la probabilidad de que:
a) La variable aleatoria x sea menor o igual a 8.
b) Sea menor o igual a 10.
c) Que la variable x esté por debajo de 12.
d) La probabilidad que un valor x esté entre 8 y 12.
Solución:
a) Para responder a la primera pregunta simplemente hay que calcular:
N(x; μ,σ)
Con x = 8, μ = 10 y σ = 2. Nos percatamos de que se trata de una integral que no tiene una solución analítica en funciones elementales, sino que la solución está expresada en función de la función error erf(x).
Por otra parte, existe la posibilidad de resolver la integral en forma numérica, que es lo que hacen muchas calculadoras, hojas de cálculo y programas informáticos como GeoGebra. La siguiente figura muestra la solución numérica correspondiente al primer caso:

y la respuesta es que la probabilidad es que x esté por debajo de 8 es:
P( x ≤ 8 ) = N(x=8; μ=10,σ=2) = 0,1587
b) En este caso se trata de encontrar la probabilidad de que la variable aleatoria x esté por debajo de la media, que en este caso vale 10. La respuesta no requiere cálculo alguno, ya que sabemos que la mitad de los datos están por debajo de la media y la otra mitad por encima. Por ello, la respuesta es:
P( x ≤ 10 ) = N(x=10; μ=10,σ=2) = 0,5
c) Para responder a esta pregunta hay que calcular N(x=12; μ=10,σ=2), lo cual puede hacerse con una calculadora que tenga funciones estadísticas o mediante un software como GeoGebra:

La respuesta al apartado c puede verse en la figura superior, y es:
P( x ≤ 12 ) = N(x=12; μ=10,σ=2) = 0,8413.
d) Para encontrar la probabilidad de que la variable aleatoria x esté comprendida entre 8 y 12, podemos usar los resultados de las partes a y c de la siguiente manera:
P( 8 ≤ x ≤ 12 ) = P( x ≤ 12 ) – P( x ≤ 8 ) = 0,8413 – 0,1587 = 0,6826 = 68,26 %.
Ejercicio resuelto
El precio promedio de las acciones de una empresa es de $25, con una desviación típica de $4. Determine la probabilidad de que:
a) Una acción tenga un costo menor de $20.
b) Que tenga un costo mayor de $30.
c) El precio esté comprendido entre $20 y $30.
Usar las tablas de distribución normal tipificada para encontrar las respuestas.
Solución:
Para usar las tablas, es necesario pasar a la variable z normalizada o tipificada:
$20 en la variable normalizada equivale a z = ($20 – $25) / $4 = -5/4 = -1,25 y
$30 en la variable normalizada equivale a z = ($30 – $25) / $4 = +5/4 = +1,25.
a) $20 equivale a -1,25 en la variable normalizada, pero la tabla no tiene valores negativos, por lo que ubicamos el valor +1,25 que arroja el valor de 0,8944.
Si a este valor se le resta 0,5 el resultado será el área entre 0 y 1,25 que, por cierto, es idéntica (por simetría) al área entre -1.25 y 0. El resultado de la resta es 0,8944 – 0,5 = 0,3944 que es el área entre -1.25 y 0.
Pero interesa el área desde -∞ hasta -1,25 que será 0,5 – 0,3944 = 0,1056. Se concluye, por tanto, que la probabilidad de que una acción esté por debajo de $20 es 10,56%.
b) $30 en la variable tipificada z es 1,25. Para este valor en la tabla aparece el número 0,8944, que corresponde al área desde -∞ hasta +1,25. El área entre +1.25 y +∞ es (1 – 0,8944) = 0,1056. Es decir, que la probabilidad de que una acción cueste más de $30 es 10,56%.
c) La probabilidad de que una acción tenga un costo comprendido entre $20 y $30 se calculará así:
100% -10,56% – 10,56% = 78,88%
Referencias
- Estadística y probabilidad. Distribución normal. Recuperado de proyectodescartes.org.
- Geogebra clásico, cálculo de probabilidad. Recuperado de geogebra.org.
- Distribución de Gauss. Recuperado de es.mathworks.com.
- Teach yourself Statistics. Poisson Distribution. Recuperado de stattrek.com.
- Distribución normal. Recuperado de es.wikipedia.org,