DISTRIBUCIONES DE PROBABILIDAD

LA DISTRIBUCIÓN NORMAL

Si los griegos la hubiesen conocido, la habrían adorado como a un dios.

Galton (1822-1911)

 

 

La distribución N(m,s)

Cálculo de probabilidades

Aproximación de la binomial por la normal

Ajuste a una normal

TABLA N(0,1)

 

 

 

 

Entre las distribuciones continuas la más importante es la llamada distribución normal

Fue introducida por Carl Friedrich Gauss a pricipios del siglo XIX en su estudio de los errores de medida. Desde entonces se ha utilizado como modelo en multitud de variables en cuya distribución los valores más usuales se agrupan en torno a uno central y los valores extremos son escasos.

Una variable aleatoria continua sigue una distribución normal si su función de densidad es:

donde m y s coinciden respectivamente con la media y la desviación típica de la variable aleatoria. Estos parámetros son los que determinan esta distribución que designaremos por N(m,s).

La gráfica de esta función tiene forma de campana y se conoce con el nombre de campana de Gauss.

 


N(m,s)

Observa que la forma de la campana y la situación respecto a los ejes dependen de los parámetros m y s

Cambia el valor de la media m y la desviación típica s en esta distribución normal y observa lo que ocurre.

¿Qué características tiene la normal de media 0 y desviación típica 1?

 


Cálculo de probabilidades

Para una variable aleatoria continua X, la probabilidad de que X tome un valor menor o igual que x está determinada por el área comprendida entre la curva y el eje de abscisas desde -¥ a x, que en este caso coincide con

Para facilitar el trabajo, existen tablas que dan directamente el valor de estas áreas para el caso m=0, s=1.

Si X es una variable aleatoria con distribución normal N(µ,s) se cumple:

P(µ-s £ X £ µ+s)=0,6826

P(µ-2s £ X £ µ+2s)=0,9544

P(µ-3s £ X £ µ+3s)=0,9974

 

Utilización de la tabla N(0,1)

En la tabla N(O,1) aparece directamente la P(z £ x) para valores de x entre 0 y 4. Observa que para valores mayores que 4 la probabilidad ya es prácticamente igual a 1.

Busca en la tabla:

  • P(z £ 0,38)
  • P(z £ 1,96)
  • P(z £ 2,345)

Observa en la escena lo que hay que hacer cuando estamos en otros casos

Calcula en la tabla:

  • P(z >1,05)=1-P(z £ 1,05)
  • P(z ³-0,25)=P(z £ 0,25)
  • P(1,05 < z £ 1,96)
  • P(-0,25 £  z £ 1,05)
  • P(-1,96 £ z £ 1,96)

 

Tipificación de variables

La tabla de la distribución normal N(0,1) también nos permite calcular probabilidades relativas a cualquier otra distribución N(m,s). Para ello basta tipificar la variable es decir calcular el valor z correspondiente a los valores x indicados mediante la operación:

Cambia los valores de m y s en la distribución de la figura y observa la forma de la misma. Comprueba también cómo varía el valor z para cada caso.

Calcula:

  • en N(10,5); P(X £ 15)
  • en N(9,3); P(X >15)
  • en N(12,5); P(X ³9)
  • en N(10;3,5); P(11 £ X £ 15)
  • en N(12,3); P(10 £ X £ 14)
  • Observa que la gráfica de la N(m,s) está dibujada con una escala diferente, que puedes cambiar con los valores de u

Utilización de la tabla N(0,1)

 

Las estaturas de cierta población se distribuyen según una normal de media 168 y desviación típica 8. Calcula la probabilidad de que elegida una persona al azar su altura sea 170 cm. como máximo.

  • La población es N(168,8)

    Hemos de calcular la probabilidad
     
    P(X£170)

    Busca en la tabla N(0,1) la probabilidad correspondiente
    al valor z

    P(X £ 170)= P(z£0,25) = 0,5987

Las notas de cierto examen se distribuyen según una normal de media 5,4 y desviación típica 1,2. ¿Qué porcentaje de estudiantes se puede esperar que sacasen entre 5 y 7? (Utiliza la escena anterior cambiando los parámetros y la escala u)

 


Aproximación de la distribución binomial por la normal

Una distribución binomial B(n,p) se parece a una normal tanto más cuanto mayor es el producto np (o nq si q<p, siendo q=1-p). Cuando np y nq superan 5, la aproximación es casi perfecta, como se puede apreciar en la figura.

En estas condiciones:

Podemos emplear la normal para calcular probabilidades en el caso de una distribución binomial, aunque hemos de tener en cuenta que la binomial es discreta y la normal continua, por lo que es necesario introducir un ajuste en el cálculo llamado corrección de Yates. Así:

P(X £ x) = P(X'£ x+0,5) P(X < x) = P(X' £ x-0.5) P(X=x) = P(x-0,5£X'£ x+0,5)

El 35% de una población está afectado por la gripe. Se eligen 30 personas al azar.

Se trata de una B(0,35;30) que aproximamos por N(10,5;2,61)

Calcula la probabilidad de que:

  • haya exactamente 10 enfermos

P(X = 10) = P(9,5 £ X' £ 10,5)

  • haya más de 5 y menos de 12 enfermos

P(5< X <12) = P(5,5£ X' £11,5)

Utilización de la tabla N(0,1)


Ajuste de un conjunto de datos a una normal

Con frecuencia conviene saber si puede suponerse que una serie de datos obtenidos experimentalmente proceden de una distribución normal. Veamos un ejemplo.

La tabla adjunta muestra la altura en cm de 100 estudiantes. ¿Es razonable suponer que estos resultados proceden de una distribución normal?

a) Calculamos la media y la desviación típica de la distribución

  • Recuerda cómo se calcula la media y la desviación típica.

  • Dibujamos el histograma de la distribución.

  • Observa que el perfil del histograma nos recuerda a la curva normal.

xa

xb

xi fi

xi fi

xi2 fi

155 160 157,5 8 1260    198450   
160 165 162,5 14 2275    369687,5
165 170 167,5 22 3685    617237,5
170 175 172,5 28 4830    833175   
175 180 177,5 16 2840    504100   
180 185 182,5 8 1460    266450   
185 190 187,5 4 750    140625   
  100 17100    2929725   

media=

171

 desviación típica=

7,50

b) Comparamos la distribución empírica con la normal N(m,s) en este caso con la N(171;7,5).

  • Tipificamos los extremos de cada intervalo y calculamos en cada caso
     P(xa<x
    £xb)=P(za<z£zb)

  • Comparamos las probabilidades obtenidas con las frecuencias relativas obtenidas y evaluamos las diferencias.

xa

xb

fri

za

zb

p(X<xa)

p(X<xb)

p(xa<X<xb)

155 160 0,08 -2,13 -1,47 0,0164 0,0712 0,05
160 165 0,14 -1,47 -0,80 0,0712 0,2119 0,14
165 170 0,22 -0,80 -0,13 0,2119 0,4470 0,24
170 175 0,28 -0,13 0,53 0,4470 0,7031 0,26
175 180 0,16 0,53 1,20 0,7031 0,8849 0,18
180 185 0,08 1,20 1,87 0,8849 0,9690 0,08
185 190 0,04 1,87 2,53 0,9690 0,9944 0,03
media= 171
 desviación típica= 7,50

Comprueba en la escena los valores tipificados y utiliza la tabla N(0,1) para calcular las probabilidades.

Las diferencias, en este caso, parecen suficientemente pequeñas como para aceptar que los datos provienen efectivamente de una distribución normal. Fíjate que este último paso es totalmente subjetivo, aunque existen métodos estadísticos con los que tomar esta decisión de manera precisa.

 


Mª José García Cebrian

 

 

 

 
Ministerio de Educación, Cultura y Deporte. Año 2000