DISTRIBUCIONES CONTINUAS: DEL HISTOGRAMA A LA NORMAL
Probabilidad Empírica y Teórica
 

4. PROBABILIDAD EN UN Histograma

¿Cuál es la probabilidad de que un alumno, elegido al azar, tarde en su desplazamiento entre 12 y 16 minutos?, ¿y la probabilidad de que tarde menos de 12 minutos? Tratamos, pues, ahora de hallar la probabilidad de que el tiempo de un alumno, elegido al azar, se encuentre entre dos valores dados t1y t2, que escribiremos así:

 P[t1<X<t2] = "probabilidad de que el tiempo esté entre t1y t2"

El valor de la probabilidad buscada se halla obteniendo la frecuencia relativa correspondiente al intervalo comprendido entre t1y t2, pues el valor de la frecuencia nos da la proporción existente entre el nº de alumnos que invierten ese tiempo y el número total de alumnos.

En consecuencia, según lo que hemos visto en las escenas 1 y 2 para hallar probabilidad, nos bastará con hallar el área que encierra el histograma entre estos dos valores (en nuestro caso equivale a contar los cuadraditos que hay bajo la línea superior del histograma, entre t1y t2).

1.- Cada vez que se pulsa en Inicio se obtiene una nueva distribución.

2.- El control tiempo inf(t1) se usa para introducir el límite inferior del tiempo, t1, que también se puede fijar arrastrando con el ratón el punto amarillo situado en el eje OX.

3.- De forma análoga, el control tiempo sup(t2) se usa para introducir el límite superior del tiempo, t2, que también se puede fijar arrastrando con el ratón el punto rojo situado en el eje OX.

4.- Al cambiar t1y t2 cambia también la zona de color turquesa que limitan, cuya área nos da probabilidad buscada.

        Ejercicios: Responde en tu cuaderno a las siguientes cuestiones:

  1. Comienza pulsando Inicio. Comprueba que la probabilidad de que un alumno tarde de 12 a 16 minutos coincide con la frecuencia relativa que aparece en la tabla de la izquierda para la clase 12-16.

  2. Para hallar P[X<12], suma las frecuencias correspondientes a las clases 0-4, 4-8 y 8-12, comprueba luego que obtienes el mismo resultado que si introduces 0 en el control de t1, y 12  en el control de t2.

  3. Para hallar P[6<X<12], dividimos por 2 la frecuencia de la clase 4-8 y le sumamos la de 8-12, comprueba también que obtienes el mismo resultado que si introduces 6 en el control de t1, y 12  en el control de t2.

  4. Calcula las siguientes probabilidades y comprueba luego en la escena que los resultados son correctos:

P[2<X<8],  P[X>10],  P[14<X<18],  P[7<X<14],  P[9<X<10],  P[X<11], P[11<X<15].

  1. Pulsa inicio para obtener nuevos datos y repite el ejercicio 4.

 


5.  hacia la probabilidad teórica

En esta escena, para asignar la probabilidad de que X esté entre 6 y 8 (suponiendo el nº interv =5, que es como está al comienzo) tenemos que suponer que el nº de alumnos que tardan entre 4 y 6 minutos es igual al nº de alumnos que tardan entre 6 y 8 minutos, por ello dividimos la frecuencia de la clase 4-8 entre 2. Pero esto no es así y en consecuencia cometemos un error.

El error cometido al suponer que el nº de alumnos se distribuye uniformemente en cada una de las clases , es más pequeño, cuanto menor sea la amplitud de las clases, es decir, cuanto más aumentamos el nº interv. Por tanto, al ir incrementando el nº de clases, la probabilidad asignada al intervalo  (t1,t2) se va aproximando más a su valor verdadero, que obtendríamos si pudiéramos calcular el área encerrada bajo la función de densidad entre t1 y t2, la probabilidad teórica.

1.- Los controles Iniciot1 y t2 realizan la misma función que en la escena anterior.

2.- Al igual que en la escena 3, si se pulsa sobre los botones de nº interv va cambiando el número de clases en los que se agrupan los tiempos.

3.- Al pulsar sobre el control Pol Frec , aparece o desaparece la poligonal de frecuencias

4.- Cuando el control  Histograma es = 0, aparece la línea poligonal, perímetro del histograma, de color azul, que tiende, igual que la poligonal de frecuencias (mirar la escena 3) hacia la función de densidad.

 

Ejercicios: Responde en tu cuaderno a las siguientes cuestiones:

  1. Comienza pulsando Inicio. Comprueba que la probabilidad de que un alumno tarde entre 6 y 11 minutos, que aparece arriba de la escena en verde, se corresponde con el área coloreada en turquesa. Para ello puedes contar el nº de cuadraditos teniendo y recuerda que el área de cada uno es 0,01 (representa el 1% de los alumnos)

  2. Cambia los valores de t1y t2, por ejemplo t1=3 y t2=9, y repite 1.

  3. Comienza de nuevo pulsando Inicio. Aumenta el nº de clases y a la vez observa el valor de la probabilidad que aparece arriba. ¿cuál crees que será el valor de la probabilidad teórica? ¿coincidirá con alguno de los valores que aparece?

  4. Pulsando los controles Pol Frec  y Histograma haz que aparezcan y desaparezcan la poligonal de frecuencias y el perímetro del histograma y observa como el área encerrada por ambas es la misma (para un número de intervalos suficientemente grande)

  5. Halla la probabilidad teórica de los siguientes intervalos (Para ello ten en cuenta que si tanto t1 como t2 coinciden con algún extremo de las clases consideradas, el valor asignado en ese caso coincide con la probabilidad teórica):

P[7<X<13],  P[X<5],  P[6.5<X<9],  P[X<14.5],  P[5.2<X<7.6],  P[X>10.4].


6. La distribución normal
Existen muchas variables estadísticas (sociológicas, físicas, morfológicas, ...) que se caracterizan por la simetría que presentan sus distribuciones. Su poligonal de frecuencias tiende a una función de densidad conocida como curva normal o campana de Gauss. La asignación de probabilidades realizada mediante el cálculo de áreas encerradas por esta curva es la Distribución Normal y es la más importante de las distribuciones de probabilidad.

La Distribución Normal es continua, simétrica y la media coincide con el máximo de la curva, siendo P[X>media] = P[X<media] = 0.5.

En esta escena, a diferencia de las 5 anteriores, la distribución de frecuencias es simétrica. La poligonal tiende a la curva normal dibujada en amarillo.

1.- Los controles Iniciot1 y t2 realizan la misma función que en las dos escenas anteriores.

2.- Si el control Pol Frec  = 1 se muestra la poligonal de frecuencias.

3.- Cuando el control  Histograma es = 0, se muestra sólo el perímetro del histograma, conviene usarlo cuando el nº de intervalos es grande.

4.-El control P Teor/Exper cuando es =0, nos muestra, en color turquesa, el área que encierra el histograma entre t1y t2;  y cuando es =1, en color amarillo, el área que encierra la curva normal entre los mismos valores de t1y t2.

El valor de la probabilidad empírica o experimental (probabilidad asignada a partir del área que encierra el histograma) entre t1y t2, aparece en la parte superior de la escena en color turquesa, y debajo, en color amarillo el valor de la probabilidad teórica (probabilidad asignada según el área que encierra la curva normal) entre t1y t2.

Ejercicios: Responde en tu cuaderno a las siguientes cuestiones:

  1. Pulsa sobre los botones P Teor/Exper y observa ambas áreas. Anota los valores de la prob. teórica y empírica. Repite lo que has hecho con t1 = 14.1 y t2 = 15.8. Después con t1 = 12.3 y t2 = 13.9. Explica por qué se diferencian los valores teórico y empírico de la probabilidad.

  2. Haz Histograma  = 0. Anota los valores teórico y empírico de P[3.4<X<14.8]. Aumenta el nº de intervalos. ¿Qué ocurre con los valores de P[3.4<X<14.8]?. Vuelve a lo mismo dando a t1y t2 los valores del ejercicio 1.

  3. Con Histograma = 0, Pol Frec = 1, y t1= t2  (para mayor claridad en la escena) ve aumentando el nº de intervalos ¿Qué ocurre con la poligonal de frecuencias?.


         
           
  Pepe Sánchez
 
Ministerio de Educación, Cultura y Deporte. Año 2006
 
 

Licencia de Creative Commons
Los contenidos de esta unidad didáctica están bajo una licencia de Creative Commons si no se indica lo contrario.