DISTRIBUCIONES CONTINUAS: DEL HISTOGRAMA A LA NORMAL
Histograma y Función de Densidad
 

1. Histograma

En un instituto se decide estudiar el tiempo, X, que emplean los alumnos en desplazarse desde su casa hasta él. Se trata de una variable estadística continua (puesto que puede tomar cualquier valor de un intervalo de números reales, en nuestro ejemplo de 0 a 20 minutos)

Este tipo de variable se suele representar gráficamente mediante un histograma que consiste en levantar un rectángulo sobre cada uno de los intervalos (clases) donde toma sus valores. La base del rectángulo es la amplitud del intervalo y, o bien la altura coincide con la frecuencia relativa (o el porcentaje o la frecuencia absoluta), o bien es el área del rectángulo la que debe coincidir con la frecuencia relativa del intervalo correspondiente.

 Observa la escena de la izquierda donde se muestra la distribución de frecuencias de la variable X y el histograma correspondiente.

1.- Los alumnos tardan de 0 a 20 minutos en sus desplazamientos, tiempo éste que aparece dividido en 5 intervalos en la columna clases (columna de rojo).

2.- Un 7,4 % de los alumnos emplean en desplazarse de 0 a 4 minutos, por ello en la columna frj (columna de verde) aparece, en primer lugar, 0,074 frecuencia relativa, o tanto por uno, correspondiente a la clase 0-4.

3.- En la columna arj (columna de amarillo) aparece la altura que tiene que tener cada intervalo para que el área del rectángulo coincida con la frec. relativa correspondiente.

4.- Procediendo de esta forma, el área total encerrada por los rectángulos coincide con la suma de las frecuencias relativas, es decir, es 1. Cada cuadradito de la cuadrícula de fondo representa 0,01 parte del área, y equivale al 1% de los datos.

5.- La media, m, del tiempo empleado por los alumnos se hallaría sumando todos los tiempos y dividiendo esta suma por el número total de alumnos. Pero cuando los datos los tenemos agrupados en intervalos o clases, la media se halla sumando los productos de las marca de clase xi (los valores medios de las clases, esto es: de 0-4 sería 2, de 4-8 sería 6, ... )por sus respectivas frecuencias relativas:

 6.- La desviación típica, s, se calcula mediante la expresión:

 Ejercicios: Responde en tu cuaderno a las siguientes cuestiones:

  1. ¿Qué porcentaje de alumnos tardan de 12 a 16 minutos?

  2. ¿Cuál es el área correspondiente a la clase 8-12? ¿Cómo se halla la altura del rectángulo correspondiente?.


2 Histograma: CÁLCULO DE FRECUENCIAS

En esta escena se representa un histograma como en la anterior, pero cada vez que pulses en inicio cambiaran los datos obteniéndose una nueva distribución de frecuencias.

1.- En cada distribución obtenida pulsando en inicio, faltará un valor de la frecuencia y otro de la altura. 

2.- Si se sitúa el cursor en el control frec. que falta, se introduce el valor aproximado y se pulsa Intro, aparece un mensaje con el texto "frecuencia correcta".

3.- Haciendo lo mismo en los controles alt. que falta y media aparecen sendos mensajes con el texto "altura correcta" y "media correcta".

4.-Si se hace igual a 0 el control Histograma aparece la línea poligonal que delimita el histograma y, se puede observar que, bajo ella hay 100 cuadraditos (equivalente al 100 % de los alumnos).

 

 Ejercicios: Responde a las siguientes cuestiones:

  1. Calcula los valores que faltan en las columnas de las frecuencias y las alturas e introdúcelos en sus lugares. Si te equivocas vuélvelo a intentar hasta que te aparezca el mensaje de que lo has hecho correctamente.

  2. Halla también la media e introdúcela en el control correspondiente, aparecerá un mensaje cuando la calcules bien.

  3. Repite 1 y 2 varias veces pulsando para ello Inicio. Calcula alguna de estas veces la desviación típica y comprueba que el valor coincide con el que aparece en la escena.

  4. Comprueba (puedes contar para ello el nº de cuadraditos) que al cambiar de distribución el área encerrada por los rectángulos no cambia, es decir continúa siendo 1.


3. la función de densidad
Si el número de alumnos a los que controlamos el tiempo fuese suficientemente grande y vamos aumentando el número de intervalos (o lo que es lo mismo, consideramos clases cada vez más pequeñas) la línea poligonal que forman los puntos medios de los lados superiores de los rectángulos, llamada poligonal de frecuencias tiende a una curva que recibe el nombre de Función de Densidad de la variable X.

1.- Cada vez que se pulsa en Inicio se obtiene una nueva distribución, es decir cambian los tiempos de los alumnos y en consecuencia las frecuencias de los intervalos.

2.- Si se pulsa sobre el control nº interv van cambiando el número de intervalos en los que se agrupan los tiempos, la media y la desviación típica, pues el valor de estos parámetros depende de la marca y la frecuencia de las clases.

3.- Al pulsar sobre el control  Pol Frec , aparece o desaparece la poligonal de frecuencias.

4.-Al pulsar sobre el control Histograma  se opta por ver el histograma o la línea poligonal superior que limita el histograma.

5.- El botón áreas se usa para mostrar el valor de las áreas que encierran la poligonal de frecuencias (en rojo) y la línea perimetral del histograma (en azul). Ambas líneas tienden a la función de densidad, con el aumento del nº de intervalos. Cuando áreas está en 1, se anulan los dos controles anteriores.

 

Ejercicios: Responde en tu cuaderno a las siguientes cuestiones:

  1. Aumenta varias veces el nº de intervalos y observa cómo cambia el histograma cuando la amplitud de las clases disminuye (El control áreas  debe estar en 0,  y el control Histograma en 1).

  2. Comienza con un nuevo ejemplo pulsando Inicio. Pulsa en el control Pol Frec, ponlo en 1, para que se vea la línea poligonal. Ve aumentando el nº de intervalos. Pulsa también el control Histograma para ponerlo en 0 ¿Qué piensas que ocurriría con las dos líneas poligonales si pudiéramos hacer el nº de intervalos infinitamente grande?.

  3. La media es, a veces, algo mayor que 10, y otras menor. ¿Que se puede decir de la forma del histograma según el valor de la media?.

  4. Comienza con una nueva distribución pulsando otra vez Inicio. Pulsa en el control áreas. Observa que el área encerrada por el histograma es 1 desde el comienzo. ¿Existe diferencia entre las áreas que encierran ambas líneas? ¿Qué ocurre con la diferencia de áreas cuando aumenta el nº de intervalos?.


         
           
  Pepe Sánchez
 
Ministerio de Educación, Cultura y Deporte. Año 2006.
 
 

Licencia de Creative Commons
Los contenidos de esta unidad didáctica están bajo una licencia de Creative Commons si no se indica lo contrario.