Distribuciones bidimensionales. Correlación y regresión

Estadística

DISTRIBUCIONES BIDIMENSIONALES


I.      Distribuciones bidimensionales. Nube de puntos.

II.     Medida de la correlación. Covarianza


I.    Distribuciones bidimensionales. Nube de puntos

Si para cada individuo de una muestra se consideran dos datos ( por ejemplo peso y talla) podemos representar la información con puntos en el plano X-Y. Se obtiene así una nube de puntos. Cada punto corresponde a un individuo. La abscisa x se refiere a uno de los datos ( por ejemplo el peso) y la ordenada y al otro dato (por ejemplo altura). 

Si la nube de puntos sugiere una curva ascendente concluimos que a mayor valor de x corresponde mayor valor de y y decimos que la correlación es positiva. Si la curva es descendente la correlación es negativa pero si se trata de una nube amorfa diremos que la correlación es débil.

En este ventana gráfica se muestra la nube de puntos correspondiente a la siguiente distribución que puede corresponder a las calificaciones de 10 alumnos en dos asignaturas.

 

A

B

C

D

E

F

G

H

I

J

X

2

3

4

5

6

6

7

7

8

10

Y

1

3

2

4

4

6

4

6

7

9

Aparece también el centro de gravedad de la nube o punto cuyas coordenadas son las medias x , y de la variables, también llamadas medias marginales.

Observa además el valor de las desviaciones típicas sx, sy llamadas desviaciones típicas marginales.

Modifica la posición de los puntos con las flechas que aparecen en la parte inferior de la escena y observa el efecto en los valores de  las medias y desviaciones típicas. También puedes situar el cursor del ratón sobre los puntos y arrastrar sin soltar hasta la posición deseada. Si pulsa el botón inferior "inicio" recuperarás la distribución inicial. Si al modificar algún punto desaparece de la escena puedes hacer un zoom con las flechas de la línea superior de la ventana.

ACTIVIDADES

1    Construye la nube de puntos correspondiente a las siguientes distribuciones bidimensionales. Anota en tu cuaderno la disposición aproximada de la nube de puntos resultante y el valor de las medias y desviaciones típicas de x e y. Asocia a cada distribución la característica de correlación positiva/ negativa y fuerte/débil.

a)    Calificaciones de varios alumnos en dos asignaturas.

 

A

B

C

D

E

F

G

H

I

J

X

2

3

4

5

6

6

7

7

8

10

Y

2

5

2

5

4

6

6

7

5

 5

b)    Distancia a la canasta y número de encestes.

 

A

B

C

D

E

F

G

H

I

J

X

1

2

2

4

5

6

7

8

9

10

Y

9

10

6

4

2

0

1

1

1

 0

c)    Peso y estatura de 10 alumnos.

 

A

B

C

D

E

F

G

H

I

J

X

60

62

61

65

70

68

72

75

70

71

Y

160

165

168

170

175

170

178

175

180

178

NOTA: Para evitar problemas de escala toma un peso inicial  60. De esta forma podrás introducir 0,2,1,5... en vez de 60, 62, 61, 65... A la media obtenida deberás sumarle 60 pero no a la desviación típica. Haz lo mismo con las tallas, tomando una talla inicial 160.

d)    Temperaturas marcadas por dos termómetros en 10 días distintos

 

A

B

C

D

E

F

G

H

X

10 12 15 20 25 22 18 30

Y

50 53.6 59 68 77 71.6 64.4 86

Al hacer click en los pulsadores de la línea inferior, los valores se incrementan en 1. Utiliza el control "inc" de la línea superior para que el incremento se fije en una décima 0.1.

Observa la nube de puntos de este ejemplo y trata de interpretar el resultado. Te puede ayudar pensar que uno de los termómetros está graduado en grados Celsius y otro en grados Farenheit.


II.    Medida de la correlación. Covarianza.

La cuantificación de la correlación puede obtenerse de la suma de los productos: (xi-x)(yi-y). Observa en la escena siguiente el valor de la suma de esos productos en cada uno de los cuadrantes I a IV en que dividimos el plano a partir del centro de gravedad ( x , y ).

Es lógico pensar que si los puntos se agrupan en torno a una recta creciente separándose poco de ella (correlación fuerte) la mayoría de los puntos se encontrarán en los cuadrantes II y III ( con sumas positivas) y habrá pocos puntos en los cuadrantes I y IV ( los de sumas negativas). Si la nube "es decreciente" ocurrirá lo contrario. Si la nube es amorfa ( correlación débil ) las sumas parciales positivas y negativas se compensarán en parte y la suma total será más pequeña ( en valor absoluto).  En la escena siguiente debes separar los puntos de la recta con el ratón. Observa en consecuencia los cambios en las sumas de los productos de desviaciones en cada cuadrante y la suma total. La recta de ajuste se adapta automáticamente. Consigue, modificando la posición de los puntos, distribuciones con correlación negativa. Observa que la recta siempre pasa por el centro de gravedad de la nube.

ACTIVIDADES

2    Aplica en la ventana gráfica anterior los datos de las distribuciones a, b, c, d de la actividad 1. Anota para cada uno de los casos los valores de las sumas parciales de los productos (xi-x)(yi-y), la suma total y estima según los valores obtenidos si se trata de correlación positiva/ negativa y fuerte/débil. 

Ver CORRELACIÓN .

  José Carlos Arias Rodríguez
 
Ministerio Educación. Año 2004
 
 

Licencia de Creative Commons
Los contenidos de esta unidad didáctica están bajo una licencia de Creative Commons si no se indica lo contrario.