jueves, 3 de diciembre de 2015

RECTA DE REGRESION

Recta de regresión por el metodo de minimos cuadrados 

Cuando la nube de puntos adopta una forma definida, se pueden aproximar sus puntos mediante una línea curva en general, que llamamos curva de regresión.

Sólo nos ocuparemos del caso en el que la curva de regresión es una recta, llamada recta de regresión. Nos centraremos entonces en calcular la ecuación de una recta que "mejor se adapte" a una nube de puntos dada. En los ejemplos anteriores lo hemos hecho a ojo, ahora lo haremos con un criterio más preciso.

Para ello existen varios métodos, siendo el más utilizado el de los mínimos cuadrados. Consiste en hacer mínima la suma de los cuadrados de las diferencias entre los valores experimentales y los obtenidos mediante la recta. Por lo tanto, si consideramos la Y=aX+b, mediríamos lo bien (o mal) que se ajusta a nuestros puntos por medio de la cantidad

   i=1 N ( y i ( a x i +b ) ) 2 =  i=1 N ( y i a x i b ) 2

 

y la recta que estamos buscando es la que haga esta cantidad lo más pequeña posible.



Una vez realizados los cálculos correspondientes, se tiene que la ecuación de la recta de regresión es:

y y ¯ = σ xy σ x 2 (x x ¯ )

donde σx σy  son las desviaciones típicas de x e y.

Se comprueba que, como indicamos anteriormente, la recta obtenida pasa por el punto (x, y) que coincide con el centro de gravedad de la nube de puntos.

Ejemplo: Para el ejemplo de Pesos (kgs.) - Estaturas (cms.)

Peso en Kgs.

60

65

70

70

68

50

60

Altura en cms.

167

170

170

180

170

155

160

Frecuencias (ni)

1

5

2

4

2

1

1

y - y = 1.11(x-x )

atan (1.11) = 47,89 º

  

COEFICIENTE DE CORRELACION r DE PEARSON

 Coeficiente de correlación lineal de Pearson  

El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima de intervalo), es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente".
 Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de Pearson. Por ejemplo, la relación entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos población y tiempo la relación será de forma exponencial. En estos casos (y en otros muchos) no es conveniente utilizar la correlación de Pearson. 
Insistimos en este punto, que parece olvidarse con cierta frecuencia. El coeficiente de correlación de Pearson es un índice de fácil ejecución e, igualmente, de fácil interpretación. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el coeficiente de correlación de Pearson entre estas dos variables como xy r entonces: Hemos especificado los términos "valores absolutos" ya que en realidad si se contempla el signo el coeficiente de correlación de Pearson oscila entre –1 y +1. 
No obstante ha de indicarse que la magnitud de la relación vienen especificada por el valor numérico del coeficiente, reflejando el signo la dirección de tal valor. En este sentido, tan fuerte es una relación de +1 como de -1. En el primer caso la relación es perfecta positiva y en el segundo perfecta negativa. Pasamos a continuación a desarrollar algo más estos conceptos. Decimos que la correlación entre dos variables X e Y es perfecta positiva cuando exactamente en la medida que aumenta una de ellas aumenta la otra. Esto sucede cuando la relación entre ambas variables es funcionalmente exacta. Difícilmente ocurrirá en psicología, pero es frecuente en los ciencias físicas donde los fenómenos se ajustan a leyes conocidas, Por ejemplo, la relación entre espacio y tiempo para un móvil que se desplaza a velocidad constante. Gráficamente la relación ser del tipo: