En este punto hay que evaluar si realmente esta predicción puede considerarse confiable. Para dar una respuesta, es necesario estudiar propiedades de la regresión lineal que están a continuación.
Una vez que ya se tiene definida , (o bien ) es necesario saber que relación hay entre la media y la varianza de esta y la de Y (o la de X ).
La respuesta se encuentra en la siguiente proposición:
Proposición
En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores de las variables X e Y y sus aproximaciones y , pues sólo se mantienen en un factor de , es decir
Demostración
Basta probar la afirmación para la variable Y , ya que para X es totalmente análogo:
donde se ha utilizado la magnitud que se denomina coeficiente de correlación, y que ya se definió anteriormente como
Nota
Como consecuencia de este resultado, se puede decir que la proporción de varianza explicada por la regresión lineal es del
Lo deseable seria tener que r=1 , pues en ese caso ambas variables tendrían la misma varianza, pero esto no es cierto en general. Todo lo que se puede afirmar, es que
y por tanto
La cantidad que le falta a la varianza de regresión, , para llegar hasta la varianza total de Y , , es lo que se denomina varianza residual, que no es más que la varianza de Y , ya que
El tercer sumando se anula, como se presenta mas adelante:
Por ello
Obsérvese que entonces la bondad del ajuste es
Para el ajuste contrario se define el error como , y su varianza residual es también proporcional a 1-r2
y el coeficiente de determinación (que sirve para determinar la bondad del ajuste de en función de ) es:
Proposición
Para los ajustes de tipo lineal se tiene que los dos coeficientes de determinación son iguales a r2 , y por tanto representan además la proporción de varianza explicada por la regresión lineal:
Por ello:
Si el ajuste es bueno ( Y se puede calcular de modo bastante aproximado a partir de X y viceversa).
Si las variables X e Y no están relacionadas (linealmente al menos), por tanto no tiene sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no posean ninguna relación en el caso ya que si bien el ajuste lineal puede no ser no adecuado, tal vez otro tipo de ajuste sí lo sea.