Considérese un conjunto de observaciones sobre n individuos de una población, en los que se miden ciertas variables   X  e   Y    :  

 


Se esta  interesado en hacer regresión para determinar, de modo aproximado, los valores de Y conocidos los de        X, se debe definir cierta variable,    que debe tomar los valores

 

de modo que:

 

Ello se puede expresar definiendo una nueva variable    E    que mida las diferencias entre los auténticos valores de Y   y  los teóricos suministrados por la regresión,

y calculando  de modo que  E  tome valores cercanos a 0. Dicho de otro modo,   E     debe ser una variable cuya media debe ser  0, y cuya varianza  V(E)  debe ser  pequeña (en comparación con la de   Y  ).   Por ello se define el coeficiente de determinación de la regresión de Y  sobre  X ,            

.


 
Si el ajuste de Y mediante la curva de regresión   es bueno, cabe esperar que la cantidad    tome un valor próximo a 1.

Análogamente es de interés encontrar una curva de regresión para  X  como función de   ,se define

 

y si el ajuste es bueno se debe tener que   


 

Las cantidades         y        sirven entonces para medir de qué modo las diferencias entre los verdaderos valores de una variable y los de su  aproximación mediante una curva de regresión son pequeños en relación con los de la variabilidad de la variable que intentamos aproximar. Por esta razón estas  cantidades miden el grado de bondad del ajuste.