Considérese un conjunto de observaciones sobre n individuos de una población, en los que se miden ciertas variables X e Y :
Se esta interesado en hacer regresión para determinar, de modo aproximado, los valores de Y conocidos los de X, se debe definir cierta variable, que debe tomar los valores
de modo que:
Ello se puede expresar definiendo una nueva variable E que mida las diferencias entre los auténticos valores de Y y los teóricos suministrados por la regresión,
y calculando de modo que E tome valores cercanos a 0. Dicho de otro modo, E debe ser una variable cuya media debe ser 0, y cuya varianza V(E) debe ser pequeña (en comparación con la de Y ). Por ello se define el coeficiente de determinación de la regresión de Y sobre X ,
.
Análogamente es de interés encontrar una curva de regresión para X como función de Y ,se define
y si el ajuste es bueno se debe tener que
Las cantidades y sirven entonces para medir de qué modo las diferencias entre los verdaderos valores de una variable y los de su aproximación mediante una curva de regresión son pequeños en relación con los de la variabilidad de la variable que intentamos aproximar. Por esta razón estas cantidades miden el grado de bondad del ajuste.