Duda ajuste de ecuaciones

Hola
Tengo una duda importante. ¿Cómo puedo saber cual es la base teórica del ajuste R2 de las hojas excel?. Se que es un ajuste por mínimos cuadrados, pero necesito más detalles de cara a justificar buenos o malos valores de R2 en virtud de un tipo de ecuación u otra
Gracias.

1 respuesta

Respuesta
1
R es el coeficiente de correlación de Pearson:
r=Sxy/(Sx.Sy)
Su cuadrado, r^2 es el coeficiente de determinación.
Si lo restamos de uno y multiplicamos por Sx obtenemos la varianza del error:
(1-r^2 ) Sx = Se (1)
O la varianza residual, es decir el valor cuadrático medio de la diferencia entre los valores de Y con los correspondientes valores de Y en la predicción. Esto es la varianza de "distancia vertical" (diferencia de ordenadas) entre los puntos (datos) y la recta(predicciones).
La (1) se demuestra fácil ya que la varianza de la diferencia es,(en este caso en que son iguales los valores medios) es igual la diferencia de las varianzas.
Dependencia del número n de muestras:
El valor de r^2 es Sxy^2/SxSy pero su valor lo estimamos a partir de la muestras.
¿Cuál será nuestro error en el calculo de r a partir de n muestras?
Esto no es tan simple. Si la distribución de r calculado a partir de n muestras fuera normal podríamos calcular su desviación típica. Bueno, resulta que r no tiene una distribución normal, pero para n>30 se la pude aproximar como normal con una desviación típica igual a 2/Raíz(n).
De esta manera tomando un número grande n de datos puedo tener un valor de r confiable.
Entonces 1-r^2 te dirá cuanto error puedes esperar de en las predicciones de Y

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas