Determina el coeficiente de correlación de variables del siguiente ejemplo.

Determina el coeficiente de correlación de variables del siguiente ejemplo, tomando las variables que se mencionan en la tabla.

Tenemos la variable edad (X) y la variable peso (Y) determina el coeficiente de correlación, para la muestra de tres personas.

x        y
15        48
26        54
54        75

Utilizamos la formula (No me permite ingresar la fórmula ni corregirla, la fórmula es igual sólo que en lugar de S es el signo de sumatoria que es una W de lado, no sé si me entienda, seguiré intentando ingresar la fórmula.

$$r=\frac{Sxy}{\sqrt(Sx^2)(Sy^2)}$$

y encontramos las sumatorias de (xy), (x2) y de (y2) y son 6174, 3817 y 10845 respectivamente, sustituimos en la formula dando por resultado R= 0.9596

x    24    35    28    47    12    44    56
y    2     4     6     4     7     2     8

1 respuesta

Respuesta
1

Estas confundiendo la covarianza muestral con el sumatorio de los (x·y) y la varianza muestral con el sumatorio de los x^2 o y^2.

La auténtica fórmula es (llamando ro a r que es lo habitual)

$$\begin{align}&\\ &\rho= \frac{S_{xy}}{\sqrt{S_x^2} \sqrt{S_y^2}}\\ &\\ &\\ &\text{o más abreviado y claro}\\ &\\ &\rho= \frac{S_{xy}}{S_xS_y}\\ &\\ &\\ &donde\\ &\\ &S_{xy}=\frac{\sum_{i=1}^n (x_i-\overline x)(y_i-\overline y)}{n-1}=\\ &\\ &\frac{\sum_{i=1}^n x_iy_i-\overline x\sum_{i=1}^n y_i- \overline y \sum_{i=1}^n x_i+n\overline x \overline y}{n-1}=\\ &\\ &\\ &\frac{\sum_{i=1}^n x_iy_i-n\overline x \overline y- n\overline y \overline x+n\overline x \overline y}{n-1}=\\ &\\ &\\ &=\frac{\sum_{i=1}^n x_iy_i-n\overline x \overline y}{n-1}\\ &\\ &\\ &\\ &S_x= \sqrt{\frac{\sum_{i=1}^N (x_i-\overline x)^2}{n-1}}=\\ &\\ &\\ &\sqrt{\frac{\sum_{i=1}^n x_i^2-\overline x \sum_{i=1}^n x_i-\overline x \sum_{i=1}^n x_i+ n\overline x \overline y}{n-1}}=\\ &\\ &\sqrt{\frac{\sum_{i=1}^n x_i^2-2n\overline x \overline x+ n\overline x^2}{n-1}}=\\ &\\ &\sqrt{\frac{\sum_{i=1}^n x_i^2-n\overline x^2}{n-1}}\\ &\\ &Analogamente\\ &\\ &Sy = \sqrt{\frac{\sum_{i=1}^n y_i^2-n\overline y^2}{n-1}}\\ &\\ &\\ &\text{con ello queda}\\ &\\ &\rho = \frac{\frac{\sum_{i=1}^n x_iy_i-n\overline x \overline y}{n-1}}{\sqrt{\frac{\sum_{i=1}^n x_i^2-n\overline x^2}{n-1}} \sqrt{\frac{\sum_{i=1}^n y_i^2-n\overline y^2}{n-1}}}=\\ &\\ &\\ &\frac{\sum_{i=1}^n x_iy_i-n\overline x \overline y}{\sqrt{\sum_{i=1}^n x_i^2-n\overline x^2} \sqrt{\sum_{i=1}^n y_i^2-n\overline y^2}}\\ &\\ &\\ &\\ &\end{align}$$

Que si lo ponemos con la misma notación que usé antes, sin subíndices y todo en función de los sumatorios es:

$$\begin{align}&\rho=\frac{\sum xy-n \frac{\sum x}{n}·\frac{\sum y}{n}}{\sqrt{\sum x^2-n\left( \frac{\sum x}{n} \right)^2} \sqrt{\sum_{i=1}^n y_i^2-n\left( \frac{\sum y}{n} \right)^2}}=\\ &\\ &\\ &\frac{\sum xy-\frac{(\sum x) (\sum y)}{n}}{\sqrt{\sum x^2- \frac{(\sum x)^2}{n}} \sqrt{\sum y^2- \frac{(\sum x)^2}{n}}}\\ &\end{align}$$

que es lo mismo que salió entonces y luego las cuentas son las mismas y el resultado es el mismo.

Además esto me ha servido para darme cuenta de una cosa: existen las medidas poblaciones para la varianza, desviación y covarianza que son las que se divide por n y las medidas muéstrales que son las que se divide por n-1. Bien pues, el indice de correlación da lo mismo que se calcule con unas o con otras, siempre que no se mezclen.

En resumen que tenias una confusión pensando que las S esas significaban sumatorios y son otra cosa.

Y eso es todo.

Añade tu respuesta

Haz clic para o