Hola por favor su ayuda para problema de comparación de dos variables

El director de operaciones de una gran cadena de supermercados que opera en Latino américa, desea saber cuál es la relación entre la cantidad gastada en alimentos por mes y el ingreso mensual de sus clientes. De manera muy específica desea conocer si a mayor ingreso hay un mayor consumo en alimentos. Dispones de la información que se representa en la siguiente tabla:

 Familia            Ingresos en cientos de unidades monetarias (x)                 Consumo (y)        

1                                                          100                                                       730

2                                                           150                                                        50

3                                                          850                                                      500

4                                                             75                                                    170

5                                                           40                                                       87

6                                                       1000                                                       600

7                                                          150                                                       135

8                                                            70                                                       69

9                                                            95                                                        30

10                                                          60                                                       60

Con base en esta información:

a)    Determina la ecuación de regresión lineal.

b)    Utilizando la ecuación de regresión lineal, estima para un valor de la variable x= 50 el valor de la variable “y”

c)    Utilizando la ecuación de regresión lineal, estima para un valor de la variable “y=40”, un valor de la variable “x”.

d)    Responde al planteamiento expresado por el director de operaciones sobre la relación de las variables

Respuesta
1

Aun no me has dicho si te pareció bien como resolví el ejercicio anterior. Voy a resolverlo de la misma forma y ya me dirás. Y si no sabes como se calcula algún dato como la varianza o covarianza dímelo y te lo explico.

Esta es la hoja de Excel con los cálculos programados y el diagrama

Y las preguntas son

a)

Recta de regresión. La tengo casi calculada ya que tengo el coeficiente de la x y el coeficiente libre

y = 0.4628x + 123.23467

No obstante te explico como ce consigue

$$\begin{align}&y=\overline y+\frac{Cov(X,Y)}{\sigma_X^2}(x-\overline x)\\ &\\ &y = 243.1+\frac{52363.1}{113144}(x-259)\\ &\\ &y = 243.1+0.4628(x-259)\\ &\\ &y =243.1 + 0.4628x - 119.8652\\ &\\ &y = 0.4628x + 123.2348\end{align}$$

No coincide del todo porque Excel hizo la cuenta con todos los decimales y aquí he redondeado algo.

Usaré esta

y = 0.4628x + 123.23467

b)

Para x=50 el valor de y es

y = 0.4628·50 + 123.23467 = 23.14+123.23467 = 146.37467

c)

Para y= 40 el valor de x se calcula así

40 = 0.4628x + 123.23467

0.4628x = 40 - 123.23467 = -106.37467

x= -106.37467 / 0.4628 = -229.8501945

d)

Si, a mayor ingreso hay mayor consumo de alimentos ya que la recta de regresión tiene pendiente positiva.

Y eso es todo.

¡Gracias! Pero me podrías ayudar por favor a decirme como se calcula la varianza y covarianza y los cálculos que están en la parte de abajo de excel es decir:

Var(x)

Var(y)

Cov(x,y)

coef de x

coef libre

Correlación

desv (x)

desv(y)

determin.

Mi mail es [email protected] me puedes ayudar con el envío de la hoja de excel para verificar que cálculos se están realizando.

Te agradezco infinitamente!

Son todo cosas teóricas que pensaba que a lo mejor las sabías y por eso no lo explicaba y me limitaba a hacer los cálculos.

La varianza de X (que se simboliza por sigma cuadrado) se calcula así:

$$\begin{align}&\sigma_X^2=\frac{\sum_{i=1}^n X_i^2}{n}-\mu_X^2\end{align}$$

Entonces tienes la columna C donde están los cuadrados de las Xi desde C2 a C11, en C12 está la suma y en C13 la división entre 10.  Eso te da el primer término y luego le restas el cuadrado de la media de los Xi que está en A13.

La varianza de Y es lo mismo pero referido a la columna D y con la media de B13

La Covarianza de X y Y se calcula así.

$$\begin{align}&Cov(X,Y)=\frac{\sum_{i=1}^n X_iY_i}{n}-\mu_X·\mu_Y\end{align}$$

Entonces en la columna E están los productos Xi·Yi, en E12 la suma y en E13 el promedio.  A ese E13 hay que restarle el producto de las medias que están en A13 y  B13

El coeficiente de X y el coeficiente libre son números que se calculan a partir de esta fórmula una vez que haces las operaciones, arriba te lo explicaba, vuelvo a poner las cuentas.

$$\begin{align}&y=\overline y+\frac{Cov(X,Y)}{\sigma_X^2}(x-\overline x)\\ &\\ &y = 243.1+\frac{52363.1}{113144}(x-259)\\ &\\ &y = 243.1+0.4628(x-259)\\ &\\ &y =243.1 + 0.4628x - 119.8652\\ &\\ &y = 0.4628x + 123.2348\end{align}$$

Cuando te pase la hoja te fijas cual es la expresión exacta ya calculada para los coeficientes.

Las desviaciones no son otra cosa que la raíz cuadrada de la varianza correspondiente, es por eso que se escriben con el símbolo sigma ya que la varianza tiene el símbolo sigma cuadrado.

Y el coeficiente de correlacióny determinación te explicaba como se calculaban en el otro ejercicio.

Cuando te mande la hoja puedes usarla par hacer otras correlaciones si añades o quitas filas con cuidado. Siempre deben empezar los datos en la fila 2, tú tienes que escribir los datos en las columnas A y B hasta la línea de separación.

Si quieres añadir filas tienes que usar Añadir Filas para que así las nuevas hereden las fórmulas.

Y no escribas sobre ninguna celda de las que tienen fórmulas.

T debe haber siempre una línea de separación entre los promedios y las celdas de abajo.

Haz una copia y no trabajes nunca sobre el original por si machacas alguna fórmula.

Espera un poco que tardaré en mandártela porque estoy haciendo que pueda calcular también las previsiones de Y para un valor de X y viceversa.

Muchísimas gracias !!! quedo a la espera

Excelente tarde

Gracias ya la recibí :)

Espera, la hoja te sirve únicamente como ejemplo para que veas las fórmulas, pero no sirve para resolver otros problemas porque al insertar filas no pone las fórmulas. Tendré que corregirlo de alguna forma, lástima.

No te preocupes esta perfecto pero con esta me doy una idea de las operaciones realizadas además de los otros ejercicios pues también ya me hiciste favor de responderlos sólo me faltaría uno :)

Ya, pero aparte que quiero dar un programa que funcione también es más cómodo para mi uso si funciona. Simplemente hay que desproteger las filas de datos de X e Y. Y tener cuidado de no machacar las fórmulas de las columnas C, D y E.

Y lo importante es la forma de operar. Que tienes que hacer una correlación con menos datos eliminas filas enteras pinchando en el número de fila con el botón derecho. Que tienes que meter más datos haces lo mismo y en vez de eliminar le das a insertar.

Ahora te lo mando.

Añade tu respuesta

Haz clic para o