¿Análisis de la varianza?

Hola, estoy estudiando un proceso de producción y quiero ver si el operador, el día, la máquina, o alguna combinación de ellos influye en mi resultado. Tengo dos operadores, tres días y dos máquinas, y observo la luz emitida. Tengo tres preguntas
Puedo analizar esto con una modelo lineal general, ¿y si alguno de los parámetros es significativo concluyo que no hay suficiente evidencia para determinar que dicho parámetro NO está afectando la producción?
¿Qué factores tomo como fijos y cuales como aleatorios?
Y si la observación fuese categórica, por ejemplo pasa-no pasa un diámetro específico, ¿podría utilizar también glm? ¿O sería mejor usar el diámetro como observación continua?
Muchas gracias por tu ayuda

1 Respuesta

Respuesta
1
En primer lugar te explico que diferencia hay entre efectos fijos y efectos aleatorios, los efectos aleatorios son los que forman parte de una muestra aleatoria, es decir, pertenecen a una población de efectos más grandes, por el contrario, los efectos fijos conforman por si mismos toda la población de efectos posibles. Para ver la diferencia te pongo un ejemplo. Imaginate que estás fabricando un producto y quieres ver si un factor afecta a la producción, dicho factor imaginate que es el tipo de máquina, y que tienes 500 tipos de máquina diferentes(lo he puesto muy exagerado) está claro que si tuvieras que tener en cuenta todos los tipos de máquinas te volverías loco tomando observaciones de cada una, entones lo que hacemos es seleccionar una muestra aleatoria de esos 500 tipos de máquinas, por ejemplo 10 tipos de máquinas, entonces esos 10 tipos de máquinas son efectos aleatorios, porque no hemos considerado todos los efectos posibles del factor, si no que hemos cogido una muestra ALEATORIA(recalco lo de aleatoria porque tiene que ser aleatoria para que los resultados sean válidos). Por el contrario imaginate que tienes el mismo número de tipos de máquinas, 500, pero que en este caso a ti sólo te interesa saber si existen diferencias entre los tipos de máquinas A, B y C, entonces a diferencia de antes que te interesaban todos los tipos, pero que por complejidad no podías tomarlos todos, ahora sólo te interesan tres tipos de máquinas entonces esos tres tipos, son los tres efectos fijos de tu factor (tipo de máquina), también serían efectos fijos si cogieras los 500 tipos de máquinas, ya que si los coges todos no es una muestra aleatoria. Al escoger premeditadamente los tipos A, B y C los resultados obtenidos SÓLO son palicables a los tres tipos de máquinas, por el contrario con la muestra los resultados son extrapolables a toda la población de efectos, es decir, a las 500 máquinas.
Te pongo cada respuesta en una pestaña de estas, ¿ok?
Se me olvidó decirte lo primero que sí lo debes hacer con un análisis de la varianza, un GLM.
Que un factor sea significativo significa que existen diferencias entre sus efectos(categorías), es decir es significativo porque existen diferencias significativas en los valores medios en cada uno de los efectos del factor. Entonces una vez que obtienes que un factor es significativo entonces realizas unas "COMPARACIONES MÚLTIPLES", para ver que efectos son los significativos y sabes en que medida lo son. Ya que un efecto sea significativo (media distinta al resto de efectos) no significa que sea bueno, porque puede ser que la media de ese efecto sea tan baja que resulta significativamente diferente al resto pero eso a lo mejor no es beneficiosos para ti.
En cuanto a "observación" a que te refieres, ¿a la variable dependiente? ¿O a una variable respuesta? En el caso que la variable dependiete sea categórica ya no tendrás que hacer un GLM.
Mirate este libro está muy bien y te ayudara a entender más conceptos.
http://www.babellibros.com/html/libro.php?codigo=LA160020043
Cualquier cosa me lo dices.
Muchísimas gracias por la respuesta y la rapidez.
Me queda claro el tema de los factores fijos o aleatorios. Un ejemplo clarísimo. Por tanto, si no estoy equivocado, si elijo tres días y quiero extrapolarlo a "días" en general, lo introduciré como un factor aleatorio.
Por otro lado, me queda claro también el tema de la significación de los factores y la realización de las comparaciones múltiples (post-hoc, me imagino).
En el caso de lo que he llamado "observación", cuando el proceso termina, observo la intensidad lumínica o el diámetro, efectivamente me refiero a la variable dependiente. En el caso de la variable dependiente dicotómica, ¿podría usar los modelos lineales generalizados que ofrece SPSS?
Por último, e igual aquí estoy mezclando churras con merinas, si el resultado de un GLM con estros tres factores es que ninguno presenta diferencias significativas entre sus efectos, ¿podría concluir que mi método de producción es reproducible en relación a estos tres factores?
Mil gracias
Por cierto, me compraré ese libro que me comentas
La verdad que me has pillado delante del ordenador cuando has enviado la pregunta, por eso he sido rápido, je je. Además, el diseño de experimentos es una rama que me gusta mucho.
Bueno, primero:
Si pones los días como efectos aleatorios, tendrás que saber cuál es tu población, es decir, saber de que población de días has extraído esa muestra ALEATORIA de tres días. Por ejemplo si tus días son Lunes, Martes, Miércoles, Jueves, Viernes y sábado, si coges una muestra ALEATORIA (que pesado soy con eso eh) de esos días los pondrás como aleatorios y el resultado de ese factor será extrapolable a todos los días de la semana (lo mismo, para días del mes, año, etc) pero no para día en general. Por el contrario imaginate que piensas que los viernes y los sábados son los días con producción más reducida(por ser final de semana, por ejemplo) entonces si te interesa saber si esto es así cogerás a propósito los días viernes, sábado y otro día entre semana el que sea (el que sea porque asumimos que en el resto de días se trabaja igual) entones serán factores fijos.
Las comparaciones múltiples si que son los post-hoc, que SÓLO se hacen si te ha salido algún factor significativo, si no, no tiene sentido hacerlos.
Vale si tu variable dependiente es la intensidad lumínica lo que harás será para cada crucea de efectos entre los factores, es decir, para cada intensidad lumínica producida según que condiciones apuntaraás esa intensidad(no se en que unidades se mide), por ejemplo:
Para el "Día 3" - "Operador 1" - "Máquina 2" tenemos intesidades 100;95;75
Así para todas las combinaciones recogerás las observaciones que consideres oportunas, la mejor forma es una tabla de 12 casillas ( 2 operadores, 3 días y 2 máquinas)2x3x2, y en cada casilla pones la lista de datos. (Ojo en SPSS no se introducen así los datos).
Me he ido por las ramas, perdón. Si la intensidad es dicótomica (categórica en general) no podrás utilizar el análisis de la varianza, si no que serán ya los modelos de respuesta discreta como son los modelos: logit, probit, logarítmico lineal, etc. Para esto el libro ese no te sirve.
Voy a suponer que tus datos son como he puesto arriba 100;95;75, entonces si ningún factor es significativo significa que da igual el día, el operador, y la máquina que escojas para la producción porque con todas las combinaciones obtendrás los mismos resultados. Sin embargo imaginate que te sale la máquina con diferencias significativas, entonces quiere decir que una máquina te produce, en media, intensidades lumínicas más elevadas que la otra, entonces si tu objetivo es producir intensidades más altas realizarás la producción con esa máquina.
Estas pruebas también son interesantes para el control de calidad, imaginate que se supone que tus dos máquinas deben ofrecer los mismos resultados, pero observando los resultados sale que una de ellas opera igual, pero la otra realiza producciones de intensidad por debajo de lo normal entonces así localizas problemas en la producción y te permite ver que esa máquina necesita una reparación. Así como ver si algún operario trabaja menos que el resto o trabaja igual pero es menos eficiente. O con el ejemplo de los días te sirve para ver si tus trabajadores hay días que reducen su producción.
Bueno ya sabes, cualquier cosa me lo dices.
PD. Primero mira el libra a ver si se ajusta a lo que tu buscas.
Estupenda respuesta, claridad y explicaciones fenomenales, y sobre todo, paciencia al responder. Muchísimas gracias. A mí también me llama mucho el tema del diseño de experimentos, desgraciadamente es muy complejo .Te añado como experto favorito. Espero no sacarte de tus casillas con muchas preguntas.

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas