Data Ware House

Soy estudiante de la carrera de Análisis de Sitemas, y este es el tema que me toca desarrollar en mi tesis. Necesito saber todo acerca de ello, (lo que he encontrado es muy ínfimo), necesito saber por ejemplo sus aplicaciones, lo que abarca, lo que podría hacer con el, hasta donde puedo llegar ... Cualquier cosa me estaría sirviendo muchísimo, gracias.

1 respuesta

Respuesta
1
Yo he estudiado ese tema este año en una asignatura, y tengo unos puntes que igual te sirven(serán 30 transparencias más o menos), así que si quieres no me importaría escanearlas y enviártelas a tu correo.
Pero para empezar te diré que su aplicación suele ser normalmente para conseguir estadísticas, y los usuarios de los almacenes de datos son "gente de las altas esferas dentro de la empresa", normalmente de la dirección de la empresa.
Suelen tratar con datos "agregados", es decir, que no nos interesa un saldo puntual, sino la evolución del saldo medio de un cliente(para hacerle ofertas...)
Más cosas sobre las que podrías investigar serían los Datamarts, que son almacenes de datos más pequeños, que suelen pertenecer a los distintos departamentos de una misma empresa, se suelen utilizar para mejorar el tiempo de respuesta.
Sobre el diseño que se suele utilizar normalmente es el "esquema estrella", tengo ejemplos aquí, lo que pasa es que se explican gráficamente, primero debes detectar el hecho principal, por ejemplo en una tienda sería la tabla Venta, y después las dimensiones sobre las que vas a hacer estadísticas, pero es muy complicado de explicar textualmente, así que si quieres lo que te he dicho arriba, te copio algún ejercicio, o te copio las transparencias con la teoría.
Respecto a las operaciones que puedes realizar ocn un almacén de datos son, aparte de las normales de las BD, rollup, que sirve para compactar el cubo, drill-down que sirve para estirar el cubo, y luego la función CUBE, que es muy potente, aunque muy costosa, te pongo un ejemplo:
SELECT fecha,region,sum(beneficio)
FROM Ventas
GROUP BY CUBE(fecha,region)
Nos devolvería:
(Fecha, región, SUM(beneficio))
(fecha,*,SUM(beneficio))
(*,*,SUM(beneficio))
(*,region,SUM(beneficio))
Los * indican la unión de todas las posibilidades de ese campo.
Si en lugar de CUBE hubiésemos puesto ROLLUP, entonces nos devolvería:
(Fecha, región, SUM(beneficio))
(fecha,*,SUM(beneficio))
(*,*,SUM(beneficio))
Espero que este ejemplillo te haya servido de ayuda, otro punto sobre el que deberías de investigar son las Vistas Materializadas, se utilizan para tener resultados ya precomputados, porque el CUBO original suele ser enorme, y el acceso a él será muy lento, por ello se suelen utilizar vistas materializadas, que son subcubos con lo datos más significativos.
No te dejes engañar por el nombre, y aunque sea una vista, y en BD las vistas no almacenan datos, las vistas materializadas sí que almacenan datos, por lo que esos datos deberán ser refrescados en algún momento para tener datos actuales.
Se me ha olvidado comentarte que los datos con los que se crean los Almacenes de datos suelen provenir de diversas fuentes, no sólo BD, sino también ficheros de texto, facturas escritas a mano o a máquina, páginas webs, etc.
Espero haberte servido de ayuda, y lo dicho, si quieres los apuntes o algún ejercicio que tenga hecho pídemelo, que en cuanto tenga tiempo los escaneo, los comprimo y te los envío.
Muchísimas gracias! De seguro me servirá, .. y si me gustaría mucho que pudieses enviarme esos datos que tienes, me serán muy útiles y me ayudaran bastante... Ok, estaré esperando.. muchas gracias de nuevo!

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas