domingo, 1 de junio de 2008

Federación de datos


La federación de datos es la técnica de integración de datos que permite acceder a diferentes entornos de origen de datos con una visión común, como si en la práctica fuese una sola base de datos.
Un elemento clave por tanto es el catálogo de datos común, que se mantiene para poder localizar los datos entre las diferentes fuentes.

La mayor ventaja de la federación de datos es que el acceso es sobre datos reales, eliminando la necesidad de tener recursos para mantener copias de datos. Otra ventaja es la solución en si, poder acceder a múltiples fuentes de datos como si fueran una sola.
La desventaja principal es que no es óptima cuando hablamos de grandes volúmenes de datos o donde el rendimiento sea crítico.

La federación de datos es muy usada como solución a corto plazo, para remediar las necesidades de información en casos de compra o unión de nuevas empresas.

Enterprise Information Integration


La EII es una tecnología de Integración de datos que proporciona una visión común y consistente de un conjunto de datos no homogéneos. El objetivo de esta tecnología es permitir a las aplicaciones el acceso a datos dispersos como si estuviesen todos residiendo en una base de datos común.

Cuándo interactuamos con los productos EII realizando consultas como cualquier BD, estos recogen los resultados individuales de cada uno de los subcomponentes de las consultas, los combinan adeucuadamente y devuelven el resultado a la aplicación que lanzó la consulta. Es por eso que el punto fuerte que puede diferenciar un producto comercial de otro es la optimización de consultas distribuidas. Varia mucho si en nuestros entornos queremos hacer lecturas o lecturas y escrituras. Para estas últimas es fundamental el soporte a la transaccionalidad y por su complejidad no todos los productos EII soportn acceso completo en escritura.

Las características más importantes de los productos que implementan tecnologias EII son:
  • Transparencia en el acceso a datos.
  • Integración de datos de diferentes fuentes.
  • Posibilidad de federar cualquier fuente de datos.
  • Acceso en lectura y escritura a las diferentes fuentes de datos.
  • Rendimiento
En una arquitectura EII podemos destacar los siguientes elementos:
  • Catálogo de metadatos.
  • Wrappers (librerias de acceso a fuentes de datos particulares).
  • Motor de federación.

sábado, 31 de mayo de 2008

Integración de datos


Pufffffffff.... dos meses sin escribir, no hay quien lo aguante. Bueno, he necesitado este parón para poder tirar adelante el proyecto que tenia entre manos, que por suerte ha acabado bien.
Eso si, el máster sigue, impepinable cada semana, sin descanso.
El módulo en el que estoy ahora y que es el que mayor interés tenía a priori, es el de Integración de datos.
El temario comprende los siguientes temas:
  1. Introducción a la integración de datos
  2. Calidad de datos
  3. Técnicas de integración de datos
  4. Las principales tecnologías de integración de datos: sus características y escenarios de uso.
  5. Desarrollo de la estrategia de integración de datos en la empresa.

Intentaré ser más constante. Saludos ;-)

jueves, 27 de marzo de 2008

Datawarehouse para dummies


Sin ánimo de ofender... pero hoy me encontrado en la aventura de explicar que era un DWH.. en una conversación informal, con gente técnica, pero profana en la materia.
No me han venido a la cabeza grandes explicaciones sobre el data warehouse, la verdad.

"Pues... como te diría yo... un data warehouse es una BD orientada al análisis.. lo normal seria orientar la BD de manera operacional, con un diseño de tablas que refleja una realidad concreta y mantenible, optimizado para su acceso y modificación. Un DWH se estructura en hechos de estudio, y a su alrededor encontramos todo lo necesario para poderlo analizar el hecho en profundidad. Los datos se cargan con una periodicidad concreta de las BD operacionales... pero se estructuran por hechos. También los datos se encuentran en el formato más adecuado para las consultas. Por ejemplo, en un BD operacional tendrías un campo "Fecha de nacimiento"... en un DWH podrías tener un campo edad."

Bueno... pues así queda una definición de data warehouse para dummies.

miércoles, 26 de marzo de 2008

Nuevo módulo: Modelado de datos


Iniciamos un nuevo módulo del máster. Os presento aquí el temario:
  1. Datos, conocimiento e información
  2. Bases de datos
  3. Diseño lógico de bases de datos
  4. La implementación del diseño lógico: El diseño físico
  5. Introducción a los sistemas de inteligencia de negocio (Business Intelligence)

miércoles, 12 de marzo de 2008

Carrefour responde


Seguimos con nuestro experimento de supermercados y la atención al cliente.
Carrefour nos ha enviado una respuesta a mis "plegarias":

Estimado Sr:
Gracias por hacernos llegar sus comentarios a través de www.cuentaseloacarrefour.com
Le agradecemos que se haya tomado la molestia de poner en nuestro conocimiento su sugerencia . En Carrefour estamos siempre encantados de escuchar las propuestas de nuestros clientes para ir implantando nuevos servicios que se adecúen a sus necesidades.
Lamentablemente no es posible en todas las ocasiones satisfacer a todos nuestros clientes al mismo tiempo. Tendremos en cuenta todos sus comentarios a la hora de introducir mejoras en el hipermercado en el futuro.

Atentamente, Centro de Atención al Cliente Centros Comerciales Carrefour
www.cuentaseloacarrefour.com



Y a lo que tuve que contestar alguna cosa, claro:

Estimado Sr. Cuentaselo a Carrefour,
No acabo de entender que me quieren decir con su correo electrónico. Parece ser que mi propuesta no ha llegado a nadie, ya que si hubiese sugerido poner mandarinas en la pescadería podrían haberme contestado lo mismo.
Me gustaría saber si han tenido en cuenta mi email, quien ha leído mi propuesta y si ha llegado a una persona que puede valorar si es una buena idea o no.
Es una pena que publiciten tanto que quieren acercarse a los clientes y no sean capaces de valorar las propuestas de los mismos.

Atentamente,


Y de nuevo la respuesta de Carrefour:

Estimado Sr:
Gracias por contactar con nosotros a través de www.cuentaseloacarrefour.com.
En relación a su consulta le informamos de que lamentamos en esta ocasión no poder hacernos cargo de su petición, esperamos seguir contando con su confianza para que nos brinde la oportunidad de satisfacerle en ulteriores oportunidades.

Así mismo, le recordamos que hasta el día 23 de Abril puede participar en la promoción " Una madre brillante " a través del siguiente enlace:
http://www.elclubcarrefour.carrefour.es/clubcarrefour/anillo/
Esperando haber sido de ayuda, aprovechamos la ocasión para saludarle,

Atentamente,

Centro de Atención al Cliente
Centros Comerciales Carrefour
www.cuentaseloacarrefour.com

¿Creéis que me han tomado el pelo? Realmente hay alguien al otro lado? Me parece que no toman ninguna nota de nada, y eso que se han molestado en comprar un dominio (cuentaseloacarrefour.com) y todo para simular que te escuchan... eso si, te cuelan la promoción "una madre brillante" rápidamente.

¿Vale la pena seguir insistiendo? No tengo muchas esperanzas!

jueves, 6 de marzo de 2008

in-database-data mining


Entendemos por in-database-data mining a los servicios ligados al gestor de base de datos. Es el propio motor relacional el encargado de implementar los servicios de modelización, validación y aplicación.
Tiene por tanto una mayor escalabilidad y rendimiento. La arquitectura de estas aplicaciones suele tener dos niveles: servidor de datos y entorno de usuario.

Ventajas:
  • Alto rendimiento y escalabilidad. Los gestores de base de datos hoy en día son verdaderos súper servidores y con gran futuro. Tienen compañías muy fuertes y consolidadas detrás.
  • Gestión de los modelos en la propia BD. Tiene solo una importancia relativa. Comodidad.
  • Fácil integración con los procesos. Depende el modelo de fuentes de datos seguido por la empresa puede ser un punto fuerte. Ayuda al camino para el éxito pero no es determinante.
  • Interfaz basado en estándares. Buena ventaja. Siempre los estándares aportan fiabilidad y robustez. Creo que a largo plazo es lo que puede dar más confianza.
  • Permite separar mejor los entornos de modelización y aplicación. La separación por niveles es positiva siempre, aunque frente a los entornos integrados es peor ya que estos incorporan tres niveles.
Inconvenientes:
  • Puede aumentar la carga. Seria un problema muy serio que provocaría la ralentización de todos los entornos operaciones. Se podría superar montado una BD exclusiva.
  • Más orientados al desarrollador de BD que al analista. Es un error común en todos los gestores de BD, que piensan que los proyectos empiezan por ellos y todo el mundo gira en torno a la BD. El analista tiene un punto de vista mucho más equidistante que el desarrollador y puede aportar mayor independencia.
  • La información debe cargarse en la BD. Un paso más que como siempre puede traer complicaciones y problemas. No creo que tenga mucha importancia.
  • Enfoque reciente. El mercado a los inicios de una herramienta, da muchos tumbos… y es un peligro. Lo que hoy parece asentado, mañana es superado por otro. Siempre es más recomendable esperar.
  • Detección compleja de problemas. Al estar integrado con la BD, siempre hay “puntos negros”, que no permiten tener todo el control de los procesos y puede llegar a desesperar.

Entre los principales fabricantes destacan IBM DB2 Data Warehouse edition, Oracle Data Mining, Microsoft SQL Server Analysis Services y Teradata TeraMiner.