Guia de la evaluación de la minería de datos

Un almacén de datos exhibe las siguientes características para apoyar el proceso de toma de decisiones de la gerencia

Orientado a temas : el almacén de datos está orientado a temas porque nos proporciona la información sobre un tema en lugar de las operaciones en curso de la organización. Estos sujetos pueden ser productos, clientes, proveedores, ventas, ingresos, etc. El almacén de datos no se enfoca en las operaciones en curso, sino que se enfoca en el modelado y análisis de datos para la toma de decisiones.

Integrado : el almacén de datos se construye mediante la integración de datos de fuentes heterogéneas, como bases de datos relacionales, archivos planos, etc. Esta integración mejora el análisis efectivo de los datos.

Variante de tiempo : los datos recopilados en un almacén de datos se identifican con un período de tiempo particular. Los datos en un almacén de datos proporcionan información desde un punto de vista histórico.

No volátil : no volátil significa que los datos anteriores no se eliminan cuando se le agregan nuevos datos. El almacén de datos se mantiene separado de la base de datos operativa, por lo que los cambios frecuentes en la base de datos operativa no se reflejan en el almacén de datos.

Almacenamiento de datos

El almacenamiento de datos es el proceso de construcción y uso del almacén de datos. Un almacén de datos se construye integrando los datos de múltiples fuentes heterogéneas. Admite informes analíticos, consultas estructuradas y/o ad hoc y toma de decisiones.

El almacenamiento de datos implica la limpieza de datos, la integración de datos y las consolidaciones de datos. Para integrar bases de datos heterogéneas, tenemos los siguientes dos enfoques:

  • Enfoque basado en consultas
  • Enfoque impulsado por la actualización

Enfoque basado en consultas

Este es el enfoque tradicional para integrar bases de datos heterogéneas. Este enfoque se utiliza para construir contenedores e integradores sobre múltiples bases de datos heterogéneas. Estos integradores también se conocen como mediadores.

Proceso de enfoque basado en consultas

  • Cuando se emite una consulta a un lado del cliente, un diccionario de metadatos traduce la consulta en las consultas, apropiadas para el sitio heterogéneo individual involucrado.
  • Ahora estas consultas se asignan y se envían al procesador de consultas local.
  • Los resultados de sitios heterogéneos se integran en un conjunto de respuestas global.

Desventajas

Este enfoque tiene las siguientes desventajas:

  • El enfoque basado en consultas necesita procesos complejos de integración y filtrado.
  • Es muy ineficiente y muy costoso para consultas frecuentes.
  • Este enfoque es costoso para consultas que requieren agregaciones.

Enfoque basado en actualizaciones

Los sistemas de almacenamiento de datos actuales siguen un enfoque basado en actualizaciones en lugar del enfoque tradicional discutido anteriormente. En el enfoque basado en actualizaciones, la información de múltiples fuentes heterogéneas se integra de antemano y se almacena en un almacén. Esta información está disponible para consulta directa y análisis.

Ventajas

Este enfoque tiene las siguientes ventajas:

  • Este enfoque proporciona un alto rendimiento.
  • Los datos se pueden copiar, procesar, integrar, anotar, resumir y reestructurar en el almacén de datos semánticos por adelantado.

El procesamiento de consultas no requiere interfaz con el procesamiento en fuentes locales.

Del almacenamiento de datos (OLAP) a la minería de datos (OLAM)

La minería analítica en línea se integra con el procesamiento analítico en línea con la minería de datos y el conocimiento de la minería en bases de datos multidimensionales. Aquí está el diagrama que muestra la integración de OLAP y OLAM:

Importancia de OLAM

OLAM es importante por las siguientes razones:

  • Alta calidad de los datos en los almacenes de datos: las herramientas de minería de datos son necesarias para trabajar con datos integrados, consistentes y limpios. Estos pasos son muy costosos en el preprocesamiento de datos. Los almacenes de datos construidos por dicho preprocesamiento son fuentes valiosas de datos de alta calidad para OLAP y también para la minería de datos.
  • Infraestructura de procesamiento de información disponible que rodea a los almacenes de datos : la infraestructura de procesamiento de información se refiere al acceso, la integración, la consolidación y la transformación de múltiples bases de datos heterogéneas, instalaciones de servicio y acceso a la web, informes y herramientas de análisis OLAP.
  • Análisis exploratorio de datos basado en OLAP: el análisis exploratorio de datos es necesario para una extracción de datos eficaz. OLAM proporciona facilidad para la minería de datos en varios subconjuntos de datos y en diferentes niveles de abstracción.
  • Selección en línea de funciones de minería de datos : la integración de OLAP con múltiples funciones de minería de datos y la minería analítica en línea brinda a los usuarios la flexibilidad para seleccionar las funciones de minería de datos deseadas e intercambiar tareas de minería de datos dinámicamente.

Sin usted, esta web no existiria. Gracias por visitarme, espero que le haya gustado y vuelva. Gracias ☺️

Articulos tematica computadoras

Fecha actualizacion el 2022-02-04. Fecha publicacion el 2022-02-04. Categoria: computadoras Autor: Oscar olg Mapa del sitio Fuente: tutorialspoint