Tutorial de los problemas de la minería de datos

La minería de datos no es una tarea fácil, ya que los algoritmos utilizados pueden volverse muy complejos y los datos no siempre están disponibles en un solo lugar

Debe integrarse a partir de varias fuentes de datos heterogéneas. Estos factores también crean algunos problemas. Aquí, en este tutorial, discutiremos los principales problemas relacionados con:

  • Metodología de minería e interacción con el usuario
  • Problemas de desempeño
  • Problemas de tipos de datos diversos

Metodología de minería y problemas de interacción con el usuario

Se refiere a los siguientes tipos de problemas:

  • Extracción de diferentes tipos de conocimiento en bases de datos − Diferentes usuarios pueden estar interesados ​​en diferentes tipos de conocimiento. Por lo tanto, es necesario que la minería de datos cubra una amplia gama de tareas de descubrimiento de conocimiento.
  • Minería interactiva de conocimiento en múltiples niveles de abstracción : el proceso de minería de datos debe ser interactivo porque permite a los usuarios enfocar la búsqueda de patrones, proporcionando y refinando las solicitudes de minería de datos en función de los resultados devueltos.
  • Incorporación de conocimientos previos − Para guiar el proceso de descubrimiento y expresar los patrones descubiertos, se pueden utilizar los conocimientos previos. El conocimiento previo puede usarse para expresar los patrones descubiertos no solo en términos concisos sino en múltiples niveles de abstracción.
  • Lenguajes de consulta de minería de datos y minería de datos ad hoc : el lenguaje de consulta de minería de datos que permite al usuario describir tareas de minería ad hoc, debe integrarse con un lenguaje de consulta de almacén de datos y optimizarse para una minería de datos eficiente y flexible.
  • Presentación y visualización de los resultados de la minería de datos : una vez que se descubren los patrones, es necesario expresarlos en lenguajes de alto nivel y representaciones visuales. Estas representaciones deben ser fácilmente comprensibles.
  • Manejo de datos ruidosos o incompletos : los métodos de limpieza de datos son necesarios para manejar el ruido y los objetos incompletos mientras se extraen las regularidades de los datos. Si los métodos de limpieza de datos no existen, la precisión de los patrones descubiertos será deficiente.
  • Evaluación de patrones: los patrones descubiertos deben ser interesantes porque representan un conocimiento común o carecen de novedad.

Problemas de desempeño

Puede haber problemas relacionados con el rendimiento como los siguientes:

  • Eficiencia y escalabilidad de los algoritmos de minería de datos : para extraer de manera efectiva la información de una gran cantidad de datos en las bases de datos, el algoritmo de minería de datos debe ser eficiente y escalable.
  • Algoritmos de minería de datos paralelos, distribuidos e incrementales : factores como el gran tamaño de las bases de datos, la amplia distribución de los datos y la complejidad de los métodos de minería de datos motivan el desarrollo de algoritmos de minería de datos paralelos y distribuidos. Estos algoritmos dividen los datos en particiones que luego se procesan de manera paralela. Luego, los resultados de las particiones se fusionan. Los algoritmos incrementales actualizan las bases de datos sin volver a extraer los datos desde cero.

Problemas de tipos de datos diversos

  • Manejo de tipos de datos relacionales y complejos : la base de datos puede contener objetos de datos complejos, objetos de datos multimedia, datos espaciales, datos temporales, etc. No es posible que un sistema extraiga todos estos tipos de datos.
  • Extracción de información de bases de datos heterogéneas y sistemas de información global : los datos están disponibles en diferentes fuentes de datos en LAN o WAN. Estas fuentes de datos pueden ser estructuradas, semiestructuradas o no estructuradas. Por lo tanto, extraer el conocimiento de ellos agrega desafíos a la minería de datos.

Sin usted, esta web no existiria. Gracias por visitarme, espero que le haya gustado y vuelva. Gracias ☺️

Articulos tematica computadoras

Fecha actualizacion el 2022-02-04. Fecha publicacion el 2022-02-04. Categoria: computadoras Autor: Oscar olg Mapa del sitio Fuente: tutorialspoint