Guia sobre las tareas de la minería de datos

La minería de datos se ocupa del tipo de patrones que se pueden extraer. Según el tipo de datos que se extraerán, hay dos categorías de funciones involucradas en la minería de datos

Función descriptiva

La función descriptiva se ocupa de las propiedades generales de los datos en la base de datos. Aquí está la lista de funciones descriptivas:

  • Clase/Concepto Descripción
  • Minería de patrones frecuentes
  • Minería de Asociaciones
  • Minería de Correlaciones
  • Minería de Clústeres

Clase/Concepto Descripción

Clase/Concepto se refiere a los datos que se asociarán con las clases o conceptos. Por ejemplo, en una empresa, las clases de artículos para la venta incluyen computadoras e impresoras, y los conceptos de clientes incluyen grandes consumidores y consumidores de presupuesto. Tales descripciones de una clase o un concepto se denominan descripciones de clase/concepto. Estas descripciones se pueden derivar de las siguientes dos maneras:

  • Caracterización de datos : se refiere a resumir los datos de la clase en estudio. Esta clase en estudio se denomina Clase objetivo.
  • Discriminación de datos : se refiere al mapeo o clasificación de una clase con algún grupo o clase predefinida.

Minería de patrones frecuentes

Los patrones frecuentes son aquellos patrones que ocurren con frecuencia en los datos transaccionales. Aquí está la lista de tipos de patrones frecuentes:

  • Conjunto de elementos frecuentes : se refiere a un conjunto de elementos que frecuentemente aparecen juntos, por ejemplo, leche y pan.
  • Subsecuencia frecuente : una secuencia de patrones que ocurren con frecuencia, como comprar una cámara, es seguida por una tarjeta de memoria.
  • Subestructura frecuente : la subestructura se refiere a diferentes formas estructurales, como gráficos, árboles o redes, que pueden combinarse con conjuntos de elementos o subsecuencias.

Minería de Asociación

Las asociaciones se utilizan en las ventas minoristas para identificar patrones que se compran juntos con frecuencia. Este proceso se refiere al proceso de descubrir la relación entre los datos y determinar las reglas de asociación.

Por ejemplo, un minorista genera una regla de asociación que muestra que el 70 % de las veces la leche se vende con pan y solo el 30 % de las veces las galletas se venden con pan.

Minería de Correlaciones

Es un tipo de análisis adicional realizado para descubrir correlaciones estadísticas interesantes entre pares de valor de atributo asociado o entre dos conjuntos de elementos para analizar si tienen un efecto positivo, negativo o nulo entre sí.

Minería de Clústeres

Cluster se refiere a un grupo de objetos similares. El análisis de conglomerados se refiere a la formación de un grupo de objetos que son muy similares entre sí pero que son muy diferentes de los objetos de otros conglomerados.

Clasificación y Predicción

La clasificación es el proceso de encontrar un modelo que describa las clases de datos o conceptos. El propósito es poder utilizar este modelo para predecir la clase de objetos cuya etiqueta de clase se desconoce. Este modelo derivado se basa en el análisis de conjuntos de datos de entrenamiento. El modelo derivado se puede presentar de las siguientes formas:

  • Reglas de clasificación (SI-ENTONCES)
  • Árboles de decisión
  • fórmulas matemáticas
  • Redes neuronales

La lista de funciones involucradas en estos procesos es la siguiente:

  • Clasificación : predice la clase de objetos cuya etiqueta de clase se desconoce. Su objetivo es encontrar un modelo derivado que describa y distinga clases de datos o conceptos. El modelo derivado se basa en el conjunto de análisis de datos de entrenamiento, es decir, el objeto de datos cuya etiqueta de clase es bien conocida.
  • Predicción : se utiliza para predecir valores de datos numéricos faltantes o no disponibles en lugar de etiquetas de clase. El análisis de regresión generalmente se usa para la predicción. La predicción también se puede utilizar para identificar tendencias de distribución en función de los datos disponibles.
  • Análisis de valores atípicos: los valores atípicos se pueden definir como los objetos de datos que no cumplen con el comportamiento general o el modelo de los datos disponibles.
  • Análisis de evolución: el análisis de evolución se refiere a la descripción y modelo de regularidades o tendencias de objetos cuyo comportamiento cambia con el tiempo.

Primitivas de tareas de minería de datos

  • Podemos especificar una tarea de minería de datos en forma de consulta de minería de datos.
  • Esta consulta se ingresa al sistema.
  • Una consulta de minería de datos se define en términos de primitivas de tareas de minería de datos.

Estas primitivas nos permiten comunicarnos de manera interactiva con el sistema de minería de datos. Aquí está la lista de primitivos de tareas de minería de datos:

  • Conjunto de datos relevantes de la tarea que se extraerán.
  • Tipo de conocimiento a extraer.
  • Conocimientos previos que se utilizarán en el proceso de descubrimiento.
  • Medidas de interés y umbrales para la evaluación de patrones.
  • Representación para visualizar los patrones descubiertos.

Conjunto de datos relevantes de la tarea que se extraerán

Esta es la parte de la base de datos en la que el usuario está interesado. Esta porción incluye lo siguiente:

  • Atributos de la base de datos
  • Dimensiones de interés del almacén de datos

Tipo de conocimiento a extraer

Se refiere al tipo de funciones a realizar. Estas funciones son −

  • Caracterización
  • Discriminación
  • Análisis de asociación y correlación
  • Clasificación
  • Predicción
  • Agrupación
  • Análisis de valores atípicos
  • Análisis de evolución

Conocimiento de fondo

El conocimiento previo permite extraer datos en múltiples niveles de abstracción. Por ejemplo, las jerarquías de conceptos son uno de los conocimientos previos que permiten extraer datos en múltiples niveles de abstracción.

Medidas de interés y umbrales para la evaluación de patrones

Esto se utiliza para evaluar los patrones que son descubiertos por el proceso de descubrimiento de conocimiento. Hay diferentes medidas interesantes para diferentes tipos de conocimiento.

Representación para visualizar los patrones descubiertos

Esto se refiere a la forma en que se mostrarán los patrones descubiertos. Estas representaciones pueden incluir lo siguiente. −

  • Reglas
  • Mesas
  • Gráficos
  • gráficos
  • Árboles de decisión
  • Cubos

Sin usted, esta web no existiria. Gracias por visitarme, espero que le haya gustado y vuelva. Gracias ☺️

Articulos tematica computadoras

Fecha actualizacion el 2022-02-04. Fecha publicacion el 2022-02-04. Categoria: computadoras Autor: Oscar olg Mapa del sitio Fuente: tutorialspoint