Introducción para principiantes Índice de base de datos

Articulos tematica Microsoft

Índice de base de datos se refiere a un tipo especial de estructura de datos que acelera la recuperación de registros de una tabla de base de datos

Los índices de la base de datos aseguran que pueda ubicar y acceder a los datos en una tabla de base de datos de manera eficiente sin tener que buscar en cada fila cada vez que se procesa una consulta de base de datos.

El índice de una base de datos se puede comparar con el índice de un libro. Los índices en las bases de datos le indican el registro que está buscando en la base de datos, al igual que la página de índice de un libro le indica el tema o capítulo que desea.

Sin embargo, aunque los índices de la base de datos son esenciales para la búsqueda y el acceso de datos rápidos y eficientes, ocupan espacio de memoria y escrituras adicionales.

¿Qué es un índice?

Los índices de la base de datos son tablas de búsqueda especiales que constan de dos columnas. La primera columna es la clave de búsqueda y la segunda es el puntero de datos. Las claves son los valores que desea buscar y recuperar de la tabla de su base de datos, y el puntero o la referencia almacena la dirección del bloque de disco en la base de datos para esa clave de búsqueda específica. Los campos clave están ordenados para acelerar la operación de recuperación de datos para todas sus consultas.

¿Por qué utilizar la indexación de bases de datos?

Le mostraré los índices de la base de datos de una manera simplificada aquí. Supongamos que tiene una tabla de base de datos de los ocho empleados que trabajan en una empresa y desea buscar la información para la última entrada de la tabla. Ahora, para encontrar la entrada anterior, debe buscar en cada fila de la base de datos.

Sin embargo, suponga que ha ordenado alfabéticamente la tabla según el nombre de los empleados. Entonces, aquí las claves de indexación se basan en la "columna de nombre". En ese caso, si busca la última entrada, " Zack ", puede saltar al centro de la tabla y decidir si nuestra entrada viene antes o después de la columna.

Como sabe, vendrá después de la fila del medio, y puede volver a dividir las filas después de la fila del medio por la mitad y hacer una comparación similar. De esta forma, no es necesario recorrer cada fila para encontrar la última entrada.

Si la empresa tuviera 1.000.000 de empleados y la última entrada fuera "Zack", tendría que buscar 50.000 filas para encontrar su nombre. Considerando que, con la indexación alfabética, puede hacerlo en unos pocos pasos. Ahora puede imaginarse cuánto más rápido puede llegar a ser el acceso y la búsqueda de datos con la indexación de la base de datos.

Diferentes métodos de organización de archivos para índices de bases de datos

La indexación depende en gran medida del mecanismo de organización de archivos utilizado. Por lo general, hay dos tipos de métodos de organización de archivos que se utilizan en la indexación de bases de datos para almacenar datos. Se comentan a continuación:

1. Archivo de índice ordenado: este es el método tradicional de almacenar datos de índice. En este método, los valores clave se ordenan en un orden particular. Los datos de un archivo de índice ordenado se pueden almacenar de dos formas.

  • Índice disperso: en este tipo de indexación, se crea una entrada de índice para cada registro.
  • Índice denso: en la indexación densa, se crea una entrada de índice para algunos registros. Para encontrar un registro en este método, primero debe encontrar el valor de clave de búsqueda más significativo de las entradas de índice que sean menores o iguales al valor de clave de búsqueda que está buscando.

2. Organización de archivos hash: en este método de organización de archivos, una función hash determina la ubicación o el bloque de disco donde se almacena un registro.

Tipos de indexación de bases de datos

En general, existen tres métodos de indexación de bases de datos. Ellos son:

  • Indexación agrupada
  • Indexación no agrupada
  • Indexación multinivel

Indexación agrupada

En la indexación agrupada, un solo archivo puede almacenar más de dos registros de datos. El sistema mantiene los datos reales en una indexación agrupada en lugar de los punteros. La búsqueda es rentable con la indexación agrupada, ya que almacena todos los datos relacionados en el mismo lugar.

Un índice de agrupación utiliza archivos de datos ordenados para definirse a sí mismo. Además, unir varias tablas de bases de datos es muy común con este tipo de indexación.

También es posible crear un índice basado en columnas no primarias que no son únicas para cada clave. En tales ocasiones, combina varias columnas para formar los valores clave únicos para los índices agrupados.

Entonces, en resumen, los índices de agrupación son donde se agrupan tipos de datos similares y se crean índices para ellos.

Ejemplo: suponga que hay una empresa que tiene más de 1000 empleados en 10 departamentos diferentes. En este caso, la empresa debe crear un índice de agrupación en su DBMS para indexar a los empleados que trabajan en el mismo departamento.

Cada grupo con empleados que trabajan en el mismo departamento se definirá como un solo grupo, y los indicadores de datos en los índices se referirán al grupo como una entidad completa.

Indexación no agrupada

La indexación no agrupada se refiere a un tipo de indexación en el que el orden de las filas del índice no es el mismo que la forma en que se almacenan físicamente los datos originales. En cambio, un índice no agrupado apunta al almacenamiento de datos en la base de datos.

Ejemplo: la indexación no agrupada es similar a un libro que tiene una página de contenido ordenada. Aquí, el puntero o referencia de datos es la página de contenido ordenada que está ordenada alfabéticamente, y los datos reales son la información en las páginas del libro. La página de contenido no almacena la información de las páginas del libro en su orden.

Indexación multinivel

La indexación multinivel se usa cuando el número de índices es muy alto y no puede almacenar el índice principal en la memoria principal. Como sabrá, los índices de la base de datos comprenden claves de búsqueda y punteros de datos. Cuando aumenta el tamaño de la base de datos, también crece el número de índices.

Sin embargo, para garantizar una operación de búsqueda rápida, es necesario que los registros de índice se mantengan en la memoria. Si se usa un índice de un solo nivel cuando el número de índice es alto, es poco probable que almacene ese índice en la memoria debido a su tamaño y múltiples accesos.

Aquí es donde entra en juego la indexación multinivel. Esta técnica divide el índice de un solo nivel en varios bloques más pequeños. Después de romperse, el bloque de nivel externo se vuelve tan pequeño que se puede almacenar fácilmente en la memoria principal.

Semrush sigue a tu competencia

Fecha actualización el 2021-07-12. Fecha publicación el 2021-07-12. Categoria: computadoras Autor: Oscar olg Mapa del sitio Fuente: makeuseof