Evaluación de consulta relacional | conjunto 2

Requisito previo: evaluación de consulta relacional | Conjunto 1
Los datos se almacenan en discos. Luego, los discos se manipulan mediante métodos de lectura y escritura. A mayor número de manipulaciones, menor número de discos estarían fallando. Para superar esto y aumentar la vida útil de los discos, queremos optimizar los discos usados ​​asegurándonos de minimizar las operaciones de lectura y escritura usando los discos.

  1. Operación de proyección :
    esta operación implica la selección de atributos del registro. Esta operación es costosa. Para llevar a cabo la operación de proyección, cada registro en el archivo debe escanearse para formular el registro resultante. Los registros duplicados en el registro resultante deben eliminarse mediante funciones de clasificación o basadas en hash. Es esencial escanear todo el archivo en caso de usar la operación de proyección. Un método económico implicaría usar operaciones de proyección solo después de las operaciones de selección. Esto se debe a que habría menos registros después de realizar la selección y luego, la operación de proyección puede ocurrir que implica un menor costo, menos operaciones de lectura y escritura y más vida útil de los discos.
  2. Clasificación:
    la clasificación es una operación que se aplica con mucha frecuencia. Tiene su uso en la eliminación de elementos duplicados, agrupación de registros, unión, etc. La clasificación externa involucra archivos enormes presentes en el disco. Podemos organizar los archivos en orden creciente o decreciente de registros. Usamos la ordenación por fusión para estas operaciones. La clasificación por fusión implica 2 fases, a saber, la fase de clasificación y la fase de fusión. Prevalece el uso de la fase de clasificación en la creación de subarchivos que se clasifican. Estos subarchivos ordenados también se conocen como ejecuciones. La fase de fusión es conocida por fusionar los subarchivos para finalmente crear un archivo ordenado.

Suposición:
la suposición es que los datos son muy grandes y se almacenan en un número n de bloques y la memoria (m bloques) es mucho más pequeña que los datos. Los próximos pasos que estarían involucrados son leer m bloques, ordenarlos en la memoria y luego escribirlos en el disco como un archivo único llamado ejecutar.
Estos pasos deben repetirse:

(n / m) number of times 

Tome el valor máximo siempre que el valor no sea un número entero.

Complejidad :

(2*n) times block access

Podemos decir que se ha producido la creación de un número “r” de subarchivos, cada uno de los cuales está ordenado. El espacio de búfer es solo m bloques, podemos operar solo en m bloques a la vez. Luego, mueva la parte operada a la memoria y opere en los siguientes bloques (a un máximo de m bloques a la vez).

Publicación traducida automáticamente

Artículo escrito por supriya_saxena y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *