SSTable en Apache Cassandra

En este artículo, vamos a discutir SSTable, que es uno de los motores de almacenamiento en los componentes de Cassandra y SSTable, y también, cubriremos qué tipo de información se guarda en diferentes archivos de base de datos en SSTable. Discutamos uno por uno.

SSTable:
es uno de los motores de almacenamiento en Apache Cassandra, es decir, almacenamiento para archivos de datos inmutables para almacenamiento de filas. En Cassandra, SSTable se usa para almacenar datos en el disco.

Figura – SSTable en Apache Cassandra

Puntos clave :

  • En Apache Cassandra, como comprobará cómo se almacenan los datos, los datos en SSTables y SSTables se descargan en el disco desde Memtables o se transmiten desde otros Nodes.
  • En Cassandra, al insertar datos, la marca de tiempo se incluye en cada escritura cuando se escribió.
  • En Cassandra, la compactación es un concepto que combina varias SSTable en una SSTable grande, y una vez que se ha escrito una SSTable nueva, se pueden eliminar las SSTable antiguas.
    solamente, se mantiene la última marca de tiempo.

Componentes de SSTable:
en Cassandra, SSTable tiene varios componentes que se almacenan en varios archivos de la siguiente manera.

  • Data.db:
    en SSTable, Data.db almacena los datos reales, es decir, el contenido de las filas.
  • Index.db:
    es el componente de SSTable en el que un índice de claves de partición a posiciones en el archivo Data.db. También puede incluir un índice de filas dentro de una partición.
  • Summary.db:
    en Cassandra, el componente SSTable Summary.db tiene una muestra (de forma predeterminada) de cada 128 entradas en el archivo Index.db.
  • Filter.db:
    en SSTable, es un filtro Bloom de las claves de partición.
  • CompressionInfo.db:
    en SSTable, es el componente que mantuvo los metadatos sobre las compensaciones. CompressionInfo.db mantuvo la longitud de los fragmentos de compresión en el archivo Data.db.
  • Statistics.db:
    es uno de los componentes importantes de SSTable que mantiene las estadísticas de los datos. En Cassandra, es un componente SSTable que almacena metadatos sobre SSTable e incluye información sobre marcas de tiempo, lápidas, claves de agrupación, compactación, reparación, compresión, valores de tiempo de vida (TTL) y más.
  • Digest.crc32:
    en Cassandra, este componente SSTable tiene un resumen CRC-32 del archivo Data.db.
  • TOC.txt:
    en Cassandra, este componente SSTable tiene una lista de texto sin formato de los archivos de componentes para SSTable. En SSTable, dentro del archivo Data.db, las filas se organizan por partición. Estas particiones se almacenan en orden de token, de modo que mediante un hash de la clave de partición cuando las filas elegidas de Murmur3Partition se almacenan en el orden de sus claves de agrupación.

Nota:
en Apache Cassandra , las SSTables se pueden comprimir opcionalmente mediante la compresión basada en bloques.

Publicación traducida automáticamente

Artículo escrito por Ashish_rana y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *