Colmena – Comandos de un disparo

Hive viene con varios comandos «One Shot» que un usuario puede usar a través de Hive CLI (Command Line Interface) sin ingresar al shell de Hive para ejecutar una o más consultas separadas por un punto y coma. Hive CLI ofrece múltiples opciones que brindan diversas funcionalidades al usuario. Discutiremos varios modos y sus características … Continue reading «Colmena – Comandos de un disparo»

Hive – Cargar datos en la tabla

Las tablas de Hive nos proporcionan el esquema para almacenar datos en varios formatos (como CSV). Hive proporciona varias formas de agregar datos a las tablas. Podemos usar consultas DML (lenguaje de manipulación de datos) en Hive para importar o agregar datos a la tabla. También se puede poner la tabla directamente en la colmena … Continue reading «Hive – Cargar datos en la tabla»

Apache HIVE: opciones de la base de datos

Apache Hive es una herramienta de almacenamiento de datos construida sobre Hadoop. Los datos estructurados se pueden manejar con el lenguaje de consulta de Hive. En este artículo, vamos a ver las opciones que están disponibles con las bases de datos en Hive. La base de datos se utiliza para almacenar información. La colmena creará … Continue reading «Apache HIVE: opciones de la base de datos»

Apache Hive: partición estática con ejemplos

La partición en Apache Hive es muy necesaria para mejorar el rendimiento al escanear las tablas de Hive. Permite a un usuario que trabaja en la colmena consultar una parte pequeña o deseada de las tablas de la colmena. Supongamos que tenemos una tabla de estudiantes que contiene 5000 registros y queremos procesar solo los … Continue reading «Apache Hive: partición estática con ejemplos»

Colmena – Mesa desplegable

Apache Hive es una herramienta de almacenamiento de datos que usamos para administrar nuestros datos de estructura en Hadoop. Las tablas en la colmena se utilizan para almacenar datos en formato tabular (estructurado). Hive es muy capaz de consultar petabytes de registros almacenados dentro de la tabla Hive. El comando DROP TABLE en la colmena … Continue reading «Colmena – Mesa desplegable»

Colmena – Alterar base de datos

Apache Hive viene con una base de datos ya creada con el nombre predeterminado . La base de datos predeterminada no se puede modificar en Hive porque está restringida. Para cada base de datos creada con éxito, la alteración se puede realizar según los requisitos del usuario. La alteración en la base de datos se … Continue reading «Colmena – Alterar base de datos»

¿Cómo crear una tabla en Hive?

En Apache Hive podemos crear tablas para almacenar datos estructurados para luego poder procesarlos. La tabla en la colmena consta de varias columnas y registros. La tabla que creamos en cualquier base de datos se almacenará en el subdirectorio de esa base de datos. La ubicación predeterminada donde se almacena la base de datos en … Continue reading «¿Cómo crear una tabla en Hive?»

Apache Hive: Introducción a la creación y eliminación de bases de datos HQL

Requisito previo: Instalación de Hive 3.1.2, Instalación de Hadoop 3.1.2 HiveQL o HQL es un lenguaje de consulta de Hive que usamos para procesar o consultar datos estructurados en Hive. Las sintaxis de HQL son muy similares a MySQL pero tienen algunas diferencias significativas. Usaremos el comando hive , que es un script de shell … Continue reading «Apache Hive: Introducción a la creación y eliminación de bases de datos HQL»

Prueba de concepto sobre agregador de noticias usando tecnologías de Big Data

Big Data es un gran conjunto de datos que puede tener un gran volumen de datos, velocidad y variedad de datos. Por ejemplo, miles de millones de usuarios buscan en Google al mismo tiempo y ese será un conjunto de datos muy grande. En este, discutiremos la prueba de concepto (POC) en un agregador de … Continue reading «Prueba de concepto sobre agregador de noticias usando tecnologías de Big Data»

Operaciones de base de datos en HIVE con CLOUDERA: estación de trabajo VMWARE

Vamos a crear una base de datos y crear una tabla en nuestra base de datos. Y cubrirá las operaciones de la base de datos en HIVE usando CLOUDERA – VMWARE Work Station. Vamos a discutir uno por uno. Introducción: Hive es una herramienta ETL que proporciona una interfaz similar a SQL entre el usuario … Continue reading «Operaciones de base de datos en HIVE con CLOUDERA: estación de trabajo VMWARE»