Vamos a crear una base de datos y crear una tabla en nuestra base de datos. Y cubrirá las operaciones de la base de datos en HIVE usando CLOUDERA – VMWARE Work Station. Vamos a discutir uno por uno.
Introducción:
- Hive es una herramienta ETL que proporciona una interfaz similar a SQL entre el usuario y el sistema de archivos distribuido de Hadoop que integra Hadoop.
- Está construido sobre Hadoop.
- Facilita la lectura, la escritura y el manejo de amplios conjuntos de datos almacenados en almacenamiento distribuido y consultados mediante la sintaxis del lenguaje de consulta de estructura (SQL).
Requisitos:
- Necesita instalar Cloudera – estación de trabajo vmware.
- Enlace para descargar para Windows: https://www.cloudera.com/downloads/cdh.html
Nubera:
Cloudera le permite implementar y administrar Apache Hadoop, manipular y analizar sus datos y mantenerlos seguros y protegidos.
Pasos para abrir Cloudera después de la instalación
Paso 1: en su escritorio, la estación de trabajo de VMware está disponible. Abre eso.
Paso 2: Ahora obtendrá una interfaz. Haga clic en abrir un dispositivo virtual.
Paso 3: Seleccione la ruta: en este paso, debe seleccionar la ruta y el archivo donde descargó el archivo.
Paso 4: Ahora su entorno virtual se está creando.
Paso 5: Puede ver los detalles de su máquina virtual en esta ruta.
Paso 6: Ahora abre la terminal para comenzar con los comandos de Hive.
Paso 7: Ahora escribe colmena en la terminal. Dará salida de la siguiente manera.
[cloudera@quickstart ~]$ hive 2020-12-09 20:59:24,314 WARN [main] mapreduce.TableMapReduceUtil: The hbase-prefix-tree module jar containing PrefixTreeCodec is not present. Continuing without it. Logging initialized using configuration in file:/etc/hive/conf.dist/hive-log4j.properties WARNING: Hive CLI is deprecated and migration to Beeline is recommended. hive>
Paso 8: Ahora, está todo listo y listo para comenzar a escribir sus comandos de colmena.
Operaciones de base de datos en HIVE
1. Crea una base de datos
Sintaxis:
create database database_name;
Ejemplo:
create database geeksportal;
Producción:
2. Crear una tabla
Sintaxis:
create database.tablename(columns);
Ejemplo:
create table geeksportal.geekdata(id int,name string);
Aquí id y string son las dos columnas.
Producción :
3. Mostrar base de datos
Sintaxis:
show databases;
Salida: Muestra las bases de datos creadas.
4. Describir la base de datos
Sintaxis:
describe database database_name;
Ejemplo:
describe database geeksportal;
Salida: muestra la ruta HDFS de una base de datos en particular.
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA