Hive es una herramienta de almacenamiento de datos que se creó sobre Hadoop. Hive actúa como una interfaz para el ecosistema Hadoop. Es un marco que se usa para almacenar los datos usando HDFS (sistema de archivos distribuido Hadoop) y procesar los datos usando Map Reduce . Entonces, la colmena toma los datos presentes en Hadoop y realiza actividades analíticas. En esto, discutiremos los tipos de datos primitivos de colmena en detalle con la ayuda de un ejemplo para una mejor comprensión. Además, cubriremos la necesidad de tipos de datos de colmena y luego enfatizaremos en tipos de datos primitivos como tipos de datos numéricos, tipos de datos de fecha y hora, tipos de datos complejos, etc. Discutámoslo uno por uno.
Necesidad de tipos de datos de Hive:
para realizar actividades analíticas se necesitan algunos tipos de datos y formatos de datos para procesar y recuperar los datos.
- Al usar Hive podemos realizar análisis de datos.
- Hive proporciona HQL (Hive Query Language) que es similar a SQL.
- Podemos crear Hive Tables definiendo columnas de tabla con un tipo de datos.
Clasificación de los tipos de datos:
los tipos de datos de Hive se pueden clasificar en dos partes.
Tipos de datos primitivos:
los tipos de datos primitivos también se dividen en 3 tipos que son los siguientes.
Tipo-1:
tipo de datos numéricos:
estos tipos de datos se utilizan para definir las columnas con variables enteras.
Tipo de datos | Tamaño |
---|---|
TINYINT: entero con signo de 1 byte | -128 a 127 |
SMALLINT – ‘Entero con signo de 2 bytes | -32, 768 a 32, 767 |
INT – entero con signo de 4 bytes | –2.147.483.648 a 2.147.483.647 |
BIGINT: entero con signo de 8 bytes | 9.223.372.036.854.775.808 a 9.223.372.036.854.775.807 |
FLOAT – ‘Punto flotante de precisión simple | Precisión simple |
DOUBLE – Coma flotante de doble precisión | Precisión doble |
DECIMAL: tipo decimal preciso basado en Java BigDecimal Object | gran decimal |
Ejemplo de consulta –
Demostración de TINYINT:
en este tipo de datos de colmena, el rango es de -128 a 127. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata(college_id tinyint);
Demostración SMALLINT:
en este tipo de datos de colmena, el tamaño es de 2 bytes y el rango es de -32768 a 32767. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata(college_id smallint);
Demostración INT:
en este tipo de datos de colmena, el tamaño es de 4 bytes y el rango es de -2,147,483,648 a 2,147,483,647. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata(college_id int);
Demostración BIGINT:
en este tipo de datos de colmena, el tamaño es de 8 bytes y el rango es de 9,223,372,036,854,775,808 a 9,223,372,036,854,775,807. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata(phonenumber bigint);
Demostración FLOAT:
en este tipo de datos de colmena, el tamaño es punto flotante de precisión única y el rango es precisión única. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata(percentage float);
Demostración DOBLE:
en este tipo de datos de colmena, el tamaño es punto flotante de precisión doble y el rango es precisión doble. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata( percentage double );
Demostración DECIMAL:
en este tipo de datos de colmena, el tamaño es de tipo decimal preciso basado en Java BigDecimal Object y el rango es Big Decimal. Entendamos con la ayuda de un ejemplo.
create table geeksportal.geekdata( percentage decimal);
Tipo 2:
tipo de datos de fecha/hora:
aquí, analizaremos los tipos de datos de fecha/hora en Hive de la siguiente manera.
TIMESTAMP - 'YYYY-MM-DD HH:MM:SS.fffffffff = 9 decimal place precision
Demostración de TIMESTAMP:
en este tipo de datos de colmena, verá la demostración del tipo de datos TIMESTAMP de la siguiente manera.
create table geeksportal.geekdata( time timestamp);
Tipo de datos de string:
en este tipo de datos de colmena, comprenderá el tipo de datos del tipo de datos de string de caracteres con la ayuda de un ejemplo de la siguiente manera.
create table geeksportal.geekdata( name string);
Tipo-3:
tipos de datos complejos:
aquí, analizaremos los tipos de datos complejos en Hive de la siguiente manera.
Array:
una array es una colección de campos del mismo tipo de datos indexados por un número entero.
Sintaxis:
ARRAY<TINYINT>
MAP:
El mapa es una colección de claves, pares de valores donde la clave es un tipo primitivo y el valor puede ser cualquier cosa. Los tipos de datos elegidos para las claves y los valores deben permanecer iguales por mapa.
Sintaxis:
MAP<STRING,INT>
STRUCT:
Es una estructura de datos compleja anidada.
Sintaxis:
STRUCT<first : SMALLINT, second : FLOAT, third : STRING>
UNION:
es un tipo de datos complejo que puede contener uno de sus posibles tipos de datos a la vez.
Sintaxis:
UNIONTYPE<INT,FLOAT,STRING>
Ejemplo:
para demostrar los tipos de datos con la ayuda de un ejemplo para una mejor comprensión. Considere un archivo de texto (Geek.txt) que incluye registros de materias y marcas de la siguiente manera.
7058,cse^1,1|2|3,A|50000,3,true 7059,cse^2,1|2,B|40000,good,true
Código/Consulta:
Creating a table t1: create table t1(id int,class map<string,int>,sections array<int>,hostel struct<grade:string,fee:double>,rating uniontype<int,string>,exist boolean) row format delimited fields terminated by ',' collection items terminated by '|' map keys terminated by '^' lines terminated by '\n' stored as textfile;
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA