Tipos de datos primitivos de Hive

Hive es una herramienta de almacenamiento de datos que se creó sobre Hadoop. Hive actúa como una interfaz para el ecosistema Hadoop. Es un marco que se usa para almacenar los datos usando HDFS (sistema de archivos distribuido Hadoop) y procesar los datos usando Map Reduce . Entonces, la colmena toma los datos presentes en Hadoop y realiza actividades analíticas. En esto, discutiremos los tipos de datos primitivos de colmena en detalle con la ayuda de un ejemplo para una mejor comprensión. Además, cubriremos la necesidad de tipos de datos de colmena y luego enfatizaremos en tipos de datos primitivos como tipos de datos numéricos, tipos de datos de fecha y hora, tipos de datos complejos, etc. Discutámoslo uno por uno. 

Necesidad de tipos de datos de Hive:
para realizar actividades analíticas se necesitan algunos tipos de datos y formatos de datos para procesar y recuperar los datos.

  • Al usar Hive podemos realizar análisis de datos.
  • Hive proporciona HQL (Hive Query Language) que es similar a SQL.
  • Podemos crear Hive Tables definiendo columnas de tabla con un tipo de datos.

Clasificación de los tipos de datos:
los tipos de datos de Hive se pueden clasificar en dos partes.

Tipos de datos primitivos:
los tipos de datos primitivos también se dividen en 3 tipos que son los siguientes.

Tipo-1:
tipo de datos numéricos:
estos tipos de datos se utilizan para definir las columnas con variables enteras.

Tipo de datos Tamaño
TINYINT: entero con signo de 1 byte -128 a 127
SMALLINT – ‘Entero con signo de 2 bytes -32, 768 a 32, 767
INT – entero con signo de 4 bytes –2.147.483.648 a 2.147.483.647 
BIGINT: entero con signo de 8 bytes 9.223.372.036.854.775.808 a 9.223.372.036.854.775.807
FLOAT – ‘Punto flotante de precisión simple Precisión simple
DOUBLE – Coma flotante de doble precisión Precisión doble
DECIMAL: tipo decimal preciso basado en Java BigDecimal Object gran decimal

Ejemplo de consulta –

Demostración de TINYINT:
en este tipo de datos de colmena, el rango es de -128 a 127. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata(college_id tinyint);

Demostración SMALLINT:
en este tipo de datos de colmena, el tamaño es de 2 bytes y el rango es de -32768 a 32767. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata(college_id smallint);

Demostración INT:
en este tipo de datos de colmena, el tamaño es de 4 bytes y el rango es de -2,147,483,648 a 2,147,483,647. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata(college_id  int);

Demostración BIGINT:
en este tipo de datos de colmena, el tamaño es de 8 bytes y el rango es de 9,223,372,036,854,775,808 a 9,223,372,036,854,775,807. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata(phonenumber  bigint);

Demostración FLOAT:
en este tipo de datos de colmena, el tamaño es punto flotante de precisión única y el rango es precisión única. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata(percentage float);

Demostración DOBLE:
en este tipo de datos de colmena, el tamaño es punto flotante de precisión doble y el rango es precisión doble. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata( percentage double );

Demostración DECIMAL:
en este tipo de datos de colmena, el tamaño es de tipo decimal preciso basado en Java BigDecimal Object y el rango es Big Decimal. Entendamos con la ayuda de un ejemplo.

create table geeksportal.geekdata( percentage decimal);

Tipo 2:
tipo de datos de fecha/hora:
aquí, analizaremos los tipos de datos de fecha/hora en Hive de la siguiente manera.

TIMESTAMP - 'YYYY-MM-DD HH:MM:SS.fffffffff   = 9 decimal place precision

Demostración de TIMESTAMP:
en este tipo de datos de colmena, verá la demostración del tipo de datos TIMESTAMP de la siguiente manera.

create table geeksportal.geekdata( time timestamp);

Tipo de datos de string:
en este tipo de datos de colmena, comprenderá el tipo de datos del tipo de datos de string de caracteres con la ayuda de un ejemplo de la siguiente manera.

create table geeksportal.geekdata( name string);

Tipo-3:
tipos de datos complejos:
aquí, analizaremos los tipos de datos complejos en Hive de la siguiente manera.

Array:
una array es una colección de campos del mismo tipo de datos indexados por un número entero.

Sintaxis:

ARRAY<TINYINT>

MAP:
El mapa es una colección de claves, pares de valores donde la clave es un tipo primitivo y el valor puede ser cualquier cosa. Los tipos de datos elegidos para las claves y los valores deben permanecer iguales por mapa.

Sintaxis:

MAP<STRING,INT>

STRUCT:
Es una estructura de datos compleja anidada.

Sintaxis:

STRUCT<first : SMALLINT, second : FLOAT, third : STRING>

UNION:
es un tipo de datos complejo que puede contener uno de sus posibles tipos de datos a la vez.

Sintaxis:

UNIONTYPE<INT,FLOAT,STRING>

Ejemplo:
para demostrar los tipos de datos con la ayuda de un ejemplo para una mejor comprensión. Considere un archivo de texto (Geek.txt) que incluye registros de materias y marcas de la siguiente manera.

7058,cse^1,1|2|3,A|50000,3,true
7059,cse^2,1|2,B|40000,good,true

Código/Consulta:

Creating a table t1:
create table t1(id int,class map<string,int>,sections array<int>,hostel
struct<grade:string,fee:double>,rating uniontype<int,string>,exist boolean)
row format delimited
fields terminated by ','
collection items terminated by '|'
map keys terminated by '^'
lines terminated by '\n'
stored as textfile; 

Publicación traducida automáticamente

Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *