En los últimos años, Big Data se definió por las » 3V «, pero ahora hay » 5V » de Big Data, que también se denominan características de Big Data de la siguiente manera:
1. Volumen:
- El nombre ‘Big Data’ en sí está relacionado con un tamaño que es enorme.
- El volumen es una enorme cantidad de datos.
- Para determinar el valor de los datos, el tamaño de los datos juega un papel muy importante. Si el volumen de datos es muy grande, en realidad se considera como ‘Big Data’. Esto significa que si un dato en particular se puede considerar como Big Data o no, depende del volumen de datos.
- Por lo tanto, al tratar con Big Data es necesario considerar un ‘Volumen’ característico.
- Ejemplo: En el año 2016, el tráfico móvil global estimado fue de 6,2 Exabytes (6,2 mil millones de GB) por mes. Además, para el año 2020 tendremos casi 40000 ExaBytes de datos.
2. Velocidad:
- La velocidad se refiere a la alta velocidad de acumulación de datos.
- En Big Data, los datos de velocidad fluyen desde fuentes como máquinas, redes, redes sociales, teléfonos móviles, etc.
- Hay un flujo masivo y continuo de datos. Esto determina el potencial de los datos y la rapidez con la que se generan y procesan para satisfacer las demandas.
- Los datos de muestreo pueden ayudar a tratar problemas como la ‘velocidad’.
- Ejemplo: Se realizan más de 3.500 millones de búsquedas al día en Google. Además, los usuarios de FaceBook aumentan un 22 % (aprox.) año tras año.
3. Variedad:
- Se refiere a la naturaleza de los datos que son datos estructurados, semiestructurados y no estructurados.
- También se refiere a fuentes heterogéneas.
- La variedad es básicamente la llegada de datos de nuevas fuentes que están tanto dentro como fuera de una empresa. Puede ser estructurado, semiestructurado y no estructurado.
- Datos estructurados : estos datos son básicamente datos organizados. Generalmente se refiere a datos que han definido la longitud y el formato de los datos.
- Datos semiestructurados: estos datos son básicamente datos semiorganizados. Generalmente es una forma de datos que no se ajusta a la estructura formal de los datos. Los archivos de registro son ejemplos de este tipo de datos.
- Datos no estructurados : estos datos se refieren básicamente a datos no organizados. Por lo general, se refiere a datos que no encajan perfectamente en la estructura tradicional de filas y columnas de la base de datos relacional. Textos, imágenes, videos, etc. son ejemplos de datos no estructurados que no se pueden almacenar en forma de filas y columnas.
4. Veracidad:
- Se refiere a las inconsistencias y la incertidumbre en los datos, es decir, los datos que están disponibles a veces pueden desordenarse y la calidad y la precisión son difíciles de controlar.
- Big Data también es variable debido a la multitud de dimensiones de datos que resultan de múltiples fuentes y tipos de datos dispares.
- Ejemplo: Los datos a granel podrían crear confusión, mientras que una menor cantidad de datos podría transmitir la mitad de la información o información incompleta.
5. Valor:
- Después de tener en cuenta las 4 V, viene una V más que significa ¡Valor!. La mayor parte de los datos que no tienen valor no son buenos para la empresa, a menos que los convierta en algo útil.
- Los datos en sí mismos no tienen ningún uso ni importancia, pero deben convertirse en algo valioso para extraer información. Por lo tanto, puede establecer ese Valor! es la V más importante de todas las 5V.