Descripción general de Apache Presto

Descripción general:
en el mundo actual, los datos se han convertido en la parte más importante de la vida y el almacenamiento y uso de los datos para diferentes propósitos se ha convertido en un objetivo comercial esencial. Por lo tanto, debido a la aparición de muchas tecnologías, una de ellas es el análisis de datos , que se ha convertido en uno de los principales de la industria actual. El análisis de datos es un proceso de recopilación de información relevante que puede ayudar a tomar mejores decisiones mediante el análisis de datos sin procesar. Pero en el caso de los grandes datos, que consisten en una gran cantidad de datos, analizar una gran cantidad de datos se vuelve bastante complejo. Por lo tanto, para minimizar la complejidad y mejorar el proceso de análisis, surge una nueva tecnología conocida como Apache Presto.

Apache Preto:
Presto es un motor de consultas SQL diseñado y desarrollado por Facebook para que el analista de datos ejecute consultas interactivas en una gran cantidad de bases de datos en Apache Hadoop. La arquitectura de Presto permite fuentes de datos de diferentes fuentes como AWS s3, MySQL y Teradata, etc. Presto ahora se ha convertido en un software de código abierto para el uso de la comunidad bajo la Licencia Apache. Presto tiene API Java incorporadas que facilitan la integración con varios componentes de infraestructura de datos. Presto tiene la funcionalidad de un sistema de procesamiento paralelo distribuido debido a que es capaz de procesar análisis de consultas interactivas y con una tasa de latencia baja. Presto ayuda a evitar varios problemas de código Java relacionados con la asignación de memoria y la recolección de elementos no utilizados.

Características de Apache Presto:
Aquí, discutiremos las características de Apache Presto de la siguiente manera.

  • La arquitectura de Presto es muy jugable y extensible a la nueva demanda.
  • Presto admite varios conectores enchufables para proporcionar metadatos y datos para diferentes consultas.
  • Presto tener la funcionalidad de canalizar la ejecución de las consultas evita la sobrecarga innecesaria de latencia de entrada/salida.
  • Presto también proporciona la funcionalidad a los analistas de datos para crear funciones definidas por el usuario de acuerdo con la demanda de la solución del problema.
  • Presto admite el procesamiento de columnas vectorizadas, lo que aumenta la eficiencia de la consulta.

Ventajas de Apache Presto:
aquí, discutiremos las ventajas de Apache Presto de la siguiente manera.

  • Presto ejecuta la escala de las consultas sin tiempo de inactividad de gigabytes a petabytes.
  • Presto es muy simple y fácil de entender y depurar en su propia computadora.
  • Presto es compatible con ANSI SQL, lo que lo hace único y popular entre otras herramientas analíticas.
  • Presto tiene una funcionalidad integrada en la que cada comando se pasa a través de un coordinador maestro que indica la selección de Nodes para ejecutar un trabajo a través del programador.
  • El motor de memoria de Apache Presto ayuda a procesar una gran cantidad de datos de la manera más rápida.

Desventajas de Apache Presto:
Aquí, discutiremos las desventajas de Apache Presto de la siguiente manera.

  • Preso tiene una asignación de consultas prioritaria basada en la cola, por lo que algunas consultas esperan un período de tiempo más largo para ser procesadas.
  • La estructura de diseño de Presto no admite la consulta relacionada con uniones para una gran cantidad de bases de datos.
  • Presto aprovecha el espacio en disco en lugar de la memoria utilizada para el procesamiento, pero en general, las personas prefieren usar un sistema para todos sus propósitos.

Aplicaciones de Apache Presto:
Aquí, discutiremos las aplicaciones de Apache Presto de la siguiente manera.

  1. Airbnb
    cientos de empleados presentes en Airbnb utilizaron la arquitectura Apache Presto para procesar grandes consultas y, por lo tanto, forman parte integral de la organización.
     
  2. Teradata
    Teradata ayuda a proporcionar soluciones integrales en análisis de datos y almacenamiento de datos. Teradata actúa como colaborador de Presto debido a que se satisfacen las necesidades analíticas de la mayor parte de la empresa.

Publicación traducida automáticamente

Artículo escrito por manasmohapatra y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *