Encontrar sus activos de datos es una cosa, administrar sus metadatos técnicos y comerciales, mientras que mantener los requisitos de seguridad adecuados es otra bestia. El catálogo de datos puede ser de gran ayuda en escenarios como este. En este artículo, analizaremos el proceso de agregar etiquetas esquematizadas a sus activos de datos, así como la integración con Cloud Identity and Access Management (IAM).
El catálogo de datos es un descubrimiento de datos escalable y completamente administrado, un servicio de administración de metadatos que permite a las organizaciones descubrir, comprender y administrar rápidamente todos sus datos en Google Cloud. Aquí abordaremos el concepto de comprender sus activos de datos con etiquetas esquematizadas de una manera segura. Al igual que las notas adhesivas, las etiquetas del catálogo de datos actúan como anotaciones, mientras que otros catálogos de datos capturan etiquetas como simples strings de texto, el catálogo de datos captura metadatos comerciales en un formato esquematizado a través de etiquetas. Estas etiquetas se pueden crear a través de la interfaz de usuario y de API personalizadas. Los usuarios ahora pueden definir una etiqueta comercial como una enumeración de string, doble, booleana o enumerada, lo que facilita la catalogación y la búsqueda de activos de datos.
Los metadatos técnicos son datos que ya están guardados en los servicios de GCP, como los nombres de las tablas, las descripciones de las columnas y la fecha de creación. Estos datos se incorporan automáticamente desde la fuente de datos al catálogo de datos sin ninguna participación por parte del usuario. Por ejemplo, si agrega una nueva tabla a BigQuery, aparecerá en el catálogo de datos en cuestión de segundos; por otro lado, los metadatos comerciales son etiquetas que brindan información comercial adicional que es valiosa para un cliente. Esto podría incluir
- información personal
- eliminar por fechas
- lógica de negocios
- puntajes de calidad de datos
- etiquetas de gobernanza
Al agregar metadatos comerciales, los activos de datos se vuelven más buscables y útiles para su equipo. Echemos un vistazo a cómo puede agregar información valiosa a sus activos de datos con plantillas de etiquetas. En la pantalla de inicio del catálogo de datos, desplácese hasta la sección de plantilla de etiqueta y haga clic en crear una plantilla de etiqueta.
Aquí puede definir el ID de la plantilla, mostrar el nombre , así como agregar atributos y definir su tipo.
Cada tipo de atributo puede ser una string doble booleana o una enumeración.
Una vez que haya agregado todos sus atributos, haga clic en Guardar plantilla .
La creación de una plantilla de etiqueta también se puede realizar mediante programación mediante API personalizadas. Aprendamos más sobre una plantilla de etiqueta existente. En la pantalla de inicio del catálogo de datos, desplácese hasta la sección de plantillas de etiquetas y haga clic en explorar plantillas de etiquetas.
Veremos las plantillas de etiquetas de gobierno de datos.
Esta plantilla tiene etiquetas para ayudar al equipo de gobierno de datos a certificar activos de datos específicos para su uso. También les permite a los usuarios aprobados saber qué activos de datos pueden usar. Notará que cada atributo también tiene un tipo.
Para la clasificación de datos, el tipo es enum. A partir de ahí, el equipo de gobierno de datos ahora puede definir si el activo de datos es público, sensible, confidencial o regulatorio y luego puede aplicar los controles aplicables a su alrededor.
Ahora que hemos explorado una plantilla de etiqueta, veamos cómo la integración con IAM ayuda con el control de acceso de sus activos de datos en lugar de tener que establecer permisos separados. El catálogo de datos ingiere automáticamente metadatos tácticos y respeta el código fuente existente. Esto significa que si un usuario ya tiene acceso de lectura a todos los recursos de datos en BigQuery, podrá descubrir y tener acceso de lectura a esos recursos de datos en el catálogo de datos.
Del mismo modo, esta integración de IAM permite establecer más controles de acceso. Con el catálogo de datos, puede configurar el acceso de lectura, el acceso de solo lectura de metadatos y el acceso sin lectura o sin lectura de metadatos. Dependiendo de la configuración de estos permisos, los resultados de búsqueda y el acceso de los usuarios se pueden controlar manteniendo los datos altamente confidenciales limitados a aquellos con el acceso necesario.
Publicación traducida automáticamente
Artículo escrito por ddeevviissaavviittaa y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA