En este artículo, veremos cómo ejecutar una consulta en BigQuery. Ejecutar consultas es una de las partes más fundamentales para descubrir información de sus datos.
Entonces, hagámosle una pregunta escandalosa a BigQuery aquí : «¿cuál es el mejor número de camiseta que debes elegir para mejorar tu juego de baloncesto?»
No sorprende que los grandes datos se hayan abierto camino en el mundo de los deportes profesionales. Los equipos de todos los niveles están comenzando a recopilar, procesar y analizar datos para poder aprovechar al máximo a sus jugadores y encontrar una ventaja competitiva en el juego. Para ver cómo funcionaría esto, veamos el conjunto de datos públicos de baloncesto de la NCAA disponible en BigQuery. El conjunto de datos contiene datos de jugada por jugada de varios años de juegos. Puede obtener información como faltas, tiros libres, puntajes, números de jugadores, tiempos muertos, básicamente, tantos datos como los profesionales. Entonces, veamos si podemos usar estos datos para la pregunta de hoy y determinar qué número de camiseta es el mejor tirador de tres puntos.
Si desea seguir, use el espacio aislado de BigQuery donde puede analizar datos sin necesidad de una tarjeta de crédito.
Paso 1: una vez que esté en la zona de pruebas de BigQuery, diríjase a Google Cloud Marketplace haciendo clic en Agregar datos y luego en Explorar conjuntos de datos.
Paso 2: busque la pelota de baloncesto de la NCAA y haga clic para iniciar el conjunto de datos en la interfaz de usuario de BigQuery. El conjunto de datos de baloncesto de la NCAA tiene varias tablas diferentes. Al hacer clic en la tabla de jugada por jugada, primero puede ver los detalles de la tabla, lo que indica que hay más de cuatro millones de filas de eventos. Son muchos datos de baloncesto.
Verifique el esquema de la tabla y verá cada columna o campo de datos que está disponible para cada uno de esos eventos.
Pero primero, veamos cuáles son esos eventos. Puede comenzar a explorar los datos haciendo clic en la pestaña Vista previa para ver algunas filas de datos de muestra. Pero para obtener una lista más completa de todos los tipos de eventos, la mejor manera de averiguarlo es ejecutar una consulta.
Paso 3: haga clic en Consultar tabla y aparecerá una consulta en blanco en el editor con una referencia de tabla rellenada previamente.
Antes de escribir nuestra consulta, es importante saber que el lenguaje utilizado para comunicarse con BigQuery es SQL o lenguaje de consulta estructurado. SQL es también el lenguaje estándar para comunicarse con bases de datos relacionales. BigQuery es compatible con ANSI SQL.
Paso 4: Ahora, copiemos una consulta SQL para explorar los tipos de eventos. acentos graves
El comando clave en SQL para recuperar datos es SELECCIONAR, que usaremos para obtener una lista de todos los diferentes tipos de eventos y el número de ocurrencias de la tabla jugada por jugada. Tenga en cuenta que la referencia de la tabla tiene el formato del nombre del proyecto de GCP, luego el nombre del conjunto de datos, luego el nombre de la tabla, separados por puntos y entre comillas graves, no entre comillas. Seleccionaremos todos los tipos de eventos y agruparemos los resultados para que podamos obtener el recuento de cada evento. La consulta quedaría como se muestra a continuación:
Paso 5: Una vez escrita la consulta SQL, haga clic en la marca de verificación verde en el lado derecho de la ventana para abrir el validador de consultas. Una marca de verificación verde significa que la consulta es válida y mostrará la cantidad estimada de datos que la consulta procesará cuando la ejecute. Si la consulta no es válida, se muestra un icono de signo de exclamación rojo. Puede hacer clic en él y obtener orientación sobre cómo corregir el problema.
Paso 6: luego haga clic en el botón Ejecutar y BigQuery se pone a trabajar. Una vez completada la ejecución de la consulta, el servicio de consulta muestra los resultados como una tabla en la interfaz de usuario web. Puede ver que la columna Tipo de evento tiene eventos de tres puntos realizados y de tres puntos fallidos.
Paso 7: ahora podemos escribir una nueva consulta que seleccione el número de camiseta para cada evento jugada por jugada y luego use la columna Tipos de eventos para determinar la precisión de los tiros de campo de tres puntos para cada número de camiseta. Haga clic en Ejecutar y luego, en menos de un segundo, tenemos la respuesta.
Entonces, según BigQuery, el número 45 mete el porcentaje más alto de sus intentos de triples.
Nota: Podemos ver que la tabla que consultamos tiene tres gigabytes de datos. Pero BigQuery solo leyó las columnas necesarias y, por lo tanto, solo procesó 78 megabytes de datos.
Publicación traducida automáticamente
Artículo escrito por ddeevviissaavviittaa y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA