TWINT es una herramienta avanzada de raspado de Twitter escrita en Python que permite raspar Tweets de los perfiles de Twitter sin usar la API de Twitter.
Twint utiliza los operadores de búsqueda de Twitter para permitirle recopilar tuits de usuarios específicos, recopilar tuits relacionados con ciertos temas, hashtags y tendencias, u ordenar información confidencial de tuits como correo electrónico y números de teléfono móvil. Es muy útil para recopilar información.
Beneficios:
Beneficios de usar Twint vs API de Twitter :
- Twint puede obtener casi todos los Tweets, mientras que la API de Twitter se limita a los últimos 3200 Tweets únicamente.
- Twint tiene una configuración inicial rápida.
- Se puede usar de forma anónima y sin registrarse ni iniciar sesión en Twitter.
- Sin limitaciones de tarifa.
Requisitos: Python 3.6
Cómo usar Twint en la consola Google Could.
Paso 1: inicie sesión en Google Cloud Console con cualquiera de sus cuentas de Google y haga clic en el icono que se muestra a continuación.
(Esto en realidad está iniciando Google Cloud Console y brindándole acceso a una máquina donde puede usar » Twint «)
Nota: Si no está utilizando la consola en la nube de Google, necesita algunas cosas instaladas antes de comenzar a usar «Twint». Esas cosas se pueden instalar usando los siguientes comandos:
- apt instalar git
- apt instalar python3
- apt instalar python3-pip
Paso 2: cuando se cumplan los requisitos anteriores, ejecute los siguientes comandos en la consola para comenzar:
- clon de git –profundidad=1 https://github.com/twintproject/twint.git
- cd gemelo
- instalar pip3. -r requisitos.txt
- pip3 instalar gemelo
Paso 3: Ahora estamos listos para usarlo, así que usemos el siguiente comando para ver qué ofrece esta herramienta.
gemelo -h
Paso 4: Ahora, usemos esta herramienta en un usuario, digamos networkchuck para sus últimos 20 tweets.
twint -u networkchuck –límite 20
Nota: Ahora lo que esta herramienta está haciendo es eso,
- No está usando api.
- No es necesario iniciar sesión en Twitter.
- Simplemente raspa twitter y es muy poderoso.
Paso 5: ahora suponga que desea buscar tweets en los que se usó una palabra clave específica, digamos «raspberry pi», usaremos -s para buscar tweets de palabras clave específicas.
twint -u networkchuck -s “raspberry pi”
Paso 6: Ahora, suponga que desea guardar los tweets en un archivo, digamos rightnow.json, porque este comando será,
twint -u networkchuck -s “ahora mismo” -o ahora mismo.json–json
nano rightnow.json-json
Hay varias cosas que puede hacer con esta herramienta para recopilar información, por lo que a continuación se proporcionan algunos ejemplos para ayudarlo a comprender los conceptos básicos:
Dominio | Descripción |
---|---|
twint -u nombre de usuario | Extrae todos los tweets de la línea de tiempo del usuario. |
twint -u nombre de usuario -s piña | Extrae todos los tweets de la línea de tiempo del usuario que contienen piña. |
twint -s piña | Recopila todos los tweets que contienen piña de los tweets de todos. |
twint -u nombre de usuario –el año 2014 | Recopila los Tweets que se tuitearon antes de 2014. |
twint -u nombre de usuario –desde 2015-12-20 | Recopila los Tweets que se tuitearon desde el 20-12-2015. |
twint -u nombre de usuario –seguidores | Raspa los seguidores de un usuario de Twitter |
twint -u nombre de usuario –siguiente | Raspa a quién sigue un usuario de Twitter. |
twint -u nombre de usuario –favoritos | Recopila todos los Tweets que un usuario ha marcado como favoritos. |
twint -u nombre de usuario -o archivo.txt | Extrae tweets y los guarda en file.txt. |
twint -u nombre de usuario -o archivo.csv –csv | Extrae tweets y los guarda como un archivo CSV. |
twint -u nombre de usuario –correo electrónico –teléfono | Muestra Tweets que pueden tener números de teléfono o direcciones de correo electrónico. |
twint -s “Donald Trump” –verificado | Muestra los tweets de usuarios verificados que twittearon sobre Donald Trump. |
Para los investigadores de inteligencia de código abierto, Twitter es una base de datos gigante y rica llena de información que cualquiera puede usar, y con una herramienta poderosa como twint que discutimos anteriormente, donde una persona puede recopilar información sobre otra simplemente raspando sus tweets.
Publicación traducida automáticamente
Artículo escrito por mtalhahussain y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA