Extrae tweets usando GetOldTweets3

Para la mayoría de los proyectos de clasificación o minería de texto, la extracción de tweets es uno de los pasos iniciales más importantes. El método conocido es extraer tweets con tweepy y crear una cuenta de desarrollador en twitter. Debido a ciertas razones de seguridad, Twitter tarda casi 15 días en verificar el proceso de creación de una cuenta de desarrollador. Por lo tanto, usar esta biblioteca de python facilita el proceso. Otra ventaja de usar esta biblioteca es que los tweets son tweets bastante recientes. Uno puede obtener tweets de meses o incluso semanas anteriores.

Entendamos mejor el funcionamiento con un código: 

  • Instalación de la biblioteca GetOldTweets3: el siguiente comando se puede instalar en un Jupyter Notebook o en cualquier símbolo del sistema.
pip install GetOldTweets3

  • Especifique el hashtag necesario: después de instalar la biblioteca, se importará con otra variable. Con el método incorporado TweetCriteria() se pueden mencionar las especificaciones necesarias en nuestro conjunto de datos de tweets. El método setQuerySearch() permite obtener cualquier tweet con respecto a nuestro hashtag
import GetOldTweets3 as got

    gettweet = got.manager.TweetCriteria().setQuerySearch(hashtag) \ 
    #'\' is similar to ', in a sentence' i.e 
    used to separate

  • Se pueden agregar más especificaciones. Hay muchos
.setSince("2020-01-01") \
.setUntil("2020-05-01") \
.setMaxTweets(100)\
.setLocation("Pune")\
.setUsername("Raj")\...etc.

Veamos el código completo

Python3

import GetOldTweets3 as got
  
def extract_tweets(hashtag):
      
    gettweet= got.manager.TweetCriteria().setQuerySearch(hashtag) \
        .setSince("2020-01-01") \
        .setUntil("2020-05-01") \
        .setMaxTweets(100)
      
    # Creation of list that contains all tweets
    tweets = got.manager.TweetManager.getTweets(gettweet)
      
    # Creating list of chosen tweet data
    text_tweets = [[tweet.text] for tweet in tweets]
    print(text_tweets)
  
# calling the function
extract_tweets('COVID19')

Producción:

GfG-GetOldTweets3

Algunos tweets están en diferentes idiomas. Se puede usar la función traductor() de Python para convertir esos tweets en un idioma distinto.

Publicación traducida automáticamente

Artículo escrito por tedious_wings y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *