Para la mayoría de los proyectos de clasificación o minería de texto, la extracción de tweets es uno de los pasos iniciales más importantes. El método conocido es extraer tweets con tweepy y crear una cuenta de desarrollador en twitter. Debido a ciertas razones de seguridad, Twitter tarda casi 15 días en verificar el proceso de creación de una cuenta de desarrollador. Por lo tanto, usar esta biblioteca de python facilita el proceso. Otra ventaja de usar esta biblioteca es que los tweets son tweets bastante recientes. Uno puede obtener tweets de meses o incluso semanas anteriores.
Entendamos mejor el funcionamiento con un código:
- Instalación de la biblioteca GetOldTweets3: el siguiente comando se puede instalar en un Jupyter Notebook o en cualquier símbolo del sistema.
pip install GetOldTweets3
- Especifique el hashtag necesario: después de instalar la biblioteca, se importará con otra variable. Con el método incorporado TweetCriteria() se pueden mencionar las especificaciones necesarias en nuestro conjunto de datos de tweets. El método setQuerySearch() permite obtener cualquier tweet con respecto a nuestro hashtag
import GetOldTweets3 as got gettweet = got.manager.TweetCriteria().setQuerySearch(hashtag) \ #'\' is similar to ', in a sentence' i.e used to separate
- Se pueden agregar más especificaciones. Hay muchos
.setSince("2020-01-01") \ .setUntil("2020-05-01") \ .setMaxTweets(100)\ .setLocation("Pune")\ .setUsername("Raj")\...etc.
Veamos el código completo
Python3
import GetOldTweets3 as got def extract_tweets(hashtag): gettweet= got.manager.TweetCriteria().setQuerySearch(hashtag) \ .setSince("2020-01-01") \ .setUntil("2020-05-01") \ .setMaxTweets(100) # Creation of list that contains all tweets tweets = got.manager.TweetManager.getTweets(gettweet) # Creating list of chosen tweet data text_tweets = [[tweet.text] for tweet in tweets] print(text_tweets) # calling the function extract_tweets('COVID19')
Producción:
Algunos tweets están en diferentes idiomas. Se puede usar la función traductor() de Python para convertir esos tweets en un idioma distinto.
Publicación traducida automáticamente
Artículo escrito por tedious_wings y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA