twitter-text-python
es un analizador y formateador de Tweets para Python. Entre muchas cosas, las tareas que puede realizar este módulo son:
- respuesta: el nombre de usuario del identificador al que se responde el tweet.
- usuarios: Todos los nombres de usuario mencionados en el tweet.
- tags: Todos los hashtags mencionados en el tweet.
- urls: Todas las URLs mencionadas en el tweet.
- html: agrega hipervínculos a los campos mencionados anteriormente.
Ejemplo 1 :
# import the twitter-text-python module from ttp import ttp # the text to be parsed tweet_text = ("@twitter Sample tweet containing different components." + "# gfg # tweeple Visit : https://twitter.com @TwitterIndia") # instantiating the Parser p = ttp.Parser() # parsing the text result = p.parse(tweet_text) # printing the username of the # account being replied to print("The username being replied to is : " + result.reply) # printing all the usernames # mentioned in the tweet print("\nAll the usernames mentioned are : " + str(result.users)) # printing all the hashtags # mentioned in the tweet print("\nAll the hashtags mentioned are : " + str(result.tags)) # printing all the URLs # mentioned in the tweet print("\nAll the URLs mentioned are : " + str(result.urls)) # adding hyperlinks to usernames, # hashtags and URLs print(result.html)
Producción :
El nombre de usuario al que se responde es: twitter
Todos los nombres de usuario mencionados son: [‘twitter’, ‘TwitterIndia’]
Todos los hashtags mencionados son: [‘gfg’, ‘tweeple’]
Todas las URL mencionadas son: [‘https://twitter.com’]
@twitter Ejemplo de tweet que contiene diferentes componentes. #gfg #tweeple Visite: https://twitter.com @TwitterIndia
Ejemplo 2: también podemos encontrar la posición de la string (POS) haciendo include_spans = True
.
# import the twitter-text-python module from ttp import ttp # the text to be parsed tweet_text = ("@twitter Sample tweet containing different components." + "# gfg # tweeple Visit : https://twitter.com @TwitterIndia") # instantiating the Parser # with spans p = ttp.Parser(include_spans = True) # parsing the text result = p.parse(tweet_text) # printing all the usernames # mentioned in the tweet with POS print("All the usernames mentioned are : " + str(result.users)) # printing all the hashtags # mentioned in the tweet with POS print("\nAll the hashtags mentioned are : " + str(result.tags)) # printing all the URLs # mentioned in the tweet with POS print("\nAll the URLs mentioned are : " + str(result.urls))
Producción :
Todos los nombres de usuario mencionados son: [(‘twitter’, (0, 8)), (‘TwitterIndia’, (130, 143))]
Todos los hashtags mencionados son: [(‘gfg’, (96, 100)), (‘tweeple’, (101, 109))]
Todas las URL mencionadas son: [(‘https://twitter.com’, (76, 95))]