Como sabemos, Python es un lenguaje adecuado para guionistas y desarrolladores. Escribamos un script para Voice Assistant usando Python. La consulta para el asistente se puede manipular según la necesidad del usuario.
El reconocimiento de voz es el proceso de convertir audio en texto. Esto se usa comúnmente en asistentes de voz como Alexa, Siri, etc. Python proporciona una API llamada SpeechRecognition que nos permite convertir audio en texto para su posterior procesamiento. En este artículo, veremos cómo convertir archivos de audio grandes o largos en texto usando la API SpeechRecognition en python.
Módulos necesarios
- Subproceso: este módulo se usa para obtener detalles del subproceso del sistema que se usan en varios comandos, es decir, Apagar, Suspender, etc. Este módulo viene integrado con Python.
- WolframAlpha: se utiliza para calcular respuestas de nivel experto utilizando los algoritmos, la base de conocimientos y la tecnología de IA de Wolfram. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install wolframalpha
- Pyttsx3: – Este módulo se utiliza para la conversión de texto a voz en un programa que funciona sin conexión. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip instalar pyttsx3
- Tkinter: – Este módulo se usa para construir GUI y viene integrado con Python. Este módulo viene integrado con Python.
- Wikipedia: como todos sabemos, Wikipedia es una gran fuente de conocimiento, al igual que GeeksforGeeks, hemos utilizado el módulo de Wikipedia para obtener información de Wikipedia o para realizar una búsqueda en Wikipedia. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install wikipedia
- Reconocimiento de voz: dado que estamos creando una aplicación de asistente de voz, una de las cosas más importantes es que su asistente reconozca su voz (significa lo que quiere decir/preguntar). Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install SpeechRecognition
- Navegador web:- Para realizar una búsqueda web. Este módulo viene integrado con Python.
- Ecapture: – Para capturar imágenes desde su cámara. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install ecapture
- Pyjokes: Pyjokes se utiliza para recopilar chistes de Python a través de Internet. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip instalar pyjokes
- Fecha y hora : la fecha y la hora se utilizan para mostrar la fecha y la hora. Este módulo viene integrado con Python.
- Twilio: – Twilio se usa para hacer llamadas y mensajes. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install twilio
- Requests: Requests se utiliza para realizar requests GET y POST. Para instalar este módulo, escriba el siguiente comando en la terminal.
requests de instalación de pip
- BeautifulSoup: Beautiful Soup es una biblioteca que facilita extraer información de las páginas web. Para instalar este módulo, escriba el siguiente comando en la terminal.
pip install beautifulsoup4
Nota: puede eliminar algunos de los archivos de importación si no desea obtener esa función como aquí Twilio para hacer llamadas y mensajes si no desea usar eso, simplemente puede eliminar esa función.
Implementación
Importe las siguientes bibliotecas.
Python3
import subprocess import wolframalpha import pyttsx3 import tkinter import json import random import operator import speech_recognition as sr import datetime import wikipedia import webbrowser import os import winshell import pyjokes import feedparser import smtplib import ctypes import time import requests import shutil from twilio.rest import Client from clint.textui import progress from ecapture import ecapture as ec from bs4 import BeautifulSoup import win32com.client as wincl from urllib.request import urlopen
Ahora configuraremos nuestro motor en Pyttsx3, que se usa para texto a voz en Python y sapi5 es una interfaz de plataforma de aplicación de voz de Microsoft que usaremos para la función de texto a voz.
Python3
engine = pyttsx3.init('sapi5') voices = engine.getProperty('voices') engine.setProperty('voice', voices[1].id)
Puede cambiar la identificación de voz a «0» para la voz masculina mientras usa el asistente aquí estamos usando una voz femenina para todo el texto a voz
Python3
def speak(audio): engine.say(audio) engine.runAndWait() def wishMe(): hour = int(datetime.datetime.now().hour) if hour>= 0 and hour<12: speak("Good Morning Sir !") elif hour>= 12 and hour<18: speak("Good Afternoon Sir !") else: speak("Good Evening Sir !") assname =("Jarvis 1 point o") speak("I am your Assistant") speak(assname) def username(): speak("What should i call you sir") uname = takeCommand() speak("Welcome Mister") speak(uname) columns = shutil.get_terminal_size().columns print("#####################".center(columns)) print("Welcome Mr.", uname.center(columns)) print("#####################".center(columns)) speak("How can i Help you, Sir") def takeCommand(): r = sr.Recognizer() with sr.Microphone() as source: print("Listening...") r.pause_threshold = 1 audio = r.listen(source) try: print("Recognizing...") query = r.recognize_google(audio, language ='en-in') print(f"User said: {query}\n") except Exception as e: print(e) print("Unable to Recognize your voice.") return "None" return query def sendEmail(to, content): server = smtplib.SMTP('smtp.gmail.com', 587) server.ehlo() server.starttls() # Enable low security in gmail server.login('your email id', 'your email password') server.sendmail('your email id', to, content) server.close()
La función principal comienza aquí, ahora llamaremos a todas estas funciones en la función principal.
Python3
if __name__ == '__main__': clear = lambda: os.system('cls') # This Function will clean any # command before execution of this python file clear() wishMe() username() while True: query = takeCommand().lower() # All the commands said by user will be # stored here in 'query' and will be # converted to lower case for easily # recognition of command if 'wikipedia' in query: speak('Searching Wikipedia...') query = query.replace("wikipedia", "") results = wikipedia.summary(query, sentences = 3) speak("According to Wikipedia") print(results) speak(results) elif 'open youtube' in query: speak("Here you go to Youtube\n") webbrowser.open("youtube.com") elif 'open google' in query: speak("Here you go to Google\n") webbrowser.open("google.com") elif 'open stackoverflow' in query: speak("Here you go to Stack Over flow.Happy coding") webbrowser.open("stackoverflow.com") elif 'play music' in query or "play song" in query: speak("Here you go with music") # music_dir = "G:\\Song" music_dir = "C:\\Users\\GAURAV\\Music" songs = os.listdir(music_dir) print(songs) random = os.startfile(os.path.join(music_dir, songs[1])) elif 'the time' in query: strTime = datetime.datetime.now().strftime("% H:% M:% S") speak(f"Sir, the time is {strTime}") elif 'open opera' in query: codePath = r"C:\\Users\\GAURAV\\AppData\\Local\\Programs\\Opera\\launcher.exe" os.startfile(codePath) elif 'email to gaurav' in query: try: speak("What should I say?") content = takeCommand() to = "Receiver email address" sendEmail(to, content) speak("Email has been sent !") except Exception as e: print(e) speak("I am not able to send this email") elif 'send a mail' in query: try: speak("What should I say?") content = takeCommand() speak("whome should i send") to = input() sendEmail(to, content) speak("Email has been sent !") except Exception as e: print(e) speak("I am not able to send this email") elif 'how are you' in query: speak("I am fine, Thank you") speak("How are you, Sir") elif 'fine' in query or "good" in query: speak("It's good to know that your fine") elif "change my name to" in query: query = query.replace("change my name to", "") assname = query elif "change name" in query: speak("What would you like to call me, Sir ") assname = takeCommand() speak("Thanks for naming me") elif "what's your name" in query or "What is your name" in query: speak("My friends call me") speak(assname) print("My friends call me", assname) elif 'exit' in query: speak("Thanks for giving me your time") exit() elif "who made you" in query or "who created you" in query: speak("I have been created by Gaurav.") elif 'joke' in query: speak(pyjokes.get_joke()) elif "calculate" in query: app_id = "Wolframalpha api id" client = wolframalpha.Client(app_id) indx = query.lower().split().index('calculate') query = query.split()[indx + 1:] res = client.query(' '.join(query)) answer = next(res.results).text print("The answer is " + answer) speak("The answer is " + answer) elif 'search' in query or 'play' in query: query = query.replace("search", "") query = query.replace("play", "") webbrowser.open(query) elif "who i am" in query: speak("If you talk then definitely your human.") elif "why you came to world" in query: speak("Thanks to Gaurav. further It's a secret") elif 'power point presentation' in query: speak("opening Power Point presentation") power = r"C:\\Users\\GAURAV\\Desktop\\Minor Project\\Presentation\\Voice Assistant.pptx" os.startfile(power) elif 'is love' in query: speak("It is 7th sense that destroy all other senses") elif "who are you" in query: speak("I am your virtual assistant created by Gaurav") elif 'reason for you' in query: speak("I was created as a Minor project by Mister Gaurav ") elif 'change background' in query: ctypes.windll.user32.SystemParametersInfoW(20, 0, "Location of wallpaper", 0) speak("Background changed successfully") elif 'open bluestack' in query: appli = r"C:\\ProgramData\\BlueStacks\\Client\\Bluestacks.exe" os.startfile(appli) elif 'news' in query: try: jsonObj = urlopen('''https://newsapi.org / v1 / articles?source = the-times-of-india&sortBy = top&apiKey =\\times of India Api key\\''') data = json.load(jsonObj) i = 1 speak('here are some top news from the times of india') print('''=============== TIMES OF INDIA ============'''+ '\n') for item in data['articles']: print(str(i) + '. ' + item['title'] + '\n') print(item['description'] + '\n') speak(str(i) + '. ' + item['title'] + '\n') i += 1 except Exception as e: print(str(e)) elif 'lock window' in query: speak("locking the device") ctypes.windll.user32.LockWorkStation() elif 'shutdown system' in query: speak("Hold On a Sec ! Your system is on its way to shut down") subprocess.call('shutdown / p /f') elif 'empty recycle bin' in query: winshell.recycle_bin().empty(confirm = False, show_progress = False, sound = True) speak("Recycle Bin Recycled") elif "don't listen" in query or "stop listening" in query: speak("for how much time you want to stop jarvis from listening commands") a = int(takeCommand()) time.sleep(a) print(a) elif "where is" in query: query = query.replace("where is", "") location = query speak("User asked to Locate") speak(location) webbrowser.open("https://www.google.nl / maps / place/" + location + "") elif "camera" in query or "take a photo" in query: ec.capture(0, "Jarvis Camera ", "img.jpg") elif "restart" in query: subprocess.call(["shutdown", "/r"]) elif "hibernate" in query or "sleep" in query: speak("Hibernating") subprocess.call("shutdown / h") elif "log off" in query or "sign out" in query: speak("Make sure all the application are closed before sign-out") time.sleep(5) subprocess.call(["shutdown", "/l"]) elif "write a note" in query: speak("What should i write, sir") note = takeCommand() file = open('jarvis.txt', 'w') speak("Sir, Should i include date and time") snfm = takeCommand() if 'yes' in snfm or 'sure' in snfm: strTime = datetime.datetime.now().strftime("% H:% M:% S") file.write(strTime) file.write(" :- ") file.write(note) else: file.write(note) elif "show note" in query: speak("Showing Notes") file = open("jarvis.txt", "r") print(file.read()) speak(file.read(6)) elif "update assistant" in query: speak("After downloading file please replace this file with the downloaded one") url = '# url after uploading file' r = requests.get(url, stream = True) with open("Voice.py", "wb") as Pypdf: total_length = int(r.headers.get('content-length')) for ch in progress.bar(r.iter_content(chunk_size = 2391975), expected_size =(total_length / 1024) + 1): if ch: Pypdf.write(ch) # NPPR9-FWDCX-D2C8J-H872K-2YT43 elif "jarvis" in query: wishMe() speak("Jarvis 1 point o in your service Mister") speak(assname) elif "weather" in query: # Google Open weather website # to get API of Open weather api_key = "Api key" base_url = "http://api.openweathermap.org / data / 2.5 / weather?" speak(" City name ") print("City name : ") city_name = takeCommand() complete_url = base_url + "appid =" + api_key + "&q =" + city_name response = requests.get(complete_url) x = response.json() if x["code"] != "404": y = x["main"] current_temperature = y["temp"] current_pressure = y["pressure"] current_humidiy = y["humidity"] z = x["weather"] weather_description = z[0]["description"] print(" Temperature (in kelvin unit) = " +str(current_temperature)+"\n atmospheric pressure (in hPa unit) ="+str(current_pressure) +"\n humidity (in percentage) = " +str(current_humidiy) +"\n description = " +str(weather_description)) else: speak(" City Not Found ") elif "send message " in query: # You need to create an account on Twilio to use this service account_sid = 'Account Sid key' auth_token = 'Auth token' client = Client(account_sid, auth_token) message = client.messages \ .create( body = takeCommand(), from_='Sender No', to ='Receiver No' ) print(message.sid) elif "wikipedia" in query: webbrowser.open("wikipedia.com") elif "Good Morning" in query: speak("A warm" +query) speak("How are you Mister") speak(assname) # most asked question from google Assistant elif "will you be my gf" in query or "will you be my bf" in query: speak("I'm not sure about, may be you should give me some time") elif "how are you" in query: speak("I'm fine, glad you me that") elif "i love you" in query: speak("It's hard to understand") elif "what is" in query or "who is" in query: # Use the same API key # that we have generated earlier client = wolframalpha.Client("API_ID") res = client.query(query) try: print (next(res.results).text) speak (next(res.results).text) except StopIteration: print ("No results") # elif "" in query: # Command go here # For adding more commands
Producción:
Escuchando…
Reconociendo…
El usuario dijo: Gaurav
####################
Bienvenido Sr. Gaurav
################# ####
Escuchando…
Reconociendo…
El usuario dijo: sí
(‘Como saben muy bien los estudiantes de historia entre ustedes aquí hoy, cuando las personas en el poder inventan sus propios hechos y atacan a quienes los cuestionan, puede marcar el principio del fin de una sociedad libre. Eso no es una hipérbole. Es lo que han hecho los regímenes autoritarios a lo largo de la historia. Intentan controlar la realidad. No solo nuestras leyes y nuestros derechos y nuestros presupuestos, sino nuestros pensamientos y creencias.’, ‘Hillary Clinton’)
Escuchando…
Reconociendo…
El usuario dijo: Gaurav en Wikipedia
Gaurav es un nombre masculino indio y nepalí. El nombre literalmente significa orgullo.
== Personas notables llamadas Gaurav ==
Gaurav S Bajaj, actor de televisión indio
Gaurav Bhatt, director de música indio, cantante y compositor.
Escuchando…
Reconociendo…
El usuario dijo: abre YouTube
Escuchando…
Reconociendo…
Incapaz de reconocer tu voz.
Escuchando…
Reconociendo…
El usuario dijo: salir
Publicación traducida automáticamente
Artículo escrito por ggauravkkumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA