El NCBI proporciona un sistema de búsqueda en línea llamado Entrez. Esto proporciona acceso a una amplia gama de bases de datos de biología molecular y también proporciona un sistema de consulta global integrado que admite los operadores booleanos y la búsqueda de campo. Los resultados se devuelven desde todas las bases de datos que contienen información como el número de visitas, enlaces a la base de datos de origen, etc. de cada base de datos.
Biopython tiene un módulo específico de Entrez llamado Bio.Entrez para este propósito. El módulo de Entrez recopila la información del archivo XML devuelto por el sistema de búsqueda de Entrez y lo muestra como diccionario y listas de python. Los pasos para conectar la base de datos se enumeran a continuación:
Acercarse
- Importe los módulos requeridos.
- Configure el correo electrónico para identificar quién está conectado.
- Configure el parámetro de la herramienta Entrez, es Biopython por defecto.
- Llame al método einfo() para obtener información sobre cada base de datos.
- Lea la información proporcionada por el método einfo() .
- Los datos así obtenidos están en formato XML, por lo que para obtener estos datos en el objeto python se utiliza el método read()
- Ahora el registro está en formato de diccionario y tiene una sola clave.
- Al acceder a la clave DbList , se devuelve una lista de bases de datos.
El programa resultante debería parecerse al código que se muestra a continuación:
Python3
# Import libraries from Bio import Entrez # Setting email Entrez.email = 'jeetesh1@yopmail.com' # Setting Entrez tool parameter Entrez.tool = 'Demoscript' # Gathering information info = Entrez.einfo() # Reading Info as XML #data = info.read() # Parsing info as python object record = Entrez.read(info) # Getting record key record.keys() # Parsing records record[u'DbList']
Producción:
Publicación traducida automáticamente
Artículo escrito por jeeteshgavande30 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA