Hay muchas características de los datos biológicos. Todas estas características hacen que el manejo de la información biológica sea un problema particularmente desafiante. Aquí principalmente nos centraremos en las características de la información biológica y el campo multidisciplinario llamado bioinformática. La bioinformática, en la actualidad, ha surgido con programas de posgrado en varias universidades.
Características de la información biológica:
- Hay una gran cantidad y rango de variabilidad en los datos.
Debe haber una flexibilidad en los sistemas biológicos para que pueda manejar tipos de datos y valores. La imposición de restricciones a los tipos de datos debe limitarse a una gama tan amplia de valores de datos posibles. Puede haber una pérdida de información cuando hay exclusión de dichos valores. - Habrá una diferencia en la representación de los mismos datos por diferentes biólogos.
Esto se puede hacer incluso usando el mismo sistema. Hay múltiples formas de modelar cualquier entidad dada y los resultados a menudo reflejan el enfoque particular del científico.
Debe haber una vinculación de elementos de datos en una red de esquemas. - Definiendo las consultas complejas y también importantes para los biólogos.
Las consultas complejas deben estar respaldadas por sistemas biológicos. El conocimiento de la estructura de datos es necesario para los usuarios promedio porque con la ayuda de este conocimiento, el usuario promedio puede construir una consulta compleja a través de conjuntos de datos por su cuenta. Para ello los sistemas deben proporcionar algunas herramientas para la construcción de estas consultas. - Cuando se compara con la mayoría de los otros dominios o aplicaciones, los datos biológicos se vuelven muy complejos.
Dichos datos deben garantizar que no se pierda información durante el modelado de datos biológicos y dichos datos deben poder representar una subestructura compleja de datos, así como relaciones. La estructura de los datos biológicos proporciona un contexto adicional para la interpretación de la información. - Hay un cambio rápido en los esquemas de las bases de datos biológicas.
Debería haber un soporte de evolución de esquemas y migración de objetos de datos para que pueda haber un flujo de información mejorado entre generaciones o versiones de bases de datos.
Los sistemas de bases de datos relacionales admiten la capacidad de ampliar el esquema y una ocurrencia frecuente en el entorno biológico. - Es poco probable que la mayoría de los biólogos conozcan la estructura interna de la base de datos o el diseño del esquema.
Los usuarios necesitan una información que se pueda mostrar de manera que pueda ser aplicable al problema que están tratando de abordar. Además, la estructura de datos debe reflejarse de una manera fácil y comprensible. No se proporciona al usuario información sobre el significado del esquema debido a la falla de los esquemas relacionales. Las interfaces web proporcionan una interfaz de búsqueda actual, que puede limitar el acceso a la base de datos. - No hay necesidad de acceso de escritura a la base de datos por parte de los usuarios de datos biológicos, sino que solo requieren acceso de lectura.
Existe una limitación de acceso de escritura a los usuarios privilegiados llamados curadores. Solo hay un pequeño número de usuarios que requieren acceso de escritura, pero los usuarios generan una amplia variedad de patrones de acceso de lectura en las bases de datos. - Los usuarios de datos biológicos requieren el acceso a los valores «antiguos» de los datos con mayor frecuencia mientras verifican los resultados informados anteriormente.
Por lo tanto, el sistema de archivos debe admitir los cambios en los valores de los datos en la base de datos. El acceso tanto a la versión más reciente del valor de los datos como a su versión anterior son importantes en el dominio biológico. - El contexto de los datos da un significado adicional para su uso en aplicaciones biológicas.
Siempre que sea apropiado, se debe mantener el contexto y transmitirlo al usuario. Para maximizar la interpretación de un valor de datos biológicos, debería ser posible integrar tantos contextos como sea posible.