Shiva Kumar, Vijaykumar Ghadage, Indhupriya Subramanian, Aarti Desai, Vivek K Singh y Abhay Jere
Antecedentes: El objetivo principal de la investigación en ciencias biológicas es comprender los mecanismos celulares complejos y la interacción de diversos genes y proteínas en múltiples procesos celulares. Para ello, PubMed sigue siendo la principal fuente de información biomédica, aunque existen otras bases de datos como UniProt, Protein Data Bank (PDB) y Reactome.
Objetivo: Con la gran cantidad de datos disponibles provenientes de tecnologías de alto rendimiento y múltiples bases de datos, encontrar información relevante para genes, procesos y fenotipos se ha vuelto extremadamente desafiante y tedioso. Actualmente, no hay ninguna herramienta disponible para buscar simultáneamente en PubMed y en múltiples otras bases de datos para obtener información integral. Además, una búsqueda típica en PubMed devuelve una gran cantidad de artículos, que deben examinarse manualmente para identificar la literatura relevante. Por lo tanto, desarrollamos BioGyan, una herramienta de minería de literatura para simplificar la búsqueda combinatoria de genes, tipos de células y procesos celulares en PubMed y otras bases de datos relevantes.
Métodos: BioGyan utiliza un método de puntuación sólido para clasificar los artículos relevantes a los términos de búsqueda de los usuarios. El método de puntuación se basa en la suma ponderada de la coocurrencia de términos de genes, procesos e interacciones en un resumen.
Resultados: BioGyan recupera artículos de PubMed que respaldan la asociación entre genes y procesos consultados, vías relevantes de bases de datos de vías y estructuras tridimensionales de PDB. Para facilitar la visualización, toda la información está disponible para el usuario en una sola ventana. BioGyan mostró una precisión del 85,46 % en la predicción de la relevancia de los artículos para una asociación entre genes y procesos, y tuvo un mejor desempeño que PESCADOR.
Conclusión: BioGyan tiene varias características clave, como la consulta por lotes de genes y procesos, la lectura de artículos sin conexión, la exportación de listas de artículos como bibliografía y la flexibilidad para que el usuario revise la relevancia de los artículos, lo que lo convierte en una herramienta vital para la búsqueda bibliográfica. Por lo tanto, BioGyan es una herramienta única que ofrece una búsqueda integral en múltiples bases de datos y, al mismo tiempo, automatiza en gran medida todo el proceso.