Semih Cantürk, Aman Singh, Jason Behrmann, Patrick St-Amant*
La integración de métodos de aprendizaje automático en la bioinformática ofrece beneficios particulares a la hora de identificar cómo las terapias eficaces en un contexto podrían tener utilidad en un contexto clínico desconocido o contra una patología novedosa. Nuestro objetivo es descubrir las asociaciones subyacentes entre las proteínas virales y las terapias antivirales que son eficaces contra ellas empleando modelos de redes neuronales. Utilizando la base de datos de proteínas virales del Centro Nacional de Información Biotecnológica y la base de datos de virus farmacológicos, que proporciona un informe completo de agentes antivirales de amplio espectro (BSAA) y los virus que inhiben, entrenamos modelos de ANN con secuencias de proteínas virales como entradas y agentes antivirales considerados seguros en humanos como salidas. El entrenamiento del modelo excluyó las proteínas del SARS-CoV-2 e incluyó solo las fases II, III, IV y los medicamentos de nivel aprobado. El uso de secuencias para el SARS-CoV-2 (el coronavirus que causa la COVID-19) como entradas para los modelos entrenados produce salidas de candidatos antivirales tentativos seguros en humanos para el tratamiento de la COVID-19. Nuestros resultados sugieren múltiples candidatos a fármacos, algunos de los cuales complementan los hallazgos recientes de estudios clínicos notables. Nuestro enfoque in silico para la reutilización de fármacos es prometedor en la identificación de nuevos fármacos candidatos y tratamientos para otras infecciones virales, bacterianas y parasitarias.