Christelle Reynes, Leslie Regad, Robert Sabatier y Anne-Claude Camproux
La predicción de motivos estructurales particulares asociados a funciones biológicas o a la estructura es de suma importancia. Dada la creciente disponibilidad de secuencias primarias sin ninguna información estructural, las predicciones a partir de secuencias de aminoácidos (AA) son esenciales. El método de predicción de motivos estructurales propuesto es un enfoque de dos pasos basado en un alfabeto estructural. Este alfabeto permite codificar cualquier estructura 3D en una secuencia 1D de letras estructurales (SL). Primero, se aprenden las reglas básicas de correspondencia entre AA y SL mediante programación genética. Luego, se aprende un modelo oculto de Markov para cada motivo de interés identificado previamente. Finalmente, se proporciona una probabilidad de correspondencia con un motivo 3D dado para cualquier secuencia de aminoácidos dada. El método se aplica en sitios de unión de ATP para comparar la eficiencia de nuestro método con otros para una función clásica. Luego, se ilustra la capacidad del método para aprender motivos correspondientes a funciones predichas con menor frecuencia o a otros tipos de motivos.