Ahmad Maleki*, Vahid Vaezinia y Ayda Fekri
El promotor es una parte de la secuencia de ADN que precede al gen y es clave como regulador de los genes. La predicción del promotor ayuda a determinar la posición del gen y a analizar la expresión génica. Por lo tanto, es de gran importancia en el campo de la bioinformática. En la investigación bioinformática, se aplican varios enfoques de aprendizaje automático para descubrir nuevos conocimientos significativos a partir de bases de datos biológicas. En este estudio, se utilizan dos enfoques de aprendizaje, el agrupamiento por maximización de expectativas y el clasificador de máquinas de vectores de soporte (EMSVM) para realizar la detección del promotor. El algoritmo de maximización de expectativas (EM) se utiliza para identificar grupos de muestras que se comportan de manera similar y diferente, como la actividad de los promotores y no promotores en la primera etapa, mientras que la máquina de vectores de soporte (SVM) se utiliza en la segunda etapa para clasificar todos los datos en la categoría de clase correcta. Hemos aplicado este método a conjuntos de datos correspondientes a los promotores σ24, σ32, σ38, σ70 y se demostró su eficacia en una variedad de regiones promotoras diferentes. Además, se comparó con otros algoritmos de clasificación para indicar el rendimiento adecuado del algoritmo propuesto. Los resultados de las pruebas muestran que EMSVM funciona mejor que otros métodos.