Bolshoy A, Salih B, Cohen I y Tatarinova T
Todavía es una pregunta abierta cómo las variaciones de longitudes de genes (algunos genes se vuelven más largos que sus predecesores, mientras que otros genes se acortan y los tamaños de estas facciones son aleatoriamente diferentes de un organismo a otro) dependen de la evolución y adaptación de los organismos. Proponemos clasificar los genomas según las longitudes de sus genes y luego encontrar la asociación entre la clasificación del genoma y varias propiedades, como la temperatura de crecimiento, la composición de nucleótidos y la patogenicidad. Este enfoque revela factores impulsores evolutivos. El objetivo principal de este estudio es probar la efectividad y la solidez de varios métodos de clasificación. El método de evaluación seleccionado es la medición de la clasificación general de los datos. Hemos demostrado que todos los métodos considerados dan resultados consistentes y que Bubble Sort y Simulated Annealing logran la clasificación más alta. Además, Bubble Sort es considerablemente más rápido que el método Simulated Annealing.