Jae Jin Choi, Byung-Ju Kim, Sung-Hou Kim
Antecedentes: Un “árbol de organismos” de insectos, el grupo más grande y con mayor diversidad de especies de todos los animales vivos, puede considerarse como un árbol metafórico y conceptual para capturar una narrativa simplificada de los cursos evolutivos complejos e impredecibles de los insectos actuales. Actualmente, el enfoque más común ha sido construir un “árbol genético”, como sustituto del árbol de organismos, seleccionando un grupo de regiones altamente alineables de cada uno de los genes/proteínas seleccionados para representar a cada organismo. Sin embargo, dichas regiones seleccionadas representan una pequeña fracción de todos los genes/proteínas y una fracción aún más pequeña del genoma completo de un organismo. Durante las últimas décadas, se dispuso de secuencias de genoma completo de muchos insectos actuales, lo que brindó la oportunidad de construir un “árbol de genoma completo o de proteoma completo” de insectos utilizando la teoría de la información sin alineamiento de secuencias (método sin alineamiento).
Resultados: Un árbol de proteoma completo de los insectos muestra que (a) el patrón de agrupamiento demográfico es similar al de los árboles genéticos, pero hay diferencias notables en los órdenes de ramificación de los grupos, y por lo tanto, en las relaciones de hermandad entre pares de grupos; y (b) todos los fundadores de los grupos principales han surgido en un “estallido explosivo” cerca de la raíz del árbol.
Conclusión: Dado que la secuencia del proteoma completo de un organismo puede considerarse como un “libro” de alfabetos de aminoácidos, se puede construir un árbol de los libros, sin alinear las secuencias, utilizando un método de análisis de texto de la teoría de la información. Dicho árbol proporciona un punto de vista alternativo para construir una narrativa de la evolución y el parentesco entre los insectos actuales.