Georges Natsoulis, Nancy Zhang, Katrina Welch, John Bell y Hanlee P. Ji
Aprovechando las capacidades de secuenciación dirigida profunda de los secuenciadores de próxima generación, hemos desarrollado un novedoso algoritmo de detección de inserción y deleción (indel) de dos pasos (IDA) que puede determinar indels a partir de secuencias de lectura única con alta eficiencia computacional y sensibilidad cuando los indels son fraccionalmente menores en comparación con la secuencia de referencia de tipo salvaje. En primer lugar, identifica posiciones de indel candidatos utilizando artefactos de alineamiento de secuencias específicos producidos por programas de alineamiento rápido. En segundo lugar, confirma la ubicación del indel candidato utilizando el algoritmo Smith-Waterman (SW) en un subconjunto restringido de lecturas de secuencia. Demostramos que IDA es aplicable a indels de diferentes tamaños a partir de datos de secuenciación dirigida profunda en fracciones bajas donde el indel se diluye por la secuencia de tipo salvaje. Nuestro algoritmo es útil para detectar variantes de indel presentes en frecuencias alélicas variables, como puede ocurrir en heterocigotos y tejido tumoral-normal mixto.