Ilya Y Zhbannikov, Samuel S Hunter, Matthew L Settles y James A Foster
Con la llegada de la secuenciación de nueva generación (NG), se ha hecho posible secuenciar un genoma completo de forma rápida y económica. Sin embargo, en algunos experimentos solo es necesario extraer y ensamblar una parte de las lecturas de la secuencia, por ejemplo, al realizar estudios de transcriptoma, secuenciar genomas mitocondriales o caracterizar exomas. Con la biblioteca de ADN en bruto de un genoma completo, parecería ser un problema trivial identificar lecturas de interés. Pero no siempre es fácil incorporar herramientas conocidas como BLAST, BLAT, Bowtie y SOAP directamente en los procesos de bioinformática antes de la etapa de ensamblaje, ya sea por incompatibilidad con las entradas de archivo del ensamblador o porque es deseable incorporar información que debe extraerse por separado. Por ejemplo, para incorporar diagramas de flujo de un secuenciador Roche 454 al ensamblador Newbler es necesario extraerlos primero de los archivos SFF originales. Presentamos SlopMap, una utilidad de software bioinformático que permite la identificación rápida de secuencias de interés similares a las proporcionadas en las bibliotecas de ADN Roche 454 o Illumnia. Con una interfaz de línea de comandos sencilla e intuitiva junto con formatos de salida de archivos compatibles con programas de ensamblaje, SlopMap se puede integrar directamente en el flujo de trabajo de procesamiento de datos biológicos sin ningún trabajo de programación adicional. Además, SlopMap conserva la información del diagrama de flujo necesaria para el ensamblador Roche 454.