Curtis Davis, Karthik Kota, Venkat Baldhandapani, Wei Gong, Sahar Abubucker, Eric Becker, John Martin, Kristine M. Wylie, Radhika Khetani, Matthew E. Hudson, George M. Weinstock Weinstock y Makedonka Mitreva
Los recientes avances en las tecnologías de secuenciación de próxima generación requieren algoritmos de alineamiento y software que puedan seguir el ritmo de la mayor producción de datos. Los algoritmos estándar, especialmente las búsquedas de similitud de proteínas, representan cuellos de botella importantes en los procesos de análisis. En particular, para los enfoques metagenómicos, ahora es necesario buscar cientos de millones de lecturas de secuencias en grandes bases de datos. Aquí describimos mBLAST, un algoritmo de búsqueda acelerada para alineaciones traducidas y/o de proteínas en grandes conjuntos de datos basado en la herramienta de búsqueda de alineamiento local básico (BLAST) y que conserva la alta sensibilidad de BLAST. Los algoritmos mBLAST logran una velocidad sustancial con respecto a los programas BLASTX, TBLASTX y BLASTP del Centro Nacional de Información Biotecnológica (NCBI) para grandes conjuntos de datos, lo que permite el análisis en plazos razonables en arquitecturas informáticas estándar. En este artículo, se demuestra el impacto de mBLAST con secuencias originadas en la microbiota de humanos sanos del Proyecto del Microbioma Humano. mBLAST está diseñado como un complemento de reemplazo para BLAST para cualquier estudio que involucre secuencias de lectura corta e incluya análisis de alto rendimiento. El software mBLAST está disponible gratuitamente para usuarios académicos en www.multicorewareinc.com.