Sally Yepes y María Mercedes Torres
Dada la heterogeneidad en el comportamiento clínico de los pacientes con cáncer con diagnóstico histopatológico idéntico, la búsqueda de subtipos moleculares no reconocidos, marcadores específicos de subtipo y la evaluación de su relevancia clínico-biológica son una necesidad. Esta tarea se beneficia hoy en día de las tecnologías genómicas de alto rendimiento y del acceso gratuito a los conjuntos de datos generados por los proyectos genómicos internacionales y los repositorios de información. Las estrategias de aprendizaje automático han demostrado ser útiles en la identificación de tendencias ocultas en grandes conjuntos de datos, lo que contribuye a la comprensión de los mecanismos moleculares y la subtipificación del cáncer. Sin embargo, la traducción de nuevas subclases moleculares y biomarcadores a entornos clínicos requiere su validación analítica y ensayos clínicos para determinar su utilidad clínica. Aquí, proporcionamos una descripción general del flujo de trabajo para identificar y confirmar subtipos de cáncer, resumimos una variedad de principios metodológicos y destacamos estudios representativos. La generación de big data público sobre las neoplasias malignas más comunes está convirtiendo la patología molecular en una disciplina impulsada por bases de datos.