Touati R, Mignotte M, Dahmane M
Este artículo aborda la problemática de detectar cambios en pares de imágenes de teledetección heterogéneas bitemporales. En diferentes disciplinas, la multimodalidad es la solución clave para mejorar el rendimiento en un contexto de teledetección colaborativa. En particular, en imágenes de teledetección aún hay un vacío de investigación que llenar con la multiplicación de sensores, junto con las capacidades de intercambio de datos y la disponibilidad de datos multitemporales. Este estudio tiene como objetivo explorar la multimodalidad en una configuración multitemporal para una mejor comprensión de la completitud de información de todo el sensor colaborativo; proponemos un enfoque de aprendizaje por pares que consiste en una arquitectura de red pseudo-siamesa basada en dos flujos de red paralelos parcialmente desacoplados. Cada flujo representa en sí mismo una red neuronal convolucional (CNN) que codifica los parches de entrada. El modelo general del detector de cambios (CD) incluye una etapa de fusión que concatena las dos codificaciones en una única representación de características multimodal que luego se reduce a una dimensión inferior utilizando capas completamente conectadas y, finalmente, se utiliza una función de pérdida basada en la entropía cruzada binaria como capa de decisión. La arquitectura de aprendizaje por pares pseudo-siamés propuesta permite al modelo CD capturar las dependencias espaciales y temporales entre pares de imágenes de entrada multimodales. El modelo procesa los dos parches de entrada multimodales a la vez bajo diferentes resoluciones espaciales. Los resultados de la evaluación en diferentes conjuntos de datos multimodales reales que reflejan una mezcla de condiciones de CD con diferentes resoluciones espaciales confirman la eficacia de la arquitectura de CD propuesta.