Abstracto

Optimización del acceso a los datos con una estrategia de georreplicación adaptativa

Amadeo Ascó

La cantidad de datos que se procesan en los centros de datos (CD) sigue creciendo a un ritmo enorme, por lo que la replicación completa puede comenzar a resultar poco práctica. Una forma de aumentar la disponibilidad de los datos se puede lograr mediante la replicación entre CD, de modo que se pueda acceder a los datos localmente, si es posible, lo que permite recuperarlos en caso de fallas del sitio y reducir los costos de acceso. Esto significa que replicar los datos solo en algunos de los CD se está volviendo más crítico para reducir los costos de mantener los datos consistentes o eventualmente consistentes y aún así mantener una alta disponibilidad (escalabilidad) y bajos costos de acceso. Las ubicaciones de los datos en los CD deben determinarse dinámicamente teniendo en cuenta los patrones cambiantes de solicitudes de lectura y escritura de los datos que se van a replicar. Dado que se ha demostrado que el problema de encontrar un esquema de replicación óptimo en una red general es NP-completo para el caso estático, es poco probable que se pueda generar un algoritmo general para encontrar soluciones eficientes al problema dinámico. Aquí se presenta una estrategia de replicación adaptativa inspirada en la biología, que es completamente descentralizada, adaptativa, inspirada en el algoritmo Ant Colony y basada en eventos. Además, el protocolo de replicación es independiente de la estrategia implementada, pero está guiado por ella.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado