Actualidad
Bases de Datos
Back-up

El Big Data está revolucionando el mundo de las copias de seguridad

Las cosas están cambiando muy rápido en materia de backup. El Big Data está afectando al mundo de las bases de datos, empezando con la capacidad de escalar en productos como Hadoop, MongoDb o Cassandra; en estos servicios la información se distribuye en diferentes servidores, lo que aporta gran flexibilidad gracias a que para poder almacenar más petabytes solo es necesario añadir un par de máquinas

Base de datos

Pero el siguiente nivel en el que más está afectando el Big Data es en el backup la recuperación de los datos. El problema de las bases de datos escalables es que pueden ser complicadas de manejar para algunas organizaciones con aplicaciones TI más tradicionales, además de que sus capacidades de recuperación y acceso no son tan robustas como las que conocen los usuarios.

La respuesta está llegando con productos como RecoverX de Datos IO. “Si tienes una base de datos tradicional escalada siempre está presente la noción de un log duradero”, ha explicado Tarun Thakur, co fundador de la empresa y CEO. El problema es que en estos casos, una copia de este log puede constituir un problema de backup.

“En la actualidad no existe realmente el concepto de log durable porque no existe un administrador maestro en el programa, cada nodo trabaja en su propia sección, por lo que cada uno de ellos tiene diferentes privilegios y puntos de vista de una operación”, ha explicado Thakur.

Esto es el resultado directo de la política de las empresas que quieren ofrecer las tres conocidas V: velocidad, volumen y variedad. Para poder ofrecer escalabilidad mientras se maneja una cantidad tan grande de datos y a mucha velocidad, las bases de datos están dejando atrás el criterio “ACID”, en el que se busca una fuerte consistencia desde el principio, para moverse hacia el principio “BASE”, por el cual se busca una consistencia más eventual. De esta forma, las actualizaciones se reflejarán en algún momento, pero habrá siempre cierto desfase temporal. “Si quieres escalabilidad, tienes que renunciar a la consistencia”, explica Thakur.

El resultado es que es más complicado conseguir una foto general de un momento concreto a la hora de recuperar una base de datos, no solo por saber hacia dónde se han movido los diferentes datos, sino que otras funciones que normalmente vienen ya integradas en las bases, como la replicación, no protegerán el sistema si los datos están corrompidos según explica Simon Robinson, un vicepresidente de investigación en 451 Research. “Solo replicarás la información corrompida”.

A principios de junio Datos IO lanzó RecoverX para responder a estos problemas con funciones que incluyen llamadas escalables o deduplicación semántica, con el resultado de un conjunto de copias de seguridad consistentes que son especialmente eficientes en accesibilidad desde formatos nativos.

Souviek Das acusa el cambio en la industria de las copias de seguridad; el vicepresidente de la startup tech de sanidad Grand Rounds; “necesitamos una nueva estrategia en las copias de seguridad y de recuperación; la mayoría de los vendedores de software o backup están enfocados en los productos que han utilizado en los últimos años, y utilizar esos sistemas antiguos con bases de datos nuevas puede causar muchos problemas”, advierte Das.

“O el software va a fallar estrepitosamente porque no entiende como copiar desde los nuevos almacenes de información, o va a funcionar de manera muy poco óptima”, estima el vicepresidente de la startup tech de sanidad Grand Rounds.

Aun así, hay buenas noticias; los proveedores de los productos más tradicionales de backup están ajustando poco a poco su propia tecnología hacia el Big Data. “Normalmente lleva un poco de tiempo que los fabricantes de copias de seguridad empiecen a apoyar la nueva tecnología, pero la tendencia está 



TE PUEDE INTERESAR...

Accede a la cobertura de nuestros encuentros
 
Lee aquí nuestra revista digital de canal

DealerWorld Digital

 

Forma parte de nuestra comunidad
 
¿Interesado en nuestros foros? 

 

Whitepaper

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS