Svalbard como tal probablemente no suena a muchos, la 'Bóveda del Apocalipsis' quizás sí. En el norte de Noruega, ya en el Ártico, se almacena un inmenso banco de semillas para preservar la flora del planeta en caso de un desastre a nivel global. Algo parecido está haciendo GitHub, la plataforma de repositorios de Microsoft ha guardado una copia de seguridad de todos sus repositorios activos y públicos. En caso de que pase algo, se preservarán durante al menos 1.000 años.
Esta idea fue anunciada en noviembre del año pasado y la premisa es muy sencilla: una copia de seguridad en el Ártico de casi todo lo que hay en GitHub ahora mismo. ¿Para qué? Para poder acceder de nuevo a toda la información en caso de que ocurra un desastre tan malo como para que sea capaz de destruir todo GitHub.
La idea inicial era que una escolta de GitHub se encargase de depositar los archivos en la bóveda del Ártico. Sin embargo, debido a la pandemia actual, finalmente decidieron enviar los archivos a una organización local para que sean ellos quienes los guarden en Svalbard, un grupo de islas del norte de Noruega.
La ubicación concreta es una antigua mina de carbón ya desmantelada. Ahí, a cientos de metros en el interior del permafrost, se encuentra una cámara interior que guarda todos los archivos. En caso de un desastre esta cámara debería poder preservar los archivos durante más de 1.000 años.
Analógico antes que digital
Quizás lo más interesante de todo este proyecto es cómo se han almacenado los datos. Cuando hablamos de archivos digitales uno se espera DVDs, SSDs y unidades de almacenamiento por el estilo. Pero no, debido a la inestabilidad de estos productos GitHub ha decidido apostar por algo más perdurable: film.
Con la ayuda de la empresa noruega Piql AS han grabado en rollos de cinta todo el código para que pueda ser leído tanto con un aparato como con una simple lupa. Cada cinta puede almacenar unos 120 GB de datos. Si bien inicialmente se calculaba que serían 24 TB de código fuente lo que GitHub tenía que guardar, finalmente han sido unos 21 TB en total. Esto corresponde a 168 rollos de cinta Piql.
¿Y qué hay en estos rollos? Principalmente una copia de todos los repositorios de GitHub activos y públicos (y algunos importantes que llevan tiempo sin actividad). Cada repositorio se ha comprimido en un archivo TAR y la mayoría de los datos se almacenan en forma de códigos QR. Aparte de esto, se ha añadido una guía fácil de entender por un humano para poder indexar los archivos y saber cómo recuperarlos.
Como dicen desde GitHub, esperemos no tener que usar nunca esta copia de seguridad.
Ver 25 comentarios