Amazon Glacier: 99.999999999% de durabilidad de almacenamiento a largo plazo, por un centavo por concierto

Glaciar Amazonas

Amazon ha presentado la última incorporación a AWS: Glacier, una solución de almacenamiento a largo plazo basada en la nube que cuesta solo $ 0.01 por gigabyte por mes. Esto es significativamente más barato que el almacenamiento en el sitio y al menos diez veces más barato que otros servicios de almacenamiento en la nube (como Amazon S3, Dropbox, Azure, etc.).

Amazon Glacier es como Amazon S3, pero es diseñado explícitamente para almacenamiento a largo plazo. Usted carga sus datos y luego Amazon los duplica automáticamente en varios repositorios geográficamente diversos, lo que promete una durabilidad del 99,999999999% (si almacena 10,000 objetos en Glacier, podría perder un objeto cada 10 millones de años). En resumen, solo perderá los datos de Amazon Glacier si hay algún tipo de apocalipsis.

A diferencia de S3 u otro almacenamiento en la nube, que está “en línea” y siempre disponible para acceso instantáneo, la recuperación de datos de Glacier lleva tiempo (entre 3 y 5 horas) y cuesta una cantidad significativa de dinero (más de 10 centavos por concierto). También hay una multa de $ 0.03 por concierto si elimina datos dentro de los 90 días. Si almacena 100 terabytes en Glacier, está buscando alrededor de $ 10,000 para recuperar todo.



Diagrama de flujo de Amazon Glacier

Sin embargo, hay una excepción bastante importante: en un mes determinado, puede recuperar hasta el 5% de su almacenamiento total de forma gratuita; por lo que si almacena 100 TB, puede descargar 5 TB al mes de forma gratuita. Esto encaja muy bien con el caso de uso normal para el almacenamiento a largo plazo (es muy poco probable que necesite descargar el archivo completo de 100 TB y 20 años).

Un robot de biblioteca de cintasLa clave de este servicio es la ventana de recuperación de 3-5 horas, provocada por Amazon que utiliza una biblioteca de cintas robótica. No conocemos la estructura exacta de Glacier, pero es probable que tenga un montón de discos duros en la interfaz, que actúan como caché para archivos recientes y recuperados regularmente, y luego una biblioteca de cintas absolutamente masiva. Cuando realiza una solicitud de recuperación, un brazo robótico agarra la cinta con sus datos, inserta la cinta en una unidad y luego sus datos se transferirán a un disco duro listo para su acceso. La ventana de 3-5 horas es simplemente el tiempo que tarda el brazo robótico en estar disponible: si muchas personas están solicitando una recuperación, debe esperar en la fila.

Las bibliotecas de cintas pueden almacenar una enorme cantidad de datos. Spectra hace una gama de dispositivos robóticos que tienen 24 unidades y espacio para 1000 cintas, que luego se pueden conectar en red para crear una biblioteca con una capacidad total de 3,6 exabytes (3,7 millones de terabytes). Es probable que Amazon haya construido bastantes de estas bibliotecas en sus centros de datos de EE. UU., Europa y Asia.

Para completar el servicio, los usuarios de Amazon S3 pueden transferir fácilmente datos directamente a Glacier, y en los próximos meses, Amazon permitirá a los usuarios de AWS configurar políticas de ciclo de vida que muevan automáticamente los datos de S3 a Glacier.

Amazon Glacier está, al menos desde el principio, casi perfectamente ubicado. Gestionar copias de seguridad a largo plazo es un trabajo duro y muy caro, y hay muchas empresas que amor para apagar sus antiguas bibliotecas de cintas y NAS y cambiar a Amazon. Con solo un centavo por concierto al mes, Amazon Glacier será más confiable, extensible y rentable que las soluciones internas. El único problema real que puedo prever es la seguridad de los datos, pero considerando que podría cifrar todos sus datos antes de enviarlos a Glacier, el riesgo de que alguien acceda a sus datos es mínimo.

Leer: ¿Qué tan grande es la nube?

Copyright © Todos Los Derechos Reservados | 2007es.com