La unidad que desaparece misteriosamente: ¿los cortes de energía están matando sus SSD?

Flash NAND

Los SSD ofrecen enormes beneficios sobre los discos giratorios tradicionales. Son hasta un orden de magnitud más rápidos en ciertas operaciones, pesan menos y consumen menos energía bajo carga. Se han vuelto cada vez más populares entre los entusiastas y los clientes habituales por igual, pero un informe de la XI Conferencia de Usenix sobre tecnologías de archivos y almacenamiento (FAST 13), dado a principios de este año, sugiere que la mayoría de los modelos tienen un problema fundamental con la pérdida repentina de energía. Si bien el documento salió a mediados de febrero, lo encontré recientemente, después de que un lector me preguntó si buscaría un programa de recuperación bastante desconcertante recomendado por Crucial para su línea SSD M4.

Crucial recomienda que los propietarios de M4 cuyos impulsos desaparecen repentinamentesimplemente deje reposar la unidad durante unos 40-60 minutos con el conector SATA desconectado, pero el cable de alimentación aún conectado. La compañía recomienda que los propietarios de computadoras portátiles dejen que sus sistemas se asienten en la pantalla del BIOS, y no se sabe si esto también es mejor para las unidades de escritorio. Las carcasas USB 3.0 se consideran subóptimas. Desconcertado, comencé a hurgar más en esto, luego me topé con el informe antes mencionado de principios de este año.

Samsung Flash SSDInvestigadores que trabajan con la Universidad de Ohio redondeó 15 SSD diferentes de cinco proveedores diferentes, así como un par de discos duros, y someterlos a una serie de pruebas diseñadas para medir cómo respondieron a fallas repentinas de energía. No se identifica a ningún proveedor, pero las unidades en cuestión incorporan tanto MLC como SLC. Algunas (las versiones SLC) son explícitamente unidades empresariales. Algunos incluyen supercondensadores, que están diseñados para mitigar fallas de energía catastróficas.



Los resultados no fueron alentadores. El grupo probó seis tipos diferentes de fallas:

  • Errores de bits: Bits de datos aleatorios, escritos incorrectamente
  • Flying escribe: Escritos que se escribieron correctamente, pero terminan en la ubicación incorrecta
  • Shorn escribe: Escribe que están por debajo del tamaño esperado, debido a la falla de energía
  • Corrupción de metadatos: Corrupción en la capa de traducción de Flash (FTL) que se encuentra entre el hardware SSD y el sistema operativo
  • Dispositivo de ladrillos: Autoexplicativo
  • Inestabilidad: Los bloques de almacenamiento que están escritos no están escritos en el orden de operación correcto

Tasas de falla de SSD

Aquí está la parte sorprendente: de las 15 unidades (10 modelos diferentes, de cinco proveedores), solo un modelo de unidad, de un proveedor, no tuvo fallas de ningún tipo. Un dispositivo falló por completo (SSD n. ° 1), mientras que un tercio del SSD n. ° 3 quedó inutilizable debido a la corrupción de metadatos. Todos los otros SSD exhibieron varios tipos de corrupción de datos cuando perdieron energía inesperadamente, incluidos los SSD empresariales de gama alta con SLC NAND y supercondensadores. Según el equipo de investigación, parte del problema es que prácticamente ninguno de los dispositivos realmente se comportan como se espera en condiciones de falla. Si bien todas las unidades afirman usar ECC RAM, por ejemplo, muchas exhibieron errores de un solo bit del tipo de errores que ECC debe prevenir. Si bien uno de los dos discos duros incluidos también desarrolló errores, los HDD son mucho más baratos y no mostraron signos de las desastrosas fallas que caracterizaron a los SSD.

El impacto de la pérdida repentina de energía

Las implicaciones de esta investigación son significativas. Sugiere que no se debe confiar en que los SSD, incluidos los SSD empresariales, se comporten de manera adecuada o sean tan robustos como los HDD. De hecho, el número de accesos a la frase 'SSD que desaparece' es enorme, y aunque muchos se refieren al Crucial M4, esa unidad no es la única en la lista. Yo mismo me he encontrado con este problema en el pasado, con varias unidades muriendo inesperadamente después de ciclos de energía aleatorios. Nunca pensé en buscar un problema más amplio hasta ahora.

Memoria flash de 20 nm

Muere flash NAND de 20 nm

Sin la información del proveedor, hay pocos consejos prácticos que ofrecer. Lo mejor que puede hacer un usuario es intentar asegurarse de que la energía no se apague inesperadamente, incluso a través de una pequeña fuente de alimentación ininterrumpida (UPS). Los usuarios de portátiles obviamente tienen menos que temer en este aspecto, ya que sus sistemas tienen baterías integradas. Incluso una batería de 5 a 10 minutos sería suficiente para que el usuario tuviera tiempo de apagarse. Es poco probable que los fabricantes empiecen a hablar de estos problemas con honestidad; nadie quiere admitir que los productos anteriores han sido menos que blindados.

Tampoco está claro si los problemas se pueden evitar, absolutamente, sin el uso de baterías de respaldo o circuitos de alimentación. Los SSD enfatizan el alto rendimiento y a menudo usan RAM volátil, lo que inevitablemente hará que sea más difícil diseñar tales protecciones. Por ahora, recomendamos a los usuarios de SSD que tengan especial cuidado de no correr el riesgo de cortes de energía inesperados. Parece que no hay forma de minimizar el problema, no se ha presentado ninguna unidad específica como blindada, e incluso el uso de SLC y supercondensadores no evita la corrupción.

Copyright © Todos Los Derechos Reservados | 2007es.com