fbpx
Almacenamiento Noticias

Google Publica Estudio Sobre Discos Duros

No hay nada más desagradable que tener toda la información en un Disco Duro y que éste, sin previo aviso, falle. En efecto, muchas veces la información perdida es invaluable y las consecuencias de ese desastre no sólo se miden por el valor de un Disco Duro nuevo. De hecho, estos dispositivos han bajado tanto de precio que cada vez fallan más rápido y cuando menos se espera. Causas hay muchas, pero no siempre es simple individualizarlas.

Siendo una Compañía con una de la infraestructuras de Investigación y Desarrollo más grandes del mundo, Google tiene la oportunidad de dedicarse no sólo la “búsqueda por Internet“. De vez en cuando, la Compañía publica los resultados de investigaciones propias. Su más reciente proyecto es uno que seguramente consiste en un tema más que candente y se relaciona con la exploración de cómo y bajo que circunstancias los Discos Duros trabajan o no.

Existe una regla casera para reemplazar los Discos Duros, la cual le ha enseñado a los clientes a mover la información de un HDD a otro cada cinco años. Pero específicamente, la naturaleza mecánica de los dispositivos de almacenamiento masivo los hacen más vulnerables y, uno de estos aparatos, puede llegar a fallar mucho antes que la marca de los cinco años. Tradicionalmente, condiciones ambientales extremas son citadas como la principal razón de colapso de los HDD, siendo las más importantes la temperatura y el exceso de actividad.

Un estudio de Google, presentado en la Conferencia de Tecnologías de Archivo y Almacenamiento (“Conference on File and Storage Technologies“) recientemente llevada a cabo, cuestiona las tradicionales causas que sirven para explicar los problemas en los Discos Duros y concluye que existen muchos otros factores que impactan la vida útil de uno de estos aparatos y que las predicciones de falla son más complicadas de hacer de lo que tradicionalmente se piensa. Lo que hace a este estudio interesante es el hecho que la infraestructura de servidores de Google se estima excede los 450,000 sistema convencionales que en promedio disponen de capacidad de almacenamiento que varía entre los 80GB a los 400GB. De acuerdo a la Compañía, el proyecto incluyó más de 100,000 Discos que fueron puestos en marcha en el 2001 o después. Las unidades revisadas corresponden a aquellas que pueden encontrarse comúnmente en el mercado, las cuales giran a velocidades rotacionales de 5,400 y 7,200 rpm y provienen de muchos de los más conocidos fabricantes de Discos Duros y de por lo menos nueve modelos distintos.

Google indicó que junta “información vital” de prácticamente todos sus sistemas cada pocos minutos y guarda esa información para posteriores análisis. Por ejemplo, esta información incluye factores ambientales (tales como temperaturas), niveles de actividad y parámetros SMART (“Self-Monitoring Análisis and Reporting Technology” o “Tecnología Análisis y Reporte de Monitoreo Propio“), los cuales son considerados buenos indicadores para describir la salud de un Disco Duro.

En general, la población de HDDs de Google evidencia un aumento en la tasa de fallas con la edad de la  unidad. Dentro del grupo de los dispositivos con un año de edad, el 1.7% de ellos tuvo que ser reemplazado debido a problemas. Esta tasa aumenta al 8% para  el caso de los dispositivos de 2 años de antigüedad y al 8.6% para los de tres. De esos resultados, es posible deducir que la tasa de falla suele estabilizarse mientras más antiguas son las unidades pero Google cree que la confiabilidad de los HDDs con más de 4 años de uso está más influenciada por “cada modelo en  particular en vez de por los efectos de la edad misma.

Observando el estudio desde el punto de vista de diferentes niveles de utilización, lo resultados que se obtienen son bastante interesantes. Sólo unidades con una edad de seis meses o menos, demostraron una decida mayor probabilidad de falla al ser puestas en un ambiente de alta actividad. Una vez que los HDDs sobreviven sus primeros meses, la probabilidad de falla debido a
alto uso decrece en el año 1,2,3 y 4 pero, aumenta significativamente en el año 5.

La investigación de la temperatura por parte de Google mostró otro sorprendente hallazgo,

“Las fallas no aumentan con un aumento promedio de la temperatura. De hecho, existe una clara tendencia que indica que las bajas temperaturas están asociadas a mayores tasas de fallas. Sólo a muy altas temperaturas esta tendencia se invierte.”

Por otro lado, la Compañía descubrió que ciertos parámetros de la tecnología SMART aparentemente tendrían un efecto en indicar las fallas de las unidades. Por ejemplo, los Discos Duros comúnmente revisan su superficie sin que el usuario se percate de ello y reportan los errores cuando los descubren. Errores de escaneo significativos pueden conducir a errores de superficie y Google reporta que menos del 2% de sus unidades muestran ese tipo de errores. Sin embargo, HDDs con errores de escaneo resultaron tener una probabilidad de falla 10 veces mayor que aquellos dispositivos que no mostraron esos errores. Cerca del 70% de las unidades de Google con errores de escaneo sobrevivieron los 8 primeros meses luego que el primer error fue reportado.

Similarmente, conteos de reubicación, un número que resulta de reubicar sectores defectuosos a un nuevo sector físico, pueden tener un dramático impacto en la vida útil de un HDD. Google indicó que las unidades con una o más reubicaciones fallaban más a menudo que aquellas que no las tenían. El 85% de los Discos Duros sobrevivió los ocho meses luego de la primera reubicación.

Google determinó similares efectos en Discos Duros en otras categorías de la tecnología SMART pero, en general, los resultados obtenidos revelan que el 56% de todas las unidades defectuosas no tenían ninguna relación con alguna de estas categorías, lo cual significa que más de la mitad de todos los dispositivos con fallas fueron retirados de operación por factores distintos a errores de escaneo, número de reubicaciones, etc.

En resumen, la investigación de Google no resuelve el problema de predecir cuando un Disco Duro fallará. Sin embargo, demuestra que la temperatura y el excesivo uso no son los únicos responsables de las fallas. Además, el estudio apunta a una tendencia que ellos llaman “fase de mortalidad infantil“, un periodo inicial de la vida de un Disco Duro en el cual existen crecientes probabilidades de defectos bajo ciertas circunstancias. El reporte adolece de una clara conclusión pero los autores indican que en la actualidad no existe un acercamiento que pueda predecir las fallas en los Discos Duros. Según ellos,

“Poderosos modelos predictivos deben hacer uso de señales que van más allá de las entregadas por las tecnología SMART.”

 

Posts relacionados

ASUS Republic of Gamers anuncia disponibilidad de sus Placas Madre ROG Strix B550-A Gaming

MadBoxpc.com

NVIDIA RTX 3080, informan fallas con algunos juegos.

MadBoxpc.com

Microsoft compra Bethesda por US$ 7.500 millones

Cedrik