Administración de red – La falla del disco duro es una realidad de por vida: por eso existen sistemas de respaldo, matrices RAID y toda una infraestructura diseñada para evitar la pérdida de datos. y minimizar el impacto en las organizaciones cuando los discos duros dejan de funcionar.
Sin embargo, eso no significa que no pueda hacer algo para minimizar el error del disco duro. En este artículo, le mostraré cinco cambios simples que puede hacer que sus discos duros funcionen sin problemas.
1. Inserte los discos duros en un laboratorio separado antes de usarlos para la producción
Los discos duros sufren una tasa de error muy alta y esa proporción es como ‘Tasa de mortalidad infantil’. En esencia, esto significa que los discos duros nuevos a menudo fallan en los primeros meses de uso. La razón puede deberse a que las desventajas en el proceso de producción no se detectan de inmediato, pero el error solo ocurre cuando el disco duro se pone en uso real.
Por cualquier motivo, los discos duros que sobrevivan los primeros meses de uso sin errores podrán sobrevivir durante muchos años.
Esto implica recordarle que no se deben utilizar discos duros nuevos en los servidores para evitar una alta probabilidad de error en esta etapa. Otra forma de identificarlos es ejecutarlos en equipos de prueba durante un período de aproximadamente tres meses. Este proceso de prueba eliminará los discos duros “débiles” y las computadoras “saludables” restantes se utilizarán en servidores de producción.
2. Detecta defectos superficiales antes de usar
Casi todos los discos duros tienen defectos superficiales magnéticos que se utilizan para almacenar datos en su interior. Los datos se almacenan en un sector, si hay un cierto error de superficie, este error puede causar legibilidad, en algunos casos, puede que no sea posible leer los datos en absoluto. Cuando el disco duro detecta un sector defectuoso porque es difícil de leer, transferirá los datos si es posible y dejará de usar esa palabra para evitar futuras pérdidas de datos.
El problema con este método, sin embargo, es que solo es capaz de detectar sectores defectuosos después de ser utilizado, y con una expresión que dificulta la lectura de los datos guardados. El método aquí es encontrar y marcar todos los sectores de superficie defectuosos antes de comenzar el almacenamiento de datos.
Quizás la utilidad más eficaz para implementar esta idea es el programa llamado SpinRite. Este programa escribirá muestras magnéticas muy débiles en la superficie del disco y probará si pueden leer los datos. Si no puede leer estas muestras de un área determinada en el disco, SprinRite asumirá que es un sector defectuoso y notificará al disco duro para marcar este sector defectuoso.
Ejecutar SpinRite en cualquier disco duro antes de usarlo, un proceso que puede demorar varias horas, evitará que los sectores defectuosos usen datos para guardar datos, lo que reduce la pérdida de datos innecesaria debido a errores que no pueden leer ciertos sectores en el futuro.
3. Seleccione el disco duro con cuidado
Muchos estudios muestran que la confiabilidad de la unidad es completamente diferente y esta diferencia depende del modelo y su proceso de fabricación. Sin embargo, un modelo del modelo de disco duro de un fabricante puede resultar muy confiable, pero todavía no hay garantía para otro modelo de otro fabricante, ni siquiera con el fabricante. ahí.
Esto significa que debe vigilar los discos duros para ver qué modelos no son confiables. La mejor manera de hacer esto es eliminar de todos los servicios de un modelo en particular que está utilizando, pero configurarlos como discos duros no confiables, aunque no hay garantía de que los discos duros sean confiables.
Una estrategia aquí, especialmente para los sistemas RAID, es utilizar una variedad de modelos de disco duro de diferentes fabricantes. De esa manera, si no se confía en un determinado modelo, esto no afectará tanto a un disco duro en una matriz de una categoría.
4. Sobrecalentamiento mejor que demasiado frío
Los estudios han demostrado que la temperatura no afecta la confiabilidad del disco duro (la opinión que la gente todavía piensa). En los primeros dos años de uso del disco duro, el disco duro será más propenso a errores si se ejecuta a una temperatura promedio de 350 ° C o más baja que la carcasa con una temperatura promedio de 450 ° C. Esto es una sorpresa y muestra que el uso de un sistema de aire acondicionado puede ser contraproducente: un ambiente más cálido cabrá en más discos duros.
A partir del tercer año, los discos duros que funcionan a más de 400 C tendrán una tasa de error más alta que los discos duros que funcionan a temperaturas más frías. Esto plantea la pregunta de si las consecuencias de correr a altas temperaturas antes son la causa de errores en años posteriores. Sin embargo, estudios recientes de Google aún concluyen que, “el rango de temperatura promedio tiene un efecto peor en los discos duros que el rango de temperatura más alto”.
5. No utilice discos duros durante demasiado tiempo
Es completamente imposible predecir exactamente cuándo se dañará un disco duro, pero un disco duro con una vida útil de dos o un año tendrá un mayor riesgo de fallas que uno nuevo. Si se trata de un tipo de disco duro que ha calificado de poco confiable, el riesgo puede ser peor. Para reducir el riesgo de falla del disco duro en general (para evitar errores que conduzcan a la pérdida de datos importantes), debe asegurarse de que la vida útil promedio de su disco duro sea siempre joven.
Además, también debe verificar los datos SMART u otros sistemas para verificar la capacidad de funcionamiento interna del disco para indicar qué unidades tienen un alto riesgo de falla. Cuando un disco comienza a comportarse de manera sospechosa, por ejemplo, al informar errores de escaneo o al reposicionar uno o más sectores y marcar sectores antiguos como sectores defectuosos, es probable que falle. en un tiempo no muy lejano.
Reducir el alcance del impacto en los errores del disco duro debe ser un acto de equilibrio económico. Se debe considerar reemplazar los discos duros antes de que fallen (el reemplazo costará una cierta cantidad de costo), pero si ocurre una falla en momentos críticos, el impacto en la productividad en que incurre la organización será enorme.
Solución de problemas de errores del disco duro
Administración de red – La falla del disco duro es una realidad: por eso existen sistemas de respaldo, matrices RAID y toda una infraestructura diseñada para evitar la pérdida de datos. y minimizar el impacto en las organizaciones cuando los discos duros dejan de funcionar.
Sin embargo, eso no significa que no pueda hacer algo para minimizar el error del disco duro. En este artículo, le mostraré cinco cambios simples que puede hacer que sus discos duros funcionen sin problemas.
1. Inserte los discos duros en un laboratorio separado antes de usarlos para la producción
Los discos duros sufren una tasa de error muy alta y esa proporción es como ‘Tasa de mortalidad infantil’. En esencia, esto significa que los discos duros nuevos a menudo fallan en los primeros meses de uso. La razón puede deberse a que las desventajas en el proceso de producción no se detectan de inmediato, pero el error solo se produce cuando el disco duro se pone en uso real.
Por cualquier motivo, los discos duros que sobrevivan los primeros meses de uso sin errores podrán sobrevivir durante muchos años.
Esto implica recordarle que no se deben usar discos duros nuevos en los servidores para evitar una alta probabilidad de error en esta etapa. Otra forma de identificarlos es ejecutarlos en equipos de prueba durante un período de aproximadamente tres meses. Este proceso de prueba eliminará los discos duros “débiles” y las computadoras “en buen estado” restantes se utilizarán en servidores de producción.
2. Detecta defectos superficiales antes de usar
Casi todos los discos duros tienen defectos superficiales magnéticos que se utilizan para almacenar datos en su interior. Los datos se almacenan en un sector, si hay un cierto error de superficie, este error puede causar legibilidad, en algunos casos, puede que no sea posible leer los datos en absoluto. Cuando el disco duro detecta un sector defectuoso porque es difícil de leer, transferirá los datos si es posible y dejará de usar esa palabra para evitar futuras pérdidas de datos.
El problema con este método, sin embargo, es que solo es capaz de detectar sectores defectuosos después de ser utilizado, y con una expresión que dificulta la lectura de los datos guardados. El método aquí es encontrar y marcar todos los sectores de superficie defectuosos antes de comenzar el almacenamiento de datos.
Quizás la utilidad más eficaz para implementar esta idea es el programa llamado SpinRite. Este programa escribirá muestras magnéticas muy débiles en la superficie del disco y probará si pueden leer los datos. Si no puede leer estas muestras de un área determinada en el disco, SprinRite asumirá que es un sector defectuoso y notificará al disco duro para marcar este sector defectuoso.
Ejecutar SpinRite en cualquier disco duro antes de usarlo, un proceso que puede tomar varias horas, evitará que los sectores defectuosos usen datos para guardar datos, reduciendo la pérdida de datos innecesaria debido a errores que no pueden leer ciertos sectores en el futuro.
3. Seleccione el disco duro con cuidado
Muchos estudios muestran que la confiabilidad de la unidad es completamente diferente y esta diferencia depende del modelo y su proceso de fabricación. Sin embargo, un modelo del modelo de disco duro de un fabricante puede resultar muy confiable, pero todavía no hay garantía para otro modelo de otro fabricante, o incluso con el fabricante. ahí.
Esto significa que debe vigilar los discos duros para ver qué modelos no son confiables. La mejor manera de hacer esto es eliminar de todos los servicios de un modelo en particular que está utilizando, pero configurarlos como discos duros no confiables, aunque no hay garantía de que los discos duros se reemplacen para que sean confiables.
Una estrategia aquí, especialmente para los sistemas RAID, es utilizar una variedad de modelos de disco duro de diferentes fabricantes. De esa manera, si no se confía en un determinado modelo, esto no afectará tanto a un disco duro en una matriz de una categoría.
4. Sobrecalentamiento mejor que demasiado frío
Los estudios han demostrado que la temperatura no afecta la confiabilidad del disco duro (la opinión que la gente todavía piensa). En los primeros dos años de uso del disco duro, el disco duro será más propenso a errores si se ejecuta a una temperatura promedio de 350 ° C o menor que la carcasa con una temperatura promedio de 450 ° C. Esto es una sorpresa y muestra que el uso de un sistema de aire acondicionado puede ser contraproducente: un ambiente más cálido cabrá en más discos duros.
A partir del tercer año, los discos duros que funcionan por encima de los 400 C tendrán una tasa de error más alta que los discos duros que funcionan a temperaturas más frías. Esto plantea la pregunta de si las consecuencias de correr a altas temperaturas antes son la causa de errores en años posteriores. Sin embargo, estudios recientes de Google aún concluyen que, “el rango de temperatura promedio tiene un efecto peor en los discos duros que el rango de temperatura más alto”.
5. No utilice discos duros durante demasiado tiempo
Es completamente imposible predecir exactamente cuándo se dañará un disco duro, pero un disco duro con una vida útil de dos o un año tendrá un mayor riesgo de falla que uno nuevo. Si se trata de un tipo de disco duro que ha calificado de poco confiable, el riesgo puede ser peor. Para reducir el riesgo de falla del disco duro en general (para evitar errores que conducen a la pérdida de datos importantes), debe asegurarse de que la vida útil promedio de su disco duro sea siempre joven.
Además, también debe verificar los datos SMART u otros sistemas para verificar la capacidad de funcionamiento interna del disco para indicar qué unidades tienen un alto riesgo de falla. Cuando un disco comienza a comportarse de manera sospechosa, por ejemplo, al informar errores de escaneo o al reposicionar uno o más sectores y marcar sectores antiguos como sectores defectuosos, es probable que falle. en un tiempo no muy lejano.
Reducir el alcance del impacto en los errores del disco duro debe ser un acto de equilibrio económico. Se debe considerar reemplazar los discos duros antes de que fallen (el reemplazo costará una cierta cantidad de costo), pero si ocurre una falla en momentos críticos, el impacto en la productividad en la que incurre la organización será enorme.