Auteur | Message |
---|---|
mirage
| Inscrit le : 04/05/2005 |
# Le 03/08/2008 à 12:53 Salut, Aug 3 12:46:05 constellation kernel: sda: Write Protect is off Aug 3 12:46:05 constellation kernel: sda: Mode Sense: 00 3a 00 00 Aug 3 12:46:05 constellation kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Aug 3 12:46:05 constellation kernel: ata1.00: (BMDMA stat 0x20) Aug 3 12:46:05 constellation kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error) Aug 3 12:46:05 constellation kernel: ata1: EH complete Aug 3 12:46:05 constellation kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Aug 3 12:46:05 constellation kernel: ata1.00: (BMDMA stat 0x20) Aug 3 12:46:05 constellation kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error) Aug 3 12:46:05 constellation kernel: ata1: EH complete Aug 3 12:46:05 constellation kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Aug 3 12:46:05 constellation kernel: ata1.00: (BMDMA stat 0x20) Aug 3 12:46:05 constellation kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error) Aug 3 12:46:05 constellation kernel: ata1: EH complete Aug 3 12:46:05 constellation kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Aug 3 12:46:05 constellation kernel: ata1.00: (BMDMA stat 0x20) Aug 3 12:46:05 constellation kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error) Aug 3 12:46:05 constellation kernel: ata1: EH complete Aug 3 12:46:05 constellation kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Aug 3 12:46:05 constellation kernel: ata1.00: (BMDMA stat 0x20) Aug 3 12:46:05 constellation kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error) Aug 3 12:46:05 constellation kernel: ata1: EH complete Aug 3 12:46:05 constellation kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Aug 3 12:46:05 constellation kernel: ata1.00: (BMDMA stat 0x20) Aug 3 12:46:05 constellation kernel: ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error) Aug 3 12:46:05 constellation kernel: sd 0:0:0:0: SCSI error: return code = 0x08000002 Aug 3 12:46:05 constellation kernel: sda: Current: sense key: Medium Error Aug 3 12:46:05 constellation kernel: Additional sense: Unrecovered read error - auto reallocate failed Aug 3 12:46:05 constellation kernel: end_request: I/O error, dev sda, sector 432427986 Aug 3 12:46:05 constellation kernel: ata1: EH complete Aug 3 12:46:05 constellation kernel: SCSI device sda: drive cache: write back Aug 3 12:46:05 constellation kernel: SCSI device sda: 488397168 512-byte hdwr sectors (250059 MB) Aug 3 12:46:05 constellation kernel: sda: Write Protect is off Aug 3 12:46:05 constellation kernel: sda: Mode Sense: 00 3a 00 00 Aug 3 12:46:05 constellation kernel: SCSI device sda: drive cache: write back J'ai aussi Smart qui m'envoie des erreurs par mail : Device: /dev/sda, ATA error count increased from 16488 to 17388 Device: /dev/sda, 90 Currently unreadable (pending) sectors Device: /dev/sda, 90 Offline uncorrectable sectors J'ai bien l'impression que le disque va rendre l'âme. J'ai raison ? NB : J'ai lancé un test smartmontools, encore environ 2h avant qu'il soit complet. |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 03/08/2008 à 13:41 Hello, -s (S/../.././02|L/../../6/03) start a short self-test every day between 2-3am, and a long self test Saturdays between 3-4am. Vu le peu d'impact sur les perfs, c'est un truc à prévoir en continue. Et sinon un "smartctl -a /dev/sda" donne des chiffres inquiétants dans le zouli tableau ? D'ailleurs pour comprendre un peu ce qu'il raconte : http://en.wikipedia.org/wiki/Self-Monitoring%2C_An... |
mirage
| Vincent Inscrit le : 04/05/2005 |
# Le 03/08/2008 à 13:51
Bool a dit : ça m'en a tout l'air oui. Déja une partition qui passe en readonly, généralement c'est pas bon signe (même si le disque n'a rien, le FS en tous cas a un coup dans l'aile). Ouep, on est d'accord. Bool a dit : Pour smartmontools, c'est bien aussi de faire des tests complets régulièrement, et ça fait partie de ses options. Y a des exemples dans le fichier de conf (/etc/smartd.conf) : -s (S/../.././02|L/../../6/03) start a short self-test every day between 2-3am, and a long self test Saturdays between 3-4am. Vu le peu d'impact sur les perfs, c'est un truc à prévoir en continue. C'est déjà en place et c'est ça qui m'envoie des mails depuis quelques temps... mais c'est voir le système de fichiers en read-only qui m'a attiré l'oeil... Bool a dit : Et sinon un "smartctl -a /dev/sda" donne des chiffres inquiétants dans le zouli tableau ? Faut lui rajouter un "-d ata" pour que ça fonctionne sur les Sata. Les résultats : === START OF INFORMATION SECTION === Le disque est encore sous garantie par Seagate (jusqu'en 2011) mais on l'a acheté chez LDLC. Je passe par LDLC ou Seagate ? (LDLC risque d'avoir des délais plus rapides mais je doute qu'ils en veuillent, ça fait plus d'un an qu'on l'a acheté) |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 03/08/2008 à 15:03 Aucun test "long" ou "court" n'a pu être fait jusqu'au bout : à chaque fois il a échoué dès 10%... et tu as attendu que la partition passe en readonly pour t'inquiéter de la santé d'un disque sur une machine de backup ? Elle est en RAID au moins ? |
mirage
| Vincent Inscrit le : 04/05/2005 |
# Le 03/08/2008 à 15:06
Bool a dit : Aucun test "long" ou "court" n'a pu être fait jusqu'au bout : à chaque fois il a échoué dès 10%... et tu as attendu que la partition passe en readonly pour t'inquiéter de la santé d'un disque sur une machine de backup ? Elle est en RAID au moins ? Mouep, j'ai pas spécialement fait attention et elle n'est pas en RAID non... je ne maîtrise pas suffisamment pour le faire (j'ai rien trouvé de suffisamment clair pour le faire mais si tu as, je prends ). Bon on va voir avec LDLC puis Seagate s'il le faut Merci Bool |
caaptusss
| Jérémy Inscrit le : 25/09/2007 |
# Le 03/08/2008 à 15:18 Chez Maxtor, ça se fait via leur site, tu donne le numéro de série, tu renvoit, et tu reçoit le nouveau disque 2 semaines plus tard. |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 03/08/2008 à 17:24 Mettre en place un raid software est très simple : aptitude install mdadm Et pour créer la partition raid md6 (en raid 1) sur sda6 + sdb6 : mdadm --create /dev/md6 --level=1 --raid-devices=2 /dev/sda6 /dev/sdb6 Il y a aussi des raccourcis : mdadm --create /dev/md7 --level=5 --raid-devices=4 /dev/sd[abcd]4 Par sécurité, penser à faire un mdadm --detail --scan qui va lister les partitions RAID puis les ajouter dans le fichier de conf /etc/mdadm.conf (il y a une section dédiée à cela). Ce qui donnerait par exemple : # definitions of existing MD arrays C'est tout pour ce qui est de la création. Il y a beaucoup d'autres options pour enlever un disque à chaud, prévoir un disque en spare, etc. Mais pour un usage classique celles ci suffisent déjà. Coté suivi : cat /proc/mdstat EDIT : ah si j'oubliais deux trucs, pour une détection automatique par linux il faut changer le type des "vraies" partition en FD (Linux raid autodetect). Ca se fait avec fdisk. Et pour se simplifier la tâche, pour recopier le partitionnement du disque A sur le disque B (attention, à ne pas faire à la légère hein) : sfdisk -d /dev/sda | sfdisk /dev/sdb |
mirage
| Vincent Inscrit le : 04/05/2005 |
# Le 03/08/2008 à 18:11 Merci, je vais mettre ça en place quand on aura reçu le nouveau disque |
mirage
| Vincent Inscrit le : 04/05/2005 |
# Le 11/01/2009 à 12:00 Vive le RAID... le disque que Seagate nous a renvoyé vient de mourir. |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 11/01/2009 à 12:15 Ca dépend aussi de la température d'utilisation (pour moi c'est à cause de ça qu'il y avait autant de problème de disques chez OVH il y a quelques années) ; SMART doit t'indiquer la température MAX de l'autre disque, non ? |
mirage
| Vincent Inscrit le : 04/05/2005 |
# Le 11/01/2009 à 12:32 32° d'après Smartmontools. Chez OVH, j'ai 27° de moyenne et sur mon MacBook, le disque est à 30°. |
Rano
| Jean Inscrit le : 13/04/2005 |
# Le 11/01/2009 à 12:36 (Je m'incruste...) j'ai un serveur qui au reboot, a un pb disk une fois sur deux en gros. Il est en raid soft :
Le 2/1 c'est pas bon non ? je dois faire quoi pour remettre en ordre ? Je change de serveur ? |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 11/01/2009 à 16:52 Mirage : 32° c'est loin d'être énorme, il t'indique un "pic" ou pas ? Genre perso j'ai eu la ventilation d'un PC mal réglée, même si maintenant le disque est "au frais", j'ai un vilain "Airflow_Temperature_Cel => WHEN_FAILED => In_the_past" qui indique à Seagate que le disque a été soumis à une trop forte température et n'est donc plus sous garantie |
mirage
| Vincent Inscrit le : 04/05/2005 |
# Le 12/01/2009 à 09:27
Bool a dit : Mirage : 32° c'est loin d'être énorme, il t'indique un "pic" ou pas ? Genre perso j'ai eu la ventilation d'un PC mal réglée, même si maintenant le disque est "au frais", j'ai un vilain "Airflow_Temperature_Cel => WHEN_FAILED => In_the_past" qui indique à Seagate que le disque a été soumis à une trop forte température et n'est donc plus sous garantie Non, je n'ai pas cette ligne. Actuellement (vu que c'est un serveur de backup, il ne fonctionne que la nuit), il est à 25°. |
Rano
| Jean Inscrit le : 13/04/2005 |
# Le 12/01/2009 à 11:23 (Bon, j'ai réussi à m'en sortir avec mdadm) |
Vous ne pouvez pas participer au forum, car votre inscription n'a pas été validée. Pour vous faire valider en tant que Membre, cliquez ici.
© MHN - Tous droits réservés | CNIL N°844440 | 24/11/2024 4:42:00 | Généré en 48.78ms | Contacts | Mentions légales |