Pics sur load average et IO Wait

28 réponses
AuteurMessage

adesyf | Yann
Membre

 

Inscrit le : 24/06/2013

# Le 26/06/2013 à 19:33

Le pic n'était pas flagrant, c'est vrai mais il y en avait quand même un.

J'ai eu un autre problème aujourd'hui. Ma partition /var s'est remplie à 100%. Du coup je n'ai plus eu de Munin. Mais à priori, les sites continuaient de fonctionner normalement sans ralentissement et le comble, c'est que depuis que le /var est à 100%, je n'ai plus de problème de loadaverage.
Je sais que je ne dois pas rester dans cet état tout de même. Donc, j'ai supprimé un gros fichier de log qui avait explosé à 14G.

Par contre j'ai toujours mon /var à 100%

# df -h
Sys. fich. Taille Util. Dispo Uti% Monté sur
/dev/md1 9,8G 3,7G 5,6G 41% /
tmpfs 16G 0 16G 0% /lib/init/rw
udev 10M 212K 9,8M 3% /dev
tmpfs 16G 4,0K 16G 1% /dev/shm
/dev/md3 7,8G 19M 7,4G 1% /tmp
/dev/md5 15G 14G 0 100% /var
/dev/md6 77G 19G 55G 25% /home

Y a une autre manip à faire pour relancer tout correctement?

Gérant de la société Dauran, éditeur de site internet et d'applications mobiles

Rano | Jean
Modérateur

Photo de Rano

Inscrit le : 13/04/2005

# Le 26/06/2013 à 21:56

Essayes de redémarrer le service du fichier de log en question. Il doit toujours avoir un pointeur en mémoire vers le fichier.

Chambres d'hote tavelOuvrir dans une nouvelle fenetre
Séjours en provenceOuvrir dans une nouvelle fenetre
Forum mariageOuvrir dans une nouvelle fenetre

adesyf | Yann
Membre

 

Inscrit le : 24/06/2013

# Le 26/06/2013 à 22:08

Effectivement c'était bien ça....
J'ai juste eu à redémarrer apache.

Merci

Du coup je me permets de revenir sur mon problème de pic sur le loadaverage (accompagné d'iowait parfois).
Pendant toute la durée de la coupure Munin, je n'ai plus eu ce problème aux heures rondes, est-ce que cela pourrait venir d'un conflit sur l'écriture de fichier dans le /var?
Car en le redémarrant correctement avant 22h00, paf revoilà le pic

Merci d'avance si quelqu'un a une piste à me fournir

Gérant de la société Dauran, éditeur de site internet et d'applications mobiles

adesyf | Yann
Membre

 

Inscrit le : 24/06/2013

# Le 28/06/2013 à 14:42

J'ai une piste pour mon problème de loadaverage.
Dans le fichier de log kernel.log, j'ai cette erreur qui revient à chaque fois que j'ai des pics. Par contre je ne sais pas ce que cela signifie.

Jun 28 06:01:02 ns302726 kernel: ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 06:01:02 ns302726 kernel: ata2.00: failed command: FLUSH CACHE
Jun 28 06:01:02 ns302726 kernel: ata2.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 06:01:02 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 06:01:02 ns302726 kernel: ata2.00: status: { DRDY }
Jun 28 06:01:02 ns302726 kernel: ata2: hard resetting link
Jun 28 06:01:02 ns302726 kernel: ata2: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 06:01:02 ns302726 kernel: ata2.00: configured for UDMA/133
Jun 28 06:01:02 ns302726 kernel: ata2.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 06:01:02 ns302726 kernel: ata2.00: device reported invalid CHS sector 0
Jun 28 06:01:02 ns302726 kernel: ata2: EH complete
Jun 28 06:04:02 ns302726 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 06:04:02 ns302726 kernel: ata1.00: failed command: FLUSH CACHE
Jun 28 06:04:02 ns302726 kernel: ata1.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 06:04:02 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 06:04:02 ns302726 kernel: ata1.00: status: { DRDY }
Jun 28 06:04:02 ns302726 kernel: ata1: hard resetting link
Jun 28 06:04:02 ns302726 kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 06:04:02 ns302726 kernel: ata1.00: configured for UDMA/133
Jun 28 06:04:02 ns302726 kernel: ata1.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 06:04:02 ns302726 kernel: ata1.00: device reported invalid CHS sector 0
Jun 28 06:04:02 ns302726 kernel: ata1: EH complete
Jun 28 08:06:02 ns302726 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 08:06:02 ns302726 kernel: ata1.00: failed command: FLUSH CACHE
Jun 28 08:06:02 ns302726 kernel: ata1.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 08:06:02 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 08:06:02 ns302726 kernel: ata1.00: status: { DRDY }
Jun 28 08:06:02 ns302726 kernel: ata1: hard resetting link
Jun 28 08:06:02 ns302726 kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 08:06:02 ns302726 kernel: ata1.00: configured for UDMA/133
Jun 28 08:06:02 ns302726 kernel: ata1.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 08:06:02 ns302726 kernel: ata1.00: device reported invalid CHS sector 0
Jun 28 08:06:02 ns302726 kernel: ata1: EH complete
Jun 28 09:03:02 ns302726 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 09:03:02 ns302726 kernel: ata1.00: failed command: FLUSH CACHE
Jun 28 09:03:02 ns302726 kernel: ata1.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 09:03:02 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 09:03:02 ns302726 kernel: ata1.00: status: { DRDY }
Jun 28 09:03:02 ns302726 kernel: ata1: hard resetting link
Jun 28 09:03:02 ns302726 kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 09:03:02 ns302726 kernel: ata1.00: configured for UDMA/133
Jun 28 09:03:02 ns302726 kernel: ata1.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 09:03:02 ns302726 kernel: ata1.00: device reported invalid CHS sector 0
Jun 28 09:03:02 ns302726 kernel: ata1: EH complete
Jun 28 09:06:01 ns302726 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 09:06:01 ns302726 kernel: ata1.00: failed command: FLUSH CACHE
Jun 28 09:06:01 ns302726 kernel: ata1.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 09:06:01 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 09:06:01 ns302726 kernel: ata1.00: status: { DRDY }
Jun 28 09:06:01 ns302726 kernel: ata1: hard resetting link
Jun 28 09:06:01 ns302726 kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 09:06:01 ns302726 kernel: ata1.00: configured for UDMA/133
Jun 28 09:06:01 ns302726 kernel: ata1.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 09:06:01 ns302726 kernel: ata1.00: device reported invalid CHS sector 0
Jun 28 09:06:01 ns302726 kernel: ata1: EH complete
Jun 28 13:04:02 ns302726 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 13:04:02 ns302726 kernel: ata1.00: failed command: FLUSH CACHE
Jun 28 13:04:02 ns302726 kernel: ata1.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 13:04:02 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 13:04:02 ns302726 kernel: ata1.00: status: { DRDY }
Jun 28 13:04:02 ns302726 kernel: ata1: hard resetting link
Jun 28 13:04:02 ns302726 kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 13:04:02 ns302726 kernel: ata1.00: configured for UDMA/133
Jun 28 13:04:02 ns302726 kernel: ata1.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 13:04:02 ns302726 kernel: ata1.00: device reported invalid CHS sector 0
Jun 28 13:04:02 ns302726 kernel: ata1: EH complete
Jun 28 14:03:02 ns302726 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Jun 28 14:03:02 ns302726 kernel: ata1.00: failed command: FLUSH CACHE
Jun 28 14:03:02 ns302726 kernel: ata1.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 28 14:03:02 ns302726 kernel: res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Jun 28 14:03:02 ns302726 kernel: ata1.00: status: { DRDY }
Jun 28 14:03:02 ns302726 kernel: ata1: hard resetting link
Jun 28 14:03:02 ns302726 kernel: ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 28 14:03:02 ns302726 kernel: ata1.00: configured for UDMA/133
Jun 28 14:03:02 ns302726 kernel: ata1.00: retrying FLUSH 0xe7 Emask 0x4
Jun 28 14:03:02 ns302726 kernel: ata1.00: device reported invalid CHS sector 0
Jun 28 14:03:02 ns302726 kernel: ata1: EH complete

Gérant de la société Dauran, éditeur de site internet et d'applications mobiles

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/06/2013 à 19:34

Disque qui déconne, très probablement un problème hardware. Qu'en dit smartctl ?

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

adesyf | Yann
Membre

 

Inscrit le : 24/06/2013

# Le 28/06/2013 à 20:48

C'est bien ça!!

A priori c'est une incompatibilité qui se présente parfois avec des disques SSD.

Après désactivation de smartctl pour les deux disques,pour l'instant je n'ai plus de pics.

Je croise les doigts

Super et merci beaucoup pour vos retours

Gérant de la société Dauran, éditeur de site internet et d'applications mobiles

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/06/2013 à 20:51

C'est un vieux système alors, non ? Genre Debian Lenny ?

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

adesyf | Yann
Membre

 

Inscrit le : 24/06/2013

# Le 28/06/2013 à 21:30

Ben non:
Distribution : Debian 7.1
Kernel : 3.8.13-xxxx-grs-ipv6-64

Gérant de la société Dauran, éditeur de site internet et d'applications mobiles

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/06/2013 à 21:37

ah, curieux : pour moi ces problèmes de compatibilité étaient fixés depuis longtemps

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

Répondre

Vous ne pouvez pas participer au forum, car votre inscription n'a pas été validée. Pour vous faire valider en tant que Membre, cliquez ici.

© MHN - Tous droits réservés | CNIL N°844440 | 24/11/2024 3:19:28 | Généré en 7.69ms | Contacts | Mentions légales |