Salut, une petite pause pour le déjeuner :)
Donc on y va.
Me confirmes tu qu'il faut installer une appli sur les clients pour utiliser certains plugins genre pour vérifier les infos disque dur?
Oui c'est exact, à moins d'utiliser snmp pour interroger des disques (c'est toujours possible...).
Pour windows tu as le choix entre NSClient (pour Net Saint Client, netsaint est l'ancien nom du projet nagios) et NRPE + des scripts/exécutables.
NSClient n'est peut etre plus mis à jour depuis quelques temps. Il est simple à utiliser. En complément tu dois utiliser le plugin check_nt sur nagios.
Sinon NRPE, lui est un peu difficile à manier. Avec nrpe, nagios demande au process nrpe d'exécuter tel ou tel script. Cela veut dire que tu peux avoir des scripts .bat sous windows et donner une valeur de retour ... tu peux aussi utiliser WMI avec VBScript (tiens tiens, on monitore avec Nagios+NRPE+WMI comme le fait MOM, cela a du bon tout de même ... surtout le prix)...
Bref il y a des tas de scripts pour nrpe déja tout fait. Je t'invite a passer par ici :
http://www.nagiosexchange.org/Check_Plugins.21.0.html
Passe par NSclient si tu ne veux pas perdre de temps :)
Peux tu me dire à quoi correspond les états UNKNOW et WARNING d'un service?
Il y a 4 types d'état de machines et de services.(En réalité 5, le flapping, mais a mettre a part...)
-OK : tout va bien.
-Warning : Avertissement, il faut se préoccuper de se service/machine; cela veut dire qu'il faut vérifier manuellement ce qui cloche avant que cela n'empire. D'ailleurs en monitoring il faut toutjours vérifier par soi meme.
Par exemple la charge CPU on la met en warning a 75 % ...ce n'est pas critique puisqu'il reste de la marge, mais il faut surveiller quand meme ce qui se passe avant que ca empire (et on mettra 90 % en critique par exemple)
-Critical : la ca sent pas bon :)
-Unknown/Unreachable : Unknown pour un service et Unreachable pour un host.
Unknown indique une erreur de plugin en général, et aussi tout ce qui n'est pas classifié.
Unreachable : en french injoignable, la machine ne peut pas etre joignable d'un point de vue "réseau", soit la carte réseau est capoutte, pb d'ip (ca arrive), ou bien imagine un switch qui lache, les machines connectées dessus seront injoignables.
Tu peux etre notifiés par mail en fonction de ces états : w,u,c,r* à indiquer dans le notification_options (f en cas de flapping)
*r : pour recovery : retour à l'état normal.
Aussi quelle est la différence entre host-notify-by-email et notify-by-email,
Les hosts sont checkés à intervalle régulier, de manière différente d'un service...pour un service tu planifies un intervalle de check, pour les hosts tu ne peux pas, nagios fait sa sauce tout seul la dessus ( a moins que qqun me trouve de l'infos la dessus :)
Donc il est normal d'avoir deux types d'envois de mail : un pour l'host et un pour le service. Mais il est vrai que lorsque l'host tombe, les services aussi tombent, d'ou une petite file indienne de mail qui arrive....
actuellement je reçoit 2 mails par evenement mais les 2 notify précédent sont activés...
Tu peux préciser ? par évenement : un évenement machine est différent d'un évenement service, il faut les dissocier... ca se trouve tu recois un mail pour le host et un pour un de ses services. Si tu peux expliquer à l'aide d'exemple ca pourrait le faire.
@+
Luc L.
[Gentoo Is Good]