[Linux] Infos sur What's up et son égal linux

Fermé
Alexaaa - 18 juil. 2006 à 17:41
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 - 21 juin 2007 à 02:43
Bjr!
je suis perdu dans les équivalents LINUX de What'up.
Quelqu'un pourrait il me dire clairement quel logiciel sous LINUX réalise les memes choses que What's Up!
C'est à dire en gros lancer des ping sur le matos du réseau (serveurs boitiers wi-fi etc...) et envoyer des mails quand le ping ne passe pas.
Un petit graph à la What's up indiquant le matériel en ligne ou hors ligne... et avec des couleurs serait le bienvenu!
Est ce que cacti réalise ça ou alors c'est plutôt Nagios ou autre... je comprend rien...
Merci pour ces infos
A+
Alexaaa
A voir également:

19 réponses

kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
18 juil. 2006 à 19:44
Salut,

Oui Nagios est LA solution !! héhé il y en a d'autres c'est certain, mais je te conseille de le tester, je l'adore en fait ^^

A contrario cacti ne renvoit pas d'alertes, il fait des graphs et c'est tout...

Maintenant avec Nagios il est possible de faire aussi des graphs à la cacti....

a+
0
Slt!
merci pour cette réponse, je vais tester.
Au niveau des plugins tu peux me dire ceux qui sont nécessaires??
Tu as installé quoi comme plugin pour que ça ressemble un max à What's Up?
Merci
A+
Alexaaa
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
19 juil. 2006 à 14:54
Salut,

Je ne connais pas what's up.

Les plugins installés par défaut suffisent dans la plupart des cas. De toute façon tout dépend de ce que tu as a surveiller, que des serveurs windows, que des switchs, ..., les méthodes sont différentes.

ceux qui servent le plus : check_ping, check_snmp, check_nrpe , ...

Il faut que tu testes un minimum, au moins avec les pings pour avoir une "petite" vision du produit.

Bonne journée @+
0
buzz17 Messages postés 252 Date d'inscription lundi 27 février 2006 Statut Membre Dernière intervention 3 septembre 2007 33
19 juil. 2006 à 16:14
Pourquoi ne pas faire un script shell lié a une tache cron ?
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
19 juil. 2006 à 16:20
Car tout est déja fait avec Nagios, autant présentation des informations que la récupération...
0
Re!
J'ai passé laprem sur Nagios... J'ai du raté des trucs pendant l'install c'est pas possible...
Genre je n'ai pas de fichiers de configuration?? pas de nagios.cfg pas de hosts.cfg et j'en passe... c'est normal? il doivent etre créé manuellement?
Autre chose je me connecte sur http://nom_machine/nagios/
et j'ai le menu nagios mais rien de plus, apres aparemment il y a un probleme de scritps cgi pourtant j'ai suivit à la lettre une doc de config!
oreon ca m'aidrait pas plus??
apache 2 est il nécessaire? j'ai le 1.3 et je suis sur debian!
Merci pour vos réponses
A+
Alex
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
19 juil. 2006 à 21:37
Salut,

Oui sur la plupart des distros tu dois créer les fichiers de config, ca dépend aussi si tu as installé nagios depuis les sources ou bien paquet ... mais tu dois effectivement les ajouter s'ils sont manquants.

Apres cela ne sert a rien d'aller sur l'interface web de nagios tant que les fichiers de config ne sont pas faits et que le démon nagios soit démarré. D'ailleurs s'il te manque des fichiers de config ou bien s'il y a une erreur de syntaxe dans les fichiers de config, le démon nagios ne démarrera pas !

Ignore pour l'instant l'erreur que tu as : nagios n'est certainement pas démarré, et des fichiers de config sont manquants (notamment le cgi.cfg, enfin peut etre) ...

Oreon ne t'aidera pas plus , car il nécessite une installation de nagios DEJA fonctionnelle...

Je pense que nagios 1.x ou 2.x ne change pas grand chose pour nagios. Pour ma part j'ai utilisé Nagios avec une version d'apache 2.

@+
0
re! merci pour ces précisions...
Je trouve nagios vraiment difficile à configurer je dois créer tous les fichiers... Je connaît pas la syntaxe et j'ai d messages d'erreur au lancement de nagios... 8 erreurs...

Checking services...
Error: There are no services defined!
Checked 0 services.
Checking hosts...
Warning: Host 'w299' has no services associated with it!
Error: Host 'w299' has no default contact group(s) defined!
Error: Notification period '24x7' specified for host 'w299' is not defined anywhere!
Checked 1 hosts.
Checking host groups...

Où dois-je definir les services? J'ai le fichier services.cfg suivant:

define service {
name generic-service
register 0

active_checks_enabled 1
passive_checks_enabled 1
parallelize_check 1
obsess_over_service 1
check_freshness 0
notifications_enabled 1
event_handler_enabled 1
flap_detection_enabled 1
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1

is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 3
retry_check_interval 1
contact_groups nagios
notification_interval 240
notification_period 24x7
notification_options c,r
}

define service {
host_name *
use generic-service
service_description ping
check_command check_ping!300.0,20%!500.0,60%
}

define service {
host_name mailhost
use generic-service
service_description SMTP
check_command check_smtp
}

define service {
host_name ns
use generic-service
service_description DNS
check_command check_dns
}
define service {
hostgroup_name web-internet
use generic-service
service_description HTTP
check_command check_http
}
merci pr votre aide.
Alexaaa
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
20 juil. 2006 à 13:39
Salut,

Explications :

Warning: Host 'w299' has no services associated with it!


La machine w299 n'a aucun service de paramétrer : c'est logique tu as mis une étoile pour le check ping, il faut mettre le nom des machines séparés par des virgules:

define service {
host_name w299,machine1,machine2
use generic-service
service_description ping
check_command check_ping!300.0,20%!500.0,60%
}

Error: Host 'w299' has no default contact group(s) defined!

As tu déclaré ton conctactgroups.cfg ? C'est obligatoire.


Error: Notification period '24x7' specified for host 'w299' is not defined anywhere!

Alors il te manque le timeperiods.cfg


Tu as installé quelle version de nagios ? La syntaxe diffère entre la 1.x et la 2.x .

As tu un répertoire /usr/share/doc/nagios-core-1.2-r4/sample-configs/ , ici c'est sous gentoo, cela devrait etre différent sous debian, mais tu devrais trouver ce répertoire quelquepart, avec des fichiers .gz

tu copies cela dans un coin , puis tu fais :
# gunzip *.gz
# for file in `ls *-sample`; do new=`echo $file|cut -d"-" -f1`;mv $file $new;done
# chmod 640 *.cfg
# chown nagios:apache *.cfg


Tu auras pratiquement tous les fichiers de config avec des exemples, n'oublies pas de décommenter dans les fichiers de config, les machines/services qui ne seront pas utilisés...

@+
0
Slt j'ai abandonné nagios seul... trop de fichier de config à créer avec trop d'option...
De plus je me vois mal entrer toutes les machines du réseau unes par unes ds les fichiers de config!
Nagios abandonné... pas vraiment!
La révolution: OREON! Oreon propose une installation automatisée de nagios et des packages nécessaires... et prend même en compte une partie de la configuration de nagios... pas besoin de se taper les fichiers à la main!
Belle interface web pratique+autodetection des hotes...
Oreon évite vraiment de galérer!
Je continue ma config de nagios via oreon et je vous sollicite si j'ai des problèmes... Pour l'instant nagios démarre tranquil :P!
a+ et merci
0
Salut, j'utilise également Nagios et Oreon mais je ne trouve pas le moyen de faire l'autodétection de mon réseau donc je voudrai savoir quelle version tu utilises car moi voici mon installation Installation :
Nagios 2.9
Nagios plugins 1.4.8
Oreon 1.3.3
Perfparse 0.106.1
Fedora6 - i386
Et je voudrai savoir ce qui cloche car sous oreon je n'ai aucun onglet qui me permet de faire de l'autodétection et si il faut ajouter un plug-in, lequel et comment?
cordialement
0
kelux > benjamin
29 mai 2007 à 10:54
Salut,

Oublie la détection automatique du réseau, tu arriveras à faire du "bon" monitoring uniquement si tu mets les mains dans le camboui.

La détection automatique c'est quoi ? Un ping de broadcast ? une recherche avec SNMP ?

Si ce n'est que ça , c'est très limité en fonctionnalité, c'est sur que si l'on a 2 switch qui se battent en duel...
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
21 juil. 2006 à 17:57
Salut,

Je ne suis pas fan du tout d'oréon, meme si ce projet est une bonne chose, je reste fidèle à nagios ;) (ah les puristes)

Une principale raison est la gestion des patrons d'hotes et de services. J'avais, pour éviter de galérer de tout taper, fait des modèles un peu particuliers (chaine jusqu'a 3 ou 4 patrons imbriqués) et Oréon ne prenait pas à l'époque les patrons de ce type. Peut etre maintenant c'est pris en charge mais oreon reste oreon ...

De plus l'installation automatisée etc ... je m'en méfie... je préfère utiliser mon gestionnaire d'appli pour cela. (apt-get ne ferait il pas bien le boulot hein ?? je préfère portage na !! :)

Par contre pour générer des fichiers de config ca peut etre pas mal, en outre je préfère modifier avec un vi que de cliquer 50 fois sur l'interface web.

L'interface web en php est par contre une très bonne chose. Ne serait ce que pour l'évolution , le graphisme, l'internationnalisation etc ... Nagios 3.x sera certainement basé sur une interface PHP voire perl et laisser les cgi au tapis... Peut etre que le travail d'oreon pourra aider sur ce point, a voir.

Un point intéressant sur oreon est les plugins check_graph_* , assez pratiques, quoique maintenant nagiosgrapher permet de faire des graphiques de la meme manière.

Je pense que le problème avec Oreon est plus la simplicité qu'une efficacité certaine : les fonctionnalités sont les memes, et le débutant aura moins de mal a creer ses hotes etc... mais aura t il compris ne serait ce que la moitié des paramètres que nagios propose ? (clic clic sur l'interface web , c'est beau mais quand meme...); Alors qu'en installant un "pur Nagios" il faut se taper la doc et donc comprendre au final les subtilités de nagios qui fait de lui un bon outil de monitoring.

Si tu as trouvé ton bonheur c'est le principal :))

N'hésite pas a poser des questions, quoique le forum oreon est plutot bien renseigné et certainement plus adapté.

Bon week end!

@+
0
Salut!
le problème c'est que je n'ai pas beaucoup de temps pour trouver la solution de remplacement à What's Up! j'ai encore moins le temps de comprendre entièrement Nagios.
Je veux juste qu'il menvoie par mail une alerte quand un serveur est pas joignable...
Pour l'instant j'ai mes infos qui s'affichent (serveur OK ou pas...).
Par contre j'ai aucune remontée par mail alors que j'ai bien créé un contact!
Est ce que je dois saisir dans ma config linux ou dans ma config nagios l'adresse de mon serveur de mail??
merci...
Alexaaa
0
re!
j'ai configuré postfix et ça marche nickel je reçois des mails quand un host est éteint.
Encore une petite précision, que dois-je renseigner pour que les contrôles de mes hôtes se fassent assez régulièrerement genre 10 secondes???
Notification_interval dans host?
Normal_check_interval,Notification_interval, Retry_check_interval dans services??

Merci
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
24 juil. 2006 à 20:16
'Soir

désolé de ne pas répondre plus tot, je n'ai plus le temps la journée.

Tu peux effectivement régler l'intervalle de check avec normal_check_interval. La valeur attendue est en minute.
Par contre c'est complètement inutile de checker des machines/éléments actifs toutes les 10 secondes ...

Sur un lan 1 a 5 minutes parait suffisant, et ceci dépend aussi du nombre de paquets envoyés lors du test de ping, ainsi que le nombre de machines a checker : il ne faut pas "surcharger" le réseau inutilement.

Ceci se paramètre dans ton services.cfg, en effet les machines (check host) sont checkées différemment, il faudrait refaire un tour dans la doc pour savoir avec exactitude.

Sur un wan il faut mettre une valeur plus grande : entre 5 et 10 minutes, ceci dépend de la bande passante et du taux d'occupation du lien...

Ne paramètre pas tes check sur le WAN comme tes checks sur le LAN.
Si tu as besoin de plus d'infos sur les "indicateurs" (cpu, disque, etc...) n'hésites pas.

a+
0
Bjr!
Ce n'est pas grave si t'as pas le temps...
Donc encore quelques questions:
Me confirmes tu qu'il faut installer une appli sur les clients pour utiliser certains plugins genre pour vérifier les infos disque dur?
Peux tu me dire à quoi correspond les états UNKNOW et WARNING d'un service? UNKNOW c'est que nagios n'arrive pas à obtenir les infos? et WARNING c'est qu'il y a des paquets qui se perdent lors du ping?(avec check_host_alive).
Aussi quelle est la différence entre host-notify-by-email et notify-by-email, actuellement je reçoit 2 mails par evenement mais les 2 notify précédent sont activés...
Merci
Alexaaa
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
25 juil. 2006 à 14:10
Salut, une petite pause pour le déjeuner :)


Donc on y va.

Me confirmes tu qu'il faut installer une appli sur les clients pour utiliser certains plugins genre pour vérifier les infos disque dur?

Oui c'est exact, à moins d'utiliser snmp pour interroger des disques (c'est toujours possible...).
Pour windows tu as le choix entre NSClient (pour Net Saint Client, netsaint est l'ancien nom du projet nagios) et NRPE + des scripts/exécutables.
NSClient n'est peut etre plus mis à jour depuis quelques temps. Il est simple à utiliser. En complément tu dois utiliser le plugin check_nt sur nagios.
Sinon NRPE, lui est un peu difficile à manier. Avec nrpe, nagios demande au process nrpe d'exécuter tel ou tel script. Cela veut dire que tu peux avoir des scripts .bat sous windows et donner une valeur de retour ... tu peux aussi utiliser WMI avec VBScript (tiens tiens, on monitore avec Nagios+NRPE+WMI comme le fait MOM, cela a du bon tout de même ... surtout le prix)...
Bref il y a des tas de scripts pour nrpe déja tout fait. Je t'invite a passer par ici :

http://www.nagiosexchange.org/Check_Plugins.21.0.html

Passe par NSclient si tu ne veux pas perdre de temps :)

Peux tu me dire à quoi correspond les états UNKNOW et WARNING d'un service?

Il y a 4 types d'état de machines et de services.(En réalité 5, le flapping, mais a mettre a part...)

-OK : tout va bien.

-Warning : Avertissement, il faut se préoccuper de se service/machine; cela veut dire qu'il faut vérifier manuellement ce qui cloche avant que cela n'empire. D'ailleurs en monitoring il faut toutjours vérifier par soi meme.
Par exemple la charge CPU on la met en warning a 75 % ...ce n'est pas critique puisqu'il reste de la marge, mais il faut surveiller quand meme ce qui se passe avant que ca empire (et on mettra 90 % en critique par exemple)

-Critical : la ca sent pas bon :)

-Unknown/Unreachable : Unknown pour un service et Unreachable pour un host.
Unknown indique une erreur de plugin en général, et aussi tout ce qui n'est pas classifié.
Unreachable : en french injoignable, la machine ne peut pas etre joignable d'un point de vue "réseau", soit la carte réseau est capoutte, pb d'ip (ca arrive), ou bien imagine un switch qui lache, les machines connectées dessus seront injoignables.

Tu peux etre notifiés par mail en fonction de ces états : w,u,c,r* à indiquer dans le notification_options (f en cas de flapping)

*r : pour recovery : retour à l'état normal.

Aussi quelle est la différence entre host-notify-by-email et notify-by-email,

Les hosts sont checkés à intervalle régulier, de manière différente d'un service...pour un service tu planifies un intervalle de check, pour les hosts tu ne peux pas, nagios fait sa sauce tout seul la dessus ( a moins que qqun me trouve de l'infos la dessus :)
Donc il est normal d'avoir deux types d'envois de mail : un pour l'host et un pour le service. Mais il est vrai que lorsque l'host tombe, les services aussi tombent, d'ou une petite file indienne de mail qui arrive....

actuellement je reçoit 2 mails par evenement mais les 2 notify précédent sont activés...

Tu peux préciser ? par évenement : un évenement machine est différent d'un évenement service, il faut les dissocier... ca se trouve tu recois un mail pour le host et un pour un de ses services. Si tu peux expliquer à l'aide d'exemple ca pourrait le faire.

@+

0
Merci pour cette réponse complète!
Il me reste pas énorme de temps pour bosser sur nagios! J'en viens dc à l'essentiel (si j'ai du temps je reviendrai sur snmp)!

J'ai du mal avec l'état Warning! Pour une machine il est justifié (boitier wi-fi qui perd svt la connection), dans oreon je vois que des paquets se perdent donc je comprends le warning (Whatsup mindique la même chose)!
Par contre pour 2 autres machines dt le pc où je travaille je reçois des warning alors que je n'ai aucun problème à aller sur internet et sur les partages lan et wan... De plus apparemment aucun paquets se sont perdu... Nagios serait-il sensible? je teste check_host_alive que ttes les minutes.

Critical ok! qd j'éteins le pc ca passe en critical => normal!
Recovery ok aussi!
Unknown/Unreachable =>ok!
notification_options ça c'est ok j'ai configuré!

Concernant host-notify-by-email et notify-by-email si je comprend bien c'est un peu redondant?
Il suffit que j'active celui pour le host et je reçois qu'un mail?
exemple de mail:
objet: Host DOWN alert for w299!
***** Nagios 1.X*****Notification
Type:PROBLEM
Host: w299
State: DOWNAddress: w299
Info: CRITICAL - Plugin timed out after 10 seconds
Date/Time: Tue Jul 25 14:51:02 CEST 2006

2e mail:
objet: ** PROBLEM alert w299 / is **
***** Nagios 1.X *****

Notification Type: PROBLEM

Service:
Host: w299
Address: w299
State:

Date/Time: Tue Jul 25 14:51:02 CEST 2006

Additional Info:

CRITICAL - Plugin timed out after 10 seconds

voila 2 mails pour le même problème...

Quand je relance le pc j'ai 2 mails aussi: un pour le Recovery et un pour le up! A la limite il m'en faudrait qu'un seul!

Merci pour toutes ces infos...
Alexaaa
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
26 juil. 2006 à 10:04
Salut,

Je te fais une petite réponse en début d'après midi...

a tte
0
salut!
J'ai trouvé cette conversation alors que je faisais des recherches sur notre magnifique superviseur... Nagios. En fait moi j'en suis au point où j'ai installé correctement le version 2.9 j'ai récupérer les .cfg de samples... et quand je lance Nagios, il y a pas d'erreurs ni rien... sauf qu'au niveau de l'interface graphique ça m'affiche rien quand j'essaye d'acceder à un .cgi...
Pour le moment je fais que me documenter pour savoir comment ça marche et qu'est ce que ça fait... Donc si ça te dérange pas de me donner quelques pistes.. je ne dirai pas nn :p

ah oui je travail sous Red Hat de Linux, j'ai mon serveur apache 2.0 qui tourne nikel! et j'ai installlé les plugins d'une version 1.x...

Merci bcp pour ton aide (si ça te derange pas)

++
0
kelux Messages postés 3065 Date d'inscription vendredi 18 juin 2004 Statut Contributeur Dernière intervention 20 janvier 2023 432
21 juin 2007 à 02:43
Bonsoir,

Tiens ca me fait penser que j'ai oublié de répondre il y a un an à ce message 17 ...

Je vais fournir l'explication ca peut toujours servir : les 2 mails présentés sont un mail pour l'host et un mail pour un service ... si l'host tombe il est évident que les services aussi ...

D'autre part je pesne avoir bien expliqué les paramètres de notifications, alors si on ne désire pas tel ou tel mail, il faut modifier le paramètre notification_options ... ceci marche pour les services indépendemment des hosts ...

__


L'accès au site qui ne fonctionne pas :

-vérifier les droits d'accès des répertoires web...
-est ce que apache a été compilé avec les CGI, est ce que ces derniers sont activés dans apache ...

Il y a pas de mal de sites qui traitent des problèmes de Nagios, maintenant me concernant, cela fait pres d'un an que je n'ai pas mis le nez dedans ...

Bon courage.
0