[Linux] Infos sur What's up et son égal linuxFermé

Question

Bjr!je suis perdu dans les équivalents LINUX de What'up.Quelqu'un pourrait il me dire clairement quel logiciel sous LINUX réalise les memes choses que What's Up!C'est à dire en gros lancer des ping sur le matos du réseau (serveurs boitiers wi-fi etc...) et envoyer des mails quand le ping ne passe pas.Un petit graph à la What's up indiquant le matériel en ligne ou hors ligne... et avec des couleurs serait le bienvenu!Est ce que cacti réalise ça ou alors c'est plutôt Nagios ou autre... je comprend rien...Merci pour ces infosA+ Alexaaa

kelux · Answer

Salut,Oui Nagios est LA solution !! héhé il y en a d'autres c'est certain, mais je te conseille de le tester, je l'adore en fait ^^A contrario cacti ne renvoit pas d'alertes, il fait des graphs et c'est tout...Maintenant avec Nagios il est possible de faire aussi des graphs à la cacti....a+

Alexaaa · Answer

Slt!merci pour cette réponse, je vais tester.Au niveau des plugins tu peux me dire ceux qui sont nécessaires??Tu as installé quoi comme plugin pour que ça ressemble un max à What's Up?MerciA+Alexaaa

kelux · Answer

Salut,Je ne connais pas what's up.Les plugins installés par défaut suffisent dans la plupart des cas. De toute façon tout dépend de ce que tu as a surveiller, que des serveurs windows, que des switchs, ..., les méthodes sont différentes.ceux qui servent le plus : check_ping, check_snmp, check_nrpe , ...Il faut que tu testes un minimum, au moins avec les pings pour avoir une "petite" vision du produit.Bonne journée @+

buzz17 · Answer

Pourquoi ne pas faire un script shell lié a une tache cron ?

kelux · Answer

Car tout est déja fait avec Nagios, autant présentation des informations que la récupération...

Alexaaa · Answer

Re!J'ai passé laprem sur Nagios... J'ai du raté des trucs pendant l'install c'est pas possible...Genre je n'ai pas de fichiers de configuration?? pas de nagios.cfg pas de hosts.cfg et j'en passe... c'est normal? il doivent etre créé manuellement?Autre chose je me connecte sur http://nom_machine/nagios/et j'ai le menu nagios mais rien de plus, apres aparemment il y a un probleme de scritps cgi pourtant j'ai suivit à la lettre une doc de config!oreon ca m'aidrait pas plus??apache 2 est il nécessaire? j'ai le 1.3 et je suis sur debian!Merci pour vos réponsesA+Alex

kelux · Answer

Salut,Oui sur la plupart des distros tu dois créer les fichiers de config, ca dépend aussi si tu as installé nagios depuis les sources ou bien paquet ... mais tu dois effectivement les ajouter s'ils sont manquants.Apres cela ne sert a rien d'aller sur l'interface web de nagios tant que les fichiers de config ne sont pas faits et que le démon nagios soit démarré. D'ailleurs s'il te manque des fichiers de config ou bien s'il y a une erreur de syntaxe dans les fichiers de config, le démon nagios ne démarrera pas !Ignore pour l'instant l'erreur que tu as : nagios n'est certainement pas démarré, et des fichiers de config sont manquants (notamment le cgi.cfg, enfin peut etre) ...Oreon ne t'aidera pas plus , car il nécessite une installation de nagios DEJA fonctionnelle...Je pense que nagios 1.x ou 2.x ne change pas grand chose pour nagios. Pour ma part j'ai utilisé Nagios avec une version d'apache 2.@+

alexaaa · Answer

re! merci pour ces précisions...Je trouve nagios vraiment difficile à configurer je dois créer tous les fichiers... Je  connaît pas la syntaxe et j'ai d messages d'erreur au lancement de nagios... 8 erreurs...Checking services...Error: There are no services defined!        Checked 0 services.Checking hosts...Warning: Host 'w299' has no services associated with it!Error: Host 'w299'  has no default contact group(s) defined!Error: Notification period '24x7' specified for host 'w299' is not defined anywhere!        Checked 1 hosts.Checking host groups...Où dois-je definir les services? J'ai le fichier services.cfg suivant:define service {    name                generic-service    register            0    active_checks_enabled       1    passive_checks_enabled      1    parallelize_check       1    obsess_over_service     1    check_freshness         0    notifications_enabled       1    event_handler_enabled       1    flap_detection_enabled      1    process_perf_data       1    retain_status_information   1    retain_nonstatus_information    1    is_volatile         0    check_period            24x7    max_check_attempts      3    normal_check_interval       3    retry_check_interval        1    contact_groups          nagios    notification_interval       240    notification_period     24x7    notification_options        c,r}define service {    host_name           *    use             generic-service    service_description     ping    check_command           check_ping!300.0,20%!500.0,60%}define service {    host_name           mailhost    use             generic-service    service_description     SMTP    check_command           check_smtp}define service {    host_name           ns    use             generic-service    service_description     DNS    check_command           check_dns}define service {    hostgroup_name                  web-internet    use                             generic-service    service_description             HTTP    check_command                   check_http}merci pr votre aide.Alexaaa

kelux · Answer

Salut,Explications :Warning: Host 'w299' has no services associated with it!La machine w299 n'a aucun service de paramétrer : c'est logique tu as mis une étoile pour le check ping, il faut mettre le nom des machines séparés par des virgules: define service {host_name w299,machine1,machine2use generic-serviceservice_description pingcheck_command check_ping!300.0,20%!500.0,60%} Error: Host 'w299' has no default contact group(s) defined!As tu déclaré ton conctactgroups.cfg ? C'est obligatoire.Error: Notification period '24x7' specified for host 'w299' is not defined anywhere! Alors il te manque le timeperiods.cfgTu as installé quelle version de nagios ? La syntaxe diffère entre la 1.x et la 2.x .As tu un répertoire /usr/share/doc/nagios-core-1.2-r4/sample-configs/ , ici c'est sous gentoo, cela devrait etre différent sous debian, mais tu devrais trouver ce répertoire quelquepart, avec des fichiers .gztu copies cela dans un coin , puis tu fais :# gunzip *.gz# for file in `ls *-sample`; do new=`echo $file|cut -d"-" -f1`;mv $file $new;done# chmod 640 *.cfg# chown nagios:apache *.cfgTu auras pratiquement tous les fichiers de config avec des exemples, n'oublies pas de décommenter dans les fichiers de config, les machines/services qui ne seront pas utilisés...@+

alexaaa · Answer

Slt j'ai abandonné nagios seul... trop de fichier de config à créer avec trop d'option...De plus je me vois mal entrer toutes les machines du réseau unes par unes ds les fichiers de config!Nagios abandonné... pas vraiment!La révolution: OREON! Oreon propose une installation automatisée de nagios et des packages nécessaires... et prend même en compte une partie de la configuration de nagios... pas besoin de se taper les fichiers à la main!Belle interface web pratique+autodetection des hotes...Oreon évite vraiment de galérer!Je continue ma config de nagios via oreon et je vous sollicite si j'ai des problèmes... Pour l'instant nagios démarre tranquil :P!a+ et merci

kelux · Answer

Salut,Je ne suis pas fan du tout d'oréon, meme si ce projet est une bonne chose, je reste fidèle à nagios ;) (ah les puristes)Une principale raison est la gestion des patrons d'hotes et de services. J'avais, pour éviter de galérer de tout taper, fait des modèles un peu particuliers (chaine jusqu'a 3 ou 4 patrons imbriqués) et Oréon ne prenait pas à l'époque les patrons de ce type. Peut etre maintenant c'est pris en charge mais oreon reste oreon ... De plus l'installation automatisée etc ... je m'en méfie... je préfère utiliser mon gestionnaire d'appli pour cela. (apt-get ne ferait il pas bien le boulot hein ?? je préfère portage na !! :) Par contre pour générer des fichiers de config ca peut etre pas mal, en outre je préfère modifier avec un vi que de cliquer 50 fois sur l'interface web.L'interface web en php est par contre une très bonne chose. Ne serait ce que pour l'évolution , le graphisme, l'internationnalisation etc ... Nagios 3.x sera certainement basé sur une interface PHP voire perl et laisser les cgi au tapis... Peut etre que le travail d'oreon pourra aider sur ce point, a voir.Un point intéressant sur oreon est les plugins check_graph_* , assez pratiques, quoique maintenant nagiosgrapher permet de faire des graphiques de la meme manière.Je pense que le problème avec Oreon est plus la simplicité qu'une efficacité certaine : les fonctionnalités sont les memes, et le débutant aura moins de mal a creer ses hotes etc... mais aura t il compris ne serait ce que la moitié des paramètres que nagios propose ? (clic clic sur l'interface web , c'est beau mais quand meme...); Alors qu'en installant un "pur Nagios" il faut se taper la doc et donc comprendre au final les subtilités de nagios qui fait de lui un bon outil de monitoring.Si tu as trouvé ton bonheur c'est le principal :))N'hésite pas a poser des questions, quoique le forum oreon est plutot bien renseigné et certainement plus adapté.Bon week end!@+

alexaaa · Answer

Salut!le problème c'est que je n'ai pas beaucoup de temps pour trouver la solution de remplacement à What's Up! j'ai encore moins le temps de comprendre entièrement Nagios.Je veux juste qu'il menvoie par mail une alerte quand un serveur est pas joignable...Pour l'instant j'ai mes infos qui s'affichent (serveur OK ou pas...).Par contre j'ai aucune remontée par mail alors que j'ai bien créé un contact!Est ce que je dois saisir dans ma config linux ou dans ma config nagios l'adresse de mon serveur de mail??merci...Alexaaa

Alexaaa · Answer

re!j'ai configuré postfix et ça marche nickel je reçois des mails quand un host est éteint.Encore une petite précision, que dois-je renseigner pour que les contrôles de mes hôtes se fassent assez régulièrerement genre 10 secondes???Notification_interval dans host?Normal_check_interval,Notification_interval, Retry_check_interval dans services??Merci

kelux · Answer

'Soirdésolé de ne pas répondre plus tot, je n'ai plus le temps la journée.Tu peux effectivement régler l'intervalle de check avec normal_check_interval. La valeur attendue est en minute. Par contre c'est complètement inutile de checker des machines/éléments actifs toutes les 10 secondes ... Sur un lan 1 a 5 minutes parait suffisant, et ceci dépend aussi du nombre de paquets envoyés lors du test de ping, ainsi que le nombre de machines a checker : il ne faut pas "surcharger" le réseau inutilement.Ceci se paramètre dans ton services.cfg, en effet les machines (check host) sont checkées différemment, il faudrait refaire un tour dans la doc pour savoir avec exactitude.Sur un wan il faut mettre une valeur plus grande : entre 5 et 10 minutes, ceci dépend de la bande passante et du taux d'occupation du lien...Ne paramètre pas tes check sur le WAN comme tes checks sur le LAN.Si tu as besoin de plus d'infos sur les "indicateurs" (cpu, disque, etc...) n'hésites pas.a+

Alexaaa · Answer

Bjr!Ce n'est pas grave si t'as pas le temps... Donc encore quelques questions:Me confirmes tu qu'il faut installer une appli sur les clients pour utiliser certains plugins genre pour vérifier les infos disque dur?Peux tu me dire à quoi correspond les états UNKNOW et WARNING d'un service? UNKNOW c'est que nagios n'arrive pas à obtenir les infos? et WARNING c'est qu'il y a des paquets qui se perdent lors du ping?(avec check_host_alive).Aussi quelle est la différence entre host-notify-by-email et notify-by-email, actuellement je reçoit 2 mails par evenement mais les 2 notify précédent sont activés...MerciAlexaaa

kelux · Answer

Salut, une petite pause pour le déjeuner :)Donc on y va.Me confirmes tu qu'il faut installer une appli sur les clients pour utiliser certains plugins genre pour vérifier les infos disque dur? Oui c'est exact, à moins d'utiliser snmp pour interroger des disques (c'est toujours possible...).Pour windows tu as le choix entre NSClient (pour Net Saint Client, netsaint est l'ancien nom du projet nagios) et NRPE + des scripts/exécutables.NSClient n'est peut etre plus mis à jour depuis quelques temps. Il est simple à utiliser. En complément tu dois utiliser le plugin check_nt sur nagios.Sinon NRPE, lui est un peu difficile à manier. Avec nrpe, nagios demande au process nrpe d'exécuter tel ou tel script. Cela veut dire que tu peux avoir des scripts .bat sous windows et donner une valeur de retour ... tu peux aussi utiliser WMI avec VBScript (tiens tiens, on monitore avec Nagios+NRPE+WMI comme le fait MOM, cela a du bon tout de même ...  surtout le prix)...Bref il y a des tas de scripts pour nrpe déja tout fait. Je t'invite a passer par ici :http://www.nagiosexchange.org/Check_Plugins.21.0.htmlPasse par NSclient si tu ne veux pas perdre de temps :)Peux tu me dire à quoi correspond les états UNKNOW et WARNING d'un service?Il y a 4  types d'état de machines et de services.(En réalité 5, le flapping, mais a mettre a part...)-OK : tout va bien.-Warning : Avertissement, il faut se préoccuper de se service/machine; cela veut dire qu'il faut vérifier manuellement ce qui cloche avant que cela n'empire. D'ailleurs en monitoring il faut toutjours vérifier par soi meme.Par exemple la charge CPU on la met en warning a 75 % ...ce n'est pas critique puisqu'il reste de la marge, mais il faut surveiller quand meme ce qui se passe avant que ca empire (et on mettra 90 % en critique par exemple)-Critical : la ca sent pas bon :)-Unknown/Unreachable : Unknown pour un service et Unreachable pour un host.Unknown indique une erreur de plugin en général, et aussi tout ce qui n'est pas classifié.Unreachable : en french injoignable, la machine ne peut pas etre joignable d'un point de vue "réseau", soit la carte réseau est capoutte, pb d'ip (ca arrive), ou bien imagine un switch qui lache, les machines connectées dessus seront injoignables.Tu peux etre notifiés par mail en fonction de ces états : w,u,c,r* à indiquer dans le notification_options (f en cas de flapping)*r : pour recovery : retour à l'état normal.Aussi quelle est la différence entre host-notify-by-email et notify-by-email,Les hosts sont checkés à intervalle régulier, de manière différente d'un service...pour un service tu planifies un intervalle de check, pour les hosts tu ne peux pas, nagios fait sa sauce tout seul la dessus ( a moins que qqun me trouve de l'infos la dessus :)Donc il est normal d'avoir deux types d'envois de mail : un pour l'host et un pour le service. Mais il est vrai que lorsque l'host tombe, les services aussi tombent, d'ou une petite file indienne de mail qui arrive....actuellement je reçoit 2 mails par evenement mais les 2 notify précédent sont activés... Tu peux préciser ? par évenement : un évenement machine est différent d'un évenement service, il faut les dissocier... ca se trouve tu recois un mail pour le host et un pour un de ses services. Si tu peux expliquer à l'aide d'exemple ca pourrait le faire.@+

Alexaaa · Answer

Merci pour cette réponse complète!Il me reste pas énorme de temps pour bosser sur nagios! J'en viens dc à l'essentiel (si j'ai du temps je reviendrai sur snmp)!J'ai du mal avec l'état Warning! Pour une machine il est justifié (boitier wi-fi qui perd svt la connection), dans oreon je vois que des paquets se perdent donc je comprends le warning (Whatsup mindique la même chose)!Par contre pour 2 autres machines dt le pc où je travaille je reçois des warning alors que je n'ai aucun problème à aller sur internet et sur les partages lan et wan... De plus apparemment aucun paquets se sont perdu... Nagios serait-il sensible? je teste check_host_alive que ttes les minutes.Critical ok! qd j'éteins le pc ca passe en critical => normal!Recovery ok aussi!Unknown/Unreachable =>ok!notification_options ça c'est ok j'ai configuré!Concernant host-notify-by-email et notify-by-email si je comprend bien c'est un peu redondant?Il suffit que j'active celui pour le host et je reçois qu'un mail?exemple de mail:objet: Host DOWN alert for w299!***** Nagios 1.X*****NotificationType:PROBLEM Host: w299State: DOWNAddress: w299Info: CRITICAL - Plugin timed out after 10 secondsDate/Time: Tue Jul 25 14:51:02 CEST 20062e mail:objet: ** PROBLEM alert w299 / is  ******* Nagios 1.X *****Notification Type: PROBLEMService: Host: w299Address: w299State: Date/Time: Tue Jul 25 14:51:02 CEST 2006Additional Info:CRITICAL - Plugin timed out after 10 secondsvoila 2 mails pour le même problème...Quand je relance le pc j'ai 2 mails aussi: un pour le Recovery et un pour le up! A la limite il m'en faudrait qu'un seul!Merci pour toutes ces infos...Alexaaa

kelux · Answer

Salut,Je te fais une petite réponse en début d'après midi...a tte

kelux · Answer

Bonsoir,

Tiens ca me fait penser que j'ai oublié de répondre il y a un an à ce message 17 ...

Je vais fournir l'explication ca peut toujours servir : les 2 mails présentés sont un mail pour l'host et un mail pour un service ... si l'host tombe il est évident que les services aussi ...

D'autre part je pesne avoir bien expliqué les paramètres de notifications, alors si on ne désire pas tel ou tel mail, il faut modifier le paramètre notification_options ... ceci marche pour les services indépendemment des hosts ...

__


L'accès au site qui ne fonctionne pas :

-vérifier les droits d'accès des répertoires web...
-est ce que apache a été compilé avec les CGI, est ce que ces derniers sont activés dans apache ...

Il y a pas de mal de sites qui traitent des problèmes de Nagios, maintenant me concernant, cela fait pres d'un an que je n'ai pas mis le nez dedans ...

Bon courage.

[Linux] Infos sur What's up et son égal linux

19 réponses

Discussions similaires

Newsletters