Forum général.cherche-logiciel Systeme de monitoring, le quel?

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes : aucune
1
14
oct.
2014

Bonjour,

Nagios est discontinued.
Quel système de monitoring me conseillez vous? Voila ce que j'ai besoin:
- Hautes performances
- Plus de 1000 nodes, avec une map (arborescence) qui peu être très complexe
- Graph a la munin pour suivi des performances dans le temps (et alerte dessus)
- Groupe de service/hôte avec priorité des trucs critiques
- Alerte mail (avec commentaire pour savoir qui prends en charge), programmation des down normale
- Une interface agréable si possible
- Si possible fusion des index a la Chukwa, pour monitorer un cluster
- Communication avec le deamon au travers de ssh

Ce que j'ai testé:
* Munin (prends trop de cpu)
* Nagios: discontinued
* Observium, beau mais null avec beaucoup d'hote, obligation d'installer des sondes snmp pour ajouter les truc a monitorer…

Merci d'avance de vos conseilles, et dites moi pourquoi vous me le conseillez

  • # Nagios -> Shinken

    Posté par  (site web personnel) . Évalué à 5.

    regarde shinken, par Jean gabès qui poste ici régulièrement
    http://www.shinken-monitoring.org/

    ウィズコロナ

    • [^] # Re: Nagios -> Shinken

      Posté par  . Évalué à 2.

      Attention, shinken ne fait pas de « graph à la munin », il faudra ajouter graphite par exemple, ce qui se fait assez bien.

  • # Munin prend trop de CPU

    Posté par  (site web personnel) . Évalué à 2.

    Il faut que tu regardes du côté de configuration de la génération de l'html et des graphes en CGI plutôt qu'en cron, c'est le jour et la nuit ! En CGI, tout ça est généré à la consultation de l'interface web et non régulièrement.

    Being a sysadmin is easy. As easy as riding a bicycle. Except the bicycle is on fire, you’re on fire and you’re in Hell.

    • [^] # Re: Munin prend trop de CPU

      Posté par  (site web personnel) . Évalué à 1.

      En cgi, même en version 2.1, c'est super lent pour généré le contenu.

      Mon projet libre: http://ultracopier-fr.first-world.info/, mon jeu libre: http://catchchallenger.first-world.info/

  • # Zabbix

    Posté par  (site web personnel) . Évalué à 2.

    Zabbix fait tout ça.
    Après j'ai pas beaucoup d'infos type retour d'expérience à grande échelle mais c'est complet et il y a une société avec un support commercial derrière.

    • [^] # Re: Zabbix

      Posté par  (site web personnel) . Évalué à 2.

      Tout à fait d'accord. Concernant l'utilisation à grande échelle, ça ne pose pas de problème : Alexei Vladishev (le boss de Zabbix SIA), lorsque je l'ai rencontré, m'a indiqué que dans un pays "locomotive de l'Europe" il y a un "gros opérateur télécom » qui utilise Zabbix pour superviser des centaines de milliers de routeurs. J'ai également moi-même travaillé avec un opérateur français, en trois lettres, sur Zabbix.

      alpha_one_x86, tu indiques que l'interface agréable vient "après tout", pourtant tu rejettes Zabbix immédiatement à cause de ça. Il faut être cohérent. D'ailleurs tu l'appelles Zappix : as-tu vraiment au moins vu son interface ? Parce que le nom en "bb" y est inscrit partout hein…

      • [^] # Re: Zabbix

        Posté par  (site web personnel) . Évalué à 2.

        Oui, j'ai tourner la page trop vite pour zabbix, je suis en train de l'installer, il me semble bien pour ce que je veux faire… après un skins a peu ce faire.

        Mon projet libre: http://ultracopier-fr.first-world.info/, mon jeu libre: http://catchchallenger.first-world.info/

  • # Nagios: discontinued ?

    Posté par  (site web personnel) . Évalué à 3.

    La dernière version du core date d'Aout 2014… pas vraiment stoppé comme développement.

    http://www.nagios.org/projects/nagioscore/history/nagios-4-version-history

    Maintenant que tu me dises que le développement de Nagios devient de plus en plus fermé…oui.

    Sinon shinken avec pnp4nagios ou shinken avec graphite

    • [^] # Re: Nagios: discontinued ?

      Posté par  (site web personnel) . Évalué à 1.

      Sous debian c'est nagios3 qui est proposé. Idem sous gentoo. Alors que icinga2 est proposé en packet sous gentoo.
      Ok, les infos que j'avais été fausse, c'est la version libre et open source qui n'est plus si open.

      Mon projet libre: http://ultracopier-fr.first-world.info/, mon jeu libre: http://catchchallenger.first-world.info/

  • # Observium

    Posté par  . Évalué à 2.

    Observium, beau

    C'est pas uniquement beau, c'est super facile à utiliser et ça présente énormément de choses avec très peu de configuration.

    Après c'est pas un outil de monitoring, c'est un outil de métrologie.

    mais null avec beaucoup d'hote,

    Effectivement, il monte pas bien à l'échelle.

    Ici on a multiplié les instances par type d’équipement (Réseau d'infra, CPE, Serveurs, etc.).

    obligation d'installer des sondes snmp pour ajouter les truc a monitorer…

    SNMP c'est un peu le protocole de monitoring/management.

    Après le gros problème avec SNMP c'est que l'implémentation disponible sous Linux (NetSNMP) est complètement pourrie.

    • [^] # Re: Observium

      Posté par  . Évalué à 2.

      Sinon, pour répondre à la question de base, chez nous (dans un contexte de FAI), on utilise Icinga pour le monitoring (alerte) et plusieurs instances d'Observium pour la métrologie.

      Le gros problème qu'on a c'est qu'Icinga est super chiant à configurer et à maintenir. Je pense que quand viendra le moment de migrer sur autre chose, on cherchera une solution qui puisse s'intégrer avec une base de données d'équipements et se gérer en clique-clique.

    • [^] # Re: Observium

      Posté par  . Évalué à 4.

      le gros problème avec SNMP c'est que l'implémentation disponible sous Linux (NetSNMP) est complètement pourrie.

      Ça m'intéresse. Peux-tu donner un exemple stp ?

      • [^] # Re: Observium

        Posté par  . Évalué à 3.

        Les descriptions des interfaces ne sont pas prise en compte :

        Le lien avec lm-sensors est complètement buggé. Déjà, pour que NetSNMP considère la sonde comme une sonde de température, il faut que son nom commence part temp (bon, c'est pas trop grave, c'est pareil pour Observium) mais en plus, il renvoi les valeurs haute et critique comme des sondes à part entière (je crois que c'est corrigé dans la version qui est sur Debian Jessie).

        Après, ça c'est des choses qui me concerne, mais en fouillant un peu sur les internets, j'avais vu d'autres personnes avec d'autres soucis (dont je ne me souviens plus).

        À coté de ça, j'ai chez moi une RouterBoard avec RouterOS (basé sur Linux) et l'implémentation SNMP renvoi toutes les infos utile sans configuration ou bidouillage.

  • # Des produits derivés de l'opensource avec du support

    Posté par  . Évalué à 2.

    suivant ta philosophie, tu peux aussi soutenir une entreprise qui developpe avec du logiciel libre,

    pom-monitoring est une boite francaise, qui developpe autour de nagios et dispose d'une solution complete (monitoring, alerting, metrologie, reporting)
    tu peux meme avoir un "cluster" de pom en actif/passif

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.