Forum général.cherche-logiciel Outil libre de monitoring

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
2
5
juin
2018

Bonjour à tous,

je cherche une solution de monitoring pour un usage professionnel qui me permette de remplacer notre solution actuelle.

Les caractéristiques de base que je recherche sont les suivantes:

  • logiciel libre
  • logiciel très stable
  • monitoring actif (les services poussent des messages “je suis en bonne santé”)
  • monitoring passif (les services sont examinés par un programme externe qui envoie ses observations au système de monitoring)
  • capacité de visualiser les métriques et “time-series” générées, sous forme graphique ou numérique (type meilleur valeur de la dernière heure, moyenne du dernier jour, etc.)
  • capacité de créer des “dashboards” pour organiser les métriques et les alarmes (rudimentaires mais faciles à préparer)
  • capacité de définir des alarmes sur les métriques avec possibilité de “push notification” (SMS ou autre) sur le téléphone
  • programmable par une API (au pire un truc en JSON/HTTP qu'on peut programmer via curl, mais s'il existe un client python ou dans un autre langage populaire, c'est mieux :) )
  • peut monitorer les services classiques (serveur HTTP/HTTPS, SSH, MySQL)

Les capacités supplémentaires (sympa mais pas vital) sont

  • possibilité de définir des patrons de monitoring (si je change mon monitoring pour un environnement production je veux que mon environnement de test bénéficie des mêmes modifications)

  • possibilité de documenter les protocoles de réaction avec les alarmes

Je suis curieux de connaître vos recommendations – ou vos anti-recommendations! :o)

Ma solution actuelle est PRTG, un outil propriétaire. Les possibilités d'organisation sont inutilisables (UI pourrie).

  • # Quelle est ta solution actuelle et pourquoi ne convient-elle plus ?

    Posté par  (site web personnel, Mastodon) . Évalué à 4.

    Ca permettra d'obtenir des réponses plus pertinentes parce que - par exemple, on ne suggèrera pas ce que tu utilises déjà (de plus ça permettra d'identifier les limitations de la solution technique).

    De notre côté on utilise Shinken. Avantage : on peut réutiliser les modules Nagios. Inconvénient : je trouve ça ps forcément top en terme d'organisation du dashboard ; je sais pas ce qu'on peut personnaliser ou pas ni ce qu'il est possible de faire en "push".

  • # Icinga2

    Posté par  (site web personnel) . Évalué à 2. Dernière modification le 05 juin 2018 à 10:21.

    Le plus maintenu dans les dérivés plus ou moins lointains de Nagios c'est Icinga2.

    Vu ta liste de besoin assez traditionnels ça rentrerait à peu près dans ce que tu cherches.

  • # Centreon

    Posté par  (Mastodon) . Évalué à 1.

    Salut,

    Centreon : https://github.com/centreon/centreon

    Originellement c'était un fork de Nagios. Certains plugins Nagios restent compatibles, mais Centreon a ses propres plugins, en opensource également : https://github.com/centreon/centreon-plugins

  • # Zabbix ?

    Posté par  (site web personnel) . Évalué à 2.

    Je déteste Centreon, je l'ai toujours trouvé bidouille, sans doute son côté PHP qui me gène.

    Icinga et Shinken sont des valeurs sures

    Je peux te proposer Zabbix qui est peut-être plus facile d'accès, mais je le déconseille pour des gros parcs, il y a une API mais tu peux également faire du clic, clic, clic, clic …

    Is it a Bird? Is it a Plane?? No, it's Super Poil !!!

    • [^] # Re: Zabbix ?

      Posté par  . Évalué à 1.

      Salut,

      Pourquoi pas sur des gros parcs? Peux-tu donner un ordre de grandeur?

      Cordialement,
      J

      • [^] # Re: Zabbix ?

        Posté par  (site web personnel) . Évalué à 1.

        Je le déconseille pour plus de 500 machines, je trouve que ça devient trop le bordel dans l'interface après :) (plus les problématiques de scaling qui sont gérables avec les proxy mais dont je ne suis pas fan)

        Is it a Bird? Is it a Plane?? No, it's Super Poil !!!

    • [^] # Re: Zabbix ?

      Posté par  . Évalué à 1.

      Perso j'utilise zabbix pour +/- 80 machines. Et pour répondre à la demande de Michaël. Zabbix semble répondre à tes attentes:

      • C'est une solution libre
      • Zabbix est stable et en plus il est possible de payer pour du support (si nécessaire)
      • Offre plusieurs techniques pour faire remonter des info vers l'infra de monitoring (zabbix agent, zabbix get, snmp get, snmp trap, IPMI, ssh…)
      • Il est possible de créer des graph sur base des items que le monitoring enregistre
      • Il y a un dashboard qui est légèrement modifiable + des vues
      • Il y a une API et des libs dans plusieurs langages (il y en a une pour python, qui est en + exploitable avec ansible https://zabbix.org/wiki/Docs/api/libraries
      • Il est possible de monitorer des services (via des tcp check ou avec des tests + avancés - par exemple les scenario web)

      Idem pour les fonctionnalités supplémentaire:

      • il est possible de définir des groupe et des templates donc pour les patrons c'est ok
      • par contre je ne comprends pas ta question concernant la documentation des protocoles de réaction avec les alarmes

      Bien à toi,
      J

  • # netdata

    Posté par  (site web personnel) . Évalué à 1.

    Hello,
    Il y a aussi netdata. Fonctionne out of the box pour beaucoup de services qui sont auto détectés, embarque un daemon compatible statsD, peut faire de l'alerting via beaucoup de services et peut remonter les données à influxDB pour une conservation à longterme des metrics. Il s'installe via apt-get.
    Par contre, ce n'est pas un outil centralisé pour l'instant. Mais ce pb peut se contourner facilement en ajountant des ping checks croisés…
    A+

  • # Eyes Of Network

    Posté par  . Évalué à 2.

    Disclaimer : je bosse dans la boite qui sponsorise l'outil, et on fournit du support pro autour (install, conseil, accompagnement).

    Tu peux regarder Eyes Of Network, ensemble de briques de monitoring: Nagios Core, Thruk, Cacti, pnp4nagios, etc, avec une interface web permettant de configurer assez facilement le tout.

    --> https://www.eyesofnetwork.com/?lang=fr

    En plus, la version 5.2 vient tout juste de sortir !

  • # xymon

    Posté par  . Évalué à 1.

    c'est moche, c'est rustique mais c'est simple, efficace, perenne, facile à étendre et par défaut ça fait plein de chose. Testez le, ca prend 5min. Le serveur, le client et go. J'ai monitoré jusqu’à 20k device sans vraiment de soucis. Xymon c'est un peu le vim ou le soyouz du monitoring. La ou nagios c'est plutôt le emacs ou la navette spatiale :).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.