Shinken 1.2

Posté par  (site web personnel) . Édité par baud123, Nils Ratusznik, Xavier Teyssier et Nÿco. Modéré par Xavier Teyssier. Licence CC By‑SA.
Étiquettes :
39
31
août
2012
Supervision

Après une attente un peu plus longue que prévue, le logiciel de supervision Shinken, parti comme une réécriture de Nagios en Python, sort une version 1.2. Les développements de cette version se sont concentrés principalement sur l'interface de visualisation des alertes, ainsi que sur l'arrivée d'une nouvelle interface de découverte et configuration.

Pour rappel, Shinken est une application permettant la surveillance système et réseau. Elle surveille les hôtes et services spécifiés, alertant lorsque les systèmes vont mal et quand ils vont mieux. C'est un logiciel libre sous licence GNU AGPL. Elle est complètement compatible avec le logiciel Nagios et elle a pour but d'apporter une supervision distribuée et hautement disponible facile à mettre en place.

Shinken

Sommaire

L'interface de visualisation

Outre un léger relooking de l'interface et de meilleures capacités pour filtrer les informations, la principale nouveauté de cette version est l'arrivée d'un tableau de bord. L'utilisateur pouvant sélectionner des "widgets" et les placer à sa guise sur sa page personnalisée.

widgets

L'installation pour les feignants

Les développeurs ont pensé aux administrateurs surchargés de travail, n'ayant pas le temps de télécharger et lancer une installation de l'outil. Désormais, une installation peut se résumer en :
curl -L http://install.shinken-monitoring.org | /bin/bash

Et c'est fini :)

Scalabilité de la supervision passive

Si la possibilité de rajouter des capacités de traitement pour la supervision active (aller chercher l'information) était native depuis les premières versions de l'outil, ce n'était pas encore le cas pour les informations passives (écouter les informations en provenance des équipements). Ce point est désormais réglé avec la possibilité d'activer un chemin direct entre les éléments qui écoutent les informations et ceux qui les consomment, sans passer par le relayeur central de l'architecture.

La partie configuration

Dans cette version, un soin tout particulier a été apporté à la gestion de configuration de l'outil, afin qu'elle soit la plus simple possible, sans (trop) entraver les possibilités de configuration.

On note ainsi l'arrivée de découverte des équipements en plusieurs phases, au lieu d'une seule. Par exemple, une première phase basée sur Nmap pouvant découvrir les principales caractéristiques des équipements (OS, ports ouverts, fabricant du matériel…), et de nouvelles sondes de découvertes pouvant être lancées sur les équipements respectant certains critères (comme le scanner les partages réseaux que sur les Windows par exemple).

Autre point intéressant de cette version, l'apparition de moyens d'échanger des bonnes pratiques de supervision. Si dans le microcosme Nagios le partage de sondes de supervision est courant, celui du partage des bonnes pratiques de la configuration de ces sondes l'est beaucoup moins. Or une bonne partie de la bonne gestion de gros environnements passe par ces bonnes pratiques. Shinken propose un outil (shinken-pack) permettant d'extraire de la configuration ce qui a trait à un sujet particulier (Linux, Windows, etc.) comme la configuration des sondes ou les règles de découvertes, et d'en faire une archive. Un site communautaire http://community.shinken-monitoring.org a été mis en place pour faciliter leur partage.

Dernier point de la partie configuration : c'est l'arrivée en bêta de l'outil de configuration de Shinken, nommé sKonf. Il permet d'utiliser la bibliothèque de découverte de l'outil, mais également la configuration plus classique des éléments. Il est également capable d'aller rechercher de nouveaux packs de supervision directement sur le site communautaire du projet.

sKonf

Corrélation avancée et calcul de KPI : les triggers

Un autre outil important en matière de supervision est Zabbix. ce dernier repose sur l'obtention de données de performances qui sont analysée par des expressions dites "triggers", là où Nagios, et donc Shinken, laisse cette tâche aux sondes.

Shinken inaugure dans cette version ses propres triggers. Ces derniers n'ont pas pour but d'être utilisés pour toute la supervision, mais dans les cas où l'utilisation des sondes n'est plus adaptée. Ces triggers sont tout simplement du code Python qui sera lancé après les sondes au sein même de l'outil, et ayant accès à toutes ses données.

Ils pourront être utilisés pour définir des règles métiers complexes, où de simples opérateurs & | Xof: ne sont plus assez complets, ou encore dans le calcul de nouveaux indicateurs, comme calculer la moyenne du temps de réponse de serveurs web déjà supervisés, et alerter si elle devient trop importante. Le principal atout de ce système étant que les données sont réinjectées directement au sein de l'outil, elles seront disponibles avec les interfaces actuelles de supervision.

Un autre module fait appel à ce système : le module Collectd. L'outil du même nom est un agent exportant sur le réseau les données de performances des serveurs (les fameuses KPI évoquées dans le titre). Shinken est désormais capable d'écouter ces informations et les transformer en données de performances pour ses propres services. Des triggers peuvent alors être utilisés pour comparer les valeurs à des seuils et lever des alertes, si besoin est.

On notera enfin des améliorations importantes du côté du temps de démarrage sur les gros environnements, ce qui est toujours bon à prendre :)

Prochaine version

Les développements actuels sont orientés vers la complétion de l'interface de configuration sKonf, ainsi que le rajout de nouvelles fonctions aux triggers et la possibilité à des modules externes d'en fournir de nouvelles.

Une autre idée des utilisateurs de Shinken devrait également voir le jour : à savoir, pouvoir changer les commandes et donc, potentiellement, les seuils, suivant la période de temps (par exemple augmenter les seuils de charge acceptables pendant une sauvegarde). Sera également présent une partie complète pour l'interface de visualisation, dédiée à la supervision "de bout en bout", permettant de simuler un utilisateur sur un site de vente en ligne, par exemple (avec affichage des temps de réponses, captures d'écrans sur les erreurs, etc.).

Un Linux mag hors série dédié à Shinken

La communauté des contributeurs Shinken ne s'est pas concentrée uniquement sur l'outil, mais a préparé une petite surprise qui sort aujourd'hui même : un hors série Linux Mag complet sur Shinken ! Très complet, il ne fait pas l'impasse sur cette version 1.2, avec justement des articles complet dédiés à l'interface sKonf ou aux triggers.

Aller plus loin

  • # Installation cool

    Posté par  . Évalué à 5.

    Désormais, une installation peut se résumer en :

    curl -L http://install.shinken-monitoring.org | /bin/bash
    

    Et c'est fini :)

    C'est vraiment cool ça. Mais je pense qu'il serait souhaitable de ne distribuer ce script qu'en https. On est quand même entrain d'exécuter un script (en root ?) directement depuis un site. Ce serait bien qu'on soit un minimum dur que c'est le bon.

    Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

    • [^] # Re: Installation cool

      Posté par  . Évalué à 2.

      D'un autre côté si tu veux un truc plus sécurisé, tu peux aussi l'installer par les dépôts…

      C'est marrant de trouver cool un truc qui a été reproché (à juste titre) à Microsoft pendant longtemps : télécharger un logiciel depuis un site web…

      • [^] # Re: Installation cool

        Posté par  . Évalué à 4.

        D'un autre côté si tu veux un truc plus sécurisé, tu peux aussi l'installer par les dépôts…

        Ils n'ont pas forcément la dernière version.

        C'est marrant de trouver cool un truc qui a été reproché (à juste titre) à Microsoft pendant longtemps : télécharger un logiciel depuis un site web…

        Ce qui était reproché c'est je pense :

        • le coté systématique : tu dois téléchargé tout les logiciels comme ça
        • la sécurité : ce que je reproche ici

        Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

    • [^] # Re: Installation cool

      Posté par  (site web personnel) . Évalué à 2.

      Très bonne remarque :)

      Aller hop, je me note d'acheter un certificat pour ce site :)

  • # Retour d'experience

    Posté par  . Évalué à 3.

    Vous savez eu des retour de mise en production sur des parcs plus ou moins important. Je ne doute pas de la fiabilité de shinken. Je pense juste que c'est un point à mettre en avant pour les « dayssideurpaysai ».

    Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

    • [^] # Re: Retour d'experience

      Posté par  . Évalué à 8.

      J'utilise cet outil pour une partie de mon infrastructure, pour mes clients, il faut aussi parti intégrante des solutions que je mets en avant lors de mes prestations d'audit/conseil pour des PME, TPE mais aussi dans le secteur du Public.

      Pour l'instant je dirai que la stabilité est de mise, de même que la qualité des releases, communauté.
      Je vois Shinken non pas comme un équivalent à Nagios avec juste de la patate en plus et une interface sexy, mais bien comme une solution qui a fait évoluer la supervision, HA, rôles, granularité, etc.

      Bien entendu tout cela demande de se former, reformer, s'accaparer de nouvelles notions etc.
      Donc il n'en déplaise à certains ce n'est pas juste un Nagios tweaké ….

      Heureusement pour nous les adminsys et formateurs, Shincken nous offre de bien plus larges possibilités que son confrère et très respectable Nagios (celui-ci est encore loin d'être mort), comme souvent dans le logiciel libre il faut choisir des solutions qui sont au plus proche de nos besoins.

      Pour parler performance, j'ai mesuré des performances entre 7 et 10% supérieures à Nagios (avec environ 15 sondes / machines, 100 machines), et des performances entre 12 et 17% sur des parcs avec plus de 1000 machines.

      Tout ça est très difficile à comparer, analyser, car les points de comparaisons ne sont pas les mêmes.

      Je pense que le but de Shinken n'est pas d'absolument chercher les performances, mais plutôt d'apporter un nouveau souffle dans la supervision tout comme on le fait souvent dans le logiciel libre, c'est ce qui fait sa force.

      Libre un jours libre toujours

    • [^] # Re: Retour d'experience

      Posté par  . Évalué à 1.

      Nous l'utilisons dans ma boîte. Je n'ai malheureusement pas le droit de dire qui c'est.
      Mais je peux t'assurer que ça fonctionne très bien sur un parc de plus de 1000 équipements et plus de 7000 services.

      • [^] # Re: Retour d'experience

        Posté par  . Évalué à 1.

        Web4All

        Je vais troller, mais la réponse se trouve en 30s avec github, facebook ou linkedin…

        • [^] # Re: Retour d'experience

          Posté par  . Évalué à 0. Dernière modification le 03 septembre 2012 à 12:04.

          Raté. Chez Web4All je suis bénévole, ce n'est pas la société pour laquelle je travaille. ;)
          Mais c'est peut-être trouvable quand même…

  • # Le Linux Mag...

    Posté par  (site web personnel) . Évalué à 1.

    Je l'ai !! :D

    Le CDI du bahut dans lequel je bosse a un abonnement, et quelle ne fut pas ma surprise de voir que ce petit hors série était arrivé pendant les vacances.

    Merci Jean !

    There is no spoon...

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.