Sortie de Datafari 5.0, moteur de recherche open source pour entreprise

Posté par  . Édité par Nils Ratusznik et Ysabeau 🧶 🧦. Modéré par claudex. Licence CC By‑SA.
30
14
avr.
2021
Base de données

Un peu comme pour la dernière news, nous avons oublié de parler de la version 4.4, mais nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.0

Changement majeur donc, synonyme de mise à jour majeure des composants utilisés.

Pour rappel, Datafari est une solution de recherche pour entreprise. Ça veut dire qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. Linuxfr oblige, le focus dans cette dépêche sera sur la version libre (mais on a plein d’autres nouveautés aussi sur la version entreprise propriétaire)

Écran de recherche

Les nouveautés et changements principaux par rapport à la 4.3 version Communautaire Open Source :

  1. nouveau widget de nuage de tags ;
  2. nouvelle page d’aide à la recherche ;
  3. ajout de l’Allemand et de l’Espagnol comme langues indexées par défaut ;
  4. nouveau menu utilisateur ;
  5. un mode API pour facilement requêter Datafari sans interface utilisateur ;
  6. un mode aggregator permettant d’aggréger les résultats de plusieurs Datafaris ;
  7. passage de la stack ELK officielle à la stack OpenDistro ;
  8. le SSL/TLS activé par défaut entre le navigateur client et le serveur Datafari ;
  9. le SSL/TLS activé par défaut entre le navigateur client et notre composant ELK open distro ;
  10. une procédure d’installation simplifiée ;
  11. un connecteur pour indexer du Solr ;
  12. un connecteur pour indexer du Confluence et du Jira ;
  13. prévisualisation permettant de voir le contenu d’un document sans ouvrir le document source (voir la capture d’écran plus bas) ;
  14. mises à jour de tous les principaux composants techniques de Datafari (Solr 8.5.2, Cassandra 4, openDistro ELK 1.9.0, PostgreSQL 12.4), apportant plus de stabilité, de sécurité et de rapidité ;
  15. des corrections de bogues de partout.

Comment démarrer ?

Pour démarrer tout de suite, le mieux est sans doute de suivre le quick start guide. Pour aller plus loin, il suffit de se balader sur la documentation Datafari sur Confluence, qui couvre les usages, l’administration et le développement.

Pour rappel, voici les principales fonctionnalités de Datafari en tant que moteur de recherche :

Que peut‐on faire avec Datafari ?

Comme dit plus haut, c’est un moteur de recherche pour entreprise. Ses objectifs sont différents d’un moteur de recherche Web, et les défis techniques diffèrent. Pour un moteur de recherche pour entreprise, il faut être multi‐source, multi‐format, et gérer la sécurité. En outre, il faut permettre l’administrer l’outil. Dans la version libre, on peut, côté admin :

  1. administrer les connecteurs aux sources de données vers de nombreuses sources (nous utilisons Apache ManifoldCF avec tous ses connecteurs) dont Sharepoint, Confluence, Alfresco et les partages de fichiers ;
  2. gérer l’algorithme de pertinence qui classe les documents pour leur affichage suite à une requête ;
  3. mettre en avant des documents pour des requêtes identifiées ;
  4. créer des utilisateurs et leur assigner des rôles ;
  5. voir des statistiques d’usage de l’outil ;
  6. créer l’équivalent de Google AdWords (appelés promoliens) ;
  7. gérer des synonymes ;
  8. plein d’autres choses accessibles depuis la documentation Confluence ; côté utilisateur, on peut :
    1. chercher de façon simple ou avancée ;
    2. prévisualiser les résultats ;
    3. bénéficier de la correction orthographique et de l’auto‐complétion ;
    4. utiliser des facettes pour filtrer les résultats ;
    5. mettre des résultats dans un panier de favoris ;
    6. créer des alertes par courriel quand des documents modifiés ou nouveaux correspondent à une requête.

Et ensuite ?

Pour 2021, nous avons dans les tuyaux de nouveaux connecteurs, une toute nouvelle interface utilisateur en React, de l’ajout d’IA pour l’analyse des documents à l’indexation, et toujours plus de simplification.

Des commentaires ?

Nous sommes en permanence à l’écoute des commentaires et suggestions pour faire avancer le produit, alors profitez-en, que ce soit d’un point de vue technique ou fonctionnel, ça nous intéresse. Ha et si vous êtes déjà un utilisateur, n’hésitez pas à en parler sur le web !

Aller plus loin

  • # Good feeling

    Posté par  . Évalué à 4.

    C'est la première fois que j'entends parler de ce truc, et franchement à première vue c'est vraiment bien.

    Pour les grosses structures, le prix est raisonnable pour disposer de l'ensemble des fonctionnalités et du support étendu. J'ai pas encore trouvé comment on pouvait créer des connecteurs supplémentaires pour aller piocher dans des sources spécifiques (des systèmes maisons), mais je vais creuser.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.