Sortie de la version 7.0 de Datafari, moteur de recherche open source « intelligent » pour entreprise

8
26
mai
2026
Java

Nous (France Labs, éditeur de Datafari) sommes fiers de vous annoncer la mise à disposition de Datafari 7.0

Nous avons beaucoup travaillé sur l’intégration plus avancée de l’IA au moment de la recherche, avec à présent une interface dédiée, notre « assistant intelligent », qui permet de converser avec les documents internes.

Pour rappel, Datafari est une solution de recherche pour entreprise. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles.

Et désormais grâce à l’IA, de « discuter » avec ses connaissances. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre aussi de chercher des documents, mais aussi d’utiliser une IA générative pour les questionner.

Pour cette dépêche, on se concentre sur la version libre et open source (licence Apache Public License v2).

Exemple de l'assistant IA Datafari

Les nouveautés et changements principaux par rapport à la version 6 :

  1. Un assistant intelligent permettant de discuter avec les documents
  2. Un mode « Retrieval Augmented Generation » permettant d’obtenir des réponses basées uniquement sur les données internes, et ne nécessitant pas d’entraîner un modèle
  3. Un mode « agentic » permettant à l’IA de raisonner sur la question posée, et de décider quelles actions prendre pour y répondre
  4. Une recherche avec plusieurs modes : par mots clés, sémantique (basée sur la recherche vectorielle dans Solr) ou hybride
  5. Des corrections, des améliorations et des mises à jour logicielles

Comment démarrer ?

Pour voir à quoi ça ressemble, nous avons téléversé une courte vidéo de démonstration (voir le lien plus bas). Pour démarrer tout de suite, le mieux est d’aller lire le quick start guide. Nous mettons gratuitement à disposition notre documentation Datafari sur Confluence, qui couvre les usages, l’administration et le développement. Attention, les modules d’IA que nous avons développés, nécessitent la disponibilité d’un serveur exposant un modèle d’IA compatible. De base, Datafari n’héberge pas localement une IA. Le plus simple pour débuter est de le connecter par exemple à Mistral pour se faire la main, et ensuite de passer à des modèles locaux hébergés par vos soins ou par des partenaires.

Pour rappel, voici les principales fonctionnalités de Datafari en tant que moteur de recherche :

Que peut-on faire avec Datafari ?

Datafari est un moteur de recherche pour entreprise enrichi à l’IA : membres de la famille des outils de gestion des connaissances, les solutions de recherche fédèrent les connaissances en analysant et indexant tous les documents d’une organisation, aussi bien leur contenu que leurs métadonnées. Pour cela, le moteur de recherche doit être multi‐sources, multi‐formats, et gérer la sécurité. En outre, il faut permettre l’administration de l’outil.

Dans la version libre, on peut, côté admin :

  1. Administrer les connecteurs vers les sources de données (nous utilisons Apache ManifoldCF avec tous ses connecteurs) ;
  2. Utiliser l’IA à l’indexation pour analyser et enrichir les contenus ;
  3. Gérer l’algorithme de pertinence qui classe les documents pour leur affichage suite à une requête ;
  4. Mettre en avant des documents pour des requêtes identifiées ;
  5. Créer des utilisateurs et leur assigner des rôles ;
  6. Voir des statistiques d’usage de l’outil ;
  7. Configurer le modèle d’IA et les paramètres de vectorisation ;
  8. Encore plein d’autres choses abordées dans la documentation Confluence.

Côté utilisateur, on peut :

  1. Chercher de façon simple ou avancée ;
  2. Poser des questions sur un ou plusieurs documents ;
  3. Laisser l’IA fouiller dans tous les documents pour répondre ;
  4. Bénéficier de la correction orthographique et de l’auto‐complétion ;
  5. Choisir et utiliser des facettes pour filtrer les résultats ;
  6. Créer des alertes par courriel quand des documents modifiés ou nouveaux correspondent à une requête ;
  7. ….

Et ensuite ?

Pour 2026 et 2027, nous continuerons de faire évoluer la partie IA. En parallèle, nous travaillons à la refonte de notre système de moissonnage des données.

Des commentaires ?

Nous sommes en permanence à l’écoute des commentaires et suggestions pour faire avancer le produit, alors profitez-en, que ce soit d’un point de vue technique ou fonctionnel, ça nous intéresse. Ha et si vous êtes déjà un utilisateur, n’hésitez pas à en parler sur le web !

Aller plus loin

  • # Un Rag quoi

    Posté par  . Évalué à 0 (+1/-1).

    Pas certain de saisir l'intérêt comparé aux 317 outils RAG based sur github existants depuis presque 3 ans.

    • [^] # Re: Un Rag quoi

      Posté par  . Évalué à 2 (+1/-0).

      Il faudrait surement faire un état de l'art des 317 solutions sur github. Sans l'avoir fait (on est plutôt concentré sur le dev de Datafari), je pense que la plupart:

      1. Ne font pas - ou très peu - de moissonnage multisources+multiformats
      2. Ne sont pas éditeurs, donc aucune garantie en production si on veut l'utiliser sans monter en compétence tech
      3. Ne proposent pas à la fois de la recherche classique et du RAG
  • # Open Core

    Posté par  . Évalué à 6 (+4/-0).

    Avec des restrictions sur la version libre du genre de

    Sécurité : Non fourni

    Qui couvrent le SSO ou le LDAP qui sont des restrictions qui à la rendent quasi inutilisable en entreprise.

    Personellemet, en plus, je trouve ces limitations irresponsable tant la multiplication des bases d’authentification et des mots de passe est une plaie pour la sécurité.

    • [^] # Re: Open Core

      Posté par  . Évalué à 0 (+0/-1).

      Je me suis surement mal exprimé dans notre article: il n'y a aucune restriction ou limitation dans la version communautaire. Si vous voulez rajouter les parties SSO ou LDAP et le contribuer à la communauté, vous êtes complètement libre de le faire. Nous avons juste pris le partie - pour pouvoir financer nos activités - de rendre notre implémentation de ces fonctionnalités payantes. Vous pouvez bien sûr recoder ces parties.

      • [^] # Re: Open Core

        Posté par  . Évalué à 5 (+3/-0). Dernière modification le 02 juin 2026 à 17:52.

        Ce n’est pas ton expression, c’est sur votre site ! Dans la description de l’offre open source, on trouve :

        Big Data : Non fourni
        Sécurité : Non fourni
        Exploitation : Non fourni
        Optimisation de la pertinence : Non fourni

        Franchement, à ce niveau là on est plus proche du open source as a demo que de la vraie version communautaire.

        Nous avons juste pris le partie - pour pouvoir financer nos activités - de rendre notre implémentation de ces fonctionnalités payantes.

        Vous avez déjà viré plein de trucs fonctionnels qui peuvet intéresser les gens, mais en virant les parties liées à la sécurité, vous elevez tout simplement la capacité de l’utiliser dans un environnement un peu sérieux d’entreprise.

        Après, c’est votre choix. Moi, je fais celui de faire l’impasse sur toute solution qui rend payant le SSO, open source ou non. Parce que je trouve ça irresponsable.

        • [^] # Re: Open Core

          Posté par  . Évalué à 1 (+0/-0).

          Hmmm va falloir qu'on mette à jour le site web, il est en effet trompeur, rien n'empêche de faire du big data, de la sécu, de l'exploitation ou de l'optim de pertinence.

          Rien que pour ce dernier, il y a de super outils comme Quepid, qui est compatible avec Solr.

          Et "Sécurité: Non fourni" c'est en effet incorrect, ce qui n'est pas inclu (mais non pas interdit et rien n'empêche de le coder) pour être précis c'est: le SSO, la connexion à LDAP/AD et la prise en compte des droits d'accès aux documents par utilisateur.

          Petit rappel: le SSO n'est pas un élément de sécurité en soit, c'est un élément de confort en entreprise pour éviter d'avoir à s'authentifier auprès des différents applicatifs (par extension, ca peut poser des risques de sécurité si les gens finissent avec des post-it autour de l'écran). J'ai pris note de votre irritation quant à l'absence du SSO dans la version commu, mais là encore rien n'empêche de le rajouter dans la version communautaire.

          Second petit rappel: tout n'est pas fabuleux dans le monde du libre. Nous étions 100% open source à la création, mais les ESN ayant eu le bon goût d'installer notre produit dans les entreprises sans rien nous reverser, il a bien fallu faire des choix pour rester en vie, tout en continuant de proposer un produit en open source qui puisse quand même être utile. En l'occurrence, avec les choix que nous avons faits, tout scenario d'entreprise qui vise un public homogène au niveau des droits d'accès, peut utiliser à profite la version CE. Comme les choses semblent évoluer au niveau du libre en entreprise grâce aux problématiques de souveraineté, il n'est pas impossible que nous rebasculions tout en open source un de ces jours, du moment que nous atteignons l'équilibre financier.

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.