dadoonet a écrit 15 commentaires

  • # Elasticsearch

    Posté par  (site web personnel) . En réponse au journal Compter automatiquement les mots prononcés sur les chaînes d'information continue. Évalué à 8. Dernière modification le 28 décembre 2021 à 12:05.

    Je me suis posé la question de savoir si un moteur de recherche comme Elasticsearch n’était pas plus adapté pour ce genre de tâches mais comme je ne connais pas bien… meh… flemme de chercher plus… Peut-être avez-vous une idée sur la question ?

    Hello.

    Disclaimer: Cela fait 10+ ans que je fais de l'Elasticsearch. A tel point que je bosse chez Elastic :)

    Oui je te recommande de le tester car il pourrait t'amener de la performance mais surtout des fonctionnalités de recherche. Par exemple, la recherche tolérante aux fautes de frappe.

    Ou encore significant text qui va permettre non pas de trouver les textes les plus fréquents (ça c'est facile), mais les textes les plus anormalement fréquents pour un candidat vs les autres.
    Autrement dit, si COVID est dit massivement par tous les candidats, ce terme ne ressortira pas avec significant_text car "trop commun".

    Bref, beaucoup de possibilités…

    Plus de la dataviz disponible nativement avec Kibana qui te permettra de fabriquer des dashboards super sympa en quelques clics.

    Nous pouvons t'aider sur le forum français.

    Developer | Evangelist at elastic

  • [^] # Re: Les promesses n’engagent que ceux qui y croient

    Posté par  (site web personnel) . En réponse au lien AWS fork Elastic Search qui n'est plus sous licence Apache. Évalué à 1.

    Bonjour

    Disclaimer: je bosse pour Elastic

    J'invite également à lire cette analyse (certes en anglais), mais que j'ai trouvée très intéressante sur le sujet. C'est écrit par un avocat dans un language assez compréhensible. :)

    https://writing.kemitchell.com/2021/01/20/Righteous-Expedient-Wrong.html

    D'autre part, j'invite quiconque qui n'utilise pas aujourd'hui la version par défaut et qui a le moindre doute si son business est compatible avec la licence Elastic (que je conseille) ou la licence SSPL, à contacter elastic_license@elastic.co pour obtenir une confirmation de la part d'Elastic que l'activité n'entre pas en conflit avec la licence choisie. Ca lève toute "ambiguité" et permet d'être serein à l'avenir et vous focaliser à nouveau sur le développement de vos services.

    Enfin, selon moi (et cela n'engage que moi), la licence choisie en complément de la licence Elastic permet justement à n'importe qui d'utiliser le code source pour en faire absolument n'importe quoi, à la condition que lui aussi s'engage à publier tout le code source qui lui permet de faire tourner ce service et qui donc permettra à tout un chacun de faire un produit concurrent.
    Si la société qui souhaite faire offrir ce type de service ne veut pas publier son code source, il faut alors utiliser une Licence Elastic et là faire un partenariat.

    Un exemple français à ce sujet : https://www.clever-cloud.com/ fournit un Elasticsearch as a Service avec les licences Elastic.

    Quentin et Laurent ont d'ailleurs expliqué pourquoi et comment ils veulent contribuer à Elasticsearch à leur manière. Voir la vidéo ici : https://youtu.be/XxOFy5wARCY?t=2001

    Developer | Evangelist at elastic

  • [^] # Re: En gros, ça ne change rien à votre activité...

    Posté par  (site web personnel) . En réponse au lien Elasticsearch et Kibana passent de APLv2 à SSPL à partir de la 7.11. Évalué à 0.

    Oui. Tout dépend de ce qu'on entend par libre en effet.

    Il y a effectivement un cas (et à ma connaissance uniquement celui-là) qui fait que tu n'es pas libre de faire tout ce que tu veux avec le code source. Tu ne peux pas commercialiser un service SaaS (Elasticsearch as a Service) sans un partenariat ou une license adéquate ou alors tu t'engages également à publier le code source qui te permet aussi de faire tourner ton service.

    Tout le reste est "libre" au sens que tu peux faire ton business en utilisant la partie gratuite d'Elasticsearch, sans reverser la moindre chose, ni revenus, ni code source, …

    En tout cas, j'espère avoir clarifié pour nos nombreux utilisateurs actuels qu'ils peuvent continuer à utiliser les projets elastic comme ils l'ont toujours fait jusqu'à ce jour.

    Enfin, en dernier lieu, je me permets d'ajouter l'adresse email à contacter (elastic_license@elastic.co) si jamais quelqu'un a le moindre doute sur ce qu'il fait et souhaite avoir un email qui valide que l'utilisation qui est faite est bien conforme.

    Developer | Evangelist at elastic

  • [^] # Re: Quelle alternative ?

    Posté par  (site web personnel) . En réponse au lien Elasticsearch et Kibana passent de APLv2 à SSPL à partir de la 7.11. Évalué à 1.

    Je me suis probablement mal exprimé sur la chronologie.

    Non. C'était clair ;)

    Nous avons choisi de passer la sécurité en basic afin de pouvoir avoir des un opérateur Kubernetes. Je crois, de mémoire, qu'il fallait qu'il soit sécurisé par défaut.
    C'était de toute façon dans les tuyaux de mettre ça en gratuit. Le projet ECK (Elastic Cloud for Kubernetes) a fait avancer plus rapidement notre décision.

    mais floragunn semble toujours en vie.

    Oui. Je le crois aussi.

    Je n'étais pas dans les discussions légales mais de mémoire également, il me semble que le problème que nous avions eu à l'époque avec ce code est qu'il s'agissait d'une copie de notre code source par moment et qu'il y avait eu visiblement une décompilation de xpack pour disons "s'inspirer" de notre implémentation de sécurité. A l'époque, le code source de xpack n'était pas publique. Quand nous l'avons publié, les analogies sont devenues plus évidentes.

    Je crois que depuis le code en question a été réécrit.

    Developer | Evangelist at elastic

  • # En gros, ça ne change rien à votre activité...

    Posté par  (site web personnel) . En réponse au lien Elasticsearch et Kibana passent de APLv2 à SSPL à partir de la 7.11. Évalué à -1.

    Bonjour,

    Disclaimer: je bosse pour Elastic

    Un petit message pour vous inviter à lire la FAQ ici : https://www.elastic.co/pricing/faq/licensing

    Comme je le dis dans le titre, dans l'immense majorité des cas, ça ne change strictement rien à votre usage, à votre business, etc…

    Voici un très bon résumé en image de ce qui se passe.

    Summary of licensing change

    Si vous avez des questions ou un doute sur votre cas, n'hésitez pas à les poster ici ou me trouver sur Twitter (dadoonet) :)

    Developer | Evangelist at elastic

  • [^] # Re: Quelle alternative ?

    Posté par  (site web personnel) . En réponse au lien Elasticsearch et Kibana passent de APLv2 à SSPL à partir de la 7.11. Évalué à 0.

    A noter que Elasticsearch fournit aujourd'hui une version gratuite de la sécurité.

    Developer | Evangelist at elastic

  • [^] # Re: Quelle alternative ?

    Posté par  (site web personnel) . En réponse au lien Elasticsearch et Kibana passent de APLv2 à SSPL à partir de la 7.11. Évalué à 1.

    Hello. De ce que je peux voir, cela ne change rien pour toi.

    As-tu regardé ce lien ? https://www.elastic.co/pricing/faq/licensing

    Developer | Evangelist at elastic

  • [^] # Re: Source des données

    Posté par  (site web personnel) . En réponse au journal Crowd sourcing pour le nouveau data pipeline de linuxfr. Évalué à 1.

    Je ne l'ai jamais utilisé.
    Mais c'est pour cette raison que je conseille de partir de la source.

    Sinon si il y a un dump local de toutes les pages web, mon projet FSCrawler indexera ça correctement je pense. https://github.com/dadoonet/fscrawler

    Developer | Evangelist at elastic

  • # Source des données

    Posté par  (site web personnel) . En réponse au journal Crowd sourcing pour le nouveau data pipeline de linuxfr. Évalué à 6.

    Plutôt que de crawler des pages web (ce qui peut être fait avec GOPA: https://github.com/infinitbyte/gopa), n'est il pas possible d'avoir accès à la source qui génère les pages (genre une base de données) ou mieux à l'application qui écrit ces données en base ?

    Developer | Evangelist at elastic

  • # Oui security toujours sous license gold/platinum

    Posté par  (site web personnel) . En réponse à la dépêche Elastic inclura X-Pack dans sa distribution. Évalué à 0.

    Pour préciser, il faut toujours une license gold ou platinum pour accéder à XPack security.
    En fait, la possibilité de lire et contribuer au code ne change quasiment rien à la situation.
    Par contre pour Xpack basic, il ne sera plus nécessaire de fournir son e-mail pour avoir accès à ces fonctionnalités.

    Autrement dit, il n'y a que du bonus dans cette ouverture du code.

    Developer | Evangelist at elastic

  • [^] # Re: qwant ?

    Posté par  (site web personnel) . En réponse au journal De la difficulté de trouver un moteur de recherche pertinent pour un site institutionnel du libre. Évalué à 6.

    Je ne crois pas que qwant soit une façade. Il a ses propres moteurs aujourd'hui, il me semble.

    En effet. Et ils utilisent Elasticsearch d'ailleurs…

    Chez elastic (disclaimer: je suis un employé de cette boite), nous avons:

    1. Elasticsearch à déployer soit même
    2. Elasticsearch as a service avec cloud.elastic.co
    3. Swiftype search as a service (replacement de Google Search Appliance et Google Site Search)

    Evidemment toutes ces solutions ont un coût:

    1. Le coût d'hébergement, de gestion et de maintien en condition opérationnel
    2. Le coût du service
    3. Le coût du service

    Developer | Evangelist at elastic

  • [^] # Re: Faille trouvée : Redis

    Posté par  (site web personnel) . En réponse au journal Un ransomware tout à fait déloyal ... et inquiétant. Évalué à 5.

    On trouve exactement le même comportement avec elasticsearch.

    Plus depuis la version 2.

    La V2 n'écoute que depuis 127.0.0.1 donc n'est accessible que localement. Si tu veux écouter sur une autre IP tu dois le dire explicitement et donc aussi t'assurer que tu n'exposes pas ta machine.

    Idéalement on met Elasticsearch dans le backend comme n'importe quelle base.

    Developer | Evangelist at elastic

  • [^] # Re: Une vie sans jointure

    Posté par  (site web personnel) . En réponse à la dépêche Donnez votre avis sur la nouvelle architecture de Cozy. Évalué à 1.

    Je n'étais pas assez précis mais en fait ça peut utiliser moins que 1Go, hein.
    Je sais qu'un de mes collègues avait fait un cluster de raspberry PI à une lointaine époque (version 0.90 de mémoire).

    Bref, faut tester… :)

    Developer | Evangelist at elastic

  • [^] # Re: Une vie sans jointure

    Posté par  (site web personnel) . En réponse à la dépêche Donnez votre avis sur la nouvelle architecture de Cozy. Évalué à 1.

    Pour la recherche full-text, on n'a rien de comparable à ElasticSearch. On a essayé d'indexer les données de CouchDB via des moteurs externes (pas ElasticSearch, car il faut quand même que ça puisse tourner sur machines avec peu de RAM pour les auto-hébergés), mais ça n'a pas été très concluant.

    Suivant le volume, ça peut passer dans Elasticsearch avec peu de RAM. Je stocke 1m de docs facilement sur 1Go de RAM.

    Disclaimer : je bosse pour elastic.

    Developer | Evangelist at elastic

  • # Elasticsearch

    Posté par  (site web personnel) . En réponse à la dépêche Petit état des lieux du NoSQL. Évalué à 2.

    Bonjour,

    A noter qu'on peut ranger déjà Elasticsearch dans les bases NoSQL orientées document. En effet, par configuration, il est possible par exemple de désactiver la recherche dans Elasticsearch et donc de le transformer en un simple système de persistance de documents.

    On profite alors de la scalabilité native de ES (partitionnement, réplication, distribution, …). De fait, ES devient très comparable à ce qu'on trouve dans MongoDB.

    D'ailleurs, Shay Banon, l'auteur d'Elasticsearch, a annoncé son intention d'investir sur cet axe pour les prochaines versions.

    Quelques liens :
    Le groupe Elasticsearch France

    Présentation Elasticsearch à Devoxx France :

    David

    Developer | Evangelist at elastic