Posté par antistress (site web personnel) .
Évalué à 9 (+6/-0).
Dernière modification le 23 décembre 2025 à 18:21.
Ensuite, pour faire un bon moteur, le nerf de la guerre était d'avoir beaucoup de données utilisateurs pour comprendre l’être humain et affiner ce que faisaient les algorithmes et qui n’était jamais parfait. Et pour parfaire les résultats d’un moteur, il fallait beaucoup de comportements humains.
Idiotement je pensais que pour faire un bon moteur de recherche sur le Web, il fallait avoir beaucoup de données sur le Web. Quel naze je fais !
La donnée utilisateur que nous allons garder qui pourra intéresser le plus le RGPD, ce sera la donnée de personnalisation du Ibou Explorer, à travers un compte utilisateur et le consentement pour l’utiliser.
Mais elle ne sera pas utilisée par les algorithmes de pub, car ceux-ci n’en ont finalement pas besoin. Ils ont besoin juste de savoir ce sur quoi ils s’affichent. Et quand une page s’affiche, maintenant avec les LLM, c’est extrêmement simple de comprendre le contexte de la page. Avec des éléments de contexte suffisant, on peut faire de la pub qui est aussi performante que celle qui utilise l’information utilisateur. Donc pour la pub que nous opérerons nous-mêmes, il n’y aura pas de données utilisateur conservées et utilisées. Après quand on envoie quelqu’un chez un tiers, on ignore ce qui s'y passe.
Posté par antistress (site web personnel) .
Évalué à 5 (+2/-0).
Dernière modification le 23 décembre 2025 à 23:56.
En fait voilà le point technique qu'il évoque et que je n'avais pas compris dans mon 1er commentaire :
La seule vraie difficulté qu’il y avait avant, ce n’était pas la partie index – que nous avons résolue dans Babbar depuis longtemps –, mais qu’il fallait de la data utilisateur pour faire les choses. Faire un index qui contient les bonnes pages, ce n'est pas difficile, faire un index qui classe les bonnes pages dans les premières, c’est ça qui est difficile. Ce sont les fonctions de ranking.
À première vue j'ai du mal à voir pourquoi en cherchant "thermodynamique", "président bulgare 2012" ou "comment changer un joint de culasse" la réponse serait fondamentalement liée à la personne qui fait la recherche. Je m'attends à avoir assez vite Wikipédia sur les deux premières, peut-être des cours de physiques pour le premier, des articles de presse pour le second (probablement français en alphabet latin plutôt que bulgares en cyrillique…) et probablement des sites de bricolages pour le 3e.
Google:
extrait Wikipédia, article Wikipédia, cours de physique
Wikipedia, wikipedia, article presse française
Une chaine de garages, deux sites de passionnés de voitures
Bing:
Wikipedia, 2 cours de physique
2 fois Wikipedia, puis un site qui reprend Wikipedia
Chaine de garages, wikihow, tuto vidéo
Bref on dirait un vendeur de pub/données personnelles qui cherche à justifier son besoin.
Posté par antistress (site web personnel) .
Évalué à 5 (+2/-0).
Dernière modification le 24 décembre 2025 à 10:45.
liée à la personne qui fait la recherche
Je ne pense pas que ce soit ce qui est évoqué ; c'est plutôt un peu comme le ranking de Google qui va regarder combien de sites pointent vers le tien pour juger de sa pertinence. Ce n'est pas l'usage de celui qui cherche qu'ils regardent, mais les usages, je pense.
Ah oui mal compris. Plus compliqué à définir : pas vraiment technique (un site efficace/beau peut contenir du vent, un site très lié peut être du spam, ne se baser que sur les liens par les gros augmentent la centralisation, etc.), très choix politique (l'algo définit la "loi" et a des conséquences réelles sur la visibilité des sites), la pertinence (l'article scientifique des docteurs en physique, la conf de physique au Collège de France, la page wikipédia physique ou le blog d'un prof de physique de collège dur son cours pour les 4e), la véracité (terre sphérique, terre patatoïde, terre en donut, terre plate ?), le sensationnalisme (et ça va vous étonner !, le meilleur site qui vous dit tout, etc.), etc.
# Indexer le Web avec Ibou...
Posté par woffer 🐧 (site web personnel) . Évalué à 3 (+1/-0).
… c'est chaud 😅
[^] # Re: Indexer le Web avec Ibou...
Posté par steph1978 . Évalué à 6 (+4/-0).
Ibou Nichnioniba
[^] # Re: Indexer le Web avec Ibou...
Posté par legranblon (site web personnel) . Évalué à 3 (+1/-0).
Je suis curieux de voir quand le mérou pète si le ibou bout !
# Ibou, le moteur qui vous regarde
Posté par antistress (site web personnel) . Évalué à 9 (+6/-0). Dernière modification le 23 décembre 2025 à 18:21.
Idiotement je pensais que pour faire un bon moteur de recherche sur le Web, il fallait avoir beaucoup de données sur le Web. Quel naze je fais !
[^] # Contra
Posté par antistress (site web personnel) . Évalué à 3 (+0/-0).
[^] # Ibou, le moteur qui vous regarde - erratum
Posté par antistress (site web personnel) . Évalué à 5 (+2/-0). Dernière modification le 23 décembre 2025 à 23:56.
En fait voilà le point technique qu'il évoque et que je n'avais pas compris dans mon 1er commentaire :
[^] # Re: Ibou, le moteur qui vous regarde - erratum
Posté par Benoît Sibaud (site web personnel) . Évalué à 7 (+4/-0).
À première vue j'ai du mal à voir pourquoi en cherchant "thermodynamique", "président bulgare 2012" ou "comment changer un joint de culasse" la réponse serait fondamentalement liée à la personne qui fait la recherche. Je m'attends à avoir assez vite Wikipédia sur les deux premières, peut-être des cours de physiques pour le premier, des articles de presse pour le second (probablement français en alphabet latin plutôt que bulgares en cyrillique…) et probablement des sites de bricolages pour le 3e.
Google:
Bing:
Bref on dirait un vendeur de pub/données personnelles qui cherche à justifier son besoin.
[^] # Re: Ibou, le moteur qui vous regarde - erratum
Posté par antistress (site web personnel) . Évalué à 5 (+2/-0). Dernière modification le 24 décembre 2025 à 10:45.
Je ne pense pas que ce soit ce qui est évoqué ; c'est plutôt un peu comme le ranking de Google qui va regarder combien de sites pointent vers le tien pour juger de sa pertinence. Ce n'est pas l'usage de celui qui cherche qu'ils regardent, mais les usages, je pense.
[^] # Re: Ibou, le moteur qui vous regarde - erratum
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+1/-0).
Ah oui mal compris. Plus compliqué à définir : pas vraiment technique (un site efficace/beau peut contenir du vent, un site très lié peut être du spam, ne se baser que sur les liens par les gros augmentent la centralisation, etc.), très choix politique (l'algo définit la "loi" et a des conséquences réelles sur la visibilité des sites), la pertinence (l'article scientifique des docteurs en physique, la conf de physique au Collège de France, la page wikipédia physique ou le blog d'un prof de physique de collège dur son cours pour les 4e), la véracité (terre sphérique, terre patatoïde, terre en donut, terre plate ?), le sensationnalisme (et ça va vous étonner !, le meilleur site qui vous dit tout, etc.), etc.
[^] # Commentaire supprimé
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0). Dernière modification le 24 décembre 2025 à 11:05.
Ce commentaire a été supprimé par l’équipe de modération.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.