Je suis pas sur de voir en quoi ton affirmation sans substance serait plus juste que celle que tu récuses.
Tu as raison :-)
Sur le reste, dans mes logs, les bots "nuisibles" identifiés sont ceux des IA (cf la liste du projet https://github.com/ai-robots-txt/ai.robots.txt). Et c'est vrai , le temps CPU est le plus nuisible. La bande passante j'enb parlais parce que c'est un coût facile à mesurer.
Je suis aussi sysadmin de profession, et j'ai clairement pas les soucis qu'il a avec des bots de scraping. J'ai pas le souci sur les serveurs mailman, j'ai pas le souci sur les instances wordpress ou les instances discourse.
Et ça prouve quoi ? tu fais une erreur de raisonnement là. Les robots d'IA ne sont pas lancés au hasard sur les serveurs. Elles ciblent des types de contenus. Par exemple :
Si on veut analyser du code moderne, potentiellement bien foutu, SourceHut me parait une bonne piste vu les gens qui l'utilisent.
Quand les IA visitent intensivement le site de ma copine, ce qui les intéresse c'est le contenu informatif sur les jeux et jouets pour enfant, ce qu'on raconte autour, pas la fiche produit qui est de l'info catalogue.
Ce n'est pas qu'une histoire de compétences en gestion de serveur, on ne peut pas accepter que le traffic soit multiplié 2 ou par 10 (ma copine) à cause des IA, la bande passante n'est pas gratuite.
Oui et non. On l'avait déjà évoqué dans cette ancienne dépêche : ddrescue, dd_rescue, myrescue : récupérer ses données après un crash disque. Le ddrescue de Diaz Diaz (le GNU) est plus facile et plus sûr. Cependant, pour ceux qui s'y connaissent, le dd_rescue original de Kurt Garloff est plus puissant, super paramétrable et son comportement peut-être changé. Il permet une récupération plus fine, mais j'insiste : c'est un outil de spécialistes. Aux autres, son auteur conseille d'utiliser GNU ddrescue.
Ce que je sous entendais, c'est que les robots d'IA ne respectent rien. Le projet Github que j'ai indiqué en parle dans ses multiples liens de référence. Donc on les bloque avec le serveur web.
Le fichier Robots.txt c'est efficace si les robots des IA obtempèrent ET s'il est à jour. Aucun de ces critères n'est facile à respecter dans la courses aux IA. En plus les IA scannent aussi avant de se faire connaître.
Pour les robots connus, on est vite obligé de doubler le fichier Robots avec des directives serveur.
Qu'on l'ait ou pas, ça ne change rien à la redondance inutile et source d'erreur (parfois, on peut rentrer des infos qui contradisent le numéro de sécu par exemple).
Ce que j'adore dans ce bouzin, c'est la redondance :
on a tous un numéro de sécu unique, n'empêche qu'on doit réentrer les infos qu'il contient déjà ; on a aussi un numéro d'imposition qui suffit aux impôts pour nous identifier (le fisc quand même, hein), un compte améli, un compte chose et un compte machin, mais il nous faut un France Connect plus avec identité numérique ; en entreprise on a Siret, No de TVA, signature électronique (différente de l'identité numérique), kbis, No d'imposition, mais… l'INPI et d'autres joyeux administratifs en veulent plus (scan de doc et tout). Etc.
Sur la soi-disant indépendance vis-à-vis des Etats-Unis, on doit lire (ou relire) François-Xavier Verschave, notamment sa petite conférence, publiée sous le titre "De la Françafrique à la Mafiafrique" qui expose à quel point c'est un leurre depuis la deuxième guerre mondiale (il ne s'agit pas que de technologie).
J'ai bien envie de copier coller tes commentaires pour les transformer en journal qui servira d'happeau à points et à karma. ;-)
Sans rire, tu crois pas que poster un lien suivi de commentaires expliquant le contenu, ça serait mieux en journal ? Note que tu n'es pas le seul, antistress le fait de plus en plus.
Pour être honnête, je ne suis pas sûr de comprendre exactement ce que le jugement dit. Il semble confirmer qu'il y a eu un usage abusif de la force, mais en même temps que l'enquête a été bien faite (alors que l'enquête n'a pas réussi à déterminer les responsabilités individuelles). Ça me semble assez paradoxal, non?
Comme tous les gros ensembles, tout dépend de ce que tu vas en faire. Et si tu vas te servir de l'interface web ou pas.
Pour la synchronisation, avec les clients Nextcloud :
Fichiers, contacts, agenda, courriels, notes, … c'est très classique, aucun problème si ta famille n'est pas grande.
Pour l'utiliser en ligne :
L'interface web est assez lourde et lente, en occasionnel ça gêne un peu, mais si tu y rajoutes le multimedia, l'édition avec LibreOffice, l'IA, les appels vidéos, etc. ben faudra du réseau du CPU et de la Ram ; ton Rapsberry sera probablement à genoux.
Aucune, ce n'est pas du ressort de la CEDH dont les arrêts sont essentiellement déclaratoires (arrêt sur une violation). Par contre, "pour éviter de nouvelles condamnations, la France doit tirer les conséquences de cette décision" comme dit l'avocat de la famille de Rémi Fraisse : indemniser pour ne pas s'exposer à un arrêt accordant une satisfaction équitable, et réviser sa gestion d'interventions des forces de l'ordre pour éviter d'autres plaintes.
ça a déjà été discuté dans une dépêche de présentation. Illico complète bien OpenRefine avec du nettoyage et mise en forme rapide. C'est un petit outil léger, plus facile à utiliser. Une importante différence c'est qu'Illico n'est pas scriptable et ne permet pas de rejouer les transformations.
Je te conseille de lire la dépêche de présentation, la discussion y mentionne d'autres outils bien utiles.
Le temps disponible pour chercher ? (mais je ne suis pas certain d'avoir compris ce à quoi tu fais allusion)
La bureaucratisation est un mouvement plus ancien que 15 ans. Mon père chercheur s'en plaignait déjà il y a 30 ans. La "paperasse" le privait d'un temps considérable, alors que dans les années 80 ce n'était pas le cas.
Je voulais dire que ce n'était peut-être pas le bon endroit pour poser ta question: le forum avec une question directe sans y annexer de troll ;-) aurait amené plus vite la réponse
Posté par orfenor .
En réponse au lien 14 ans de systemd.
Évalué à 5 (+3/-0).
Dernière modification le 20 février 2025 à 14:13.
La console effacée (ou qui semble telle) c'est vieux comme une distro Linux. Je cherchais déjà les messages de boot en 1994.
Par contre, merci systemd, je les retrouve facilement sur Debian. J'ai oublié comment (ça sert pas souvent), va falloir chercher un peu (j'ai vraiment oublié).
En lisant tes messages, je me suis plusieurs fois dit que tu cherchais des solutions aux problèmes de ta bécane, plutôt que participer au débat. Franchement, penses-y, parce qu'une discussion technique aurait été plus enrichissante (même si tu as suscité des belles réponses).
Très intéressant.
Autrefois, il me semble que tu avais aussi mentionné l'aspect passion : travailler bénévolement est plus motivant que travailler en étant payé, puisque tu choisis librement tes tâches.
Il y a un historique politique de proximité de milieux d'argent genre la bourgeoisie Républicaine avec l'exploitation des masses et l'esclavage et ses idées racistes et eugénistes.
À moins que je ne m'abuse, ce sont les démocrates qui étaient esclavagistes. C'est sans doute historiquement plus flou que ça, mais comme tu en parles…
Pour être un peu dans le même cas (ma copine et ses jouets éthiques qui poste sur Facebook et Instagram) je peux avancer une hypothèse :
Ils sont trop peu pour avoir eu le temps de migrer.
+ Facebook/Instagram permettent de largement se faire connaître.
+ L'audience est une nécessité pour vivre, la pub coûte trop cher,
+ Dans les petites structures avec des gens qui dévouent une grande part de leur temps à les faire vivre, eh bien ces gens font ce qu'ils peuvent, avec ce qu'ils connaissent.
= Vouloir migrer ailleurs n'est pas tout.
[^] # Re: robot.txt
Posté par orfenor . En réponse au lien Drew Devault : Please stop externalizing your costs directly into my face . Évalué à 2 (+0/-0).
Tu as raison :-)
Sur le reste, dans mes logs, les bots "nuisibles" identifiés sont ceux des IA (cf la liste du projet https://github.com/ai-robots-txt/ai.robots.txt). Et c'est vrai , le temps CPU est le plus nuisible. La bande passante j'enb parlais parce que c'est un coût facile à mesurer.
Merci pour tes remarques.
[^] # Re: robot.txt
Posté par orfenor . En réponse au lien Drew Devault : Please stop externalizing your costs directly into my face . Évalué à 3 (+1/-0).
Et ça prouve quoi ? tu fais une erreur de raisonnement là. Les robots d'IA ne sont pas lancés au hasard sur les serveurs. Elles ciblent des types de contenus. Par exemple :
Ce n'est pas qu'une histoire de compétences en gestion de serveur, on ne peut pas accepter que le traffic soit multiplié 2 ou par 10 (ma copine) à cause des IA, la bande passante n'est pas gratuite.
# appel à la modération
Posté par orfenor . En réponse au journal Hyprland est hypé. Évalué à 10 (+10/-1).
à passer en dépêche!
[^] # Re: Sauvegarde
Posté par orfenor . En réponse au journal Après photorec. Évalué à 4 (+2/-0).
Oui et non. On l'avait déjà évoqué dans cette ancienne dépêche : ddrescue, dd_rescue, myrescue : récupérer ses données après un crash disque. Le ddrescue de Diaz Diaz (le GNU) est plus facile et plus sûr. Cependant, pour ceux qui s'y connaissent, le dd_rescue original de Kurt Garloff est plus puissant, super paramétrable et son comportement peut-être changé. Il permet une récupération plus fine, mais j'insiste : c'est un outil de spécialistes. Aux autres, son auteur conseille d'utiliser GNU ddrescue.
[^] # Re: robot.txt
Posté par orfenor . En réponse au lien Drew Devault : Please stop externalizing your costs directly into my face . Évalué à 3 (+1/-0).
Ce que je sous entendais, c'est que les robots d'IA ne respectent rien. Le projet Github que j'ai indiqué en parle dans ses multiples liens de référence. Donc on les bloque avec le serveur web.
[^] # Re: robot.txt
Posté par orfenor . En réponse au lien Drew Devault : Please stop externalizing your costs directly into my face . Évalué à 4 (+2/-0).
Le fichier Robots.txt c'est efficace si les robots des IA obtempèrent ET s'il est à jour. Aucun de ces critères n'est facile à respecter dans la courses aux IA. En plus les IA scannent aussi avant de se faire connaître.
Pour les robots connus, on est vite obligé de doubler le fichier Robots avec des directives serveur.
Il y a un projet Github pour garder une liste à jour:
https://github.com/ai-robots-txt/ai.robots.txt
Sur le petit serveur de ma copine, les IA sont une terrible plaie, qui multiplie considérablement la charge (fois 10 et plus).
# After Using PhotoRec
Posté par orfenor . En réponse au journal Après photorec. Évalué à 4 (+2/-0).
Bonne nouvelle ce repair café à Pougne, ça manquait (j'ai travaillé au Nombril autrefois).
Pour ceux qui cherchent d'autfres scripts, le wiki de Photorec en contient, rubrique After Using PhotoRec. Siltaar tu pourrais y ajouter les tiens.
[^] # Re: Utilité ?
Posté par orfenor . En réponse au journal qui a sérieusement réussi à créer facilement son identité numérique sur smartphone?. Évalué à 2 (+0/-0).
Qu'on l'ait ou pas, ça ne change rien à la redondance inutile et source d'erreur (parfois, on peut rentrer des infos qui contradisent le numéro de sécu par exemple).
[^] # Re: Utilité ?
Posté par orfenor . En réponse au journal qui a sérieusement réussi à créer facilement son identité numérique sur smartphone?. Évalué à 4 (+2/-0).
Ce que j'adore dans ce bouzin, c'est la redondance :
on a tous un numéro de sécu unique, n'empêche qu'on doit réentrer les infos qu'il contient déjà ; on a aussi un numéro d'imposition qui suffit aux impôts pour nous identifier (le fisc quand même, hein), un compte améli, un compte chose et un compte machin, mais il nous faut un France Connect plus avec identité numérique ; en entreprise on a Siret, No de TVA, signature électronique (différente de l'identité numérique), kbis, No d'imposition, mais… l'INPI et d'autres joyeux administratifs en veulent plus (scan de doc et tout). Etc.
# Pour mieux comprendre
Posté par orfenor . En réponse au journal Il y a du chemin avant que nos dirigeants intègrent la notion de souveraineté à l'heure du numérique. Évalué à 5 (+3/-0).
Sur la soi-disant indépendance vis-à-vis des Etats-Unis, on doit lire (ou relire) François-Xavier Verschave, notamment sa petite conférence, publiée sous le titre "De la Françafrique à la Mafiafrique" qui expose à quel point c'est un leurre depuis la deuxième guerre mondiale (il ne s'agit pas que de technologie).
[^] # Re: Petit résumé sans IA
Posté par orfenor . En réponse au lien "Des prothèses qui ne trahissent pas", une proposition de réforme de la gouvernance de GNOME. Évalué à 3 (+1/-0). Dernière modification le 01 mars 2025 à 19:25.
Ça fait (très) longtemps qu'on n'a pas eu ce genre de remarques, non ?
et +++ pour antistress et totof2000
Bref, poste!
[^] # Re: Petit résumé sans IA
Posté par orfenor . En réponse au lien "Des prothèses qui ne trahissent pas", une proposition de réforme de la gouvernance de GNOME. Évalué à 6 (+4/-0).
J'ai bien envie de copier coller tes commentaires pour les transformer en journal qui servira d'happeau à points et à karma. ;-)
Sans rire, tu crois pas que poster un lien suivi de commentaires expliquant le contenu, ça serait mieux en journal ? Note que tu n'es pas le seul, antistress le fait de plus en plus.
[^] # Re: Condamnée à quoi ?
Posté par orfenor . En réponse au lien La France condamnée par la Cour européenne des droits de l'homme pour violation du droit à la vie. Évalué à 3 (+1/-0).
Pas du tout. Il y a deux points différents, voir l'explication de Misc un peu plus haut.
[^] # Re: Consommation de ressources
Posté par orfenor . En réponse au lien Sortie de Nexcloud Hub 10 (version 31.0.0). Évalué à 2 (+0/-0).
Comme tous les gros ensembles, tout dépend de ce que tu vas en faire. Et si tu vas te servir de l'interface web ou pas.
Pour la synchronisation, avec les clients Nextcloud :
Fichiers, contacts, agenda, courriels, notes, … c'est très classique, aucun problème si ta famille n'est pas grande.
Pour l'utiliser en ligne :
L'interface web est assez lourde et lente, en occasionnel ça gêne un peu, mais si tu y rajoutes le multimedia, l'édition avec LibreOffice, l'IA, les appels vidéos, etc. ben faudra du réseau du CPU et de la Ram ; ton Rapsberry sera probablement à genoux.
[^] # Re: Condamnée à quoi ?
Posté par orfenor . En réponse au lien La France condamnée par la Cour européenne des droits de l'homme pour violation du droit à la vie. Évalué à 4 (+2/-0). Dernière modification le 27 février 2025 à 11:32.
Aucune, ce n'est pas du ressort de la CEDH dont les arrêts sont essentiellement déclaratoires (arrêt sur une violation). Par contre, "pour éviter de nouvelles condamnations, la France doit tirer les conséquences de cette décision" comme dit l'avocat de la famille de Rémi Fraisse : indemniser pour ne pas s'exposer à un arrêt accordant une satisfaction équitable, et réviser sa gestion d'interventions des forces de l'ordre pour éviter d'autres plaintes.
[^] # Re: openrefine ?
Posté par orfenor . En réponse à la dépêche Illico Editor : nouveautés depuis 2021. Évalué à 3 (+1/-0).
ça a déjà été discuté dans une dépêche de présentation. Illico complète bien OpenRefine avec du nettoyage et mise en forme rapide. C'est un petit outil léger, plus facile à utiliser. Une importante différence c'est qu'Illico n'est pas scriptable et ne permet pas de rejouer les transformations.
Je te conseille de lire la dépêche de présentation, la discussion y mentionne d'autres outils bien utiles.
[^] # Re: L’imprégnation des esprits ?
Posté par orfenor . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 3 (+1/-0).
Le temps disponible pour chercher ? (mais je ne suis pas certain d'avoir compris ce à quoi tu fais allusion)
La bureaucratisation est un mouvement plus ancien que 15 ans. Mon père chercheur s'en plaignait déjà il y a 30 ans. La "paperasse" le privait d'un temps considérable, alors que dans les années 80 ce n'était pas le cas.
[^] # Re: Une soluce + une relance de troll (ou pas)
Posté par orfenor . En réponse au lien 14 ans de systemd. Évalué à 1 (+0/-1).
Je voulais dire que ce n'était peut-être pas le bon endroit pour poser ta question: le forum avec une question directe sans y annexer de troll ;-) aurait amené plus vite la réponse
[^] # Re: Une soluce + une relance de troll (ou pas)
Posté par orfenor . En réponse au lien 14 ans de systemd. Évalué à 5 (+3/-0). Dernière modification le 20 février 2025 à 14:13.
La console effacée (ou qui semble telle) c'est vieux comme une distro Linux. Je cherchais déjà les messages de boot en 1994.
Par contre, merci systemd, je les retrouve facilement sur Debian. J'ai oublié comment (ça sert pas souvent), va falloir chercher un peu (j'ai vraiment oublié).
En lisant tes messages, je me suis plusieurs fois dit que tu cherchais des solutions aux problèmes de ta bécane, plutôt que participer au débat. Franchement, penses-y, parce qu'une discussion technique aurait été plus enrichissante (même si tu as suscité des belles réponses).
[^] # Re: cryptomonaie
Posté par orfenor . En réponse à la dépêche Nouvelles de Haiku - Hiver 2024-25. Évalué à 3 (+1/-0).
Très intéressant.
Autrefois, il me semble que tu avais aussi mentionné l'aspect passion : travailler bénévolement est plus motivant que travailler en étant payé, puisque tu choisis librement tes tâches.
[^] # Re: sensibilisation
Posté par orfenor . En réponse au lien Données piratées: ils ont envoyé de soi-disant coursiers pour "récupérer leurs cartes compromises". Évalué à 0 (+0/-2).
Oui mais les parts de stress et d'heures sup' y sont plus élevées
# vie privée pas privée
Posté par orfenor . En réponse au lien Jeep Owners Furious Over Full Screen Ads at Every Stop. Évalué à 4 (+2/-0).
J'adore ce passage :
[^] # Re: LVSL
Posté par orfenor . En réponse au lien Pourquoi les barons de la Silicon Valley se convertissent au trumpisme . Évalué à 3 (+1/-0). Dernière modification le 15 février 2025 à 20:08.
À moins que je ne m'abuse, ce sont les démocrates qui étaient esclavagistes. C'est sans doute historiquement plus flou que ça, mais comme tu en parles…
Abraham Lincoln était d'ailleurs au parti Républicain.
[^] # Re: Panne des liens vers planet-libre
Posté par orfenor . En réponse à la dépêche Projets Libres! Saison 3 épisode 10 : OSRD, un outil libre de simulation ferroviaire. Évalué à 2 (+0/-0).
Le premier lien (lien vers l'épisode et sa transcription) fonctionne, avec l'audio, le lien s'abonner au podcast fonctionne aussi.
[^] # Re: LVSL
Posté par orfenor . En réponse au lien Pourquoi les barons de la Silicon Valley se convertissent au trumpisme . Évalué à 10 (+8/-0).
Pour être un peu dans le même cas (ma copine et ses jouets éthiques qui poste sur Facebook et Instagram) je peux avancer une hypothèse :
Ils sont trop peu pour avoir eu le temps de migrer.
+ Facebook/Instagram permettent de largement se faire connaître.
+ L'audience est une nécessité pour vivre, la pub coûte trop cher,
+ Dans les petites structures avec des gens qui dévouent une grande part de leur temps à les faire vivre, eh bien ces gens font ce qu'ils peuvent, avec ce qu'ils connaissent.
= Vouloir migrer ailleurs n'est pas tout.