J'ai mis foultitude parce que je ne sais pas combien ni leurs tailles.
Mais pour une entreprise du numérique, 6M$, c'est rien du tout. Et d'ailleurs c'est sûrement plus. Mais à nouveau ça reste abordable.
L'hypothèse que tu donnes d'alimenter du RAG est intéressante aussi et générerai probablement un trafic non négligeable et permanent et est en effet encore plus abordable.
Je suis partisan de l'hypothèse que ces crawlers ont été écrit par des gens dont ce n'est pas la spécialité.
J'imagine les trésor d'ingéniosité qu'un produit comme google search a dû mettre dans son crawler : quoi scanner, quand, quand revenir, comment juger la pertinence de ce que je trouve, trouver les liens, stocker de manière efficace, créer des indexes, gérer le débit, les retry, le back-pressure, distribuer le travail à des dizaines/centaines de machines ; et sûrement mille autres qui ne me viennent pas. Et ce pendant des années où le web a grossi / changé.
Là une foultitude de boîtes se sont dit, il nous faut notre LLM, c'est pas si cher que ça (cf deepseek) et ont torché un système de crawling en quelques semaines / mois.
Et on se retrouve à devoir mettre des contre mesures qui pénalisent aussi les utilisateurs légitimes. C'est moche et j'espère qu'ils vont vite s’essouffler.
2016 : l'objectif de réduire à quasi néant l'industrie du smartphone en Europe étant atteint et après avoir dépensés quelques milliards de $ Microsoft jette l'éponge.
Loin de tenir MS dans mon cœur mais leur objectif était de "réduire à quasi néant l'industrie du smartphone en Europe" et il y aurait consacré quelques milliards ? On a des sources de ça ? ça a leaké ? Pourquoi seulement "quasi" ?
Le plus souvent c'est :
- gérer les dépendances -> venv
- performances -> ffi
- images trop lourd -> multi-stages
- difficile à distribuer -> pyinstaller, pyoxyde
Donc faux problèmes, "skill issue".
Alors que ce que tu pointe est réel.
Cela peut s'atténuer avec avec du typage (pydantic est merveilleux) et des linters mais cela nécessite de rajouter quelque chose au langage.
il y a des chances que ton serveur backend soit sans TLS.
On en sait rien et ce n'est pas le propos de l'article.
Le propos est que cloudflare déchiffre le flux chez eux. Oui. Et je ne crois pas qu'ils s'en cachent.
Étant donné qu'ils doivent prendre sur chaque la décision de la bloquer, de la servir localement ou d'appeler l'upstream, ils ont besoin de la déchiffrer.
On dirait qu'on vient de découvrir que l'eau ça mouille, que le macdo c'est dégueux, que amazon enfouit/brule ses invendus.
Moi aussi je cherche un moyen d'avoir un LLM en local ou au moins self-hosted.
J'ai essayé avec Jan (mentionné plus haut) ou ollama.
Cela fonctionne bien sur des petits modèles (15B) mais c'est extrêmement lent.
Du genre un mot par seconde avec la machine au taquet.
J'ai un amis qui a une NVIDIA 4080 et il montait à 50 mots par secondes. Mais rien que la carte coûte plus de 2000e.
Mais pour avoir des modèles réellement utiles, 70B et plus, c'est impossible sur une machine perso. Il faut une machine spécifique avec 8 cartes installées.
Si tu as deux PC avec des prises ethernet, le plus simple est de les connecter à ta box.
En 1Gbps full duplex sur chaque, c'est là que tu aura la meilleure performance de transfer.
Si tu as pas de box, tu peux aussi utiliser un cable croisé entre les deux PC.
Bon, c'est vrai que l'ordiphone est alors reconnu comme un disque dur.
Oui et non.
Le système Android étant toujours actif lorsqu'il est connecté au PC, avoir deux systèmes qui puissent écrire sur le disque en même temps serait dangereux pour l'intégrité de données.
Android propose donc le MTP qui est un protocole de plus haut niveau que le "Mass Storage" utilisé par les clés/disques USB.
Dans ce cas, le téléphone est disponible dans l'explorateur de fichiers, mais pas en tant que périphérique de type bloc (/dev/sdX).
Ce qui est vrai dans les deux cas, c'est que le PC et hôte et le téléphone ou la clé sont "périphérique". Il y a une notion de hiérarchie. Ce qu'il n'est peut être pas facile de reproduire avec deux PC.
Avec l'USB 1 ou 2, pas d'ambiguïté, la grosse prise (A) va côté hôte et la petite (micro) va côté périphérique. Mais avec l'USB-C, je n'ai jamais essayé de connecter deux PC entre eux.
C'est un produit d'appel vers les offres pro.
20 GB, de mail qui plus est, c'est pas tant que ça au final pour un fournisseur et pour un client, ça permet de voir loin.
La grosse limitation c'est que en offre gratuite, tu n'as pas de custom domain. Donc un pro qui veut utiliser sa marque passera par l'offre payante.
Je suis client de l'offre minimale (1.5e/mois pour 5 boites mail) et j'en suis satisfait. J'avais comparé les fournisseurs européens un peu sérieux avant de choisir et c'était les moins cher.
À la maison j'utilise la mouture de Mozilla parce que je l'utilise depuis 20 ans et que je n'ai rien à lui reprocher.
Au bureau, l'IT a eu la merveilleuse idée de mettre en place des "policies" pour Firefox. Je connaissais pour Chrome, mais je ne savais même pas que ça existait pour FF. Dont une complètement ridicule qui est de ne pas sauvegarder l'historique (!!!). Alors que cette policy n'est pas mise en place pour Chrome.
Alors que si il y a une raison pour laquelle je cherche à tout prinx à utiliser FF au lieu de Chrome c'est pour la puissance de la recherche dans l'historique qui évite bien des recherches en lignes - ce que Chrome ne peut pas se permettre ; (et maintenant pour µBlock0 depuis le passage au manifest v3)
J'ai regardé les forum et le code dans l'espoir de trouver comment désactiver cette "fonctionnalité" mais je n'ai rien trouvé.
Je me suis mis en quête d'un dérivé de FF qui n'obtempère pas aux policies d'entreprise. Parmi ceux lister dans l'article, seul Floorp a répondu à ma contrainte.
Enfin un article du Figaro plus pourri que ses commentaires.
D'habitude on a un article bien orienté sur les valeurs conservatrices et des commentaires du genre "dehors les imigrés, à bas le wokisme".
Là on a une ineptie qui ferait d’étrangler n'importe quel élève de maths au lycée
Avec les mathématiques, le loto est un peu moins une question de chance
Et des commentaires qui se permettent de le souligner
Complètement idiot. Chaque tirage étant indépendant, l'IA ne peut rien faire. Coment peut on y croire ?!
Châpeau, il fallait le dégoter.
On en a quand même un qui combine les deux :
Voilà comment on peut faire gober n'importe quoi à une population, pourvu qu'il y ait quelques nombres dedans. Procédé largement utilisé par les écolos en particulier et la gauche en général.
Magistral !
Et dire que ce site merdique demande de s'abonner quand on refuse ses cookies. Faut pas avoir de fierté.
# concrètement ?
Posté par steph1978 . En réponse au lien Stupeur dans les entreprises françaises après une lettre de l’ambassade américaine à Paris. Évalué à 2 (+0/-0).
C'est quoi ses règles anti diversité ? Faut que les contractors emploient que des hommes blancs, valides, droitiers, binaires et hétéro ?
[^] # Re: vibe coding
Posté par steph1978 . En réponse au lien Le site de curl désormais à 1,6 Go/minute de trafic à cause des crawlers pour LLMs. Évalué à 3 (+1/-0).
J'ai mis foultitude parce que je ne sais pas combien ni leurs tailles.
Mais pour une entreprise du numérique, 6M$, c'est rien du tout. Et d'ailleurs c'est sûrement plus. Mais à nouveau ça reste abordable.
L'hypothèse que tu donnes d'alimenter du RAG est intéressante aussi et générerai probablement un trafic non négligeable et permanent et est en effet encore plus abordable.
[^] # vibe coding
Posté par steph1978 . En réponse au lien Le site de curl désormais à 1,6 Go/minute de trafic à cause des crawlers pour LLMs. Évalué à 10 (+9/-0).
Je suis partisan de l'hypothèse que ces crawlers ont été écrit par des gens dont ce n'est pas la spécialité.
J'imagine les trésor d'ingéniosité qu'un produit comme google search a dû mettre dans son crawler : quoi scanner, quand, quand revenir, comment juger la pertinence de ce que je trouve, trouver les liens, stocker de manière efficace, créer des indexes, gérer le débit, les retry, le back-pressure, distribuer le travail à des dizaines/centaines de machines ; et sûrement mille autres qui ne me viennent pas. Et ce pendant des années où le web a grossi / changé.
Là une foultitude de boîtes se sont dit, il nous faut notre LLM, c'est pas si cher que ça (cf deepseek) et ont torché un système de crawling en quelques semaines / mois.
Et on se retrouve à devoir mettre des contre mesures qui pénalisent aussi les utilisateurs légitimes. C'est moche et j'espère qu'ils vont vite s’essouffler.
[^] # Re: Trop de raccourcis ....
Posté par steph1978 . En réponse au lien Qu l'eut cru : les débuts de Nokia. Évalué à 3 (+1/-0).
Loin de tenir MS dans mon cœur mais leur objectif était de "réduire à quasi néant l'industrie du smartphone en Europe" et il y aurait consacré quelques milliards ? On a des sources de ça ? ça a leaké ? Pourquoi seulement "quasi" ?
# quelle résolution ?
Posté par steph1978 . En réponse au journal Un super Logic Analyzer DIY pour pas cher. Évalué à 2 (+0/-0).
J'ai vu/lu du 100MHz et du 400MHz…
[^] # Re: Pendant ce temps là, dans un univers parallèle
Posté par steph1978 . En réponse au lien Microsoft utilise Go pour son portage Typescript (et expliquent pourquoi ce n'est pas écrit en Rust). Évalué à 2 (+0/-0).
La publication de MS date du 11.
[^] # Re: Oui, mais pas ce que je retiens comme vrais problèmes de Python
Posté par steph1978 . En réponse au lien Difficile de recommander Python en production . Évalué à 2 (+0/-0). Dernière modification le 23 mars 2025 à 16:49.
Oui, encore faut il que la lib et ses bindings existent
Après, il faut être patient, Mojo arrive.
Et comme cela te titille, regarde codon.
[^] # Re: Oui, mais pas ce que je retiens comme vrais problèmes de Python
Posté par steph1978 . En réponse au lien Difficile de recommander Python en production . Évalué à 2 (+0/-0). Dernière modification le 23 mars 2025 à 02:46.
Voici enfin des critiques fondées de ce langage.
Le plus souvent c'est :
- gérer les dépendances -> venv
- performances -> ffi
- images trop lourd -> multi-stages
- difficile à distribuer -> pyinstaller, pyoxyde
Donc faux problèmes, "skill issue".
Alors que ce que tu pointe est réel.
Cela peut s'atténuer avec avec du typage (pydantic est merveilleux) et des linters mais cela nécessite de rajouter quelque chose au langage.
# source
Posté par steph1978 . En réponse au lien Microsoft utilise Go pour son portage Typescript (et expliquent pourquoi ce n'est pas écrit en Rust). Évalué à 3 (+1/-0).
https://devblogs.microsoft.com/typescript/typescript-native-port/
[^] # Re: FUD ?
Posté par steph1978 . En réponse au lien CloudFlare voit tous vos mots de passe en clair (sur tous les sites qui utilisent CloudFlare). Évalué à 4 (+2/-0).
Pareil, niveau de survivalisme : 0 😨
[^] # Re: bah oui
Posté par steph1978 . En réponse au lien CloudFlare voit tous vos mots de passe en clair (sur tous les sites qui utilisent CloudFlare). Évalué à 3 (+2/-1).
On en sait rien et ce n'est pas le propos de l'article.
Le propos est que cloudflare déchiffre le flux chez eux. Oui. Et je ne crois pas qu'ils s'en cachent.
Étant donné qu'ils doivent prendre sur chaque la décision de la bloquer, de la servir localement ou d'appeler l'upstream, ils ont besoin de la déchiffrer.
On dirait qu'on vient de découvrir que l'eau ça mouille, que le macdo c'est dégueux, que amazon enfouit/brule ses invendus.
# bah oui
Posté par steph1978 . En réponse au lien CloudFlare voit tous vos mots de passe en clair (sur tous les sites qui utilisent CloudFlare). Évalué à 10 (+12/-1).
Ils font la terminaison SSL, donc bien sûr qu'ils voient tout en clair.
[^] # Re: Câble ethernet croisé
Posté par steph1978 . En réponse au message Peut on connecter 2 ordis linux via cable usb. Évalué à 2 (+0/-0).
Ah oui, très pratique
Après le câble croisé avait don charme
Ça date de 2011 ; ça doit bien faire aussi longtemps que j'ai pas eu à en utiliser un.
# petit et lent
Posté par steph1978 . En réponse au message IA Pratique. Évalué à 2 (+0/-0).
Moi aussi je cherche un moyen d'avoir un LLM en local ou au moins self-hosted.
J'ai essayé avec Jan (mentionné plus haut) ou ollama.
Cela fonctionne bien sur des petits modèles (15B) mais c'est extrêmement lent.
Du genre un mot par seconde avec la machine au taquet.
J'ai un amis qui a une NVIDIA 4080 et il montait à 50 mots par secondes. Mais rien que la carte coûte plus de 2000e.
Mais pour avoir des modèles réellement utiles, 70B et plus, c'est impossible sur une machine perso. Il faut une machine spécifique avec 8 cartes installées.
# en direct
Posté par steph1978 . En réponse au message Freetube. Évalué à 2 (+0/-0).
Sinon, tu vas sur https://github.com/FreeTubeApp/FreeTube/releases
Et tu cherche "linux-x64-portable.zip".
Tu Dl
Tu dézip
Tu lance l'exe.
# Câble ethernet croisé
Posté par steph1978 . En réponse au message Peut on connecter 2 ordis linux via cable usb. Évalué à 2 (+0/-0).
Si tu as deux PC avec des prises ethernet, le plus simple est de les connecter à ta box.
En 1Gbps full duplex sur chaque, c'est là que tu aura la meilleure performance de transfer.
Si tu as pas de box, tu peux aussi utiliser un cable croisé entre les deux PC.
Ensuite tu lance un
rsync
de l'un vers l'autre.[^] # Re: Comment ça se passe avec Android ?
Posté par steph1978 . En réponse au message Peut on connecter 2 ordis linux via cable usb. Évalué à 3 (+1/-0).
Oui et non.
Le système Android étant toujours actif lorsqu'il est connecté au PC, avoir deux systèmes qui puissent écrire sur le disque en même temps serait dangereux pour l'intégrité de données.
Android propose donc le MTP qui est un protocole de plus haut niveau que le "Mass Storage" utilisé par les clés/disques USB.
Dans ce cas, le téléphone est disponible dans l'explorateur de fichiers, mais pas en tant que périphérique de type bloc (/dev/sdX).
Ce qui est vrai dans les deux cas, c'est que le PC et hôte et le téléphone ou la clé sont "périphérique". Il y a une notion de hiérarchie. Ce qu'il n'est peut être pas facile de reproduire avec deux PC.
Avec l'USB 1 ou 2, pas d'ambiguïté, la grosse prise (A) va côté hôte et la petite (micro) va côté périphérique. Mais avec l'USB-C, je n'ai jamais essayé de connecter deux PC entre eux.
# produit d'appel -> pas de custom domain
Posté par steph1978 . En réponse au message Infomaniak, offre gratuite ???. Évalué à 2 (+0/-0).
C'est un produit d'appel vers les offres pro.
20 GB, de mail qui plus est, c'est pas tant que ça au final pour un fournisseur et pour un client, ça permet de voir loin.
La grosse limitation c'est que en offre gratuite, tu n'as pas de custom domain. Donc un pro qui veut utiliser sa marque passera par l'offre payante.
Je suis client de l'offre minimale (1.5e/mois pour 5 boites mail) et j'en suis satisfait. J'avais comparé les fournisseurs européens un peu sérieux avant de choisir et c'était les moins cher.
# virtual env
Posté par steph1978 . En réponse au message Python mal installé. Évalué à 2 (+0/-0).
En gros, dans un terminal
# adelielinux peut être ?
Posté par steph1978 . En réponse au message Vieux mac + linux. Évalué à 2 (+0/-0).
https://www.adelielinux.org/
[^] # Re: lbc
Posté par steph1978 . En réponse au message [HS] Trouver des cartons pour déménagement. Évalué à 2 (+0/-0).
Dans le même genre, il y a geev
# le choix
Posté par steph1978 . En réponse au lien A look at Firefox forks. Évalué à 4 (+2/-0).
À la maison j'utilise la mouture de Mozilla parce que je l'utilise depuis 20 ans et que je n'ai rien à lui reprocher.
Au bureau, l'IT a eu la merveilleuse idée de mettre en place des "policies" pour Firefox. Je connaissais pour Chrome, mais je ne savais même pas que ça existait pour FF. Dont une complètement ridicule qui est de ne pas sauvegarder l'historique (!!!). Alors que cette policy n'est pas mise en place pour Chrome.
Alors que si il y a une raison pour laquelle je cherche à tout prinx à utiliser FF au lieu de Chrome c'est pour la puissance de la recherche dans l'historique qui évite bien des recherches en lignes - ce que Chrome ne peut pas se permettre ; (et maintenant pour µBlock0 depuis le passage au manifest v3)
J'ai regardé les forum et le code dans l'espoir de trouver comment désactiver cette "fonctionnalité" mais je n'ai rien trouvé.
Je me suis mis en quête d'un dérivé de FF qui n'obtempère pas aux policies d'entreprise. Parmi ceux lister dans l'article, seul Floorp a répondu à ma contrainte.
# une grande première
Posté par steph1978 . En réponse au lien L'IA, c'est pas si mal que ça, la preuve. Évalué à 10 (+10/-0).
Enfin un article du Figaro plus pourri que ses commentaires.
D'habitude on a un article bien orienté sur les valeurs conservatrices et des commentaires du genre "dehors les imigrés, à bas le wokisme".
Là on a une ineptie qui ferait d’étrangler n'importe quel élève de maths au lycée
Et des commentaires qui se permettent de le souligner
Châpeau, il fallait le dégoter.
On en a quand même un qui combine les deux :
Magistral !
Et dire que ce site merdique demande de s'abonner quand on refuse ses cookies. Faut pas avoir de fierté.
[^] # Re: pour faire quoi ?
Posté par steph1978 . En réponse au lien Android intègre maintenant une machine virtuelle Debian 12 (sur certains téléphones). Évalué à 4 (+2/-0). Dernière modification le 13 mars 2025 à 14:13.
Donc Google voudrait réaliser un vieux rêve de Canonical 🤔
# pour faire quoi ?
Posté par steph1978 . En réponse au lien Android intègre maintenant une machine virtuelle Debian 12 (sur certains téléphones). Évalué à 5 (+3/-0).
Je vois pas ce que Google voudrait faire de cette fonctionnalité…