Fulgrim a écrit 331 commentaires

  • [^] # Re: Bel argumentaire mais incomplet

    Posté par  . En réponse au journal [Trolldi] Vulgarisation sur l'IA pour décideur pressé. Évalué à 1 (+0/-0). Dernière modification le 09 avril 2024 à 13:07.

    Il y a de l'aléatoire dans la sortie. Le modèle va prédire la probabilité de chaque token (grosso modo mot) de suivre le texte déjà entré. Les utilisations type ChatGPT vont ensuite choisir aléatoirement parmi les tokens de plus forte probabilité (avec une pondération).

    Les différentes expériences ont montré qu'avec un peu d'aléatoire, les sorties avaient l'air plus naturelles que quand on prend toujours la plus probable. C'est empirique, surtout sur du ressenti relativement difficile à quantifier. Ca permet aussi de relancer les réponses et ça évite des effets "boucle" ou le modèle se met à prédire en boucle la même suite de mots (ça arrive pas mal sur les completions de clavier de smartphone qui ne gardent qu'un tout petit historique).

    Donc en soit, l'algorithme donnant une probabilité à chaque token suivant est globalement déterministe (il peut y avoir des erreurs d'arrondis de float par exemple), mais celui cherchant à produire un texte naturel va ajouter un peu d'aléa.

  • [^] # Re: Il n’y a presque que de l’argent magique !

    Posté par  . En réponse au journal Combien pour un algorithme de détection de piscines sur les photos aériennes ?. Évalué à 2 (+1/-0).

    J'ai du mal à comprendre la différence entre ce que tu décris et ce que décrit le documentaire ?

    La principale critique théorique (il y en a beaucoup d'autres sur la forme) contre le documentaire est qu'il ne parle pas de suppression monétaire, ce dont tu ne parles pas non plus, mais tout le sujet du documentaire est d'expliquer ce que tu dis, soit grosso modo https://fr.m.wikipedia.org/wiki/Cr%C3%A9ation_mon%C3%A9taire mais sans la partie destruction (qui est tout aussi importante)

  • [^] # Re: le bit de poids faible

    Posté par  . En réponse au lien la manière la plus efficace de déterminer si un nombre est pair. Évalué à 3. Dernière modification le 31 décembre 2023 à 10:13.

    C'est clairement un post ironique, si ça avait été un vrai professionnel il aurait mis en place une CI/CD permettant de construire une image docker reproductible et un micro service REST exposant une API pour pouvoir le déployer sur kubernetes afin de permettre une vraie scalabilité horizontale. Ma principale interrogation aurait été de savoir de quelle image partir pour minimiser la taille de l'image finale.

  • [^] # Re: Exactement

    Posté par  . En réponse au journal Une idée pour financé les retraites . Évalué à 10.

    Ton président de région est en colère pour détourner l'attention du fait qu'il est responsable, c'est beaucoup plus facile politiquement de dire "c'est la SNCF" vu que c'est l'imaginaire habituel (qui était vrai il y a longtemps, plus maintenant) que de dire qu'il a merdé.

    Si la SNCF ne met pas les trains, il a surement négocié des pénalités, ou alors c'est soit une buse, soit qu'il n'a trouvé personne d'autre pour accepter sa proposition. C'est d'ailleurs ces pénalités dont il parle dans ton lien, pas la peine d'agiter ces menaces de procès si le contrat est bien fait… C'est le même problème avec les sociétés d'autoroutes, mais là les gens ont compris que c'était le gouvernement de l'époque qui a fait de la merde, pas Vinci.

    Si la SNCF ne met pas assez de trains, c'est qu'il les a pas demandé.

    La SNCF n'est pas décisionnaire sur l'offre de trains en région (ni en intercité, globalement elle ne l'est quasi que sur les TGVs et pas vraiment sur ce qui est structurant), elle est exécutante des ordres de la région. C'est la région qui dit combien de train, lesquels, à quelle fréquence, sur quelles ligne, quelle gare et combien de pénalités, les comptes TER/intercité/TGV/Réseaux sont séparés, c'est même pas les mêmes entreprises. Le problème serait exactement le même avec un acteur privé, sauf qu'en plus il aurait des actionnaires divers derrière.
    J'ai peur que tu te trompes de colère.

    Et en fait la question ne se pose même pas tant en privé vs SNCF, la SNCF est aussi une SA. La problématique est plus entre un acteur intégré (la sncf, qui gère de bout en bout et de moins en moins vu qu'on a forcé son découpage) ou pleins d'acteurs. L’intégré a un vrai avantage, typiquement si une rame ou un cheminot manque sur telle ligne, il peut avoir du mou ailleurs. Un plus petit ne pourra pas faire ça, la situation serait sans doute pire au moindre problème. Des problèmes, sur un réseau ferré, c'est la normalité qu'il faut prévoir et pouvoir encaisser.

  • [^] # Re: Et le Hardware?

    Posté par  . En réponse au journal Du voilier à la murène, itinéraire d'une dégooglisation longue mais réussie. Évalué à 2.

    Un moteur de recherche, c'est beaucoup plus que du code ou des brevets, c'est aussi une grosse infrastructure, un savoir faire, du suivi humain, des données (utilisateur ou non) en masse, et le logiciel libre me semble aujourd'hui pas encore suffisamment armé sur ces points.

    Dur dur de mettre en place les ressources pour, inutile de filer juste un modèle de ML sans les données derrières, qui peuvent être difficilement partageables (ça a plein d'implication en terme de vie privée).

    J'ai bien peur que tu doives au final faire confiance à des gens, ça peut être audité par des extérieurs, mais faire un moteur de recherche c'est déjà hyper difficile en centralisant sur des gros serveurs dans un data center, les expériences en décentralisé sont quand même très très limitées et je les vois mal décollées sans une vraie découverte scientifique (et des chercheurs essaient, va pas croire que c'est faute d'essayer que ça n'a pas eu lieu)

    Et ça demande de gros investissements, fatalement ça sera un gros. Qwant est loin d'être une méga entreprise mais aspire sans doute a l'être

  • [^] # Re: Jouer en streaming

    Posté par  . En réponse au lien Google ferme son service de jeu en streaming Stadia . Évalué à 7. Dernière modification le 30 septembre 2022 à 11:18.

    En ce qui me concerne, ce qui me bloque:

    • L'ADSL, l'air de rien la fibre n'est pas encore généralisée partout.
    • Le modèle économique côté "jeux", j'ai beaucoup de jeux achetés sur Steam, les services ont tous leurs règles sur quels jeux tu peux avoir ou non, pas envie de perdre ma bibliothèque d'aujourd'hui (ou future si j'y passe).
    • L'écosystème pas très mature: ces services ouvrent, ferment, dépendent de tel ou tel outil (stadia fonctionne pas sur androidTV dans mon souvenir par exemple). Si je compare à un Netflix, je serais quasi certain que ça fonctionnera sur mes périphériques actuels (smartphone, ordi, androidTV, box, tablettes…). Un streaming de jeux c'est un peu l'enfer la matrice de ce sur quoi ça va marcher.
    • Ecologiquement, difficile à dire si streaming clairement pire ou non qu'une solution locale, dans la pratique on joue beaucoup tous aux mêmes heures, je suis pas convaincu qu'ils puissent mutualiser tellement, mais certainement plus que mon ordi. Mais ayant déjà une carte graphique, j'ai déjà facturé ça à la planète, donc ça serait forcément négatif aujourd'hui.
  • [^] # Re: La fin de la "stabilite" des standards ?

    Posté par  . En réponse au lien It's time to stop using C and C++ for new projects, says Microsoft Azure CTO. Évalué à 5.

    Le mot important c'est 'premature' pas 'optimisation'. Ce que je comprends de cette phrase c'est plus mesurez ce que vous optimisez et commencez pas par ça, codez juste avant de codez rapide, et évaluez le coût…

    Que celui qui n'a jamais optimisé la mauvaise fonction pour gagner moins de temps d'exécution totale que le temps passé a optimiser me jete la première pierre.

  • [^] # Re: Je change

    Posté par  . En réponse au lien It's time to stop using C and C++ for new projects, says Microsoft Azure CTO. Évalué à 4.

    La taille des objets mis sur la stack est connue en rust a la compilation, c'est même une erreur de compilation quand c'est pas le cas. Que l'architecture soit pas gérée par le compilateur je comprends, mais ta remarque sur la taille de la stack pas vraiment, et s'il faut être économe tu as de premier abord les mêmes possibilités (passer des pointeurs vers des trucs en heap, utiliser des types peu gourmands comme des int16) qu'en C… Tu peux détailler ce qui rend rust pas gérable côté stack, c'est la première fois que je lis ça et je vois mal le problème ? Surtout que le compilo me fait bien chier quand il me saoule avec ces histoires de tailles pas connues a la compilation :)

  • [^] # Re: Mes impressions

    Posté par  . En réponse au journal Performances et GC : détruisons les mythes. Évalué à 5.

    Quand le dev est compétent, il sait qu'il va devoir se méfier de faire du C

  • [^] # Re: J'en ai une, je m'en sers... mais pas assez

    Posté par  . En réponse au journal Clés de sécurité, pas assez utilisées. Évalué à 6.

    Perso j'ai 2 clés, une qui reste à la maison avec les autre trucs importants (type double de clés, papiers que je conserve pas sur moi…) et une sur moi. J'ai jamais eu de sites m'empêchant de déclarer deux clés, c'est pas mon plus gros problème. Là où c'est gênant c'est surtout a l'inscription vu que j'ai qu'une clé sur moi faut bien penser à enregistrer la 2eme ensuite quand on peut et ça s'oublie très vite.

  • [^] # Re: Hum...

    Posté par  . En réponse au journal Vous avez dit "caractère" ?. Évalué à 2.

    La ou ça me gène en pratique, c'est qu'il y a très peu (aucune ?) de fonctions de conversion.

    Autant je peux comprendre qu'historiquement on savait pas forcément si UTF-16 ou 8 ou 32 (ou 7… si si ça existe même s'il était sans doute pas candidat à la victoire :p) allait gagner et donc comment représenter une chaine (bon, en pratique, on représente qu'un tableau, osef d'itérer sur des charactères, savoir la taille de la chaine etc biensur), autant je trouve completement ridicule d'avoir aussi peu d'outils en C de base pour convertir ce qui fait que toute l'api te pousse à faire des erreurs.

    Rappel, ce qui est considéré comme une bonne pratique est d'avoir une représentation interne connue et de convertir à la lecture/écriture depuis/dans le charset qu'on veut, et en C c'est bien galère.

    De même, travailler sur des chaines en C, faut vraiment aimer les bugs, difficile de passer en lower case, de savoir le nombre de charactères, de normaliser…

  • [^] # Re: Super rich, super bullshit

    Posté par  . En réponse au journal La richesse des ultra-riches, à raison de 1000 USD par pixel. Évalué à 3.

    On pourrait inventer une industrie pour rendre toutes ces actions plus liquides, facilement transformables en argent ? Je propose de l'appeler "finance"

  • [^] # Re: Unité Bernard Arnault

    Posté par  . En réponse au journal La richesse des ultra-riches, à raison de 1000 USD par pixel. Évalué à 7.

    Ils le prétendent et l'on surrement fait.

    Le fait est que mettre en place de la participation à tes bénéfices quand tu organises l'absence de bénéfices (soit en cassant les prix pour écraser la concurrence, soit en se faisant facturer des choses genre propriété intellectuelle ou de marque par des filliales amies dans des paradis fiscaux) ça va pas rendre les employés si riches et encore moins quand tu as pu externaliser…

    Amazon a différentes politiques pour ses employés. Globalement developpeurs, marketing, cadre chez eux ça a réputation d'être confortable même sans participation. Manutentionnaire/livreur/petite main c'est un employeur qui a très mauvaise réputation.

  • [^] # Re: Survivor

    Posté par  . En réponse au journal C, un âge remarquable. Évalué à 5.

    Si tu supposes qu'un char code un charactère, peut être… C'est faux avec tous les encodings communs comme utf-8, utf-16, utf-32, même pas besoin de sortir l'étonnant UTF-7 (si si, ça existe, j'en ai vu des fois, ça fait très bizarre). En utf-8, un charactère peut occuper entre 1 et 4 bytes, en utf-16 2 ou 4, en utf-32 toujours 4. Et je te parle même pas du fait qu'il y a plusieurs façon de représenter le même charactère qui vont avoir des tailles différentes…

    La doc est d'ailleurs explicite, ça ne renvoit pas le nombre de char mais le nombre de bytes. Strlen ne renvoit pas la longueur d'une chaine mais la taille de sa représentation mémoire.

    En pratique, si tu as besoin d'accéder et travailler sur le texte, les chaînes C sont inutilisables vu qu'il n'y a pas de notion d'encoding, impossible d'itérer charactère par charactère, de passer en lowercase/uppercase tout en te laissant l'impression que tu peux.

    C'est ça entre autre qui donne une fausse impression de facilité, qu'il suffit de bien faire… mais faire du C ça doit aujourd'hui être vraiment un choix mûrement réfléchi parce que c'est un vrai champs de mines.

  • [^] # Re: Survivor

    Posté par  . En réponse au journal C, un âge remarquable. Évalué à 2.

    Magie magie, sauf que c'est faux:

    man strlen:

    The strlen() function returns the number of bytes in the string pointed to by s.

    Et non, le nombre de bytes c'est différent de la taille d'une chaine

  • [^] # Re: Encenser le C? Non!

    Posté par  . En réponse au journal C, un âge remarquable. Évalué à 7.

    Écrire 10 lignes de C sans UB, ça demande un talent et un temps dont peu de personnes disposent. Tout langage est un compromis entre pleins de facteurs, vitesse d'exécution, compétences disponibles, coût d'implémentation, interfaçage, vitesse d'écriture, limitation des bugs, outillage, historique, envie et pleins d'autres… Le C permet des choses formidables mais il amène de gros coûts, qui se résolvent très mal avec des yakas.

  • [^] # Re: Conclusion curieuse

    Posté par  . En réponse au journal Comment je suis devenu un vacciné antivaxx.... Évalué à 2.

    Perso, je n'ai strictement rien senti, ce qui fait que j'ai pris un autre sujet pour me plaindre à la machine a café.

    Le biais de sélection est sans doute non négligeable (il ne l'est jamais en fait, même avec beaucoup de bonne volonté on sait pas faire mieux que du randomisé)

  • [^] # Re: Vaccin ou pas vaccin

    Posté par  . En réponse au journal Petite question sur l'immunité collective. Évalué à 6.

    En vrai, je prends 10 covid pour pas chopper un tétanos, pour moi le noeud du problème du covid est son côté hyper explosif. C'est pas une maladie très grave en soit (j'ai pas dit gripette non plus), mais tu te retrouves avec des milliers de patients en moins de temps qu'il en faut pour dire ouf et un truc pas trop dangereux sur une telle population, ça fait de la casse et devient un enfer quand ton système de soin n'arrive plus à suivre.

  • [^] # Re: Vaccin ou pas vaccin

    Posté par  . En réponse au journal Petite question sur l'immunité collective. Évalué à 3.

    Si tu étudies le Tétanos, tu te fais vite vacciner. C'est une vraie saloperie, avec des taux de mortalité assez affolants, des traitements très durs et incertains, et tu douilles comme rarement.

  • [^] # Re: Ce qu'on aimerait (tous?) éviter ...

    Posté par  . En réponse au journal Petite question sur l'immunité collective. Évalué à 5. Dernière modification le 13 juillet 2021 à 17:01.

    Et plus simplement, merci de ne pas condamner à mort mes grands parents, y a des gens qui les aiment même s'ils sont vieux et malades.

  • [^] # Re: Nausée

    Posté par  . En réponse à la dépêche Sortie de Cassandre 4.0.0, un cadriciel pour développer votre propre « trading bot ». Évalué à 1.

    Ça ne représente même pas 1To de données si j'en crois https://www.blockchain.com/charts/blocks-size

    Je pense que Visa a plus d'un disque d'avance, sinon on est très très mal

  • [^] # Re: Nausée

    Posté par  . En réponse à la dépêche Sortie de Cassandre 4.0.0, un cadriciel pour développer votre propre « trading bot ». Évalué à 8.

    Le truc, c'est qu'une transaction en bitcoin, pour la valider il faut par construction faire des tonnes de calcul. Je ne connais pas l'informatique de Visa, mais il faudrait que leurs informaticiens soient vraiment tarés pour chercher des moyens constamment que le hash de leur DB prenne une valeur défini. Pour eux valider une transaction, c'est pas loin d'un COMMIT SQL, c'est dur à bien faire a cette échelle, mais ça n'a rien à voir avec résoudre un problème conçu à la base pour faire mouliner les ventilateurs des gpus.

    Cette méthode a un intérêt quand tu n'as pas confiance en qui que ce soit, sauf que globalement les gens ont confiance en Visa pour que les transactions soient valides (l'argent existe, il est supprimé une et une seule fois du compte source et ajouté une et une seule fois sur le compte destination)

  • [^] # Re: Nausée

    Posté par  . En réponse à la dépêche Sortie de Cassandre 4.0.0, un cadriciel pour développer votre propre « trading bot ». Évalué à 4.

    Le minage demande beaucoup d'énergie, mais cela n'a jamais été comparer à la consommation des centaines de milliers de personnes qui gère l'Euro ou le Dollars.

    L'Euro et le Dollar ont quand même la bonne propriété de me permettre d'acheter la majorité des trucs, aujourd'hui le bitcoin consomme beaucoup par design pour un service assez limité par rapport à des euros.

  • [^] # Re: pourquoi ?

    Posté par  . En réponse à la dépêche CentOS se saborde‑t‑elle ?. Évalué à 2.

    Si c'est pour les serveurs intégration/preprod mais qu'on t'a distribué une RHEL pour ta prod, vue que cette dernière est libre tu peux pas t'appliquer la GPL et l'installer aussi sur ces serveurs (sans support, comme les centos gratuites) ?

  • [^] # Re: globalement ça me parait pas mal

    Posté par  . En réponse au journal Projet de loi "Sécurité Globale". Évalué à 3.

    Ce que je me demande, c'est un peu pourquoi transformer les policiers municipaux en leur donnant les mêmes pouvoirs que des nationaux ? Pourquoi cet axe plutôt qu'améliorer le national ?