steph1978 a écrit 3753 commentaires

  • [^] # Re: sauver un châton

    Posté par  . En réponse au journal [HS] Prix des carburants vs. prix du brut : déphasage(s) ?. Évalué à 3 (+1/-0).

    je remonte en commentaire la structure du fichier traité

    Pareil. AWK est data driven, si on connais pas le format de l'input, difficile de comprendre le programme.

  • # BS ?

    Posté par  . En réponse au lien Débranchée par Trump des IA de pointe américaines, l’Europe accuse le coup et peine encore à contre-attaquer. Évalué à 4 (+2/-0).

    Je n'ai pas lu l'article car bon, bfm, pas trop tenté.

    Sur le sujet en lui même, j'ai du mal à conclure si il s'agit juste d'un coup marketing de Anthropic : regardez notre modèle est tellement fort que l'état a dû interdire ; ou si l'administration Trump est juste trop con en pensant vraiment que c'est plus dangereux qu'un autre LLM ; heu en l’écrivant, je viens de conclure.

  • [^] # Re: sauver un châton

    Posté par  . En réponse au journal [HS] Prix des carburants vs. prix du brut : déphasage(s) ?. Évalué à 3 (+1/-0).

    Je me rappelle de ce journal sur les villes en ville. Il a fait partie d'une série de journaux sur les cartes en générale ; très cool.

    pour comprendre ces scripts AWK

    J'avais essayé de résumer ses principes dans ce journal ; je ne sais pas si ça aide.

    Cela parait abscons au premier abord car il y a une partie implicite : on ne voit pas les boucles ; il y a des variables non initialisées un peu partout. Mais une fois qu'on a le modèle mental en tête, la syntaxe est très simple et, pour ma part, je n'ai que rarement besoin d'aller voir la doc.
    C'est peut être le même manque de pratique qui m'oblige à avoir la doc de Pandas sous les yeux quand j'en fait.

    Pour moi, AWK, c'est vraiment la botte secrête quand on a masse de données texte à processer.

  • [^] # Re: ai slop, oui mais open source

    Posté par  . En réponse au lien Ironsmith - Décrivez votre app Mac et l'IA la forgera. Évalué à 2 (+0/-0).

    Quand tu demandes rien de particulier, j'imagine qu'un agent de code, sous macos, t'emmène sur du Swift+xcode.

  • # top !

    Posté par  . En réponse au lien Avis de sebsauvage sur DeltaChat. Évalué à 3 (+1/-0).

    Je suis ravi de cet article car pour ma part,j'en étais à

    Plus le temps passe, plus je me dis que DeltaChat est une purin [sic] de bonne idée.

    Sans pour autant avoir élaboré.

  • # et pourtant

    Posté par  . En réponse au lien Anthropic « désactive brutalement » ses deux modèles d’IA les plus puissants, faute de pouvoir se conformer aux ordres de l’administration Trump. Évalué à 9 (+7/-0).

    Quand on sait que ce sont les américains ont élus Trump, on se dit que c'est à eux qu'il faudrait interdire les jouets dangereux.

  • # ai slop, oui mais open source

    Posté par  . En réponse au lien Ironsmith - Décrivez votre app Mac et l'IA la forgera. Évalué à 3 (+1/-0).

    https://github.com/Jeidoban/Ironsmith

    bon moi ça m'intéresse pas non plus vraiment …

  • # sauver un châton

    Posté par  . En réponse au journal [HS] Prix des carburants vs. prix du brut : déphasage(s) ?. Évalué à 6 (+4/-0).

    Journal très sympa.

    J'ai quand même buggé sur :

    prévoyez de la RAM, chez moi ça en a pris ~22 Go pour parser tout ça

    Ça veut dire une machine avec 32GB de RAM. Pas trop dans mes moyens en ce moment.

    Je connais bien la structure des fichiers de données car j'ai déjà joué avec par le passé. Ils peuvent être parsé en mode texte car les xml sont bien indentés.

    Pour chaque par points de vente (pdv), il y a toutes les modifications de prix effectuées dans l'année : type de carburant, date, prix.

    Les fichiers ne sont pas triés pas dates mais par pdv, il faudra donc rassembler les données par date avant de les dumper.

    J'utilise donc le script awk suivant :

    # prix nom="Gazole" id="1" maj="2017-09-03 09:13:43" valeur="1.151"/>
    #   $1       $2     $3 $4  $5           $6             $7     $8   $9
    $1 == "prix nom=" {
        type = $4
        prix = +$8 < 100 ? +$8 : +$8 /1E3
        date = substr($6,1,10)
        k = type "@" date
        if (! N[k]++) {  # first record for this (type, date)
            MAX[k] = MIN[k] = prix
        } else {
            if (prix > MAX[k]) { MAX[k]=prix }
            else if (prix < MIN[k]) { MIN[k]=prix }
        }
        SUM[k] += prix
        SQ2[k] += prix*prix
    }
    END {
        for (k in N) {
            type = substr(k,1,1)
            date = substr(k,3)
            AVG = SUM[k] / N[k]
            VAR = (SQ2[k] - 2*SUM[k]*AVG) / N[k] + AVG*AVG
            print date, AVG, MIN[k], MAX[k], sqrt(VAR) >> "stats_dir/type_" type ".txt"
        }
    }

    Il y a une petite gymnastique avec les clés de tableaux associatifs car MAWK ne supporte pas les tableaux imbriqués contrairement à GAWK mais est au moins deux fois plus rapide.

    Je fais la glue avec le script bash suivant:

    #!/bin/bash -eu
    
    AWK=mawk
    export LC_NUMERIC=en_GB.UTF-8
    TIME='/usr/bin/time -f %M,%P,%e,%U,%S,%W,%c,%w,%x'
    
    for y in $(seq 2007 2026);
    do
        echo $y
        $AWK -F "<" '{print $2}' <(unzip -p 1_dl/PrixCarburants_annuel_${y}.zip PrixCarburants_\*.xml) \
        | $TIME $AWK -F '"' -vOFS=";" -f parse_pdv.awk
    done

    Le premier AWK permet de récupérer le contenu de la balise ouvrante XML. Pour le second on découpe les attributs XML avec le caractère ".

    Le script prend 54.73s pour process les 4.257GB de données et consomme en pic 3.356Mo de RAM ; oui, moins de 4 mégaoctets de RAM. Le script AWK est bien le facteur limitant (pas le premier awk ni le unzip).

    Pour produire six fichiers - un par type de carburant - de 7000 (=19*365) lignes chacun, pour 280Ko en tout, qu'il faudra alors charger dans pandas. J'imagine que cela ne prendra que quelques dizaine de Mo de RAM.

    Il faudra encore réaliser l’agrégation par semaine car le script AWK ne le fait pas. Il n'est là que pour diminuer drastiquement la quantité de données à charger dans Python.

  • # déçu

    Posté par  . En réponse au lien Gloire à la cancoillote. Évalué à 2 (+1/-1).

    Pas un seul commentaire raciste, misogyne, homophobe ou transphobe sur cet article en ligne du figaro.

    Simple manque d'imagination ou aurait-on enfin trouvé le sujet qui uni les peuples : la bouffe ?

  • [^] # Re: sur peertube

    Posté par  . En réponse au journal Vulnérabilités systémiques dans le secteur du numérique : Table ronde sur le logiciel libre. Évalué à 10 (+9/-0).

    videos.assemblee-nationale.fr est hébergé chez OVH à Roubaix

    video.tedomum.net est hébergé chez OVH à Gravelines

    Ça fait un peu derby du nord…

  • # bague offline ?

    Posté par  . En réponse au lien PulseLoop libère les bagues connectées à 7 dollars. Évalué à 5 (+3/-0).

    Je crois comprendre que pour 7$, la bague ne stocke pas de données et a besoin en permanence d'un smartphone pour lui envoyer les mesures au fur et à mesure, c'est ça ?

    Si oui, ça se comprend pour le prix, mais ça limite bien l'usage. Je ne vais pas courir avec mon téléphone, je trouve cela trop encombrant. Et je le passe en mode avion la nuit pour ne pas avoir une source d'ondes à quelques centimètres de la tête.

  • [^] # Re: Mais ça existe déjà

    Posté par  . En réponse au lien Le projet titre unique (de transport). Évalué à 5 (+3/-0). Dernière modification le 11 juin 2026 à 14:39.

    Là, soit tu parles du media, soit tu parles du mode de paiement.

    Dans tous les cas : 1/ la CB est contrôlé par des organismes privés (banque, fabriquant) qui peuvent la supprimer quand ils veulent (d'ailleurs ils le font tous les deux ans). Donc impossible de s'appuyer dessus pour le transport publique.

    2/ la CB dépanne occasionnellement dans le bus mais tu payes le billet plein pot voire même avec une petite majoration dû au frais de transaction avec nos chers$$ amis américains Visa et MasterCard.

    De toute façon, ici, on parle de centraliser le compte de l'usager.

    L'idéal, pour ne pas avoir à emmètre quantité de petits rectangles en plastique serait de pouvoir enregistrer n'importe quel badge RFID, de mettre de l'argent sur un compte "transport public" et de pouvoir voyager sur n'importe quel réseau de France et de Navarre.

  • [^] # Re: échantillon

    Posté par  . En réponse au journal Quel hébergeur préférer, ou éviter?. Évalué à 3 (+1/-0).

    hébergés sur les 100 Mo compris dans l'offre nom de domaine

    Oui c'est étonnant tout ce qu'on peut héberger dans 100Mo.

    Ça, plus un compte sur une forge logicielle avec CI/CD et on peut déployer des applications sans acheter/louer et administrer de serveur.

  • [^] # Re: occupation mémoire, etc

    Posté par  . En réponse au message Ghostty 1.3 : le terminal en Rust qui veut remplacer Alacritty et WezTerm. Évalué à 2 (+0/-0).

    https://www.enlightenment.org/about-terminology.md

    This topic does not exist yet

    You've followed a link to a topic that doesn't exist yet. If permissions allow, you may create it by clicking on “Create this page”.

  • # `rg -M 69 foo`

    Posté par  . En réponse au message grepLittleLine.sh. Évalué à 2.

    ripgrep a l'option -M nn pour cela:

        -M NUM, --max-columns=NUM
            When given, ripgrep will omit lines longer than this limit in bytes.
            Instead of printing long lines, only the number of matches in that line
            is printed.
    
  • [^] # Re: échantillon

    Posté par  . En réponse au journal Quel hébergeur préférer, ou éviter?. Évalué à 4 (+2/-0).

    D'où le mieux avec API + Ansible.

  • # as code

    Posté par  . En réponse au message cherche logiciel de frise chronologique. Évalué à 3 (+1/-0).

  • # debian, sans hésitation

    Posté par  . En réponse au message Choix distribution serveur : Debian versus Ubuntu. Évalué à 3 (+1/-0).

    Les surcouches, ça apporte plus de complexité qu'autre chose.

    Sur desktop, il pourrait y avoir le débat du look and feel. Mais sur serveur, ça ne compte pas.

    Au final, sur Debian, grâce au backports, tu as [5 ans de support](https://endoflife.date/debian].

    Et puis la gouvernance est impeccable, la communauté bienveillante.

  • # échantillon

    Posté par  . En réponse au journal Quel hébergeur préférer, ou éviter?. Évalué à 3 (+1/-0).

    Je n'ai pas pratiqué beaucoup de fournisseurs donc mon retour va être très partiel et partial.

    Pour les mails, j'utilise infomaniak, principalement pour 1/ la Suisse (l’Europe) 2/ le prix : 22€/an pour 5 boites mail. Leur webmail est pourri mais pas plus que les autres webmails.

    Pour les noms de domaine, j'utilise OVH principalement pour 1/ la France 2/ le prix. Ça vient avec quelques supplément sympathique : hébergement site web php+mysql de 100Mo. Une API et un module Ansible pour faire le paramétrage de la zone DNS en infra as code.

    Pour l'hébergement, j'utilise du bare métal chez OVH pour 1/ la France 2/ le prix. Très peu de problèmes en plus de 10 ans. Quelque fois un serveur qui reboot tout seul. Le support un peu lent pour traiter les tickets des fois. Au final, je pense pas bouger.

  • # toktok

    Posté par  . En réponse au lien Votre Smart TV aide les scrappers web à contourner les blocages. Évalué à 2 (+0/-0).

    L'application tiktok a servi à ça aussi, sûrement pour scraper les données servant à l’entraînement de leur IA.

  • [^] # Re: what ?

    Posté par  . En réponse au journal Publication de contenus augmentés par l'IA. Évalué à 2 (+0/-0).

    Tu as raison. Je choisirai la définition qui me permettra de récupérer mon billet :)

  • [^] # Re: what ?

    Posté par  . En réponse au journal Publication de contenus augmentés par l'IA. Évalué à 2 (+0/-0).

    Comment tu le définis?

    En effet je n'ai pas les compétences pour le faire, je me baserai donc sur des conclusions d'experts.

  • [^] # Re: what ?

    Posté par  . En réponse au journal Publication de contenus augmentés par l'IA. Évalué à 3 (+1/-0). Dernière modification le 03 juin 2026 à 18:39.

    Je suis pleinement d'accord.

    Ce que nous nommons "conscience" et qui est actuellement implémenté par un cerveau biologique pourrait tout à fait être implémenté par de l'électronique. Il y a d'ailleurs des exercices de pensés dans ce sens.

    Mais je fiche mon billet que les LLM n'iront pas jusque là.

  • [^] # Re: Intéressant

    Posté par  . En réponse au lien Sam Altman, le messie de l'IA. Évalué à 7 (+5/-0).

    Justement, le considérer comme un ennemie serait lui donner trop d'importance. C'est seulement un sociopathe comme le capitalisme en produit à la pelle.

  • [^] # Re: Légèrement partial

    Posté par  . En réponse au lien Reddit - GitHub Copilot's new billing system is wreaking havoc. Évalué à 8 (+6/-0).

    Je me réjouis de voir que les prix rejoignent les coûts réels. C'est le seul moyen d'endiguer la prolifération des usages d'IAGen.