• # CSV

    Posté par  (site web personnel, Mastodon) . Évalué à 6.

    Dans les évolutions de Awk, celle-là me parait une avancée importante. Les fichiers CSV sont utilisés dans plein de domaines, et pouvoir les traiter directement avec un langage comme Awk est quelque chose que les gens attendent depuis longtemps.

    https://benhoyt.com/writings/goawk-csv/

    • [^] # Re: CSV

      Posté par  (site web personnel) . Évalué à 4.

      C’est super le format CSV, c’est simple facile, à construire, facile à lire, sauf que

      Le format CSV n’est pas un format texte mais un format binaire.

      Le format CSV n’est pas un format texte mais un format binaire.

      Le format CSV n’est pas un format texte mais un format binaire.

      mais quand on s’en rend compte, c’est trop tard. On est piégé. Fini. Foutu.

      Ça fonctionne bien tant qu’on travaille sur ses propres fichiers de son coté, mais dès qu’on s’ouvre au monde on découvre à quel point l’univers est cruel :

      Niveau 0 :

      • les européens qui utilisent le point virgule à la place de la virgule
      • les caractères d’échappements avant les séparateurs de champs (\,)
      • les caractères d’échappements qui sont échappé eux meme (\\,)

      Niveau 1 :

      • les séparateurs de champ qui sont contenus dans un bloc texte (",")
      • les caractères de bloc textes qui n’en sont pas vraiment car précédé par un caractère d’échappement (\")

      Niveau 2 :

      • toutes les combinaisons possibles des niveau 0 et 1
      • le texte contenant des retours chariots
      • les formules excels stockées directement le CSV (="Du texte")

      Et la découverte de cette année : Excel enregistre le "CSV au format UTF-8" en ajoutant un Indicateur d'ordre des octets — ou BOM pour les intimes. Il te faut donc commencer à lire les premiers octets du fichier voir s’il s’agit d’un BOM, et si c’est le cas ne commencer à parser le fichier qu’après. (un exemple de cas posant problème dans un ticket de bug ouvert que j’ai ouvert suite à ça)

      Allez on le répète une dernière fois pour la route

      Le format CSV n’est pas un format texte mais un format binaire.

      Pfff ça va mieux.

    • [^] # Re: CSV

      Posté par  (site web personnel, Mastodon) . Évalué à 2.

      On va pouvoir remiser fawk, xsv, csvkit, csvtool, tsv-utils, etc. et autres csvspoon et miller ? Tant d'énergie investie dans ce faux format m'épate.

      “It is seldom that liberty of any kind is lost all at once.” ― David Hume

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.