Journal csvspoon et csvformatmail: l'industrialisation de la manipulation de fichiers csv.

Posté par  . Licence CC By‑SA.
Étiquettes :
49
23
mar.
2021

Bien que les journaux sur le cyclisme me manquent, tout se perd ma bonne dame, y compris le cyclisme sur dlfp, dans ce journal, csv ne désigne pas cycliste sur vélo mais comma separated values, un format primitif de stockage de données tabulées.

Dans mes activités je me retrouve régulièrement à gérer des données de notes d'étudiants dans des modules d'enseignements à gros effectifs, ainsi qu'à envoyer des mails au dits étudiants. La manipulation se fait très souvent (…)

Sortie de Tabula 1.0.1 - Extraction de données tabulaires dans des pdfs

Posté par  . Édité par Nils Ratusznik, claudex et palm123. Modéré par Ontologia. Licence CC By‑SA.
Étiquettes :
44
15
sept.
2015
Base de données

Issu de l'univers du data-journalisme, Tabula est un logiciel permettant d'extraire facilement des données tabulaires issues de fichiers PDF. Il a été développé par des journalistes pour des journalistes. Mais son usage va au-delà de cette profession : étudiants, chercheurs, etc…

Si vous avez déjà essayé de copier-coller des tableaux contenus dans des documents PDF pour les retravailler dans Libre Office par exemple, au format CSV, vous savez à quel point c'est compliqué et chronophage.

Gratuit, Libre (Licence MIT), Tabula fonctionne sous Mac, Windows et Linux. Codé en Ruby, fonctionnant avec la JVM, Tabula est un web-service puissant, disposant de fonctionnalités de détection de tableaux de deux types :

  • soit par détection automatique des espaces entre les colonnes (mode stream) ;
  • soit par détection automatique des caractères de colonnes (mode lattice).

Journal En finir avec CSV ou Excel pour échanger des données

Posté par  . Licence CC By‑SA.
19
6
oct.
2020

Du Excel-engineering dans tout sa splendeur:
Excel: Why using Microsoft's tool caused Covid-19 results to be lost

Mais je suis aussi à blâmer: j'ai souvent utilisé Excel ou CSV pour échanger des données alors que je sais pertinemment que c'est mal.
Je ne compte pas les soucis que j'ai eu à cause d'un mauvais formatage de fichiers CSV (texte non quoté, retour à la ligne dans les valeurs, texte avec guillemets, etc.). Ou encore Excel qui persiste à interpréter "00123" (…)

Journal Feuille de style pour CSV

Posté par  . Licence CC By‑SA.
12
23
jan.
2019

N'avez-vous jamais voulu suivre l'évolution d'un fichier de type "tableur" ?

Et bien, moi, je voulais versionner un tel fichier contenant des chaînes de caractères et leurs traductions. Le projet évoluant, des lignes venait s'insérer à n'importe quel endroit du fichier. J'aurais pu utiliser le format CSV mais je voulais manipuler le document avec un tableur (LibreOffice Calc, par exemple) et je trouvais cela fastidieux de repasser par la phase d'importation à chaque ouverture; je me suis dès lors tourné (…)

Journal autocsv2sql : un utilitaire pour convertir ses CSV sans se poser de question, "écris" en OCaml

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
10
13
mar.
2024

Cher Journal,

J'ai probablement mal cherché dans les tréfonds de l'internet, mais je rêvais depuis longtemps d'un bête utilitaire en CLI pour me convertir un CSV en SQL sans me poser de question, ie. je lui donne le fichier et il se débrouille avec les types de données, l'ordre de création de table.

C'est maintenant chose faite avec autocsv2sql, un utilitaire que j'ai "écris" en OCaml, et qui fait globalement bien le taf pour la 20aine de CSV que (…)

Forum Programmation.java fichiers csv

Posté par  .
Étiquettes :
2
21
avr.
2012

Bonjour à toutes et tous,

Je m'appelle Manuel. Je suis amateur de programmation.
Mon dernier projet est un logiciel de création graphique d'images et vidéos.
Un petit projet que j'ai aussi est un lecteur de fichiers texte sous interface graphique.
Pas vraiment un éditeur plutôt quelque chose comme une base de données.
Fort d'une première expérience concluante avec des fichiers "CSV", je souhaite améliorer mon logiciel.
Pour ca, j'aurais besoin de fichiers csv librement utilisables et redistribuables.
J'ai trouvé le (…)

Forum Programmation.shell Formater fichier de sortie vers colonnes CSV

Posté par  . Licence CC By‑SA.
Étiquettes :
1
30
juil.
2019

Bonjour à tous,

Je cherche de l'aide.
J'ai un fichier généré par SQL, sur lequel j'aimerai séparer les lignes existantes, vers un format de type "Colonne CSV".
Je sais que SQL peut sortir un CSV directement, mais les contraintes de l'environnement sur lequel je travaille m'obligent à passer par un fichier "temporaire"
Je n'arrive pas à trouver la bonne technique pour modifier ce formatage.

Ci-dessous l'exemple de fichier, je souhaite le "transformer" en un CSV séparé par des "," par (…)

Forum Programmation.shell Script awk : Afficher le nom du fichier en cours de traitement ?

Posté par  . Licence CC By‑SA.
Étiquettes :
1
16
juil.
2019

Bonjour,

Je suis bloqué sur un script et je ne sais pas comment m'en sortir. Je sollicite donc votre aide.

J'ai un script qui me permet d'afficher avec une mise en page des informations provenant de plusieurs CSV.

Voici le script :

    cat /var/www/cgi-bin/LPAR_MAP/*.csv | grep foo | awk -F',|;' '{print $2","$5","$6","$7}' | awk '{
    print "LPARS :" $2
    print "RAM : " $5
    print "CPU 1 : " $6
    print "CPU 2 : " $7
    }'

Ce script (…)

Forum général.cherche-logiciel Base de données/API pour évaluer la crédibilité d'un site

Posté par  . Licence CC By‑SA.
Étiquettes :
1
1
avr.
2019

Existe-t'il un annuaire ou un service qui permettrait d'obtenir rapidement une note sur la crédibilité d'un site ou blog d'informations ?

Je pense à quelque chose de très basique, qui séparerait les sites ultra-propagandistes (genre diffusion d'informations entièrement imaginaires, appels à la haine etc) des plateformes plus réputées (mêmes si financées par un grand nom de l'armement ou un ami du président).

Mon googlage rapide m'a renvoyé à des initiatives assez ambitieuses, souvent des pages qui s'efforcent de répertorier et (…)