toctoc1 a écrit 189 commentaires

  • [^] # Re: Extraction de données ?

    Posté par  . En réponse à la dépêche Sortie de Tabula 1.0.1 - Extraction de données tabulaires dans des pdfs. Évalué à 8.

    Je ne suis pas dans l'équipe de dev, juste un utilisateur de la première heure, donc mon expertise technique est limitée sur ce sujet. Je vais essayer de ne pas dire trop de bétises.

    Le rendering et tout ce qui tourne autour du pdf (parsing) est géré par PDF.js depuis la version 1.0. Par le passé, c'était JPedal qui fait tout cela mais le changement a eu lieu récemment.

    Pour la partie extraction du tableau, Tabula utilise deux algorithmes maisons et effectivement PDFBox.
    Plutôt que de reformuler maladroitement l'aspect technique du fonctionnement de Tabula, je préfère te renvoyer vers cette page : https://github.com/tabulapdf/tabula-extractor#how-does-this-work-like-theoretically

    Ces deux algo sont basés notamment sur cette publication universitaire.

  • # Usage et adoption

    Posté par  . En réponse à la dépêche Sortie de Tabula 1.0.1 - Extraction de données tabulaires dans des pdfs. Évalué à 10.

    Tout d'abord, merci au modérateur et aux relecteurs de ma première dépêche! ;)

    J'utilise Tabula tous les jours dans le domaine de la compliance/analyse de relevés bancaires.
    Lorsque Tabula échoue ou génère beaucoup de décalage de colonnes - ce qui arrive sur des pdf de 200 pages scannés et ocrisés - je couple Tabula avec OpenRefine pour redresser plus vite mes tableaux.

    Ce magic combo Tabula/Refine a vraiment boosté ma productivité au quotidien!

    L'équipe de développement fait un boulot assez remarquable.

    J'ajoute que tabula est en faite une interface web à un un moteur en ligne de commande : tabula-extractor, et qui peut être scripté. https://github.com/tabulapdf/tabula-extractor

    Bref, cet outil est merveilleux et je voulais vous faire partager mon enthousiasme à son sujet.

  • # Bravo pour le site

    Posté par  . En réponse à la dépêche Blender comme outil de montage audio-vidéo grâce à Blender Velvets. Évalué à 6.

    Un grand bravo pour le site internet!
    Rien qu'à lire les tutos, j'ai appris plein de choses! (Velvet Revolver notamment)

  • # quel est le rapport avec le libre?

    Posté par  . En réponse à la dépêche Tamashare : salle virtuelle interactive pour vos activités collaboratives. Évalué à 3.

    Soft français, certes. Mais proprio.
    Je veux bien degoogliser, mais quitte à le faire, autant aller vers bigbluebutton, déjà cité ci-dessus.

  • # Superbe projet.

    Posté par  . En réponse à la dépêche 1flow — plate‐forme libre pour l’information. Évalué à 2.

    Interface superbe, beau projet. J'adore.

    question : est-il prévu un export RSS des articles?
    genre, je fais ma sélection et je mets à dispo mes lectures à destination de lecteurs.

    Merci de mettre à dispo le code, également. c'est génial.

  • # Outil simple et fabuleux! j'adore!

    Posté par  . En réponse à la dépêche Kanboard, un logiciel libre pour gérer ses projets avec la méthode Kanban. Évalué à 2.

    Bon ben voilà,
    A peine arrivé ce matin et déjà en prod au bureau. C'est génial.

    Deux suggestions :

    • pouvoir réorganiser les colonnes par drag n' drop, notamment quand on a créé une nouvelle colonne dans un projet
    • La possibilité d'afficher en tableau en mode public, en lecture seule.

    Sinon, c'est vraiment excellent, bravo!

  • # Super!

    Posté par  . En réponse au journal Mon projet : Feedspot. Évalué à 1.

    Bravo pour ce boulot, c'est bluffant!

    Question : Si je veux déployer feedspot sur sur mon serveur local (intranet) et proposer à mes collègues cet outil, les sources du site web sont-elles également sous licence BSD et dispo?

  • # automatisation

    Posté par  . En réponse à la dépêche Méthode et outils pour la veille technologique. Évalué à 3. Dernière modification le 31 janvier 2013 à 09:52.

    Je serai moins dur que mes camarades du dessus. J'ai péché quelques outils dans ta dépêche.

    Mon expérience, c'est qu'il manque l'outil ultime qui puisse en un click, prendre l'URL qui t'intéresse, parser un résumer du texte (le x premières lignes), créer un pdf index de l'ensemble du texte, associer l'ensemble dans un post de blog (exemple joomla ou wordpress.

    J'ai testé des trucs avec IFTTT ( http://ifttt.com ), par exemple, mais le résultat est aléatoire.

    Mais je cherche toujours.

    H.

  • # Weboob

    Posté par  . En réponse à la dépêche SFRswallow, envoyer des SMS en ligne de commande. Évalué à 9.

    Ça mériterait un backend pour weboob.

  • # Sur un intranet

    Posté par  . En réponse au journal je découvre yacy, moteur de recherche p2p. Évalué à 1.

    J'ai tenté l'installation de Yacy pour indexer un NAS au bureau.
    L'idée c'était de faire profiter à une centaine d'utilisateur sur mon intranet, d'un accès à des fichiers de mon NAS et récupérer au passage les infos du leur.

    J'ai été emballé par l'idée, moins par le résultat : paramétrage confus, résultats bof, bof...

    Cela dit, depuis que Korben en a parlé sur son blog, la version française a fait des progrès.

  • [^] # Re: Karma remis à pas beaucoup?

    Posté par  . En réponse à la dépêche Nouvelle version de LinuxFr.org. Évalué à 10.

    C'est sciemment fait pour que Patrick_g fasse moins le malin.

  • [^] # Re: Pour le retour des dépêches

    Posté par  . En réponse à la dépêche Nouvelle version de LinuxFr.org. Évalué à 10.

    Pertinent.

    Je prône un retour vers la page dépêche par défaut.

  • # video

    Posté par  . En réponse à la dépêche Focuswriter, un éditeur de texte sans distractions. Évalué à 0.

    J'ai trouvé une video sur youtube pour mieux comprendre le truc :

    http://www.youtube.com/watch?v=aLKm_04OBw4

    intéressant le concept.
  • # PIL

    Posté par  . En réponse au message Conseil pour lire des données EXIF ?. Évalué à 1.

  • # Plex et autres joyeusetés - DLNA

    Posté par  . En réponse à la dépêche XBMC 10.0 "Dharma" est enfin de sortie!. Évalué à 0.

    J'ai testé XBMC pour sa partie serveur DLNA entre mon mac et ma TV samsung.
    ça marchait bien, et je trouve ce soft achement bien. Par contre, PLEX, son fork m'avait plus plu.

    Et finalement le serveur DNLA que j'ai installé est TVMOBILI. PAs libre, mais très bien.

    En tout cas je trouve ce genre de projet très excitant!
  • [^] # Re: I blue 747

    Posté par  . En réponse au message Cherche un logger GPS avec une forte autonomie. Évalué à 1.

    http://www.transystem.com.tw/product.php?b=G&m=pe&ci(...)

    j'oubliais le site...

    Ce modèle pro a un capteur de mouvement pour optimiser la conso d'énergie.
  • # I blue 747

    Posté par  . En réponse au message Cherche un logger GPS avec une forte autonomie. Évalué à 2.

    Le iblue est bien. pour l'autonomie, par contre, pas plus de 28 heures (testée) mais on peut facilement le bricoler pour ajouter un support de pile lithium.

    pour récupérer les données sous linux ou windows, ou mac :

    http://www.bt747.org/


    On le trouve sur ebay, pas trop cher.
    on peut même récupérer les données en bluetooth depuis un PDA.
  • [^] # Re: question sur DM

    Posté par  . En réponse à la dépêche Sortie de Nuxeo EP 5.4 - plate-forme de gestion documentaire libre. Évalué à 1.

    Merci pour ta réponse rapide.

    Je vais réessayer DM début décembre, j'aurai un peu plus de temps.
  • # question sur DM

    Posté par  . En réponse à la dépêche Sortie de Nuxeo EP 5.4 - plate-forme de gestion documentaire libre. Évalué à 1.

    Bonjour

    Je suis à la recherche d'une solution de GED à déployer.


    J'ai testé la précédente version de DM en ligne qui m'avait bien plu.
    Mais lorsque j'ai récupéré la version "bundle" pour windows, une bonne partie des fonctionnalités n'était pas présente (affichage des PDF, par exemple).

    Je n'ai pas beaucoup plus creusé, alors je profite que des dev de Nuxeo moulent sur DLFP pour poser mes questions :


    Out-of-the-box est-ce que Nuxeo DM sait :

    - prendre un répertoire où se trouvent plein de sous-répertoires contenant des fichiers PDF indexés, des fichiers DOC, et Open Document et me les importer dans DM par lot? (250.000 documents à cet instant)
    - auto-tagger ces documents pour une recherche intelligente?
    - Envoyer un mail chaque semaine à mes utilisateurs en leur livrant un Digest des documents importés et mis à jours ces 7 derniers jours (une revue de presse, quoi)
    - faire un aperçu rapide des documents PDF, DOC et OpenDocument en consultations?

    Merci
  • # je sais que tu ne veux pas d'un phone...

    Posté par  . En réponse au message Existe-t-il encore des PDAs ?. Évalué à 1.

    Mais je me suis trouvé la semaine passée dans ta situation !
    Je cherchais un PDA, customisable, avec agenda, et note. Un truc basique, pas cher, d'occase et bien distribué/documenté.

    J'ai acheté sur PriceMinister, d'occasion un HTC Touch P3450, tout bête.
    Un proc OMAP 221Mhz, 64Mo de Ram.
    Esthétiquement très réussi/

    Le vendeur a eu le bon goût d'y précharger une ROM type Seiya pleine de bonne idées.

    J'ai acheté ça 50 euros. une misère.

    J'ai investi 20 euros de plus dans le connecteur BirdieSync pour Thunderbird+Lightning. http://www.birdiesync.com/

    Eh hop, j'ai un PDA qui en plus fait téléphone. Cherry on ze Cake.

    OK, c'est pas libre, c'est du WM6.1 dedans, mais tu trouveras une tonne de soft GPL à y claquer. Et des rom en veux-tu en voilà...
    Par exemple, mon GPS bluetooth se connecte dessus avec plein d'appli.

    Bref, c'est un couteau suisse, ce truc. Adopté illico.

    H.
  • [^] # Re: et ?

    Posté par  . En réponse à la dépêche Weboob 0.3. Évalué à 4.

    Moi ce que je retiens, c'est la possibilité de script.

    Je suis dans ton cas : je pense que les premiers articles sur Weboob faisaient un peu "blague de potache". J'ai même relu la description et c'est presque incompréhensible.

    Je vois plein d'intérêts à ce truc.

    Ex : je fais de la veille internet, pour une revue de presse.
    Je pense que weboob me permettrait de récupérer du full-text sans fioriture et de déclencher une action (envoi de mail, sauvegarde, alarme, etc...)...
    Jouer le rôle de trigger, en fait.

    A suivre.
  • [^] # Re: Résolu - Klyster

    Posté par  . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.

    en fait Klyster ne fait pas tout... et notamment pas le tri "que les fichiers de la semaine"...

    Cela dit c'est un bon soft.
  • # Résolu - Klyster

    Posté par  . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.

    En fait, sur une requête alambiquée de GUEUGUEL, j'ai découvert Klyster, logiciel GPL qui fait ça.

    http://www.kobware.com/klyster.php

    Qt4 et C++....

    Merci pour vos réponses!

    H.
  • [^] # Re: ?

    Posté par  . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.

    pas de zsh dispo... :(

    en bash, ça donnerait quoi?
  • [^] # Re: ?

    Posté par  . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.

    en batch, ça m'irait aussi.

    zsh, je ne connais pas mais je viens de voir que j'ai cygwin sur ma machine.... je jete un coup d'oeil.