Je ne suis pas dans l'équipe de dev, juste un utilisateur de la première heure, donc mon expertise technique est limitée sur ce sujet. Je vais essayer de ne pas dire trop de bétises.
Le rendering et tout ce qui tourne autour du pdf (parsing) est géré par PDF.js depuis la version 1.0. Par le passé, c'était JPedal qui fait tout cela mais le changement a eu lieu récemment.
Tout d'abord, merci au modérateur et aux relecteurs de ma première dépêche! ;)
J'utilise Tabula tous les jours dans le domaine de la compliance/analyse de relevés bancaires.
Lorsque Tabula échoue ou génère beaucoup de décalage de colonnes - ce qui arrive sur des pdf de 200 pages scannés et ocrisés - je couple Tabula avec OpenRefine pour redresser plus vite mes tableaux.
Ce magic combo Tabula/Refine a vraiment boosté ma productivité au quotidien!
L'équipe de développement fait un boulot assez remarquable.
Question : Si je veux déployer feedspot sur sur mon serveur local (intranet) et proposer à mes collègues cet outil, les sources du site web sont-elles également sous licence BSD et dispo?
Je serai moins dur que mes camarades du dessus. J'ai péché quelques outils dans ta dépêche.
Mon expérience, c'est qu'il manque l'outil ultime qui puisse en un click, prendre l'URL qui t'intéresse, parser un résumer du texte (le x premières lignes), créer un pdf index de l'ensemble du texte, associer l'ensemble dans un post de blog (exemple joomla ou wordpress.
J'ai testé des trucs avec IFTTT ( http://ifttt.com ), par exemple, mais le résultat est aléatoire.
J'ai tenté l'installation de Yacy pour indexer un NAS au bureau.
L'idée c'était de faire profiter à une centaine d'utilisateur sur mon intranet, d'un accès à des fichiers de mon NAS et récupérer au passage les infos du leur.
J'ai été emballé par l'idée, moins par le résultat : paramétrage confus, résultats bof, bof...
Cela dit, depuis que Korben en a parlé sur son blog, la version française a fait des progrès.
J'ai testé XBMC pour sa partie serveur DLNA entre mon mac et ma TV samsung.
ça marchait bien, et je trouve ce soft achement bien. Par contre, PLEX, son fork m'avait plus plu.
Et finalement le serveur DNLA que j'ai installé est TVMOBILI. PAs libre, mais très bien.
En tout cas je trouve ce genre de projet très excitant!
Le iblue est bien. pour l'autonomie, par contre, pas plus de 28 heures (testée) mais on peut facilement le bricoler pour ajouter un support de pile lithium.
pour récupérer les données sous linux ou windows, ou mac :
Je suis à la recherche d'une solution de GED à déployer.
J'ai testé la précédente version de DM en ligne qui m'avait bien plu.
Mais lorsque j'ai récupéré la version "bundle" pour windows, une bonne partie des fonctionnalités n'était pas présente (affichage des PDF, par exemple).
Je n'ai pas beaucoup plus creusé, alors je profite que des dev de Nuxeo moulent sur DLFP pour poser mes questions :
Out-of-the-box est-ce que Nuxeo DM sait :
- prendre un répertoire où se trouvent plein de sous-répertoires contenant des fichiers PDF indexés, des fichiers DOC, et Open Document et me les importer dans DM par lot? (250.000 documents à cet instant)
- auto-tagger ces documents pour une recherche intelligente?
- Envoyer un mail chaque semaine à mes utilisateurs en leur livrant un Digest des documents importés et mis à jours ces 7 derniers jours (une revue de presse, quoi)
- faire un aperçu rapide des documents PDF, DOC et OpenDocument en consultations?
Mais je me suis trouvé la semaine passée dans ta situation !
Je cherchais un PDA, customisable, avec agenda, et note. Un truc basique, pas cher, d'occase et bien distribué/documenté.
J'ai acheté sur PriceMinister, d'occasion un HTC Touch P3450, tout bête.
Un proc OMAP 221Mhz, 64Mo de Ram.
Esthétiquement très réussi/
Le vendeur a eu le bon goût d'y précharger une ROM type Seiya pleine de bonne idées.
J'ai acheté ça 50 euros. une misère.
J'ai investi 20 euros de plus dans le connecteur BirdieSync pour Thunderbird+Lightning. http://www.birdiesync.com/
Eh hop, j'ai un PDA qui en plus fait téléphone. Cherry on ze Cake.
OK, c'est pas libre, c'est du WM6.1 dedans, mais tu trouveras une tonne de soft GPL à y claquer. Et des rom en veux-tu en voilà...
Par exemple, mon GPS bluetooth se connecte dessus avec plein d'appli.
Bref, c'est un couteau suisse, ce truc. Adopté illico.
Moi ce que je retiens, c'est la possibilité de script.
Je suis dans ton cas : je pense que les premiers articles sur Weboob faisaient un peu "blague de potache". J'ai même relu la description et c'est presque incompréhensible.
Je vois plein d'intérêts à ce truc.
Ex : je fais de la veille internet, pour une revue de presse.
Je pense que weboob me permettrait de récupérer du full-text sans fioriture et de déclencher une action (envoi de mail, sauvegarde, alarme, etc...)...
Jouer le rôle de trigger, en fait.
[^] # Re: Extraction de données ?
Posté par toctoc1 . En réponse à la dépêche Sortie de Tabula 1.0.1 - Extraction de données tabulaires dans des pdfs. Évalué à 8.
Je ne suis pas dans l'équipe de dev, juste un utilisateur de la première heure, donc mon expertise technique est limitée sur ce sujet. Je vais essayer de ne pas dire trop de bétises.
Le rendering et tout ce qui tourne autour du pdf (parsing) est géré par PDF.js depuis la version 1.0. Par le passé, c'était JPedal qui fait tout cela mais le changement a eu lieu récemment.
Pour la partie extraction du tableau, Tabula utilise deux algorithmes maisons et effectivement PDFBox.
Plutôt que de reformuler maladroitement l'aspect technique du fonctionnement de Tabula, je préfère te renvoyer vers cette page : https://github.com/tabulapdf/tabula-extractor#how-does-this-work-like-theoretically
Ces deux algo sont basés notamment sur cette publication universitaire.
# Usage et adoption
Posté par toctoc1 . En réponse à la dépêche Sortie de Tabula 1.0.1 - Extraction de données tabulaires dans des pdfs. Évalué à 10.
Tout d'abord, merci au modérateur et aux relecteurs de ma première dépêche! ;)
J'utilise Tabula tous les jours dans le domaine de la compliance/analyse de relevés bancaires.
Lorsque Tabula échoue ou génère beaucoup de décalage de colonnes - ce qui arrive sur des pdf de 200 pages scannés et ocrisés - je couple Tabula avec OpenRefine pour redresser plus vite mes tableaux.
Ce magic combo Tabula/Refine a vraiment boosté ma productivité au quotidien!
L'équipe de développement fait un boulot assez remarquable.
J'ajoute que tabula est en faite une interface web à un un moteur en ligne de commande : tabula-extractor, et qui peut être scripté. https://github.com/tabulapdf/tabula-extractor
Bref, cet outil est merveilleux et je voulais vous faire partager mon enthousiasme à son sujet.
# Bravo pour le site
Posté par toctoc1 . En réponse à la dépêche Blender comme outil de montage audio-vidéo grâce à Blender Velvets. Évalué à 6.
Un grand bravo pour le site internet!
Rien qu'à lire les tutos, j'ai appris plein de choses! (Velvet Revolver notamment)
# quel est le rapport avec le libre?
Posté par toctoc1 . En réponse à la dépêche Tamashare : salle virtuelle interactive pour vos activités collaboratives. Évalué à 3.
Soft français, certes. Mais proprio.
Je veux bien degoogliser, mais quitte à le faire, autant aller vers bigbluebutton, déjà cité ci-dessus.
# Superbe projet.
Posté par toctoc1 . En réponse à la dépêche 1flow — plate‐forme libre pour l’information. Évalué à 2.
Interface superbe, beau projet. J'adore.
question : est-il prévu un export RSS des articles?
genre, je fais ma sélection et je mets à dispo mes lectures à destination de lecteurs.
Merci de mettre à dispo le code, également. c'est génial.
# Outil simple et fabuleux! j'adore!
Posté par toctoc1 . En réponse à la dépêche Kanboard, un logiciel libre pour gérer ses projets avec la méthode Kanban. Évalué à 2.
Bon ben voilà,
A peine arrivé ce matin et déjà en prod au bureau. C'est génial.
Deux suggestions :
Sinon, c'est vraiment excellent, bravo!
# Super!
Posté par toctoc1 . En réponse au journal Mon projet : Feedspot. Évalué à 1.
Bravo pour ce boulot, c'est bluffant!
Question : Si je veux déployer feedspot sur sur mon serveur local (intranet) et proposer à mes collègues cet outil, les sources du site web sont-elles également sous licence BSD et dispo?
# automatisation
Posté par toctoc1 . En réponse à la dépêche Méthode et outils pour la veille technologique. Évalué à 3. Dernière modification le 31 janvier 2013 à 09:52.
Je serai moins dur que mes camarades du dessus. J'ai péché quelques outils dans ta dépêche.
Mon expérience, c'est qu'il manque l'outil ultime qui puisse en un click, prendre l'URL qui t'intéresse, parser un résumer du texte (le x premières lignes), créer un pdf index de l'ensemble du texte, associer l'ensemble dans un post de blog (exemple joomla ou wordpress.
J'ai testé des trucs avec IFTTT ( http://ifttt.com ), par exemple, mais le résultat est aléatoire.
Mais je cherche toujours.
H.
# Weboob
Posté par toctoc1 . En réponse à la dépêche SFRswallow, envoyer des SMS en ligne de commande. Évalué à 9.
Ça mériterait un backend pour weboob.
# Sur un intranet
Posté par toctoc1 . En réponse au journal je découvre yacy, moteur de recherche p2p. Évalué à 1.
J'ai tenté l'installation de Yacy pour indexer un NAS au bureau.
L'idée c'était de faire profiter à une centaine d'utilisateur sur mon intranet, d'un accès à des fichiers de mon NAS et récupérer au passage les infos du leur.
J'ai été emballé par l'idée, moins par le résultat : paramétrage confus, résultats bof, bof...
Cela dit, depuis que Korben en a parlé sur son blog, la version française a fait des progrès.
[^] # Re: Karma remis à pas beaucoup?
Posté par toctoc1 . En réponse à la dépêche Nouvelle version de LinuxFr.org. Évalué à 10.
C'est sciemment fait pour que Patrick_g fasse moins le malin.
[^] # Re: Pour le retour des dépêches
Posté par toctoc1 . En réponse à la dépêche Nouvelle version de LinuxFr.org. Évalué à 10.
Pertinent.
Je prône un retour vers la page dépêche par défaut.
# video
Posté par toctoc1 . En réponse à la dépêche Focuswriter, un éditeur de texte sans distractions. Évalué à 0.
http://www.youtube.com/watch?v=aLKm_04OBw4
intéressant le concept.
# PIL
Posté par toctoc1 . En réponse au message Conseil pour lire des données EXIF ?. Évalué à 1.
# Plex et autres joyeusetés - DLNA
Posté par toctoc1 . En réponse à la dépêche XBMC 10.0 "Dharma" est enfin de sortie!. Évalué à 0.
ça marchait bien, et je trouve ce soft achement bien. Par contre, PLEX, son fork m'avait plus plu.
Et finalement le serveur DNLA que j'ai installé est TVMOBILI. PAs libre, mais très bien.
En tout cas je trouve ce genre de projet très excitant!
[^] # Re: I blue 747
Posté par toctoc1 . En réponse au message Cherche un logger GPS avec une forte autonomie. Évalué à 1.
j'oubliais le site...
Ce modèle pro a un capteur de mouvement pour optimiser la conso d'énergie.
# I blue 747
Posté par toctoc1 . En réponse au message Cherche un logger GPS avec une forte autonomie. Évalué à 2.
pour récupérer les données sous linux ou windows, ou mac :
http://www.bt747.org/
On le trouve sur ebay, pas trop cher.
on peut même récupérer les données en bluetooth depuis un PDA.
[^] # Re: question sur DM
Posté par toctoc1 . En réponse à la dépêche Sortie de Nuxeo EP 5.4 - plate-forme de gestion documentaire libre. Évalué à 1.
Je vais réessayer DM début décembre, j'aurai un peu plus de temps.
# question sur DM
Posté par toctoc1 . En réponse à la dépêche Sortie de Nuxeo EP 5.4 - plate-forme de gestion documentaire libre. Évalué à 1.
Je suis à la recherche d'une solution de GED à déployer.
J'ai testé la précédente version de DM en ligne qui m'avait bien plu.
Mais lorsque j'ai récupéré la version "bundle" pour windows, une bonne partie des fonctionnalités n'était pas présente (affichage des PDF, par exemple).
Je n'ai pas beaucoup plus creusé, alors je profite que des dev de Nuxeo moulent sur DLFP pour poser mes questions :
Out-of-the-box est-ce que Nuxeo DM sait :
- prendre un répertoire où se trouvent plein de sous-répertoires contenant des fichiers PDF indexés, des fichiers DOC, et Open Document et me les importer dans DM par lot? (250.000 documents à cet instant)
- auto-tagger ces documents pour une recherche intelligente?
- Envoyer un mail chaque semaine à mes utilisateurs en leur livrant un Digest des documents importés et mis à jours ces 7 derniers jours (une revue de presse, quoi)
- faire un aperçu rapide des documents PDF, DOC et OpenDocument en consultations?
Merci
# je sais que tu ne veux pas d'un phone...
Posté par toctoc1 . En réponse au message Existe-t-il encore des PDAs ?. Évalué à 1.
Je cherchais un PDA, customisable, avec agenda, et note. Un truc basique, pas cher, d'occase et bien distribué/documenté.
J'ai acheté sur PriceMinister, d'occasion un HTC Touch P3450, tout bête.
Un proc OMAP 221Mhz, 64Mo de Ram.
Esthétiquement très réussi/
Le vendeur a eu le bon goût d'y précharger une ROM type Seiya pleine de bonne idées.
J'ai acheté ça 50 euros. une misère.
J'ai investi 20 euros de plus dans le connecteur BirdieSync pour Thunderbird+Lightning. http://www.birdiesync.com/
Eh hop, j'ai un PDA qui en plus fait téléphone. Cherry on ze Cake.
OK, c'est pas libre, c'est du WM6.1 dedans, mais tu trouveras une tonne de soft GPL à y claquer. Et des rom en veux-tu en voilà...
Par exemple, mon GPS bluetooth se connecte dessus avec plein d'appli.
Bref, c'est un couteau suisse, ce truc. Adopté illico.
H.
[^] # Re: et ?
Posté par toctoc1 . En réponse à la dépêche Weboob 0.3. Évalué à 4.
Je suis dans ton cas : je pense que les premiers articles sur Weboob faisaient un peu "blague de potache". J'ai même relu la description et c'est presque incompréhensible.
Je vois plein d'intérêts à ce truc.
Ex : je fais de la veille internet, pour une revue de presse.
Je pense que weboob me permettrait de récupérer du full-text sans fioriture et de déclencher une action (envoi de mail, sauvegarde, alarme, etc...)...
Jouer le rôle de trigger, en fait.
A suivre.
[^] # Re: Résolu - Klyster
Posté par toctoc1 . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.
Cela dit c'est un bon soft.
# Résolu - Klyster
Posté par toctoc1 . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.
http://www.kobware.com/klyster.php
Qt4 et C++....
Merci pour vos réponses!
H.
[^] # Re: ?
Posté par toctoc1 . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.
en bash, ça donnerait quoi?
[^] # Re: ?
Posté par toctoc1 . En réponse au message Trier une arborescence fichiers par derniers fichiers écrits. Évalué à 1.
zsh, je ne connais pas mais je viens de voir que j'ai cygwin sur ma machine.... je jete un coup d'oeil.