Je n'avais pas spécialement envie d'utiliser un programme externe, à vrai dire. La solution proposée par ElasticSearch me convient tout à fait, même si elle doit consommer un peu plus d'espace disque (mais vu les volumes considérés, ce n'est pas grave).
Malheureusement, ça m'a l'air compliqué d'extraire le contenu des PDF en Python 3.3, je risque de passer outre (en partant du principe que je n'aurais pas trop de fichiers), en attendant de trouver une meilleure solution. Merci pour l'info, en tout cas !
je bosse sur un petit site pour stocker mes documentations (notamment celles de langages ou de bibliothèques que j'utilise), et j'aimerais ajouter le support des PDF avec une indexation avec ElasticSearch.
J'ai l'impression que c'est possible ( http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/mapping-attachment-type.html ). Si je comprends bien, j'envoie simplement à ElasticSearch une requête POST qui contient ce message JSON (avec mon PDF en base64), et il sera indexé proprement. Me trompé-je ?
Et si je lui passe une archive ZIP avec plein de HTML dedans, fonctionnera-t-il aussi bien ?
En effet :) pour le coup, ça fait quelques années qu'OS X est passé à launchd et personne ne s'en plaint ; je ne vois pas pourquoi on se plaindrait davantage sur Linux avec systemd (en termes de complexité et de fonctions, ils sont grosso-modo équivalents).
De mémoire, le passage à été progressif sur OS X, par exemple crond est resté pendant une ou deux versions.
Perso, j'aurais plutôt parlé d'OS X, qui doit avoir 6 ou 7 fois plus de présence que Linux (sur les ordis classiques, en tout cas). C'est aussi un vrai UNIX (avec la certification notamment).
Ce n'est pas si évident.
Imaginons en plus qu'une boîte se mette volontairement en déficit à force de proposer des prix extrêmement bas pour couler la concurrence, avant de pouvoir remonter tranquillement ses prix une fois que la concurrence est éliminée. Non, je ne pense absolument pas à Amazon.
Si on limite l'amende proportionnellement au bénéfice, alors celle-ci sera ridicule, bien que si elle pratiquait des prix « normaux », elle pourrait être largement bénéficiaire, et donc payer une amende bien plus forte.
S'il n'y avait que ça comme affreux anglicisme : on voit quand même de plus en plus assumer une supposition, adresser puis fixer un problème, être confortable, demander une question, un raisonnement consistant, etc.
Je ne connaissais pas du tout gitlab, et ça paraît plutôt pas mal.
Je sais que dans quelque temps je vais refaire ma forge perso (actuellement basée sur du svn + redmine, avec du github pour des projets publics), et gitlab me paraît un bon candidat. C'est simplement dommage à mes yeux que ça soit en Ruby, va falloir que j'apprenne à faire avec… (ce n'est pas une critique de Ruby, c'est qu'autant je maîtrise le déploiement des sites en Python, autant je ne connais rien en Ruby)
Juste par curiosité, où sont les problèmes entre clang et le kernel ? Parce que s'il ne compile pas à cause d'options spécifiques à GCC et qui ne sont pas dans le standard, le chemin à faire n'est pas forcément pour clang.
Je ne vois pas trop où tu veux en venir, à vrai dire. Montrer qu'Apple fait son beurre avec du logiciel propriétaire, qui lui permet de vendre le matériel associé avec des marges confortables ? Ce n'est pas non plus une grande nouvelle, ça. J'imagine que tu avais un message un peu plus subtil à faire passer…
Je ne vois pas le rapport avec le fait d'avoir les serveurs du projet chez soi. Ou alors peut-être fait-il ses tests sur l'environnement de prod ??? Je n'espère pas, ça ruinerait toute la réputation de sérieux du projet.
J'avais déjà entendu parler de Pandas, mais je n'ai pas eu l'occasion de m'en servir pour l'instant.
Mais que veux-tu dire exactement par gros volumes de données ? Pour moi, un gros volume de données, ça se compte en Po ou au moins en To, mais je ne pense pas que Pandas soit réellement adapté à de tels volumes.
Je ne connais pas bien les autres plates-formes, mais sur OS X, une bonne intégration ne se limite pas à avoir le même style et à avoir la bonne boîte de dialogue pour les fichiers.
Je pourrais citer en vrac : utiliser les champs textes intégrés (avec le correcteur orthographique et grammatical, le remplacement d'abréviations, …) , le trousseau de clefs (mots de passe, certificats, clefs privées, …), la possibilité de mettre ou de changer des raccourcis clavier sur tous les éléments du menu depuis les préférences globales, …
Même en C++, ce n'est pas évident. Par exemple, Qt ne fonctionne pas parfaitement sur OS X, si tu prends une application Qt sans la retravailler un peu, ça se voit qu'elle est faite en Qt et non en Cocoa.
Ça ne veut rien dire, ce qui est important c'est que ce qui est très utilisé soit bien codé. Pour ça, il faudrait faire un peu de profiling (ou connaître le code).
Pour les GPU, la consommation prend en compte celle de la RAM (et 6 Go de RAM, ça doit bien faire dans les 20 ou 30 W, c'est loin d'être négligeable).
Et pour les cartes de type Tesla, les blocs annexes ont été supprimés à mon avis (certaines n'ont de toute façon pas de sortie graphique).
[^] # Re: Indexation de documents
Posté par flan (site web personnel) . En réponse à la dépêche Sortie d'Elasticsearch en version 1.0. Évalué à 1.
Je n'avais pas spécialement envie d'utiliser un programme externe, à vrai dire. La solution proposée par ElasticSearch me convient tout à fait, même si elle doit consommer un peu plus d'espace disque (mais vu les volumes considérés, ce n'est pas grave).
[^] # Re: Indexation de documents
Posté par flan (site web personnel) . En réponse à la dépêche Sortie d'Elasticsearch en version 1.0. Évalué à 1.
Ah oui, en effet.
Malheureusement, ça m'a l'air compliqué d'extraire le contenu des PDF en Python 3.3, je risque de passer outre (en partant du principe que je n'aurais pas trop de fichiers), en attendant de trouver une meilleure solution. Merci pour l'info, en tout cas !
# Indexation de documents
Posté par flan (site web personnel) . En réponse à la dépêche Sortie d'Elasticsearch en version 1.0. Évalué à 1.
je bosse sur un petit site pour stocker mes documentations (notamment celles de langages ou de bibliothèques que j'utilise), et j'aimerais ajouter le support des PDF avec une indexation avec ElasticSearch.
J'ai l'impression que c'est possible ( http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/mapping-attachment-type.html ). Si je comprends bien, j'envoie simplement à ElasticSearch une requête POST qui contient ce message JSON (avec mon PDF en base64), et il sera indexé proprement. Me trompé-je ?
Et si je lui passe une archive ZIP avec plein de HTML dedans, fonctionnera-t-il aussi bien ?
Ça m'enlèverait une bonne épine du pied !
[^] # Re: Proxmox
Posté par flan (site web personnel) . En réponse au message Virtualisation sur un parc de serveurs de calcul. Évalué à 1.
Quand on regarde sur un an, ça ne bouge quand même plus beaucoup : https://github.com/ArchipelProject/Archipel/graphs/commit-activity
C'est dommage, j'aimais bien l'idée
[^] # Re: Merci pour l'info
Posté par flan (site web personnel) . En réponse au journal Outils de pseudo gestion de projet et développement. Évalué à 1.
Ça m'a l'air un peu loin de Gitlab, malheureusement :( Enfin, je regarderai quand même le moment venu, merci :)
[^] # Re: je suis le seul ou quoi ?
Posté par flan (site web personnel) . En réponse au journal Debian rejoint les utilisateurs de Systemd. Évalué à 1.
En effet :) pour le coup, ça fait quelques années qu'OS X est passé à launchd et personne ne s'en plaint ; je ne vois pas pourquoi on se plaindrait davantage sur Linux avec systemd (en termes de complexité et de fonctions, ils sont grosso-modo équivalents).
De mémoire, le passage à été progressif sur OS X, par exemple crond est resté pendant une ou deux versions.
[^] # Re: je suis le seul ou quoi ?
Posté par flan (site web personnel) . En réponse au journal Debian rejoint les utilisateurs de Systemd. Évalué à 1.
Perso, j'aurais plutôt parlé d'OS X, qui doit avoir 6 ou 7 fois plus de présence que Linux (sur les ordis classiques, en tout cas). C'est aussi un vrai UNIX (avec la certification notamment).
[^] # Re: Montant des amendes espagnoles à Google
Posté par flan (site web personnel) . En réponse au journal Google se fait taper sur les doigts par la CNIL. Évalué à 2.
Ce n'est pas si évident.
Imaginons en plus qu'une boîte se mette volontairement en déficit à force de proposer des prix extrêmement bas pour couler la concurrence, avant de pouvoir remonter tranquillement ses prix une fois que la concurrence est éliminée. Non, je ne pense absolument pas à Amazon.
Si on limite l'amende proportionnellement au bénéfice, alors celle-ci sera ridicule, bien que si elle pratiquait des prix « normaux », elle pourrait être largement bénéficiaire, et donc payer une amende bien plus forte.
[^] # Re: Comparaison foireuse
Posté par flan (site web personnel) . En réponse au journal Pourquoi les jeux vidéos devraient entrer dans le domaine public. Évalué à 2.
S'il n'y avait que ça comme affreux anglicisme : on voit quand même de plus en plus assumer une supposition, adresser puis fixer un problème, être confortable, demander une question, un raisonnement consistant, etc.
# Merci pour l'info
Posté par flan (site web personnel) . En réponse au journal Outils de pseudo gestion de projet et développement. Évalué à 3.
Je ne connaissais pas du tout gitlab, et ça paraît plutôt pas mal.
Je sais que dans quelque temps je vais refaire ma forge perso (actuellement basée sur du svn + redmine, avec du github pour des projets publics), et gitlab me paraît un bon candidat. C'est simplement dommage à mes yeux que ça soit en Ruby, va falloir que j'apprenne à faire avec… (ce n'est pas une critique de Ruby, c'est qu'autant je maîtrise le déploiement des sites en Python, autant je ne connais rien en Ruby)
[^] # Re: Proxmox
Posté par flan (site web personnel) . En réponse au message Virtualisation sur un parc de serveurs de calcul. Évalué à 1.
Accessoirement, Archipel a l'air plus ou moins mort :(
[^] # Re: Faut-il supprimer les restrictions sur les plugins GCC ?
Posté par flan (site web personnel) . En réponse au journal La GPL est un échec (FreeBSD 10 est sorti). Évalué à 2.
Juste par curiosité, où sont les problèmes entre clang et le kernel ? Parce que s'il ne compile pas à cause d'options spécifiques à GCC et qui ne sont pas dans le standard, le chemin à faire n'est pas forcément pour clang.
[^] # Re: Mauvais paradigme
Posté par flan (site web personnel) . En réponse au journal La GPL est un échec (FreeBSD 10 est sorti). Évalué à 1.
Je ne vois pas trop où tu veux en venir, à vrai dire. Montrer qu'Apple fait son beurre avec du logiciel propriétaire, qui lui permet de vendre le matériel associé avec des marges confortables ? Ce n'est pas non plus une grande nouvelle, ça. J'imagine que tu avais un message un peu plus subtil à faire passer…
[^] # Re: Mauvais paradigme
Posté par flan (site web personnel) . En réponse au journal La GPL est un échec (FreeBSD 10 est sorti). Évalué à 1.
Que ne comprends-tu pas dans « Apple distribue le code (avec les modifs) des projects BSD qu'ils utilisent sur opensource.apple.com. » ?
[^] # Re: Mauvais paradigme
Posté par flan (site web personnel) . En réponse au journal La GPL est un échec (FreeBSD 10 est sorti). Évalué à 3.
Bin a priori oui. mais bon, manifestement, ton opinion est toute faite, je ne suis pas sûr que ça vaille la peine de discuter.
[^] # Re: Oui
Posté par flan (site web personnel) . En réponse au journal Projets Open Source, des vaches à lait ?. Évalué à -6.
Je ne vois pas le rapport avec le fait d'avoir les serveurs du projet chez soi. Ou alors peut-être fait-il ses tests sur l'environnement de prod ??? Je n'espère pas, ça ruinerait toute la réputation de sérieux du projet.
[^] # Re: Compraison avec R
Posté par flan (site web personnel) . En réponse à la dépêche Pandas, une bibliothèque pour manipuler facilement des données. Évalué à 1.
On peut déjà utiliser les modules R depuis Python (donc depuis Pandas) avec rpy2 :)
# Gros volumes de données ?
Posté par flan (site web personnel) . En réponse à la dépêche Pandas, une bibliothèque pour manipuler facilement des données. Évalué à 4.
J'avais déjà entendu parler de Pandas, mais je n'ai pas eu l'occasion de m'en servir pour l'instant.
Mais que veux-tu dire exactement par gros volumes de données ? Pour moi, un gros volume de données, ça se compte en Po ou au moins en To, mais je ne pense pas que Pandas soit réellement adapté à de tels volumes.
[^] # Re: Pas MP4
Posté par flan (site web personnel) . En réponse au journal Le format non-libre MPEG4 en passe d'être supporté sur Wikipédia ?. Évalué à 5.
Le format du conteneur est en effet le MPEG-4 Part 14. Cela dit, il est souvent utilisé pour contenir du Part 10, la phrase est un peu ambiguë.
[^] # Re: Autres plate-formes
Posté par flan (site web personnel) . En réponse au journal Gtk to Qt - A strange journey. Évalué à 2.
Je ne connais pas bien les autres plates-formes, mais sur OS X, une bonne intégration ne se limite pas à avoir le même style et à avoir la bonne boîte de dialogue pour les fichiers.
Je pourrais citer en vrac : utiliser les champs textes intégrés (avec le correcteur orthographique et grammatical, le remplacement d'abréviations, …) , le trousseau de clefs (mots de passe, certificats, clefs privées, …), la possibilité de mettre ou de changer des raccourcis clavier sur tous les éléments du menu depuis les préférences globales, …
[^] # Re: Local knowledge
Posté par flan (site web personnel) . En réponse au journal Gtk to Qt - A strange journey. Évalué à -1.
Même en C++, ce n'est pas évident. Par exemple, Qt ne fonctionne pas parfaitement sur OS X, si tu prends une application Qt sans la retravailler un peu, ça se voit qu'elle est faite en Qt et non en Cocoa.
[^] # Re: Uchronie
Posté par flan (site web personnel) . En réponse au journal Gtk to Qt - A strange journey. Évalué à -3.
En quoi est-ce une faute ?
[^] # Re: c'est une question de philosophie
Posté par flan (site web personnel) . En réponse au journal "Scaling Mercurial at Facebook". Évalué à 2.
Ce n'est pas le cas sur tous les OS, et heureusement !
[^] # Re: Mercurial
Posté par flan (site web personnel) . En réponse au journal "Scaling Mercurial at Facebook". Évalué à 1.
Ça ne veut rien dire, ce qui est important c'est que ce qui est très utilisé soit bien codé. Pour ça, il faudrait faire un peu de profiling (ou connaître le code).
[^] # Re: Et les cartes graphiques ?
Posté par flan (site web personnel) . En réponse à la dépêche Kalray un processeur massivement parallèle très impressionnant : Qu’il est loin le temps de mon ZX81. Évalué à 1.
Pour les GPU, la consommation prend en compte celle de la RAM (et 6 Go de RAM, ça doit bien faire dans les 20 ou 30 W, c'est loin d'être négligeable).
Et pour les cartes de type Tesla, les blocs annexes ont été supprimés à mon avis (certaines n'ont de toute façon pas de sortie graphique).
Pour le reste, je suis d'accord avec toi.