WAARP : le moniteur de transfert de fichier Open Source

Posté par  (site web personnel) . Édité par Benoît Sibaud, Xavier Teyssier, baud123, tuiu pol, Nÿco et Nils Ratusznik. Modéré par tuiu pol.
Étiquettes :
48
22
juin
2012
Technologie

Avec la montée en puissance du Big Data, le transport sécurisé de grands volumes de documents entre sites distants est une problématique récurrente des SI qui gèrent des quantités croissantes de ressources.

Waarp est né de la volonté d’une équipe de professionnels de créer et d’animer un outil communautaire à même d’assurer le transfert de fichiers dans des contextes sécurisés et performants.

Waarp est le nouveau nom du logiciel libre OpenR66 (licence GPL). Cet outil Open Source de monitoring de transfert de fichiers fut créé pour pallier les limites de performances de la passerelle propriétaire CFT, et supporter 10.000 transferts simultanés dans le cadre de la plate-forme d'échange de la DGFIP (Ministère des Finances à Bercy).

surveillance:// Entretien avec son auteur Tristan Nitot et 10 livres à gagner

44
27
oct.
2016
Internet

Cela aura échappé à peu d’entre vous, le livre surveillance:// de Tristan Nitot est disponible dans les bonnes librairies francophones et en ligne depuis début octobre. Infatigable évangéliste du libre, du Web ouvert, des standards et maintenant de la vie privée, Tristan est loin de se laisser abattre par la fatalité des mécanismes d’absorption massive et d’analyse poussée de nos données par les plus grandes entreprises. Il prend le taureau par les cornes et a sorti, toutes proportions gardées, une petite bible sur la surveillance numérique et ses impacts.

Livre Surveillance://

Sur le fond, il n’apprendra que peu de choses aux libristes et à un public majoritairement sensibilisé comme ici. Cependant, il y a là un énorme travail que peu d’entre nous auraient été en mesure de faire. surveillance:// est pédagogique, clair, synthétique (≃150 pages), objectif et sourcé. Le livre est découpé en quatre grandes parties :

  • Pourquoi la surveillance, c’est le mal.
  • Concrètement, ça se passe comment cette surveillance ?
  • Bon, comment fait‐on pour échapper à cette surveillance ?
  • Concrètement que faut‐il faire, utiliser ?

Certes, on pourra lui trouver des défauts et discuter certains choix. Voyez‐le plutôt comme un livre qui vous donnera des armes pour les repas de famille sur le sujet. Ou encore un livre à offrir pour prouver que vous n’êtes pas paranoïaque (rappelons‐le, la paranoïa est une sorte de peur de quelque chose qui n’existe pas, alors que la surveillance massive existe).

Et comme Tristan est un gars ultra sympa, comme nous d’ailleurs, il a répondu à quelques‐unes de nos questions. Et on vous offre aussi (enfin, plutôt Tristan), dix exemplaires du bouquin aux meilleurs commentaires de cette dépêche, basés, entre autres, selon le jugement des personnes qui notent (contrairement aux journaux ou dépêches, l’affichage des notes est borné [−10 ; +10] pour les commentaires).

L’entretien et les modalités pour gagner un bouquin dans la suite de la dépêche ! Et, pour les Franciliens qui ne veulent pas attendre et souhaitent leur exemplaire dédicacé, Tristan sera vendredi 28 octobre à 19 h dans la plus libriste des librairies parisiennes, chez À Livr’Ouvert au 171 B boulevard Voltaire, Paris 11e. Dites bonjour à @Bookynette de notre part.

Pandas, une bibliothèque pour manipuler facilement des données

Posté par  . Édité par _PhiX_, Benoît Sibaud, karteum59, Nÿco, Jiehong, olivierweb, palm123, Benoît et mornik. Modéré par tuiu pol. Licence CC By‑SA.
Étiquettes :
38
19
jan.
2014
Python

À l'occasion de la sortie de la version 0.13, je vous présente cette bibliothèque basée sur Python qui permet de travailler simplement et efficacement avec des données structurées. Jusqu'à présent, les versions se sont enchaînées rapidement mais celle-ci arrive plusieurs mois après la précédente. On peut donc espérer qu'un code développé pour cette nouvelle version demandera moins de maintenance.

Logo pandas

Les principales possibilités sont :

  • récupérer des données depuis des fichiers CSV, tableaux Excel, des pages web, HDF5, etc. ;
  • grouper, découper, alléger, déplacer, écrire les données ;
  • ces données peuvent être à une ou deux dimensions, avec des manques, ou encore temporelles avec ou sans périodicité.

Pour peu que les données soient correctement formatées, pandas peut s'en sortir même dans le cas où la quantité dépasse les capacités de votre machine en traitant les sources morceaux par morceaux.

Le développement de cette bibliothèque s'inscrit dans la problématique de disposer d'outils pour manipuler de gros volumes de données dans le but de leur exploitation scientifique ou commerciale.

Note : pandas fonctionne avec la même base de code sur Python 2 et 3 mais ce n'est, peut-être, pas le cas de toutes les dépendances.

Journal Aider la recherche en étant malade

Posté par  .
Étiquettes :
31
30
juil.
2017

L’AP‐HP propose aux personnes étant atteintes de maladies chroniques de participer à la recherche de deux façons intéressantes et complémentaires :

  • ComPaRe, est un projet scientifique collaboratif qui vise à faire avancer la recherche sur les maladies chroniques en impliquant largement les patients.
    L’objectif est de fonder une communauté de 200 000 participants atteints d’une ou plusieurs maladies chroniques qui peuvent, quelle que soit leur maladie, partager leurs expériences directement avec les chercheurs, grâce à Internet ; une fois inscrit à (…)

Journal Pôle-Emploi sous-traite à IPSOS qui sous-traite à

Posté par  . Licence CC By‑SA.
Étiquettes :
30
14
jan.
2018

J'ai reçu un message m'invitant à remplir un questionnaire de satisfaction de Pôle-Emploi. Cette campagne nationale est sous-traitée à IPSOS, qui sous-traite le publipostage et l'analyse des données à Globalpark AG en Allemagne, racheté par QuestBack en Norvège.
Je trouve que les fichiers de Pôle Emploi se promènent beaucoup en Europe et c'est dommage de sous-traiter ce travail hors de France tout en radiant les personnes qui ne répondent pas aux offres d'emploi envoyées par pôle Emploi.
Pôle Emploi m'a (…)

Sortie de Datafari 5.0, moteur de recherche open source pour entreprise

Posté par  . Édité par Nils Ratusznik et Ysabeau 🧶 🧦. Modéré par claudex. Licence CC By‑SA.
30
14
avr.
2021
Base de données

Un peu comme pour la dernière news, nous avons oublié de parler de la version 4.4, mais nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.0

Changement majeur donc, synonyme de mise à jour majeure des composants utilisés.

Pour rappel, Datafari est une solution de recherche pour entreprise. Ça veut dire qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. Linuxfr oblige, le focus dans cette dépêche sera sur la version libre (mais on a plein d’autres nouveautés aussi sur la version entreprise propriétaire)

Écran de recherche

Journal Do not track !

29
15
avr.
2015

Nal ! De bon matin, ça boom ? Boom !

As-tu entendu parlé de do not track, un web-documentaire interactif, produit par Arte (entre autres).

C'est en 7 épisodes. Le premier a été diffusé hier soir.

Ce web-doc propose au téléspectateur de lâcher, au cours des épisodes, quelques informations persos.
Grâce à elles, il tente de nous démontrer à quel point nous sommes trackés.
Son but, surtout, est de nous expliquer, vulgairement, comment ce tracking de masse fonctionne, quels en sont (…)

Journal #data et libre : une belle histoire ?

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
20
12
juil.
2016

Mon cher journal,

DLFP a 18 ans, et ca fait 12 ans que je lis ce qu'il propose sans trop participer. Pourquoi ne pas apporter mon gravier à l'édifice ? A toi de juger de la pertinence du propos, qui oscillera peut-être entre le billet de blog et les réflexions de comptoir.

J'aimerais partager avec toi 2-3 réflexions que je me fais depuis quelque temps sur le rôle du libre dans le grand raout actuel que les communicants appellent "disruption digitale" (…)

Journal Cassandra 4 qui la testent, un qui l'Hécube

Posté par  (site web personnel) . Licence CC By‑SA.
20
4
août
2021

Bonjour Nal,

Je t'écris pour te signaler la sortie de la base de données Apache Cassandra 4.0.

Cette base orientée colonne grecque est devenue l'un des stockages les plus utilisées pour les titanodonnées. Écrite en Java (pour les perfs), elle utilisable via son langage de requête CQL ou via des API dans tous les bons langages mais aussi en Python ou Node.js.

Voici les nouveautés de cette version:

  • le support de Java 11 : c'est important, car il s'agit (…)

Sortie de Datafari 5.3, moteur de recherche open source pour entreprise

Posté par  . Édité par Ysabeau 🧶 🧦, Benoît Sibaud et Pierre Jarillon. Modéré par Benoît Sibaud. Licence CC By‑SA.
19
5
oct.
2022
Base de données

Nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.3. Pas mal de changements depuis la version 5.0 sur laquelle nous avions communiqué, on en fait la liste un peu plus bas.

Pour rappel, Datafari est une solution de recherche pour entreprise, sous licence Apache v2. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. On parle également de fédération des connaissances et des savoirs au sein d’une organisation. Pour cette dépêche, on se concentre sur la version libre et open source (mais il y a aussi d’autres nouveautés sur la version entreprise propriétaire).

OpenMOLE 5: Interface web et Market Place

Posté par  . Édité par Benoît Sibaud, bubar🦥 et tuiu pol. Modéré par ZeroHeure. Licence CC By‑SA.
19
25
sept.
2015
Science

La version 5 d'OpenMOLE - surnommé Loving Lobster (homard aimant) - vient d'être publiée. Pour mémoire OpenMOLE est un logiciel permettant de distribuer des explorations d'espaces de paramètres, de listes de fichiers, d'algorithme d'optimisation, d'analyse de sensibilité… sur des environnements de calcul type serveurs multi-processeurs, fermes et grilles de calcul. Il permet d’intégrer facilement votre code exécutable quelque soit le langage (C++, R, Python, Java, NetLogo…) et déporte son exécution de manière entièrement transparente, sans aucune installation préalable du coté de l'environnement d'exécution. Il permet de concevoir des workflows de calcul à très grande échelle générant des millions de jobs et des centaines de Go de données.

Voir les changements depuis la version 4 en seconde partie de dépêche.

Nous donnons régulièrement des formations ouvertes au public d'OpenMOLE à l'Institut des Systèmes Complexes à Paris. La prochaine aura lieu courant octobre, elle sera annoncée très prochainement.

ConFoo 2013 : l'appel aux conférenciers est maintenant ouvert !

Posté par  (site web personnel) . Édité par Florent Zara, Nÿco, Lucas Bonnet, Benoît Sibaud et Xavier Teyssier. Modéré par Xavier Teyssier.
16
6
sept.
2012
Communauté

ConFoo est l'une des conférences orientées développeur les plus importantes. Elle est multi-technologique (principalement vers les technologies du web) et sans but lucratif. ConFoo 2013 se tiendra du 25 février au 1 mars 2013 à Montréal au Canada.

Logo ConFoo.ca

L'équipe organisatrice vient d'ouvrir l'appel aux conférenciers. Les candidats peuvent soumettre des propositions jusqu'au 23 septembre. Consultez la page de l'appel aux conférenciers pour des détails et pour soumettre. Cette page explique aussi quelles dépenses ConFoo peut prendre en charge pour les conférenciers. Vous pouvez également trouver des conseils pour l'écriture de vos propositions. L'appel aux conférenciers est public, ce qui signifie que toutes les propositions sont publiées sur le site pour que les autres puissent voter et commenter. Cette approche permet aux organisateurs de choisir les sujets qui ont le plus d'intérêts dans la communauté. Les commentaires sont visibles seulement pour les conférenciers et organisateurs pour éviter d'influencer les votes.

Pour rester branché via Twitter, suivez @confooca et utilisez le tag #confoo.

Journal VITAM : projet open-source gouvernemental pour l'archivage de données

Posté par  . Licence CC By‑SA.
13
9
mar.
2015

La dématérialisation et l'archivage des contenus issus de sources gouvernementales est un sujet délicat, aussi bien du point de vue législatif (durée de conservation) que de la confiance dans la solution mise en place. Cette mission, remplie jusqu'à présent par des moyens de stockage "classiques", doit aujourd'hui faire face à la forte augmentation du volume de données produit. Le gouvernement réfléchit donc aux moyens nécessaires pour continuer à assurer cette mission.

Une étude lancée par les ministères de la Défense (…)