Les bases NoSQL sont passées de mode depuis longtemps (dernière dépêche en 2012), remplacées par la Blockchain, les NFT, les IA génératives et probablement plein d'autres choses déjà oubliées entre les deux. À l'origine, l'avantage était de pouvoir mieux passer à l'échelle en distribuant les données sur de multiples serveurs. Un autre des avantages avancés (et qui m'intéresse plus) était de simplifier les développements en éliminant la rigidité des bases de données relationnelles, permettant de livrer plus rapidement (…)
Journal Cassandra 4 qui la testent, un qui l'Hécube
Bonjour Nal,
Je t'écris pour te signaler la sortie de la base de données Apache Cassandra 4.0.
Cette base orientée colonne grecque est devenue l'un des stockages les plus utilisées pour les titanodonnées. Écrite en Java (pour les perfs), elle utilisable via son langage de requête CQL ou via des API dans tous les bons langages mais aussi en Python ou Node.js.
Voici les nouveautés de cette version:
- le support de Java 11 : c'est important, car il s'agit (…)
Lien DBaaS: Découvrez les bases de données managées
Lien Bye bye Mongo, Hello Postgres
CouchDB passe la seconde vitesse
CouchDB est une base de données de la famille NoSQL. C’est même l’une des plus anciennes, sortie en 2005. Elle est ensuite devenue un projet Apache en 2008. Elle a pris du retard sur ses concurrents sur de nombreux aspects, mais sa grande force, la réplication entre instances primaires, reste inégalée. Pouchdb, un portage de CouchDB en JavaScript capable de tourner dans les navigateurs, est compatible avec le protocole de réplication de CouchDB et la combinaison des deux est très intéressante pour développer des applications Web dites « progressives » (PWA), capables de travailler sans connexion Internet. Il existe d’autres implémentations compatibles avec ce protocole de réplication, dont Couchbase lite pour mobile.
La version 2.0 de CouchDB est attendue depuis plusieurs années et a pris beaucoup de retard. Elle vient enfin de sortir avec de grandes nouveautés, dont la prise en charge du clustering, un nouveau moteur de « requêtage » et une interface d’administration plus moderne.
Journal Présentation aux entreprises d'un projet Open Source de l'Etat : VITAM pour l'Archivage numérique
Bonjour à toutes et à tous,
En relais de l'information publiée par le Service des achats de l'Etat, avant le lancement d'un appel d'offres, je pense intéressant de vous faire passer une copie de cette news :
Solution d’archivage électronique VITAM : présentation du projet aux entreprises - Invitation
Enjeu majeur en termes de mutualisation et d’archivage, le programme VITAM sera présenté le jeudi 25 juin de 14h30 à 16h30, dans les locaux des Archives Nationales (Site de Pierrefitte (…)
Forum général.petites-annonces [annonce de présentation aux entreprises d'un projet Open Source de l'Etat] VITAM
Bonjour à toutes et à tous,
En relais de l'information publiée par le Service des achats de l'Etat, je pense intéressant de vous faire passer une copie de cette news :
Solution d’archivage électronique VITAM : présentation du projet aux entreprises - Invitation
Enjeu majeur en termes de mutualisation et d’archivage, le programme VITAM sera présenté le jeudi 25 juin de 14h30 à 16h30, dans les locaux des Archives Nationales (Site de Pierrefitte, 59 rue Guynemer, Pierrefitte-sur-Seine / Métro (…)
Événement gratuit sur Mongo DB le 23 janvier
En 2010 Atol Conseils et Développements a été choisi, par un groupement de 25 régions française, pour réaliser une solution de production et diffusion du dossier de l'inventaire du patrimoine : GERTRUDE. Ce projet a été l'occasion pour les équipes d'Atol C&D de mettre en œuvre de nombreuses briques Open Source : GWT, OpenLayers, Google Guice, HornetQ, Morphia, Jetty, Lombok, Play! Framework, Solr et MongoDB.
Le 23 janvier 2014 dans nos locaux, à Gevrey-Chambertin, nous proposons une conférence technique gratuite baptisée « Labs Premier Cru ». Au programme : concepts NoSQL et MongoDB avec des ateliers pratiques pour en découvrir le potentiel.
Cette journée sera l'occasion de partager le retour d’expérience de l'équipe ayant travaillé sur ce projet, ainsi que d'échanger dans la convivialité.
Plus de détails en seconde partie!
Sortie de NemakiWare 1.0, serveur de gestion électronique de documents basé sur NoSQL
Après deux ans de tests en bêta, NemakiWare 1.0 est sorti ! NemakiWare est un serveur de GED (Gestion électronique de documents) libre développé au Japon. C’est le premier serveur de GED basé sur NoSQL, une technologie permettant de monter en charge plus facilement que les bases de données traditionnelles relationnelles [NdM].
NemakiWare a été conçu dès le départ pour CMIS (Content Management Interoperability Services), l’API standard des serveurs de GED. Passé en version 1.1 le 1er juillet, CMIS est aussi implémenté par tous les concurrents de NemakiWare, tels Alfresco, Nuxeo ou SharePoint.
Pour les entreprises, l’intérêt de développer des applications au‐dessus de CMIS (plutôt qu’au‐dessus d’interfaces logicielles propriétaires) est la facilité des futures migrations logicielles. Par exemple, lorsque SharePoint devient ingérable ou trop coûteux, il suffit de reconfigurer l’adresse URL CMIS vers un Alfresco/Nuxeo/NemakiWare après avoir migré les données.
Quelques précisions :
- technologies derrière NemakiWare : Java EE pour le serveur, Rails pour l’interface Web optionnelle ;
- licence : GNU GPL v3 ;
- le nemaki est une sorte de pyjama japonais, une référence à la base de données utilisée : CouchDB.
Journal Témoignage d'expérience de nosql avec PHP et Mongodb
Je fais du développement web amateur en php depuis quelques années maintenant et un ami développeur qui déteste coder pour le web et qui n'a pas le temps pour ça m'a récemment demandé de lui développer un site internet pour ses bêta-testeurs, quelque chose de simple où les utilisateurs auraient accès aux différents projets auxquels ils sont inscrits.
Je n'avais jusqu'à maintenant jamais eu le courage de m'attaquer aux bases de données et encore moins au langage sql, même si (…)
Petit état des lieux du NoSQL
Pendant longtemps, les bases de données relationnelles ont été l'unique solution pour enregistrer des données, ou en tout cas, la solution adoptée par défaut par beaucoup de monde sans plus de réflexion sur le sujet. Pourtant, certaines personnes considèrent que le problème de stockage de données est en fait multiple et qu'il convient de se poser de nombreuses questions :
- Est-ce que les données sont fortement structurées ou non ?
- Quel est le ratio entre les lectures et les écritures ?
- Est-il acceptable de perdre un enregistrement sur un million ? Sur un milliard ?
- Est-ce que les données sont réparties sur plusieurs data-centres ?
- Est-ce que la taille des données peut être multipliée par 10 en l'espace d'un mois ?
- Quelle indisponibilité du service peut-on se permettre ?
- Etc.
Les bases de données relationnelles proposent leurs réponses à ces questions ; elles peuvent paraître raisonnables dans bien des cas, mais pas toujours. Par exemple, les bases de données relationnelles sont très mal adaptées quand on veut privilégier les performances plutôt que la garantie d'écriture des données.
Aussi, pour répondre à ces problématiques différentes, un mouvement, NoSQL, a proposé d'adopter des outils différents, spécialisés pour certains cas d'usage. Certaines bases de données NoSQL sont destinées à traiter d'énormes volumes de données, d'autres sont conçues pour maximiser le nombre de requêtes par seconde qu'un serveur pourra traiter, etc. Notons en particulier que la plupart des plus gros sites web ont quitté le monde relationnel (Google, Facebook, Twitter, Amazon), ce qui tend à valider le besoin d'avoir d'autres outils que les bases de données relationnelles.
NdA : Merci à Christophe Turbout, Thomas Douillard, Buf, olivierweb, Spack, baud123, Bruno Michel, mike.simonson et rakoo pour leur aide lors de la rédaction de cette dépêche
Journal NoSQL ou pas ?
Je cherche à faire quelques projets orientés Web. Pour donner une idée, je compte partir sur deux projets :
- Un gestionnaire de noms de domaines genre Domain Portfolio Manager
- Et un lecteur multimédia en ligne genre streeme
Le but est de redécouvrir les technologies Web, un monde qui bouge beaucoup ces derniers temps, et enfin de me lancer avec Django.
La nouvelle mode des bases NoSQL me pousse à réfléchir sur l'utilisation de celles-ci. Cependant, étant sûrement trop formaté (…)
Petites brêves : ODF et Cassandra
Apache Cassandra 1.1 est sortie
La base de donnée NoSQL de la fondation Apache est sortie en version 1.1, cette base de données est destinée à stocker beaucoup de données sur une architecture distribuée tout en étant tolérante aux pannes et offrants de grandes performances.
Les nouveautés sont un cache amélioré, une amélioration du langage de requête CQL (Cassandra Query Language, un sous-ensemble de SQL), un contrôle du stockage, une intégration d'Hadoop, un contrôle du répertoire des données et une amélioration de la montée en charge.
Microsoft Office 15 prendra en charge ODF 1.2
Microsoft a annoncé à la conférence ODF plugfest, hébergée par Microsoft, que sa suite Office intégrerait la gestion d'ODF 1.2 dans sa version 15
Le gouvernement hongrois soutient le développement d'ODF
Le gouvernement hongrois a annoncé investir 370 millions de Forints (environ 1,25 millions d'Euros) dans le développement d'applications utilisant le format ODF. La somme sera répartie entre le département d'informatique de l'université de Szeged et la société Multiráció qui développe EuroOffice, une suite bureautique issue d'OpenOffice.
Logiciel libre et Big Data
Je viens de publier un livre blanc sur ce que je pense être la convergence inévitable du Big Data et du logiciel libre / open source. Après une définition du big data (« ensembles de données qui deviennent tellement gros qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données », d'après Wikipedia) et de ses caractéristiques (les « 3 V » de Stonebraker ou les « 4 V » de Popescu), j'expose les raisons pour lesquels les principaux logiciels du domaine ont été mis en open source, et j'en fais un panorama.
Le même jour, le magazine InfoDSI publie un article sur le décollage du Big Data, citant une étude de marché d'IDC qui évalue le marché à 3.2 milliards de $US en 2010 et potentiellement presque 17 milliards de $US en 2015 et qui met en avant également le dynamisme des projets open source dans le domaine.
Pour en revenir à mon livre blanc, il s'agit de la première édition, forcément incomplète. Vos commentaires, qu'ils soient posté sur mon blog ou ici-même, seront pris en compte (s'ils sont pertinents ;-)).
NdM: le livre est sous licence CC BY-SA 3.0.
1.0 et 2.0 (Cassandra et Mercurial)
Des versions toutes rondes de logiciels libres sont tout juste sorties : la 1.0 de Cassandra, et la 2.0 de Mercurial.
N. D. A. : Merci à GeneralZod pour avoir contribué à cette brève.
Apache Cassandra 1.0
Le projet Apache Cassandra a publié la version 1.0.0 de son logiciel libre. Pour rappel, Cassandra est une base de données non‐SQL (NoSQL), sous forme de paires clé‐valeur, sous licence Apache 2.0. Initiée par Facebook et utilisée par Twitter, Digg et Reddit, Cassandra est super‐extensible et conçue pour fonctionner sur des grappes de serveurs (clusters).
Mercurial 2.0
Mercurial version 2.0 a été publiée. C’est un système de gestion de versions décentralisée sous UNIX (et donc GNU/Linux) et Windows, distribué sous licence GPL v2. Des fonctionnalités majeures on été ajoutées, et des nouveautés font leur apparition dans le cœur et les extensions.
Tous les détails dans la seconde partie.