La fin de l’année dernière a été riche en nouvelles incubations de projets liés aux technologies sémantiques au sein de la Fondation Apache.
Le projet FISE,
annoncé fin août sur LinuxFr, a été intégré dans un projet plus vaste baptisé
Apache Stanbol, en incubation depuis novembre 2010.
Stanbol est le principal résultat du projet de R&D européen
IKS, qui vise à produire une « stack » de services permettant d’améliorer les solutions actuelles de gestion de contenu par des technologies sémantiques : « semantic lifting » (extraction d'information sémantique à partir d'informations « brutes »), « linked open data », raisonnement et présentation contextuelle
D’autres projets, déjà bien établis, sont également passés récemment en incubation chez Apache :
- openNLP, qui produit, en Java, des outils pour l’analyse du texte à base de machine learning ;
- Et Jena, base de données RDF et framework Java pour le développement d’applications sémantiques développées à l’origine par le HP Lab.
Dans un blog récent, «
Mining Wikipedia with Hadoop and Pig for Natural Language Processing », Olivier Grisel, l’un des principaux développeurs de FISE et Stanbol, fait la liaison entre ces projets, ainsi qu’avec
Hadoop, un autre projet Apache, consacré au calcul distribué. Ces résultats exploitent également des résultats du projet
SCRIBO.