IBM libère un framework pour le Web sémantique

Posté par  . Modéré par j.
0
3
déc.
2006
Technologie
IBM a annoncé la semaine dernière l'ouverture du code du SRLP (Semantic Layered Research Platform) : un ensemble d'applications développées dans le cadre de leurs recherches sur le Web sémantique.

Pour l'instant, seul Boca, un dépôt RDF qui s'appuie sur la base de donnée DB2 est disponible, mais l'ensemble des composants de la plateforme devraient être rendus publics dans les mois qui viennent sous licence Eclipse. Il reste en effet à nettoyer le code et écrire la documentation technique afin que cette libération soit utile à l'ensemble de la communauté.

Cette annonce est importante de deux points de vue :
D'une part, cela montre l'engagement d'une entreprise aussi importante qu'IBM dans la recherche et le développement sur le Web sémantique qui pourrait bien devenir une véritable révolution de notre façon de traiter l'information.
D'autre part, c'est une illustration importante de l'intérêt du modèle libre pour la recherche en informatique.
L'article Semantic Web Technologies in the Enterprise sur le blog de Lee Feigenbaum illustre bien ces deux points de vue. Comme l'explique Lee Feigenbaum dans le plan de route de l'ouverture, la plateforme SLRP sera, à terme, composée de plusieurs applications. Outre Boca, qui constitue une des bases majeures de leur plateforme, il y a aussi des bibliothèques utilisables pour manipuler des données enregistrées en RDF, des objets binaires dont les métadonnées sont écrites en RDF, ou encore des outils utilisables pour l'affichage et la manipulation des données à travers des applications Web.

Bien entendu, ce genre d'annonce ne s'adresse pas à tout le monde, le Web sémantique n'est pas encore utilisé à grande échelle mais seulement pour des prototypes.

Néanmoins, ceci illustre bien l'utilité du modèle de développement open source pour la recherche en général et dans l'informatique en particulier. On peut en effet remarquer que, par exemple, la plupart des applications utilisées dans le Web sémantique sont développées sous licence libre, cela concerne aussi bien les outils de création d'ontologies (Protégé et ses nombreux plugins par exemple), que les bibliothèques de manipulation de données (la bibliothèque JENA développée dans les laboratoires d'HP) ou que les nombreux prototypes. On peut voir, à ce propos, les outils du groupe Simile du MIT qui sont déjà utilisables plus facilement sans avoir besoin de connaissances très poussées sur le Web sémantique. On pourrait continuer longtemps la liste des applications mises à disposition de cette façon.

Plusieurs raisons peuvent expliquer pourquoi le logiciel libre est si présent dans ce domaine. D'une part, la communauté de la recherche scientifique a intérêt à cette ouverture car cela permet aux chercheurs impliqués de faire connaître leurs travaux tout autant que les publications scientifiques. D'autres part, ce ne sont généralement que des prototypes venant montrer l'intérêt d'une théorie. La plupart de ces logiciels ne sont pas encore prêts à être utilisés en production et il est donc inutile de chercher à les vendre. L'ouverture du code permet en revanche leur appropriation par la communauté et permet un retour important. Cela constitue donc un exemple typique de l'utilité de l'open source et du modèle gagnant-gagnant permis par le don.

Le fait que tous ces outils soient développés en libre laisse augurer d'un bon avenir pour le logiciel libre car cela constituera une base de code importante lorsque ces technologies auront fait leurs preuves et seront prêtes à être utilisées à une plus grande échelle.

Aller plus loin

  • # Typo

    Posté par  . Évalué à 2.


    D'une part, cela montre l'engagement d'une entreprise aussi



    on pourrait continuer longtemps la listes des applications mise à disposition de cette façon.



    la recherche scientifique àa intérêt



    il est donc inutiles de chercher à les vendre



    seront prêtes à être utilisées


    je ne suis pas sûr là
    • [^] # Re: Typo

      Posté par  . Évalué à 3.

      Et zut, jamais envoyer un truc sans la 3ème relecture car on a plus le temps...
      sinon ? T'as trouvé ca intérressant ?
      • [^] # Re: Typo

        Posté par  . Évalué à 1.

        On dirait, oui, mais une question me turlupine: C'est quoi exactement, le Web sémantique ?
        • [^] # Re: Typo

          Posté par  . Évalué à 2.

          Suffit de cliquer sur le mot dans la nouvelle, ça t'envoi sur wikipedia français avec la définition qui va bien...
          Bon perso je suis en train de relire car on dirait que la première phrase est sorti tout droit de ma dernière réunion de vendredi après-midi, de la bouche même de mon décideur pressé préféré et donc je la comprends pas :-)
          • [^] # Re: Typo

            Posté par  . Évalué à 7.

            Ouah !!! c'est vrai que cette première phrase fait bien "définition qui veut contenir tous les termes"
            Bon en fait, j'avais pas trop fait gaffe à la page de wikipédia, je l'ai plus mise par réflexe. Et à la relire, je la trouve pas si terrible, j'essaierai de la retoucher un jour ou j'aurais du tem :ps.

            Bon sinon, pour répondre à la question du dessus. Le web sémantique se base sur les technologies du web et les recherches effectuées sur l'IA et les technologies de représentations des connaissances.
            Un schéma classique est le semantic web cake : http://www.w3.org/2002/Talks/04-sweb/slide12-0.html

            En gros, la base est RDF (ressource description framework, voir le lien wikipedia dans la news) qui permet de représenter les liens entres les objets (les ressources) sous formes de triplet sujet-predicat-objet. Le prédicat est le lien entre deux ressources.
            Par exemple, FOAF te permet de représenter :
            Alice - connait - Bob
            en utilisant définnissant la relations "connaitre" définit dans l'ontologie FOAF.

            En utilisant RDF (et OWL), tu peux créer des ontologies ou tu définis les divers classe d'objet et les types de relations pouvant exister entre eux. Ces définitions sont faites en utilisant une logique spécifique.

            Une fois que tu as cela, tu peux effectuer des raisonnement et des déductions logiques sur tes informations : classification de tes objets...

            Ce qui est intéressant avec le Web sémantique c'est que tu utilise toute la puissance des technos du Web. Chaque ´classe, objet ou propriété est définit par une URI qui l'identifie de manière uniforme et unique. De plus l'utilisation des namespaces te permet de définir les propriétés d'un objet en te basant sur plusieurs ontologies disponibles ailleurs.

            Voilà, c'est un gros résumé taillé à la hache mais j'espère que ca éclaire un peu.
            • [^] # Re: Typo

              Posté par  . Évalué à 1.

              C'est beaucoup mieux, oui. Merci :)
      • [^] # Re: Typo

        Posté par  . Évalué à 2.

        Très intéressant et comme j'aime bien me faire moinsser
        j'en remets une tournée ;-)


        On pourrait continuer longtemps la liste des applications mises à disposition de cette façon.
  • # plus ça rate, plus ça a des chances de réussir

    Posté par  . Évalué à 6.

    D'une part, cela montre l'engagement d'une entreprise aussi importante qu'IBM dans la recherche et le développement sur le Web sémantique qui pourrait bien devenir une véritable révolution de notre façon de traiter l'information.

    Ca fait combien de temps qu'on nous bassine avec ces chimères ?
    Le Web sémantique qui révolutionne le traitement de l'information, c'est un peu comme la traduction automatique sans assistance humaine, et autres lubies réminiscentes de la croyance passée en une Intelligence Artificielle triomphante.

    Certes, un modèle comme RDF n'est pas à mettre à la poubelle, par contre la "véritable révolution" que les gourous nous annoncent invariablement, elle ressemble à du comique de répétition.
    • [^] # Re: plus ça rate, plus ça a des chances de réussir

      Posté par  . Évalué à 4.

      > Ca fait combien de temps qu'on nous bassine avec ces chimères ?

      alors :
      - Premier brouillon de la définition de RDF : octobre 1997
      - Article "The Semantic Web" de Tim Berners-Lee : mai 2001

      Finalement, ca fait pas si longtemps que ca qu'on nous bassine avec ces chimères. Certes, ca m'étonnerais que ce soit appliqué à l'échelle du Web tel que c'est décrit dans l'article de Berners-Lee. N'empêche que ca se développe, et on fait des progrès. Ca commence même à être utilisé en entreprise dans les systèmes de KM...

      Alors, pour les grosses critiques. Ca m'étonnerait que tous les documents du Web soient annotés et contiennent des métas liées à des ontologies de qualités (rien que parce que construire des ontologies de qualités c'est déjà pas rien en soi...) Mais on a aussi pleins de bases de données disponibles sur le web, via une interface classique mais aussi via des services web. De plus en plus d'applications se servent de ces services web. Maintenant, si les données de ces services sont liées à une ontologie, et si tu lie les ontologies entre elles, et bien tu peux les utiliser plus facilement.

      Tiens, pour illustrer mon derniers propos :
      - Tu prends musicbrainz : tu as une belle BdD sur la musique. Prends l'exemples des BOs, qui peuvent être liées à IMDB... tu peux très bien liées toutes ces donnée à une ontologie de Musicbrainz, et au besoin à des ontologies extérieures.
      - IMDB, BdD sur les films bien connues
      - Tu utilises FOAF (friend Of A Friend) pour décrire les réalisateurs, acteurs... dans IMDB et les artistes, compositeurs producteurs... dans Musicbrainz...

      Et bien, dans l'hypothèse ou cela marche, tu peux facilement savoir la liste de tous les musiciens ayant jouer dans les films réalisés par quelqu'un de la famille Coppola... Alors qu'actuellement, pour faire un truc comme ca, ben tu va chercher longtemps...

      Tu vas me répondre "c'est bien gentil la théorie mais dans la pratique ?" Alors oui, il manque les données mais celles si pourraient être bientôt là (je tiens au conditionnel qui ne correspond pas à une annonce de prévisioniste...) Rien que les blogs produisent quantités de données utilisables automatiquement (certes, pas forcément de qualité) Les microformats sont une réalité, Semantic Mediawiki ( http://meta.wikimedia.org/wiki/Semantic_MediaWiki ) pourrait bien tourner un jour...
      A terme (pas forcément dans les 5 ou 10 ans non plus) je pense donc effectivement que des choses pourraient être révolutionnées, et je l'espère car sinon, on est pas dans la m****...
      • [^] # Re: plus ça rate, plus ça a des chances de réussir

        Posté par  . Évalué à 3.

        (rien que parce que construire des ontologies de qualités c'est déjà pas rien en soi...)

        Ah, ça oui, c'est pas rien...
        Ce serait même peut-être intéressant de se poser la question de la stricte faisabilité d'une représentation sémantique qui ne serait pas limitée à quelques domaines très circonscrits.
        Construire un langage idéal, ce fut déjà une idée tentée par les logiciens du dix-neuvième siècle comme Frege.

        et je l'espère car sinon, on est pas dans la m****...

        Comment ça ? Le Web d'aujourd'hui ne sent pas bon ?
        • [^] # Re: plus ça rate, plus ça a des chances de réussir

          Posté par  (Mastodon) . Évalué à 4.

          Ce serait même peut-être intéressant de se poser la question de la stricte faisabilité d'une représentation sémantique qui ne serait pas limitée à quelques domaines très circonscrits.

          Concrètement, je ne vois pas comment on peut s'interroger sur la faisabilité du web sémantique sans essayer de le construire. Je n'ai pas l'impression que nos connaissances sur la sémantique soient avancées au point de pouvoir conclure dans la théorie sans passer par la pratique et l'expérimentation.
          • [^] # Re: plus ça rate, plus ça a des chances de réussir

            Posté par  (site web personnel) . Évalué à 3.

            Ce à quoi j'ajouterai que l'écriture de programme auto-apprenant est une des meilleurs voie qui mènera à la compréhension profonde de la sémantique.

            C'est en essayant de lever les embûches de cet apprentissage que les véritables enjeux théoriques - qui sont beaucoup plus trans disciplinaires qu'on a tendance à le penser- vont apparaître.

            « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

  • # quelques liens sur ...

    Posté par  (site web personnel) . Évalué à 5.

    http://www.semanticdesktop.org/

    http://dot.kde.org/1155935483/1156033117/
    http://nepomuk.semanticdesktop.org/

    http://www.semantic-web.at/57.392.392.press.mandriva-means-t(...)

    d' autres liens très intéressants, tant sur le point technique vulgrisé que sur la finalité du bousin, sont à dénicher un peu partout sur le web...

    Reste à savoir / comprendre comment la libération de ce moteur peux/pourra mettre un coup de turbo à tout ça. Quelqu' un pour nous éclairez ?
    • [^] # Re: quelques liens sur ...

      Posté par  . Évalué à 1.

      Bon, je connais pas trop les spécificités liées au semantic desktop. A mon avis, c'est plus ou moins le même principes et les mêmes théories que celle que l'on retouve derrière le semantic web, à savoir l'annotation de documents avec des métadonnées liées à des ontologies.

      Le truc, c'est que la plupart des dévellopements sur les bases de connaissances, ou sur la manipulation d'onologies (qui permettent de définir un langage pour les métadonnées) se basent actuellement sur le semantic web.

      Ce qui signifie que tous ce qui permet de manipuler facilement du RDF est bon à prendre. De ce point de vue, je vois la libération d'un dépot RDF comme une excellente nouvelle.

      De même quand on voit la liste des prochaines applications, il y a :
      - Telar : qui permet de dévelloper des applications basées sur des données en RDF, en utilisant principalement Eclipse RCP.
      - Salsa : qui semble permettre d'exprimer la sémantique contenue dans les données de feuilles de calcul sortie d'un tableur. Tel que je vois ca (mais je me trompe peut être, les infos sont limités et je ne m'y connais pas plus que ca) ca pourrait peut être permettre de "diminuer" le nombre de fichier Excel completement bordéliques trainant dans les entreprises. On se retrouve alors avec une qualité de structure de l'information équivalente à celle des BdD tout en offrant plus de souplesse

      Voilà, pour les 2 derniers, je ne suis pas sur, je dis ca d'après mes connaissances limités et ce que je comprends de leur présentation. On en saura plus quand les différentes applications seront effectivement disponibles...
  • # semantic wikipedia

    Posté par  . Évalué à 2.

    Voici quelques liens sur le concept de "semantic wikipedia".
    Comme évoqué dans une discussion sur wikipedia cela pourrait être combiné avec les modèles (templates) de wikipedia afin de ne pas perturber les habitudes des utilisateurs. Les possibilités sont ensuite nombreuses. J'ai pensé à faire des statistiques et des classements sur les villes ou pays (population, densité, etc), les personalités (qui connait qui, qui a contribué directement ou indirectement à quoi, dégrés de séparation entre 2 personalités, age moyen d'une profession), etc.

    http://wiki.ontoworld.org/index.php/Semantic_Wiki_State_Of_T(...)
    http://wiki.ontoworld.org/wiki/Sites_using_Semantic_MediaWik(...)
    http://en.wikipedia.org/wiki/Wikipedia_talk:Semantic_Wikiped(...)
    http://www2006.org/programme/item.php?id=4039
    http://meta.wikimedia.org/wiki/Semantic_MediaWiki

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.