Valentin Lorentz a écrit 2 commentaires

  • [^] # Re: Assistant personnel

    Posté par  (site web personnel) . En réponse au journal Galaxie Wikidata : le hub est en extension. Évalué à 1.

    Je pense que dans la compréhension des questions, il y a deux parties différentes à distinguer : la structure, et le sens.

    La structure, on sait plus ou moins faire, on en parle dans le rapport. On utilise le Stanford CoreNLP, qui est un outil qui combine des approches grammaticales « classiques » (écriture de règles pour des lexers, parsers, etc.) et du “machine learning” (l’apprentissage sur des corpus). Et de façon assez surprenante, ça marche plutôt bien ! (Je ne m’attendais pas à de tels résultats en quelques mois de travail.)

    C’est le sens qui est délicat. Pour la plupart des questions simples (une requête de données), on peut extraire le sens à partir de la structure grammaticale.
    Pour reprendre l’exemple « Affiche les images prises deux jours avant le 13 Novembre », cela ne me semble effectivement pas être quelque chose d’inatteignable, car il n’y a pas d’implicite (identifier « 13 novembre », chercher deux jours avant, prendre les images de ce jour). Ça ne va pas être simple de gérer ce genre de requêtes, mais c’est raisonnablement faisable. (Note : je viens de jeter un coup d’œil, et cette phrase n’est pas parsée correctement. Ça demanderait donc aussi du boulot grammaticalement.)
    En revanche, ce qui devient plus compliqué, c’est dès qu’il y a de l’implicite. Comment comprendre « Qui est le premier président des États-Unis ? » ? On peut récupérer la liste des présidents sans problème, mais il faut comprendre comment on veut la trier (par ordre de mandat), ce qui est beaucoup moins évident à gérer.
    Si ça vous intéresse, la solution technique que l’on envisage actuellement, c’est de mettre une sorte d’annotation sur les ressources, par exemple « présidents des États-Unis » sur la liste, ce qui permettrait ensuite d’en déduire qu’il faut trier par date de mandat. Par exemple via une règle « toutes les ressources annotée par un poste se trient par ordre d’entrée en fonction ». (Mais il y a très probablement des contrexemples ; c’est là qu’est la complexité de ce genre de choses.)

    Et pour revenir sur le sujet d’intelligence artificielle, je suis d’accord avec Okki que ce qu’on cherche plutôt, c’est de l’apprentissage. Mais c’est possible d’apprendre par soi-même ! Par exemple, du feedback à partir de l’interface utilisateur.
    Google fait ça en trackant les clics sur des liens ; nous, nous pourrions le faire avec un bouton de vote +/-, et éventuellement la possibilité de corriger les phrases (ou une salle d’êtres humains chargés d’ajouter les questions mal gérées et leur réponse attendue dans le corpus à partir duquel faire apprendre les algorithmes).

    (J’espère avoir répondu aux questions ; j’en ai peut-être oublié / mal interprété certaines)

  • [^] # Re: Assistant personnel

    Posté par  (site web personnel) . En réponse au journal Galaxie Wikidata : le hub est en extension. Évalué à 4.

    En fait, actuellement, nous n’utilisons pas de données d’OpenStreetMap (à part les tiles, dans l’UI) ; les informations géographiques actuelles viennent de Wikidata.
    Nous sommes néanmoins sur le point de commencer à développer un module pour en récupérer, car il y a effectivement des informations qui nous intéressent dedans ; par exemple des indications de surface (c’est un peu triste que “Where is France?” indique actuellement un point au centre de la France) ou encore des horaires d’ouverture.

    Et merci pour les idées ! Les trois ont l’air d’être des bases de données prometteuses.
    (Et les contributions sont bienvenues si vous voulez développer vous-même un module pour l’une d’elle :) ).