Journal traduction automatisée de langues naturelles contrôlées

Posté par . Licence CC by-sa
Tags :
-11
25
juil.
2012

Nal, je réfléchissais au potentiel d'échange avec des chinois sur la tribune. Maintenant que la charte les "Règles de modération des contenus, commentaires et comptes problématiques" sont consignées dans le détail, je propose une piste pour les tester en profondeur.

À quand un bot qui prendrait en entrée du chinois contrôlé pour générer du français contrôlé ? En ayant l'inverse également, on pourrait interagir avec des chinois \o/ …De même avec toutes les langues :D

On peut considérer le corpus de mots et d'agencements de mots définissant le chinois contrôlé d'une part, le français contrôlé d'autre part, et toutes les langues, par extension.

Or "Il y a transcription possible du langage N3 en langage naturel contrôlé" (source : hacking n°1). J'en déduis logiquement que la traduction automatique d'une langue contrôlée à une autre est possible, au moins par le pivot de N3. Mais peut-être que le travail de convergence des correspondances {langue naturelle contrôlée} vers un même ensemble {ontologie + modèle} en N3 n'est pas fait… Or il me semble que c'est une étape nécessaire.

Pour éclairer le propos, je considère la traduction automatique possible entre langues naturelles contrôlées, sous réserve que le travail de définition d'un ensemble {ontologie + règles} de référence en N3 soit réalisé, pour une traduction possible de toutes les langues naturelles contrôlées vers/depuis cette référence.

Bon après ça voudrait dire que les étrangers peuvent dialoguer en se limitant à leur langue naturelle contrôlée (et nous aussi, en réponse pour eux).

Ce qui peut être fait par un assistant logiciel, par exemple… Voir cette "vidéo sur ACEWiki, un Wiki sémantique, basé sur l'anglais contrôlé" (Url d'accès direct à la vidéo) - considérer l'extrait entre 2'57" et 4' pour découvrir une interface de saisie prédictive en langage naturel contrôlé (ici, de l'anglais contrôlé). Par le biais de ce genre d'interface, je pense qu'on pourrait parler tranquilement aux chinois, si la glue derrière est déjà faite. Et ça je n'ai pas encore la réponse.

Demain, qui sait, une tribune avec certains posts visuellement identifables comme étant exprimés en langage naturel contrôlé, de manière à permettre un suivi des posts échangés avec des étrangers ne parlant pas notre merveilleuse langue ?

  • # Le langage

    Posté par . Évalué à 6.

    la traduction automatique d'une langue contrôlée à une autre est possible

    Je pense que tu as raison, mais c'est pour moi intrinsèquement lié au caractère contrôlé des deux langues justement.

    sous réserve que le travail de définition d'un ensemble {ontologie + règles} de référence en N3 soit réalisé

    Je ne connais pas N3 je devrais me renseigner. Je trouve en effet très intéressant ces problématiques de traduction automatique par ordinateur.

    Bon après ça voudrait dire que les étrangers peuvent dialoguer en se limitant à leur langue naturelle contrôlée (et nous aussi, en réponse pour eux).

    Et bien oui en se limitant donc on perdrait la richesse cumulée des différentes langues naturelles avec cette approche.

    Ça me fait penser au Basic English (passé le cliché de la tour de Babel). Dans cet article on peut lire :

    Si l'invention par Orwell de la novlangue dans 1984 repose bel et bien sur les principes linguistiques qu'il a pu observer dans les discours totalitaires des années 1940, l'intention de l'écrivain est de rendre compte des processus qu'il observait effectivement déjà dans sa propre langue. D'après Jean-Jacques Courtine en effet, l'idée de la novlangue est venue à Orwell avec la diffusion du Basic English. La novlangue constituerait donc pour Orwell une satire du Basic English7 et montre combien il s'était radicalement détourné des prétentions illusoires que pourrait comporter une langue transparente : « Orwell montre à quel point le désir d'une langue transparente peut s'achever dans la pire des obscurités » 8.

    On prend quoi comme pivot ? N3, l'anglais basique, le latin ?

    • [^] # Re: Le langage

      Posté par (page perso) . Évalué à 5.

      La langue pivot ne doit pas être une langue parlée. Ce pourraient être des nombres. Une langue parlée évolue inévitablement, la langue pivot doit rester fixe.
      La difficulté vient principalement du fait qu'il y a quatre façons d'aborder le sens des mots. C'est ce qui est décrit dans Les quatre sens des mots avec une peite dose d'humour.
      J'avais publié il y a longtemps cetral-eurolang et sa traduction en anglais qui montre la problématique de la traduction.

      Ce qui est intéressant, c'est de comprendre que le langage est une interface entre humains et que c'est la même problématique que l'on retrouve avec Les cinq couches des interfaces.

  • # Lobbies

    Posté par (page perso) . Évalué à 2.

    Pour éclairer le propos, je considère la traduction automatique possible entre langues naturelles contrôlées, sous réserve que le travail de définition d'un ensemble {ontologie + règles} de référence en N3 soit réalisé, pour une traduction possible de toutes les langues naturelles contrôlées vers/depuis cette référence.

    Encore un coup de ces lobbies de traducteurs et interprètes pour empêcher la technologie de SamWang de révolutionner le domaine! Sinon, comment va Zino?

    • [^] # Re: Lobbies

      Posté par . Évalué à 2. Dernière modification le 25/07/12 à 23:55.

      Je te trouve un peu dur avec lui. La note de son journal est assez significative du crédit que la communauté de ce site accorde à ses projets et idées. Je ne vois pas en quoi l'enfoncer en lui parlant de Zino, qui même s'il pourrait y avoir un lien avec cet article, n'étant pas le propos de ce journal pourrait avoir un intérêt.

      • [^] # Re: Lobbies

        Posté par (page perso) . Évalué à 3.

        De mon point de vue, ça ressemble beaucoup à Zino : il y a des milliards d'Euros/Dollars mis dans des technologies avec des échecs, mais lui pense que c'est faisable comme ça en écrivant des journaux sur LinuxFr. Beaucoup de théorie, mais… C'est quoi l'objectif de la chose?

        • [^] # Re: Lobbies

          Posté par . Évalué à 1.

          il y a des milliards d'Euros/Dollars mis dans des technologies avec des échecs, mais lui pense que c'est faisable comme ça en écrivant des journaux sur LinuxFr

          Putain mais où a-t-il écrit ça dans cet article ? Dans celui là au moins il exprime son hypothèse que la traduction automatique (limité à des langages contrôlés) est possible. Il a parlé de complot ? De l'incapacité de grandes multi-nationales investissant des sommes colossales à arriver à cet état de fait ?

          Je me permet de te dire que tu es en plein procès d'intentions. Mais bon, à cette heure tardive et ne connaissant pas l'historique de tes relation avec ce fameux SamWang< il n'y a pas de problème, je reste cool ;)

        • [^] # Re: Lobbies

          Posté par . Évalué à -10.

          Lui revendique modestement le titre de "hackeur". Je met les mains dans le cambouis (au moins conceptuel) et là je tombe sur des questions qui me permettent d'approfondir. C'est connu, je pratique. Tu n'as pas envie de participer autrement qu'en trollant, soit.

          • [^] # Re: Lobbies

            Posté par . Évalué à -1.

            C'est vrai que t'es chiant… Au lieu d'ignorer son attaque verbale en faisant preuve de plus d'intelligence que lui, tu lui lances une attaque personnelle encore plus vile, ridicule. :(

            J'ai vraiment pas l'impression que Zenitram se réclame être un hacker (et de toute façon on ne se réclame pas hacker, c'est la communauté des hackers qui vous octroie ce titre :), il a plutôt l'air d'avoir une tête bien faite et c'est souvent agréable d'échanger avec lui.

            • [^] # Re: Lobbies

              Posté par . Évalué à -9.

              Tu te trompes, je n'ai pas lancé d'attaque personnelle au titre qu'il se prétendrait hackeur. C'est moi qui affiche cette prétention sans honte (rien à foutre !), à mon niveau. Par contre, je fais le constat qu'il ne fait que troller sur ce que je produis, ou quasiment. Je trouve ce comportement pénible et je ne suis pas le seul à avoir ce ressenti : Benoar< en avait même fait un journal.

              Je n'ai pas de plaisir à "échanger" avec un trolleur systématique (ou presque, dans son rapport avec moi), mais je peux apprécier de le lire quand il est constructif, même dans la critique.

              • [^] # Re: Lobbies

                Posté par . Évalué à 0.

                je n'ai pas lancé d'attaque personnelle au titre qu'il se prétendrait hackeur.

                Si.

                Lui revendique modestement le titre de "hackeur". Je met les mains dans le cambouis

                Alors déjà pourquoi lui en italique ?

                Ensuite tu sous-entends simplement qu'il ne met pas "les mains dans le cambouis" (bien que d'après toi il le revendique) lui. Tu sous-entends clairement que c'est un menteur et un mec qui veut péter plus haut que son cul.

                Si ta phrase avait une toute autre signification j'espère que quelqu'un ici me corrigera. Mais à mon avis la majorité des autres gens comprend ton commentaire comme moi.

                C'est moi qui affiche cette prétention sans honte (rien à foutre !), à mon niveau.

                À mon humble avis tu n'es pas un hacker mais plutôt un théoricien. Assez perché si je me fie à ta réputation, sache que pour moi un théoricien ne devrait pas se donner de limite. Mais comprends bien que si tes théories sont trop "exotiques", déjà si tu te conformes pas à la grammaire et la typographie admise par ton public c'est déjà bien trop exotique, tu ne toucheras personne.

                Je n'ai pas de plaisir à "échanger" avec un trolleur systématique

                Je vais arrêter de discuter avec toi alors, je pense correspondre à une certaine définition de "trolleur systématique"…

                • [^] # Re: Lobbies

                  Posté par . Évalué à -6.

                  Grumpf ! Je me suis mal fait comprendre !
                  Lui c'est pour parler de moi en reprenant son usage de la 3e personne pour parler de moi, en y associant au passage de l'ironie sur la forme de dénigrement qu'il utilise à mon égard.

                  Ensuite, toute l'interprétation que tu fais est grossière de mon point de vue de rédacteur, mais peut-être que j'ai vraiment été maladroit. Il se fait tard et ça me saoule, je ne vais donc pas investiguer plus.

                  Ceci dit, pour tacher d'être clair quant à mes intentions : je prétendais être un hackeur, l'assumer sans complexe, en présentant ma démarche décomplexée de hacking conceptuel. Je ne parlais pas de lui en cela. Et j'ajoutais qu'il trolait et que j'en faisais le constat.

                  Je peux aussi développer pourquoi je considère qu'il ne faisait que troller, mais franchement pour moi c'est si évident que ça me saoule à ce stade.

                  Je vais arrêter de discuter avec toi alors, je pense correspondre à une certaine définition de "trolleur systématique"…

                  Ce n'est absolument pas ce que j'ai perçu de toi depuis que je t'ai identifié, que ce soit sur la tribune à une époque, que ce soit dans tes contributions sur la partie visible du site.

                  • [^] # Re: Lobbies

                    Posté par . Évalué à 2.

                    Grumpf ! Je me suis mal fait comprendre !

                    C'est pas la première fois !

                    Lui c'est pour parler de moi en reprenant son usage de la 3e personne pour parler de moi, en y associant au passage de l'ironie sur la forme de dénigrement qu'il utilise à mon égard.

                    C'était loin d'être flagrant, manier l'ironie n'est pas un jeu d'enfant.

                    • [^] # Re: Lobbies

                      Posté par . Évalué à -8.

                      C'était loin d'être flagrant, manier l'ironie n'est pas un jeu d'enfant

                      En effet, en me relisant, je le vois. L'abus de tribune mène à l'usage immodéré du second degré et j'ai dérapé. Mea culpa.

        • [^] # Re: Lobbies

          Posté par . Évalué à -10.

          Ça (ce journal) ne ressemble pas "beaucoup" à Zino, il n'y a pas de rapport direct à priori. Ok, c'est pas dur d'en imaginer plein… pour la construction collaborative de montage vidéo (Zino) - avec le support d'un chat gérant la traduction de langage naturel contrôlé -, pour la contribution collaborative à l'ontologie et aux règles (Zind). Mais voilà, j'ai vraiment produit ce journal sur l'impulsion d'une réflexion à propos d'échanges avec des étrangers sur la tribune. La traduction automatique peut concerner n'importe quelle activité collaborative où il y a de l'écrit.

          Tiens, à propos d'absence d'arrière pensée de ma part et d'honnêteté intellectuelle : en relisant mon journal sur le P2P ("objectif : rapide revue du P2P moderne") et en parcourant les commentaires, j'ai vu plein de contributions de ta part. Je n'ai pas relu le détail, mais je réalise avec cette prise de recul que mon sentiment sur ton attitude est infondée au regard de toutes tes participations aux discussions menées au seins des journaux que j'ai écrit. Disons que j'avais la mémoire un peu poluée de nos interactions plus récentes. Ça peut changer. C'est mon souhait.

          Concernant les projets Zino et Zind, je ne comprends pas ton attitude et je n'arrive toujours pas à envisager autre chose que de la mauvaise foi. Cette présentation n'est-elle pas claire à tes yeux ?

      • [^] # Re: Lobbies

        Posté par . Évalué à -10.

        Merci de ton soutien.

        Pour éclairer la situation persistante /o\ (j'ai conservé les posts significatifs) :

        23:16:47 bi2cotte j'ai commis ça ce soir : [url]
        23:17:52 Single cabale<
        23:20:36 pierre_80 23:17 ok
        23:20:47 bi2cotte 23:20:36 maichan !
        23:22:38 bi2cotte Mais je rêve, ils l'ont vraiment fait, ils m'ont moinssé en masse /o\
        23:23:03 bi2cotte Vous voulez manger bi2cotte, c'est ça, hein !
        23:24:53 bi2cotte 23:22:38 -3 en 2 minutes… -4 en 10 minutes… Je note…
        23:28:14 enzo_bricolo 23:24:53 tu es le Enzo Molinari de la tribune
        23:28:57 bi2cotte 23:28:14 ha, si j'ai ce titre de gloire, ça me suffit.
        23:30:01 ffx 23:24:53 tout le monde te note
        23:30:45 bi2cotte 23:30:01 à l'école y avait que la maitresse qui avait le droit. Ça doit être ça, l'évolution démocratique.
        23:33:02 enzo_bricolo 23:28:57 [url] C'est triste à la fin
        23:36:10 bi2cotte 23:33:02 lol
        23:38:07 bi2cotte The Big Blue Overture [url]
        23:38:26 enzo_bricolo "Surprise sex is the best thing to wake up to…. Unless you're in prison." mouarf
        23:41:47 bi2cotte MOUARF
        23:55:54 bi2cotte Sur les 4 derniers journaux, seul le dernier (le mien) a des commentaires (3), dont l'un est constructif et apprécie la réflexion en rebondissant… Quant aux notes, seul mon journal est négatif, à -5 maintenant. Cabale< va-t'en s'il te plait.

        • [^] # Re: Lobbies

          Posté par . Évalué à 5.

          23:55:54 bi2cotte Sur les 4 derniers journaux, seul le dernier (le mien) a des commentaires (3), dont l'un est constructif et apprécie la réflexion en rebondissant… Quant aux notes, seul mon journal est négatif, à -5 maintenant. Cabale< va-t'en s'il te plait.

          Arrête de faire ton Calimero. Tes journaux sont moinssés car ils sont dans la quasi totalité trop vagues et partant dans tout les sens pour avoir la moindre substance. Plus tu vas te plaindre sur la tribune à dire "Ya une cabale" plus ton karma va noircir…

          J'ai trouvé ce journal un peu mieux que la moyenne de tes journaux c'est tout. Mais écoute (quand même un peu) les critiques que l'on peut te faire et tiens en compte.

        • [^] # OSEF

          Posté par . Évalué à 3.

          On s'en fout complètement.

          Si la cabale existe, j'ai un voeu à lui formuler : ne vous contentez pas juste de moinsser cet abruti, s'il vous plait, faites le partir, loin, qu'il arrête de nous les briser avec ses hallucinations à la con !

          • [^] # Re: OSEF

            Posté par . Évalué à -10.

            Oh mais voilà qui est très intéressant !

          • [^] # Re: OSEF

            Posté par (page perso) . Évalué à 6.

            Merci de rester poli et de ne pas insulter les autres personnes du site.

            • [^] # Re: OSEF

              Posté par . Évalué à 1.

              Ouais enfin on parle de samwang… D'ailleurs rappeler la "charte" du site, c'est quand ça vous arrange hein, parce que Machin, des multis, il en est pas à son premier.

              • [^] # Re: OSEF

                Posté par . Évalué à 1. Dernière modification le 26/07/12 à 12:04.

                Benoît a raison, le traiter d'abrutis et lui demander de se casser ça sert strictement à rien.

                Tu remarquera que j'ai aussi été un peu rude avec lui mais que je n'ai fait que lui demander d'arrêter de faire sa tête de con, pas qu'il n'était qu'un con. Je lui ai également demandé de changer son comportement sinon ça ne servait à rien qu'il vienne ici, pas qu'il devait se casser.

                Tu saisi la nuance ?

                D'ailleurs rappeler la "charte" du site, c'est quand ça vous arrange hein, parce que Machin, des multis, il en est pas à son premier.

                C'est pas vraiment des multis, dans le sens : avec le compte toto je tiens tel discourt, avec tata tel autre et avec titi je plussoie tata parce qu'il a trop raison et je moinsse toto parce que c'est un connard.

                Samwang il casse son compte à chaque fois en quelques journaux (parfois 1 seul…), donc il utilise tout le temps de dernier en date qui ne poste pas encore à -12… Enfin il me semble.

                • [^] # Re: OSEF

                  Posté par . Évalué à 1.

                  C'est des multis pour contourner le moinssage mérité, c'est "malin" (http://fr.wiktionary.org/wiki/malin), prémedité dans un but de continuer à polluer. Je vois pas en quoi ça l'excuse "non mais il a le droit de continuer tu comprends le pauvre il est moinssé"

                  • [^] # Re: OSEF

                    Posté par . Évalué à 0.

                    Et puis si ce genre de multi est autorisé, et bien le karma ne sert à rien.

                    Si il a un karma négatif, c'est son problème, et en plus ce n'est pas la première fois. La communauté ne veut pas de lui, il est éjecté, il revient, bref c'est un parasite.

  • # Déception et questions

    Posté par . Évalué à -10.

    Après ce journal et ces échanges, il me reste 5 point de karma (l'intégration des comptes des votes se fait à 1h du matin). Si ça continue ainsi, je ne pourrais plus poster de journal, ni participer sur la tribune. C'est peut-être ce que la communauté de LinuxFr souhaite (dans sa majorité ? Absolue ? Ça serait un critère définitif ?). Si je suis toléré, serai-je banni pour autant de la contribution dans les deux catégories précitées où j'apprécie de m'exprimer ? Ou bien aurai-je le droit de fermer le présent compte, pour en créer un nouveau, comme par le passé ?

    Je pose la question ouvertement. Ça pourra aider à affiner la charte, dans la transparence si possible.

    • [^] # Re: Déception et questions

      Posté par . Évalué à 10.

      Si tu continues à faire ta tête de con comme ça ton prochain compte subira le même sort.

      Quelque conseils pour ton prochain compte (j'étais parti sur comment t'aider à garder celui là mais bon)

      Ne met pas le logo de ton si fameux projet Zino en avatar… Dans l'état actuel des choses les gens accrochent pas (moi non plus c'est trop abstrait), admet le.

      Exprime toi dans un français correct, structure ta pensée. Respect un maximum les rêgles de typographie en vigueur ici (tu m'as bien soulé avec tes : "<<< Hello >>> <<< World >>>.)..

      Ne prête pas attention à celui qui fait un commentaire désobligeant sur toi juste parce qu'il a reconnu (de part ton style…) qui tu étais. Ne réponds que sur le fond, ignore sinon.

      PS : Je compte monter ma boîte de coaching linuxfr.org (je ferais aussi coaching facebook en alimentaire), je le fais bien ?

      • [^] # Re: Déception et questions

        Posté par . Évalué à 0.

        Je le fais bien ?

        Ça a son charme :)

      • [^] # Re: Déception et questions

        Posté par . Évalué à 1.

        je ferais aussi coaching facebook en alimentaire

        Il fallait que ce soit dit. Non mais sérieux vous trouvez pas que la conjugaison anglaise est nettement plus KISS que la conjugaison française ? Une fois qu'on a intégré la concordance des temps, certes différente de celle français, ce genre de faute ne pourrait arriver !

    • [^] # Re: Déception et questions

      Posté par . Évalué à 0.

      "Casse-toi pauvre con" \o/

  • # Bonne question

    Posté par (page perso) . Évalué à 5.

    Bonne question, mais la bande de grincheux plus haut n'accrochent pas, c'est des codeurs, c'est pas leur monde. Leur horizon lointain, c'est les channels de Go…
    T'as de bonne intuitions, mais tu es encore très bordélique, structure ton propos et soit super humble et prudent quand à tes idées : la plupart des gens ne voient pas plus loin que le bout de leur nez, et toute révolution que tu proposes risquerai de remettre en cause leurs avantages acquis.
    J'ai appris tout cela à mes dépends ici même. Et par conséquent je garde mes idées pour moi vu que tout le monde s'en fout.

    Bref, foin d'acrimonie.

    C'est effectivement un des objectifs des langages contrôlé et de ACEWiki qui est basé sur Attempto Controlled English.
    L'intérêt d'ACE est de produire du Discourse Representation Structure, je te renvoi à cette news que j'avais posté sur ce très intéressant projet de l'université de Zurich : https://linuxfr.org/news/attempto-controlled-english

    AceWiki n'est qu'une application de cette technologie.

    Il y a ensuite plusieurs problèmes :

    • Les langages contrôlés dont Attempto ont une interprétation sémantique qui est parti pris. Ils sont obligés, ils n'ont pas le choix. Exemple typique :

    $ ./ape -csyntaxpp -csyntaxdpp -cparaphrase -cdrs -guess -text "Chris gives a flower to John. He has no flower."

    Ce qui donne en DRS :

    drs([A,B],[object(A,flower,countable,na,eq,1)-1/4,predicate(B,give,named('Chris'),A,named('John'))-1/2,=&gt;(drs([C],[object(C,flower,countable,na,eq,1)-2/4]),drs([],[-(drs([D],[predicate(D,have,named('John'),C)-2/2]))]))])
    
    

    Dont ACE tire lui même la paraphrase à partir de ce DRS :

    Chris gives a flower to John.
    No flower is had by John.

    Tu peux constater qu'un humain aurais déduit que c'est de Chris dont on parle

    • Des mots de vocabulaire avec un sens différent. Les moteurs à langage contrôlés travaillent sur la syntaxe pure. Ils ne font pas d'analyse sémantique. Et ça peut vite donner n'importe quoi.

    • Un langage contrôlé est souvent super galère pour exprimer des choses simples. Ca m'est souvent arrivé de réécrire 16 fois ma phrase sans succès.

    « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

    • [^] # Re: Bonne question

      Posté par . Évalué à 5.

      Même si l'anglais est langue universelle dans le monde du développement informatique, je trouve qu'une approche "langage contrôlée" (que je découvre ici) est toute adaptée à l'écriture d'une documentation d'une lib. Ça serait très intéressant si l'on écrivait cette doc une seule fois pour la voir directement traduite dans toute les langues, cela faciliterais grandement les mises à jour (qui sont souvent le gros problème de ce genre de traduction).

      Voir par exemple les réponses désillusionnées de ce genre de journal : http://linuxfr.org/users/deasy/journaux/des-volontaires-pour-traduire-la-documentation-de-django
      Un projet de réécrire une telle doc en langage contrôlé en lieu et place d'une réécriture en une autre langue (ici le français) apporterais un bonus non négligeable au travail titanesque à fournir (on "traduit" alors directement dans un nombre de langue énorme en une seule fois). De plus, le nombre de personne pouvant participer à cette "traduction" est alors beaucoup plus important (au lieu de se cantonner aux anglo-francophones, toute personne maîtrisant l'anglais est capable de contribuer.

      Par contre l'exemple que tu donnes montre effectivement les limites actuelles du système. Mais si dans l'avenir le langage contrôlé devient simple à écrire, je vois ce genre d'application toute indiquée.

      • [^] # Re: Bonne question

        Posté par (page perso) . Évalué à 3.

        Pour avoir un peu taté des membres du projet Attempto, ils n'ont clairement pas l'intention de modifier leur langage.
        Le support de la logique temporelle risque d'attendre longtemps alors qu'on a déjà un bon support de la logique déontique.

        Attempto étant de loin le projet libre le plus avancé sur la question, cela va être dur de faire mieux.

        Mais pour le reste, je suis totalement d'accord avec toi.

        « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

      • [^] # Re: Bonne question

        Posté par . Évalué à 3.

        J'ai eu cette idée il y a quelque temps (je me disais bien que j'étais pas le 1er à l'avoir).

        Après avoir suivit un cours sur le Traitement automatique du langage naturel (Natural Language Processing), je me suis rendu compte que aucune méthode scientifique ne permettra de traduire un texte automatiquement de façon efficace.

        Alors je me suis dit pourquoi ne pas créer un langage "explicite" à la manière des langage de programmation ? Un langage qui pourra être compilé -> traduit vers n'importe quel langue.

        J'ai cherché sur internet mais je n'ai rien trouvé de semblable maintenant grâce à ce journal je sais que ça s'appelle "les langages naturel contrôlés".

        Je pense que c'est quelque chose qui sera courant dans le futur. On pourra traduire vers toutes sortes langues ou dialectes. Avec même des variations selon la façon de parler.

        Du moment que la technologie est libre on pourra implémenter son propre compilateur/traducteur et produire ainsi des traductions "personnalisé". Avec des tournures de phrases, des expressions, un niveau de langage, et un lexique technique adapté selon la région/population visée.

        Les développeurs auront une nouvelle opportunités de carrière -> traducteur universel.

        • [^] # Re: Bonne question

          Posté par . Évalué à -9.

          Le temps de changer de peau pour ne pas perdre la main en tribune, je n'ai pas encore lu le journal d'Ontologia< mais c'est bon d'avoir tous ces retours !

          J'ai pondu un appel public sur la partie cachée du site (la tribiouuuune) :

          Oh, peuple de moules< investig'actrices, passons à l'action purificatrice : attaquons nous à l'implémentation libre de la logique déontique !
          Dans le journal, j'ai mis un lien vers une page sur AceWiki. C'est du Java et du prolog, soit.
          À l'intuition, je dirai qu'en 3000 lignes d'Ocaml ou autant de Prolog, à raison de 3 moules produisant 10 lignes par jour en régime de croisière, je vois ça codé en 3 mois. À vous.
          Un bon point d'entrée pour attaquer tout ça : "ACE 6.6 in a nutshel" ("a short overview of the ACE language").

          Rapport d'audit préliminaire sur mon bureau en fin de matinée s'il vous plait

          PS : nom d'une pipe, il se passe des choses, on me dit pas tout : "Using the Grammatical Framework Krasimir Angelov and Aarne Ranta (both at University of Gothenburg) implemented a grammar for ACE and ported it to five other European languages." (source)

          • [^] # Re: Bonne question

            Posté par . Évalué à -5.

            Je réalise que j'ai commis une erreur. J'aurais du écrire "attaquons nous à l'implémentation libre de la logique temporelle !" et non pas "logique déontique", pour être cohérent avec ce propos d'Ontologia plus haut : « Pour avoir un peu taté des membres du projet Attempto, ils n'ont clairement pas l'intention de modifier leur langage. Le support de la logique temporelle risque d'attendre longtemps alors qu'on a déjà un bon support de la logique déontique ».

        • [^] # Re: Bonne question

          Posté par . Évalué à 3.

          Alors je me suis dit pourquoi ne pas créer un langage "explicite" à la manière des langage de programmation ? Un langage qui pourra être compilé -> traduit vers n'importe quel langue.

          Je me suis aussi posé cette question. Seulement définir un langage controlé c'est définir une grammaire (tout comme chaque langage de programmation a sa grammaire), hors on ne peut pas synthétiser en une seule grammaire les grammaires de toutes les langues. Elles sont trop différentes. Je pense qu'un langage controlé quel qu'il soit n'a aucune chance d'avoir ce coté universel pour toutes les langues du monde.

          Je pense que c'est quelque chose qui sera courant dans le futur.

          Ou pas.

          • [^] # Re: Bonne question

            Posté par . Évalué à -9.

            En partant de la page précité avec cette entrée "Using the Grammatical Framework Krasimir Angelov and Aarne Ranta (both at University of Gothenburg) implemented a grammar for ACE and ported it to five other European languages.", je suis allé faire un test ici.

            Et j'ai pondu ça avec l'interface de démo (sélectionner "Fre" - pour French - dans la liste déroulante à gauche) : "Quatre-vingt-dix cafés et soixante bières s'il vous plaît!" en cliquant sur les mots…. Qui me donne en bulgare : "Деветдесет кафета и шестдесет бири моля!". \o/ …et en anglais : "Ninety coffees and sixty beers please!" …C'est bon tout ça !

            Dans le "Grammatical Framework Tutorial" (par Aarne Ranta, December 2010 for GF 3.2) on trouve par exemple le paragraphe :

            Embedded grammar applications

            compile grammars to new formats, such as speech recognition grammars
            embed grammars in Java and Haskell programs
            build applications using compilation and embedding:
                voice commands
                spoken language translators
                dialogue systems
                user interfaces
                localization: render the messages printed by a program in different languages 
            
            

            J'ai l'impression qu'il faut creuser :)

            • [^] # Re: Bonne question

              Posté par . Évalué à 3.

              five other European languages

              C'est bien ce que je dis. Ça peut fonctionner avec un nombre restreint de langues.

              Inventer un langage, basé sur un alphabet quel qu'il soit, qui puisse être un langage contrôlé universel est un projet voué à l'échec selon moi.

              À moins de prendre un alphabet "pictogrammique", qui permettrait au mieux d'exprimer des idées comme "J'ai faim", "Tu me fais chier" mais guerre plus, la complexité de la pluralité de langues parlées dans le monde ne peut être réduit à un seul langage structuré et contrôlé.

              • [^] # Re: Bonne question

                Posté par . Évalué à -7.

                euh… j'ai donné un extrait des résultats pour faire court, mais la page m'a produit la traduction dans une vingtaine de langues ("all" sélectionné par défaut), comme même :

                Bul:
                Деветдесет кафета и шестдесет бири моля!
                Cat:
                Noranta cafès i seixanta cerveses sisplau!
                Dan:
                Halvfems kaffe og tres øl tak!
                Dut:
                Negentig koffie en zestig bieren alsjeblieft!
                Eng:
                Ninety coffees and sixty beers please!
                Fin:
                Yhdeksänkymmentä kahvia ja kuusikymmentä olutta kiitos!
                Fre:
                Quatre-vingt-dix cafés et soixante bières s'il vous plaît!
                Ger:
                Neunzig Kaffees und sechszig Biere bitte!
                Hin:
                नववे काफ़ीँ और साटh' बियर कृपया!
                Ita:
                Novanta caffè e sessanta birre per favore!
                Nor:
                Nitti kaffen og seksti øl takk!
                Pes:
                Pol:
                Dziewięćdziesiąt kaw i sześćdziesiąt piw proszę!
                Ron:
                Nouăzeci de cafele şi şaizeci de beri vă rog!
                Rus:
                Девяносто кофе и шестьдесят пиво пожалуйста!
                Spa:
                ¡ noventa cafés y sesenta cervezas por favor!
                Swe:
                Nittio kaffe och sextio öl tack!
                Tha:
                ขอ กาแฟ เก้า สิบ กำ ลัง และ เบียร์ หก สิบ แก้ว หน่อย ครับ
                -- ninety coffees and sixty beers please (by male)
                ขอ กาแฟ เก้า สิบ กำ ลัง และ เบียร์ หก สิบ แก้ว หน่อย ค่ะ
                -- ninety coffees and sixty beers please (by female)
                Urd:
                نوے كافیاں اور ساٹھ بییر مہربانی

                • [^] # Re: Bonne question

                  Posté par . Évalué à 1.

                  Tu n'es pas en mesure de juger de la pertinence de toutes ces traductions. Moi non plus je te rassure.

                  • [^] # Re: Bonne question

                    Posté par . Évalué à -7.

                    Ça ne me rassure pas du tout. Menons une enquête, on saura bien discriminer ce qui est valable dans tout ça. J'ai envie de rêver.

                  • [^] # Re: Bonne question

                    Posté par . Évalué à 2. Dernière modification le 27/07/12 à 07:49.

                    En plus la phrase est simple. Ça me rappelle que les mots polonais que j'ai retenu quand j'ai été là-bas c'est, dziękuję, dobra, piwo et papierosy…

                    Si il y a des gens qui partent en Pologne, ne pensez pas que vous aller vous dermerder parce que vous parlez anglais ! (Là-haut le tourisme c'est encore plutôt abstrait) Partez avec un bon dictionnaire, qui inclu une transcription pseudo-phonétique, c'est des malades de la consonne, quand on est pas habitué ça fait bizarre (la français repose nettement plus sur les voyelles et des son voyelliques comme "in" "on" "en" ou "eu" (il n'y a pas ses variations en polonais : a, é, i, o, ou suffisent, tout est dans les consonnes.

                    Bref, une phrase comme "Deux bières et une pizza s'il vous plaît" c'est sûr que le programme de traduction va pas se plenter.

                    Mais "Une des valeurs de la connerie c'est qu'elle est étrangère à la logique binaire" accroche toi…

                    J'éspère que tu vas tester ! Je serai en mesure de te renseigner sur la pertinence de la traduction en anglais et en espagnol, au moins…

                    • [^] # Re: Bonne question

                      Posté par . Évalué à -6.

                      Mais "Une des valeurs de la connerie c'est qu'elle est étrangère à la logique binaire" accroche toi…
                      J'éspère que tu vas tester !

                      Euh, déjà cette expression "Une des valeurs de la connerie c'est qu'elle est étrangère à la logique binaire" m'a l'air erronée au niveau du sens. Je dirais que "Une des valeurs de la connerie c'est qu'elle est familière de la logique binaire" me parait plus sensé. Tant qu'à faire, je vais tester avec cette version.

                      Bon, le test n'est pas bien concluant… Dès que je choisis "une" dans la liste, le choix du mot suivant est très limité, j'obtiens la liste suivante de mot disponibles : "banque bière bonne couronne discothèque eau gare livre mauvaise pharmacie pizza pomme poste trop très université école église"

                      Il n'y a pas l'expression "valeur" dans la liste, snif.

                      J'ai testé pour voir avec "un", j'obtiens : "aéroport bar café cafétéria centre cinéma dollar euro hôpital hôtel leu (sic !) lev (re-sic !) magasin musée parc parking pub restaurant rouble supermarché thé théâtre vin zioty (re-re sic) zoo"…

                      Finalement, j'ai testé en collant la phrase "Une des valeurs de la connerie c'est qu'elle est familière de la logique binaire" dans le champ de saisie, ensuite j'observe qu'en validant une fois, il m'affiche le token "une", et en validant successivement plusieurs fois, on se retrouve avec tous les tokens de la phrase à l'écran, c'est beau, mais pas de traduction. Y a un bouton "Try Google Translate" en bas mais j'ai pas cliqué…

                      Je note qu'il y a aussi un bouton "Feedback" en bas, avec le libellé (au survol de la souris) "click to suggest improvments (…)" : on peut proposer une meilleur traduction pour un texte donné (participation anonyme, ouverte à tous). À partir du résultat de la phrase découpée à l'écran en tocken, j'ai sélectionné l'anglais comme langue cible (pour proposer une traduction dans cette langue, l'interface est prévue pour fonctionner ainsi) et j'ai clické "Feedback". J'ai alors saisi ma traduction personnelle : "One of the values of the bullshit is that it's familiar with the binary logic" et j'ai validé par "submit feedback". On verra si ça a un impact plus tard, j'ai reçu un message de remerciement à l'écran :)

                      Note : j'ai composée ma version de la traduction anglaise à partir de ce que me proposait reverso.net : "One of the values of the bullshit it is because she(it) is familiar of the binary logic". Reverso se fonde sur les api de google, vu que la page du traducteur a besoin de googleapis.com (et de reverso.net) comme source pour charger du code javascript (constaté avec l'extension NoScript de Firefox), sinon elle ne fonctionne pas.

                      Sinon, je note cet avertissement (après clic sur le bouton "help") : "The translator is slightly overgenerating, which means you can build some semantically strange phrases. Before reporting them as bugs, ask yourself: could this be correct in some situation? is the translation valid in that situation?"

                      Je serai en mesure de te renseigner sur la pertinence de la traduction en anglais et en espagnol, au moins…

                      Désolé /o\

                      • [^] # Re: Bonne question

                        Posté par . Évalué à 2.

                        Euh, déjà cette expression "Une des valeurs de la connerie c'est qu'elle est étrangère à la logique binaire" m'a l'air erronée au niveau du sens. Je dirais que "Une des valeurs de la connerie c'est qu'elle est familière de la logique binaire" me parait plus sensé. Tant qu'à faire, je vais tester avec cette

                        Tu retournes mes propos.

                        • [^] # Re: Bonne question

                          Posté par . Évalué à -6.

                          Tu retournes mes propos.

                          C'est vrai, j'assume.

                          Regarde, j'ai poursuivi un peu l'expérience, c'est pas gagné :

                          reblochon< lance "نوے كافیاں اور ساٹھ بییر مہربانی" à la cantonade sur la tribune…
                          Je réagis : "ایك سو بییر اور پندرہ كاٹالانین پیزے كو خریدنا"

                          Détails :
                          reblochon< a pioché la version "Urd" de "Quatre-vingt-dix cafés et soixante bières s'il vous plaît!"

                          J'ai voulu répondre "achète cent bières et quinze pizzas catalanes" et j'ai réussi avec http://www.grammaticalframework.org/demos/phrasebook/ (j'ai pioché les mots dans la liste, j'ai mis quelques instants à trouver une formulation censée qui soit …disponible) …Mais par contre, si je mets ensuite mon expression en "Urd" dans le moteur (sélectionner "Urd" dans la liste déroulante de gauche), que je valide par une succession de [entrée] et que je considère le résultat, c'est franchement pas fini l'histoire, lol. L'interface en Ajax ne permet pas d'obtenir une url pour présenter le résultat d'un test, c'est bien dommage. Ceci dit, on peut facilement faire le test par un copié/collé suivi d'un appui répété sur [entrée] sans effet de bord si on appuie plus que nécessaire.

    • [^] # Re: Bonne question

      Posté par . Évalué à 3.

      Les langages contrôlés dont Attempto ont une interprétation sémantique qui est parti pris. Ils sont obligés, ils n'ont pas le choix. Exemple typique :
      $ ./ape -csyntaxpp -csyntaxdpp -cparaphrase -cdrs -guess -text "Chris gives a flower to John. He has no flower."

      Ce qui donne en DRS :

      drs([A,B],[object(A,flower,countable,na,eq,1)-1/4,predicate(B,give,named('Chris'),A,named('John'))-1/2,=>(drs([C],[object(C,flower,countable,na,eq,1)-2/4]),drs([],[-(drs([D],[predicate(D,have,named('John'),C)-2/2]))]))])

      Dont ACE tire lui même la paraphrase à partir de ce DRS :

      Chris gives a flower to John.
      No flower is had by John.

      Tu peux constater qu'un humain aurais déduit que c'est de Chris dont on parle

      Des mots de vocabulaire avec un sens différent. Les moteurs à langage contrôlés travaillent sur la syntaxe pure. Ils ne font pas d'analyse sémantique. Et ça peut vite donner n'importe quoi.

      Forcément…

      Une application permettant l'écriture dans un langage contrôlé ne devrait-elle pas justement contrôler ce que l'émetteur produit ?

      Dans notre cas la phrase "Chris gives a flower to John. He has no flower." ne devrait-elle pas être considérée comme invalide ou indécise par le moteur de langage contrôlé ? Nécessitant donc un choix humain (Who's He : Chris or John) ce n'est plus vraiment un automate.

      Je le répète, l'utilisation d'un langage contrôlé oblige l'émetteur à se conformer à ce langage, ce langage peut très bien interdire une phrase équivoque comme l'exemple que tu as employé. (ERROR : 'He' is undefined, could be 'Chris' or 'John')

      • [^] # Re: Bonne question

        Posté par (page perso) . Évalué à 3.

        Effectivement, mais ce n'est pas le scope d'ACE et c'est assumé. Et franchement, ils n'ont pas trop le choix.

        C'est pour cela que ce langage contrôlé doit être pratiqué par quelqu'un qui sait ce qu'il fait, et de fait qui va avoir tendance à éviter les anaphores (C'est comme cela que ça s'appelle). Donc plutôt écrire "Chris gives a flower to John. Chris has no flower."

        Dans ce cas, tu ne prend pas le risque de prendre un logiciel comme ACE en défaut, mais tu dois avoir un analyseur de ton DRS, qui va interpréter la logique.

        J'en ai d'ailleurs écris un tout début : https://github.com/ontologiae/DRS-Analysis-Tool

        Biscotte/etc… si ça t'intéresse, j'ai pour projet d'écrire un prolog déontique et temporel..

        « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

        • [^] # Re: Bonne question

          Posté par . Évalué à -5.

          Bi2coteau< au rapport : affirmatif, ça m'interesse.

          Le rapport d'audit préliminaire commandé tôt ce matin a été livré d'une façon magistrale par l'ensemble des contributeurs. C'est une grande réussite et un jalon remarquable dans l'aventure qui t'attend. Je pense que ton projet est voué au succès. Je vais donc te coacher, au minimum (maintenant que j'ai vu m4rotte< patiquer).

          De plus, bien que je n'ai jamais codé en Prolog (j'ai juste parcouru un travail universitaire de Bernard Yannou sur le sujet il y a une quinzaine d'années), je vais m'y mettre et t'accompagner à la mesure de mes moyens.

          • [^] # Re: Bonne question

            Posté par . Évalué à -5.

            J'ai mené une petite recherche d'info autour de Prolog pour déclencher la phase formation. Je partage cette démarche.

            J'ai retrouvé le doc papier de 51 pages intitulé "cours de programmation logique (Prolog)" (sous-titré "Introduction aux CLP (Prolog II, III)") de Bernard Yannou. Par contre, je l'ai pas retrouvé en ligne… M'enfin ça date de 1996 /o\.
            /me se demande si y a pas des ressources en ligne plus récentes et de qualitaÿ en fait… Si vous avez d'autres idées…

            pierre_80< : bi2coteau< http://prolog.developpez.com/cours/
            pierre_80< : et reviens nous voir quand tu aura un truc fonctionnel pas avant hein !

            Pour sûr ! Pour l'instant, je travaille ma mémoire avec le paragraphe "Rule Based Programming" : « La programmation orienté règle (Rule Based Programming) est peu connue et assez intéressante. Elle se rapproche plus d'une logique du premier ordre, donc assez haut niveau. Il n'y a pas grand chose de très différent avec un moteur à la Prolog. Seul le contrôle de flot diffère puisque le moteur va "surveiller" la base de fait pour appliquer une règle qui pourrait "matcher" » (source : le journal "Des paradigmes alternatifs" (du 25/05/11) d'Ontologia< …Où il est question des paradigmes de programmation autres que les "classiques" impératif, objet, fonctionnel [Ocaml que j'ai cité dans la journée est un langage fonctionnel]) avec une belle nimage du Moteur d'inférence à règle. « [La programmation orienté règle] est à la base de Drools, qui est un moteur d'inférence libre pour le monde Java, distribué par Apache ».

            pierre_80< : oui mais reviens sur la 3bune lorsque 1) tu auras les bases de ce langage et de 2) un prototype même si il est crade

            J'aquiers les bases, pas de problème… Prolog… un lien avec Drools… Tiens, mais justement, « Pour se libérer des inconvénients des langages Orientés Objet et procéduraux, le premier "ingrédient" de la solution est d'utiliser un moteur d'inférence, plus précisément un moteur en chaînage avant avec l'algorithme optimisé RETE. Le moteur utilisé est Drools, un projet Java Open Source solide ». Source : la doc cadriciel_eulergui …Et avec moulte détails dans la documentation d'Eulergui (version anglaise) …ou encore partout dans les notes en français de Jean-Marc Vanel.

            J'en parle un peu plus, les concepts sont à voir :

            Dans ses notes du 2012-06-20 on trouve (dans la section titrée "Cadriciel") une "Vue d'ensemble - Diagramme de flux de données" :

            ACE --> OWL+SWRL --> N3(ontologie+règles) --> Drools
                                        |                   |
                                        v                   v
                                 Euler, CWM, FuXi         Drools
                                        |
                                        v
                                       N3
            
            

            /*
            Séquence ludique : je m'amuse à développer ce diagramme de flux à plat avec un formalisme perso trivial (évident), c'est lisible, c'est une chaine délicieusement goûteuse (lol) avec un ptit commentaire (le "[uh !]" est de moi) :
            ACE --> OWL+SWRL --> {N3(ontologie+règles) {--> [Euler, CWM, FuXi] --> N3}} --> Drools {--> Drools [uh !]}
            */

            Pour référence, ce qu'est EulerGui, vu sur Linuxfr. Voici la vision que j'en avais développé suite à mes échanges avec Jean-Marc (en gros la sienne, à travers la moulinette de ma compréhension et de mon expression, validée en retour par lui) ; je vous invite sérieusement à la lire pour élargir votre esprit.

            • [^] # Re: Bonne question

              Posté par (page perso) . Évalué à 3.

              Mais c'est quoi ton objectif en fait ?

              « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

              • [^] # Re: Bonne question

                Posté par . Évalué à 2.

                Y va t'aider qu'il a dit ! ;)

                Sinon bon courage pour ton projet, c'est intéressant ce domaine.

                • [^] # Re: Bonne question

                  Posté par (page perso) . Évalué à 3.

                  Ouais enfin, c'est qu'une pièce d'un projet plus grand : un langage à règle déontique et temporel, avec syntaxe en anglais (merci Attempto et Stanford NLP) et couplée à un début d'ontologie, Wordnet. J'ai encore 10 ans devant moi pour faire un proto !

                  « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

                  • [^] # Re: Bonne question

                    Posté par . Évalué à -10.

                    [back-tracking]

                    j'ai cité ton post dans ce cas d'usage

                    // c'est un jeu sérieux avec les concepts, de la part d'un gros débutant, pertinence non garantie :)

                    En quelques mots, je dirais que ça traite :

                    • de l'impact fonctionnel de la traduction automatisée de LNC (langage naturel contrôlé)

                    • de l'impact fonctionnel de la recherche d'expressions LNC approchantes (par vérification de cohérence entre l'expression recherchée et la cible de recherche considérée comme un modèle de référence (+ extraction si possible d'une assertion valide issue de la cible, proche sémantiquement))

                    • de la vérification de cohérence pour consolidation de spécifications fonctionnelles (ou documentations de logiciels…) au fil de commentaires en LNC sur des réseaux sociaux dédiés

                    • Enfin, d'écriture d'application en LNC (voire d'assistance à l'écriture depuis le CDCF en LNC) avec exploitabilité de source non LNC (réutilisation de code robuste existant, tous langages confondus, mais avec un bloc additionnel de normalisation en LNC (fonctionnalités, E/S, … modélisées en LNC)), selon un schéma qui pourrait se rapprocher de ça :


                    { 
                        { CDCF en LNC ---(assistant)---> source LNC },
                        { [bloc de normalisation LNC](d'un code_source_externe (langage quelconque)) ---(EulerGui)---> [API LNC exploitable]}
                    }  ---(EulerGui)---> code source de l'application
                    
                    

                    Avec :

                    • source LNC : application définie en tant que modèle et règles écrits en LNC
                    • code source de l'application : en Java pour l'instant (autre, à l'avenir) - nécessite d'intégrer des appel au code_source_externe (via des connecteurs pour langages externes si besoin)
                    • [^] # Re: Bonne question

                      Posté par . Évalué à -10.

                      [back-tracking]

                      J'ai ajouté une idée ici : le bloc de normalisation est derrière une URI (pas d'impact sur le fichier source) identifiant ce qui est nécessaire, dont une référence au code source originel que ce bloc vient enrichir de sens, avec ce qui convient de signature crypto pour valider la certification, les audits…

                    • [^] # Re: Bonne question

                      Posté par . Évalué à -10. Dernière modification le 01/08/12 à 03:04.

                      [back-tracking] j'ai cité ce journal en ajoutant du contenu traitant de "chat avec norloges" ainsi que des développements complémentaire sur le TALNC + conception/codage/documentation en LNC

                      // [back-tracking] cité plus bas dans cette page, dans un nouveau fil de commentaire, doublon


                      [ réflexion sur les graphes de commentaires, la gestion de multiples parents pour un message avec l'usage des citations, l'inclusion automatisée de rétro-liens, l'affichage en zoom arrière des graphes de commentaires ]

                      Pour ceux qui, à la suite de mon usage des citations des sources et des référencement par rétro-liens, se demanderaient comment gérer plusieurs parents pour un même message, dans une suite de messages hierarchisées, où typiquement, selon l'habitude comme sur Linuxfr, un message a un seul parent éventuel (à moins de débuter un nouveau fil de commentaires) et plusieurs enfants éventuels, je dirais : plutôt que d'ajouter une gestion de plusieurs parents dans un en-tête de message sans caractérisation riche de leur nature, il conviendrait :

                      • de promouvoir la citation des sources au moment opportun dans tout nouveau message - on peut y être incité, notamment par insertion automatique d'une formule consacrée avec le sucre syntaxique adéquat (le formalisme d'ajout d'url cliquable), déclenchée par un clic sur une icône "citation de source" ("source quotes"). Ce clic insérerait une formule du type "source : « »" et proposerait en option d'émettre un [rétro-lien] en réponse sous la source (nouveau commentaire (ou nouevelle catégorie "rétro-liens" dans la page) pour un journal/dépêche, commentaire imbriqué pour un commentaire (ou identifiant visuel plus discret, dessous ou dans la marge, avec informations supplémentaires au survol), ce qui pourrait donner le processus suivant pour l'utilisateur de linuxfr :

                        • je saisis (copier/coller par ex.) le titre d'une source (disons titre_d'une_source)
                        • je le sélectionne
                        • j'appuie sur le bouton "citation de source" et j'obtiens la syntaxe Markdown suivante "source : « [titre_d'une_source](http://URL_de_la_source) »" (avec http://URL_de_la_source préselectionné, pour être remplacé, par un copier/coller de l'url de la source - travail qui reste à la charge de l'utilisateur).
                      • de permettre la visualisation d'un arbre des messages (dans un journal par exemple) incluant un fléchage pour les sources citées (sources internes au journal, sources externes). Selon un mode plus fin, ou pourrait avoir un message sourcé en petit format (zoom arrière) pour visualiser les endroits citant les sources, avec fléchage fin ciblant le bon endroit dans le message, avec visualisation des sources (avec par exemple {le titre du journal/dépêche/whatever + titre du commentaire} affichés au survol souris de cette source, représentée en petit format. Selon d'autres modes, on pourrait avoir des représentations sous forme de graphe plus ou moins élaborés, plus ou moins développables ou repliables, plus ou moins enrichis en informations.

                      Option : intégrer un filtre sur les horraires, pour avoir une vue d'une source en l'état au moment où elle a été citée (tout au moins au moment de la validation du message incluant la citation, ce qui serait affinable uniquement en ayant connaissance du dernier moment où la source a été contrôlée avant validation du message, ce qui est difficile), pour voir le contexte connu de l'auteur de la citation au moment de sa rédaction. Pour obtenir cette vue, l'utilisateur pourrait cliquer sur un bouton en marge d'un post, en face d'une citation, un bouton libellé (au survol souris) "source contextualisée à la date de citation".

                      Légèrement amélioré, le principe incluerait une syntaxe markdown déjà citée "source : « [titre_d'une_source](http://URL_de_la_source) »" (avec http://URL_de_la_source préselectionné) générant automatiquement, pour les citations internes à Linuxfr, une formule avec passage de norloge en paramètre, lors de la validation du message, de la forme : "source : « [titre_d'une_source](http://URL_de_la_source_sur_Linuxfr/norloge_contexte=jj-mm-aaaa-hh-mm-ss) »" permettant à un linuxfr patché de renvoyer la page contextualisant la source dans un affichage identique à aujourd'hui, mais avec un bouton à côté de la source permettant en javascript d'effacer tous les commentaires non présent dans le contexte à l'heure de la citation.


                      Plop

              • [^] # Re: Bonne question

                Posté par . Évalué à -6.

                Comme je l'exprime plus haut (source), je suis motivé par le potentiel de traduction automatique en langage naturel contrôlé, qui peut concerner n'importe quelle activité collaborative où il y a de l'écrit (par exmple l'échange avec des étrangers sur la tribune) et notamment :

                • la construction collaborative de montage vidéo (Zino) - avec le support d'un chat gérant la traduction de langage naturel contrôlé ;

                • la contribution collaborative à l'ontologie et aux règles de Zind.

                Bon, si tu en es encore à te demander ce que sont Zino et Zind, tu peux procéder ainsi :

                Pour finir, l'implémentation de Zind demande plus qu'une automatisation de la traduction entre langues naturelles contrôlées. D'où mon intérêt pour EulerGui, entre autre.

                • [^] # Re: Bonne question

                  Posté par (page perso) . Évalué à 4.

                  Le problème, Paul, c'est que tu es manifestement infoutu de présenter Zino et Zind en 3 phrases, ce qui est la pierre angulaire d'un pitch. Tant que tu ne sauras pas l'expliquer en 3 phrases, tu te feras jeter et c'est normal.

                  Si je comprend bien :

                  Tu souhaites faire un système ou tout un chacun puisse sélectionner des parties de vidéo, et les décrire dans un langage naturel contrôlé, afin qu'il soit automatiquement traduit.
                  Le tout serait centralisé au sein d'une plateforme et tout un chacun pourrait faire des recherches en langage naturel contrôlé afin de retrouver ce qu'il cherche.

                  C'est bien ça ?

                  Réponse claire et synthétique et courte STP (3 phrases murement réfléchies)

                  « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

                  • [^] # Re: Bonne question

                    Posté par . Évalué à -5.

                    Je pose "LNC" pour "langage naturel contrôlé".

                    Bravo, il manque juste deux précisions :

                    • la recherche avec Zind a vocation à ramener des extraits - éventuellement traduits (au niveau des sous-titres (LNC ou en dur), de la transcription en LNC, du résumé en LNC) - agencés en un discours cohérent et valide au niveau du sens, avec d'éventuels discours de liaison entre les extraits (générés en LNC).

                    • Zino doit permettre de faire des montage vidéo "à la main" en associant des extraits et en produisant les discours de liaison soi-même. La recherche sur Zino doit pouvoir renvoyer des extraits et des montage vidéo réalisés, sans nécessité de gérer une requête en LNC, pour commencer.


                    Ceci dit, je considérais avoir dit l'essentiel du point de vue utilisateur en deux phrases (une pour Zind, une pour Zino) dans cette référence pré-citée : "présentation de Zino et Zind dans l'actualité de la situation".


                    Précision : je ne peux évidemment pas prétendre décrire tout le périmètre fonctionnel avec aussi peu de mots. Pour Zino, on pourrait citer des caractéristiques spécifiques comme le fait de permettre de visionner les sources d'un clic (lors du visionnage d'un montage fait d'extraits) / capacité de sauvegarde systématique des sources citées (y compris sur Freenet si besoin) avec signatures GPG pour authentification / capacité de calcul réparti pour adaptation aux contraintes CPU et bande passante des internautes défavorisés, etc (je le formalisais en 6 points en février dernier).

                    • [^] # Re: Bonne question

                      Posté par . Évalué à 4. Dernière modification le 28/07/12 à 00:46.

                      C'est quoi un discourt de liaison, dans le domaine vidéo s'entend ?

                      C'est clair que ton projet est tellement zarbi qu'il nécessite absolument un prototype histoire que l'on puisse saisir le concept.

                      Pour forniquer avec la vérité, ton projet (Zino) n'est rien qu'un ramassis d'idées des plus louches. Croire que l'image animée (taggée, commentée, croisée) devrait être le medium ultime est à mon sens d'une stupidité sans bornes.

                      Oublie Zino passe à autre chose…

                      • [^] # Re: Bonne question

                        Posté par . Évalué à -10.

                        Oh mais rofl, tu es un vrai trolleur de première classe !

                      • [^] # Re: Bonne question

                        Posté par (page perso) . Évalué à 2.

                        C'est sur qu'en terme de besoin, c'est assez limité… Dans l'enseignement peut être ?
                        Je pense que c'est plus du côté du Grammatical Framework qu'il faudrait aller voir… Ou attendre que le linguiste qui voulait l'intégrer avec Attempto ait réalisé son projet.

                        Cela dit, une branche du AceWiki, ou en tout cas la partie qui liste les mots possible à un certain moment de la phrase peut faire l'affaire. Occupe toi de la traduction après. Tu as bien assez d'universitaires qui bossent sur le sujet.

                        Je me souviens de son message sur la ML il y a un ou deux, et il précisait qu'il n'était pas développeur, donc ça peut attendre longtemps, sans compter le travail de traduction.

                        « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

                        • [^] # Re: Bonne question

                          Posté par . Évalué à -10.

                          Concernant "Grammatical Framework" on a mené une petite expérimentation ce vendredi matin (je suis surpris, tu sembles ne pas l'avoir vu passer).

                        • [^] # Re: Bonne question

                          Posté par . Évalué à -10.

                          C'est sur qu'en terme de besoin, c'est assez limité… Dans l'enseignement peut être ?

                          L'enseignement… Et la télé, mais une nouvelle télé, une télé d'éveil.

                          J'ai eu l'occasion d'utiliser l'expression "télévision interactive construite collaborativement" pour parler de Zind.

                          Le 10 du mois, j'exprimais ce potentiel dans un échange de questions/réponses.
                          J'en propose une synthèse charpentée (source : essentiellement ici et ) :

                          La capacité de production d'un discours intelligent (en tant qu'amalgame d'extraits avec des discours de liaison bien ordonnés, selon une ligne éditoriale), en réponse à une question, donne la possibilité de programmer un listing de questions qui amèneront leurs réponses en image, comme une succession d'émissions sur divers sujets, source d'intérêt y compris pour le péquin lambda qui aurait la flemme d'exprimer sa question et se collerait juste devant son écran.

                          Il y a dans le concept de zind la recherche d'une certaine "pureté" de l'information (il y a des media alternatifs et des meRdias mainstream). Se pose la question de limiter l'influence des tenants des "merdias" sur les productions basées sur zind (ou zino). Même si ces logiciels devaient apparaître d'abord sous forme de logiciel libre, de gros acteurs meRdiatiques tenteraient de l'influencer par l'argent (capacité à mobiliser des assemblées de rédacteurs, des comités éthiques et scientifiques, capacité promotionnelle) et du pourrissement par la désinformation amplifiante.

                          Pour limiter l'influence meRdiatique, la solution est dans un traitement à la racine par :

                          • la capacité de forker : aujourd'hui, faire sa propre télé avec Zind, ce n'est pas donné à chacun. Demain, ça pourrait l'être, dans la mesure où il serait facile de forker depuis la production d'une communauté, ou même de fusionner entre plusieurs sources. Pour qu'il y ait capacité de fork, il faut logiciel libre ET données libres. Dans le cas de données non libres (des sources vidéos aux licences restrictrices), la redirection automatisée vers le contenu sur des réseaux incensurables comme Freenet pourrait bien être une solution efficace.
                          • la mise en avant pertinente des bonnes sources parmis la multiplicité des sources télévisuelles alternatives : par les forums et réseaux sociaux classiques et par des systèmes de vote, avec signature crypto possible (y compris en mode anonyme sous pseudo) et donnant un contrôle à l'utilisateur sur les votes à prendre en compte.

                          Finalement, avec des télés communautaires produisant des discours citant des sources (et permettant d'y remonter d'un clic), je considère que l'éveil est accessible. Si en plus la "télé" peut répondre aux questions spécifiques du candidat à l'éveil, avec différents niveaux d'approfondissement de la réponse, on peut considérer qu'on est sur la voie ! La démonstration par l'image (et pour être sérieux, avec recoupement d'informations et multiples témoignages concordants, c'est mieux) peut être un très bon mode de communication, en terme de crédibilité du discours.

                        • [^] # Re: Bonne question

                          Posté par . Évalué à -10.

                          Je me souviens de son message sur la ML il y a un ou deux, et il précisait qu'il n'était pas développeur, donc ça peut attendre longtemps, sans compter le travail de traduction.

                          Je n'ai pas compris de qui tu parles. Si c'est de moi, il y a erreur. Mon métier c'est l'ingénierie logicielle. Je développ. e .…ais et après quasi 10 ans de pause, je compte m'y remettre.

                      • [^] # Re: Bonne question

                        Posté par . Évalué à -10.

                        Un "discours de liaison" c'est un discours de liaison [qui vient s'intercaler] entre deux extraits vidéos, éventuellement. Il fait la liaison. Si j'ai bonne mémoire, j'utilise ce vocabulaire un peu partout depuis des années.

                        • [^] # Re: Bonne question

                          Posté par . Évalué à -10.

                          En considérant ce vieillissant "Résumé de Zino/Zind en français" (dont je considérais qu'il faisait référence, d'ici la publication du cahier des charges v 0.9), j'observe que le mot "discours" y apparaît de nombreuses fois, mais "liaison" pas une seule. Mea culpa.

                          Pour éclairer, je cite un extrait, à propos de Zino : « construire un discours à base de citation d'extraits multimédia. Ton discours s'intercale entre les extraits [discours "de liaison", la glue qui permet d'articuler l'ensemble des extraits dans un discours cohérent et orienté] » (…) « Mme Michu étant téméraire mais pas trop, elle a produit son discours intercalaire [= "discours de liaison"] en texte pour rester anonyme ».

                          Dans le cahier des charges v 0.5 on trouve une occurrence du mot "liaison" utilisée dans l'expression "discours de liaison", à l'annexe A, à propos de Zind (fautes corrigées ici) : « On peut envisager une extension à Zino, une surcouche, que j'appellerai "Zind". Il s'agit de donner la possibilité, par Intelligence artificielle, de répondre à une requête en langage naturel par la génération d'un flux vidéo qui intègre automatiquement les séquences qui répondent à la requête, dans un ordre logique, avec des discours de liaisons bien ordonnés ».

        • [^] # Re: Bonne question

          Posté par . Évalué à 2.

          C'est pour cela que ce langage contrôlé doit être pratiqué par quelqu'un qui sait ce qu'il fait,

          Donc il est clairement pas universel. Je pense au contraire qu'un langage contrôlé doit être praticable par tout un chacun, au prix d'éventuelles interactions (votre phrase porte à confusion reformulez, 'il' est ambigüe dans cette phrase). Je vois vraiment pas comment faire autrement.

          • [^] # Re: Bonne question

            Posté par (page perso) . Évalué à 3.

            Je suis d'accord, c'est clairement pas utilisable si tu ne connais pas les limites syntaxiques. C'est pour cela que j'aimerai, un jour ou j'aurai le temps ( avec l'air de "un jour mon prince viendraaa"), d'utiliser le Stanford NLP.

            L'idée serait d'utiliser la sortie produite pas le Stanford NLP et de le traduire en DRS, à la mode Attempto. Car pour avoir un peu potassé la littérature sur le sujet, le DRS d'Attempto, qui est nommé "Extended DRS" dans le papier dans lequel ils le présentent - que je retrouve plus (mais dont la dernière version est ici http://attempto.ifi.uzh.ch/site/pubs/papers/drs_report_06.pdf) - est beaucoup plus avancé que les DRS classique.

            Un DRS classique c'est

            John is happy.
            Happy(John).
            
            

            Attempto c'est plutôt :

            drs([A,B],
                      [
                        property(A,happy,pos)-1/3,
                        predicate(B,be,named('John'),A)-1/2
                      ]
            ).
            
            

            Bref, c'est beaucoup plus puissant.

            Le Stanford NLP lui, sort une analyse plus "linguistique", mais à coup de règles, c'est carrément jouable.

            nsubj(happy-3, John-1)
            cop(happy-3, is-2)
            root(ROOT-0, happy-3)

            L'avantage du Stanford NLP est qu'il n'est pas contrôlé, il est statistique, ce qui peut donner des mauvaises surprises, mais dans l'ensemble, il est capable de traiter toute forme de phrases.

            « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

            • [^] # Re: Bonne question

              Posté par (page perso) . Évalué à 2.

              Je voulais dire qu'il est carrément jouable de traduire la sortie Stanford NLP en DRS attempto.

              « Il n’y a pas de choix démocratiques contre les Traités européens » - Jean-Claude Junker

  • # cons trollés

    Posté par (page perso) . Évalué à 3.

    Demain, qui sait, une tribune avec certains posts visuellement identifables comme étant exprimés en langage naturel contrôlé, de manière à permettre un suivi des posts échangés avec des étrangers ne parlant pas notre merveilleuse langue ?

    Attention LiNuCe va faire exploser ton détecteur de français contrôlé.

    http://devnewton.bci.im

    • [^] # Re: cons trollés

      Posté par . Évalué à 3.

      J'avoue ne pas comprendre.

      La phrase que tu cites est grammaticalement correcte. Et, exceptionnellement de la part de ce contributeur, elle a un sens.

      J'aime pas quand je comprends pas les blagues :/

      • [^] # Re: cons trollés

        Posté par (page perso) . Évalué à 2. Dernière modification le 30/07/12 à 22:58.

        c'est référence à un détecteur de troll, je te laisse retrouver les références. Indice : il y a au moins un journal en parlant, de la haute technologie.

  • # Chat avec norloges et TALNC + conception/codage/documentation en LNC

    Posté par . Évalué à -10.

    [back-tracking] j'ai cité ce journal en ajoutant du contenu tout à fait en rapport.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.