Dictionnaire orthographique français inclus par défaut dans Firefox, Thunderbird et Seamonkey

Posté par . Modéré par Jaimé Ragnagna.
0
8
fév.
2008
Mozilla
Les produits Mozilla sont tous équipés d’un correcteur orthographique par défaut, qui est actuellement MySpell. Toutefois, pour bénéficier de la correction orthographique, il fallait jusqu'à présent installer soi-même le dictionnaire français.

Cette manipulation n’est désormais plus nécessaire, le dictionnaire étant dorénavant inclus par défaut, à partir des versions 2.0.0.12 de Firefox et Thunderbird, et peut-être 1.1.X de Seamonkey (si ce n'est pas possible, ce sera pour sa version 2.0). Cette amélioration a été rendue disponible grâce à la motivation de contributeurs externes au projet Mozilla : vazkor, Félix le chat, et Christophe Pythoud, l'auteur du dictionnaire orthographique français qui a accepté de changer sa licence, de GPL à la tri-licence GPL/LGPL/MPL, permettant alors son inclusion dans les logiciels Mozilla. Pour en savoir plus, consultez l'article détaillé publié sur geckozone.

Ce changement de licence va également permettre à OpenOffice.org d'inclure le dictionnaire orthographique français dans sa version 2.4.

Le dictionnaire inclus par défaut est un dictionnaire comprenant l'orthographe classique et version 1990. Si vous ne souhaitez avoir qu'une des orthographes, il suffit d'installer manuellement un des dictionnaires proposés sur http://dico.savant.free.fr/

A noter que Myspell, le correcteur orthographique, sera remplacé par Hunspell dans leurs prochaines versions majeures : 3.X pour Firefox et Thunderbird, et 2.X pour Seamonkey

La version 2.0.0.12 de Firefox a été publiée cette nuit, la mise à jour automatique se fera dans les 24 à 48 heures, vous pouvez la déclencher manuellement via ? > Rechercher des mises à jour
  • # Changement de licence?

    Posté par (page perso) . Évalué à 0.

    Pourquoi il y avait besoin de changer de licence? Firefox n'est pas GPL aussi?
    • [^] # Re: Changement de licence?

      Posté par (page perso) . Évalué à 1.

      Autant pour moi, je viens de voir que non, Firefox est en licence MPL.
      Bon ben on va dire que c'est une bonne nouvelle! :)

      Sinon, deux autres questions:
      1. Qu'est-ce que Hunspel à de mieux que Myspell?
      2. A quand le correcteur grammatical?

      Merci!
      • [^] # Re: Changement de licence?

        Posté par . Évalué à 5.

        A deux questions, deux réponses :

        1. Le développement de Myspell est apparemment arrêté. Hunspell est basé sur Myspell et propose notamment une meilleure gestion des signes diacritiques (tous ces signes que l'on trouve au-dessous et au-dessous des caractères des langues slaves), et permet également de meilleures suggestions de correction (je n'ai pas les détails par contre).

        2. Vu le travail ardu que représente un dictionnaire orthographique, j'ai du mal à imaginer un dictionnaire grammatical avant un moment ... une extension pour OOo (LanguageTool) semble cependant creuser le chemin : http://www.languagetool.org/

        Si le sujet t'intéresse, tu trouveras certainements des pages intéressante, par exemple un bilan sur sa transposition au français :
        http://blogs.nuxeo.com/sections/blogs/agnes-souque/2007_07_1(...)
        • [^] # Re: Changement de licence?

          Posté par . Évalué à 10.

          1. Hunspell propose en effet de générer de meilleures suggestions par l'association de lettres. Par exemple:
          - on peut associer les voyelles affiliées : eéêèêë
          - on peut associer des combinaisons de lettres : ph/f, ss/s, ss/c, oe/œ, etc.

          On peut même remplacer des lemmes entiers. Exemple :
          Au barbarisme questionnable, Hunspell peut suggérer discutable.

          Hunspell par rapport à Myspell permet de créer un nombre presque infini de drapeaux (contrairement à Myspell qui est très limité de ce point de vue, c'est pourquoi le dico actuel est un tel bordel), et surtout on peut créer une arborescence de règles d'application d'affixes.
          Par exemple: avec le lemme aimer et le drapeau A1, on peut engendrer toute la conjugaison avec une cinquantaine de règles de suffixation. Et pour chacune des formes fléchies engendrées, on peut appliquer d'autres drapeaux, engendrant d'autres déclinaisons. Sur "aime", par exemple, on peut appliquer un drapeau J- de préfixation, qui va engendrer "j'aime". Sur "aimes", on peut par exemple appliquer un drapeau +T pour engendrer "aimes-tu", etc. On peut aussi combiner les effets et appliquer, par exemple, sur "aimais" les drapeaux L+ et +J qui engendreront "l'aimais" "aimais-je" "l'aimais-je".

          Hunspell gère aussi les combinaisons de lemmes (circumfix) pour l'allemand, le hongrois, etc.

          Hunspell permet aussi d'étiqueter grammaticalement les entrées (pas possible avec Myspell).

          etc.

          Doc de Hunspell:
          http://sourceforge.net/docman/display_doc.php?docid=29374&am(...)


          2. Je ne suis pas très informé de l'avancée du correcteur grammatical, mais ça avance, paraît-il. Si j'ai bien compris, le boulot fait concerne surtout l'écriture de règles pour détecter les erreurs et suggérer les bonnes corrections.

          Le dictionnaire grammatical n'est actuellement qu'une réécriture du dico de l'ABU (et il n'est pas tenu à jour).
          http://abu.cnam.fr/DICO/donner-dico-uncompress.html
          • [^] # Re: Changement de licence?

            Posté par (page perso) . Évalué à 1.

            C'est vrai que les propositions de correction de MySpell ne sont pas toujours bonne. Principalement lorsque l'on utilise des accents, il est complètement perdu... Si HunSpell corrige ce comportement, c'est une bonne avancée!
            J'ai vu aussi que HunSpell est en UTF-8 alors que MySpell non. Ca explique sûrement sa meilleur compatibilité avec les langues autres qu'anglophone.

            Pour le correcteur grammatical, je vais regarder ça de près! Ca m'intéresse pas mal de savoir comment ils s'y prennent!

            Merci pour toutes ces réponses!
      • [^] # Re: Changement de licence?

        Posté par . Évalué à 2.

        Présentation du correcteur grammatical Français Open Source (ds les conférence Linagora) par Agnes Souque Doctorante, Laboratoire Lidilem, Université Stendhal - Grenoble 3 :


        http://www.toolinux.com/news/communaute/solutions_linux_2008(...)
    • [^] # Re: Changement de licence?

      Posté par (page perso) . Évalué à 2.

      Non, Firefox est MPL/GPL/LGPL, un code seulement en GPL ne peut être inclus dans un tel logiciel.

      Voir le premier lien de l'article.
      • [^] # Re: Changement de licence?

        Posté par (page perso) . Évalué à 0.

        Histoire de compléter / préciser : une brique GPL pourrait très bien être intégrée, c'est juste que ça forcerait Mozilla à diffuser en pur GPL (au lieu de donner le choix entre LGPL, MPL et GPL), ce qu'ils ne veulent pas
        • [^] # Re: Changement de licence?

          Posté par (page perso) . Évalué à 1.

          Ce qui n'empêche les distributions de le faire dans iceweasel, icedove...

          Comme quoi, la diversité en gardant une mutualisation du code source peut aussi avoir du bon ;-)
    • [^] # Re: Changement de licence?

      Posté par . Évalué à 2.

      Je connais pas trop, mais si Mozilla firefox est distribué sous cette triple license, je pense qu'il faut que tous ses composants intégrés le soit également, d'où le passage d'une "simple" GPL à cette triple license.

      /glattering
    • [^] # Re: Changement de licence?

      Posté par . Évalué à 0.

      Oui c'est vrai, ça pourquoi changer de licence... et puis surtout pourquoi parler de licence, en fait?

      Il me semblait, jusqu'aujourd'hui, que la langue française faisait partie du domaine public, voire du patrimoine mondial, et que l'Académie Française, à l'origine du projet, mettait ses ressources à disposition librement et permettait à quiconque de les utiliser et de les redistribuer librement (avec un clause particulière de non-modification toutefois de façon à maintenir une certaine cohérence au projet au fil de son évolution... clause respectée par peu d'entre-nous, il faut le reconnaître)

      Décidément, le monde va beaucoup trop vite pour moi aujourd'hui, je n'arrive plus à suivre.

      J'espère que je n'ai utilisé aucun vocable propriétaire ou breveté, n'hésitez pas à m'en informer, j'avoue avoir la flemme de vérifier chaque mot dans mon dictionnaire, qui par ailleurs date de quelques années et n'est sûrement plus à jour en ce qui concerne les licences.
      • [^] # Re: Changement de licence?

        Posté par . Évalué à 1.

        Un dictionnaire, comme tout livre, article, nouvelle, essai,... est une oeuvre écrite dont les droits appartiennent à son auteur. Et cela, quelque soit la langue utilisée par l'auteur.
        Tout comme les droits sur ton commentaire t'appartiennent, et heureusement, tant que tu ne les a pas cédés à DPLF.
      • [^] # Re: Changement de licence?

        Posté par . Évalué à 5.

        Bonjour,

        Les "auteurs" du dictionnaire sont d'accord pour dire qu'une liste de mots, en effet, n'appartient à personne.

        Néanmoins, le système d'affixation qui permet d'engendrer les flexions (déclinaisons et conjugaisons) est bien une oeuvre de l'esprit, car ça n'existe pas tel quel dans le français. Il faut le créer et il y a plusieurs façons de faire (il y a des contraintes et des complications).

        De surcroît, étiqueter correctement les mots, ce n'est pas une mince affaire qui se fait en sifflotant, c'est un véritable travail parfois plus complexe qu'il n'y paraît (homonymies, élisions, orthographes variantes, orthographe réformée, etc.)

        Bref, ce ne sont pas les mots qui sont sous licence, mais le mécanisme qui génère un dictionnaire avec toutes les variantes (étiquetées ou non) ou bien le dictionnaire final étiqueté.

        Vous verrez d'ailleurs que tous les dicos sont soumis à licence. Par exemple, le lexique XML Morphalou:
        http://www.cnrtl.fr/lexiques/morphalou/

        Ceci dit, de mon point vue, j'estime quand même toutes ces contraintes de licence sont pénibles et vaines.
        • [^] # Re: Changement de licence?

          Posté par . Évalué à -1.

          Certaines personnes un peu grincheuses dans leur têtes, trouvent non pertinent le questionnement sur le sens des choses. J'ai donc été moinssé comme il se doit. J'avais une idée erronée du chemin vers la connaissance, J'ai retenu la leçon: lorsque l'on ne comprend pas, on se roule dans sa crasse ignorance et l'on se taît. Merci doctes amis didacticiens de m'avoir remis dans le droit chemin.

          Dans cette digne ligne morale pro-culturelle, Je fustige Vladislav et Auberon d'avoir jugé pertinent de tenter m'apporter quelques lumières à ce questionnement insensé. A cause de vous, je comprends presque pourquoi certains estiment qu'un dictionnaire doit être soumis à licence.

          Mais désolé c'est plus fort que moi:
          Auberon, je supposais bien que c'est le mécanisme qui est soumis à licence. Mais le mécanisme ne fait que gérer des données lexicales. Selon la vision que je pourrais me faire de ce type de programme, la seule partie variable est la base lexicale (polonais, turkmène voire vénusien) qui n'est une création de personne, mais simplement une suite d'informations séculaires saisies dans un format précis. Donc si un dictionnaire libre est inclus en anglais dans la version "officielle", ou "root", eh bien chaque pays inclus automatiquement le sien sans autre question que de savoir si oui où non la base existe : supedico.bin utilise la base superdico-en, superdico-fr, superdico-es etc.. selon disponibilité et paramêtrage utilisateur. Mais, au vu de cette dépêche et de ses commentaires, j'ai l'impression que nous parlons d'une programmation paléolithique en dur, et que chaque pays doit réécrire le code complet du dictionnaire.

          Enfin pour ce qui est de ma prose, Vladislav, elle fait partie du domaine public. Le jour où elle sera soumise à licence, je vous en informerai. Encore un principe qui m'échappe; à partir du moment où mes mots ne sortent pas directement de ma bouche ils sont soumis à licence. Ils sont pourtant, à la base, toujours issus de mon pauvre cerveau. Nous ne marchons plus sur la tête, nous courons! Soumettre à licence le moindre baragoin démontre que l'Homme n'a pas la moindre idée du seuil critique de la fatuité.

          Je digresse, je digresse, mais le sujet vaut bien ça.

          Amis poêtes, je rends l'antenne.
          • [^] # Re: Changement de licence?

            Posté par . Évalué à 2.

            Je n'ai ni moinssé ni jugé impertinent votre questionnement sur le sens des choses. En plus, je suis d'accord avec vous.

            Simplement, vous posez une question, alors je réponds. Comment suis-je censé savoir ce que vous savez ou ignorez?

            Détail : l'Académie ne met pas à disposition ses ressources si librement.
            http://linuxfr.org/comments/637370.html#637370
            • [^] # Re: Changement de licence?

              Posté par . Évalué à 2.

              Auberon, mon esprit facérieux et mes ironies, je m'en aperçois, rendent ma prose difficile à saisir parfois. Je ne te tenais rigueur de rien, bien au contraire, je te remerciais d'avoir pris le soin de répondre à mes interrogations avec Vladislav.

              Certes j'ai pris des raccourcis, car je sais que l'Académie ne mets pas son travail rédactionnel gratuitement à disposition. Mais l'orthographe des mots, puisqu'il s'agit de celà dans un correcteur orthographique n'est soumis à aucun droit.

              Creak, je comprends bien le principe oui. Et voici comment pour ma part je l'appliquerai techniquement:

              Le correcteur orthographique, superdico-bin: travail d'ingénierie soumis à licence
              Règles grammaticales de la langue, superdico-rules-fr: données culturelles endémiques gérées par le correcteur
              Mots et racines verbales et nominales, superdico-words-fr: idem

              Bref, tout ceci pour dire que soumettre à licence, même libre, ce qui ne relève ni de la création ni de l'ingénierie, mais uniquement de l'exploitation de l'existant me dépasse complètement. Même si vos lumières m'apportent la compréhension de ces mécanismes que je trouve profondément stupides. Ne fut-ce que par le temps précieux qu'ils font perdre à la création et à sa diffusion.
          • [^] # Re: Changement de licence?

            Posté par (page perso) . Évalué à 2.

            Toute oeuvre est, par défaut, sujette au copyright de son auteur. C'est alors à l'auteur de choisir ce qu'il veut en faire.

            Une exception: si les conditions d'utilisation (les 15 pages avec le bouton "Je suis d'accord" en bas) stipulent que tous les commentaires tombent directement dans le domaine public (ou autre) et que tu as validé ces conditions lorsque tu t'y es inscrit, alors ton droit de copie est automatiquement supprimé.

            Sinon, pour ce qui est du dictionnaire, la licence se base sur le mécanisme de création de règles et de détection d'erreur. Car un dico n'est pas qu'une liste de mots (ce serait bien trop lourd à gérer, c'est bien plus simple de dire que "aimer" est un verbe du 1er groupe plutôt que de lister toutes les conjugaisons du verbe). Il s'y ajoute donc tout le système de règles d'orthographe et de conjugaison.
            Enfin je pense que tu as compris le principe :)
            • [^] # Re: Changement de licence?

              Posté par (page perso) . Évalué à 3.

              si les conditions d'utilisation [snip] stipulent que tous les commentaires tombent directement dans le domaine public (ou autre)

              En France ce sera plutôt ou autre, une vraie clause domaine publique ne pouvant être exigée, vu que certains droits sont incessibles, d'où le recours à une licence permettant toute latitude en terme de distribution (dans les limites du droit français) pour aboutir à un contenu libre. Reformulé, c'est un peu ce que tu as dit d'ailleurs à relire ton commentaire :-)

              Pour ce qui est de la liste de mots, cela tombe sans doute sous le coup de la définition de base de données, défini par les lois informatique et liberté ; en tout cas, c'est ce qui est généralement utilisé pour protéger les dictionnaires. Dommage j'ai toujours un mal fou à retrouver les articles de loi sur legifrance concernant les articles de loi en tant que tel concernant les manipulation de ces fichiers :/

              Heureusement, il y a wikipedia http://fr.wikipedia.org/wiki/Loi_informatique_et_libert%C3%A(...)
              et le nouveau système mis en place par légifrance semble plus pratique que l'année dernière : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITE(...)
  • # Complément d'information de l'article + critique publication de dépêc

    Posté par . Évalué à 5.

    Complément d'information

    Juste pour préciser 2/3 points, étant donné que j'ai écrit cette dépêche en 15 minutes ce matin avant de partir au boulot :
    * Merci également aux contributeurs de http://dico.savant.free.fr/ que je n'ai pas cité dans mon premier paragraphe
    * Si vous utilisez déjà un dictionnaire orthographique français, il faut le désinstaller si vous voulez que le dictionnaire à présent inclus par défaut prenne la main.
    * Je suis également l'auteur de l'article sur geckozone, si je conseille d'aller là-bas c'est parce que je ne voulais pas faire un copié/collé ... sachant que j'ai un peu de mal avec Templeet en plus (cf ci-dessous).

    Critique de la rédaction de dépêche

    J'aime bien proposer des dépêches sur linuxfr sur les sujets qui me branchent, mais je n'aime pas la page de rédaction de dépêche :
    * je sais qu'il y a une syntaxe pour créer des liens wikipedia, mais comme j'écris rarement sur linuxfr je ne m'en rapelle pas, or elle n'est pas indiquée sur la page de rédaction (merci au modérateur qui m'a corrigé mes liens «spip»).
    * quand j'effectue une prévisualisation, je n'ai aucun retour chariot dans ma dépêche prévisualisé (mon texte, lui, reste tel quel). Ça n'aide pas à voir si l'on a bien découpé son texte.
    • [^] # Niet

      Posté par . Évalué à 1.

      * Si vous utilisez déjà un dictionnaire orthographique français, il faut le désinstaller si vous voulez que le dictionnaire à présent inclus par défaut prenne la main.

      j'ai desinstallé l'extension qui gérait le dico francais pour myspell, redemarré firefox, mais je n'ai plus acces a la correction orthographique francaise : seul le dictionnaire English/United States m'est proposé.

      ... un doute m'assaille ...
      est ce que cette nouveauté ne serait valable que sur la version française de firefox ?
      • [^] # Re: Niet

        Posté par (page perso) . Évalué à 3.

        Un peu dans le même genre, avec la VF de Firefox, j'ai désinstallé l'extension puis mis à jour Firefox. Ça marche bien, il a bien sûr fallu re-sélectionner la langue française au niveau du vérificateur d'orthographe.

        Par contre, je ne vois pas le dico français dans la liste des extensions (alors que je vois le dico en-US, et je suis presque certain qu'il fait partie de l'install par défaut de Firefox). La question, c'est comment le dico français sera mis à jour ultérieurement ?
        • [^] # Re: Niet

          Posté par . Évalué à 3.

          Autre chose que j'ai précisé dans l'article sur geckozone :

          Pour utiliser le dictionnaire inclus par défaut, vous devez désinstaller l’ancien via Outils -> Modules complémentaires et, lors du prochain redémarrage de votre logiciel le dictionnaire intégré sera utilisé par défaut.

          Il ne sera pas visible dans les modules complémentaires car ce n’en est pas un : il est désormais présent dans le logiciel et non en tant qu’extension dans votre profil.


          Il sera donc mis à jour ... lors des mises à jour du logiciel (Firefox, Thunderbird, etc.)
      • [^] # Installer manuellement un dictionnaire prévu pour OOo

        Posté par . Évalué à 2.

        ... un doute m'assaille ...
        est ce que cette nouveauté ne serait valable que sur la version française de firefox ?


        Tout à fait : chaque version localisée de Firefox contient le dictionnaire orthographique dans la langue en question, lorsque celui-ci existe et est sous la tri-licence MPL/GPL/LGPL.

        Imaginez si tous les dictionnaires étaient inclus ... la majeure partie du poids de Firefox serait alors les dictionnaires.

        Si vous souhaitez utiliser la version anglaise de Firefox, vous pouvez installer manuellement un des dictionnaire à jour sur http://dico.savant.free.fr/ : choisissez MySpell, puis la version du dictionnaire qui vous intéresse. Comme ils sont prévus pour OOo la procédure n'est pas très intuitive :

        1/ Extraire l'archive (fr_FR.aff et fr_FR.dic) dans le sous-répertoire components/myspell/ du répertoire où vous avez installé Thunderbird (où se trouvent déjà en-US.aff et en-US.dic).
        2/ Accessoire : renommer ces fichiers en fr-FR.aff et fr-FR.dic (conventions de nommage différentes chez OOo et Mozilla semble-t-il)
    • [^] # Re: Complément d'information de l'article + critique publication de dé

      Posté par (page perso) . Évalué à 4.

      * quand j'effectue une prévisualisation, je n'ai aucun retour chariot dans ma dépêche prévisualisé (mon texte, lui, reste tel quel). Ça n'aide pas à voir si l'on a bien découpé son texte.

      oui, c'est un bug connu https://linuxfr.org/tracker/744.html (c'est très pénible en relecture quand ceux bien intentionnés qui écrivent une dépêche s'embêtent à rajouter des balises <p> de partout /o\).

      Le source est disponible pour ceux qui ont le courage de mettre le nez dedans ou qui sont tout simplement intéressés, voir http://wiki.eagle-usb.org/wakka.php?wiki=SuggestionsLecteurL(...) vers le bas.
  • # Bloated

    Posté par . Évalué à 10.

    Donc si je comprends bien, maintenant on va avoir un dictionnaire français dans Mozilla Firefox, un dans OpenOffice.org, aspell si on a décidé d'avoir la correction dans xchat, myspell si on a abiword...


    Pourquoi ne pas simplement utiliser les dépendances ? Est ce que chaque logiciel va embarquer sa propre libc également ?


    Je trouve que c'est bien dommage. Surtout au moment où on voit se développer de plus en plus des offres UMPC ou PDA/Smartphones.


    Est ce une dérive windowsienne des produits grand public qui doivent s'adapter à un environnement qui n'est pas prévu pour gérer les dépendances correctement ? Va-t-on s'orienter vers des packages à moitité statiques comme sous Mac ?

    Ce n'est pas un troll, je m'interroge sérieusement. (commentaire posté depuis iceweasel/firefox 2.0.0.10, possédant un myspell français installé par add-on, sur une debian avec myspell, aspell et dictionnaries-common d'installés sur le système).
    • [^] # Re: Bloated

      Posté par (page perso) . Évalué à 5.

      AMHA, c'est le travail de la distribution de faire en sorte que ce soit mutualisé.

      Il y a un projet Fedora pour ça :
      http://fedoraproject.org/wiki/Releases/FeatureDictionary

      Mandriva travaille aussi sur le sujet (mais de façon moins formelle a priori), exemple :
      http://qa.mandriva.com/show_bug.cgi?id=32935
      • [^] # Re: Bloated

        Posté par . Évalué à 8.

        Merci pour le lien, je plusse¹ avec enthousiasme :)

        Content de voir que des personnes se sont déjà intéressés au problème. Cependant ce qui m'ennuie, c'est que ce n'est pas tellement mutualisé. Si toutes les distribs doivent faire ce boulot de suppression/ajout/clean c'est une perte d'énergie.
        Si toutes ne le font pas, soit il faut qu'elles reprennent le travail d'une autre distrib et l'adapter (ce qui demande quand même un peu de boulot), soit il faut se contenter de la solution bloated.

        Autant que je sache en temps normal, il suffit de passer une option de compilation et le logiciel se charge de chercher s'il trouve les dépendances dans le PATH des librairies. Ici, on voit bien que les packageurs ont une étape en plus, celui de retirer quelque chose qui est à l'intérieur de OOo par exemple (split out hunspell from OpenOffice.org )

        Enfin c'est déjà mieux que rien, merci aux devs fedora pour le coup ;)


        ¹ Oui je sais on dit pertinnente maintenant, mais c'est plus joli. Et puis aucun des deux n'est dans hunspell ;)
        • [^] # Re: Bloated

          Posté par (page perso) . Évalué à 4.

          >Merci pour le lien, je plusse¹ avec enthousiasme :)*

          Le verbe "plusser", bien que finissant en "er", est un verbe du troisième groupe (comme "aller"). Il se conjugue en

          je plussois
          tu plussois
          il plussoit
          nous plussons
          vous plussez
          ils plussoient


          Merci de respecter la langue française.
    • [^] # Re: Bloated

      Posté par . Évalué à 2.

      D'expérience la plus part des distro sont marche a peut prés correctement avec aspell, Myspell pour les meilleurs mais généralement qu'en anglais. Hors comme il l'a été dit plus haut Myspell est loin d'être la panacée pour le français ( j'ai tapé de énormité à cause de ses suggestions farfelue ). Le support linguistique est en général pas génial a ce niveau quelque soit la distrib.

      Donc on peut voir cela comme une approche pragmatique de la par de la Mozilla fondation, qui plus ait on ne peut que se réjouir qu'un dictionnaire de qualité soit maintenue et développé pour la langue française.
    • [^] # Re: Bloated

      Posté par . Évalué à 3.

      Il me semble avoir entendu parler d'un projet de fedora pour "standardiser" tout ça non ?

      Est ce une dérive windowsienne des produits grand public

      C'est surtout qu'il n'y a pas de 'standard' ni d'outil qui kill tout, ni même d'interface de programmation standardisée pour l'utilisation de ces outils, que leur intégration "à toute les sauces" dans les logiciels n'a pas été pensée, que ce n'est pas forcément intégré dans Gtk ou Qt, etc.

      Le système de paquet n'a pas grand chose à faire là dedans.
      • [^] # Re: Bloated

        Posté par (page perso) . Évalué à 4.

        Pour KDE, peut-être que Sonnet apportera un peu de standard. C'est une bibliothèque de fonctions pour KDE dédiée à la correction orthographique et peut-être un jour la correction grammaticale.
  • # debian

    Posté par . Évalué à 5.

    Toutefois, pour bénéficier de la correction orthographique, il fallait jusqu'à présent installer soi-même le dictionnaire français.
    Sous debian, ca a toujours fait automatiquement...
    Et même sur seamonkey...
    • [^] # Re: debian

      Posté par . Évalué à 4.

      Tu veux dire IceApe...
      ~~~>[]
  • # Historique du travail de Vazkor

    Posté par . Évalué à 2.

    Bonjour,

    Pour ceux que cela intéresse, Vazkor à donné des informations sur l'avancement de ses travaux et sur les difficultés rencontrées (en particulier avec l’imbroglio des licences), depuis le 11 nov 2006, sur ce fil de discussion :

    http://assiste.forum.free.fr/viewtopic.php?t=13797

    On y trouve même ses états d'âme (dont à propos du cadeau de la communauté pour son immense travail de ré-écriture du dictionnaire) et des notes techniques (ligatures, règles d'affixes etc. ...).

    Cordialement
  • # Ligatures.. et scissions

    Posté par . Évalué à 6.

    Cette mise à jour est une excellente nouvelle, bien entendu. Sans parler du superbe changement de licence (quoiqu'une licence plus permissive, type MIT, aurait permis l'intégration dans d'autres logiciels importants, comme Vim, certains logiciels de messagerie instantanée, etc.).

    Mais à fouiller un peu les liens indiqués dans la dépêche et surtout des les commentaires (le lien sur le forum assiste est très instructif : http://assiste.forum.free.fr/viewtopic.php?t=13797 ...), j'en tire une impression de malaise ou pour le moins de relative anarchie. Il semblerait que l'unification des efforts isolés et la prise en compte commune des divers besoins et améliorations subséquentes dans une démarche fédératrice ne soit pas encore à l'ordre du jour.

    Pour ce que j'en ai compris - corrigez-moi si je me trompe - ce travail de mise à jour et correction des dicos a été initié par l'énorme travail de Vazkor. Il semblerait qu'ultérieurement, des contributeurs d'OOo (les personnes autour du site Dicollecte / http://dico.savant.free.fr ) aient repris ce travail à un instant donné (dictionnaires de Vazkor, version d'août 2007 - ils ne semblent pas avoir repris ses travaux ultérieurs, bizarrement), l'aient amputé de nombreux apports (enlevé tout les mots avec ligatures (œ, æ) parce que non supporté par OOo sur certaines vieilles plateformes¹, enlevé ses apports intéressants relatifs au filtrage de mots trompeurs comme « détaller » (très rare) vs. « détaler », etc.), mais aient ajouté d'autres apports intéressants (nouveaux mots importants oubliés, quelques corrections, prénoms français, noms des communes de France de plus de 20 000 habitants, ...). Ils ont aussi noyauté les contributeurs aux dictionnaires divers, et proposent une interface intéressante pour soumettre des suggestions. Pour ce que j'en ai compris, c'est leur version qui est intégrée dans les projets OOo (logique) et Mozilla (Vazkor semble trop peut habitué aux mœurs (mot souligné en rouge !) du LL et trop peut anglophone pour défendre sa version, face à celle de Dicollecte, pour l'intégration dans FF).

    En conséquence il semblerait qu'on se retrouve avec des scissions, des forks, des versions différentes des dictionnaires. Parfois pour des raisons techniques louables compréhensibles, voir inévitables, mais ça ne clarifie pas les choses. Il semble qu'on ai des dictionnaires français :
    - Scindés en versions plus complète (dicos OOo/Dicollecte : prénoms français, grandes villes de France) ou plus correcte (dicos Vazkor : support des ligatures, nombreuses corrections entre août 2007 et février 2008 non reprises par l'équipe OOo/Dicollecte).
    - Scindés en versions « orthographe classique » et « orthographe réformée 1990 » (mais Dicollecte fournis une version fusionnée)
    - Scindés en versions Myspell et Hunspell.
    - Scindés en versions intégrées dans Firefox/TB et versions intégrées dans OOo (visiblement à peut près similaires)
    Espérons que ça se tasse avec le temps (probable : unification atour des dicos Hunspell, fusion des dicos classique+réformée, maintenance par l'équipe Dicollecte seule, ...).

    Si j'ai bien compris ce qui se passe, je trouve en particulier fort dommage qu'on se tape partout (sans FF, TB et OOo) un dictionnaire ne supportant pas les ligatures² (comment écrivez-vous « œcuménique », « Lætitia », « et cætera » ? Firefox me souligne les mots en rouge et ne propose pas de correction) à cause d'un bug d'OOo sur certaines plateformes. Dommage aussi que le travail de Vazkor entre août 2007 et fin janvier 2008 soit passé à la trappe, et que Vazkor, usé de ce fait, ait décidé d'abandonner son travail³, il était le plus compétent et le plus bosseur (avec Christophe Pythoud, qui a aussi abandonné il y a 8 ans)...

    Au rayon des imperfections techniques, il semblerait aussi que les mots composés (avec un trait d'union, quoi) ne soient pas supportés (au moins dans les versions Myspell des dicos) ; l'apostrophes courbe (typographiquement correcte : ´ au lieu de ') non plus. Et la nouvelle licence est bien mieux (permet l'intégration dans OOo, FF et TB) mais ne permet pas l'intégration dans Vim & al.

    ¹ Du moins, c'est ce qui est expliqué en bas de cette page : http://assiste.forum.free.fr/viewtopic.php?t=13797&postd(...) . Est-ce co
    rrect ? Ou s'agit-il d'un bug de Myspell et d'Hunspell ? Pourtant Vazkor semble avoir réussi à produire un dico avec ligature qui fonctionne sous FF et OOo : http://assiste.forum.free.fr/viewtopic.php?p=107681#107681
    ² Cf. par exemple ici la motivation du rejet du mot « nœthérienne » : http://dico.savant.free.fr/proposition.php?id=513
    ³ Voir par exemple son annonce sur son site : http://perso.latribu.com/rocky2/mydico.html . Il continue néanmoins son excellent travail de correction des art
    icles de Wikipédia (cf. http://fr.wikipedia.org/wiki/Special:Contributions/Vazkor ).

    Voila. Si quelqu'un en sait un peu plus sur les problèmes évoqués et les possibilités de résolution, ce serait chouette de nous en parler.
    • [^] # Re: Ligatures.. et scissions

      Posté par . Évalué à 5.

      Bonjour,

      Certaines de vos affirmations sont tout simplement fausses.
      Les ligatures sont supportées par les dictionnaires de Dicollecte (ils sont peut-être même plus complets que celui de Vazkor sur ce point, il faudrait vérifier). Merci de télécharger un des dicos du site et lisez le README complet (le changelog est inclus dedans).

      nœthérienne vient de Noether, un nom allemand (sans ligature).
      http://www.universalis.fr/encyclopedie/T624464/NOETHER_M.htm
      Vous pouvez néanmoins demander la réévaluation de la proposition si vous le jugez nécessaire.

      Le travail de Vazkor n'est pas passé à la trappe. Pourquoi le voudrais-je d'ailleurs?
      Pour les divergences sur le dico, voir ici:
      http://www.forum-openoffice.org/forum/sutra49605.html#49605

      Plus de détails ici :
      http://fr.openoffice.org/servlets/ReadMsg?list=dic&msgNo(...)

      Pour les mots composés, voici une explication :
      http://www.geckozone.org/forum/viewtopic.php?p=430741#430741

      Les dicos que j'ai "créés" étaient effectivement prévus pour OOo. Des gens de Mozilla s'y sont ensuite intéressés de leur côté, mais je ne leur ai rien demandé. Ils ont choisi seuls. On peut effectivement se demander si le dico de Vazkor n'est pas plus adapté pour FF, mais ça ne dépend pas de moi. Et puis il est facile de changer les fichiers pour ceux qui le veulent.

      Pour la question de la licence, il faudra attendre que j'ai fini la réécriture totale du fichier des affixes et la recomposition à zéro du dico. J'envisage effectivement une licence MIT ou BSD ou une autre de mon cru. Ce n'est pas trop mon souci actuel.
      • [^] # Re: Ligatures.. et scissions

        Posté par . Évalué à 4.

        Merci pour vos précisions et corrections.

        Ce ne sont pas vraiment mes affirmations, mais, comme j'ai indiqué (et avec des réserves et demandes de confirmations) celles que j'ai trouvé sur le forum indiqué plus haut (que j'ai trop rapidement corroboré avec le fait que mon FF souligne encore les ligatures (mais il s'agit d'un 2.0.11, il faut que je teste la mise à jour)), et sur le site de Vazkor ( http://perso.latribu.com/rocky2/mydico.html où l'on voit qu'il a fait des mises à jour en janvier et indique que la version intégrée dans FF date d'août 2007 ; le README dans les dictionnaires en téléchargement sur votre site parle de septembre 2007).
        Comme quoi, une bonne explication détaillée évite bien des confusions (merci de l'avoir fait ici). Peut-être que ces clarifications méritent de figurer dans votre FAQ (parce que c'est bien la première chose que j'ai lu pour essayer de comprendre où allaient les divers forks, qui fait - et a fait - quoi, ce qui était repris ou rejeté parmi les améliorations des autres dictionnaires, et pourquoi, etc.)
        • [^] # Re: Ligatures.. et scissions

          Posté par . Évalué à 1.

          Ça fait plus de 3 mois que je planche sur la réécriture du dictionnaire et toutes ces dissensions m'ennuient plus qu'autre chose. C'est une perte de temps. Je passe peu de temps sur les forums, et je ne surveille pas ce qui se dit ici ou là. [En regardant les stats, j'ai juste vu un afflux massif de visiteurs depuis Linuxfr et Geckozone dernièrement ;)]

          Je complèterai donc la FAQ si j'ai le temps, car ça va être long d'expliquer tout correctement en détail (sans fâcher personne), et je ne suis pas sûr que ça intéresse tant de monde.
    • [^] # Re: Ligatures.. et scissions

      Posté par . Évalué à 2.

      J'oubliais de dire que Vazkor avait annoncé d'arrêter de gérer les dicos dès Juillet 2007, si ma mémoire ne me fait pas défaut, c'est-à-dire à peu près au moment où son travail a commencé à être vraiment connu et où j'en ai entendu parler.
      Je n'y peux rien s'il décide de poursuivre son oeuvre de son côté. Je ne vois même pas de raison de lui en tenir rigueur. Chacun est libre!
      Mon site présente des défauts (pas de saisie de masse), et je présume qu'il n'aime pas l'idée de suivre une politique qui n'est pas la sienne (et ça se comprend aussi très bien).

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.