Wiktionary et Wikisource : les autres projets de la fondation Wikimedia

Posté par  . Modéré par Jaimé Ragnagna.
0
13
fév.
2006
Internet
Parmi les autres projets de la fondation Wikimedia, Wiktionnaire (Wiktionary en anglais) et Wikisource ont récemment beaucoup progressé.

Wiktionnaire est un projet de dictionnaire libre multilingue, c'est-à-dire qu'il contient, pour la partie francophone, des mots français avec leurs définitions et leurs traductions, et des mots dans d'autres langues avec des traductions en français. Il vient récemment de dépasser en nombre de mots le projet en anglais. Il contient actuellement plus de 125 000 mots. C'est donc déjà le dictionnaire libre le plus important. Le dictionnaire de l'Académie française de 1932-1935 qui vient de tomber dans le domaine public est en cours d'incorporation (33 000 articles).

Wikisource est un projet de bibliothèque libre. Le projet contient des oeuvres intégrales dans le domaine public ou sous licence libre. Il a été divisé en sous-domaines par langues en décembre dernier, ce qui a demandé un énorme travail de transfert, copie, vérification et suppression. Cela a créé une nouvelle dynamique au projet qui connaît depuis une rapide expansion. Il contient plusieurs milliers de livres répartis en plus de 12 500 articles. La mise en page des ouvrages est maintenant facilitée avec l'utilisation d'un bot en Python.

Chacun de ces projets possède aussi un canal IRC, respectivement #wiktionary-fr et #wikisource sur les serveurs de Freenode (irc.freenode.net).

Wikisource cherche à se doter d'un nouveau logo. Avis aux amateurs...

Aller plus loin

  • # Manque de Contribution ?

    Posté par  . Évalué à 3.

    Il y a régulièrement de la "pub" pour les projets autres que wikibooks/wikipedia de wikimedia. Il sont si délaissé que cela ?

    Je ne veux pas critiquer le fait qu'une news sort sur ceux là, je demande réellement si ils manquent assez de contribution pour être en danger ?
  • # ....vient de tomber dans le domaine public...

    Posté par  . Évalué à 9.

    Euh, à la lecture de ces lignes, j'ai un peu tendance à m'etouffer. Si j'ai bien compris, un dictionnaire payé par nos impôts n'est pas immédiatement dans le domaine plublique ? Qui sont les ayants droits ?

    Je dois être naïf, mais j'aurais aimé croire que financement publique implique libre accès au public... J'ai dû réver.
    • [^] # Re: ....vient de tomber dans le domaine public...

      Posté par  (site web personnel) . Évalué à 10.

      Des dictionnaires et du libre :

      - vu le 4 février sur la liste interop, un courriel envoyé à l'éditeur du
      « Trésor de la Langue Française informatisé » qui fournit un CD avec juste un TLFi-setup.exe dessus, et qui souhaite une version pour GNU/linux.

      - DafOOo (Dictionnaire de l'Académie Française pour OpenOffice.org)
      Cet outil que vous n'aurez pas...
      http://oooconv.free.fr/dafooo/dafooo_fr.html

      - voir les définitions fausses de logiciel libre dans les Larousse et
      Hachette
      http://wiki.april.org/Terminologie

      - un serveur de correction ortho côté SPIP
      http://lab.spip.net/spikini/?wiki=CorrecteurOrthographique

      - sans oublier les travaux en cours pour obtenir une définition de LL par la DGLF (http://www.culture.gouv.fr/culture/dglf/garde.htm)
      Cf http://lists.gnu.org/archive/html/fsfe-france/2005-11/msg000(...)

      Voir aussi « Le statut des données et contenus générés par l'administration » et « L'accès aux décisions des juridictions administratives. »
      http://guerby.org/blog/index.php/2006/02/04/2-le-statut-des-(...)
      http://droitadministratif.blogspirit.com/archive/2006/02/02/(...)
      • [^] # Re: ....vient de tomber dans le domaine public...

        Posté par  (site web personnel) . Évalué à 3.

        > - vu le 4 février sur la liste interop, un courriel envoyé à l'éditeur du
        > « Trésor de la Langue Française informatisé » qui fournit un CD avec
        > juste un TLFi-setup.exe dessus, et qui souhaite une version pour
        > GNU/linux.

        Avec si je me rappelle bien une réponse du type "nous y avons réfléchi et nous avons décidé de refuser l'utilisation dans tout projet dont nous n'avons pas directement le contrôle, qu'il soit légitime ou non".
        • [^] # Re: ....vient de tomber dans le domaine public...

          Posté par  (site web personnel) . Évalué à 5.

          Voir mon premier lien, à la date de sept. 2004.

          « Monsieur,

          J'ai le regret de devoir vous informer qu'après s'être concertés, l'ATILF et l'Académie se sont arrétées au principe de ne pas autoriser la reprise de toute ou partie du travail effectué sur la neuvième édition du Dictionnaire de l'Académie française (nomenclature, définitions, balisage...) dans un projet, si intéressant et désintéressé fût-il, dont elles n'auraient pas le contrôle.
          En revanche, ainsi que je vous l'avais indiqué, les listes établies par la Commission générale de terminologie et de néologie sont libres de tous droits.

          Veuillez agréer, Monsieur, mes salutations distinguées. »
    • [^] # Re: ....vient de tomber dans le domaine public...

      Posté par  . Évalué à 8.

      Eh non !... La plupart des documents qui sont produits avec nos impôts ne sont pas dans le domaine public. :o(

      Dans le cas de l'Académie française, c'est même pire que ça, car l'Académie prétendait (prétend ?) détenir les droits sur ses dictionnaires ad vitam eternam, car évidemment ce sont des « Immortels »... Prétention qui n'a bien sûr aucun fondement dans le domaine du droit d'auteur. Et si le droit le permettait, on copierait un dictionnaire plus récent que celui de 1932.

      Par ailleurs, une campagne pour que les productions de l'État soient dans le domaine public (comme aux États-Unis) serait une bonne chose... Avis aux amateurs.
      • [^] # Re: ....vient de tomber dans le domaine public...

        Posté par  (site web personnel) . Évalué à 3.

        La plupart des documents qui sont produits avec nos impôts ne sont pas dans le domaine public.

        Il faut tout de même se rappeler que le domaine public n'est pas réservé aux contribuables français.

        A titre perso il ne me semble pas totalement déraisonnable que l'état ne diffuse pas l'ensemble de ses productions dans le domaine public.

        En particulier les données géographiques qui sont une monaie d'échange avec les autres institut géographiques mondiaux.

        Pour ce qui est du cas du dico de l'académie, il pourrait effectivement être librement utilisable.

        D'une façon générale on est au début de la dématérialisation réelle de l'information. Il est logique que tous les reflexes ne soient pas encore acquis.
        • [^] # Re: ....vient de tomber dans le domaine public...

          Posté par  . Évalué à 6.

          En particulier les données géographiques qui sont une monaie d'échange avec les autres institut géographiques mondiaux.


          Et pourtant, la mission topographique de la NASA qui donne les élévation d'une bonne partie du globe avec une résolution de 1" (!) est dans le domaine public par exemple : http://srtm.usgs.gov/ . Ça permet de faire des cartes sympa pour Wikipédia en combinant avec GMT par exemple (http://gmt.soest.hawaii.edu/ ).
          • [^] # Re: ....vient de tomber dans le domaine public...

            Posté par  (site web personnel) . Évalué à 2.

            Sans parler du CIA World Factbook qui est dans le domaine public aussi.
            http://www.cia.gov/cia/publications/factbook/

            pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

            • [^] # Re: ....vient de tomber dans le domaine public...

              Posté par  (site web personnel) . Évalué à 2.

              Attention, je ne prétend pas qu'un choix ou l'autre va de soit.

              Il me semble juste qu'il y a des arguments valables pour justifier les deux points de vues.

              D'ailleurs, je pense que les US ne sont pas nécessairement d'une transparence absolue. Et pourtant ils ont effectivement fait le choix de placer les productions du gouvernement dans le domaine public.

              Sans parler du CIA World Factbook

              Sans tomber dans la paranoia, je serais un peu réservé quand à l'utilisation aveugle des données de ce "factbook". Car il présente les informations avec un angle pas tout a fait neutre.
              • [^] # Re: ....vient de tomber dans le domaine public...

                Posté par  . Évalué à 8.

                Sans tomber dans la paranoia, je serais un peu réservé quand à l'utilisation aveugle des données de ce "factbook". Car il présente les informations avec un angle pas tout a fait neutre.


                Et c'est très exactement le problème. Comme les données émises par le gouvernement français (par exemple), ne sont pas dans le domaine public, on ne peut pas les utiliser. On est alors obligés d'utiliser les données librement utilisables et il nous reste guère que le CIA world factbook. Il y a donc un effet de bord pas forcément très sain que c'est le point de vue des USA qui est diffusé tout simplement parce qu'ils ont une politique très permissive au niveau des copyrights alors que le gouvernement français est bien plus strict et par là même limite la diffusion de son point de vue ...
                • [^] # Re: ....vient de tomber dans le domaine public...

                  Posté par  . Évalué à -1.

                  Attention, gouv US et gouv français n'ont pas les mêmes moyens...
                  Les uns peuvent se permettre de *donner* des résultats qui ont finalement peu de valeur pour eux, alors que c'est plus difficile pour les autres, puisqu'ils en vivent ... (GIN par exemple)
                  Dire que l'Europe devrait financer de tels projets d'accord, mais la France malgré sa place dans le monde n'a pas les moyens.

                  Pour ce qui est de l'usage des dictionnaires, on peut comprendre que l'Académie ne souhaite pas voir ses données diffusées n'importe comment avec le risque qu'elles soient diffusées altérées. Mais on ne peut pas dire non plus qu'ils aient montré d'empressement ou qu'ils aient fait des efforts pour rendre la langue française accessible, ce qui devrait être une priorité s'ils souhaitent continuer à sièger encore quelques siècles...
                  • [^] # Re: ....vient de tomber dans le domaine public...

                    Posté par  (site web personnel) . Évalué à 8.

                    > Pour ce qui est de l'usage des dictionnaires, on peut comprendre que
                    > l'Académie ne souhaite pas voir ses données diffusées n'importe
                    > comment avec le risque qu'elles soient diffusées altérées.

                    Ca c'est un faux prétexte. S'ils ne veulent pas d'altération ils peuvent mettre une licence correspondante. Ca ne les empêche pas de diffuser.

                    Certes, il y aura des méchants pour ne pas respecter la licence, mais ces mêmes méchants peuvent déjà ne pas respecter l'interdiction d'utilisation et aller piller le dico. Autoriser la diffusion et l'utilisation n'ouvrira pas plus de portes de ce coté là.

                    Et puis même si quelqu'un change des définitions pour en mettre d'autres qui lui paraissent mieux adaptées, qu'est-ce que ça change ?
                    Les gens peuvent déjà mettre les définitions qu'ils veulent derrière les mots (ils y sont même obligés vu qu'ils n'ont pas le droit de reprendre celles de l'académie).
                    On aura toujours une référence accessible pour qui veut s'assurer de la source. On peut aussi demander dans la licence que les oeuvres modifiées soient explicitement marquées comme telles pour lever la possible ambiguité.

                    Bref, c'est un faux prétexte, vraiment. D'ailleurs vis à vis du dico de l'académie, le meilleur moyen pour que des gens ne commencent pas à modifier les définitions pour faire dire ce qu'ils veulent aux mots, c'est justement de favoriser la diffusion, pas de la restreindre.

                    Les lois c'est grave si quelqu'un les modifie. Est-ce qu'on refuse pour autant de les diffuser sous prétexte de limiter les altérations ?
                    Est-ce qu'on voit beaucoup de fausses lois présentées comme des vraies pour autant ?


                    Qu'on érige une référence sur la langue sans autoriser la diffuser librement c'est à la base quelque chose que je ne comprend pas.
                    • [^] # Re: ....vient de tomber dans le domaine public...

                      Posté par  . Évalué à 0.

                      > Pour ce qui est de l'usage des dictionnaires, on peut comprendre que
                      > l'Académie ne souhaite pas voir ses données diffusées n'importe
                      > comment avec le risque qu'elles soient diffusées altérées.

                      Ca c'est un faux prétexte.


                      Ce n'est pas un prétexte, c'est une raison. Est-ce une bonne raison? Non, et mon message ne disait pas le contraire.

                      Je soulignais 2 aspects:

                      Attention, gouv US et gouv français n'ont pas les mêmes moyens...
                      Les uns peuvent se permettre de *donner* des résultats qui ont finalement peu de valeur pour eux, alors que c'est plus difficile pour les autres, puisqu'ils en vivent ... (GIN par exemple)
                      Dire que l'Europe devrait financer de tels projets d'accord, mais la France malgré sa place dans le monde n'a pas les moyens.


                      On ne peut pas demander à la France, malgré sa place parmis les autres nations, de se comporter comme si elle était la première puissance économique. (ah ben oui, on travaille pas pour du beurre, et si on a tout donné le peu qu'on a...)
                      Et les finances publiques ne sont pas un pot commun où chacun peut réclamer son "I want my money back", il faut un intérêt commun qu'est sensé expliquer que mettre des données en accès public, c'est le donner à tous, y compris à ceux qu'on pas payé (paradoxe de ceux qui en veulent pour leur argent), et pour ça il y a les associations ou les fondations.

                      Pour ce qui est de l'usage des dictionnaires, on peut comprendre que l'Académie ne souhaite pas voir ses données diffusées n'importe comment avec le risque qu'elles soient diffusées altérées. Mais on ne peut pas dire non plus qu'ils aient montré d'empressement ou qu'ils aient fait des efforts pour rendre la langue française accessible, ce qui devrait être une priorité s'ils souhaitent continuer à sièger encore quelques siècles...

                      Dans certains cas c'est la méconnaissance qui pousse les institutions à agir contre leur intérêt. C'est une explication, pas une justification.
                  • [^] # Re: ....vient de tomber dans le domaine public...

                    Posté par  . Évalué à 5.

                    en france si tu discute avec un moyen-fonctionnaire qui s'occupe d'un quelquonque domaine, ign, meteo france, academie francaise, musee du louvre, ina, etc...

                    tu remarque tres vite qu ils ont l'impression que leur travail leur appartient et qu il est hors de question de le donner, meme pas que cela leur traverse l'esprit de partager. A ma connaissance il n'y a que l'insee qui donne les informations et a chaque fois que je vais sur le site je suis surpris.
          • [^] # Re: ....vient de tomber dans le domaine public...

            Posté par  . Évalué à 1.

            "La plupart des documents qui sont produits avec nos impôts ne sont pas dans le domaine public."

            j'espere au moins qu'ils en tirent une rémunération, sinon c'est du pur gachi.
      • [^] # Re: ....vient de tomber dans le domaine public...

        Posté par  . Évalué à 4.

        Précisons pour le 8e dictionnaire de l'Académie : tombé entièrement dans le domaine public en tant qu'œuvre collective, soit 70 ans après l'année de publication du dernier tome. Le second tome fut publié en 1935, donc logiquement dans le domaine public en 2006.

        (Article L113-2, Article L113-5, Article L123-3 du code de la propriété intellectuelle si je ne m'abuse)

        S'il devait s'avérer que les dictionnaires de l'académie jouissent d'un droit particulier et moins restrictif pour leur emploi ça serait une bonne nouvelle.
    • [^] # Re: ....vient de tomber dans le domaine public...

      Posté par  . Évalué à 6.

      Et oui, bienvenue en France, le pays où il faut tout payer 2 fois. Aucun contenu produit par une administration n'est librement disponible : les données géographique de l'IGN, les statistiques de l'INSEE, les photos et les informations astronomiques du CNES, tout ça est soumis à droit d'auteur, et il faut généralement payer pour pouvoir l'utiliser (une deuxième fois, puisque ça a généralement été payé par l'impot).
      • [^] # Re: ....vient de tomber dans le domaine public...

        Posté par  . Évalué à 7.

        Et rappelez vous le scandale quand méteo-france voulait faire payer la consultation internet, et ils l'ont appliqué pour les prévisions à plus de 3 jours je crois
    • [^] # Re: ....vient de tomber dans le domaine public...

      Posté par  (site web personnel) . Évalué à 4.

      On a le même problème dans la recherche, ça me dégoute un peu de voir les articles que je publie aux frais de la recherche française revendus par un éditeur américain au prix exorbitant de 30¤ l'article...
      On a pas vraiment le choix, pour avoir une chance d'obtenir un poste (ou des promotions), il faut publier dans les journaux les plus prestigieux. La seule solution serait une décision politique imposant à la recherche publique de publier dans des journaux à accès libre. Si cette cause intéresse quelqu'un...
      • [^] # Re: ....vient de tomber dans le domaine public...

        Posté par  . Évalué à 9.

        Il existe aussi des journaux européens prestigieux (enfin dans mon domaine du moins). Mais lors de la publication on est obligés de céder tous nos droits (en théorie on n'a même plus le droit d'utiliser une figure qu'on a faite) au journal et les articles sont revendus à un tarif pas possible. À titre personnel je trouve ça scandaleux, ça limite la diffusion de la connaissance aux membres d'instituts pouvant se payer un accès. Et l'abonnement est bien évidemment fort cher. J'ai du mal à saisir d'ailleurs, leurs frais sont relativement limités, les chercheurs paient pour publier, les chercheurs paient pour accéder aux publications, et les rapporteurs ne touchent évidemment même pas un centime pour leur travail. Le problème est qu'effectivement, si je ne publie pas dans les revues prestigieuses, je n'ai aucune chance d'obtenir un poste un jour (déjà que la probabilité est initialement faible). On a affaire à un bel exemple de captivité qui n'a rien à envier à certains gros éditeurs de logiciels.

        Pour pallier ce problème un certain nombre de chercheurs mettent leurs articles sur arxiv (http://arxiv.org/ ) dès qu'il est accepté et aussi sur leur site personnel. C'est a priori toléré de faire ça.
        • [^] # Re: ....vient de tomber dans le domaine public...

          Posté par  . Évalué à 6.

          La technique usuelle est :
          - faire un rapport de recherche avec l'article qu'on souhaite soumettre ;
          - faire 2-3 modifications cosmétiques ;
          - soumettre.

          L'article soumis est un produit dérivé du rapport de recherche et l'éditeur n'a des droits que sur la version qu'on lui a soumise. Bien évidemment, si dans le processus de relecture, on corrige une erreur, on ne peut pas corriger l'erreur dans le rapport de recherche mais au moins, on garde les droits sur les figures et le contenu reste libre.
  • # Wiktionnaire et Wikitranslate

    Posté par  (site web personnel) . Évalué à 7.

    Le Wiktionnaire est se suffit il a reellement a lui meme ?
    Cela fait un bon nombre de fois que cherchant la traduction d un mot en anglais, je ne trouve pas mon compte en allant sur le Wiktionnaire ou bien Google Translate. Generalement mon choix se porte sur le dico francais anglais du CNRS ( http://dico.isc.cnrs.fr/fr/index_tr.html ). Pourquoi ? parce qu'il propose TOUS (ou presque) les sens du mot que je cherche.

    Un simple exemple avec un mot que nous aimons bien : libre
    le Wiktionnaire me propose : free (logique ;) )
    l autre dico lui me propose : available, broad, clear, disengaged, empty, free, free in one's behaviour, free off, open in one's behaviour, private and Roman Catholic, promiscuous, uninhibited, unrestricted

    Exactement comme le ferait un vrai dictionnaire de traduction francais-anglais. Voila pourquoi je pense que la partie "traduction" devrait etre séparée du Wiktionnaire et devenir une sorte de sous-projet. Je suis conscient que le boulot couvert par Wikimedia est pas mal segmenté, mais pour etre parfaitement efficace, un tel dictionnaire mériterai une contribution qui lui serait spécifique et une légere adaptation du moteur.
    • [^] # Re: Wiktionnaire et Wikitranslate

      Posté par  (site web personnel) . Évalué à 10.

      Je pense qu'une réflexion préalable sur la structure des dictionnaires serait intéressante car elle permettrait de gérer les relations entre les mots avec des bases de données.
      Il y a 5 ans (déjà) j'avais écrit : http://pjarillon.free.fr/eurolang/cetral-propos.fr.html et je pense que c'est toujours d'actualité.
    • [^] # Re: Wiktionnaire et Wikitranslate

      Posté par  . Évalué à 3.

      Cela fait un bon nombre de fois que cherchant la traduction d un mot en anglais, je ne trouve pas mon compte en allant sur le Wiktionnaire ou bien Google Translate. Generalement mon choix se porte sur le dico francais anglais du CNRS ( http://dico.isc.cnrs.fr/fr/index_tr.html ). Pourquoi ? parce qu'il propose TOUS (ou presque) les sens du mot que je cherche.

      Oui, mais les conditions d'utilisation ne sont pas les mêmes:

      "DROITS CONCEDES
      Sous réserve du respect des obligations qui vous sont imposées, le CNRS, l'Université Lyon 1 et l'Université de Caen vous concèdent le droit de consulter le DICTIONNAIRE, c'est-à-dire de visualiser, reproduire et imprimer des informations issues du DICTIONNAIRE, pour vos besoins propres et/ou à des fins de recherche uniquement. Pour toute autre utilisation, notamment à des fins commerciales, veuillez vous adresser à la société FIST S.A. - 135, boulevard Saint-Michel - 75005 PARIS (mail@fist.fr).
      Ce droit de consultation vous est concédé gratuitement sans limitation de durée.
      En aucun cas, les droits de propriété intellectuelle sur le DICTIONNAIRE ne vous sont cédés, ceux-ci demeurant la propriété exclusive du CNRS, de l'Université Lyon 1 et de l'Université de Caen.

      RESTRICTIONS
      Il est interdit de publier, diffuser, extraire et/ou réutiliser, de quelque manière que ce soit, le DICTIONNAIRE ou une partie substantielle de celui-ci, et plus généralement de porter atteinte de quelque façon que ce soit aux droits de reproduction et autres détenus par le CNRS, l'Université Lyon 1 et l'Université de Caen sur le DICTIONNAIRE. "
  • # j'en perds mon latin

    Posté par  (site web personnel) . Évalué à 1.

    j'ai du mal à m'y retrouver dans ce dictionnaire. y'a tous les mots de toutes les langues dans le dictionnaire français ? C'est vraiment étrange. Si quelqu'un pouvait m'expliquer...

    Axel
    • [^] # Re: j'en perds mon latin

      Posté par  . Évalué à 2.

      Oui, relire l'article. Wiktionnaire est à la fois un dictionnaire de définitions et un dictionnaire de traductions.
      • [^] # Re: j'en perds mon latin

        Posté par  (site web personnel) . Évalué à 0.

        non à partir d'un article, je peux avoir les traductions dans l'article et les traductions à partir des wikiliens sur les autres wiktionnaire...

        Est ce que ça ne fait pas double emploi ? y'a t'il une synchronisation entre les différents projets ?

        Axel
        • [^] # Re: j'en perds mon latin

          Posté par  . Évalué à 2.

          Les traductions ne sont pas bijectives, sauf pour les objets (et encore...) et quelques notions simples. En plus, en principe, il faut avoir un exemple et une explication en français d'un mot étranger.

          Exemple simple :

          le verbe "aller" aura une définition en français et la traduction dans plusieurs langues avec des exemples des différents sens du mot (dont "se déplacer", en anglais "to go") ;
          le verbe "to go" aura la définition et la traduction en français, avec des exemples, des différents sens du mot (dont "se déplacer", en français "aller").
          la page du projet anglophone aura une définition en anglais de ces mots.


          Finalement, il prévu de transférer les différents Wiktionnaires dans un nouveau logiciel conçu spécialement dans ce but, appelé WiktionaryZ ou Ultimate Wiktionary. Le code est encore en développement. Cf. http://meta.wikimedia.org/wiki/WiktionaryZ , http://wiktionaryz.blogspot.com/ , etc.
          • [^] # Re: j'en perds mon latin

            Posté par  (site web personnel) . Évalué à 2.

            Il existe un projet qui s'appelle Reta Vortaro, qui est un dictionnaire en ligne, un peu comme WP dans l'esprit, sauf que les contributions sont "validés" à la fin de la journée. Donc un peu plus restrictif, et les contributions doivent respecter une DTD assez bien foutu.

            Si on regarde l'exemple d'aller :

            http://www.uni-leipzig.de/esperanto/voko/revo/art/ir.html

            on voit tous les mots dérivés de cette racine. Les traductions se trouvent en bas.

            Ce que j'aime dans cette approche par DTD c'est la possibilité d'ajouter du "sens" dans ce qu'on met.

            Sur WP, c'est déjà le cas pour les catégories, les liens inter-langues. Mais ce serait bien de pouvoir spécifier certaines informations. Par exemple rajouter des mots clefs qui faciliterait la recherche. Et ça me semble encore plus indispensable pour un projet comme le wiktionnaire où il faudrait spécifier ce qui est la définition, les traductions, les exemples, les dérivés et l'ethymologie. Afin de pouvoir, après, faire des traitements automatiques (par exemple, on pourrait imaginer générer un dictionnaire papier d'ethymologie sans les traductions, ou alors un dictionnaire fr-it/it-fr sans la définition...)

            Axel
  • # Projet gutenberg ?

    Posté par  (site web personnel) . Évalué à 4.

    Pour wikisource, est-ce qu'il y a une coordination avec le projet gutenberg ?

    Par exemple vf : http://www.gutenberg.org/browse/languages/fr
    • [^] # Re: Projet gutenberg ?

      Posté par  . Évalué à 4.

      Les deux projets sont complémentaires. Gutenberg est principalement un projet anglophone, Wikisource est un projet très multilingue. Par exemple, Wikisource possède l'Iliade et l'Odyssée en grec et le Rig Veda en sanskrit. (Le projet de lancer un projet Gutenberg multilingue en Europe n'a pour l'instant pas abouti, cf. http://www.gutenberg.nl/ : un seul libre publié en deux ans d'existence). L'encodage de Gutenberg est US-ASCII ou ISO-8859-1. Celui de Wikisource est UTF-8. Enfin Gutenberg héberge des documents au format "texte" en une seul page, alors que Wikisource héberge des documents sur un Wiki (HTML) en les découpant par chapitre ou par poème pour faciliter la lecture. Cela permet aussi un bien meilleur référencement. Et Wikisource a l'ambition de proposer de nouvelles traductions sous licence libre de documents dans le domaine public. Voir aussi http://wikisource.org/wiki/Wikisource:Wikisource_and_Project(...)
      • [^] # Re: Projet gutenberg ?

        Posté par  . Évalué à 2.

        le projet gutenberg accepte des textes en toutes les langues, le seul problème est que l'interface du site est en anglais et que la plupart des contributeurs parlent anglais, notamment à http://www.pgdp.net qui est un site permettant de se partager le travail pour mettre des livres en ligne.
        Il peut cependant y avoir des projets dans toutes les langues sur PGDP (Project Gutenberg's Distributed Proofreaders).

        On peut aussi signaler http://dp.rastko.net/ qui est plus spécialisé dans les projets en grecs, cyrilliques... Il y a moins de contributeurs, mais cela fonctionne aussi.

        le projet gutenberg accepte des fichiers en UTF-8 et la grande majorité des livres uploadés possèdent une version HTML (souvent très bien foutue en plus, bien plus utile que celle de wikisource, avec des liens internes, des images...). Il faut cependant une version ISO-8859-1 si possible mais parfois cela n'a pas de sens... (ils ont des textes en chinois par exemple et ceux-là peuvent n'être qu'en BIG5...)
  • # 125 000 mots mais

    Posté par  . Évalué à 4.

    Je vois dans la liste des noms communs trop de chose du genre:

    10base-t, dhcp, A380, ...

    tiens il manque unbuntu!

    Pourquoi polluer un dictionnaire de la langue française avec ça? Incorrigible ces geeks ...
  • # Wikionnaire : Export pour DICTD ?

    Posté par  . Évalué à 2.

    Qu'en est il d'une exportation du contenu du Wikionnaire au format DICTD afin de l'utiliser en local ?

    C'est ce que propose par exemple le ReVo http://purl.org/NET/voko/revo/ (Dictionnaire Espéranto - Autres langues) et c'est très pratique !

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.