tag:linuxfr.org,2005:/tags/dictionnaire/publicLinuxFr.org : les contenus étiquetés avec « dictionnaire »2023-03-22T21:34:25+01:00/favicon.pngtag:linuxfr.org,2005:Post/435422023-03-22T07:07:48+01:002023-03-22T07:08:32+01:00Une solution de dictionnaire (+synonymes) libre et élégante, hors ligne ?<p>Bonjour,</p>
<p>J'utilise "Stardict" (avec Le Littré) mais je n'aime pas trop la présentation et l'intégration générale ; pour les synonymes, j'utilise un petit script dans le terminal, très pratique : un appui sur F12 pour appeler Yakuake, puis $synonyme mot…le problème, c'est que c'est un script connecté et il m'arrive soit de ne pas l'être, soit que le site (<a href="https://crisco4.unicaen.fr/des/">https://crisco4.unicaen.fr/des/</a>) ne soit pas disponible / très lent (et ça arrive assez souvent).<br>
De la même façon, j'aimerais que ma compagne et mes nièces puissent accéder à ces outils sans passer par plusieurs solutions.<br>
En attendant, leur préférence va au format papier la plupart du temps (et souvent, la mienne aussi).</p>
<p>Est-ce que vous connaissez des solutions élégantes, rapides et simples ? Merci pour vos suggestions.</p>
<div><a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/une-solution-de-dictionnaire-synonymes-libre-et-elegante-hors-ligne.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/130676/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/une-solution-de-dictionnaire-synonymes-libre-et-elegante-hors-ligne#comments">ouvrir dans le navigateur</a>
</p>
Stinouffhttps://linuxfr.org/nodes/130676/comments.atomtag:linuxfr.org,2005:Diary/401462022-02-13T14:50:26+01:002022-02-13T19:07:49+01:00Le dictionnaire des francophones : un dictionnaire francophone structuré libreLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<p>Les mots sont à la mode alors j’en profite pour parler d’un projet intéressant de quelques mois d’age, pour sa sortie officielle : le dictionnaire des francophones réalisé avec <a href="https://2if.universite-lyon.fr/">l’institut international de la francophonie</a>.</p>
<p><a href="https://www.dictionnairedesfrancophones.org/">https://www.dictionnairedesfrancophones.org/</a></p>
<p>C’est un projet de dictionnaire structuré collaboratif, créé entre autre avec les données du wiktionnaire. Réalisé (entre autre ?) par le wikimédien Noé<br>
On peut y consulter un mot comme <a href="https://www.dictionnairedesfrancophones.org/form/motus">motus</a>.</p>
<p>Jusque là rien de très original, des dictionnaires comme ça on en a plutôt pas mal en consultation sur le net.</p>
<p>Ce qui est beaucoup plus original c’est la présence d’un <a href="https://www.dictionnairedesfrancophones.org/sparql">point d’accès SPARQL</a> pour faire des requêtes sur les données ! On a donc un graphe RDF structuré par un modèle de donnée <a href="https://mnemotix.gitlab.io/ddf/ddf-models/">documenté</a> et des relations entre les mots et leurs formes, leur définition, leur étymologie …</p>
<p>La communauté du wiktionnaire liste <a href="https://fr.wiktionary.org/wiki/Projet:Requ%C3%AAter_le_Wiktionnaire">des requêtes intéressantes sur cette page</a>.</p>
<p>Quel est le prétexte à cette assez fruste introduction du projet des mois après sa sortie ? <a href="https://www.dictionnairedesfrancophones.org/sparql#query=%0APREFIX%20ontolex%3A%20%3Chttp%3A%2F%2Fwww.w3.org%2Fns%2Flemon%2Fontolex%23%3E%0A%0ASELECT%20distinct%20%3Fmot%0AWHERE%20%7B%0A%20%20%5B%5D%20ontolex%3AwrittenRep%20%3Fmot%20.%0A%20%20FILTER%20(%20strlen(%3Fmot)%20%3D%205%20)%0A%7D%0AORDER%20BY%20DESC(%3Fmot)&endpoint=https%3A%2F%2Fwww.dictionnairedesfrancophones.org%2Fapi%2Fsparql&requestMethod=POST&tabTitle=Query&headers=%7B%7D&contentTypeConstruct=application%2Fn-triples%2C*%2F*%3Bq%3D0.9&contentTypeSelect=application%2Fsparql-results%2Bjson%2C*%2F*%3Bq%3D0.9&outputFormat=table">Une tentative de requête de plus</a> pour trouver les suites de 5 lettres qui pourraient servir à un wordle francophone .</p>
<p>On peut discuter des résultats en commentaires, mais j’ai l’impression qu’il en manque :)</p>
<p>La prochaine fois, les données lexicale structurées de Wikidata.</p>
<div><a href="https://linuxfr.org/users/thoasm/journaux/le-dictionnaire-des-francophones-un-dictionnaire-francophone-structure-libre.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/126906/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/thoasm/journaux/le-dictionnaire-des-francophones-un-dictionnaire-francophone-structure-libre#comments">ouvrir dans le navigateur</a>
</p>
Thomas Douillardhttps://linuxfr.org/nodes/126906/comments.atomtag:linuxfr.org,2005:Post/417212020-12-23T19:54:47+01:002021-01-07T18:33:49+01:00Résolu : BlueGriffon avec un dico Français<p>Salut,</p>
<p>J'ai installé <em>BlueGriffon</em> (v. 3.1) sur ma <em>Budgie Ubuntu 20.04</em>. Ça marche bien mais le dictionnaire français n'est pas installé.</p>
<p>J'ai bien installé le dictionnaire français comme indiqué par <a href="http://blogzinet.free.fr/blog/index.php?post/2011/05/13/Installer-un-dictionnaire-fran%C3%A7ais-dans-BlueGriffon-pour-la-correction-orthographique">blogzinet</a> mais le dico français n'apparait pas dans la liste des dictionnaires avec <em>clic droit => Dictionnaire</em>. J'ai même installé le dictionnaire Espagnol avec le même résultat.</p>
<p>A noter qu'après installation, je vois bien le dictionnaire dans la fenêtre Outils => Modules Complémentaires. Mais après fermeture, et redémarrage du logiciel le ou les nouveaux dictionnaires n'y sont plus : il y a donc manifestement quelque chose qui se passe mal … mais je ne sais pas quoi.</p>
<p>Est-ce que quelqu'un est arrivé à activer le dictionnaire français sur <em>BlueGriffon</em> et si oui comment ?</p>
<p>Tant que je suis sur le sujet <em>BlueGriffon</em> : dans les menus et fenêtres de commandes j'ai des points entre certaines lettres des mots. Est-ce que vous avez la même chose ? Est-ce que vous avez une idée de comment supprimer ces points disgracieux ?</p>
<p>Merci d'avance pour votre aide,<br>
L.</p>
<div><a href="https://linuxfr.org/forums/general-general/posts/resolu-bluegriffon-avec-un-dico-francais.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/122717/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-general/posts/resolu-bluegriffon-avec-un-dico-francais#comments">ouvrir dans le navigateur</a>
</p>
ComputingFroggyhttps://linuxfr.org/nodes/122717/comments.atomtag:linuxfr.org,2005:Diary/373672017-06-17T16:00:35+02:002017-06-17T16:00:35+02:00Enquête sur les noms propres pour le dictionnaire orthographiqueLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<p>Il y a quelques années, la confection du dictionnaire orthographique se faisait collaborativement avec quelques participants très impliqués. Puis, à mesure que le dictionnaire se complétait, deux ou trois dizaines de milliers de mots plus tard, les participants se sont moins impliqués et les propositions de nouveaux mots se sont faites de plus en plus rares. Bien sûr, le dictionnaire n’est toujours pas complet, mais il semble l’être suffisamment pour beaucoup, ou bien ça n’intéresse plus grand-monde. Difficile de savoir.</p>
<p>C’est à l’époque où il y avait du monde que la politique d’intégration des mots s’est faite, autour d’un consensus plus ou moins établi. Et cela n’a guère été remis en cause, hormis sur certains points spécifiques.</p>
<p>Or, il y a un domaine où beaucoup de points n’ont jamais été fixés clairement : celui des noms propres. Vous n’en avez peut-être pas conscience, mais il existe une quantité gigantesque de noms propres : prénoms, patronymes, artistes, personnages historiques, mythologiques ou fictifs, sociétés, compagnies, ONG, organisations étatiques, produits commerciaux ou non commerciaux, toponymes (villes et villages, rivières, fleuves, montagnes, déserts, lacs, régions administratives ou historiques, lieux-dits). Tout ça représente en fait plus de mots que les noms communs du français.</p>
<p>Pour l’instant, le dictionnaire contient environ 8 000 noms propres sur 82 000 entrées. Est-ce trop, pas assez ? Y a-t-il des points à revoir ? A-t-on mal fait ? À vous de le dire.</p>
<p>J’ai confectionné <a href="https://framaforms.org/quels-noms-propres-pour-votre-correcteur-orthographique-1495717640">un questionnaire sur Framaforms</a> pour essayer d’y voir plus clair.</p>
<p>Comme vous le savez peut-être, le dictionnaire orthographique inclus dans Grammalecte est aussi celui qui sert à la correction orthographique de nombreux logiciels, notamment Firefox, Thunderbird, LibreOffice, Chrome, et beaucoup de logiciels sur Linux. Donc, ça vous concerne aussi probablement, même si vous n’utilisez pas le correcteur grammatical.</p><div><a href="https://linuxfr.org/users/or/journaux/enquete-sur-les-noms-propres-pour-le-dictionnaire-orthographique.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/112106/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/or/journaux/enquete-sur-les-noms-propres-pour-le-dictionnaire-orthographique#comments">ouvrir dans le navigateur</a>
</p>
Olivierhttps://linuxfr.org/nodes/112106/comments.atomtag:linuxfr.org,2005:News/378852017-03-24T21:42:44+01:002017-03-30T22:36:51+02:00Version 3.0 de qdictionnaireLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<div><p>La version 3.0 de qdictionnaire est sortie avec une version Linux/deb (i386 et amd64), une Linux/rpm (x86 et x86_64), une Windows et une macOS. Les sources sont sous licence GPL v3+.</p>
<p>Pas de grands changements depuis la 2.6 à part une amélioration du code, quelques modifications ergonomiques et corrections de bogues. La partie la plus visible est l’ajout d’une fenêtre d’information système dans l’aide indiquant le chemin de la base de données, celle du fichier de configuration de l’application et le chemin de l’exécutable.</p>
<p>Rappelons que qdictionnaire est un dictionnaire qui :</p>
<ul>
<li>comporte 385 000 mots de la langue française, les mots rares, les noms des communes françaises et les prénoms ;</li>
<li>comprend un dictionnaire de synonymes ;</li>
<li>affiche les conjugaisons des verbes ;</li>
<li>dispose de 38 000 citations ;</li>
<li>affiche les rimes de 384 000 mots phonémisés par un algorithme interne ;</li>
<li>propose un éditeur poétique ;</li>
<li>embarque toutes les informations dans une base de données SQlite et ne nécessite pas de connexion Internet.</li>
</ul></div><ul><li>lien nᵒ 1 : <a title="http://www.gillesmaire.com/tiki-index.php?page=qdictionnaire" hreflang="fr" href="https://linuxfr.org/redirect/99477">Page de l’auteur</a></li><li>lien nᵒ 2 : <a title="https://linuxfr.org/news/dicorime-change-de-nom-de-version-et-de-site-d-hebergement" hreflang="fr" href="https://linuxfr.org/redirect/99479">LinuxFr.org : Dicorime change de nom, de version et de site d’hébergement</a></li></ul><div><p>Il est fourni en licence GPL v3 et il est basé sur un certain nombre de ressources libres :</p>
<ul>
<li>Lexique 3 ;</li>
<li>la liste des villes issue du site de l’INSEE ;</li>
<li>Wiktionary ;</li>
<li>Wikiquote ;</li>
<li>fortunes-fr ;</li>
<li>la base de données SQLite ;</li>
<li>l’environnement de développement QtCreator ;</li>
<li>la bibliothèque Qt 5 ;</li>
<li>les définitions des mots rares du dictionnaire de Didier Méral ;</li>
<li>des verbes conjugués et l’affichage des tables de conjugaisons sont dues au programme <em>french-conjugator</em>.</li>
</ul><p>Il est disponible sur la <a href="http://www.gillesmaire.com/tiki-index.php?page=qdictionnaire">page de l’auteur</a>.</p></div><div><a href="https://linuxfr.org/news/version-3-0-de-qdictionnaire.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/111520/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/version-3-0-de-qdictionnaire#comments">ouvrir dans le navigateur</a>
</p>
maire gillesDavy DefaudBenoît Sibaudhttps://linuxfr.org/nodes/111520/comments.atomtag:linuxfr.org,2005:Post/363712016-01-19T16:23:59+01:002016-01-19T16:23:59+01:00Cherche dictionnaire<p>Bonjour à tous,</p>
<p>Je cherche un dictionnaire (libre) du français, avec les propriétés suivantes : nature des mots, genre des nom, et s'il s'agit d'un dictionnaire exhaustif (tel que /usr/share/dict/french) s'il s'agit d'un pluriel ou non.</p>
<p>De préférence dans un format connu, mais s'il faut sortir lexx/yacc pour le traiter ça ne me gêne pas plus que ça… Par contre pas de webservice !</p>
<p>J'ai regardé s'il était possible d'exporter le wiktionnaire mais n'ai pas trouvé l'info, est-ce que vous auriez une idée si ce genre de chose existe ?</p>
<p>Merci à vous</p><div><a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/cherche-dictionnaire.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/107933/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/cherche-dictionnaire#comments">ouvrir dans le navigateur</a>
</p>
chimrodhttps://linuxfr.org/nodes/107933/comments.atomtag:linuxfr.org,2005:Post/358602015-09-24T21:46:12+02:002015-09-24T21:46:12+02:00Dictionnaire (words) complet pour esperanto<p>Bonsoir, je cherche un package qui me permettrait d'avoir un fichier de tout les mots (words) en esperanto à la manière (/usr/share/dict/w*). Je suis sous Debian Jessie, et je vais une recherche pas trouvé grand chose à parts avec ispell et aspell. Sauf qu'avec ces programmes puis-je manipuler et faire des recherches comme sur un fichier voir une base de donnée? - j'en ai pas l'impression.<br>
Merci d'avance.</p>
<p>-encore une fois je ne cherche pas un traducteur, mais un fichier (BDD) qui me permettrait de faire des recherche sur tout les mots en esperanto (la racine de chaque mot).</p><div><a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/dictionnaire-words-complet-pour-esperanto.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/106857/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/dictionnaire-words-complet-pour-esperanto#comments">ouvrir dans le navigateur</a>
</p>
dafphttps://linuxfr.org/nodes/106857/comments.atomtag:linuxfr.org,2005:Post/355582015-07-01T15:42:38+02:002015-07-01T15:42:38+02:00Télécharger les mots du Wiktionaire<p>Salut forum,</p>
<p>Connais-tu un moyen de télécharger la liste des mots français du Wiktionaire ? J'aurais besoin d'un dico pour un jeu et ça me semble être la meilleure source proposant les mots et les conjugaisons avec un contrat d'utilisation sympa.</p>
<p>Tout ce que j'ai trouvé pour l'instant ce sont les fichiers de <a href="http://dumps.wikimedia.org/frwiktionary/">http://dumps.wikimedia.org/frwiktionary/</a> qui listent les titres des pages. Malheureusement ces titres sont parfois des mots étrangers.</p><div><a href="https://linuxfr.org/forums/general-general/posts/telecharger-les-mots-du-wiktionaire.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/106213/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-general/posts/telecharger-les-mots-du-wiktionaire#comments">ouvrir dans le navigateur</a>
</p>
Julien Jorgehttps://linuxfr.org/nodes/106213/comments.atomtag:linuxfr.org,2005:Post/351902015-04-02T15:27:58+02:002015-04-02T15:27:58+02:00Dictionnaire Français et Anglais-Français offline<p>Bonjour,</p>
<p>Il m'arrive de prendre le train et j'en profite pour faire un peu de rédaction en anglais.</p>
<p>Dans le train c'est pas évident d'avoir le net et puis on a pas forcément envie d'être connecté. Bref, je suis à la recherche de dictionnaire offline. A l'époque, j'utilisais le Bibliorom sous Windows. </p>
<p>Principalement je recherche un dictionnaire anglais - français. Avez vous des idées d'où je pourrais trouver cela ?</p><div><a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/dictionnaire-francais-et-anglais-francais-offline.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/105301/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/dictionnaire-francais-et-anglais-francais-offline#comments">ouvrir dans le navigateur</a>
</p>
MrBidonhttps://linuxfr.org/nodes/105301/comments.atomtag:linuxfr.org,2005:Diary/356922015-03-13T10:31:22+01:002015-03-13T10:31:22+01:00À la recherche des dictionnaires pour Bookeen Cybook OdysseyLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<p>Bonjour,</p>
<p>Notre chère DLFP n'ayant pas été renommée GNUlinuxFR.org, je me permets de poster un journal concernant une liseuse pas tout à fait libre, mais basée sur Linux tout de même…</p>
<p>Je me suis penché hier soir sur l'ajout de dictionnaires à un modèle en version Boo Reader 6.1. Sur le principe, il suffit de copier des couples de fichiers (.dict / .dict.idx) dans le dossier Dictionaries à la racine de la liseuse, une fois qu'elle apparaît, montée, sur votre système de fichiers (donc que vous avez pensé à lui demander d'apparaître une fois l'avoir branchée).</p>
<p>Ma liseuse était livrée avec un dico français propriétaire pré-installé, et les copies allemande et italienne de Wiktionnary. Ça dénote d'une bonne volonté certaine de la part du constructeur, mais j'aurais préféré de l'anglais et de l'espagnol…</p>
<p>En torturant quelques moteurs de recherche, j'ai trouvé deux liens pertinents et les dictionnaires suivants :</p>
<ul>
<li>En -> En en.gcide.dict.install (34 MO)</li>
<li>En -> Fr en-fr.dict.install (300 KO)</li>
<li>En -> Fr en-fr.dict de Guilhem G. (6 MO)</li>
<li>En -> It en-it.dict.install (1 MO)</li>
<li>De -> De de.wiktionary.dict.install (20 MO)</li>
<li>It -> It it.wikipedia.dict.install (2 MO)</li>
</ul><p>Les fichiers .install listés là sont en fait des ZIP contenant le bon couple de fichiers pour l'installation d'un dictionnaire.<br>
Le dictionnaire de Guilhem G. vient lui dans un fichier RAR qu'on peut manipuler via file-roller quand on a unrar installé sur son système.</p>
<ul>
<li><a href="http://blog.bookeen.com/fr/dictionnaire-anglais-francais-pour-cybook-odyssey/">Explications sur le blog de Bookeen</a></li>
<li><a href="http://blog.bookeen.com/fr/dictionnaire-anglais-francais-pour-cybook-odyssey/dictionary_en_fr/">Téléchargement du dictionnaire anglais/français de Guilhem G.</a></li>
<li><a href="https://ubibooks.bookeen.com/dic/index.htm">5 autres dictionnaires proposés par Bookeen</a></li>
</ul><p>Sur la page d'explications, Bookeen indique qu'Alberto Pettarin propose une application Python libre nommée <a href="https://github.com/pettarin/penelope">Penelope</a> pour convertir des dictionnaires existants en un format acceptable par la liseuse, mais je n'ai pas trouvé de dictionnaire "source" à convertir.</p>
<p>Et vous, avez-vous trouvé d'autres dictionnaires à ajouter dans une Odyssey ?</p><div><a href="https://linuxfr.org/users/siltaar/journaux/a-la-recherche-des-dictionnaires-pour-bookeen-cybook-odyssey.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/105094/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/siltaar/journaux/a-la-recherche-des-dictionnaires-pour-bookeen-cybook-odyssey#comments">ouvrir dans le navigateur</a>
</p>
Siltaärhttps://linuxfr.org/nodes/105094/comments.atomtag:linuxfr.org,2005:News/347262013-10-24T10:40:36+02:002013-10-24T10:47:07+02:00Phokaia, dictionnaire de grec ancien → françaisLicence CC By‑SA http://creativecommons.org/licenses/by-sa/3.0/deed.fr<div><p>En bref : un (embryon de) dictionnaire grec ancien → français, sur corpus, libre (GPLv3), compilable avec <a href="https://github.com/suizokukan/logotheras">Logotheras</a> et disponible aux formats texte et RST.</p>
<p><a href="http://94.23.197.37/phokaia/phokaia.html">Phokaia</a> est un dictionnaire grec ancien -> français sur corpus. <br>
Phokaia est écrit de manière à être utilisé avec le projet <a href="https://github.com/suizokukan/logotheras">Logotheras</a> et est par conséquent disponible en format texte ainsi que sous forme <a href="http://94.23.197.37/phokaia/rst/index.html">d'une exportation au format RST</a>.</p>
<p>Quand le projet Logotheras le permettra, ce dictionnaire sera également consultable sous forme d'une base de données MySQL.</p>
<p>Phokaia est <a href="http://projects.tuxfamily.org/?do=group;name=phokaia">hébergé chez l'excellent(e) TuxFamily</a>.</p></div><ul><li>lien nᵒ 1 : <a title="http://94.23.197.37/phokaia/phokaia.html" hreflang="fr" href="https://linuxfr.org/redirect/88141">(Phokaia) version de consultation</a></li><li>lien nᵒ 2 : <a title="http://projects.tuxfamily.org/?do=group;name=phokaia" hreflang="fr" href="https://linuxfr.org/redirect/88142">(Phokaia) compte git chez TuxFamily</a></li><li>lien nᵒ 3 : <a title="https://github.com/suizokukan/logotheras" hreflang="fr" href="https://linuxfr.org/redirect/88143">Logotheras sur GitHub</a></li><li>lien nᵒ 4 : <a title="https://github.com/suizokukan/infgrid" hreflang="fr" href="https://linuxfr.org/redirect/88144">InfGrid, le module gérant les grilles de flexion</a></li><li>lien nᵒ 5 : <a title="https://github.com/suizokukan/hlevel" hreflang="fr" href="https://linuxfr.org/redirect/88145">HLevel, le module gérant les niveaux hiérarchiques</a></li></ul><div><h2 class="sommaire">Sommaire</h2>
<ul class="toc">
<li><a href="#choix-du-nom">Choix du nom</a></li>
<li><a href="#avancement-du-projet">Avancement du projet</a></li>
<li><a href="#les-tableaux-morphologiques">Les tableaux morphologiques</a></li>
<li><a href="#choix-du-corpus">Choix du corpus</a></li>
<li>
<a href="#le-probl%C3%A8me-des-licences-et-des-droits-dauteur">Le problème des licences et des droits d'auteur</a><ul>
<li><a href="#licence-de-phokaia">licence de Phokaia</a></li>
<li><a href="#le-probl%C3%A8me-des-documents-sous-droits-dauteur">le problème des documents sous droits d'auteur</a></li>
</ul>
</li>
<li><a href="#et-la-suite">Et la suite ?</a></li>
</ul><p>Je présente Phokaia sur LinuxFr avant d'en parler à un public d'hellénistes ; dans mon esprit, en effet, ce projet n'est pas encore abouti et a besoin de mûrir. <br>
Puissé-je retrouver avec ce projet l'accueil toujours agréable que les membres de LinuxFr ont réservé à mes contributions ! Si vous consultez l'export RST, veuillez comprendre que tout est à (re)faire, de l'organisation des articles à leur mise en page. D'autre part, les documents que je publie contiennent encore de nombreuses imperfections tant sur le fond que la forme !</p>
<h2 id="choix-du-nom">Choix du nom</h2>
<p>Je cherchais un nom grec évoquant le lien entre la Grèce et la France… Je me suis alors souvenu des Phocéens, peuple grec qui fonda la colonie de Marseille. <a href="http://fr.wikipedia.org/wiki/Phoc%C3%A9ens">« Phokaia » désigne le nom de la ville d'origine des Phocéens</a>.</p>
<h2 id="avancement-du-projet">Avancement du projet</h2>
<p>À ce jour, Phokaia compte 333 articles, un nombre ridicule comparé au dictionnaire Bailly qui doit en compter à peu près cent mille. Le but n'étant pas d'être exhaustif, j'ai pu me concentrer sur la qualité des renseignements donnés et sur les procédés de traduction utilisés.<br>
Les articles sont découpés en « entrées », chaque entrée étant illustrée par au moins un exemple.<br>
Je ne m'interdis pas d'utiliser le même exemple pour différentes entrées et au bout du compte, mes 333 articles utilisent 170 exemples différents tirés d'auteurs classiques tels Isocrate, Hérodote ou Thucydide.</p>
<h2 id="les-tableaux-morphologiques">Les tableaux morphologiques</h2>
<p>L'un des points forts du projet Logotheras est de permettre la création automatique de tableaux de conjugaisons et de déclinaisons à partir des données du dictionnaire.<br>
Si vous consultez <a href="http://94.23.197.37/phokaia/rst/art000088.html">la page de Phokaia consacrée au verbe être (εἶναι)</a> vous en verrez un exemple — pour être sincère, c'est à ce jour le seul tableau de ce genre dans Phokaia, mais d'autres sont prévus. Le tableau qui figure juste avant la section « morphologie » a donc été extrait <strong>automatiquement</strong> des données du dictionnaire : je reconnais que son aspect est hideux, mais il a le mérite de montrer ce que Logotheras peut faire.<br>
L'intérêt de ce traitement automatisé est double : remplir à peu de frais de tels tableaux et mettre en évidence les formes (encore) absentes du dictionnaire.</p>
<p>C'est le module <a href="https://github.com/suizokukan/infgrid">InfGrid</a> qui prend en charge la génération de ces tableaux : dans le code de <a href="https://github.com/suizokukan/logotheras">Logotheras</a>, voyez le répertoire <code>logotheras/rst/morphogrids</code> pour en savoir davantage.</p>
<h2 id="choix-du-corpus">Choix du corpus</h2>
<p>À l'origine, Phokaia est un recueil de notes de cours relatives aux procédés de traduction propres à la version grecque. Peu à peu ces notes sont devenues un mini-dictionnaire quand j'ai voulu systématiser cette approche en dépouillant tous les mots des passages étudiés.<br>
Aujourd'hui, j'aimerais surtout utiliser Phokaia pour un projet de « liseuse » que je n'ai pas encore publié : l'idée serait d'enrichir la lecture de textes en ayant recours aux notes de Phokaia.<br>
Tant que ce projet n'est pas abouti, j'enrichis Phokaia au gré de mes envies, en ajoutant peu à peu des éléments empruntés à des grammaires, à des cours et à des ouvrages consacrés à la version grecque. Ceci pose donc le problème classique des droits d'auteurs.</p>
<h2 id="le-problème-des-licences-et-des-droits-dauteur">Le problème des licences et des droits d'auteur</h2>
<h3 id="licence-de-phokaia">licence de Phokaia</h3>
<p>Par habitude, je publie Phokaia sous licence GPLv3 mais je suis bien conscient des problèmes que pose ce choix. L'idée est de trouver une license open-source respectant l'idée que je me fais des documents libres et permettant d'utiliser Phokaia dans le cadre de projets éducatifs, pour peu qu'eux aussi soient libres. Je suis ainsi tenté d'utiliser la <a href="http://fr.wikipedia.org/wiki/Licence_de_documentation_libre_GNU">GFDL</a> mais j'ai encore besoin de réfléchir à la question.</p>
<h3 id="le-problème-des-documents-sous-droits-dauteur">le problème des documents sous droits d'auteur</h3>
<p>Certains matériaux utilisés par Phokaia sont couverts, me semble-t-il, par le droit d'auteur. Il s'agit :</p>
<ul>
<li>du texte grec des éditions Budé que j'utilisais il y a encore quelques années. La solution est simple et consiste à utiliser à leur place les éditions de Wikipedia (Wikisource) et de Perseus. La seule difficulté est la nécessité d'adapter les traductions desdits textes.</li>
<li>de traductions provenant de mes cours de faculté. J'ai signalé le plus honnêtement les emprunts que je faisais mais je suis conscient du problème. Ou bien je fais disparaître ces traductions ou bien je les réécris.</li>
<li>de traductions provenant de livres et de documents variés, par exemple glanés sur Internet. Je me limite alors à quelques courtes citations afin de ne pas violer les lois sur le droit d'auteur.</li>
</ul><p>Mais le cas le plus intéressant reste celui des rapports de jury d'agrégation et de l'ENS. La qualité des traductions y est particulièrement élevée et j'aimerais bien y puiser le maximum d'éléments. Mais leur statut légal pose problème : ai-je le droit de les utiliser dans un projet comme Phokaia en précisant seulement leur origine ? Je ne le sais pas encore.</p>
<p>Si certains ont des conseils à me donner sur ces délicats problèmes, je suis preneur !</p>
<h2 id="et-la-suite">Et la suite ?</h2>
<p>Je cherche trois catégories de personnes : celles voulant consulter le dictionnaire, celles voulant contribuer à sa rédaction et enfin celles qui désireraient écrire d'autres dictionnaires. En particulier, si certains veulent se lancer dans l'écriture du dictionnaire français → latin, je suis partant pour les aider pour peu que soient respectées mes exigences concernant la qualité des articles.</p>
<p>Merci de m'avoir lu !</p></div><div><a href="https://linuxfr.org/news/phokaia-dictionnaire-de-grec-ancien-francais.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/100085/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/phokaia-dictionnaire-de-grec-ancien-francais#comments">ouvrir dans le navigateur</a>
</p>
Xavier FaureNeoXZeroHeureBenoît Sibaudclaudexhttps://linuxfr.org/nodes/100085/comments.atomtag:linuxfr.org,2005:News/346402013-10-01T10:30:56+02:002013-10-01T10:30:56+02:00Logotheras, compilateur de dictionnaires de languesLicence CC By‑SA http://creativecommons.org/licenses/by-sa/3.0/deed.fr<div><p>En bref : <a href="http://94.23.197.37/logotheras">une bibliothèque</a> (Python3, GPLv3) hébergée sous <a href="https://github.com/suizokukan/logotheras">GitHub</a>, permettant de lire des dictionnaires de langues (<a href="http://git.tuxfamily.org/tenez/gitrepository.git">au format texte</a> ou sous forme d'une base de données), de les formater et d'en vérifier la cohérence, puis de les (ré)écrire au format texte ou sous forme d'une base de données. La version actuelle (0.1.6) permet seulement de travailler sur les fichiers texte. De manière générale, le projet n'a pas été testé de manière intensive.</p></div><ul><li>lien nᵒ 1 : <a title="http://projects.tuxfamily.org/?do=group;name=tenez" hreflang="fr" href="https://linuxfr.org/redirect/87851">Projet de démonstration "tenez", dictionnaire anglais->français</a></li><li>lien nᵒ 2 : <a title="http://94.23.197.37/logotheras/" hreflang="fr" href="https://linuxfr.org/redirect/87852">Logotheras</a></li><li>lien nᵒ 3 : <a title="https://github.com/suizokukan/logotheras" hreflang="fr" href="https://linuxfr.org/redirect/87853">Logotheras sur GitHub</a></li></ul><div><h2 class="sommaire">Sommaire</h2>
<ul class="toc">
<li><a href="#quest-ce-logotheras">Qu'est-ce Logotheras ?</a></li>
<li><a href="#les-fichiers-texte-et-le-format-textdbdict">Les fichiers texte et le format TextDBDict</a></li>
<li><a href="#compilation-dun-dictionnaire">Compilation d'un dictionnaire</a></li>
<li><a href="#options-diverses-pour-la-compilation">Options diverses pour la compilation</a></li>
<li><a href="#%C3%89criture-du-code-choix-de-la-licence">Écriture du code, choix de la licence</a></li>
<li><a href="#futurs-d%C3%A9veloppements-conclusion">Futurs développements, conclusion</a></li>
</ul><h2 id="quest-ce-logotheras">Qu'est-ce Logotheras ?</h2>
<p>Dans le cadre d'un projet personnel, <a href="http://94.23.197.37">j</a>'ai eu besoin d'un module Python3 lisant et écrivant des données placées dans des dictionnaires. Le format des dictionnaires texte (<a href="http://94.23.197.37/logotheras/examples_textDBDict/tenez.textdbdict">un exemple ici</a>) est propre à mon module et n'est pas compatible avec d'autres formats comme StarDict, Babylon, Lingvo ou Dictd.<br>
Les données lues et écrites associent le(s) "sens" de chaque mot à des "extraits" illustrant ce(s) sens, extraits tirés d'un corpus.<br>
Tout dictionnaire Logotheras repose donc sur un ensemble de textes, le corpus, découpé en extraits qui peuvent être traduits et commentés.<br>
Logotheras peut utiliser l'une de mes bibliothèques (<a href="http://94.23.197.37/dchars/doc/en/index.html">DChars</a>) pour certaines langues : c'est DChars qui peut trier les mots et normaliser les caractères utilisés dans les mots.</p>
<p>À ce stade du projet, Logotheras n'a été testé que sous Linux. Pire, je n'ai même pas eu le temps d'en tester l'installation comme bibliothèque : si vous l'installez, copiez simplement tous les fichiers du projet dans un répertoire et utilisez le front-end <code>logotheras.py</code> livré avec !</p>
<p>Ceci dit, Logotheras commence à devenir utilisable : j'en fais l'annonce sur LinuxFr en espérant renouveler l'accueil chaleureux et instructif que j'ai toujours rencontré sur ce site.</p>
<h2 id="les-fichiers-texte-et-le-format-textdbdict">Les fichiers texte et le format TextDBDict</h2>
<p>À titre d'exemple, voyez <code>tenez</code> (anglais -> français, à prononcer <em>[tenets]</em>), le dictionnaire de démonstration - ce n'est pas un vrai projet - que vous trouverez <a href="http://git.tuxfamily.org/tenez/gitrepository.git">à cette adresse</a>.</p>
<p>Tout dictionnaire Logotheras existe comme une suite de fichiers texte stockés dans un répertoire. <a href="http://git.tuxfamily.org/tenez/gitrepository.git?p=tenez/gitrepository.git;a=tree">À la racine du répertoire</a>, un fichier <code>informations.textdbdict</code> recense les auteurs, les titres, les éditions… Puis un sous-répertoire <code>source</code> contient tous les fichiers de données, au format TextDBDict.</p>
<p>Un fichier de données au format TextDBDict est une partie d'un dictionnaire ; en voici les divisions :</p>
<ul>
<li>un dictionnaire est divisé en articles (un article par mot) ;</li>
<li>un article est divisé en entrées (une entrée par sens du mot) ;</li>
<li>une entrée est divisée en extraits (chaque extrait illustrant le sens).</li>
</ul><p>Le format a été choisi afin qu'il soit facile de modifier le fichier texte ; la compilation permet en plus de formater le texte de ces fichiers.</p>
<p>D'autre part, un extrait est composé d'un texte : ce texte peut être accompagné d'une ligne précisant l'auteur du texte et sa référence (titre, position dans l'œuvre…). On pourra également ajouter une traduction et un commentaire.</p>
<p>Prenons l'exemple du projet Phokaia que je présenterai bientôt (dictionnaire grec ancien -> français). Voici la troisième entrée de l'article ἀλλὰ (="mais"), entrée explicitant le sens de l'expression "ἀλλὰ… μὴν". On y reconnaîtra le texte sur deux vers, la ligne entre parenthèses précisant d'où vient ce texte, puis la traduction (précédée de '=') et enfin une ligne de commentaire précédée de '#' :</p>
<pre><code>(3) ἀλλὰ… μὴν : "oui et même"
ναί, τέκνον, εἴπερ ἐστί γ᾽ ἐξοικήσιμος.
ἀλλ᾽ ἐστὶ μὴν οἰκητός· […]
(Sophocle•Œdipe à Colonne•27-28;free_edition)
=(Œdipe) Oui ma fille, pour savoir si jamais il est habitable./(Antigone) Oui il l'est, il est même habité;{XF}
#Œdipe vient de s'arrêter en un endroit inconnu; il demande donc à sa fille d'aller voir si l'endroit est ἐξοικήσιμος (habitable).
</code></pre>
<p>Enfin, d'autres possibilités existent encore ; par exemple, Logotheras peut traiter à part certaines entrées en les empêchant d'être triées avec les autres. Me consulter pour plus de détails.</p>
<h2 id="compilation-dun-dictionnaire">Compilation d'un dictionnaire</h2>
<p>J'ai écrit un front-end permettant d'appeler Logotheras depuis la ligne de commande, front-end que j'utiliserai dans les exemples suivants.</p>
<p>Un exemple minimaliste, pour simplement lire un répertoire TextDBDict :</p>
<p>(on supposera qu'il existe un sous-répertoire <code>logs/</code> permettant d'accueillir les fichiers de logs)</p>
<p><code>$ ./logotheras.py --showstatistics --textinput=/home/xxx/projets/tenez/</code> … lit le contenu du répertoire <em>tenez</em> et affiche des statistiques sur les données. Vous y lirez par exemple :</p>
<pre><code>articles : 114
extracts : 172
* extracts with a workreference : 172 (100.00%)
* unique extracts : 17 (9.88%)
Authors sorted by frequency :
Shelley : 62.21% (107/172)
Shakespeare : 30.23% (52/172)
Robert Browning : 7.56% (13/172)
Groups sorted by frequency :
poésie : 69.77% (120/172)
théâtre élisabéthain : 30.23% (52/172)
Titles sorted by frequency :
Ozymandias : 62.21% (107/172)
Hamlet : 30.23% (52/172)
My Last Duchess : 7.56% (13/172)
Editions sorted by frequency :
Wikipedia : 100.00% (172/172)
Translation sources sorted by frequency :
XF : 100.00% (172/172)
Frequency of the number of extracts by entry :
3 : 9
2 : 7
1 : 131
0 : 24
List of the extracts :
Robert Browning My Last Duchess 19-21
Shakespeare Hamlet III.1, v.58
Shakespeare Hamlet III.1, v.59-60
Shakespeare Hamlet III.1, v.61-62
[…]
</code></pre>
<h2 id="options-diverses-pour-la-compilation">Options diverses pour la compilation</h2>
<p>Un exemple plus complexe, pour lire un répertoire TextDBDict et en écrire le contenu vers /tmp/tenez/ ; Logotheras va donc réécrire plus ou moins les mêmes fichiers mais en les vérifiant et si besoin, en les normalisant :</p>
<p><code>$ ./logotheras.py --showstatistics --textinput=/home/xxx/projets/tenez/ --textoutput=/tmp/tenez/</code></p>
<p>Au lieu de récupérer un seul gros fichier de données, peut-être voulez-vous une série de fichiers de données limités à 10 articles par fichier ? Essayez alors <code>--TEXTDBDICTwriteseveralfiles=10</code>.<br>
Ou peut-être voulez-vous trier vos fichiers de manière à ce que les mots de chaque fichier commencent par la même lettre ? Essayez alors <code>--TEXTDBDICTwriteseveralfiles=a</code>, ou <code>--TEXTDBDICTwriteseveralfiles=aa</code> pour des mots groupés selon leur deux premières lettres, etc.</p>
<p>Si vous ne désirez garder que ce que vous avez défini comme étant 100% libre, choisissez <code>--minimalfreeness=100</code> ; à la place de <code>100</code> vous pouvez écrire le nombre de votre choix. Choisir <code>--minimalfreeness=0</code> signifie que vous gardez tout. C'est dans le fichier <code>informations.textdbdict</code> que le degré de "liberté" des textes et des sources des traductions est défini.</p>
<p>Le problème de la normalisation est crucial pour certaines langues, comme le grec ancien : ainsi, faut-il écrire 'ά'(0x1F71) ou 'ά'(0x03AC) ? Logotheras peut faire appel à la bibliothèque <a href="http://94.23.197.37/dchars/doc/en/index.html">DChars</a> pour rectifier le nom des auteurs, des titres et des textes eux-mêmes. Ainsi, utilisez l'option <code>--normalize=titles+authors</code> pour normaliser les titres et le nom des auteurs. C'est également DChars qui peut s'occuper de trier les mots du dictionnaire, tâche non triviale pour certaines langues.</p>
<p>Outre <code>--showstatistics</code>, vous auriez intérêt à laisser <code>--showerrorsnumber</code> pour voir s'afficher le décompte des erreurs et des warnings.</p>
<p>Enfin, les messages peuvent être orientés vers trois flux : <code>console</code>, <code>lastlog</code> et <code>rotatinglog</code>. Le second crée un fichier de logs avec les messages de la dernière compilation, le troisième conserve tous les messages émis depuis l'installation de la bibliothèque. Ajoutez par exemple <code>--logs=lastlog+rotatinglogs</code> pour éliminer les messages vers la console et conserver les deux autres.</p>
<h2 id="Écriture-du-code-choix-de-la-licence">Écriture du code, choix de la licence</h2>
<p>J'ai essayé de respecter les normes actuelles : code et documentation en anglais, utilisation de Git via <a href="https://github.com/suizokukan/logotheras">GitHub</a>, de <a href="http://www.pylint.org/">Pylint</a> pour vérifier mon code et de <a href="http://sphinx-doc.org/">Sphinx</a> pour écrire la documentation.<br>
Il manque les tests unitaires qui ne sont pas encore écrits.</p>
<p>Quant à la licence GPLv3, j'ai attentivement suivi, sur LinuxFr, les fils de discussion consacrés à ce sujet . En deux mots : je suis conscient du caractère très restrictif de cette licence pour une bibliothèque et je fais ce choix pour des raisons plus idéologiques que pratiques.</p>
<h2 id="futurs-développements-conclusion">Futurs développements, conclusion</h2>
<p>Le développement de ce projet cessera quand les principales fonctionnalités seront codées : il manque essentiellement la lecture / écriture avec les bases de données. Si je demeure seul à développer Logotheras, une fois le lien avec les BDD correctement établi, je pourrais rapidement cesser de contribuer à ce projet.</p>
<p>Je ne cherche donc pas seulement des utilisateurs pour mon projet mais aussi des personnes désireuses d'en poursuivre le développement avec moi. En espérant que cela intéressera quelqu'un… merci de m'avoir lu !</p></div><div><a href="https://linuxfr.org/news/logotheras-compilateur-de-dictionnaires-de-langues.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/99819/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/logotheras-compilateur-de-dictionnaires-de-langues#comments">ouvrir dans le navigateur</a>
</p>
Xavier FaureZeroHeureNÿcoBenoît SibaudNils Ratusznikhttps://linuxfr.org/nodes/99819/comments.atomtag:linuxfr.org,2005:Diary/329922012-08-18T18:02:53+02:002012-08-18T18:02:53+02:00La langue française, un standard commun ?Licence CC By‑SA http://creativecommons.org/licenses/by-sa/3.0/deed.fr<h2 id="sommaire">Sommaire</h2>
<ul><li>
<ul><li>
<a href="#toc_0">Introduction</a>
</li>
<li>
<a href="#toc_1">Les règles de base</a>
</li>
<li>
<a href="#toc_2">Les outils</a>
<ul><li>
<a href="#toc_3">Dictionnaires</a>
</li>
<li>
<a href="#toc_4">Conjugaison</a>
</li>
<li>
<a href="#toc_5">Grammaire</a>
</li>
</ul></li>
<li>
<a href="#toc_6">Conclusion</a>
</li>
</ul></li>
</ul><h3 id="toc_0">Introduction</h3>
<p>Fréquentant ce site depuis maintenant plusieurs années je n'ai pu m'empêcher de remarquer que, parfois, la communication entre deux contributeurs se heurtait à une différence de niveau de maîtrise de la langue française. Je souhaite donc partager avec vous les solutions dont je pense qu'elles peuvent, sinon régler le problème, améliorer la communication entre nous tous "LinuxFRiens".</p>
<h3 id="toc_1">Les règles de base</h3>
<ul><li>Faire, chacun à son niveau, l'effort de se rapprocher du standard bien établi que l'on nomme <em>Langue française</em>.</li>
<li>Accepter la critique et la correction d'autrui, se remettre en question.</li>
<li>S'astreindre à une relecture consciencieuse de sa propre prose avant de faire le pas de la publication.</li>
<li>Accepter la déviance de certains de nos interlocuteurs, mais la combattre avec mansuétude, fermeté et humanisme.</li>
</ul><h3 id="toc_2">Les outils</h3>
<p>Ces béquilles informatiques peuvent parfois parer nos faiblesses bien humaines.</p>
<h4 id="toc_3">Dictionnaires</h4>
<p>Le <a href="http://fr.wiktionary.org/wiki/Wiktionnaire:Page_d%E2%80%99accueil">Wiktionnaire</a>, un incontournable. C'est un wiki utilisant le même moteur que Wikipdia (Mediawiki). Il est simple, sobre et efficace.</p>
<p>Le <a href="http://www.cnrtl.fr">CNRTL</a> propose au sein d’un portail unique, un ensemble de ressources linguistiques informatisées et d’outils de traitement de la langue. Notamment des dictionnaires français <a href="http://www.cnrtl.fr/dictionnaires/anciens">anciens</a> et <a href="http://www.cnrtl.fr/dictionnaires/modernes">modernes</a>. Personnellement je fais mes requêtes sur <a href="http://www.cnrtl.fr/definition">http://www.cnrtl.fr/definition</a>. Les définitions renvoyées par cet outil peuvent paraître trop complexes (on m'a déjà fait la remarque) par rapport au Wiktionary. Le plus de ce dictionnaire est que pour chaque définition de mot, il indique les extraits de la littérature française (au sens large) dans laquelle ce mot est apparu en premier. Par exemple pour espérance, voici ce que ce dictionnaire nous retournera, j'ai retiré certains passages par soucis de concision :</p>
<pre>
<code class="text">ESPÉRANCE, subst. fém.
A.− PHILOS., PSYCHOL.
1. Disposition de l'âme qui porte l'homme à considérer dans l'avenir un bien important qu'il désire et qu'il croit pouvoir se réaliser. L'espérance est le désir joint à un jugement (Destutt de Tr., Idéol.,1, 1801, p. 237).Cette belle espérance, qui consiste à croire sans preuve, à adorer ce qu'on ignore et à attendre avec ferveur ce qu'on ne sait pas du tout (Flaub., Tentation,1849, p. 344).Et l'espérance n'espère pas l'espérance, mais d'heureux lendemains (Jankél., Je-ne-sais-quoi,1957, p. 240):
[...]
a) RELIG. CHRÉT. Vertu surnaturelle par laquelle les croyants attendent de Dieu, avec confiance, sa grâce en ce monde et la gloire éternelle dans l'autre[...]
− LITT. (cf. L'Enfer de Dante) :
5. « Je n'aime point, disait M., ces femmes impeccables, au-dessus de toute faiblesse. Il me semble que je vois sur leur porte le vers du Dante sur la porte de l'enfer : Lasciate ogni speranza, voi che intrate. Vous qui entrez ici, laissez toute espérance. » C'est la devise des damnés. Chamfort, Caract. et anecd.,1794, p. 172
− MYTH. [La vérité] doit demeurer ensevelie dans le sein du sage, comme l'espérance au fond de la boîte de Pandore (Chateaubr., Essai Révol.,t. 2, 1797, p. 268).
c) Locutions
− Contre toute espérance. Contre toute attente, alors que personne ne s'y attendait, ne l'espérait (cf. Rob., Lar. Lang. fr.).
− De grande/belle/haute/riche espérance (vieilli). Dont on espère beaucoup; qui donne dès maintenant une haute idée de ce que sera l'avenir. Jeune homme de la plus haute espérance (Delille, Homme des champs,1800, p. xix):
[...]
♦ Avoir des espérances. Être enceinte. Laura m'a confié qu'elle avait des espérances; mais chut!... elle préfère qu'on ne le sache pas encore (Gide, Faux-monn.,1925, p. 1122).
♦ (Avoir des) espérances. (Avoir un) héritage en perspective. Monsieur diplômé, (...) recherche en vue mariage jeune personne (...) avec dot minimum 500 000 et espér. possible (Montherl., J. filles,1936, p. 925):
9. ... je fis remarquer à mon ami que d'excellentes gens emploient communément le mot « espérances » pour désigner la fortune qui doit leur échoir lorsqu'ils auront eu le malheur de devenir orphelins. « Cent mille francs de dot, sans compter les espérances... » Petite phrase coutumière et qui n'a pas l'air méchant, mais qui ouvre un jour, comme on dit, sur les bas-fonds humains. Mauriac, Journal 1,1934, p. 60.
Prononc. et Orth. : [εspeʀ ɑ ̃:s]. D'apr. Grammont Prononc. 1958, p. 41 : [εspε ʀ ɑ ̃:s], p. harmonis. vocalique. Ds Ac. dep. 1694. Étymol. et Hist. 1. Ca 1100 n'aveir esperance de « ne pas s'attendre à » (Roland, éd. J. Bédier, 1411); 2. 1remoitié xiies. esperance « disposition de l'âme qui nous fait considérer ce que nous désirons comme devant se réaliser » (Psautier Oxford, éd. Fr. Michel, LXI, 7, p. 79); 3. mil. xiies. « personne ou chose sur laquelle on fonde son espérance » (Psautier Cambridge, éd. Fr. Michel, LXI, 8, p. 105). Dér. du rad. de espérer*; suff. -ance*. Fréq. abs. littér. : 6 700. Fréq. rel. littér. : xixes. : a) 15 418, b) 9 311; xxes. : a) 7 534, b) 5 815. Bbg. Gossen (C.-T.). Ma plus douce espérance est de perdre l'espoir. Z. rom. Philol. 1955, t. 71, pp. 337-364.
</code>
</pre><h4 id="toc_4">Conjugaison</h4>
<p>La conjugaison c'est l'art d'accorder genre et nombre dans le passé, le présent et futur.</p>
<p><a href="http://perso.b2b2c.ca/sarrazip/dev/verbiste.html">Verbiste</a> est un système de conjugaison française. Il s'agit d'une librairie écrite en C++, de deux programmes aussi écrits en C++ qui peuvent être utilisés à la ligne de commande ou à partir d'un autre programme, et d'une applet GNOME. Il est sûrement disponible dans les dépots de votre distribution favorite.</p>
<p><a href="http://leconjugueur.lefigaro.fr">Leconjugueur.com</a> est le conjugueur en ligne du site du journal <em>Le Figaro</em>. Il y a de la publicité mais il est plus complet que Verbiste. Il semble qu'il y ait <a href="http://leconjugueur.lefigaro.fr/frtelechargelinux.php">un client lourd pour GNU/Linux</a> mais il ne doit pas être libre et je ne l'ai jamais testé.</p>
<h4 id="toc_5">Grammaire</h4>
<p>La grammaire c'est le fondement d'une langue ou d'un langage.</p>
<p><a href="http://grammaire.reverso.net">Reverso.net</a> semble être une ressource de qualité. Je ne l'ai jamais utilisé mais il doit permettre d'apprendre ou réviser sa grammaire de manière efficace. Par exemple la page sur la proposition relative ressemble à ça :</p>
<pre>
<code class="text">La proposition relative
La proposition relative est une subordonnée introduite par un pronom relatif (qui, que, quoi, dont, où, lequel, quiconque). a) C'est le bureau dans lequel il a toujours travaillé. b) Vous compléterez le dossier que vous avez reçu. c) Je l'aperçois qui arrive en toute hâte. d) Qui veut voyager loin ménage sa monture. e) Embrassez qui vous voudrez. La proposition relative est généralement complément de l'antécédent du pronom relatif.
a) La proposition dans lequel il a toujours travaillé est complément du nom antécédent bureau (tout comme le serait du directeur dans une phrase telle que C'est le bureau du directeur).
b) La proposition que vous avez reçu est complément du nom antécédent dossier.
c) La proposition qui arrive en tout hâte est complément du pronom antécédent l'.
Quand le pronom relatif n'a pas d'antécédent, la relative est sujet (d) ou complément (e) du verbe de la principale.
Le pronom relatif, contrairement à la conjonction de subordination, a toujours une fonction dans la relative. a) lequel : complément circonstanciel du verbe a travaillé. b) que : complément d'objet direct du verbe avez reçu. c) qui : sujet du verbe arrive. d) qui : sujet du verbe veut voyager. e) qui : complément d'objet direct du verbe voudrez. Le verbe de la relative peut être à l'infinitif. Dans ce cas, le sujet n'est pas exprimé. Il répertorie les organismes à qui adresser une demande de subventions. La proposition relative peut ne pas comporter de verbe, notamment avec dont et voici, voilà. C'est un statut particulier puisque normalement toute proposition se compose d'un sujet et d'un verbe. Aliette a eu neuf enfants dont huit filles. L'homme que voici est notre nouveau directeur.
</code>
</pre><h3 id="toc_6">Conclusion</h3>
<p>La clé pour bien écrire c'est de lire beaucoup, ça aide énormément. À force de <em>voir</em> le français écrit correctement on arrive à l'intégrer et à l'écrire mieux. Savoir s'exprimer dans un français correct, un français commun, est le pré-requis à une diffusion efficace de ses idées à l'oral et surtout à l'écrit. J'ai conscience que cet effort peut paraître insurmontable, mais c'est une obligation inévitable.</p>
<p>J'espère que ce journal ne vous aura pas trop chauffé les neurones car en cette période de canicule les miens semblent fondre de par cette chaleur diabolique.</p><div><a href="https://linuxfr.org/users/m4rotte/journaux/la-langue-francaise-un-standard-commun.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/95237/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/m4rotte/journaux/la-langue-francaise-un-standard-commun#comments">ouvrir dans le navigateur</a>
</p>
Marotte ⛧https://linuxfr.org/nodes/95237/comments.atomtag:linuxfr.org,2005:Diary/328812012-07-25T21:19:15+02:002012-07-25T21:19:15+02:00apprendre à lire et à dactylographier en chinois avec des outils libresLicence CC By‑SA http://creativecommons.org/licenses/by-sa/3.0/deed.fr<h2 id="sommaire">Sommaire</h2>
<ul><li>
<a href="#toc_0">Introduction</a>
<ul><li>
<a href="#toc_1">I. Lire le chinois</a>
<ul><li>
<a href="#toc_2">1.1 l'objectif : associer un sens à un idéogramme</a>
<ul><li>
<a href="#toc_3">1.1.1 les dictionnaires électroniques avec Firefox</a>
</li>
<li>
<a href="#toc_4">1.1.1 les dictionnaires électroniques sans Firefox</a>
</li>
<li>
<a href="#toc_5">1.1.1.1 étymologie</a>
</li>
<li>
<a href="#toc_6">1.1.1.2 les moteurs de recherche d‘exemple de phrase :</a>
</li>
</ul></li>
<li>
<a href="#toc_7">1.1.2 les dictionnaires papier</a>
</li>
<li>
<a href="#toc_8">1.1.3. Grammaire</a>
</li>
<li>
<a href="#toc_9">1.2 l'objectif : associer un son à un idéogramme</a>
</li>
</ul></li>
<li>
<a href="#toc_10">II. Taper en chinois</a>
<ul><li>
<a href="#toc_11">2.1 l'objectif : entrer au clavier un idéogramme</a>
</li>
<li>
<a href="#toc_12">2.1.1 Le Wubi : une saisie au clavier qui favorise la mémorisation.</a>
</li>
</ul></li>
<li>
<a href="#toc_13">IV.Interface généraliste et utilitaire</a>
</li>
<li>
<a href="#toc_14">V. Mise en oeuvre :</a>
<ul><li>
<a href="#toc_15">5.1. Critères d'appréciations.</a>
<ul><li>
<a href="#toc_16">5.1.1.Observations préalables et premier critère</a>
</li>
<li>
<a href="#toc_17">5.1.1.1 Ajout de considération sur le Wubi et le Pinyin</a>
</li>
</ul></li>
<li>
<a href="#toc_18">5.1.2 Second critère</a>
</li>
</ul></li>
<li>
<a href="#toc_19"> VI. La suite de logiciel que j'utilise</a>
<ul><li>
<a href="#toc_20">6.1 le vocabulaire, la grammaire et la syntaxe:</a>
</li>
<li>
<a href="#toc_21">6.2 l'association phonétique</a>
</li>
<li>
<a href="#toc_22">6.3 la dactylographie</a>
</li>
<li>
<a href="#toc_23">6.4 Pendant le surf</a>
</li>
<li>
<a href="#toc_24">6.5 le contrôle des connaissances</a>
</li>
<li>
<a href="#toc_25">6.6 approfondissement de la grammaire</a>
</li>
<li>
<a href="#toc_26">7.1 analyse de texte</a>
</li>
<li>
<a href="#toc_27">7.2 le contrôle de l'analyse</a>
</li>
</ul></li>
</ul></li>
<li>
<a href="#toc_28">VII Conclusion provisoire</a>
</li>
</ul><h2 id="toc_0">Introduction</h2>
<p>Cet article se donne pour but de présenter une mise à jour dans le domaine de l'apprentissage en autodidacte de la lecture et de la dactylographie du chinois par le biais d'outils libres. Il reprend une structure identique au premier, et se focalise sur les mises à jour significatives qui n'existaient pas encore , ou qui n'étaient pas encore portées à ma connaissance. Lorsqu'aucun changement majeur n'est intervenu, il sera fait un renvoi à <a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres">l'article précédent.</a> </p>
<p>Bien que certains domaines ne soient pas encore pleinement couverts par le libre, l'utilisation de logiciel libre dans un contexte d'apprentissage et de découverte du chinois devient de plus en plus abordable, les sources d'informations ainsi que les outils commencent à devenir matures et pleinement fonctionnels. Ce foisonnement nous amènera à rationaliser le système d'apprentissage lors de la mise sur pied effective du processus par le biais de critères distinctifs. </p>
<p>La première partie présentera les différents outils d'aide à l'apprentissage de la lecture, la seconde sera consacrée à la partie dactylographie (qui poursuit le double objectif de rendre durable la compétence de lecture et rapide la saisie du chinois au clavier ) et la dernière section à la mise en oeuvre concrète de cette suite de logiciels. À ce dernier stade, quelques observations préalables seront posées afin de fournir des critères d'évaluation pertinents face à la multitude des méthodes. </p>
<h3 id="toc_1">I. Lire le chinois</h3>
<h4 id="toc_2">1.1 l'objectif : associer un sens à un idéogramme</h4>
<h5 id="toc_3">1.1.1 les dictionnaires électroniques avec Firefox</h5>
<p>Deux plug-ins sont en concurrence : Cantofish et Perapakun, et cela se comprend Cantofish est un fork de Perapakun. </p>
<p>Ils ne se différencient que par quelques détails qui peuvent néanmoins avoir toutes leurs importances.</p>
<p>Cantofish d'une part semble utiliser un dictionnaire plus fourni, et d'autre part , il permet d'enregistrer facilement dans un fichier en texte brut les mots ou groupes de mots qui nous semblent importants. Les options par défaut respectent le formatage Unix et le séparateur de champ et une Tabulation. </p>
<p>Perakun quant à lui se donne pour objectif de supporter d'autres langues asiatiques outre le chinois (japonais, coréen ). Son principal avantage réside dans le fait qu'il affiche les mots dans différentes couleurs en fonction de la tonalité de leur prononciation, une sorte de coloration syntaxique pour la phonétique. </p>
<p>L'inconvénient c'est qu'il ne comporte plus d'options d'enregistrement simple tel que Cantofish, par défaut Perapakun enregistre dans un menu qu'il affiche dans Firefox. Il peut exporter en txt, mais il est nécessaire de cocher au préalable les cases afin de sélectionner les mots à exporter, ce qui est moins rapide et plus fastidieux qu'un enregistrement automatique dans un fichier.</p>
<p>J'utilise les dictionnaires chinois anglais de Cantofish majoritairement, mais celui de Perapakun se vaut tout autant. J'ai aussi testé le dictionnaire chinois-français de Perapakun basé sur ( <a href="http://www.chine-informations.com/chinois/open/CFDICT/">CFDIT</a>) , la précision des traductions ne valent pas encore son homologue anglais. J'imagine que cela va en s'améliorant, à de rares exceptions près , je remarque en générale que les outils anglophones ont toujours une longueur d'avance.</p>
<h5 id="toc_4">1.1.1 les dictionnaires électroniques sans Firefox</h5>
<p>Goldendict reste un très bon logiciel de gestion de dictionnaire, autant en ligne qu'hors ligne. L'usage que j'en ai est l'utilisation de la fonction scan. Celle-ci permet lorsqu'elle est activée d'avoir la même fonction que les dictionnaires rollover venant des plug-ins Firefox. La seule différence c'est qu'elle n'est pas limitée au web. Elle peut scanner n'importe quel champ texte. Cela élargit considérablement l'étendue de la traduction (notamment les fichiers gérer par d'autres logiciels qu'un navigateur). L'on peut dans l'option assigner une touche pour éviter que le scan ne s'active intempestivement (assez gênant lorsque l'on ne souhaite pas l'utiliser et que la fenêtre de traduction s'affiche comme un popup publicitaire). Je lui ai assigné la touche Windows , étant donné qu'aucune fonction ne lui était assignée sous GNU/Linux. L'ajout de dictionnaire en ligne ou hors-ligne reste identique (cfr. <a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_4">article precédent</a> )</p>
<p>La base de données open source adsotrans, vient du projet <a href="http://popupchinese.com/">popup chinese</a>, qui est un autre dictionnaire rollover (non libre ) en greffon sous Firefox. Le projet principalement enregistre les mots dont les utilisateurs souhaitent garder la trace sur leur serveur. De sorte que la base de données adsotrans s'enrichit des listes des mots glannées par leurs usagers sur le net. Cela ajoute les néologismes venant de phénomène de la pop culture (notamment la cyberculture venant des netizens ) qui ne sont pas encore enregistrés dans les dictionnaires traditionnels. La dernière version a été releaser le 3 février 2012.</p>
<p>dans le tarball <a href="http://www.adsotrans.com/downloads/">adso-v5.079.tar.gz</a></p>
<p>L'usage que j'en fais se situe principalement dans la constitution d'un champ sémantique spécialisé. Par exemple :</p>
<pre>
<code class=""> gnu@robby:~/Downloads$ cat adso.dat | grep "computer"
上电脑 上電腦 [shang4 dian4nao3 ] /to use the computer/
上电脑游戏 上電腦游戲 [shang4dian4 nao3 you2xi4 ] /to play computer games/
个人电脑 個人電腦 [ge4ren2 dian4nao3 ] /personal computer/
个人计算机 個人計算機 [ge5ren2ji4suan4ji1] /personal computer/
人机交互 人機交互 [ren2ji1jiao1hu4] /human-computer interaction/
低级语言 低級語言 [di1ji2yu3yan2] /low level computer language/
低阶语言 低階語言 [di1jie1yu3yan2] /low level computer language/
</code>
</pre>
<p>Caractéristique : la version précédente datant du 16 aout 2010 comportait 186 973 entrées (disponible <a href="http://sourceforge.net/projects/openscene/files/wubi/bash/adsotrans/adso.wubi86.0.2.dat/download">ici</a> , la version en date du 3 février 2012 comporte 132 206 entrées. J'ignore la raison de cette diminution. </p>
<p>le <a href="http://sourceforge.net/projects/openscene/files/wubi/bash/adsotrans/popup.chinese.wubi86.0.1.sh/download">script</a> ajoutant le champ wubi86 devrait encore fonctionné et devrait donner le résultat suivant</p>
<pre>
<code class="">一下 一下 [yi1xia4] /a little/ :g.gh.:
一下儿 一下兒 [yi1xia4r5] /a little bit/ :g.gh.qt.:
一下击鼓声 一下擊鼓聲 [yi1xia4ji1gu3sheng1] /dub/ :g.gh.fmk.fkuc.fnr.:
一下子 一下子 [yi1xia4zi5] /in a short while/ :g.gh.bb.:
一不做二不休 [] /if you set a goal for yourself, persevere until you accomplish it/ :g.gi.wdt.fg.gi.ws.:
一丘之貉 [] /weasels from the same nest/ :g.rgd.pp.eetk.:
一丛柔毛 一叢柔毛 [yi1cong2rou2mao2] /flocculus/ :g.wwg.cbts.tfn.:
一丝一丝 一絲一絲 [] /thread by thread/ :g.xxg.g.xxg.:
</code>
</pre>
<p>Il devrait aussi être possible de le convertir en dictionnaire au format stardict pour le faire gérer par goldendict. Je réserve la question pour un autre épisode. Si quelqu'un souhaite expérimenter, le blog <a href="http://jalasthana.de/?p=828">Jalastha</a> montre la démarche, principalement il faut convertir les séparateurs de champ en Tabulation et faire convertir le fichier par stardict-editor , il en ressortira les 3 fichiers permettant l'indexation nécessaire à goldendict ( adso.dict.dz, adso.idx and adso.ifo ). I</p>
<p><strong>Glossaire des interprètes des Nations-Unies :</strong> </p>
<p>Dans le domaine spécialisé , différents glossaires ont été compilés , notamment par les interprètes des Nations Unis. Selon les <a href="http://www.un.org/en/aboutun/terms/index.shtml#disclaimer">conditions générales d'utilisation</a> , il est possible de les télécharger pour un usage personnel. Pas de reproduction dans un but commercial. Le domaine couvert étant très large je met en lien les glossaires susceptibles d' intéresser les libristes.</p>
<p><a href="http://un-interpreters.org/glossaries/humanrights.doc">Droits de l'Homme</a> <br /><a href="http://un-interpreters.org/glossaries/Informationcom.doc">Information, Committee</a><br /><a href="http://un-interpreters.org/glossaries/information-security-ec.doc">Information security</a> , (<a href="http://un-interpreters.org/glossaries/Information%20security%20and%20ICT_%20EF.doc">E-F)</a><br /><a href="http://un-interpreters.org/glossaries/internet%20governance.doc">Internet Governance</a>: <br /><a href="http://un-interpreters.org/glossaries/latina-c.html">Latin Expressions</a>, <a href="http://un-interpreters.org/glossaries/latind-h.html">(D to H)</a>, <a href="http://un-interpreters.org/glossaries/latini-o.html">(I to O)</a>, <a href="http://un-interpreters.org/glossaries/latinp-v.html">(P to V)</a> <br /><a href="http://un-interpreters.org/glossaries/lawlatin.html">Legal Terms (Latin-Chinese)</a>:<br /><br /><a href="http://un-interpreters.org/glossaries/NGO-efsrac.doc">NGOs</a> <br /><a href="http://un-interpreters.org/glossaries/electroniccommerce.doc">UNCITRAL Electronic Commerce</a><br /><a href="http://un-interpreters.org/glossaries/statistical-comission-ecfs.doc">Statistics</a> </p>
<p>De plus l'institution s'est constitué un moteur de recherche des terminologies utilisé nommé l'' <a href="http://unterm.un.org">United Nations Multilingual Terminology Database.</a> Le site ne semble pas (encore ? ) être passé à la mode criarde du web 2.0. Il est sobre , simple et permet l'accès rapidement à l'information. Il demande qu'un navigateur ayant le minimum requît pour comprendre le HTML. Cerise sur le gâteau , il recommande dans sa Faq de passer à des navigateurs supportant l'utf8 , et il en explique la raison (la nécessite d'une gestion des langues non alphabétiques de manière uniforme et standardisée).<br /><br />
Il est possible de l'ajouter à Goldendict pour pouvoir faire une recherche automatiquement, la ligne à ajouter dans les options des dictionnaires en ligne : <a href="http://unterm.un.org/dgaacs/unterm.nsf/WebView?SearchView&Query=%GDWORD%&SearchOrder=1&SearchMax=250&SearchWV=TRUE&SearchFuzzy=FALSE&Start=1&Count=0">http://unterm.un.org/dgaacs/unterm.nsf/WebView?SearchView&Query=%GDWORD%&SearchOrder=1&SearchMax=250&SearchWV=TRUE&SearchFuzzy=FALSE&Start=1&Count=0</a></p>
<h5 id="toc_5">1.1.1.1 étymologie</h5>
<p>
<strong>Zhongwen</strong>
</p>
<p>Pour l'étymologie , j'utilise toujours zhongwen.net à travers le script harb.sh (<a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_4">cfr. article précédent</a>) venant du site <a href="http://wargle.blogspot.be/2009/10/looking-up-kanjihanzi-quickly-on.html">suivant</a>, dont le contenu :</p>
<pre>
<code class=""> #! /bin/bash -e
if [ -z "$@" ]; then
echo Usage:./harb char1 char2 ...
echo
echo Will print the zhongwen.com URL for the characters and pass them to browser
fi
while [ $# -gt 0 ]; do
url=$(
echo $1| iconv -t big5| \
perl -lne '@c=unpack("CC", $_); print "http://zhongwen.com/d/$c[0]/x$c[1].htm"'
)
echo $URL
browser "$URL"
shift
done
</code>
</pre>
<p><strong>Archchinese</strong> </p>
<p><a href="http://www.archchinese.com/">Archchinese</a> est un site qui se propose de mettre différents outils disponibles en ligne à la portée de l'étudiant. Certains services sont payants (notamment la composition de son glossaire personnelle) , mais l'usage qui nous intéresse est le tracé des traits et l'analyse des radicaux (en accès libre). </p>
<p>Le script pour accéder de la même manière : harb2.sh </p>
<pre>
<code class=""> #! /bin/bash -e
read Zh
url=http://www.archchinese.com/chinese_english_dictionary.html?find=$Zh
echo $URL
browser "$URL"
shift
</code>
</pre>
<p>Le script ouvre directement le caractère recherché par un query , et va montrer le tracé (animation en flash ). l'accès à l'information est plus rapide, et son contenue plus complet (que certain site qui n'ont pas l'animation des traits pour chaque caractère ,dont chinesetools.eu/) </p>
<p>
<a href="http://www.chinesetools.eu/">Chinese TOOLS.EU</a>
</p>
<p>Ce site à l'avantage de montrer la configuration du caractère (sa structure générale) et sa décomposition en radicaux, ainsi que les caractères Wubi correspondants. Ce qui favorise la vitesse de mémorisation étant donné que toutes les informations pertinentes sont rassemblées au même endroit. </p>
<p>La non-standardisation de l'encodage ne m'a pas permis d'écrire un script car j'ignore la correspondance du query utf8 vers l'autre encodage(exemple : la requête du caractère 右 me retourne l'URL sous cette forme <a href="http://www.chinesetools.eu/chinese-dictionary/?q=%26%2321491%3B&champs=all&Submit=Search&ca=&tr=">http://www.chinesetools.eu/chinese-dictionary/?q=%26%2321491%3B&champs=all&Submit=Search&ca=&tr=</a> (le query n'est pas compréhensible ).</p>
<h5 id="toc_6">1.1.1.2 les moteurs de recherche d‘exemple de phrase :</h5>
<p>
<strong><a href="http://www.nciku.com/">Nciku</a> et <a href="http://www.jukuu.com/">Jukuu</a></strong>
</p>
<p>J'ai testé les site Nciuk et Jukuu dont la fonction principale est d'afficher des exemples de phrases selon l'idéogramme ou le groupe d'idéogrammes recherché. Bien que je ne ressente pas encore le besoin de les utiliser couramment. Nciuk offre en plus la synthèse vocale sur les réponses. J'ai été assez impressionné par le niveau de langue de ces deux moteurs de recherches, avec un niveau plus élevé pour Nciuk. A titre d'exemple les idéogrammes : 判断 (qui signifie juger, jugement, décider ) </p>
<p>Nciuk<br /><em>实测和目测是有差距的,我们不应根据目测的数据来作判断。 <br />
There are differences between actual measurement and visual inspection, so we shouldn't make judgments based on the data from visual inspections</em>. </p>
<p>Jukuu<br /><em>We would all like to have an intelligent and self-motivated assistant who shows initiative, drive, good judgment, and a keen memory. 我们都希望有个聪明且自觉的助手,具有灵敏的直觉、源源不断的动力和好的判断,以及值得信赖的记忆。</em> </p>
<p>Quant à Jukuu il donne ,outre les exemples, la distribution de l'usage de l'idéogramme dans la langue , ainsi que les mots avec lequel il est le plus associé . La recherche précédente nous indique les adjectifs avec lesquels ces caractères sont le plus fréquemment qualifié (正确 : adéquat ) , les verbes auxquels ils se conjuguent régulièrement ( 作出 : prendre , prendre une décision ) ainsi que les noms auxquels ils s'associent facilement. </p>
<h4 id="toc_7">1.1.2 les dictionnaires papier</h4>
<p>Je ne reviendrais pas sur chinese character finder , qui et véritablement un outil tout terrain. Si vous avez déjà essayé de chercher dans un dictionnaire ou une encyclopédie chinoise un mot, et que vous ne connaissais pas son pinyin, ni la manière dont la table Kangxi est organisé , vous comprendrez que retrouver un caractère rapidement dans ces conditions est une gageure. Le livre permet d'arriver à retrouver le caractère (les caractères du HSK ) en un temps record (quelques minutes ), grâce à sa méthode d'indexation par structure. Je vous renvoie pour <a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_6">les détails à l'article précédent</a>.</p>
<p><a href="http://www.amazon.fr/Caract%C3%A8res-chinois-Edoardo-Fazzioli/dp/2081120046"><em>Caractère chinois</em> d'Edoardo Fazzioli</a>, est un ouvrage (qui était vendu en occasion) qui recense les 214 radicaux et leur donne une explication étymologique en français, j'imagine que d'autres livres du même genre existent. Je le mentionne pour information. Il a pour particularité de classer les idéogrammes en fonction de leurs champs lexicaux, cela à pour but de faire revenir au processus de pensée de classement analogique utilisé lors de la reconnaissance de caractère.la seule chose c'est qu'il n'y figure pas la numérotation selon leur ordre kangxi (est-ce une omission de la linéarité ? ). J'ai ajouter les numéro à la main, et imprimer un pdf pour y retrouver les pages. </p>
<h4 id="toc_8">1.1.3. Grammaire</h4>
<p><strong>Electronique</strong> </p>
<p>Pour la grammaire , je n'ai pas encore trouvé d'outil équivalent à <a href="http://hlt030.cse.ust.hk/research/c-assert/">Assert-c</a>. Ce fait ne m'étonne pas étant donné que celui-ci est lui-même un projet de recherche universitaire , quelques recherches m'ont confirmé qu'il ne semble pas encore exister sur le marché ou sur internet d'outil de POS tag automatique ayant un niveau supérieur à Assert-c. Je renvoie pour <a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_5">les détails au premier article</a>. Il est savoir que je n'ai pas réussis à l'installer sous ubuntu 12.04 (en outre, je trouve que celui-ci manque un certain nombre de logiciels dans leurs dépôts , j'ignore pourquoi d'ailleurs ). Denière précision , il est basé sur un projet du MIT utilisant les réseaux de neurones eux-mêmes sous GPL (et qui est focalisé sur l'anglais ). </p>
<p><em>WUBI</em> </p>
<p>Mon utilisation, après la sortie du fichier en POS, je le mets dans un script qui permet d'ajouter une ligne wubi86 en dessous de chaque caractère. Ensuite je convertis le fichier cSv en HTML , pour avoir un meilleur rendu et pouvoir utiliser les dictionnaires rollover (cantofish et perakun) sous Firefox. <br />
La conversion en HTML se fait via le service CSV converter : <a href="http://area23.brightbyte.de/csv2wp.php">http://area23.brightbyte.de/csv2wp.php</a>. Si quelqu'un à un script bash simple qui fait le même résultat je suis preneur (le séparateur de champ est la tabulation ). </p>
<p>
<strong>Papier</strong>
</p>
<p>Une découverte assez majeure dans le domaine. Si vous avez appris ou tenté d'apprendre le chinois avec les livres qui sont traditionnellement dans le commerce (ou même dans une haute école dédiée à la traduction et à l'interprétariat). Vous trouverez peut-être que la manière d'enseigner le chinois reste très basique et mène rapidement à certaines confusions du point de vue grammatical. Par hasard, chez un libraire spécialisé, j'ai trouvé un ouvrage nommé<a href="http://www.amazon.fr/Guide-grammatical-chinois-Jacques-H%C3%A9delin/dp/2842793846"> guide grammatical du chinois</a>. J'étais assez curieux et un peu dubitatif (au vu du matériel généralement mis sur le marché ) au départ. Je pensais avoir à faire soit à un quasi-traité dans le domaine de la recherche en linguistique (ultra pointu et difficilement utilisable en tant que guide ) , soit un autre livre de type le chinois-sans-peine (mais sans contenu aussi ). Hé bien, je dois dire que j'ai été agréablement surpris , ce livre est véritablement un guide de grammaire. Il s'adresse véritablement aux francophones, c'est-à-dire que l'auteur explique correctement et très précisément les différents points de grammaire, dans une forme accessible et familière à tous étudiants ayant dû apprendre la grammaire française sur les bancs de l'école. le prix est très largement compensé par la qualité du matériel. <a href="http://www.amazon.fr/Guide-grammatical-chinois-Jacques-H%C3%A9delin/dp/2842793846">L'auteur Jean-Jacques Hédelin</a> a été correcteur-traducteur pour une maison d'édition chinoise. Il a aussi été enseignant de français en Chine et de chinois en France. </p>
<p>Le livre <a href="http://www.amazon.com/Chinese-English-Frequency-Dictionary-Mandarin-Frequently/dp/0781808421">chinese-english frequency dictionnary</a> complète assez bien l'ouvrage précédent. En effet, étant donné son classement par ordre de fréquence , permet de connaitre précisément les mots plus importants à maitriser. Ainsi que ses usages les plus courants, y compris les dérivées. Armées de cette information , il ne suffit plus que de consulter le guide grammatical du chinois pour aborder clairement le point de grammaire le concernant. <a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_6">(cf article précédent pour les détails )</a> </p>
<h4 id="toc_9">1.2 l'objectif : associer un son à un idéogramme</h4>
<p><strong>Flashcard.0.2.sh</strong> </p>
<p>L'idée est d'utiliser la méthode nommée en anglais "flashcard" , c'est à dire l'affichage d'un idéogramme et la répétition du son qui lui est associée. En outre ces logiciels comportent souvent un aspect "contrôle de connaissance" basé sur diverses méthodes statistiques. Ceux-ci ont pour but de déterminer la fréquence optimale de répétition afin d'ancrer dans la mémoire à long terme les nouveaux concepts. Je sais qu'il existe un certain nombre de logiciels en la matière, dont le plus fameux est Ankhi. Je n'ai pu utiliser ce dernier car des bugs subsistaient dans ma version (sous ubuntu 11.04 ).<br />
Google m'a proposé d'autres logiciels, dont Mnemosyne Project, Pauker, jVLT, granule, FlashQard, KWordQuiz et Parley. Chacun de ses programmes à ses qualités et défauts, mais il ne m'ont pas convaincue pour l'usage que je voulais en faire (je les ai testés sommairement, mais certaines fonctionnalités manquait déjà à la base).<br />
Étant donné que la synthèse vocale était déjà présente <a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_7">(ekho cf article précédent )</a> , et qu'il se trouvait sous la magnifique forme d'une ligne de commande. Dès lors, il suffisait d'afficher selon une liste donnée le caractère chinois à l'écran (manipuler du texte c'est ce que la philosophie Unix fait de mieux). J'ai commencé à écrire un script Bash qui synchronise l'affichage à la synthèse vocale en fonction d'un fichier CSV (en tabulation) prédéfinie. <br />
Je ne dirais pas que c'est un bijou Shell script, mais il fait ce qu'il est sensé faire de manière simple et rapide (selon la philosophie KISS). </p>
<p>En sortie cela donne l'affichage au centre de l'écran dans une boite en ASCII art (merci à boxes) des mots , phrases du fichier CSV,la prononciation par la synthèse vocale se fait après 2 secondes. On peut choisir la partie que l'on souhaite voir répéter ainsi que le nombre d'occurrences de la voix. Dans un terminal il faut au préalable zoomer assez fort pour pouvoir avoir les caractères dans une taille lisible (j'utilise terminator qui permet des zoom plus grand que le terminal de gnome ). </p>
<p>le code source : </p>
<pre>
<code class="">#!/bin/bash
#flashcard pour chinois audio 2 visuel
#set -xv
x=1
while [ $x -gt "0" ]
do
_COLUMNS=$(tput cols)
_LINES=$(tput lines)
# Set default message if $1 input not provided
_MESSAGE="${1:-Linux Shell Scripting Flashcard v0.2}"
# Calculate x and y coordinates so that we can display $MESSAGE
# centered in the screen
x=$(( $_LINES / 2 ))
y=$(( ( $_COLUMNS - ${#_MESSAGE} ) / 2 ))
# Clear the screen
tput clear
# set x and y position
tput cup $x $y
listeflag=0
#echo "chemin du fichier csv ?"
#read path
#sourceFilecsv=$path
vocabdir=/tmp/vocabdir_$(date +%d_%m_%Y)
vocabwubilast=vocab.wubi.final.0.1.csv
Defaultpath=$vocabdir/$vocabwubilast
pathflag=1
echo "Chemin par défaut ? (Oui=1 ; Non=0)"
read path
pathflag=$path
if [ $pathflag -eq "0" ]
then
echo "Entrer le chemin complet vers le fichier :"
read filepath
sourceFilecsv=$filepath
else
sourceFilecsv=$Defaultpath
fi
echo "le Nombre de mots est de "$( cut -f1 $sourceFilecsv | wc -l )
echo "Afficher la liste des mots ? (Oui=1 ; Non=0)"
read liste
listeflag=$liste
if [ $listeflag -gt "0" ]
then
cut -f1 $sourceFilecsv | awk '{ print FNR "." $0 }' | less
fi
wubiflag=0
boxfileInput=/tmp/boxfileInput.txt
boxfileInputWubi=/tmp/boxfileInputWubi.txt
OneWordisplay=/tmp/OneWordisplay.txt
OneWordisplayWubi=/tmp/OneWordisplayWubi.txt
pause=2
sequence=/tmp/seq.txt
echo "Entrer le début de la séquence :"
read entrer
debut=$entrer
clear
tput cup $x $y
echo "Entrer la fin de la séquence :"
read entrerfin
fin=$entrerfin
clear
tput cup $x $y
echo "Entrer l'interval entre les mots :"
read interval
clear
tput cup $x $y
echo "Afficher le code Wubi86 ? (Oui=1 ; Non=0)"
read wubi
wubiflag=$wubi
clear
tput cup $x $y
cut -f1 $sourceFilecsv | awk NR==$debut,NR==$fin > $boxfileInput
cut -f3 $sourceFilecsv | awk NR==$debut,NR==$fin > $boxfileInputWubi
cat $boxfileInput | wc -l > $sequence
for i in $( seq $( cat $sequence ) ) ;
do
echo $i. $( cat $boxfileInput | awk NR==$i ) > $OneWordisplay
echo $i. $( cat $boxfileInputWubi | awk NR==$i ) > $OneWordisplayWubi
if [ $wubiflag -gt "0" ]
then
cat $OneWordisplayWubi >> $OneWordisplay
clear
boxes -d peek -a c -s $( echo $( echo $_COLUMNS)x$( echo $_LINES) ) $OneWordisplay
sleep $pause
ekho $( cut -d ' ' -f2 $OneWordisplay | awk NR==1 )
else
clear
boxes -d peek -a c -s $( echo $( echo $_COLUMNS)x$( echo $_LINES) ) $OneWordisplay
sleep $pause
ekho $( cut -d ' ' -f2 $OneWordisplay | awk NR==1 )
fi
sleep $interval
done
echo "Recommencer ? (Oui=1 ; Non=0)"
read choice
x=$choice
#while done
done
</code>
</pre>
<p>A noter que les champs pris pour les mots sont le champ numéro 2 (cut -f2 ) et que le champ pour le wubi est le 3 (cut -f3 ). </p>
<p><strong>Figlet et toilet</strong> </p>
<p>Lors de ma réflexion sur flashcard.0.2.sh , j'avais au départ pensé à utiliser figlet pour afficher en ASCII art (et de manière plus lisible ) les caractères , mais je me suis aperçu que celui-ci ne gérait pas l'utf8. Je me suis tourné vers le logiciel"toilet" qui lui permettait ce support. Son site montrait un support des caractères japonais , alors je me suis dit que cela devrait fonctionner pour les caractères chinois. Mais cela n'était pas le cas. J'ai été sur le channel irc de #libcaca pour demander de l'aide. Sam Hocevar à modifié les sources pour y ajouté le support CJK , et faire afficher les fonts. le résultat : </p>
<p>La procédure : télécharger la dernière version de libcaca-0.99.beta18.tar.gz , ainsi que toilet-0.3.tar.gz. Aller dans libcaca/tools/ modifié le fichier makefont.c ajouté la ligne 0x4e00, 0xa000, en dessous de la ligne 0x30a0, 0x3100, /* Katakana: ロ ル */</p>
<p>faire :<br />
./bootstrap &&./configure && make && make update-fonts && make ; sudo make install </p>
<p>puis dans le répertoire toilet faire :</p>
<pre>
<code class="">make clean && make && makefonts && make ; sudo make install.
./toilet -d fonts -f mono12 你好
</code>
</pre>
<p><strong>Googletts</strong> </p>
<p>Au niveau de la traduction vocale, le moteur de Google prononce fréquemment les bonnes tonalités , en fonction de la phrase donnée. Cela s'approche d'une euphonie plus naturelle. l'entreprise permet un accès à son logiciel de synthèse vocale en ligne limité à un certain nombre de caractères, il donne en sortie un fichier mp3. <br />
Commandelinefu donne un certain nombre de lignes de commande pour l'utiliser à travers son terminal. <br />
notamment : la fonction suivante : </p>
<pre>
<code class="">say(){ mplayer -user-agent Mozilla "http://translate.google.com/translate_tts?tl=en&q=$(echo $* | sed 's#\ #\+#g')" > /dev/null 2>&1 ; }.
</code>
</pre>
<p>Une autre fonction pour enregistrer sur le disque dur </p>
<pre>
<code class="">curl -À "Mozilla" "http://translate.google.com/translate_tts?tl=en&q=hello+world" > hello.mp3
</code>
</pre>
<p>Le script Perl speak.pl permet d'enregistrer le fichier mp3 lorsqu'on donne en entrée un fichier texte brut. ( Usage:./speak.pl LANGUAGE IN.txt OUT.mp3 ) disponible ici : <a href="https://gist.github.com/3110049">https://gist.github.com/3110049</a>. Il ne m'est pas particulièrement utile actuellement vu la limitation au nombre de caractère, en outre il est nécessaire ligne pour pouvoir bénéficier du Googletts ce qui est un inconvénient au niveau de la flexibilité. </p>
<h3 id="toc_10">II. Taper en chinois</h3>
<h4 id="toc_11">2.1 l'objectif : entrer au clavier un idéogramme</h4>
<h4 id="toc_12">2.1.1 Le Wubi : une saisie au clavier qui favorise la mémorisation.</h4>
<p>Je ne reviendrais pas sur le fonctionnement du Wubi et l'esprit qui le sous-tend ainsi que les effets sur la mémoire à long terme du point de vue de l'apprentissage de la lecture (<a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_10">cf article précédent</a> ). Néanmoins J'ajoute certaines considérations dans la partie observations préalables. Je mentionne ici les nouveautés que j'ai vues en la matière. Dans l'article précédent, je parlais de la manière d'utiliser le Wubi sous Ubutu via Ibus. J'ai remarqué (et l'on m'a posé la question par email ), que celui-ci n'était pas encore complet au niveau de la table de saisi, certain caractère ne sont pas encore encodées. Par exemple l'email que j'ai reçu me démontrait que la frappe de la combinaison. "dee - " ne donnait rien sous ibus, alors que sous un autre logiciel de saisi la sortie est comme prévu la suivante "dee - 历". </p>
<p>
<strong>
<a href="http://fcitx-im.org/wiki/Fcitx">FCITX</a>
</strong>
</p>
<p>Cet autre logiciel, est un programme de saisi qui existe depuis en fait déjà fort longtemps (je l'ai connue sous une Knoppix 3.2 chinoise vers 2003 , c'est dire). Elle se nomme fcitx pour <a href="http://fcitx-im.org/wiki/Fcitx">free chinese input toy for X.</a> La première raison pour laquelle j'ai basculé sous ce logiciel (qui est devenu mature) est bien entendu sa relative exhaustivité des tables. La seconde se situe dans le fait qu'elle propose depuis récemment une table assez particulière : la Wubipinyin. Celle-ci à l'avantage de pouvoir accepter à la fois l'entrée en Wubi et en pinyin simultanément. Mais au-delà, elle affiche le code correspondant en Wubi lorsqu'on saisit un code pinyin. En fait elle fait "parser" en même temps que méthode de saisi. Ce qui favorise l'apprentissage progressif du Wubi d'une part et d'autre part de pouvoir répondre à l'urgence d'une saisie (les codes Pinyin étant annoté partout -dictionnaire , site - , on peut avoir le caractère assez facilement (avec le désavantage de l'homophonie …). Mais on peut le saisir plus rapidement dans ce cas que si l'on a pas encore du tout le code wubi (qui est rarement noté). Le blog <a href="http://asiatiques.blog.so-net.ne.jp/2011-05-30">Asiatiques</a> montre une procédure d'installation si fcitx n'est pas encore dans les dépôts. </p>
<p>Le projet fcitx est sur le point de se trouver un autre nom pour décrire ses objectifs, en chinois on le traduit par 小企鹅输入法, qui signifie littéralement la méthode de saisie du petit<br />
pingouin, en référence à son logo composé d' un Tux exhibant un pinceau de calligraphie. Il a aussi de nouveaux binding notamment <a href="http://code.google.com/p/fcitx/">fcitx-fbterm</a> (que je n'ai pas encore testé ).</p>
<p>
<strong>
<a href="http://www.yudit.org/">YUDIT</a>
</strong>
</p>
<p>Yudit quant à lui reste l'utilitaire de saisi multiplateforme, petit éditeur qui à la couleur d'un terminal et en imite certain fonctionnement et qui s'installe rapidement et sans dépendances système , ni dépendances à des logiciels tiers. Il dépanne très rapidement (notamment sous Windows ) ;</p>
<p>
<strong>FireInput</strong>
</p>
<p>Fireinput quant à lui est un greffon Firefox qui ajoute à celui-ci les différentes méthodes de saisi dont le wubi86 et 98. Il embarque aussi un petit éditeur texte. . Le site propose différentes versions , la version complète se trouve à l'adresse suivante : <a href="http://www.fireinput.com/releases/fireinput-2.6l.xpi">http://www.fireinput.com/releases/fireinput-2.6l.xpi</a></p>
<p>
<strong>Logiciel d'apprentissage du Wubi :</strong>
</p>
<p>Ayant écrit le script flashcard.sh, il me suffisait de l'adopté pour le transformer en aide à l'apprentissage des touches du clavier wubi. J'ai repris le poème wubi disponible sur Wikipedia. Le script se comporte de la même manière qu'avec une flashcard.0.2. le but est de mémoriser ici le type de radicaux et leur emplacement sur le clavier. Le fichier ascii art: </p>
<pre>
<code class="">[ ][ ][ ][ ][G](1.1) 王旁青头戋五一
[ ][ ][ ][F][<](1.2) 土士二干十寸雨
[ ][ ][D][<][<](1.3) 大犬三羊古石厂
[ ][S][<][<][<](1.4) 木丁西
[A][<][<][<][<](1.5) 工戈草头右框七
(2.1)[H][ ][ ][ ][ ] 目具上止卜虎皮
(2.2)[>][J][ ][ ][ ] 日早两竖与虫依
(2.3)[>][>][K][ ][ ] 口与川,字根稀
(2.4)[>][>][>][L][ ] 田甲方框四车力
(2.5)[>][>][>][>][M] 山由贝,下框几
[ ][ ][ ][ ][T](3.1) 禾竹一撇双人立,反文条头共三一
[ ][ ][ ][R][<](3.2) 白手看头三二斤
[ ][ ][E][<][<](3.3) 月彡(衫)乃用家衣底
[ ][W][<][<][<](3.4) 人和八,登祭头
[Q][<][<][<][<](3.5) 金勺缺点无尾鱼,犬旁留义儿一点夕,氏无七
(4.1)[Y][ ][ ][ ][ ] 言文方广在四一,高头一捺谁人去
(4.2)[>][U][ ][ ][ ] 立辛两点六门疒(病)
(4.3)[>][>][I][ ][ ] 水旁兴头小倒立
(4.4)[>][>][>][O][ ] 火业头,四点米
(4.5)[>][>][>][>][P] 之宝盖,摘示衣
[ ][ ][ ][ ][N](5.1) 已半巳满不出己,左框折尸心和羽
[ ][ ][ ][B][<](5.2) 子耳了也框向上
[ ][ ][V][<][<](5.3) 女刀九臼山朝西
[ ][C][<][<][<](5.4) 又巴马,丢矢矣
[X][<][<][<][<](5.5) 慈母无心弓和匕,幼无力
</code>
</pre>
<p>le code source : </p>
<pre>
<code class="">#!/bin/bash
#flashcard pour wubi keyboard
#set -xv
x=1
while [ $x -gt "0" ]
do
_COLUMNS=$(tput cols)
_LINES=$(tput lines)
# Set default message if $1 input not provided
_MESSAGE="${1:-Linux Shell Scripting Flashcard v0.1}"
# Calculate x and y coordinates so that we can display $MESSAGE
# centered in the screen
x=$(( $_LINES / 2 ))
y=$(( ( $_COLUMNS - ${#_MESSAGE} ) / 2 ))
# Clear the screen
tput clear
# set x and y position
tput cup $x $y
listeflag=0
#echo "chemin du fichier csv ?"
#read path
#sourceFilecsv=$path
Defaultpath=/home/gnu/Documents/wubi.keymap.0.2.csv
pathflag=1
echo "Chemin par défaut ? (Oui=1 ; Non=0)"
read path
pathflag=$path
if [ $pathflag -eq "0" ]
then
echo "Entrer le chemin complet vers le fichier :"
read filepath
sourceFilecsv=$filepath
else
sourceFilecsv=$Defaultpath
fi
echo "le Nombre de mots est de "$( cut -f1 $sourceFilecsv | wc -l )
echo "Afficher la liste des mots ? (Oui=1 ; Non=0)"
read liste
listeflag=$liste
if [ $listeflag -gt "0" ]
then
cut -f2 $sourceFilecsv | awk '{ print FNR "." $0 }' | less
fi
wubiflag=0
boxfileInput=/tmp/boxfileInput.txt
boxfileInputWubi=/tmp/boxfileInputWubi.txt
OneWordisplay=/tmp/OneWordisplay.txt
OneWordisplayWubi=/tmp/OneWordisplayWubi.txt
pause=2
sequence=/tmp/seq.txt
echo "Entrer le début de la séquence :"
read entrer
debut=$entrer
clear
tput cup $x $y
echo "Entrer la fin de la séquence :"
read entrerfin
fin=$entrerfin
clear
tput cup $x $y
echo "Entrer l'interval entre les mots :"
read interval
clear
tput cup $x $y
echo "Entrer le nombre de répétition ( minimum 1 )"
read repeat
repetition=$repeat
clear
tput cup $x $y
echo "Afficher le code Wubi86 ? (Oui=1 ; Non=0)"
read wubi
wubiflag=$wubi
clear
tput cup $x $y
cut -f2 $sourceFilecsv | awk NR==$debut,NR==$fin > $boxfileInput
cut -f1 $sourceFilecsv | awk NR==$debut,NR==$fin > $boxfileInputWubi
cat $boxfileInput | wc -l > $sequence
for i in $( seq $( cat $sequence ) ) ;
do
echo $i. $( cat $boxfileInput | awk NR==$i ) > $OneWordisplay
echo $i. $( cat $boxfileInputWubi | awk NR==$i ) > $OneWordisplayWubi
if [ $wubiflag -gt "0" ]
then
cat $OneWordisplayWubi >> $OneWordisplay
clear
boxes -d peek -a c -s $( echo $( echo $_COLUMNS)x$( echo $_LINES) ) $OneWordisplay
sleep $pause
for r in $( seq $repetition ) ; do
ekho $( cut -d ' ' -f2 $OneWordisplay | awk NR==1 ) ;
sleep 2
done
else
clear
boxes -d peek -a c -s $( echo $( echo $_COLUMNS)x$( echo $_LINES) ) $OneWordisplay
sleep $pause
for r in $( seq $repetition ) ; do
ekho $( cut -d ' ' -f2 $OneWordisplay | awk NR==1 ) ;
sleep 2
done
fi
sleep $interval
done
echo "Recommencer ? (Oui=1 ; Non=0)"
read choice
x=$choice
#while done
done
</code>
</pre>
<p>
<strong>Considération sur Tuxtyping</strong>
</p>
<p>Il existe dans le monde du logiciel propriétaire un grand nombre de programmes (en chinois essentiellement) orienté vers l'apprentissage du Wubi. Il n'existe à ma connaissance pas encore de logiciel de ce type dans le libre. </p>
<p>La dernière fois j'avais émis l'hypothèse que Tuxtyping pourrait en tant que logiciel d'apprentissage de la dactylographie, y adjoindre une section Wubi,<a href="http://linuxfr.org/users/eastwind/journaux/apprendre-%C3%A0-lire-et-taper-en-chinois-avec-des-outils-libres#toc_15">(cf article précédent )</a>. J'avais vu qu'il y avait eu une internationalisation en chinois de celui-ci et j'en avais contacté l'auteur. Il m'a répondu que le paquet en pinyin n'avait pas été envoyé en upstream. Et qu'en outre un problème de codage existait (dont j'ignore la nature ).Tout cela est bien triste pour le libre. </p>
<p>
<strong>Considération sur la méthode de saisie par simulation d'écriture (handwriting) :</strong>
</p>
<p>Il existe à côté des méthodes de saisies par clavier , la méthode de saisi par dessin. Celle-ci consiste via soit la souris , ou une tablette graphique munie d'un stylet ou sur un écran tactile à dessiner directement les traits , par imitation avec le processus d'écriture. C'est la raison pour laquelle les Anglais l'appellent handwriting. Lors de la saisi le logiciel est sensé reconnaitre automatiquement en fonction des traits , le mot adéquats. Celui-ci m'intéresse dans un seul cas de figure, dans la situation où le temps est compté et que l'on ne trouve ni le code Wubi, ni le code Pinyin , ni la définition , ni la traduction d'un idéogramme spécifique , alors il ne reste plus qu'à le dessiner. Dans le logiciel propriétaire le leader en la matière est PenPower , je ne l'ai jamais utilisé personnellement. Je sais simplement qu'il est utilisé par la génération des personnes dont l'ordinateur était plus difficile d'accès que la nôtre (je fais référence aux cinquantenaires et plus ). Ceux-ci non habitué au clavier , sont plus à l'aise avec la simulation de l'écriture. En outre , je me souviens que la société éditrice de PenPower a proposé ses logiciels sur la plateforme du Nokia N900 Maemo. </p>
<p>Dans le domaine du libre, les deux logiciels que j'utilise si je me retrouve dans ce cas de figure (qui est rare ), c'est Yudit et <a href="http://www.kiang.org/jordan/software/hanzilookup/">Hanzilookup</a>. Yudit possède une mini méthode de saisie à la main. Celle-ci néanmoins est relativement limitée, elle s'accommode mal des caractères à l'enchainement de traits plus complexes. Quant à Hanzilookup , il fait la même chose , mais de manière plus précise. Le problème c'est qu'il donne en sortie le caractère au format … image ! Il donne aussi la définition de celui-ci, ce qui permet de le retrouver par la traduction. Pour terminer , j'ai testé <a href="http://www.tegaki.org/">Teragaki</a> qui est un logiciel qui semble avoir pour but de devenir le PenPower du libre, pour le moment le logiciel est encore dans une phase Béta version.</p>
<p><strong>Considération sur la reconnaissance optique de caractère ( OCR )</strong> </p>
<p>Le principal moteur d'OCR libre est tesseract (libéré par HP), il existe des datasets pour le chinois simplifié et traditionnel , il existe aussi une interface graphique en GTK nommé Ocrfeeder. Celui-ci bug lors de sa configuration. Le résultat en l'état n'est pas exploitable. Il est actuellement impossible de l'utiliser pour numériser des textes. À ce niveau je n'ai d'autre solution que de me tourner vers le logiciel propriétaire en la matière , à savoir ABBY. Je l'utilise sous Virtualbox sous Windows XP. </p>
<p>III Le Contrôle des connaissances :</p>
<p>Après la phase d'apprentissage vient la phase de contrôle de connaissance. Cette phase de feedback à pour but de s'assurer de l'ancrage de l'apprentissage dans la mémoire à long terme.</p>
<p><strong>la Phonétique</strong> <br />
avec flashcard.0.2.sh<br />
L'on peut facilement contrôler la prononciation avec flashcard, il suffit d'allonger les pauses. </p>
<p>
<strong>Vocabulaire, grammaire, syntaxe et Wubi</strong>
</p>
<p>
<strong>Parley</strong>
</p>
<p>Dans les logiciels que m'ont été proposé pour les flashcard, il en est un qui après test est particulièrement utile. </p>
<p>C'est le programme "<a href="http://edu.kde.org/applications/all/parley">Parley</a>'. Celui-ci a pour but d'aider à la mémorisation de manière généraliste et avec différente méthode de contrôle, quel que soit le domaine. Il embarque bien entendu une méthode d'optimalisation de la répétition ( <a href="http://docs.kde.org/stable/en/kdeedu/parley/advanced-practice-configuration.html">la documentation parley</a> -) en fonction des erreurs et du niveau. <br />
Dans un contexte d'apprentissage linguistique, sa plus grande utilité se situe dans le fait qu'il possède aussi d'autres méthodes d'apprentissage à côté du flashcard. Il permet de s'autoévalue via soit un questionnaire à choix multiples, les phrase exemple, le genre des noms, la comparaison des formes , la conjugaison et le « Mixed letters. » <br />
Ce dernier est particulièrement intéressant , en ce sens qu'il affiche par exemple une définition (par exemple America's compagnies) et affiche aussi la réponse, mais sous forme de caractères mélangés. Il faut retapé dans l'ordre adéquat les caractères chinois correspondants. Cela permet d'une part de réviser son vocabulaire, ses points de grammaire (en y mettant des phrases exemples) sa syntaxe (remettre dans l'ordre correct les mots ), ainsi que son Wubi (étant donné qu'il faut l'entrée au clavier). </p>
<p>Parley est un logiciel fesant partie de la suite orienté éduction de KDE.</p>
<p>Par sa flexibilité , c'est le projet le plus prometteur dans l'auto-évaluation d'un apprentissage en général et en chinois en particulier. </p>
<h3 id="toc_13">IV.Interface généraliste et utilitaire</h3>
<p>J’aborde ici non pas des logiciels spécifiquement destinés à l'apprentissage du chinois, mais des utilitaires qui rendent des services bien appréciables lorsqu'on souhaite aller vite. </p>
<p><strong><a href="https://launchpad.net/clicompanion/">Clicompanion</a></strong> </p>
<p>Ce logiciel de terminal qui enregistre dans une liste les commandes que l'utilisateur définit et qui permet de les retrouver rapidement (plus rapide et plus sur que de faire un grep sur son history ). Il gère aussi les entrées utilisateurs (à l'instar de la fonction read de bash ). Je l'utilise comme une sorte d'interface à mes commandes. Surtout pour les commandes invoquées fréquemment notamment la conversion du chinois en Wubi. Enter pour envoyé la ligne de commande , il m'affiche une fenêtre pour y entrer les caractères , enter et il m'affiche le tout. S'utilise aussi avec ekho.</p>
<p>
<strong>
<a href="http://www.tenshu.net/p/terminator.html">Terminator</a>
</strong>
</p>
<p>Terminator : a l'avantage de diviser l'espace de son terminal en différent compartiment accueillant des gettys. un click et il me sectionne ma fenêtre en deux dans le sens de la longueur , un click et il refait la même chose pour la nouvelle fenêtre, cela va plus vite qu'ouvrir une tabulation à chaque fois qu'on lance une commande et que l'on souhaite y garder un oeil dessus. </p>
<p>
<strong><a href="http://korben.info/ubuntu-desactiver-touchpad.html">Touchpadindicator</a> </strong>
</p>
<p>Le touchpad de mon ordinateur portable à la fâcheuse habitude de se mettre en travers mon chemin lorsque je tape du texte, ce logiciel permettra de le désactiver (je n'utilise que la souris de toute façon). <br />
installation : <br />
sudo add-apt-repository ppa:atareao/atareao<br />
sudo apt-get update<br />
sudo apt-get install touchpad-indicator</p>
<h3 id="toc_14">V. Mise en oeuvre :</h3>
<h4 id="toc_15">5.1. Critères d'appréciations.</h4>
<p>Il est nécessaire pour pouvoir mettre sur pied un système cohérent de dégager des critères qui permettront d'organiser la suite de logiciel de manière rationnelle.</p>
<h5 id="toc_16">5.1.1.Observations préalables et premier critère</h5>
<p>En général , lors de l'usage de sa langue maternelle, le locuteur ou le lecteur à un accès instantané à la compréhension pleine et entière de la sémantique d'une expression ou d'un texte, sur une étendue relativement vaste.</p>
<p>Lors de l'usage d'une seconde langue apprise (non maternelle), le locuteur ou le lecteur à un accès<br />
soit : différé à la sémantique d'un texte ou d'une expression. Il a par exemple besoin de support (dictionnaire de traduction, etc..) pour avoir y accès (ce qui ralentie le processus ). Soit un accès instantané, mais sur une étendue moins grande (limité à l'étendue de son vocabulaire et de son sujet). En général les deux facteurs se combinent.</p>
<p>Ainsi ce qui différencie le premier locuteur du second , est « la vitesse d'accès à la compréhension » ( que je dénommerais pas l'acronyme V.A.C. ). Dans l'idéal , le but serait d'avoir un accès à la compréhension de la seconde langue à la même vitesse que dans sa langue maternelle.</p>
<p>Le système d'apprentissage doit dès lors dans sa méthodologie et ses processus favoriser l'augmentation de cette vitesse d'accès. </p>
<p>On peut sans trop se tromper définir la maitrise d'une langue ou même d'un sujet par le rapport de cette vitesse en fonction de la portée du sujet. Pour prendre un exemple : les marques de politesse , la portée du sujet est limité (variant en fonction des cultures) , et la V.A.C peut être très grande. La vitesse d'accès à la compréhension de 你好,再见,谢谢你,请 ( bonjour , au revoir, merci , s'il vous plait ) est très rapide (sinon instantané) . A contrario la vitesse d'accès à la compréhension de 道沖而用之或不盈 ( Le Tao est vide ; si l'on en fait usage, il paraît inépuisable. ) Est de beaucoup ralentie (autant par la question sémantique, que le contexte culturel, l'étendu de la phrase, ses tenants et aboutissants, etc. ).</p>
<p>La vitesse d'accès à la compréhension dépend nécessairement de la rapidité d'accès à l'information pertinente. Cette rapidité dépend-elle même des conditions et des modalités d'accès offert par les supports. Ainsi taper dans un traducteur logiciel un mot prendra moins de temps que de devoir le rechercher dans son équivalent papier (toute chose par ailleurs égale ). En outre le mode d'organisation du support jouera un rôle déterminant dans l'accès à l'information pertinente. <br />
Par exemple la méthode de classement par structure visuelle du livre fast character finder , permet d'avoir une vitesse d'accès à l'information pertinente qui bat la méthode Kangxi et même pinyin (car la portée est limitée au HSK et que la reconnaissance visuelle est ce qui a de plus intuitif ). </p>
<h5 id="toc_17">5.1.1.1 Ajout de considération sur le Wubi et le Pinyin</h5>
<p>Dans cette perspective , l'on devrait de prime abord favoriser l'usage du pinyin en tant que système de saisi au clavier , car elle permet effectivement plusieurs choses , pour un Européen d'avoir une continuité dans la traduction de l'alphabet dans sa partie phonétique à sa partie visuelle (le signe ). <br />
Ce qui est vrai lorsqu'on aborde la question de manière superficielle, mais le problème principal du pinyin c'est qu'elle est distingue mal les nombreux homophones et dès lors constamment nécessitent l'intervention de l'utilisateur pour valider sa frappe (ce qui est une sorte de mini interruption, alors que cette interruption n'existe pas dans les langues alphabétiques , la frappe de la touche affiche le caractère voulu directement et sans détour ). Ce qui sur le long terme lui fait perdre les bénéfices de départ, et ce, de manière géométrique. Plus on l'utilise de manière approfondie dans des domaines d'étude spécialisés , et plus il sera lent. Cette direction au regard du critère de vitesse n'est pas souhaitable. Puisqu'on peut déduire facilement que plus l'on accumulera de la connaissance plus l'on se spécialisera.<br /><br />
Le Wubi au regard du critère de vitesse permet en fait une équation radicalement inversée. Plus son utilisation sera fréquente plus la vitesse de frappe augmentera, ce qui est la relation logique dans un apprentissage. En outre, il ne dépend pas du tout de la prononciation (variable selon les régions et dialectes ) ce qui le rend universel (facteur de rapidité). Finalement une personne maitrisant la méthode pourra avoir une vitesse de frappe de 160 caractères par minutes , ratio qui excède même les langues basées sur l' alphabet. J'ajoute aussi qu'au regard de la vitesse d'accès à la compréhension , il aménage , en même temps que la frappe, des couloirs sémantiques qui seront utilisables pour la compréhension. C'est-à-dire qu'il permet de facilité et de se familiariser grandement avec l'étymologie. </p>
<p>Le critère de la vitesse d'accès à la compréhension étant posé, il nous suffit que de combiner les logiciels en fonctions de celu i-ci. </p>
<h4 id="toc_18">5.1.2 Second critère</h4>
<p>Dans l'ensemble des 80 000 caractères chinois, quels seront ceux qui seront l'objet de notre attention ? </p>
<p>Il est nécessaire de privilégier l'étude des caractères dont l'usage est le plus fréquent, étant donné que la probabilité de les rencontrer est plus grande, dès lors de se retrouver plus fréquemment dans une situation d'incompréhension si l'on ne les maitrise pas.</p>
<p>Dès lors le second critère d'appréciation se situe dans la fréquence statistique.</p>
<h3 id="toc_19"> VI. La suite de logiciel que j'utilise</h3>
<h4 id="toc_20">6.1 le vocabulaire, la grammaire et la syntaxe:</h4>
<p>Il existe sur internet des listes de fréquence des caractères, pour ma part j'utilise le dictionnaire chinese-english fréquence qui me donne les caractères, et leur grammaire et syntaxe générale.<br />
Ensuite je numérise les pages avec ABBY , et je les ajoute à mon répertoire Gradint, particulièrement les exemples. </p>
<h4 id="toc_21">6.2 l'association phonétique</h4>
<p>Gradint me permet d'avoir la prononciation de ces segments sémantiques.<br />
Son seul inconvénient se situe dans l'absence d'ascenseur pour la liste, celle-ci est dès lors limitée aux 11 derniers entrés. </p>
<p>Pour contourner le problème, j'ai écrit un script vocab.wubi.sh qui convertit la liste Gradint en fichier cSv ,cela me permet de l'utiliser dans flashcard.0.2.sh et de le répéter avec les caractères Wubi inclus.</p>
<h4 id="toc_22">6.3 la dactylographie</h4>
<p>je dactylographie en même temps que flashcard tourne sur Yudit<br />
J'ajoute l'utilisation du script harb.sh et du harb2.sh pour approfondir l'étymologie, ainsi que chinese-tools.eu</p>
<h4 id="toc_23">6.4 Pendant le surf</h4>
<p>Lorsque je surf et que je souhaite apprendre de nouveaux mots , je les enregistre avec Cantofish , qui le fait direct en format Unix compatible. J'utilise le script cantodict.sh" qui permet de ne prendre que les champs pertinents , ensuite le script final.sh permet de fusionner le fichier CSV de Gradint au fichier CSV de Cantofish. Je peux aussi n'utiliser qu'un seul de ces fichiers , il suffit de le spécifier à flashcard.0.2.sh </p>
<h4 id="toc_24">6.5 le contrôle des connaissances</h4>
<p>L'importation du fichier précédent se fait sans problème dans Parley , qui me permet de faire un contrôle de connaissance sur le tout. </p>
<h4 id="toc_25">6.6 approfondissement de la grammaire</h4>
<p>j'utilise le guide de grammaire du chinois. </p>
<h4 id="toc_26">7.1 analyse de texte</h4>
<p>Lorsqu'on souhaite lire et analyser un texte entier , j'utilise d'abord Assert-c qui me fait la segmentation sémantique, puis j'utilise le script Chinese.sh qui permet d'y adjoindre une ligne au code wubi en dessous de chaque idéogramme. Finalement je convertis le fichier cSv en HTML et je l'ouvre avec Firefox qui me permet d'utiliser Cantofish et Perapakun. </p>
<p>Pendant l'analyse du texte, je peux aussi utiliser les différents dictionnaires en ligne et hors-ligne gérer par Goldendict. </p>
<h4 id="toc_27">7.2 le contrôle de l'analyse</h4>
<p>Comment contrôler l'exactitude de sa propre analyse ? En utilisant un texte dont on maitrise le sujet. </p>
<h2 id="toc_28">VII Conclusion provisoire</h2>
<p>Par rapport au premier article , un certain nombre d'améliorations à été apporter au système d'apprentissage, notamment via le contrôle de connaissance, de tel sorte qu'il devient plus cohérent et plus intuitif, tout en pouvant répondre à l'urgence si nécessaire. </p>
<p>La classification selon le double critère de la vitesse d'accès à la compréhension et de la fréquence d'occurrences des caractères rationalise l'ensemble de l'architecture. Certains substituts ont été trouvés (notamment flashcard.sh) à certains manques passés (Tuxtyping en Wubi ). Ce qui manquait était aussi un plug-in Firefox ayant le code Wubi directement inclut, l'utilisation de Clicompanion associé au parser uniconv réponds à cette lacune. Quant à la segmentation sémantique vue que le domaine est toujours en recherche , il faudra surement attendre encore un bout de temps avant d'avoir un segmenter parfait (mais assert-c remplit déjà bien son rôle). </p>
<p>Pour l'étudiant sérieux, le domaine d'apprentissage s’est assez enrichi pour pouvoir passer outre les problèmes techniques, il ne reste plus qu'à s'en donner la motivation et à l'inscrire dans son agenda adéquat pour concrétiser sa propre démarche d'apprentissage. </p><div><a href="https://linuxfr.org/users/eastwind/journaux/apprendre-a-lire-et-a-dactylographier-en-chinois-avec-des-outils-libres.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/94965/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/eastwind/journaux/apprendre-a-lire-et-a-dactylographier-en-chinois-avec-des-outils-libres#comments">ouvrir dans le navigateur</a>
</p>
eastwind☯https://linuxfr.org/nodes/94965/comments.atomtag:linuxfr.org,2005:Diary/300432010-08-11T18:06:08+02:002010-08-11T18:06:08+02:00Un dictionnaire des synonymes libres ?
Salut, salut,<br />
<br />
Voilà, comme j'aime paraître hachement cultivé et tout, et aussi parce qu'il m'arrive d'écrire <a href="http://www.culture-libre.org/wiki/Auteur:psychoslave#Po.C3.A9sie">des poèmes</a>, j'utilise assez souvent le <a href="http://www.crisco.unicaen.fr/cgi-bin/cherches.cgi">dictionnaire des synonymes en ligne de l'université de Caen</a>.<br />
<br />
Seulement ces derniers temps il est souvent inaccessible (à moins qu'on l'est <a href="http://linuxfr.org/~porki/30042.html">filtré pour éviter que l'adonnation à des activités subversives que l'État français n'approuve pas</a> comme <a href="Les_fleurs_du_mal#Le_proc.C3.A8s_et_la_censure">la poésie</a>).<br />
<br />
Je me demande donc si quelqu'un dans le coin connaît un dictionnaire des synonymes libre. Il doit bien y avoir un dictionnaire des synonymes qui s'est élevé dans le domaine public non ?<div><a href="https://linuxfr.org/users/psychoslave__/journaux/un-dictionnaire-des-synonymes-libres.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/56321/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/psychoslave__/journaux/un-dictionnaire-des-synonymes-libres#comments">ouvrir dans le navigateur</a>
</p>
psychoslave__https://linuxfr.org/nodes/56321/comments.atom