Journal Hermaia

17
15
avr.
2014

en bref : Hermaia est un projet (Python3/GPLv3) pour créer et consulter des listes de mots préalablement analysés du point de vue morphologique. Un exemple ici (si vous voyez n'importe quoi, pensez à utiliser l'unicode comme encodage).


Hermaia est un (très modeste) projet (Python3/GPLv3) permettant

  • de créer une liste de mots accompagnés de leur analyse morphologique. Exactement comme si l'on associait le mot "aimerai" à "aimer"+"futur.3S".
  • de rechercher un mot et de l'analyser. Ex : est-ce que le mot "aimerai" (...)

Inflectiones, déclinaisons et conjugaisons en grec ancien

Posté par (page perso) . Édité par Benoît Sibaud et tuiu pol. Modéré par ZeroHeure. Licence CC by-sa
26
13
fév.
2014
Python

En bref : inflectiones est une bibliothèque (Python3, GPLv3) qui permet de conjuguer et de décliner des mots. Le travail inverse (analyser un mot pour en dégager les caractéristiques morphologiques) ne m'intéressant pas, n'a pas été codé. Enfin, seuls quelques exemples tirés du grec ancien et de l'esperanto sont disponibles, voyez les exemples ci-dessous. Le projet n'en est qu'à ses débuts et attend du renfort !

Journal projet : commentaires didactiques d'une partie d'échecs

Posté par (page perso) . Licence CC by-sa
20
2
déc.
2013

Bonsoir,
la lecture du code de Pychess (je pense en particulier à ce fichier) et mes déboires de mauvais joueur d'échecs m'ont donné une idée.

Pourquoi ne pas essayer d'"enrober" l'information donnée par les moteurs d'analyse (Crafty, Gnuchess), information que Pychess sait lire, pour donner des commentaires didactiques au joueur ? Pour le moment, blunders.py dit juste quelque chose comme "oups, mauvais coup, il aurait fallu jouer ceci" et ce, quand la différence entre la position réellement jouée et le (...)

Phokaia, dictionnaire de grec ancien → français

Posté par (page perso) . Édité par NeoX, ZeroHeure, Benoît Sibaud et Xavier Claude. Modéré par ZeroHeure. Licence CC by-sa
21
24
oct.
2013
Éducation

En bref : un (embryon de) dictionnaire grec ancien → français, sur corpus, libre (GPLv3), compilable avec Logotheras et disponible aux formats texte et RST.

Phokaia est un dictionnaire grec ancien -> français sur corpus.
Phokaia est écrit de manière à être utilisé avec le projet Logotheras et est par conséquent disponible en format texte ainsi que sous forme d'une exportation au format RST.

Quand le projet Logotheras le permettra, ce dictionnaire sera également consultable sous forme d'une base de données MySQL.

Phokaia est hébergé chez l'excellent(e) TuxFamily.

Journal HLevel, librairie pour comparer B.IX.2 < A.IV.3.a < A.III.2.c

Posté par (page perso) . Licence CC by-sa
11
14
oct.
2013

HLevel est une librairie (GPLv3, Python3) permettant de comparer des "niveaux hiérarchiques" tels qu'ils se trouvent dans les textes où plusieurs niveaux coexistent :

A) titre de la partie
A.1) sous-partie
A.1.a) sous-sous-partie
etc.

HLevel n'a pas été testée mais est fonctionnelle : dites-moi si ce projet vous intéresse !

Typiquement, HLevel permet de dire que A.1.a est "supérieur à" (="vient après") A.1 en faisant abstraction de la parenthèse fermante.

L'idée est de stocker l'information, d'une part sous la forme d'une (...)

Logotheras, compilateur de dictionnaires de langues

20
1
oct.
2013
Python

En bref : une bibliothèque (Python3, GPLv3) hébergée sous GitHub, permettant de lire des dictionnaires de langues (au format texte ou sous forme d'une base de données), de les formater et d'en vérifier la cohérence, puis de les (ré)écrire au format texte ou sous forme d'une base de données. La version actuelle (0.1.6) permet seulement de travailler sur les fichiers texte. De manière générale, le projet n'a pas été testé de manière intensive.

DChars, pour lire/écrire et modifier des caractères unicodes complexes

27
23
mar.
2013
Python

Dans le cadre d'un projet, j'ai eu besoin d'un module pour analyser et modifier les caractères complexes de certains systèmes d'écriture, en particulier en hébreu, grec ancien ou sanskrit. Mon code commence à devenir utilisable, je le publie donc sous une licence GLPv3 : DChars est un module pour Python3.

J'ai essayé de coller à certains principes facilitant le travail en communauté ainsi que l'écriture de code lisible : tests unitaires, code et commentaires écrits en anglais, surveillance de la qualité du code par Pylint, documentation fournie et écrite avec Sphinx.

Concrètement, je cherche d'autres personnes susceptibles d'utiliser ou d'améliorer mon module. Si vous utilisez les langues concernées, dites-moi si ce que j'ai fait vous convient ! En particulier, si certains connaissent très bien la norme ISO 15919, je suis preneur… De façon générale, n'hésitez pas à faire remonter vos remarques, je n'attends que ça, surtout si elles sont négatives !

Phoseg, stockage et analyse de données phonétiques transcrites

25
14
déc.
2012
Technologie

Bonjour à tous,
dans le cadre d'un projet j'ai besoin d'un module pour stocker et analyser des données phonétiques transcrites, par exemple avec l'alphabet phonétique international. Mon code commence à devenir (vaguement) utilisable : je le publie donc sous une licence GLPv3 : Phoseg est un module pour Python3 que vous trouverez à cette adresse.

J'ai essayé de coller à certains principes facilitant le travail en communauté ainsi que l'écriture de code lisible : tests unitaires, code et commentaires écrits en anglais, surveillance de la qualité du code par pylint, documentation fournie.

Concrètement, je cherche d'autres personnes susceptibles d'utiliser ou d'améliorer mon module. Si vous êtes un spécialiste de la phonétique, j'ai aussi de nombreuses questions à vous poser… De façon générale, n'hésitez pas à faire remonter vos remarques, je n'attends que ça, surtout si elles sont négatives !