Comme beaucoup de domaines scientifiques, la documentation de la diversité linguistique entretient une relation forte avec les mondes du Libre. Dans cette dépêche, je vous propose de découvrir ce domaine à travers la présentation de plusieurs logiciels et ressources libres ou en accès ouvert. La documentation des langues étant un thème peu courant sur LinuxFr.org, on commencera par une présentation de cette problématique. Nous continuerons par une description des deux ressources principales existantes pour cataloguer et se repérer au sein de cette diversité linguistique. Je parlerai ensuite d’ELAN et de FLEX, deux logiciels utilisés pour annoter des enregistrements audio-visuels, une étape clef dans l’analyse linguistique, et qui permet le partage et la réutilisation de ces enregistrements. Enfin, après un court passage sur la question de l’archivage, je présenterai deux compilations de corpus de documentation en accès libre, une pratique récente qui permet de nouveaux questionnements quantitatifs sur les langues orales peu documentées, et qui contribue également à la transparence et la traçabilité des analyses linguistiques.
Sortie de YunoHost 4.2
La sortie de YunoHost 4.2 est l’occasion de rappeler l’existence de ce projet et de tenir au courant de ses dernières évolutions. On note la réécriture en Python 3, et en Vuejs pour l’interface web.
YunoHost est une distribution basée sur Debian qui facilite l’auto-hébergement en fournissant une interface conviviale pour installer et administrer des applications serveurs. Le catalogue d’applications gérées par YunoHost est de plus en plus fourni et propose des logiciels pour gérer ses courriels, son nuage de données, son serveur média, le partage de fichiers, l’agrégation d’informations, etc.
Comparaison de deux outils de gestion de séminaires en ligne : BigBlueButton et OpenMeetings
Dans le cadre du confinement, je me suis intéressé à la mise en place d’un séminaire en ligne pour un laboratoire de recherche. Au cours de cet article, nous allons comparer deux logiciels libres, BigBlueButton et OpenMeetings, qui permettent de gérer ce genre d’événements. Séminaire est à entendre ici comme un ensemble d’interventions audio‐visuelles géré par une même personne physique ou morale. Les versions présentées des deux logiciels sont la version 2.2 pour BigBlueButton, qui fonctionne de pair avec le client Greenlight 2.0 et la version 5.0.0-M3 pour OpenMeetings.
Python pour les sciences, une présentation
La sortie de Pandas 0.24.1 est l’occasion de parler de Python et du traitement des données scientifiques. Depuis quelques années, un certain nombre de projets ont émergé afin d’équiper Python pour les mondes de la recherche. Cette dépêche présente quelques‐uns de ces projets. Des ressources pour aller plus loin sont proposées en fin de dépêche.
Sortie d'Ardour 3
Ardour est un logiciel libre (licence GPL2) pour station de travail audio-numérique. Plus précisément, il s'agit d'un séquenceur enregistreur audio multi-pistes doté de toutes les fonctionnalités présentes sur les équivalents propriétaires professionnels. Il diffère de Cubase SX, par exemple, par une structure modulaire : là où Cubase ne propose qu'une vision de type matériel, Ardour permet l'utilisation de l'étage de gain et celui d'égalisation à n'importe quel moment de la chaîne de traitement par le biais des greffons. De courts comparatifs sont disponibles sur LinuxMAO, également sur Wikipedia La première version est sortie en 2005. Paul Davis, auteur initial et principal contributeur du projet, est aussi à l'origine du serveur de son JACK ainsi que du premier pilote de carte Hammerfall de RME, pour le noyau Linux. Ardour est disponible pour FreeBSD, GNU/Linux et MacOSX intel.
Le projet est financé par le biais de dons qui peuvent se faire en une fois lors du téléchargement, ou bien par mensualités. On peut également choisir de ne financer qu'une fonctionnalité encore incomplète ou insatisfaisante. N'ayons pas peur des mots, l'emploi d'un superlatif n'est pas mal venu ici : Ardour est proprement fabuleux. Déplacer, étirer, copier, aligner, couper, fondre, clicher, zoomer, transposer, quantifier, balancer, glisser, tomber, … Gérer un nombre de flux dont il sera difficile d'atteindre les limites, en instruments, pistes, groupes de pistes et bus… Jouer avec de très nombreux formats, travailler directement avec le midi. Utiliser des standards audionumériques sans peine. Travailler de concert avec des greffons de tout types, et des logiciels externes, en orchestrant l'ensemble … Ardour ne s'adresse pas qu'aux professionnels et ingénieurs, mais à tout compositeurs, musiciens, et simples amateurs, désireux d'une belle solution en se faisant plaisir à chaque étape de la création musicale.
Le libre et les mémoires de traduction
Contrairement à ce que son nom pourrait suggérer, il s'agit bien d'un logiciel. Celui-ci permet aux traducteurs d'enregistrer au format TMX, un format XML standardisé et ouvert, la concordance entre un segment dans une langue source et un segment dans une langue cible.
Décrit ainsi, cela ne semble pas vraiment intéressant ? Vous vous demandez peut-être ce que cela apporte par rapport aux bibliothèques Gettext (NdM : voir les entrées Fuzzy ) ? Vous ne voyez pas en quoi cela aide un traducteur ?
Eh bien, lisez le reste de l'article.
Le système que je propose, Mémoires Libres, est utilisable dès à présent, il n'attend que des contributeurs et c'est le but de cette dépêche que d'en trouver. Bien sûr, je vais aussi contacter les listes de diffusion liées à la traduction de logiciels libres. N'hésitez pas à critiquer le projet, que ce soit au niveau du site Web, de son organisation ou autre chose, ça lui permettra d'avancer.
NdM : KBabel et POedit disposent aussi d'outils de recherche dans des dictionnaires de chaînes traduites. Le projet KAider (devenu Lokalize) ainsi que la présentation ci-dessous montrent ce qu'apportent des mémoires de traduction en plus.