Comme beaucoup de domaines scientifiques, la documentation de la diversité linguistique entretient une relation forte avec les mondes du Libre. Dans cette dépêche, je vous propose de découvrir ce domaine à travers la présentation de plusieurs logiciels et ressources libres ou en accès ouvert. La documentation des langues étant un thème peu courant sur LinuxFr.org, on commencera par une présentation de cette problématique. Nous continuerons par une description des deux ressources principales existantes pour cataloguer et se repérer au sein de cette diversité linguistique. Je parlerai ensuite d’ELAN et de FLEX, deux logiciels utilisés pour annoter des enregistrements audio-visuels, une étape clef dans l’analyse linguistique, et qui permet le partage et la réutilisation de ces enregistrements. Enfin, après un court passage sur la question de l’archivage, je présenterai deux compilations de corpus de documentation en accès libre, une pratique récente qui permet de nouveaux questionnements quantitatifs sur les langues orales peu documentées, et qui contribue également à la transparence et la traçabilité des analyses linguistiques.
Journal Suppression de la gestion des SMS par Signal
Bonsoir à vous.
La dernière mise à jour de Signal m'a annoncé la fin de la gestion des SMS. Si c'est vrai qu'il y avait quelques soucis au niveau la distinction entre SMS et messages chiffrés, ou lorsque les utilisateur.es quittaient l'application, ça me semblait gênants, mais pas insupportables.
Mais maintenant, sans la gestion des SMS, ben, ça m'embête de devoir installer une autre application pour les gérer. J'aime bien avoir une application qui gérait de manière centralisée ma messagerie (…)
Journal Réflexions concernant la mise en place d'un serveur autonome au Vanuatu
Bien le bonjour linuxfriens et linuxfriennes, j'aimerais bénéficier de vos conseils et suggestions concernant un projet sur lequel je potasse actuellement. Mes questionnements portent notamment sur le dimensionnement du serveur et de ses panneaux solaires, puis sur le choix ou la fabrication d'un boitier adapté aux tropiques. Je suis évidemment aussi preneur de conseils ou d'idées concernant d'autres aspects auxquels je n'aurais pas pensé.
Dans le cadre de mes recherches, je travaille à l'étude de la langue nisvaie. Pour (…)
Journal Du ménage autour de nos ordinateurs
Bien le bonjour à vous.
Comme nombre d'entre vous, je profite du dimanche pour faire le ménage. Non pas du contenu qui se trouve dans les disques durs/SSD, en tout cas ce n'est pas ce dont je souhaiterais discuter aujourd'hui, mais de ce qui se trouve autour : cette poussière, ces peluches, ces traces sur l'écran ou le clavier.
J'aimerais connaitre les trucs, astuces et produits, que vous utilisez, ou au contraire que vous n'utilisez pas, pour :
- nettoyer les (…)
Sortie de YunoHost 4.2
La sortie de YunoHost 4.2 est l’occasion de rappeler l’existence de ce projet et de tenir au courant de ses dernières évolutions. On note la réécriture en Python 3, et en Vuejs pour l’interface web.
YunoHost est une distribution basée sur Debian qui facilite l’auto-hébergement en fournissant une interface conviviale pour installer et administrer des applications serveurs. Le catalogue d’applications gérées par YunoHost est de plus en plus fourni et propose des logiciels pour gérer ses courriels, son nuage de données, son serveur média, le partage de fichiers, l’agrégation d’informations, etc.
Journal Covid, ah non pardon, plus important : le RGPD
Comparaison de deux outils de gestion de séminaires en ligne : BigBlueButton et OpenMeetings
Dans le cadre du confinement, je me suis intéressé à la mise en place d’un séminaire en ligne pour un laboratoire de recherche. Au cours de cet article, nous allons comparer deux logiciels libres, BigBlueButton et OpenMeetings, qui permettent de gérer ce genre d’événements. Séminaire est à entendre ici comme un ensemble d’interventions audio‐visuelles géré par une même personne physique ou morale. Les versions présentées des deux logiciels sont la version 2.2 pour BigBlueButton, qui fonctionne de pair avec le client Greenlight 2.0 et la version 5.0.0-M3 pour OpenMeetings.
Python pour les sciences, une présentation
La sortie de Pandas 0.24.1 est l’occasion de parler de Python et du traitement des données scientifiques. Depuis quelques années, un certain nombre de projets ont émergé afin d’équiper Python pour les mondes de la recherche. Cette dépêche présente quelques‐uns de ces projets. Des ressources pour aller plus loin sont proposées en fin de dépêche.
Sortie d'Ardour 3
Ardour est un logiciel libre (licence GPL2) pour station de travail audio-numérique. Plus précisément, il s'agit d'un séquenceur enregistreur audio multi-pistes doté de toutes les fonctionnalités présentes sur les équivalents propriétaires professionnels. Il diffère de Cubase SX, par exemple, par une structure modulaire : là où Cubase ne propose qu'une vision de type matériel, Ardour permet l'utilisation de l'étage de gain et celui d'égalisation à n'importe quel moment de la chaîne de traitement par le biais des greffons. De courts comparatifs sont disponibles sur LinuxMAO, également sur Wikipedia La première version est sortie en 2005. Paul Davis, auteur initial et principal contributeur du projet, est aussi à l'origine du serveur de son JACK ainsi que du premier pilote de carte Hammerfall de RME, pour le noyau Linux. Ardour est disponible pour FreeBSD, GNU/Linux et MacOSX intel.
Le projet est financé par le biais de dons qui peuvent se faire en une fois lors du téléchargement, ou bien par mensualités. On peut également choisir de ne financer qu'une fonctionnalité encore incomplète ou insatisfaisante. N'ayons pas peur des mots, l'emploi d'un superlatif n'est pas mal venu ici : Ardour est proprement fabuleux. Déplacer, étirer, copier, aligner, couper, fondre, clicher, zoomer, transposer, quantifier, balancer, glisser, tomber, … Gérer un nombre de flux dont il sera difficile d'atteindre les limites, en instruments, pistes, groupes de pistes et bus… Jouer avec de très nombreux formats, travailler directement avec le midi. Utiliser des standards audionumériques sans peine. Travailler de concert avec des greffons de tout types, et des logiciels externes, en orchestrant l'ensemble … Ardour ne s'adresse pas qu'aux professionnels et ingénieurs, mais à tout compositeurs, musiciens, et simples amateurs, désireux d'une belle solution en se faisant plaisir à chaque étape de la création musicale.
Journal La stéganographie et le traitement automatique des langues
La stéganographie et le traitement automatique des langues
Bon-jour-nal,
Alors, ceci n'a pas vraiment de rapport avec le logiciel libre, mais je me dis que ça intéressera sûrement les gens du coin. J'avais envie de partager mes petites connaissances accumulées ces derniers jours sur le sujet. Au pire, je me ferai moinsser et je ne le referai plus :)
Déjà, qu'est-ce que la stéganographie ? Sa problématique est de transmettre un message de manière à ce que seul le destinataire (…)
Journal Petit changement à la "London Stock Exchange"
Je suis désolé, ce journal fait de nombreuses références à des articles anglais et en plus, ce n'est pas du tout neuf.
Pour situer un peu les faits, Microsoft est, ou était, très fier de compter parmi ses clients la Bourse londonienne. Voir : "Get The Facts".
Mais, en septembre dernier, il y a eu quelques soucis techniques. Le nouveau directeur (enfin CEO, plus approprié j'imagine au système anglais), Xavier Rolet, a donc décidé de changer de technologie (…)
Journal Les vierges effarouchées du langage
Et c'est normal, je viens de l'inventer. La personne en face comprend pourtant bien le mot mais comme il ne l'a jamais entendu auparavant, il s'offusque.
C'est pourtant une des capacités intéressante du langage (petite information, en linguistique, langage = capacité à communiquer) est sa double_articulation, c'est-à-dire la possibilité de réutilisé des motifs pour créer de nouveaux mots et surtout d'être encore compris. Cette capacité est beaucoup aidée par (…)
Le libre et les mémoires de traduction
Contrairement à ce que son nom pourrait suggérer, il s'agit bien d'un logiciel. Celui-ci permet aux traducteurs d'enregistrer au format TMX, un format XML standardisé et ouvert, la concordance entre un segment dans une langue source et un segment dans une langue cible.
Décrit ainsi, cela ne semble pas vraiment intéressant ? Vous vous demandez peut-être ce que cela apporte par rapport aux bibliothèques Gettext (NdM : voir les entrées Fuzzy ) ? Vous ne voyez pas en quoi cela aide un traducteur ?
Eh bien, lisez le reste de l'article.
Le système que je propose, Mémoires Libres, est utilisable dès à présent, il n'attend que des contributeurs et c'est le but de cette dépêche que d'en trouver. Bien sûr, je vais aussi contacter les listes de diffusion liées à la traduction de logiciels libres. N'hésitez pas à critiquer le projet, que ce soit au niveau du site Web, de son organisation ou autre chose, ça lui permettra d'avancer.
NdM : KBabel et POedit disposent aussi d'outils de recherche dans des dictionnaires de chaînes traduites. Le projet KAider (devenu Lokalize) ainsi que la présentation ci-dessous montrent ce qu'apportent des mémoires de traduction en plus.