Sortie de uchardet 0.0.8 pour la détection de codages de caractères

Posté par  (site web personnel, Mastodon) . Édité par Julien Jorge et Benoît Sibaud. Modéré par Benoît Sibaud. Licence CC By‑SA.
63
21
déc.
2022
C et C++

uchardet est une bibliothèque C/C++ de détection de codage de caractère (par exemple UTF-8 ou ISO-8859-15 sont ce qu’on appelle des « codages de caractères » ou « jeux de caractères ») basée sur des caractéristiques statistiques des langages naturels et membre du projet Freedesktop. Elle peut détecter quelques dizaines de codages de caractères.

Le projet fournit également un outil en ligne de commande pour tester très simplement le codage de vos fichiers ou de flux de texte.

uchardet version 0.0.8 est sortie ce 8 décembre 2022.

Sondage Mon rapport à l'anglais

Posté par  . Licence CC By‑SA.
Étiquettes :
11
21
juil.
2022

Je ne sais pas si tu as remarqué mais la langue angloise est assez utilisé dans notre bas monde.

J'ai toujours eu un problème avec cela mais j’essaie de me soigner et d'oublier qu'ils ont brûlé vive Jeanne. Depuis mon précédent journal avec l'excellent commentaire bienveillant de quelqu'un dont la langue maternelle est l'anglais, ça va un peu mieux pour moi avec la pratique de l'anglais. J'arrive même à écouter des vidéos/tutoriel yewtu.be (how to exit vim in less than two hours) en anglais où je comprends à peu près ce qui s'y dit (surtout quand ce sont des Allemands qui parlent anglais en fait, j'ai encore du mal avec les Texans).

Et toi ça avance ?

  • Non par principe et je veux récupérer Jersey et Guernesey. :
    325
    (14.7 %)
  • J'ai toujours du mal à l'écrit et à l'oral et je ne progresse guère. :
    176
    (8.0 %)
  • L'écrit ça passe mais je ne suis pas à l'aise à l'oral. :
    618
    (27.9 %)
  • On parle tous anglois au boulot, c'est comme une deuxième langue. :
    417
    (18.8 %)
  • Je pense en anglais et j'ai besoin de chercher certains mots en français. :
    274
    (12.4 %)
  • C'est «has-been» l'anglois mec, faut se mettre au mandarin. :
    140
    (6.3 %)
  • Une autre réponse que je t'explique en commentaire. :
    32
    (1.4 %)
  • Obi-Wan Kenobi. :
    231
    (10.4 %)

Total : 2213 votes

Journal regex-wordsearch : Faire une recherche dans le dictionnaire par expression régulière

31
6
déc.
2019

Les expressions régulières sont un outil très pratique pour rechercher un texte correspondant à un certain motif. Elles sont très connues et leur usage est très répandu parmi les programmeurs, et les informaticiens en général. Cependant, et je pense que c'est dommage, elles ne sont pas enseignées à l'école, et sont assez peu connues de la population générale des utilisateurs de l'outil informatique.

Récemment, ma compagne a été chargée d'une nouvelle mission. Elle doit déchiffrer et traduire du russe en (…)

Journal Typographie et langues, mes ressources (quelques‑unes) à toutes fins utiles

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
43
12
sept.
2019

Cela devrait intéresser deux ou trois personnes ici, et comme ça, égoïstement, j’aurais tout sous la main d’un seul bloc aussi.

Donc mes références en typographie et en langue française accessibles sur Internet. Je mets de côté Wikipédia que tout le monde doit connaître ici. Plus une ch’tite astuce.

Orthotypographie

Suivi — Dépêches Les langues ne devraient pas être indiquées avec des drapeaux de pays

#1890 Posté par  (site web personnel, Mastodon) . État de l’entrée : ouverte. Licence CC By‑SA.
Étiquettes :
8
25
juil.
2019

Bonjour,

les langues sont actuellement indiquées avec des drapeaux de pays. C'est une choses couramment pratiquée parce qu'une icône semble passer mieux qu'un texte, mais qui pose de nombreux problèmes, entre autres:

  • une langue peut être parlée dans plusieurs pays. Ainsi en mettant le drapeau français pour la langue française, on ignore les autres pays francophones (comme la Belgique, la Suisse, de nombreux pays d'Afrique, le Canada, etc.)
  • un pays peut avoir plusieurs langues officielles (on peut reprendre la Suisse (…)

État de l’espéranto sous GNU/Linux

40
31
août
2016
Communauté

L’espéranto, créé pour être facile à apprendre et servir de passerelle neutre entre les peuples, continue tranquillement à faire son chemin dans le monde entier. Faisons un point sur la prise en charge, tant du point de vue des traductions que de l’écriture, de cette belle et intéressante langue sous GNU/Linux.

Logo Espéranto

Journal dometo.net: un forum francophone de l'Espéranto

Posté par  . Licence CC By‑SA.
Étiquettes :
11
26
avr.
2016

Bonjour à toutes et à tous,

Voila une nouvelle opportunité de débats passionnés et bien sur sans coup bas ni mesquineries, /je vous invite à visiter dometo.net: un forum francophone de l'Espéranto ainsi qu'à donner votre avis sur la chose.

Ce qui le souhaite peuvent lire la suite, j'y ferait un point sur ce qu'est l'espéranto puis sur sa situation actuelle.

Qu'est ce que cela?

L'espéranto est une langue inventée il y a plus de 125 ans avec l'intention (…)

Journal Hermaia

17
15
avr.
2014

en bref : Hermaia est un projet (Python3/GPLv3) pour créer et consulter des listes de mots préalablement analysés du point de vue morphologique. Un exemple ici (si vous voyez n'importe quoi, pensez à utiliser l'unicode comme encodage).


Hermaia est un (très modeste) projet (Python3/GPLv3) permettant

  • de créer une liste de mots accompagnés de leur analyse morphologique. Exactement comme si l'on associait le mot "aimerai" à "aimer"+"futur.3S".
  • de rechercher un mot et de l'analyser. Ex : est-ce que le mot "aimerai" (…)

Forum général.hors-sujets Un bon site pour trouver des correspondants linguistiques?

Posté par  . Licence CC By‑SA.
Étiquettes :
5
4
nov.
2013

Bonjour,

Je demandais si vous connaissiez de bons sites pour trouver des correspondants étrangers afin d’apprendre/perfectionner sa maitrise d’une langue. J’ai l’impression qu’il y a beaucoup de sites pour ça mais bon j’ai pas trop le temps de tout tester donc je me dis qu’il y en a sûrement parmi vous qui pourrons me faire un retour d’expérience!

Pour le moment j’ai repéré ce blog qui liste quelques sites, ainsi que celui-ci (la version française comporte quelques tournures étranges et (…)

Logotheras, compilateur de dictionnaires de langues

Posté par  (site web personnel) . Édité par ZeroHeure, Nÿco, Benoît Sibaud et Nils Ratusznik. Modéré par Benoît Sibaud. Licence CC By‑SA.
20
1
oct.
2013
Python

En bref : une bibliothèque (Python3, GPLv3) hébergée sous GitHub, permettant de lire des dictionnaires de langues (au format texte ou sous forme d'une base de données), de les formater et d'en vérifier la cohérence, puis de les (ré)écrire au format texte ou sous forme d'une base de données. La version actuelle (0.1.6) permet seulement de travailler sur les fichiers texte. De manière générale, le projet n'a pas été testé de manière intensive.