Sortie de uchardet 0.0.8 pour la détection de codages de caractères

Posté par  (site web personnel, Mastodon) . Édité par Julien Jorge et Benoît Sibaud. Modéré par Benoît Sibaud. Licence CC By‑SA.
63
21
déc.
2022
C et C++

uchardet est une bibliothèque C/C++ de détection de codage de caractère (par exemple UTF-8 ou ISO-8859-15 sont ce qu’on appelle des « codages de caractères » ou « jeux de caractères ») basée sur des caractéristiques statistiques des langages naturels et membre du projet Freedesktop. Elle peut détecter quelques dizaines de codages de caractères.

Le projet fournit également un outil en ligne de commande pour tester très simplement le codage de vos fichiers ou de flux de texte.

uchardet version 0.0.8 est sortie ce 8 décembre 2022.

Sondage Mon rapport à l'anglais

Posté par  . Licence CC By‑SA.
Étiquettes :
11
21
juil.
2022

Je ne sais pas si tu as remarqué mais la langue angloise est assez utilisé dans notre bas monde.

J'ai toujours eu un problème avec cela mais j’essaie de me soigner et d'oublier qu'ils ont brûlé vive Jeanne. Depuis mon précédent journal avec l'excellent commentaire bienveillant de quelqu'un dont la langue maternelle est l'anglais, ça va un peu mieux pour moi avec la pratique de l'anglais. J'arrive même à écouter des vidéos/tutoriel yewtu.be (how to exit vim in less than two hours) en anglais où je comprends à peu près ce qui s'y dit (surtout quand ce sont des Allemands qui parlent anglais en fait, j'ai encore du mal avec les Texans).

Et toi ça avance ?

  • Non par principe et je veux récupérer Jersey et Guernesey. :
    325
    (14.7 %)
  • J'ai toujours du mal à l'écrit et à l'oral et je ne progresse guère. :
    176
    (8.0 %)
  • L'écrit ça passe mais je ne suis pas à l'aise à l'oral. :
    618
    (27.9 %)
  • On parle tous anglois au boulot, c'est comme une deuxième langue. :
    417
    (18.8 %)
  • Je pense en anglais et j'ai besoin de chercher certains mots en français. :
    274
    (12.4 %)
  • C'est «has-been» l'anglois mec, faut se mettre au mandarin. :
    140
    (6.3 %)
  • Une autre réponse que je t'explique en commentaire. :
    32
    (1.4 %)
  • Obi-Wan Kenobi. :
    231
    (10.4 %)

Total : 2213 votes

Journal regex-wordsearch : Faire une recherche dans le dictionnaire par expression régulière

31
6
déc.
2019

Les expressions régulières sont un outil très pratique pour rechercher un texte correspondant à un certain motif. Elles sont très connues et leur usage est très répandu parmi les programmeurs, et les informaticiens en général. Cependant, et je pense que c'est dommage, elles ne sont pas enseignées à l'école, et sont assez peu connues de la population générale des utilisateurs de l'outil informatique.

Récemment, ma compagne a été chargée d'une nouvelle mission. Elle doit déchiffrer et traduire du russe en (…)

Suivi — Dépêches Les langues ne devraient pas être indiquées avec des drapeaux de pays

#1890 Posté par  (site web personnel, Mastodon) . État de l’entrée : ouverte. Licence CC By‑SA.
Étiquettes :
5
25
juil.
2019

Bonjour,

les langues sont actuellement indiquées avec des drapeaux de pays. C'est une choses couramment pratiquée parce qu'une icône semble passer mieux qu'un texte, mais qui pose de nombreux problèmes, entre autres:

  • une langue peut être parlée dans plusieurs pays. Ainsi en mettant le drapeau français pour la langue française, on ignore les autres pays francophones (comme la Belgique, la Suisse, de nombreux pays d'Afrique, le Canada, etc.)
  • un pays peut avoir plusieurs langues officielles (on peut reprendre la Suisse (…)

Journal Hermaia

17
15
avr.
2014

en bref : Hermaia est un projet (Python3/GPLv3) pour créer et consulter des listes de mots préalablement analysés du point de vue morphologique. Un exemple ici (si vous voyez n'importe quoi, pensez à utiliser l'unicode comme encodage).


Hermaia est un (très modeste) projet (Python3/GPLv3) permettant

  • de créer une liste de mots accompagnés de leur analyse morphologique. Exactement comme si l'on associait le mot "aimerai" à "aimer"+"futur.3S".
  • de rechercher un mot et de l'analyser. Ex : est-ce que le mot "aimerai" (…)

Forum général.hors-sujets Un bon site pour trouver des correspondants linguistiques?

Posté par  . Licence CC By‑SA.
Étiquettes :
5
4
nov.
2013

Bonjour,

Je demandais si vous connaissiez de bons sites pour trouver des correspondants étrangers afin d’apprendre/perfectionner sa maitrise d’une langue. J’ai l’impression qu’il y a beaucoup de sites pour ça mais bon j’ai pas trop le temps de tout tester donc je me dis qu’il y en a sûrement parmi vous qui pourrons me faire un retour d’expérience!

Pour le moment j’ai repéré ce blog qui liste quelques sites, ainsi que celui-ci (la version française comporte quelques tournures étranges et (…)

Logotheras, compilateur de dictionnaires de langues

Posté par  (site web personnel) . Édité par ZeroHeure, Nÿco, Benoît Sibaud et Nils Ratusznik. Modéré par Benoît Sibaud. Licence CC By‑SA.
20
1
oct.
2013
Python

En bref : une bibliothèque (Python3, GPLv3) hébergée sous GitHub, permettant de lire des dictionnaires de langues (au format texte ou sous forme d'une base de données), de les formater et d'en vérifier la cohérence, puis de les (ré)écrire au format texte ou sous forme d'une base de données. La version actuelle (0.1.6) permet seulement de travailler sur les fichiers texte. De manière générale, le projet n'a pas été testé de manière intensive.

Est‐il démocratique, adapté et rentable que l’anglais soit la langue internationale ?

35
10
oct.
2011
Culture

Dans une série de vidéos, Claude Piron, psychologue et ancien traducteur, dissèque les mécanismes linguistiques, au travers d’une analyse critique du choix de l’anglais comme langue internationale.

Après avoir mis en lumière l’importance de la maîtrise d’une langue lors d’échanges internationaux politiques, économiques, scientifiques et autres, il montre en quoi le choix de l’anglais comme langue internationale :

  1. n’est pas démocratique ;
  2. est inadapté ;
  3. a un résultat, par rapport à l’énergie et aux sommes dépensées pour son apprentissage, proche de 0 ; ce qui ne serait jamais accepté dans d’autres domaines.

NdM :

Journal Directive européenne sur la langue de l'Union

Posté par  (site web personnel) .
Étiquettes :
0
3
avr.
2003
Voici la dernière directive européenne, bon entraînement : La Commission européenne a finalement tranché : après la monnaie unique, l'Union européenne va se doter d'une langue unique, à savoir... le Français. Trois langues étaient en compétition: le Français (parlé par le plus grand nombre de pays de l'Union, la France, la Belgique, le Luxembourg), l'Allemand (parlé par le plus grand nombre d'habitants de l'Union) et l'Anglais (langue internationale par excellence). L'Anglais a vite été éliminé, pour deux raisons : l'Anglais (…)