uchardet
est une bibliothèque C/C++ de détection de codage de caractère (par exemple UTF-8
ou ISO-8859-15
sont ce qu’on appelle des « codages de caractères » ou « jeux de caractères ») basée sur des caractéristiques statistiques des langages naturels et membre du projet Freedesktop. Elle peut détecter quelques dizaines de codages de caractères.
Le projet fournit également un outil en ligne de commande pour tester très simplement le codage de vos fichiers ou de flux de texte.
uchardet
version 0.0.8 est sortie ce 8 décembre 2022.