Journal grep, find, awk, sed, etc. : casse et accent

Posté par (page perso) .
Tags : aucun
1
20
fév.
2004
Hello les gens,
dites moi pas que je vais devoir me taper des chaines d'expressions regulieres (rationnelles) de 20 km pour pouvoir faire une recherche sans casse et gestion d'accent, c cedille, etc. ...

J'ai trouve -i pour la casse dans grep mais rien pour avoir un resultat sur "postés", "PoStEs" et "postes" apres une recherche sur "postes"

MAMAN, y a le Perl qui me regarde ! J'ai peur ! Je veux garder mon Python !
  • # Re: grep, find, awk, sed, etc. : casse et accent

    Posté par . Évalué à 1.

    grep -i 'post[ée]s' ??
    • [^] # Re: grep, find, awk, sed, etc. : casse et accent

      Posté par (page perso) . Évalué à 1.

      N ai pas peur du Perl mon enfant, il ne te veut que du bien!
    • [^] # Re: grep, find, awk, sed, etc. : casse et accent

      Posté par (page perso) . Évalué à 1.

      Oui, mais j'aimerai un truc un peu plus general :) Comme dans google en fait.

      Si ca doit etre automatises, ca implique un pre-traitement de chaque mot recherche pour transformer tous les a,e,o,i en chaine [ée.....] avec toutes les possibilites :(

      Si c'est la seule solution ... je suis pas a 1000 cycles de proc pres ;p
      • [^] # Re: grep, find, awk, sed, etc. : casse et accent

        Posté par . Évalué à 1.

        malheuresement t'as pas le choix... les accents et compagnies, c'est véritablement une merde gigantesque en informatique... le problème supplémentaire est que les équivalences e, é, è... dépendent aussi de l'encodage, car le é n'est pas forcement le même code (si il existe) si tu es en utf8, latin1, iso8859-8...

        on n'en serait pas là si les americains utilisaient les accents (ou si nous n'en utilisions pas...)!

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.