cappir a écrit 2 commentaires

[^] # Re: Tu peux utiliser les distances

Posté par cappir le 07 août 2019 à 13:29. En réponse au message grep et recherche approximative. Évalué à 1.

Ok du coup je dirais que rechercher une nucléotide dans une séquence équivaudrait à rechercher un mot dans une phrase.

Si je voulais rechercher "nucléotides" dans ta phrase précédente j'essaierais de comparer "nucléotides" (11 caractères) à tous les sous-textes de 11 caractères de ta phrase : "cependant, " puis "ependant, s" puis "pendant, si" etc.
C'est la boucle dont je parlais.
Et quand je dis "comparer" c'est calculer la distance.

Qu'en penses-tu ?
# Tu peux utiliser les distances

Posté par cappir le 07 août 2019 à 10:21. En réponse au message grep et recherche approximative. Évalué à 2.

Salut,

selon moi deux séquences avec 1 ou 2 lettres de différence sont proches de part leur distance : https://askubuntu.com/questions/753608/is-there-any-program-for-fuzzy-string-matching-which-provides-a-match-score

Après il va te falloir boucler sur tout ton fichier pour extraire chaque motif de même longueur que la séquence que tu cherches, pour les comparer.