Ok du coup je dirais que rechercher une nucléotide dans une séquence équivaudrait à rechercher un mot dans une phrase.
Si je voulais rechercher "nucléotides" dans ta phrase précédente j'essaierais de comparer "nucléotides" (11 caractères) à tous les sous-textes de 11 caractères de ta phrase : "cependant, " puis "ependant, s" puis "pendant, si" etc.
C'est la boucle dont je parlais.
Et quand je dis "comparer" c'est calculer la distance.
[^] # Re: Tu peux utiliser les distances
Posté par cappir . En réponse au message grep et recherche approximative. Évalué à 1.
Ok du coup je dirais que rechercher une nucléotide dans une séquence équivaudrait à rechercher un mot dans une phrase.
Si je voulais rechercher "nucléotides" dans ta phrase précédente j'essaierais de comparer "nucléotides" (11 caractères) à tous les sous-textes de 11 caractères de ta phrase : "cependant, " puis "ependant, s" puis "pendant, si" etc.
C'est la boucle dont je parlais.
Et quand je dis "comparer" c'est calculer la distance.
Qu'en penses-tu ?
# Tu peux utiliser les distances
Posté par cappir . En réponse au message grep et recherche approximative. Évalué à 2.
Salut,
selon moi deux séquences avec 1 ou 2 lettres de différence sont proches de part leur distance : https://askubuntu.com/questions/753608/is-there-any-program-for-fuzzy-string-matching-which-provides-a-match-score
Après il va te falloir boucler sur tout ton fichier pour extraire chaque motif de même longueur que la séquence que tu cherches, pour les comparer.