Forum Programmation.shell Comment récupérer des valeurs dans un fichier pour effectuer une substitution dans un autre ? RESOLU

Posté par fredlabidouille le 08 novembre 2011 à 20:03.

Étiquettes :

nov.

2011

Bonjour,

J'ai besoin d'urgence de substituer dans un fichier des valeurs par d'autres présentes dans un autre fichier et je ne sait pas comment procéder.

N.B. Les 2 fichiers ont le même nombre de lignes (plusieurs centaines) et le champs1 (ville dans l'exemple) est dans le bon ordre dans le fichier2. Par contre il y a des trous dans la numérotation du fichier 1... Je précise aussi que je ne suis pas en bash 4 mais en 2.05b.0(1)-release

Exemple du fichier1 (contenant les infos à substituer) :

ville1 tata ville4 tbtb
ville3 ville5 tctc tdtd
ville4 tete ville1 tftf
ville5 tgtg thth ville3

Exemple du fichier2 (contenant les noms des villes) :

Lille
Paris
Lyon
Toulouse

Il me faut donc au final un fichier3 contenant :

Lille tata Lyon tbtb
Paris Toulouse tctc tdtd
Lyon tete Lille tftf
Toulouse tgtg thth Paris

Merci d'avance pour votre aide !

# join ?

Posté par nono14 (site web personnel) le 08 novembre 2011 à 20:05. Évalué à 2.

Tout est dans le titre.

Système - Réseau - Sécurité Open Source - Ouvert à de nouvelles opportunités
- [^] # Re: join ?
  
  Posté par fredlabidouille le 08 novembre 2011 à 20:24. Évalué à 0.
  
  Peut être... je regarde le man de join et je tente... merci.
  - [^] # Re: join ?
    
    Posté par fredlabidouille le 08 novembre 2011 à 20:41. Évalué à 0.
    
    J'essaye de comprendre le fonctionnement de la commande join car j'obtiens ceci quand je la tente même en demandant de joindre les 2 fichiers sur le champ 1 :
    
    join: fichier 2 n'est pas dans l'ordre attendu
    join: fichier 1 n'est pas dans l'ordre attendu
    
    Est-tu sur que cette commande est adaptée à ce que je souhaite faire ? Sachant que les 2 fichier n'ont pas de champs commun...
- [^] # Re: join ?
  
  Posté par fredlabidouille le 08 novembre 2011 à 21:00. Évalué à 0.
  
  A présent j'en suis sur. Je ne peux pas faire cela avec join car il faut un champs commun dans les deux fichiers ce qui n'est pas mon cas...
- [^] # Re: join ?
  
  Posté par fredlabidouille le 08 novembre 2011 à 21:16. Évalué à 0.
  
  De plus j'avais oublié que le champs1 pouvait se retrouver ailleurs dans le fichier1... désolé. Je mets à jour le post.
- [^] # Re: join ?
  
  Posté par Anthony Jaguenaud le 09 novembre 2011 à 11:43. Évalué à 1.
  Grâce à toi, je lui ai trouvé une solution que j’espère il prendra le temps de comprendre.
  
  Je suis content, je viens de découvrir join. C’est une bonne journée, j’ai appris un truc.
  Par contre, je suis toujours pas au point avec cut, du coup, j’utilise awk :-p
```
$ ./test.sh
Lille tata Lyon tbtb
Paris Toulouse tctc tdtd
Lyon tete Lille tftf
Toulouse tgtg thth Paris
$ cat test.sh
#!/bin/bash

sed 's% %\n%g' fic1.txt | grep -E "ville[[:digit:]]+" | sort -u | awk '{num += 1; print num " " $1;}' >ville.txt

awk '{num += 1; print num " " $1;}' fic2.txt >nom.txt

join ville.txt nom.txt | awk '{print $2 " " $3}' >ville_nom.txt

 cp fic1.txt fic1_tmp.txt

 while read line; do set $line; sed -i 's%'$1'%'$2'%g' fic1_tmp.txt; done < ville_nom.txt

cat fic1_tmp.txt
rm fic1_tmp.txt nom.txt ville_nom.txt ville.txt
$ 
```
  En moins de 20 mns…
# explications ?

Posté par bertrand le 08 novembre 2011 à 21:22. Évalué à 1.

est ce que je comprend bien en disant que Adresse 1 correspond à la première ligne du fichier 2, adresse2 à la deuxième ...

Est ce qu'il y a des trous, par exemple pas d'adressse3 dans le premier fichier ?

Les fichiers sont ils gros ?

Solution proposé : charger en mémoire dans le variables adresse1,adresse2, adressen, les différentes lignes du fichier 2.
ensuite, boucle readline sur le premier fichier avec incrémentation d'un compteur de ligne, et echo de adresse${n} (utiliser expr) et de la suite de la ligne du premier fichier (on omet le premier champ).

S'il y a des trous, il faut rajouter des tests pour vérifier que l'on est bien en phase.
- [^] # Re: explications ?
  
  Posté par fredlabidouille le 08 novembre 2011 à 21:53. Évalué à 0.
  
  Tout a fait. Entre temps j'ai changé adresse pas ville dans mon exemple mais c'est bien ça ville1 correspond bien à la première ligne du fichier2, adresse2 à le deuxième...
  
  Non aucun trou.
  
  Les fichiers font plusieurs centaines de lignes.
  
  Trop de ligne pour gérer chaque ligne dans une variable je pense.
  
  Je pense qu'il faut charger la première ligne du fichier2 (Paris), faire un sed avec substitution globale dans le fichier1 pour remplacer tout les ville1 par Paris, ensuite charger la seconde ligne du fichier2 et refaire un sed etc... mais j'ai du mal (je débute en scripting et j'ai du mal a imbriquer 2 boucles
# solution en bash

Posté par sputnick (site web personnel, Mastodon) le 08 novembre 2011 à 23:13. Évalué à 1.
Voici une solution à ton problème en bash (4) :
```
$ cat a
ville1 tata ville2 tbtb
ville2 ville3 tctc tdtd
ville3 tete ville4 tftf
Ville4 tgtg thth ville3

$ ville=( "" Lille Paris Lyon Toulouse )

$ count=$(grep -io "ville[0-9]\+" a | sort -n | awk 'END{gsub("[a-zA-Z]+", ""); print}')

$ for ((i=1; i<count; i++)); do sed -i -r "s@(v|V)ille${i}@${ville[i]}@g" a; done
```
On ne peut pas mettre d'array dans le string...
- [^] # Re: solution en bash
  
  Posté par fredlabidouille le 08 novembre 2011 à 23:29. Évalué à 0.
  
  Merci beaucoup pour ta proposition de solution mais le fichier des villes contenant plusieurs centaines de lignes ça vas pas être faisable comme ça je pense malheureusement. Il faut absolument que je lise les 2 fichiers et que je remplace toutes les occurrences comme par exemple ville1 par Lille, ville2 par Paris etc...
  - [^] # Re: solution en bash
    
    Posté par NeoX le 09 novembre 2011 à 07:29. Évalué à 2.
    
    pourquoi ça ne passerais pas ?
    
    il lit bien tous le fichier A (et compte le nombre de ligne, range les villes dans un tableau)
    
    puis lis le fichier 2 pour traiter ligne par ligne et remplacer ville1 par paris, ville2 par lyon...
    - [^] # Re: solution en bash
      
      Posté par fredlabidouille le 09 novembre 2011 à 11:10. Évalué à 0.
      
      J'ai du mal à comprendre ta premiere ligne :
      
      ville=( "" Lille Paris Lyon Toulouse )
      
      Ca met juste dans la variable les 4 premieres valeurs du fichier mais ça ne lis pas tous le fichier.
      - [^] # Re: solution en bash
        
        Posté par NeoX le 09 novembre 2011 à 12:35. Évalué à 2.
        
        parce qu'il ne va pas te donner la réponse à ton exercice
        
        il faut que tu cherches un peu,
        que tu comprennes quelle commande fait quoi
        et que tu adaptes les idées qu'on te balance.
        
        ;)
# typo :°

Posté par sputnick (site web personnel, Mastodon) le 08 novembre 2011 à 23:18. Évalué à 0.

Apparemment on peut pas éditer : il faut mettre dans la boucle for count+1 pour gérer Toulouse ;)

On ne peut pas mettre d'array dans le string...
- [^] # Re: typo :°
  
  Posté par fredlabidouille le 08 novembre 2011 à 23:32. Évalué à 0.
  
  Comme dit au dessus mes fichiers font plusieurs centaines de lignes... ça ne passera donc pas avec ta solution il me semble malheureusement.
# si si, c'est jouable :

Posté par sputnick (site web personnel, Mastodon) le 08 novembre 2011 à 23:35. Évalué à 0.
Suffit de récupérer le deuxième fichier dans un tableau :
```
$ cat v
Lille
Paris
Lyon
Toulouse

$ ville=( "" $(<v) )
```
On ne peut pas mettre d'array dans le string...
- [^] # Re: si si, c'est jouable :
  
  Posté par sputnick (site web personnel, Mastodon) le 08 novembre 2011 à 23:39. Évalué à -1.
  Ce qui donnes au final :
```
$ cat a
ville1 tata ville2 tbtb
ville2 ville3 tctc tdtd
ville3 tete ville4 tftf
Ville4 tgtg thth ville3

$ cat v
Lille
Paris
Lyon
Toulouse

$ ville=( "" $(<v) )

$ count=$(grep -io "ville[0-9]\+" a | sort -n | awk 'END{gsub("[a-zA-Z]+", ""); print}')

$ for ((i=1; i<count+1; i++)); do sed -i -r "s@(v|V)ille${i}@${ville[i]}@g" a; done

$ cat a
Lille tata Paris tbtb
Paris Lyon tctc tdtd
Lyon tete Toulouse tftf
Toulouse tgtg thth Lyon
```
  On ne peut pas mettre d'array dans le string...
  - [^] # Re: si si, c'est jouable :
    
    Posté par sputnick (site web personnel, Mastodon) le 08 novembre 2011 à 23:51. Évalué à 1.
    Une autre solution :
```
$ cat a
ville1 tata ville2 tbtb
ville2 ville3 tctc tdtd
ville3 tete ville4 tftf
Ville4 tgtg thth ville3

$ cat v
Lille
Paris
Lyon
Toulouse

$ sed -i 's:$: :g' a

$ c=0; while read a; do ((c++)); sed -i -r "s@(v|V)ille${c} @$a @g" a; done < v

$ cat a
Lille tata Paris tbtb
Paris Lyon tctc tdtd
Lyon tete Toulouse tftf
Toulouse tgtg thth Lyon
```
    On ne peut pas mettre d'array dans le string...
- [^] # Re: si si, c'est jouable :
  
  Posté par JGO le 09 novembre 2011 à 00:15. Évalué à 0.
```
#!/bin/bash
TAILLE=`wc -l /tmp/fichier2| cut -d " " -f 1` 
for i in `seq 1 $TAILLE` ; do
  ville=`sed -n -e ${i}p /tmp/fichier2` 
  sed -i -e "s/ville${i}/$ville/g" /tmp/fichier1 
done
```
  - [^] # ouch
    
    Posté par sputnick (site web personnel, Mastodon) le 09 novembre 2011 à 01:11. Évalué à 0.
    Erreurs :
    - tu gère pas la casse (ville et Ville)
    - ville1 va matcher ville10 ville110 (...) et ville1
    - seq en bash c'est moche, on peut utiliser plus proprement for ((i=1; i<taille; i++))
    On ne peut pas mettre d'array dans le string...
    - [^] # Re: ouch
      
      Posté par JGO le 09 novembre 2011 à 09:53. Évalué à 2.
      casse -> Ah oui, j'avais pas vu le V majuscule en dernière ligne. Mais apparemment l'auteur du post s'y connait un minimum, il peut adapter l'expression rationnelle tout seul aux vrais fichiers qu'il aura à traiter.
      
      ville110 -> on peut faire la boucle en sens inverse avec |tac après seq pour éviter le problème.
      
      je sais pas si seq c'est moche, c'est ce que je connais et j'ai a pas passé plus de 2 minutes avant que chez-moi-ça-marche sur l'exemple fourni. Bon mettons 3 minutes pour quand j'ai dû lire le manuel de cut pour éviter awk "{ print $1 }" (qui marche aussi très bien, mais je me suis dit « y'aura bien quelqu'un pour trouver que c'est moche »).
      
      Je cherche pas à donner une solution parfaite, je donne une des directions possibles, qui n'est juste pas totalement peaufinée. Perso je n'ai pas compris grand chose aux autres solutions proposées, et je vois pas pourquoi on serait obligé de répondre avec des tableaux bidimensionnels, des while ou des for si on sait faire autrement. There's more than one way to do it.
      - [^] # Re: ouch
        
        Posté par NeoX le 09 novembre 2011 à 10:12. Évalué à 3.
        
        ville110 -> on peut faire la boucle en sens inverse avec |tac après seq pour éviter le problème.
        
        ou simplement faire un seq $count 1 -1
        pour compter de $count jusqu'à 1 avec un pas de -1 (donc compter à l'envers
# sed quand même

Posté par gaaaaaAab le 09 novembre 2011 à 02:05. Évalué à 2.
j'arrive un peu après la bataille, mais, en tenant compte des deux premières remarques de sputnick:
```
# fabrication d'un fichier de regex pour sed
i=0; while read line; do i=$(($i+1)); echo "s/\\<ville$i\\>/$line/ig"; done < ./fichier2  > regex
# et voilà !
sed -f ./regex ./fichier1 > fichier3
```
- [^] # Re: sed quand même
  
  Posté par fredlabidouille le 09 novembre 2011 à 10:24. Évalué à 0.
  
  MErci mais en fait j'ai de trous dans le numérotation donc ça n e fonctionne pas encore... je modifie à nouveau mon post de départ. Désolé.
# Plus simple :

Posté par sputnick (site web personnel, Mastodon) le 09 novembre 2011 à 10:00. Évalué à 0.
```
cp fichier1 new_fichier
c=0; while read a; do ((c++)); sed -i "s@\<ville$c\>@$a@gi" new_fichier; done < fichier2
```
On ne peut pas mettre d'array dans le string...
- [^] # Re: Plus simple :
  
  Posté par fredlabidouille le 09 novembre 2011 à 10:23. Évalué à 0.
  
  Merci mais en fait j'ai des trous dans la numérotation ce qui fait qu'il y a un décalage à partir de la... je cherche un méthode pour vraiement récupérer les infos ligne par ligne. exemple si par exemple il n'y a pas de ville2: ville1 -> Lille ville3 -> Paris etc... si vous voyez comment faire je suis preneur.
  - [^] # Re: Plus simple :
    
    Posté par fearan le 09 novembre 2011 à 10:49. Évalué à 2.
    
    un bête
    (( c++ )
    until grep -sqw ville$c
    do
    ((c++))
    done
    
    permet de s'assurer de l'existence de la présence de la ville ;)
    
    Il ne faut pas décorner les boeufs avant d'avoir semé le vent
# petit cours d'algorithme (algorythmique)

Posté par NeoX le 09 novembre 2011 à 10:54. Évalué à 2.
quand on fait de la programmation, on oublie souvent de réfléchir en français, et en décortiquant le problème étape par étape.

les programmeurs habitués et rodés à l'exercice font les deux en meme temps, mais parfois cela ne fonctionne pas.

et pour les débutants, autant faire les choses bien.

Alors commence par réfléchir à ton problème en français :
- j'ai un fichier A qui contient des données, présentées en ligne, chaque ligne contenant un motif (ville1 tâta ville5 titi)
- j'ai un deuxième fichier (B) contenant des données, présentée en ligne, présentant la correspondance ville1 -> paris, ville2 -> reims ...
- ce que je veux : remplacer dans le premier fichier, les mots ville1 par Paris, ville2 par Reims, etc (tel que définis dans le fichier B).
La premiere chose qui vient à l'esprit simplement, c'est :
1°) lire une ligne dans le fichier B,
2°) pour chaque ligne sortir le motif cherché "ville1" et le motif de remplacement 'Paris'
3°) effectuer le remplacement dans FichierA avec le motif recherché/remplacé définit en 2°)
4°) recommencer en 1°) avec la ligne suivante

ce qui se traduit en algorithme suivant :
tant qu'il y a des lignes dans fichierB lire une ligne extraire le motif de recherche extraire le motif de remplacement faire le rechercher/remplacer dans fichierA passer à la ligne suivante

en général une fois l'algorithme posé, l'écrire dans du code n'est plus qu'une histoire de traduction.

en perl :
```
while ($_)
...
```
en bash
```
readline
...
```
# ZSH encore vainqueur par KO!

Posté par calandoa le 09 novembre 2011 à 14:22. Évalué à 3.
En 5 lignes, sans aucune commande externe:
```
#!/bin/zsh
v=( $(<$1) )
d=( ${(f)"$(<$2)"} )
for (( i=1; i <= ${#d}; i++ ))
	d=( ${d//${${=d[i]}[1]}/$v[i]} )
print -l $d
```
Avant de passer aux explications, ouvrez votre fenêtre et criez « Gloire à Zsh » 5 fois à la cantonade.

On part du principe que v et d font la même longueur, et que le premier mot de chaque ligne de d est unique.

Dans le tableau v, on met le fichier en argument 1 contenant le nom des ville (1 élément = 1 ville).
Dans le tableau d, on met le fichier en argument 2 avec les infos à substituer (1 élément = 1 ligne).
Puis, pour chaque ligne n de d, on remplace le premier mot de cette ligne par la n-ième ville (avec le remplacement qui s'applique sur la totalité de d).
Enfin on affiche d en sautant une ligne à chaque élément.

Bien entendu, je viens de pondre ce script du premier coup, et je ne l'ai même pas vérifié tellement il est évident qu'il marche... Que je sois foudroyé si je m
# Résolu

Posté par fredlabidouille le 16 novembre 2011 à 15:38. Évalué à 0.

Bonjour,

Le problème à été résolu de la manière suivante :

i=1
while read line
do
valeur=$(sed -n "${i}p" fichier2)
sed -i "s/${line%% *}/${valeur}/Ig" fichier1
((i++))
done < fichier1

N.B. : La solution n'est pas de moi mais d'une personne d'un autre forum

Merci à tous pour votre aide et vos conseils.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.