Forum Linux.débutant Extraire mot d'un fichier texte suivant un pattern

Posté par  . Licence CC By‑SA.
0
15
juin
2015

Bonjour à tous,

Utilisateur très récent de l'univers linux (j'utilise Ubuntu 14.04 LTS), dans le cadre d'un projet, j'aurais besoin d'aide pour extraire des informations d'un document texte

Voici le lien d'une recherche google, le lien de cette recherche est écrit dans un document texte :

https://www.google.fr/search?q=recherche+google&ie=utf-8&oe=utf-8&gws_rd=cr&ei=zd5-VY-kJ8nCywPEvIDwCw

Je voudrais savoir quelles commandes appliquer depuis le terminal, ou écrire un script pour extraire les mots "recherche" et "google" du lien (à savoir que tous les liens google suivent le même pattern, les mots sont situés après /search?q= ) et les placer dans un autre fichier texte

Il doit surement déjà exister des algorithmes qui permettent de le faire

Merci d'avance

  • # regex powa

    Posté par  (Mastodon) . Évalué à 3.

    Bonjour?

    D'abord, grep :
    sh
    $ grep 'recherche' <file>
    $ grep 'google' <file>

    Ensuite expressions rationnelles sont tes amies, même si tu ne le sais pas encore…

    http://www.rexegg.com/

    Bien à toi et bon courage !

  • # Exercice d’école ?

    Posté par  . Évalué à 3. Dernière modification le 15 juin 2015 à 16:54.

    Bonjour,

    Ça ressemble méchamment à un exercice d’école ça. On doit pouvoir trouver une solution en sed, awk, bash, perl, C, python, avec ou sans regex, etc. Pour le fun, voici une solution en Go: http://play.golang.org/p/1MZ8wpSyUB

        $ go run test.go "https://www.google.fr/search?q=recherche+google&ie=utf-8&oe=utf-8&gws_rd=cr&ei=zd5-VY-kJ8nCywPEvIDwCw"
        recherche google

    Oui je sais que c’est pas ce qui est demandé :-)

  • # Merci pour vos réponses

    Posté par  . Évalué à 1.

    Merci beaucoup, le Regex va très certainement me permettre de résoudre mon problème.

    J'ai également une autre question, concernant également mon projet :
    En collectant des paquets via mitmproxy, comme des liens http par exemple, que je stocke ensuite dans un document "outfile", seulement lorsque je souhaite ouvrir ce document, ce dernier est "crypté"
    Pourriez vous m'indiquer comment passer mon document avec des caractères tels que ceux de l'ASCII ou autre, qui me permette de lire le lien récupéré?

    Exemple de paquet crypté

    Merci d'avance encore une fois

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.