Même si l'on est dans un cadre de programmation shell, il existe une méthode simple et accessible à tous. Évidemment, si le but est d'automatiser la transformation, elle sert à rien.
Ouvrez la page web qui contient le tableau avec un navigateur web. Sélectionnez le tableau, et copiez le (édition copier).
Ouvrez le tableau d'open office, et dans un nouveau document, collez le tableau (édition coller).
Ensuite, enregistrez le document (fichier enregistrer), et sélectionnez dans la liste déroulante le format csv.
Laissez vous guider, et c'est terminé.
La solution est lourde, mais pas la peine de maîtriser l'informatique pour avoir un résultat.
# Sous quoi ?
Posté par ze_lionix (site web personnel) . Évalué à 8.
php : http://www.ouvrir-fichier.com/ouvrir-fichier-php-convertir-p(...)
shell : sed -n '/<TR/p' filename | sed 's/\(\)\(.*\)\(<\/TD>\)\(.*\)\(<\/TD>\)\(.*\)\(<\/TD>\)\(.*\)\(<\/TD><\/TR>\)/\2,\4,\6,\8/'
python : http://sebsauvage.net/python/html2csv.py
Fuse : j'en Use et Abuse !
# Méthode facile
Posté par yellowiscool . Évalué à 5.
Ouvrez la page web qui contient le tableau avec un navigateur web. Sélectionnez le tableau, et copiez le (édition copier).
Ouvrez le tableau d'open office, et dans un nouveau document, collez le tableau (édition coller).
Ensuite, enregistrez le document (fichier enregistrer), et sélectionnez dans la liste déroulante le format csv.
Laissez vous guider, et c'est terminé.
La solution est lourde, mais pas la peine de maîtriser l'informatique pour avoir un résultat.
Envoyé depuis mon lapin.
[^] # Re: Méthode facile
Posté par NeoX . Évalué à 2.
[^] # Re: Méthode facile
Posté par Mikis . Évalué à 1.
# avec un parser HTML et un langage de scripting.
Posté par Marc Quinton . Évalué à 1.
- python : BeautifulSoup
- perl ?
tu peux donner des exemples du code que tu veux décoder ?
[^] # Re: avec un parser HTML et un langage de scripting.
Posté par Marc Quinton . Évalué à 2.
(l'indentation est perdue)
from mechanize import Browser
from BeautifulSoup import BeautifulSoup
mech = Browser()
url = "http://www.palewire.com/scrape/albums/2007.html"
page = mech.open(url)
html = page.read()
soup = BeautifulSoup(html)
table = soup.find("table", border=1)
for row in table.findAll('tr')[1:]:
col = row.findAll('td')
rank = col[0].string
artist = col[1].string
album = col[2].string
cover_link = col[3].img['src']
record = (rank, artist, album, cover_link)
print "|".join(record)
[^] # Re: avec un parser HTML et un langage de scripting.
Posté par gilles renault (site web personnel, Mastodon) . Évalué à 1.
http://www.leboncoin.fr/annonces/offres/ile_de_france/
[^] # Re: avec un parser HTML et un langage de scripting.
Posté par Marc Quinton . Évalué à 1.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.