sur un site, tu as uniquement certaines pages qui t'intéressent.
par exemple, des fiches produits que tu souhaites indexer.
ce que je veux, c'est par exemple indexer les fiches produits mais pas les pages de catégorie, sachant que la découverte des pages de catégorie implique de passer par l'index puis les pages de catégorie.
Avec "-A" comme options, j'ai l'impression que wget mélange les deux. En fait, pour ramener ça à une directive "robots", je ne vois pas comment séparer les règles pour l'"index" et le "follow".
Rien de très précis. D'abord faire un inventaire de ce qui existe en matière de veille (surveillance de pages, de news, interrogation de mpteurs et de db en ligne,...).
je rectifie: ça fonctionne pour de courtes phrases. si je mets plus de texte, ça ne donne rien, par contre... Si qqn connaît un forum d'utilisateurs pour vocalyze, je suis partant...
Oui ^^. Moi, ce qui m'a fait tiquer, c'est surtout ceci: "Firebird: base de données dont le code source a été ouvert par Inprise (aujourd'hui Borland) en 2000. La moins répandue des bases de données Open Source." Un type qui bossait dessus m'avait pourtant dit que c'était bien utilisé auprès des développeurs Delphi et cie.
> si tu ne fermes pas l'ID de connexion entre script 1 et script 2
Possible... Sauf que SQLite n'utilise pas de connexion comme MySQL mais une ouverture de fichier. Ce qui me fait penser à une histoire de cache internet au moteur d'exécution de PHP).
Il ne s'agit donc pas de deux accès dans un meme script.
Ca te semble tjrs aussi logique?
Connexion associée à l'adresse de connexion, alors?
Ou sorte de cache mémoire propre à PHP dès que plusieurs requêtes arrivent?
Hello,
Oui, c'est une des manières.
Cependant, en fait, je cherche à voir ce qu'il existe de plus élaboré, notamment en matière de souplesse de définition des règles d'extraction et de robustesse aux variations de code HTML (entre pages similaires).
R.
Au mieux, le nouveau brevet serait dépendant des précédents. Ca revient donc à "je te tiens, tu me tiens, par la barbichette" et c'est peut-être ça le but : freiner l'essor de ces technologies, ou amener les "gros" à la négociation.
Concernant Red Hat, je pense me souvenir qu'ils ont des brevets défensifs.
Excellent site que Zoonek2, c'est en effet le plus complet en français sur R que j'ai trouvé.
Sinon, pour le M de Box, je n'ai pas trouvé. J'ai un script pour le calculer, mais ne sais pas l'exploiter (il me manque une autre donnée) et ne suis pas en plus sûr de ma formule :
Ceux que ça intéresse, j'ai un début de script pour le M de Box en R.
Finalement, je fais une partie des traitements sur R (Manova -je vais essayer plus tard de faire un tuto, car même sur Zoonek, il n'y a pas pour la Manova- et HSD de Tukey) et le Test de Box sur SPSS (finalement, je l'ai trouvé dans SPSS, qui par contre ne propose par la MANOVA, qui est dans un module optionnel que je n'ai pas avec ma licence).
Pour ma part, je commence à utiliser ce service pour localiser les visiteurs d'un service de recherche d'actualités belges. Je suis ainsi en mesure de proposer des raccourcis vers des news géagraphiquement ciblées. Je pense que ça peut représenter, pour un certain public, une réelle valeur ajoutée (les actus de votre ville, de vos élus, etc).
Ca m'a l'air super sympa comme truc (ça demande un minimum de lignes de code pour l'utiliser).
Je jette un oeuil ce soir et je reposte pour dire quoi.
Merci !
PS : sais-tu si c'est robuste vis-à-vis des flux mal formés ?
Si si, c'est le genre de chose que je cherche :-D .
Propagande, je connais bien, il y a plein de bonnes choses là-dessus, dont René Binamé et les Slugs.
[^] # Re: synchroniser des applications ?
Posté par Robert VISEUR (site web personnel) . En réponse au message Logiciel avec connecteur. Évalué à 1.
mais j'ai aussi des collègues sous windows (côté poste de travail)...
y a-t-il des outils de ce côté-là?
[^] # Re: synchroniser des applications ?
Posté par Robert VISEUR (site web personnel) . En réponse au message Logiciel avec connecteur. Évalué à 1.
je parlais bien sûr de récupérer les données liées aux contacts et aux rendez-vous....
# blâme...
Posté par Robert VISEUR (site web personnel) . En réponse au message Attribut Type d'une balise Link via SGML Parser (Python). Évalué à 1.
[^] # Re: wget et lien
Posté par Robert VISEUR (site web personnel) . En réponse au message wget + suivi de lien vs sauvegarde. Évalué à 1.
sur un site, tu as uniquement certaines pages qui t'intéressent.
par exemple, des fiches produits que tu souhaites indexer.
ce que je veux, c'est par exemple indexer les fiches produits mais pas les pages de catégorie, sachant que la découverte des pages de catégorie implique de passer par l'index puis les pages de catégorie.
Avec "-A" comme options, j'ai l'impression que wget mélange les deux. En fait, pour ramener ça à une directive "robots", je ne vois pas comment séparer les règles pour l'"index" et le "follow".
[^] # Re: Nom pourrie
Posté par Robert VISEUR (site web personnel) . En réponse à la dépêche Go-oo, une alternative à OpenOffice. Évalué à 5.
Non, je ne pense pas, d'ailleurs, MS semble l'avoir bien compris à l'époque de Netware
=> []
[^] # Re: hmmm
Posté par Robert VISEUR (site web personnel) . En réponse au message Logiciel de veille par métamoteur croisé jadis sur Linuxfr. Évalué à 1.
# Magellan
Posté par Robert VISEUR (site web personnel) . En réponse au message Logiciel de veille par métamoteur croisé jadis sur Linuxfr. Évalué à 1.
Mais pas de trace dans les news Linuxfr.
Donc, ai un doute...
http://sourceforge.net/projects/magellan2/
[^] # Re: Va voir dans kttsmgr
Posté par Robert VISEUR (site web personnel) . En réponse au message Ce qui en libre existe pour la synthèse vocale?. Évalué à 1.
freetts
c'est une idée où ces deux-là fonctionne pas pour le français ?
[^] # Re: ça fonctionne
Posté par Robert VISEUR (site web personnel) . En réponse au message Problème dans l'utilisation de Vocalyse. Évalué à 1.
# ça fonctionne
Posté par Robert VISEUR (site web personnel) . En réponse au message Problème dans l'utilisation de Vocalyse. Évalué à 1.
pas vraiment d'explication...
pour les personnes intéressées, il y a epseak aussi (cfr sourceforge), bien léger et accessible en ligne de commande.
[^] # Re: beuh
Posté par Robert VISEUR (site web personnel) . En réponse au message Berkeley DB: quelque peu disparue de la circulation?. Évalué à 1.
# Liste blanche
Posté par Robert VISEUR (site web personnel) . En réponse à la dépêche Surfez anonymement avec la dernière version du client BitTorrent Deluge. Évalué à 2.
Quelqu'un a trouvé cette liste blanche ?
J'ai regardé sur le site, mais pas trouvé.
[^] # Re: pas besoin d'un serveur
Posté par Robert VISEUR (site web personnel) . En réponse au message Sites Bittorrent "clean". Évalué à 1.
Pour préciser, je maintiens un moteur de recherche BitTorrent, et je recherche donc de nouvelles "grosses" sources "clean".
[^] # Re: phenomene de cache ?
Posté par Robert VISEUR (site web personnel) . En réponse au message Premier chargement de SQLite fort long. Évalué à 1.
Possible... Sauf que SQLite n'utilise pas de connexion comme MySQL mais une ouverture de fichier. Ce qui me fait penser à une histoire de cache internet au moteur d'exécution de PHP).
[^] # Re: phenomene de cache ?
Posté par Robert VISEUR (site web personnel) . En réponse au message Premier chargement de SQLite fort long. Évalué à 1.
1er accès = script1
2ème accès = script2
Il ne s'agit donc pas de deux accès dans un meme script.
Ca te semble tjrs aussi logique?
Connexion associée à l'adresse de connexion, alors?
Ou sorte de cache mémoire propre à PHP dès que plusieurs requêtes arrivent?
[^] # Re: Rétroingénérie
Posté par Robert VISEUR (site web personnel) . En réponse au message Outils libres de rétroingénierie de pages Web?. Évalué à 1.
Oui, c'est une des manières.
Cependant, en fait, je cherche à voir ce qu'il existe de plus élaboré, notamment en matière de souplesse de définition des règles d'extraction et de robustesse aux variations de code HTML (entre pages similaires).
R.
# Plugins et licences
Posté par Robert VISEUR (site web personnel) . En réponse au message Architectures à plugins: comment les réaliser en pratique?. Évalué à 1.
Y a-t-il également des techniques pour permettre une certaine liberté dans le choix de la licence des plugins ?
Par exemple, si mon application principale est GPL ?
[^] # Re: Cela faisait longtemps que j'attendais ça !
Posté par Robert VISEUR (site web personnel) . En réponse à la dépêche RMS par Alan Cox. Évalué à 2.
Concernant Red Hat, je pense me souvenir qu'ils ont des brevets défensifs.
[^] # Re: je suis un chieur
Posté par Robert VISEUR (site web personnel) . En réponse à la dépêche Le Jargon Français en wiki. Évalué à 2.
C'est le fait qu'ils réutilisent qui t'embête ou le fait qu'ils réutilisent dans citer la licence ni l'origine ?
[^] # Re: Hum
Posté par Robert VISEUR (site web personnel) . En réponse au message Questions sur R (statistiques). Évalué à 1.
Sinon, pour le M de Box, je n'ai pas trouvé. J'ai un script pour le calculer, mais ne sais pas l'exploiter (il me manque une autre donnée) et ne suis pas en plus sûr de ma formule :
http://www.math.yorku.ca/Who/Faculty/Monette/S-news/1320.htm(...)
http://www.math.yorku.ca/Who/Faculty/Monette/S-news/1321.htm(...)
Ceux que ça intéresse, j'ai un début de script pour le M de Box en R.
Finalement, je fais une partie des traitements sur R (Manova -je vais essayer plus tard de faire un tuto, car même sur Zoonek, il n'y a pas pour la Manova- et HSD de Tukey) et le Test de Box sur SPSS (finalement, je l'ai trouvé dans SPSS, qui par contre ne propose par la MANOVA, qui est dans un module optionnel que je n'ai pas avec ma licence).
En tout cas, R, c'est vraiment pas mal du tout !
[^] # Re: intérêt ?
Posté par Robert VISEUR (site web personnel) . En réponse au message Votre contribution à HostIP (géolocalisation). Évalué à 2.
[^] # Re: feedparser
Posté par Robert VISEUR (site web personnel) . En réponse au message Lecture RSS en Python : quel outil ?. Évalué à 1.
Je jette un oeuil ce soir et je reposte pour dire quoi.
Merci !
PS : sais-tu si c'est robuste vis-à-vis des flux mal formés ?
[^] # Re: urllib2
Posté par Robert VISEUR (site web personnel) . En réponse au message urllib + .htaccess. Évalué à 1.
exemple qui marche aussi avec urllib (indenter correctement)
il suffit d'intercepter dans le try except du programme qui fait l'appel.
[^] # Re: Miss Helium
Posté par Robert VISEUR (site web personnel) . En réponse au message MP3 en libre diffusion. Évalué à 1.
Propagande, je connais bien, il y a plein de bonnes choses là-dessus, dont René Binamé et les Slugs.
[^] # Re: Miss Helium
Posté par Robert VISEUR (site web personnel) . En réponse au message MP3 en libre diffusion. Évalué à 1.
Non, en effet, mais c'est assez fun à écouter. Ca me fait penser à du Young Gods, mais en plus "hard".