Accueil > Internet > Les aspirateurs de sites Web

Les aspirateurs de sites Web

Les internautes possedant des petites connections à l’Internet 56k (dont je fais parti, il ne faut pas croire)

sont souvent contraints à un accès limité et non-permanent au réseau des réseau, contrairement aux internautes

privillegiès cablés et ADSLés :-)

Hors, pour cette première catégorie, il n’existe pas d’autres solutions souvent que de devoir telecharger

un site pour pouvoir accéder aux informations qu’il comporte. On peut alors effectuer l’opération manuellement,

ce qui est souvent lent et qui prend rapidement la tête : click Fichier, click Enregistrer sous,

click Enregistrer (ou Alt + F + S + Enter pour les plus rapides), ou bien aussi click

droit Enregister l’image sous, parfois ce sont aussi des Ctrl + C qui sont utilisés,

si jamais les inombrables JavaScript vous autorisent cette opération.

L’homme se devait de se simplifier la tâche. Et c’est pourquoi il créa l’aspirateur de site. L’aspirateur

vous permet de réaliser toutes ces opérations automatiquement. Il vous suffit de parametrer quelques options

en début de capture, comme par exemple seulement les images, explorer les sous répertoires, les liens liés,

et le tour est joué : vous n’avez plus qu’a attendre que l’aspiration se termine.

Beaucoup d’éditeur de logiciel se sont penchés sur la question. Il existe maintenant beaucoup d’outils.

La plupart sont gratuits, d’autre sont payants (Ouh!).

J’ai pour ma part retenu et testé 2 produit totalement gratuit. Un moyen et un SUPER : Memoweb

et WGET.

MemoWeb

Memoweb

Memoweb est gratuit dans sa version de demo. Toutes les options ne sont

donc pas toutes disponibles. Une publicité est affichée durant toute la durée de la capture (que dis-je?

4 publicités qui utilisent de la bande passant qui est limitée si nous nous plaçons dans l’hypothése d’une

connection 56k) et un logo Memoweb est apposé à tous les documents HTML en

guise de pied de page (gloops!). Un raccourci est créer dans la barre d’outils de Internet Explorer, ainsi

qu’un autre dans le premier niveau du menu démarrer. Vous pourrez toujours le supprimer, mais il reviendra

à chaque utilisation de Memoweb :-( . Ce programme est également un peu buggé. Aussi,

si vous tentez de l’utiliser si vous n’êtes pas connecté au www, il plantera parcequ’il ne pourra pas telecharger

ses pubs =:o. Je vous dis pas si ça plante pendant le telechargement d’un gros fichier :’-(

Mais à coté de ça, Memoweb est très bien : on peut configuer le type de fichiers

à aspirer, les niveaux d’explorations des répertoires et sous-répertoires, et il peut même analyser le code

JavaScript, les applets Java, les animations Flash. On peut spécifier des tailles limites et maximales

d’aspiration des fichiers. Un ensemble de pages Web est aussi créé afin d’explorer l’ensembles des documents

aspirés en local.

WGET

WGET est GNU et a été à l’origine développé pour Linux/Unix.

Vu qu’il était très performant (et qu’il l’est toujours :-) , il a rapidement été porté pour les plateformes DOS et Windows. Comme WGET

est donc totalement gratuit et le code source est également disponible (instructif). Le seul inconvenient énorme de

WGET que j’ai pu trouver est que son utilisation nécessite

un peu d’apprentissage, puisqu’il faut l’utiliser en ligne de commande : pas d’interface graphique comme les

utilisateurs de Windows ont l’habitude d’en voir. Tous se passe comme au bon vieux temps de Unix et de DOS.

WGET

Par conséquent, WGET est très petit (262 ko à télecharger

contre pratiquement 2mo pour Memoweb) et occupe très peu de place en mémoire.

Il ne plante JAMAIS et il n’y a aucune pub (normal). Une fois maitrisé, vous pourrez facilement réaliser

les même opérations qu’avec un autre aspirateur. En effet, WGET

permet d’analyser le code des documents, d’explorer les FTP anonyme ou non, de choisir les documents à

telecharger, de restreindre l’exploration à un répertoire, ou au contraire de létendre. Vous pouvez aussi

éditer un fichier dans lequel vous pourez configurer les options que vous utilisez le plus souvent.

Bref, il est tellement complet que je vais m’arreter là : un fichier d’aide au format HTML et HLP est fourni

avec vous indiquant comme l’utiliser au mieux.

Quelques liens :

Categories: Internet Tags:
  1. Pas encore de commentaire
  1. Pas encore de trackbacks