Les aspirateurs de sites Web
Les internautes possedant des petites connections à l’Internet 56k (dont je fais parti, il ne faut pas croire)
sont souvent contraints à un accès limité et non-permanent au réseau des réseau, contrairement aux internautes
privillegiès cablés et ADSLés
Hors, pour cette première catégorie, il n’existe pas d’autres solutions souvent que de devoir telecharger
un site pour pouvoir accéder aux informations qu’il comporte. On peut alors effectuer l’opération manuellement,
ce qui est souvent lent et qui prend rapidement la tête : click Fichier, click Enregistrer sous,
click Enregistrer (ou Alt + F + S + Enter pour les plus rapides), ou bien aussi click
droit Enregister l’image sous, parfois ce sont aussi des Ctrl + C qui sont utilisés,
si jamais les inombrables JavaScript vous autorisent cette opération.
L’homme se devait de se simplifier la tâche. Et c’est pourquoi il créa l’aspirateur de site. L’aspirateur
vous permet de réaliser toutes ces opérations automatiquement. Il vous suffit de parametrer quelques options
en début de capture, comme par exemple seulement les images, explorer les sous répertoires, les liens liés,
et le tour est joué : vous n’avez plus qu’a attendre que l’aspiration se termine.
Beaucoup d’éditeur de logiciel se sont penchés sur la question. Il existe maintenant beaucoup d’outils.
La plupart sont gratuits, d’autre sont payants (Ouh!).
J’ai pour ma part retenu et testé 2 produit totalement gratuit. Un moyen et un SUPER : Memoweb
et WGET.
MemoWeb
Memoweb est gratuit dans sa version de demo. Toutes les options ne sont
donc pas toutes disponibles. Une publicité est affichée durant toute la durée de la capture (que dis-je?
4 publicités qui utilisent de la bande passant qui est limitée si nous nous plaçons dans l’hypothése d’une
connection 56k) et un logo Memoweb est apposé à tous les documents HTML en
guise de pied de page (gloops!). Un raccourci est créer dans la barre d’outils de Internet Explorer, ainsi
qu’un autre dans le premier niveau du menu démarrer. Vous pourrez toujours le supprimer, mais il reviendra
à chaque utilisation de Memoweb
. Ce programme est également un peu buggé. Aussi,
si vous tentez de l’utiliser si vous n’êtes pas connecté au www, il plantera parcequ’il ne pourra pas telecharger
ses pubs =:o. Je vous dis pas si ça plante pendant le telechargement d’un gros fichier :’-(
Mais à coté de ça, Memoweb est très bien : on peut configuer le type de fichiers
à aspirer, les niveaux d’explorations des répertoires et sous-répertoires, et il peut même analyser le code
JavaScript, les applets Java, les animations Flash. On peut spécifier des tailles limites et maximales
d’aspiration des fichiers. Un ensemble de pages Web est aussi créé afin d’explorer l’ensembles des documents
aspirés en local.
WGET
WGET est GNU et a été à l’origine développé pour Linux/Unix.
Vu qu’il était très performant (et qu’il l’est toujours
, il a rapidement été porté pour les plateformes DOS et Windows. Comme WGET
est donc totalement gratuit et le code source est également disponible (instructif). Le seul inconvenient énorme de
WGET que j’ai pu trouver est que son utilisation nécessite
un peu d’apprentissage, puisqu’il faut l’utiliser en ligne de commande : pas d’interface graphique comme les
utilisateurs de Windows ont l’habitude d’en voir. Tous se passe comme au bon vieux temps de Unix et de DOS.
Par conséquent, WGET est très petit (262 ko à télecharger
contre pratiquement 2mo pour Memoweb) et occupe très peu de place en mémoire.
Il ne plante JAMAIS et il n’y a aucune pub (normal). Une fois maitrisé, vous pourrez facilement réaliser
les même opérations qu’avec un autre aspirateur. En effet, WGET
permet d’analyser le code des documents, d’explorer les FTP anonyme ou non, de choisir les documents à
telecharger, de restreindre l’exploration à un répertoire, ou au contraire de létendre. Vous pouvez aussi
éditer un fichier dans lequel vous pourez configurer les options que vous utilisez le plus souvent.
Bref, il est tellement complet que je vais m’arreter là : un fichier d’aide au format HTML et HLP est fourni
avec vous indiquant comme l’utiliser au mieux.
Quelques liens :
- Memoweb : http://www.goto.fr/
- WGET : ftp://sunsite.dk/projects/wget/windows/

