Wget
Un article de SeRoM - Wiki.
Sommaire |
[modifier] Introduction
wget est un logiciel libre permet de télécharger un fichier depuis Internet. Il sait s'adapter à de très nombreux cas :
- HTTP
- HTTPS
- FTP
[modifier] Astuces
[modifier] Télécharger les fichiers nom01.gif, nom02.gif, …, nom30.gif :
for i in $(seq -w 30); do
wget http://images.ucomics.com/comics/ga/1992/ga9209$i.gif;
done
[modifier] Télécharger le contenu d'un répertoire :
wget -r -np http://www.haypocalc.com/wiki/images/
où « -np » indique "no parent" (ne remonte pas dans les répertoires parents), et « -r » demande la récursion.
[modifier] Faire un miroir d'un site
wget -m -e robots=off --user-agent 'qqchose' URL
Détails :
* "-m" active le mode miroir * "-e robots=off" ignore le fichier robots.txt (à utiliser avec précaution, c'est normalement interdit) * "--user-agent 'qqchose'" : Cache l'identité de wget
[modifier] Idées de projet
un aspirateur de site pourrait etre facilment réalisé a l'aide d'un petit scrypt utilisant wget

