Download-Manager Wget
In diesem Artikel stelle ich das Programm Wget vor, mit dem man einzelne Dateien oder komplette Webseiten aus dem Internet herunterladen kann. Im Gegensatz zu Webbrowsern kann das programm seine Arbeit im Hintergrund erledigen. Da macht es weniger aus, wenn ein Download ein par Stunden dauert.
Installation
Unter den meisten Linux-Distributionen wird Wget wohl schon standardmäßig installiert sein. Das Debian-Paket hat den Namen wget und wird standardmäßig installiert.
Eine Windows-Version ist in der 941 kB großen Datei wget-1.10.2b.zip zu finden.
Syntax und Optionen
Das Programm verwendet folgende Syntax:
wget [OPTION]... [URL]...
Hier eine Auswahl der verfügbaren Optionen:
- -V oder --version
- Die Programm-Version wird angezeigt.
- -h oder --help
- eine Hilfe wird angezeigt.
- -b oder --background
- Das Programm führt seine Arbeit im hintergrund aus.
- -o Datei oder --output-file=Datei
- Protokoll-Meldungen werden in die angegebene Datei geschrieben. Wenn die Datei bereits existiert, wird sie überschrieben.
- -a Datei oder --append-output=Datei
- Meldungen werden an die angegebene Datei angehängt.
- -q oder --quit
- Es werden keine Meldungen ausgegeben.
- -v oder --verbose
- Dies ist die Standardeinstellung. Es werden Informationen über aktuelle Abläufe ausgegeben.
- -nv oder --non-verbose
- Es werden weniger meldungen ausgegeben.
- -i Datei oder --input-file=Datei
- Die angegebene Datei enthält die herunterzuladnenden URLs.
- -O Datei oder --output-document=Datei
- Die heruntergeladene Datei wird untr dem angegebenen Dateinamen gespeichert.
- -nc oder --no-clobber
- Bereits vorhandene Dateien werden nicht überschrieben, sondern neu angelegt und mit einem Suffix versehen.
- -c oder --continue
- Das Herunterladen noch nicht vollständig übertragener Dateien wird veranlasst.
- -N oder --timestamping
- Es werden nur Dateien heruntergeladen, die neuer als die lokalen Dateien sind.
- --spider
- Es werden keine Dateien heruntergeladen, sondern lediglich deren Verfügbarkeit getestet.
- --limit-rate Rate
- Die Download-Geschwindigkeit wird auf den angegebenen Wert begrenzt. Gibt man hinter der Zahl weder k für Kilobyte noch m für Megabyte an, wird von der Angabe von Byte ausgegangen.
- --user=Benutzername
- Der angegebene Benutzername wird für HTTP- und FTP-Verbindungen verwendet.
- --password=Passwort
- Das angegebene Passwort wird für FTP- und HTTP-Verbindungen verwendet.
- -nH oder --no-host-directories
- Das Anlegen von Verzeichnissen mit dem Hostnamen wird verhindert.
- -r oder --recursive
- Der Download findet rekursiv statt. Verlinkte Seiten oder Unterverzeichnisse werden ebenfalls heruntergeladen. Verweise auf andere Webseiten wird gefolgt. Diese Option ist mit Vorsicht zu verwenden.
- -l Zahl oder --level=Zahl
- Legt die maximale Rekursionstiefe fest. Dabei stehen 0 und inf für eine unbegrenzte Tiefe.
- -k oder --convert-links
- Nicht relative Links werden in relative umgewandelt. So kann eine Website offline gelesen werden.
- -m oder --mirror
- Aktiviert Optionen, die zum Erstellen eines Mirrors (Spiegels) einer Website notwendig sind. Folgende Optionen werden aktiviert: -r -N -l inf --no-remove-listing
- -p oder --page-requisites
- Alle Dateien, die zur Anzeige einer HTML-Seite benötigt werden, werden ebenfalls heruntergeladen.
- -A Liste oder --accept=Liste
- Diese Option legt die Dateiendungen fest, die heruntergeladen werden. Die Werte sind durch Komma zu trennen.
- -R Liste oder --reject=Liste
- Diese Option legt die Dateierweiterungen fest, die nicht heruntergeladen werden. Einzelne Werte sind mit einem Komma zu trennen.
- -L oder --relative
- Diese Option legt fest, dass Wget nur relativen Verweisen folgt.
Ein paar Beispiele
Im folgenden Screenshot wird die 941 kB große Datei wget-1.10.2b.zip heruntergeladen und im aktuellen Verzeichnis abgelegt:
simon@etch:~$ wget www.linux-fuer-blinde.de/pub/wget/wget-1.10.2b.zip
--15:34:53-- http://www.linux-fuer-blinde.de/pub/wget/wget-1.10.2b.zip
=> `wget-1.10.2b.zip'
Auflösen des Hostnamen »www.linux-fuer-blinde.de«.... 213.239.210.240
Verbindungsaufbau zu www.linux-fuer-blinde.de|213.239.210.240|:80... verbunden.
HTTP Anforderung gesendet, warte auf Antwort... 200 OK
Länge: 963.237 (941K) [application/zip]
100%[====================================>] 963.237 46.15K/s ETA 00:00
15:35:14 (46.17 KB/s) - »wget-1.10.2b.zip« gespeichert [963237/963237]
simon@etch:~$
Mit dem folgenden Befehl wird die Startseite dieser Website mit all ihren verknüpften Dateien heruntergeladen und im Ordner www.linux-fuer-blinde.de abgelegt. Außerdem werden Verweise zu den verknüpften Dateien angepasst, damit diese lokal abrufbar sind:
wget -p -k www.linux-fuer-blinde.de
Der folgende Befehl stellt eine Verbindung zum FTP-Server lfb.local unter Angabe des Benutzernames lfb-local und des Kennwortes geheim her und lädt den kompletten Inhalt des Servers in das Verzeichnis lfb.local:
wget --mirror --preserve-permissions --user=lfb-local --password=geheim ftp://lfb.local
Datum der Veröffentlichung: Samstag, 10.03.2007