Springe zu: Hauptnavigation, Themennavigation, Seiteninhalt, Spezielle Seiten

Download-Manager Wget

In diesem Artikel stelle ich das Programm Wget vor, mit dem man einzelne Dateien oder komplette Webseiten aus dem Internet herunterladen kann. Im Gegensatz zu Webbrowsern kann das programm seine Arbeit im Hintergrund erledigen. Da macht es weniger aus, wenn ein Download ein par Stunden dauert.

Installation

Unter den meisten Linux-Distributionen wird Wget wohl schon standardmäßig installiert sein. Das Debian-Paket hat den Namen wget und wird standardmäßig installiert.

Eine Windows-Version ist in der 941 kB großen Datei wget-1.10.2b.zip zu finden.

Syntax und Optionen

Das Programm verwendet folgende Syntax:

wget [OPTION]... [URL]...

Hier eine Auswahl der verfügbaren Optionen:

-V oder --version
Die Programm-Version wird angezeigt.
-h oder --help
eine Hilfe wird angezeigt.
-b oder --background
Das Programm führt seine Arbeit im hintergrund aus.
-o Datei oder --output-file=Datei
Protokoll-Meldungen werden in die angegebene Datei geschrieben. Wenn die Datei bereits existiert, wird sie überschrieben.
-a Datei oder --append-output=Datei
Meldungen werden an die angegebene Datei angehängt.
-q oder --quit
Es werden keine Meldungen ausgegeben.
-v oder --verbose
Dies ist die Standardeinstellung. Es werden Informationen über aktuelle Abläufe ausgegeben.
-nv oder --non-verbose
Es werden weniger meldungen ausgegeben.
-i Datei oder --input-file=Datei
Die angegebene Datei enthält die herunterzuladnenden URLs.
-O Datei oder --output-document=Datei
Die heruntergeladene Datei wird untr dem angegebenen Dateinamen gespeichert.
-nc oder --no-clobber
Bereits vorhandene Dateien werden nicht überschrieben, sondern neu angelegt und mit einem Suffix versehen.
-c oder --continue
Das Herunterladen noch nicht vollständig übertragener Dateien wird veranlasst.
-N oder --timestamping
Es werden nur Dateien heruntergeladen, die neuer als die lokalen Dateien sind.
--spider
Es werden keine Dateien heruntergeladen, sondern lediglich deren Verfügbarkeit getestet.
--limit-rate Rate
Die Download-Geschwindigkeit wird auf den angegebenen Wert begrenzt. Gibt man hinter der Zahl weder k für Kilobyte noch m für Megabyte an, wird von der Angabe von Byte ausgegangen.
--user=Benutzername
Der angegebene Benutzername wird für HTTP- und FTP-Verbindungen verwendet.
--password=Passwort
Das angegebene Passwort wird für FTP- und HTTP-Verbindungen verwendet.
-nH oder --no-host-directories
Das Anlegen von Verzeichnissen mit dem Hostnamen wird verhindert.
-r oder --recursive
Der Download findet rekursiv statt. Verlinkte Seiten oder Unterverzeichnisse werden ebenfalls heruntergeladen. Verweise auf andere Webseiten wird gefolgt. Diese Option ist mit Vorsicht zu verwenden.
-l Zahl oder --level=Zahl
Legt die maximale Rekursionstiefe fest. Dabei stehen 0 und inf für eine unbegrenzte Tiefe.
-k oder --convert-links
Nicht relative Links werden in relative umgewandelt. So kann eine Website offline gelesen werden.
-m oder --mirror
Aktiviert Optionen, die zum Erstellen eines Mirrors (Spiegels) einer Website notwendig sind. Folgende Optionen werden aktiviert: -r -N -l inf --no-remove-listing
-p oder --page-requisites
Alle Dateien, die zur Anzeige einer HTML-Seite benötigt werden, werden ebenfalls heruntergeladen.
-A Liste oder --accept=Liste
Diese Option legt die Dateiendungen fest, die heruntergeladen werden. Die Werte sind durch Komma zu trennen.
-R Liste oder --reject=Liste
Diese Option legt die Dateierweiterungen fest, die nicht heruntergeladen werden. Einzelne Werte sind mit einem Komma zu trennen.
-L oder --relative
Diese Option legt fest, dass Wget nur relativen Verweisen folgt.

Ein paar Beispiele

Im folgenden Screenshot wird die 941 kB große Datei wget-1.10.2b.zip heruntergeladen und im aktuellen Verzeichnis abgelegt:

simon@etch:~$ wget www.linux-fuer-blinde.de/pub/wget/wget-1.10.2b.zip
--15:34:53--  http://www.linux-fuer-blinde.de/pub/wget/wget-1.10.2b.zip
           => `wget-1.10.2b.zip'
Auflösen des Hostnamen »www.linux-fuer-blinde.de«.... 213.239.210.240
Verbindungsaufbau zu www.linux-fuer-blinde.de|213.239.210.240|:80... verbunden.
HTTP Anforderung gesendet, warte auf Antwort... 200 OK
Länge: 963.237 (941K) [application/zip]

100%[====================================>] 963.237       46.15K/s    ETA 00:00

15:35:14 (46.17 KB/s) - »wget-1.10.2b.zip« gespeichert [963237/963237]

simon@etch:~$

Mit dem folgenden Befehl wird die Startseite dieser Website mit all ihren verknüpften Dateien heruntergeladen und im Ordner www.linux-fuer-blinde.de abgelegt. Außerdem werden Verweise zu den verknüpften Dateien angepasst, damit diese lokal abrufbar sind:

wget -p -k www.linux-fuer-blinde.de

Der folgende Befehl stellt eine Verbindung zum FTP-Server lfb.local unter Angabe des Benutzernames lfb-local und des Kennwortes geheim her und lädt den kompletten Inhalt des Servers in das Verzeichnis lfb.local:

wget --mirror --preserve-permissions --user=lfb-local --password=geheim ftp://lfb.local

Datum der Veröffentlichung: Samstag, 10.03.2007

Nach oben

Diese Seite drucken