Zdálo by se, že ve světě, kde je polovina populaceplaneta aktivně využívá počítače a je zvyklá na stylová grafická rozhraní a jejich bohaté možnosti, pro textové aplikace již není místo. Asi před 20 lety bylo počítačové rozhraní strašným černým panelem, který kromě sady bílých znaků nezobrazoval nic a veškeré ovládání bylo prováděno pomocí textových příkazů. Překvapivě, jak ošklivé jsou tyto programy, jsou stejně funkční a spolehlivé.
Co je Wget?
Wget (také označovaný jako GNU Wget Linux)je konzolová, neinteraktivní aplikace pro práci se soubory a webovými stránkami. Ve skutečnosti se jedná o program pro stahování souborů z internetu, charakterizovaný absencí grafického rozhraní a řadou ovládacích funkcí, které jsou pro modernější řešení netypické.
Program vyvinul inženýr z ChorvatskaHrvoji Niksic a nyní vývoj podporuje Giuseppe Scrivano a komunita Linuxu. První build nástroje (tehdy ještě nazývaného GetURL) byl představen v lednu 1996. Program byl napsán v programovacím jazyce C a publikován pod licencí GNU. Nástroj byl původně vydán na platformě Linux. Časem byl nástroj přeložen do mnoha jazyků a přenesen na všechny populární platformy, včetně Wget pro Windows 7 (a novější), Wget pro MacOS atd.
Tento program není interaktivní, což znamená, žejakýkoli proces spuštěný v rámci jeho schopností nelze vzít pod kontrolu; lze jej řídit odkazem na nástroje pro správu samotného operačního systému.
Ačkoli moderní prohlížeče obvyklemají vestavěného správce stahování, jsou stále určeny pro interaktivní interakci, proto je ruční práce obtížná. Naproti tomu Wget umožňuje automatizaci řady procesů. Je například možné předem připravit textový dokument se seznamem webových stránek, pomocí kterého můžete nahrát několik souborů a stránek najednou.
Hlavní funkce programu
Přesto je to v první řadě program pro stahování souborů, ze kterého vyplývá samozřejmost jeho hlavní funkce.
Wget si může stáhnout jakýkoli materiál z webuInternet, ať už jde o dokumenty, spustitelné soubory nebo celé webové stránky ve formátu HTML (přes různé protokoly). Soubory lze stahovat z adresářů přes FTP.
Klient může provádět rekurzivní načítání vautomatické sledování odkazů v rámci konkrétní webové stránky (nebo několika webových stránek), přičemž se obnoví původní struktura webové stránky. Stažené webové stránky je možné zobrazit bez přístupu k síti (ve výchozím nastavení se načítají jako adresy pro online prohlížení).
Wget se zpočátku přizpůsobil pomalým anestabilní typy připojení, takže jeho důležitou vlastností je schopnost obnovit přerušené stahování souborů (to je možné, pokud server podporuje záhlaví RANGE). Wget také může sledovat stav serverů (jejich dostupnost) pro opětovné načítání a aktualizaci (Wget kontroluje záhlaví souborů a udržuje nejnovější verzi) souborů a webových stránek.
Program má také řadu funkcí typických pro takzvané spider utilities, které zkoumají různé weby a servery na přítomnost určitých souborů.
Podporované platformy
Wget Linux se stal základem tohoto produktu.Jak bylo uvedeno výše, nástroj původně fungoval pouze na Linuxu, ale rychle si získal popularitu a byl přizpůsoben pro jiné systémy. Můžete například najít verzi Wget pro Windows 7 a novější operační systémy a existují sestavy s grafickým rozhraním. Pokud jde o Linux, program je často součástí distribuce. Terminály v některých sestaveních Linux nativně podporují příkazy Wget. Ubuntu, Fedora, openSUSE a další spotřebitelské distribuce pracují s programem, jak se říká, po vybalení z krabice. Dále budeme program zvažovat podrobněji.
Wget příkazy: seznam základních parametrů
Základní seznam příkazů obsahuje:
- -V - umožňuje zjistit, která verze programu se aktuálně používá;
- -h - zobrazuje nejúplnější seznam příkazů pro práci s aplikací;
- -b - umožňuje umístit program na pozadí;
Seznam parametrů zprávy
Wget příkazy vám dávají úplnou kontrolu nad zobrazenými informacemi. Zde je jejich seznam:
- -o logfile - vytvoří soubor protokolu, který zaznamenává celý proces aplikace;
- -a logfile - umožňuje přidat existující soubor protokolu namísto vytvoření nového;
- -d - zobrazuje informace potřebné pro vývojáře a debugger (pomáhá řešit problémy a opravovat chyby v práci klienta);
- -q - zakáže zobrazování zpráv;
- -v - tato možnost je ve výchozím nastavení povolena, poskytuje podrobnou zprávu o všech procesech vyskytujících se v programu (v reálném čase);
- -nv - Výrazně zkracuje informace přijaté uživatelem ve zprávách. Zůstávají pouze nejnutnější data a upozornění na chyby;
- -i soubor (s cestou k souboru) - příkazumožňuje skenovat soubor extrahováním odkazu z něj a stáhnout jej; můžete použít soubory různých formátů, včetně HTML, ale pokud použijete tento příkaz, nezadávejte cestu k souboru na příkazovém řádku;
- -f - provokuje program, aby přečetl soubor jakoHTML; při použití tohoto příkazu pro práci s místním dokumentem HTML může dojít k chybě; aby se tomu zabránilo, stačí v dokumentu zadat <base href = ”url”>.
Seznam parametrů spouštění
Základní příkazy pro zpracování odesílání souborů pomocí Wget. Zde je jejich základní sada:
- --bind-address = ADDRESS-tento příkaz umožňujepředat data vazby ADDRESS místního počítače. Při použití připojení TCP / IP je k zadání přesné IP adresy vyžadován příkaz (pokud jich je několik).
- -t číslo (musíte zadat číslo) - umožňuje uživateli vybrat počet pokusů o stažení. Abyste se vyhnuli opakování, zadejte číselnou hodnotu rovnou nule.
- -nc - tento příkaz vám umožňuje vrátit předchozístav staženého souboru, pokud došlo k selhání sítě a stahování je přerušeno. Pokud nepoužijete některý ze stahovacích příkazů (-N, -nc, -r), Wget z něj vytvoří jeho kopii a zahájí stahování znovu. Volba -r vám umožňuje přepsat stávající soubory.
- -c - také usnadňuje další načítání souboru vpokud dojde ke ztrátě připojení (a když se Wget přestal sám pokoušet znovu připojit). Tento příkaz stačí uvést před odkazem na soubor. Pokud je podobný soubor nalezen v použitém adresáři, pak jej Wget identifikuje a automaticky se rozhodne jej načíst. Příkaz lze použít pouze na serverech, které podporují záhlaví RANGE.
- --progress -umožňuje vybrat typ zobrazení průběhu stahování. Můžete zadat –progress = bar nebo progress = dot.
- --spider -nahradí příkaz pro nahrání souboru kontrolou jeho přítomnosti na serveru;
- -w (v sekundách) - Určuje časový limit mezi stahováními.
- -q (uvedeno v kilobajtech nebomegabyte) - umožňuje vám jasně kontrolovat velikost stažených dat a omezit nadměrné objemy. Přesto stojí za zmínku, že jeden soubor bude nahrán bez ohledu na nastavenou kvótu (to znamená, že tato možnost nebude fungovat s jedním souborem, bez ohledu na to, jak je těžký).
Seznam parametrů HTTP
- --http-user = a --http-passwd =-vám umožní zadat uživatelské jméno a heslo pro autorizaci na webovém zdroji, ze kterého budou soubory nahrány.
- -C = zapnuto / vypnuto - umožňuje povolit nebo zakázat ukládání dat do mezipaměti na straně serveru.
- --cookies = zapnuto / vypnuto -stejné jako procache, pouze pro cookies. Umožňuje vám buď zastavit nebo obnovit výměnu údajů o souborech cookie nezbytných pro server k uchovávání statistik návštěv. Tato možnost je ve výchozím nastavení povolena, ale soubory cookie se neukládají na pevný disk.
- --save-cookies-umožňuje ukládat cookies (pouze čerstvá data).
- --proxy-user a –proxy-passwd-umožňuje zadat uživatelské jméno a heslo pro autorizaci na proxy serveru (pokud je použit).
Seznam parametrů FTP
Pokročilé možnosti pro práci s Wgetem. FTP příkazy:
- -nr - zakazuje mazání dočasných souborů z adresáře .listing, které jsou generovány spontánně při práci s FTP;
- -g zapnuto / vypnuto - umožňuje nástroji používat speciální znaky v adresářích FTP;
- --passive-ftp-tento příkaz lze použít, pokud existuje brána firewall k aktivaci pasivního režimu FTP (když je uživatel zodpovědný za vytvoření připojení k serveru).
Wget příkazy: Příklady použití
Nejjednodušší a nejběžnější příklad pro práci sprogram samozřejmě stahuje soubory. Chcete -li otestovat příkazy Wget, můžete začít jednoduše, najít odkaz na soubor v síti a do konzoly / terminálu zadat: Wget * odkaz s přesnou a úplnou cestou k souboru *.
Chcete -li pokračovat ve stahování souboru, použijte: odkaz Wget -c * s přesnou a úplnou cestou k souboru *.
Pokud máte naplánovaný seznam s odkazy na soubory a dokumenty, můžete použít příkaz Wget -i filelist.txt.
Pokud jde o načítání webových stránek, je to.poněkud komplikovanější, ale zároveň se výrazně zvyšuje počet možností. Abyste nemuseli znovu zadávat parametry pokaždé, když potřebujete načíst web, můžete vytvářet skripty nebo zapisovat všechna nastavení do souboru .wgetrc.
Webovou stránku můžete uložit jako odkazy (na místním počítači bude obtížné je otevřít) pomocí příkazu Wget -m * link určující přesnou a úplnou cestu k *.
Chcete -li stejnou stránku zpřístupnit k prohlížení bez připojení k internetu, můžete použít příkaz Wget -r -10 -k * link určující přesnou a úplnou cestu k souboru *.
Chyba formátu Příkaz Wget nebyl nalezen, může znamenat jakýkoli překlep a zadaný nesprávný parametr.