Sembrerebbe che in un mondo in cui metà della popolazioneil pianeta utilizza attivamente i computer ed è abituato a interfacce grafiche eleganti e alle ricche capacità di tali, non c'è già posto per le applicazioni di testo. Circa 20 anni fa, l'interfaccia del computer era un terribile pannello nero che non mostrava nulla tranne una serie di caratteri bianchi, e tutto il controllo veniva effettuato tramite comandi di testo. Sorprendentemente, quanto siano brutti questi programmi, sono altrettanto funzionali e affidabili.
Cos'è Wget?
Wget (indicato anche come GNU Wget Linux)è una console, un'applicazione non interattiva per lavorare con file e pagine web. Si tratta infatti di un programma per scaricare file da Internet, caratterizzato dall'assenza di un'interfaccia grafica e da una serie di funzionalità gestionali non tipiche delle soluzioni più moderne.
Il programma è stato sviluppato da un ingegnere croatoHrvoji Niksic, e ora lo sviluppo è supportato da Giuseppe Scrivano e dalla comunità Linux. La prima build dell'utilità (allora ancora chiamata GetURL) è stata presentata nel gennaio 1996. Il programma è stato scritto nel linguaggio di programmazione C e pubblicato sotto licenza GNU. Lo strumento è stato originariamente rilasciato sulla piattaforma Linux. Nel tempo, l'utilità è stata tradotta in molte lingue e trasferita su tutte le piattaforme più diffuse, tra cui Wget per Windows 7 (e più recenti), Wget per MacOS e così via.
Questo programma non è interattivo, il che significaqualsiasi processo avviato nell'ambito delle sue capacità non può essere tenuto sotto controllo; può essere controllato facendo riferimento agli strumenti di gestione del sistema operativo stesso.
Sebbene i browser moderni di solitohanno un download manager integrato, sono ancora progettati per l'interazione interattiva, quindi il lavoro manuale diventa difficile. Al contrario, Wget consente di automatizzare una serie di processi. Ad esempio, è possibile preparare in anticipo un documento di testo con un elenco di pagine web, utilizzando il quale è possibile caricare più file e pagine contemporaneamente.
Le principali funzioni del programma
Tuttavia, prima di tutto, è un programma per scaricare file, da cui segue l'ovvietà della sua funzione principale.
Wget può scaricare qualsiasi materiale dal webInternet, che si tratti di documenti, file esecutivi o intere pagine web in formato HTML (su vari protocolli). I file possono essere caricati dalle directory tramite FTP.
Il client può eseguire il caricamento ricorsivo, inseguire automaticamente i collegamenti all'interno di un sito Web specifico (o più siti Web), ripristinando la struttura originale del sito Web. È possibile visualizzare i siti Web scaricati senza accedere alla rete (per impostazione predefinita, caricati come indirizzi per la visualizzazione in linea).
Inizialmente, Wget si è adattato a rallentare etipi di connessione instabili, quindi la sua caratteristica importante è la capacità di recuperare un download di file interrotto (questo è possibile se il server supporta le intestazioni RANGE). Inoltre, Wget può monitorare lo stato dei server (la loro disponibilità) per ricaricare e aggiornare (Wget controlla le intestazioni dei file e mantiene l'ultima versione) di file e pagine web.
Il programma ha anche una serie di funzionalità, tipiche delle cosiddette utilità spider, che esaminano vari siti Web e server per la presenza di determinati file.
Piattaforme supportate
Wget Linux è diventato la base per questo prodotto.Come accennato in precedenza, inizialmente l'utility funzionava solo su Linux, ma ha rapidamente guadagnato popolarità ed è stata adattata per altri sistemi. Ad esempio, puoi trovare una versione di Wget per Windows 7 e sistemi operativi più recenti e ci sono assembly con un'interfaccia grafica. Per quanto riguarda Linux, il programma è spesso integrato nella distribuzione. I terminali in alcune build Linux supportano nativamente i comandi Wget. Ubuntu, Fedora, openSUSE e altre distribuzioni consumer funzionano con il programma, come si suol dire, fuori dagli schemi. Diamo uno sguardo più da vicino al programma qui sotto.
Comandi wget: elenco dei parametri di base
L'elenco di base dei comandi include:
- -V - consente di scoprire quale versione del programma è attualmente in uso;
- -h - mostra l'elenco più completo di comandi per lavorare con l'applicazione;
- -b - ti permette di mettere il programma in background;
Elenco dei parametri del messaggio
I comandi di Wget ti danno il controllo completo sulle informazioni visualizzate. Eccone un elenco:
- -o logfile - crea un file di log che registra l'intero processo dell'applicazione;
- -un file di registro - consente di aggiungere un file di registro esistente invece di crearne uno nuovo;
- -d - mostra le informazioni necessarie per gli sviluppatori e il debugger (aiuta a risolvere problemi e correggere errori nel lavoro del client);
- -q - disabilita la visualizzazione dei messaggi;
- -v - questa opzione è abilitata per impostazione predefinita, fornisce un rapporto dettagliato su tutti i processi che avvengono nel programma (in tempo reale);
- -nv - Riduce in modo significativo le informazioni ricevute dall'utente nei messaggi. Rimangono solo i dati più importanti e gli avvisi di errore;
- -i file (con il percorso del file) - comandoconsente di scansionare un file estraendone un collegamento e scaricandolo; puoi usare file di vari formati, incluso HTML, ma se usi questo comando, non specificare il percorso del file sulla riga di comando;
- -f - fa sì che il programma legga il file comeHTML; quando si utilizza questo comando per lavorare con un documento HTML locale, può verificarsi un errore, per evitarlo è sufficiente specificare nel documento <base href = ”url”>.
Elenco dei parametri di avvio
Comandi di base per la gestione dei caricamenti di file con Wget. Ecco il loro set di base:
- --bind-address = ADDRESS - questo comando lo consentepassare i dati di associazione a ADDRESS della macchina locale. Quando si utilizza una connessione TCP / IP, il comando è necessario per specificare l'indirizzo IP esatto (se ce ne sono diversi).
- -t numero (è necessario specificare un numero): consente all'utente di selezionare il numero di tentativi di download. Per evitare ripetizioni, specificare il valore numerico uguale a zero.
- -nc - questo comando ti permette di restituire il precedentelo stato del file in fase di download in caso di errore di rete e il download viene interrotto. Se non usi uno dei comandi di download (-N, -nc, -r), Wget ne creerà una copia e inizierà a scaricare di nuovo. L'opzione -r ti consente di sostituire i file esistenti.
- -c - aiuta anche a scaricare il file, inse la connessione viene persa (e quando Wget ha smesso di provare a riconnettersi). È sufficiente indicare questo comando prima del collegamento al file. Se un file simile viene trovato nella directory utilizzata, Wget lo identificherà e deciderà automaticamente di caricarlo. Il comando può essere utilizzato solo su server che supportano le intestazioni RANGE.
- --progress - consente di selezionare il tipo di visualizzazione dell'avanzamento del download. È possibile specificare –progress = bar o progress = dot.
- --spider - sostituisce il comando di caricamento del file verificandone la presenza sul server;
- -w (in secondi) - Specifica il timeout tra i download.
- -q (specificato in kilobyte omegabyte): consente di controllare chiaramente la dimensione dei dati scaricati e limitare i volumi eccessivi. Tuttavia, vale la pena notare che un file verrà caricato indipendentemente dalla quota impostata (ovvero, questa opzione non funzionerà con un file, non importa quanto sia pesante).
Elenco dei parametri HTTP
- --http-user = e --http-passwd = - consentono di specificare un nome utente e una password per l'autorizzazione sulla risorsa Web da cui verranno caricati i file.
- -C = on / off - consente di abilitare o disabilitare la memorizzazione nella cache dei dati sul lato server.
- --cookies = on / off - come percache, solo per i cookie. Consente di interrompere o riprendere lo scambio dei dati dei cookie necessari al server per conservare le statistiche delle visite. L'opzione è abilitata per impostazione predefinita, ma i cookie non vengono salvati sul disco rigido.
- --save-cookies - consente di salvare i cookie (solo dati aggiornati).
- --proxy-user e –proxy-passwd - consente di specificare un nome utente e una password per l'autorizzazione sul server proxy (se utilizzato).
Elenco parametri FTP
Opzioni avanzate per lavorare con Wget. Comandi FTP:
- -nr - proibisce l'eliminazione dei file temporanei dalla directory .listing, che vengono generati spontaneamente quando si lavora con FTP;
- -g on / off - consente all'utilità di utilizzare caratteri speciali nelle directory FTP;
- --passive-ftp: questo comando può essere utilizzato se è presente un firewall per attivare la modalità FTP passiva (quando l'utente è responsabile di stabilire una connessione al server).
Comandi Wget: esempi di utilizzo
L'esempio più semplice e comune per lavorare conil programma, ovviamente, sta scaricando dei file. Per provare i comandi di Wget, puoi iniziare semplice, trovare un collegamento a un file sulla rete e inserire nella console / terminale: Wget * un collegamento che indica il percorso esatto e completo del file *.
Per continuare a scaricare il file, utilizzare: Wget -c * collegamento con il percorso esatto e completo del file *.
Se hai un elenco pianificato con collegamenti a file e documenti, puoi utilizzare il comando Wget -i filelist.txt.
Quando si tratta di caricare pagine web, il gioco è fatto.un po 'più complicato, ma allo stesso tempo il numero di possibilità aumenta in modo significativo. Per evitare di dover reinserire i parametri ogni volta che è necessario caricare un sito Web, è possibile creare script o scrivere tutte le impostazioni in un file .wgetrc.
È possibile salvare la pagina web come link (sarà difficile aprirli sulla macchina locale) utilizzando il comando Wget -m * link specificando il percorso esatto e completo del file *.
Per rendere la stessa pagina disponibile per la visualizzazione senza una connessione Internet, è possibile utilizzare il comando Wget -r -10 -k * link con il percorso esatto e completo del file *.
Errore di formato Il comando Wget non trovato può indicare un errore di battitura e un parametro errato.