wget es una utilidad no interactiva de línea de comandos para descargar recursos de una URL específica. Debido a que no es interactivo, wget puede trabajar en segundo plano o incluso antes de que el usuario inicie sesión. El programa fue diseñado especialmente para conexiones deficientes, lo que lo hace especialmente robusto en condiciones que de otro modo serían irregulares. Aunque wget no se entrega con macOS, puede descargarse e instalarse fácilmente con Homebrew, el mejor gestor de paquetes para Mac disponible.
1. Descargar e instalar Homebrew
Para instalar Homebrew, abra una ventana Terminal y ejecute el siguiente comando tomado del sitio web de Homebrew:
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
Podría notar el comando llamado curl, que es una utilidad de línea de comandos diferente para descargar archivos desde una URL que se incluye en la instalación de Ruby en macOS.
2. Instalando wget
Una vez que haya terminado de instalarse, usaremos Homebrew para instalar wget. En Terminal, ejecute el siguiente comando para descargar e instalar wget:
brew install wget
Obtendrá actualizaciones en vivo sobre el progreso de la descarga e instalación de las dependencias (requisitos previos de software) necesarias para ejecutar wget en su sistema.
3. Usando wget
El propósito de wget es descargar contenido de URLs. Es una herramienta rápida y sencilla, no interactiva, para descargar archivos desde cualquier URL de acceso público.
Descargar un único archivo
Al igual que el comando similar curl, wget toma un recurso remoto de una URL y lo guarda en una ubicación específica de su computadora. La estructura del comando funciona de la siguiente manera: so:
wget -O path/to/local.copy http://example.com/url/to/download.html
Que guardará el archivo especificado en la URL en la ubicación especificada en su equipo. Si se excluye la bandera -O, la URL especificada se descargará en el directorio de trabajo actual.
Descargar un directorio recursivamente
Para descargar un árbol de directorios completo con wget, necesita usar las banderas -r/--recursiva y -np/--no-parent, como so:
wget -e robots=off -r -nphttps://www.w3.org/History/19921103-hypertext/hypertext/
Esto hará que wget siga los enlaces encontrados en los documentos dentro del directorio especificado, descargando recursivamente toda la ruta URL especificada. En general, es una buena idea desactivar robots.txt para evitar descargas abreviadas.
Otras banderas wget
Además de las banderas anteriores, este puñado seleccionado de banderas de wget son las más útiles:
Control de la descarga
- wget -X /absolute/path/to/directory excluirá un directorio específico en el servidor remoto.
- wget -nElimina los directorios de nombres de host. Recuerde, el nombre de host es la parte de la URL que contiene el nombre de dominio y termina en un TLD como ".com." Por ejemplo, la carpeta llamada "www.w3.org" en nuestro ejemplo anterior se omitiría, iniciando la descarga con el directorio "History".
- wget --cut-dirs=# omite el número especificado de directorios en la URL antes de comenzar a descargar archivos. Por ejemplo, -nH --cut-dirs=1 cambiaría la ruta especificada de "ftp.xemacs.org/pub/xemacs/" a simplemente"/xemacs/", reduciendo el número de directorios padre vacíos en la descarga local.
- wget -R index.html/wget --reject index.htmSaltará todos los archivos que coincidan con el nombre de archivo especificado. En este caso, excluirá todos los archivos de índice. El carácter * se puede utilizar como comodín, como "*.png", que omitiría todos los archivos con la extensión PNG.
- wget -i especifica las URLs de destino de un archivo de entrada. El archivo de entrada debe ser un archivo HTML o ser analizado como HTML con la bandera adicional --force-html
- wget -nc/wget --no-clobber no sobrescribirá los archivos que ya existen en el destino.
- wget -c/wget --continue continuará descargando archivos parcialmente descargados.
- wget -t 10 intentará descargar el recurso hasta 10 veces antes de fallar.
Ajuste del nivel de registro
- wget -d permite depurar la salida.
- wget -o path/to/log.txt habilita la salida del logging al directorio especificado en lugar de mostrar la salida estándar de log-in.
- wget -q desactiva toda la salida de wget, incluyendo los mensajes de error.
- wget -v habilita explícitamente la salida verbosa por defecto de wget.
- wget --no-verbose desactiva los mensajes de registro pero muestra mensajes de error.
Conclusión
Aunque esto debería cubrir la mayoría de los casos de uso de wgets, el descargador es capaz de mucho más. Para una descripción completa de las capacidades de wget, puede revisar la página de manual de GNU de wget en línea.
Preguntas comunes de nuestros lectores
¿Cómo instalar Wget en Mac?
Para instalar Wget en Mac, sigue estos pasos: INSTALACIÓN EN MAC 1. Abrir la terminal. 2. Instalar Homebrew si aún no lo tienes en tu equipo. (Puedes hacerlo pegando el siguiente comando en la terminal: /bin/bash -c '$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)'
) 3. Ejecutar el comando brew install wget
. 4. Comprobar la instalación con el comando wget --version
. Y listo, ya tienes Wget instalado en tu Mac.
¿Puedo usar Wget en Mac?
Sí, puedes usar Wget en Mac. Para instalar la utilidad de línea de comandos wget en una Mac, la opción más rápida y sencilla es utilizar Homebrew. Una vez que se haya instalado el paquete, podrás utilizar wget en tu terminal.
¿Cómo funciona el comando WGET?
Wget es un programa útil que se ejecuta a través de la línea de comandos de tu computadora y sirve para recuperar material en línea. Funciona realizando solicitudes HTTP, HTTPS o FTP para descargar archivos o páginas web. Puede ser especialmente útil en las siguientes situaciones: 1. Descargar sitios web completos: Wget permite crear una copia exacta de un sitio web para su visualización offline, utilizando la opción -m
para hacer una copia espejo. 2. Descargas en segundo plano: Puedes utilizar la opción -b
para descargar archivos en modo background, lo que permite continuar usando la terminal. 3. Repetir descargas automáticas: Con la opción -N
, Wget solo descarga archivos que han cambiado desde la última descarga, ahorrando ancho de banda. 4. Recuperar recursos específicos: Puedes limitar los tipos de archivos que se descargarán usando filtros como -A
para aceptar ciertos tipos de archivos. En resumen, Wget es una herramienta versátil y poderosa para gestionar descargas y respaldos de contenido en línea.
¿Qué es wget en Python?
Wget en Python se refiere a la utilización de la biblioteca wget
, que permite descargar archivos a través de HTTP, HTTPS y FTP. Esta herramienta, inspirada en el comando wget del Proyecto GNU, facilita la recuperación de contenido y archivos de servidores web. Al usar wget
en Python, los desarrolladores pueden automatizar descargas de manera eficiente con una sintaxis sencilla. Por ejemplo, se puede utilizar wget.download('URL')
para iniciar la descarga de un archivo específico.