Cómo instalar y usar wget en Mac

Valora este post

wget es una utilidad no interactiva de línea de comandos para descargar recursos de una URL específica. Debido a que no es interactivo, wget puede trabajar en segundo plano o incluso antes de que el usuario inicie sesión. El programa fue diseñado especialmente para conexiones deficientes, lo que lo hace especialmente robusto en condiciones que de otro modo serían irregulares. Aunque wget no se entrega con macOS, puede descargarse e instalarse fácilmente con Homebrew, el mejor gestor de paquetes para Mac disponible.

1. Descargar e instalar Homebrew

Cómo instalar y usar wget en Mac 1Para instalar Homebrew, abra una ventana Terminal y ejecute el siguiente comando tomado del sitio web de Homebrew:

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Podría notar el comando llamado curl, que es una utilidad de línea de comandos diferente para descargar archivos desde una URL que se incluye en la instalación de Ruby en macOS.

2. Instalando wget

Cómo instalar y usar wget en Mac 2

Una vez que haya terminado de instalarse, usaremos Homebrew para instalar wget. En Terminal, ejecute el siguiente comando para descargar e instalar wget:

brew install wget

Obtendrá actualizaciones en vivo sobre el progreso de la descarga e instalación de las dependencias (requisitos previos de software) necesarias para ejecutar wget en su sistema.

3. Usando wget

Cómo instalar y usar wget en Mac 3El propósito de wget es descargar contenido de URLs. Es una herramienta rápida y sencilla, no interactiva, para descargar archivos desde cualquier URL de acceso público.

Descargar un único archivo

Al igual que el comando similar curl, wget toma un recurso remoto de una URL y lo guarda en una ubicación específica de su computadora. La estructura del comando funciona de la siguiente manera: so:

wget -O path/to/local.copy http://example.com/url/to/download.html

Que guardará el archivo especificado en la URL en la ubicación especificada en su equipo. Si se excluye la bandera -O, la URL especificada se descargará en el directorio de trabajo actual.

Descargar un directorio recursivamente

Para descargar un árbol de directorios completo con wget, necesita usar las banderas -r/–recursiva y -np/–no-parent, como so:

wget -e robots=off -r -nphttps://www.w3.org/History/19921103-hypertext/hypertext/

Esto hará que wget siga los enlaces encontrados en los documentos dentro del directorio especificado, descargando recursivamente toda la ruta URL especificada. En general, es una buena idea desactivar robots.txt para evitar descargas abreviadas.

Otras banderas wget

Además de las banderas anteriores, este puñado seleccionado de banderas de wget son las más útiles:

Control de la descarga

  • wget -X /absolute/path/to/directory excluirá un directorio específico en el servidor remoto.
  • wget -nElimina los directorios de nombres de host. Recuerde, el nombre de host es la parte de la URL que contiene el nombre de dominio y termina en un TLD como «.com.» Por ejemplo, la carpeta llamada «www.w3.org» en nuestro ejemplo anterior se omitiría, iniciando la descarga con el directorio «History».
  • wget –cut-dirs=# omite el número especificado de directorios en la URL antes de comenzar a descargar archivos. Por ejemplo, -nH –cut-dirs=1 cambiaría la ruta especificada de «ftp.xemacs.org/pub/xemacs/» a simplemente»/xemacs/», reduciendo el número de directorios padre vacíos en la descarga local.
  • wget -R index.html/wget –reject index.htmSaltará todos los archivos que coincidan con el nombre de archivo especificado. En este caso, excluirá todos los archivos de índice. El carácter * se puede utilizar como comodín, como «*.png», que omitiría todos los archivos con la extensión PNG.
  • wget -i especifica las URLs de destino de un archivo de entrada. El archivo de entrada debe ser un archivo HTML o ser analizado como HTML con la bandera adicional –force-html
  • wget -nc/wget –no-clobber no sobrescribirá los archivos que ya existen en el destino.
  • wget -c/wget –continue continuará descargando archivos parcialmente descargados.
  • wget -t 10 intentará descargar el recurso hasta 10 veces antes de fallar.

Ajuste del nivel de registro

  • wget -d permite depurar la salida.
  • wget -o path/to/log.txt habilita la salida del logging al directorio especificado en lugar de mostrar la salida estándar de log-in.
  • wget -q desactiva toda la salida de wget, incluyendo los mensajes de error.
  • wget -v habilita explícitamente la salida verbosa por defecto de wget.
  • wget –no-verbose desactiva los mensajes de registro pero muestra mensajes de error.

Conclusión

Aunque esto debería cubrir la mayoría de los casos de uso de wgets, el descargador es capaz de mucho más. Para una descripción completa de las capacidades de wget, puede revisar la página de manual de GNU de wget en línea.

Posts Relacionados