HTTrack es una herramienta con licencia GPL, que permite descargar un sitio web a nuestro disco duro, construyendo todos los directorios, obteniendo el código html, imagenes y demás archivos.
Lo interesante de HTTrack es que mantiene la estructura original de los enlaces, permitiendo la navegación por la página de modo offline, del mismo modo que si estuvieras conectado a internet.
La versión para linux incluye una GUI llamada WebHTTrack, que presenta opciones avanzadas como:
- Descargas paraleras
- Permite reanudar descargas interrumpidas
- Soporte de IPV6 y HTTPS
- Control de la velocidad de descarga
- Soporte de Proxy para maximizar la velocidad con opción de autentificación
- Buen manejo de PHP
- Capacidad de limitar el ancho de bando a utilizar
- Seleccionar los tipos de archivos a descargar: PDF, mp3, gif, JPEG, etc…
La última versión 3.45.2 salió hace apenas unos días y está disponible para su descarga desde aquí.
Link | HTTrack