BandaAncha.eu

Comunidad de usuarios
de fibra, móvil y ADSL

Script que guarde el código fuente de una web en un fichero.

BocaDePez
BocaDePez

Buenos días.

Llevo un tiempo intentando encontrar la forma de guardar el código fuente de una serie de páginas webs en respectivos archivos.

Encontré el "comando" web view-source, pero no encuentro forma de emplearlo para que el resultado lo vuelque en un archivo.

Sería algo parecido a las manidas redirecciones de los comandos de consola tipo:

"dir >> c:\directorio.txt", sólo que sería usando el código fuente de páginas web, y de forma "masiva", es decir como si se utilizase procesamiento por lotes, para guardar el código fuente de varias webs en varios archivos.

Desconozco si se puede hacer mediante un script sin más, o si hay que emplear C, PHP, Java...

¿Alguna idea?

Muchas gracias.

BocaDePez
BocaDePez

Creo que no lo tienes muy claro lo que buscas. El código fuente de una web no requiere ni de "view-source" ni nada. Es la propia web en HTML la que te tienes que descargar, es decir, el propio archivo que estas viendo es el mismo codigo fuente. Por tanto, es tan simple como descargar el HTML. Si lo quieres hacer con DOS, te hacen falta utilidades de descarga de archivos como WGET. Hay muchos programas que hacen eso, no recuerdo ahora el nombre de ninguno, pero creo que lo llaman MIRROR WEB.

Ejemplo: wget google.es

BocaDePez
BocaDePez

Como han dicho, wget es tu mejor opción, al existir para todos los sistemas operativos y ser gratuito.

Otra cosa es que quieras englobarlo dentro de otro proyecto más ambicioso, pues digo yo que necesitarás procesar después ese código para algo, y que ya dependerá más de la plataforma elegida.