¿Cómo usar diff mientras haces wget?

Digamos que hay un sitio www.songs.com, descargo canciones de ese sitio usando wget -r. Luego, digamos, 3 días después, se ha actualizado el sitio y se han agregado nuevas canciones.

¿Hay alguna manera de download solo nuevas canciones usando wget?

Tal como está, si doy el command

wget – r

Descargará todo el website.

Creo que puedes intentar usar wget --no-clobber , pero como se mencionó anteriormente, es probable que desees estudiar el uso de una solución basada en rsync lugar de HTTP. Suponiendo que tiene acceso SSH al server, rsync puede usarlo como un mecanismo de transporte con rsync -za --stats -essh user@host.example.com:/path/to/files /path/to/local/copy/of/files .

Sin embargo, tenga en count que wget --no-clobber -r solo obtendrá files nuevos desde la última comprobación, y no volverá a download copys nuevas que hayan cambiado . Es por eso que rsync es la mejor solución para el caso de uso que presente.

Otra alternativa que encontré es el software GPL, HTTrack, que refleja sitios web completos, y puede desplegar diferenciales posteriores. Se puede encontrar aquí . Captura de pantalla de Windows, pero hay comstackciones y / o fuente para Windows, OS X, Linux, BSD y Android (!).