防止wget递归到排除的目录中
我通过http在远程Windows服务器上使用以下wget
命令在Mac上镜像文件:
wget --execute="robots = off" --mirror -N --no-parent -R '*index.html*' convert-links -nH --cut-dirs=1 http://user:pass@domain.com/share/?C=M;O=D
这工作得很好。
现在,服务器上的一些目录具有永远不会改变的文件。 我不想让wget
烦恼递归到这些目录中。 这些目录中有数千个文件,检查它们的时间戳是浪费时间。 我试图排除这些目录,如下所示:
wget --exclude-directories='*1. Council Meetings*,*3. Council Minutes*' --execute="robots = off" --mirror -N --no-parent -R '*index.html*' convert-links -nH --cut-dirs=1 http://user:pass@domain.com/share/?C=M;O=D
但是,尽管排除了两个目录,但wget仍会深入其中,并检查每个目录和排除目录的子目录中的每个文件的时间戳。
我已经尝试了许多不同的通配符重复和转义和引用/不引用等,但没有成功。
为了得到这个工作,我必须从根开始。 所以,例如:
--exclude-directories='/root/stuff/*1. Council Meetings*
上一篇: Prevent wget from recursing into excluded directories
下一篇: wget command to download a file and save as a different filename