wget 镜像网站不够完整

十分喜欢酷壳的文章,于是决定把整个网站copy到本地,用wget命令如下:

wget -m -k -p -np --restrict-file-names=nocontrol http://coolshell.cn

但是在本地浏览分类目录中的企业应用时(本地路径为:~/Documents/coolshell.cn/category/企业应用/),并没有显示企业应用的索引页, 然后看了以下企业应用目录下的内容,发现只有feed:

zsh➜ $ pwd
~/Documents/coolshell.cn/category/企业应用
zsh➜ $ ls
feed

而在看其他英文路径的分类目录时,一些正常,比如python分类的在线路径结构为:http://coolshell.cn/category/proglang..., 本地路径为~/Documents/coolshell.cn/category/proglanguage/pythondev/index.html,看了下相应目录的内容,如下:

zsh➜ $ pwd
/home/zhaofei/Documents/coolshell.cn/category
zsh➜ $ ls proglanguage/pythondev
feed index.html index.html?p=694 page

这里就没有问题。最后全部看了以下,category目录中只有中文目录缺少html,其他的都正常。

zsh➜ $ pwd
~/Documents/coolshell.cn/category
zsh➜ $ ls
career itnews operatingsystem progdesign story tools 系统架构
datebase misc operatingsystem.1 proglanguage techarticle 技术管理
funny netsecurity process proglanguage.1 technews 企业应用

请问怎样才能完整下载带中文路径的url中的内容呢?

阅读 5.5k
1 个回答

用SiteSucker了镜像网站啦,wget还是不适合做这种活。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进