一个思路,应该可行 假设你的博客链接是 http://hi.baidu.com/endle 用脚本打开该页面,将所有形式为 http://hi.baidu.com/endle/item/* 的链接抓取下来 查找这个元素 <a class="next" href="?page=2"> 下一页>> </a> 接着,加载 http://hi.baidu.com/endle?page=2,重复1 重复 2, 直到找不到 "next" 元素 然后,有了文章链接的列表,你抓取正文部分的难度应该就不大了
http://www.diandian.com/transfer/ 转到点点,
http://www.diandian.com/backup 再导出XML文件。
这么是最简单的,不需要什么编程基础。