typecho怎样导入百度hi的数据?

impig33
  • 704

好多年的百度hi文章,有办法导过来吧? 谢谢

评论
阅读 3k
5 个回答

一个思路,应该可行
假设你的博客链接是 http://hi.baidu.com/endle

  1. 用脚本打开该页面,将所有形式为 http://hi.baidu.com/endle/item/* 的链接抓取下来
  2. 查找这个元素

    <a class="next" href="?page=2">
    
        下一页>>
    
    </a>
    

    接着,加载 http://hi.baidu.com/endle?page=2,重复1

  3. 重复 2, 直到找不到 "next" 元素

然后,有了文章链接的列表,你抓取正文部分的难度应该就不大了

可以利用WordPress曲线救国一下,先按照此文章从百度空间转到WordPress,再按照此条目从WordPress转入到Typecho即可。

一篇一篇复制吧。。。

百度空间不提供xml导出吧。下次记得用个支持导出的,比如点点,比如lofter。

宣传栏