当博客作者未在其中包含 RSS 时,抓取和显示整页内容是否可以(符合道德规范)?

主要观点:作者在构建基于网络的 RSS 阅读器/搜索引擎/发现工具,面临是否在阅读器中显示完整文章的道德困境,引发了广泛讨论。
关键信息:

  • 应用从 feed 中获取内容并显示给订阅者,常需访问博客网站获取全文,也会为搜索索引目的抓取全文但尊重robots.txt
  • 讨论围绕显示完整文章是否道德展开,包括对作者意愿、用户体验、盈利等方面的考虑。
    重要细节:
  • 不同用户观点各异,如有人认为作为用户代理读取页面无错,有人认为应尊重作者意图,避免影响作者流量和收益等。
  • 提及一些实际情况,如部分博客作者默认只提供摘要,部分博客存在样式等问题在抓取后显示不正确等。
  • 讨论了存档、盈利模式(如通过订阅服务盈利)、与 Google 的比较等方面的问题。
  • 还提到了一些技术细节,如处理页面更新、不同 RSS 格式的有效性等问题。
阅读 20
0 条评论