怎么用nodejs分析出爬的不同网页那部分是文章标题和内容主体，有相关资料吗

发布于
2015-01-17

怎么用nodejs分析出爬的不同网页那部分是文章标题和内容而不是页面的其他元素，有相关资料吗

阅读 3.4k

3 个回答

发布于
2015-01-17

如果是特定的网站，可以根据其页面做些匹配。
如果想兼容所有的网站就很难了。只根据标签名识别肯定不准。应该有神经网络，机器学习之类的算法。

查看全部 3 个回答

推荐问题

相似问题

找不到问题？创建新问题