各位大佬,帮忙看看这个编码问题。

用node 写个小爬虫

clipboard.png

突发奇想爬取其中的html()

clipboard.png

出来却是这种编码,这是为啥?怎么转成中文?
爬text()的时候是正常的中文。

阅读 1.9k
1 个回答

这个是HTML的实体中文字符,直接写在HTML里显示出来就是中文。具体的原因不太清楚,用axios抓取网页时候源码中的中文也是HTML实体,不过可以用这个包将实体转成常规字符:https://www.npmjs.com/package...

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题