如何爬取百度指数的数据?

百度指数的查询地址:http://index.baidu.com
比如说我输入:世界杯。查询到的结果如下:
查询结果
查询到的结果数字并不是文本的形式,不知道应该如何抓取?
请输入图片描述
希望各位大神指教!

阅读 34.3k
7 个回答

ajax的吧 看看ajax里的请求返回数据吧

大致步骤如下:

  1. 首先要前往这个页面登录,获取会话 cookie;
  2. 然后使用获取到的 cookie 访问指数查询的 URL(此处使用“google io”):http://index.baidu.com/?tpl=trend&word=google+io
  3. 根据获取到页面中的 Javascript,拼接相关 AJAX 请求 URL,使用获取到的 cookie 重新请求该 URL,返回的内容即是你要的东西。

可能需要用到的第三方库:

新手上路,请多包涵

百度加密了,很难抓取的。
在淘宝上看到了一家店。。。 http://t.cn/RhC1O6J

新手上路,请多包涵

我们提供百度指数的实时抓取服务,请访问我们的在线demo站点:http://www.datadriver.info/scrapdata/,
我们可以免费分享详细的破解过程和算法描述,但是不提供源代码。 您也可以qq我们,2011193471

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题