python2 爬虫builtwith模块

看了书教的 识别网站所有技术
教程识别的网站返回很清楚

图片描述

但是我试了俩个都貌似没什么效果,而且有的还报了错误

图片描述

阅读 4.7k
1 个回答

这个是用来查网站使用哪些技术,如果没用什么技术,返回信息就少了,楼主可以多查多几个网站看看吧!

In [5]: import builtwith

In [6]: builtwith.parse('http://httpbin.org')
Out[6]: {u'web-servers': [u'Nginx']}

In [7]: builtwith.parse('http://ctb988.com')
Out[7]: {u'programming-languages': [u'Java']}

In [8]: builtwith.parse('http://m8128.com')
Out[8]: {u'programming-languages': [u'Java'], u'web-frameworks': [u'JavaServer Pages']}

In [9]: builtwith.parse('http://www.douban.com')
Out[9]: 
{u'analytics': [u'Piwik'],
 u'javascript-frameworks': [u'jQuery'],
 u'tag-managers': [u'Google Tag Manager']}

In [10]: builtwith.parse('http://example.webscraping.com')
Out[10]: 
{u'javascript-frameworks': [u'jQuery', u'Modernizr', u'jQuery UI'],
 u'programming-languages': [u'Python'],
 u'web-frameworks': [u'Web2py', u'Twitter Bootstrap'],
 u'web-servers': [u'Nginx']}
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题