爬虫抓取动态网页

发布于
2016-10-11

更新于
2016-10-13

--------------------------更新-----------------------------
谢谢大家提供的思路，想着先通过分析网页交互能不能找到方法，我又仔细看了看elements里的网页代码，发现搜索结果是通过AJAX返回一个链接的内容，即（http://search.ickey.cn/site/g...）我用python抓取这个链接可以从中得到我想要的内容。但是又碰到了另一个问题：我在浏览器里已经搜索过的器件型号，例如SC1894，python通过上述链接可以抓取到内容(浏览器直接输入这个getsup链接也可以)。要是我输入一个之前从来没搜索过的型号却没有数据返回？是不是在此之前还有什么我遗漏的东西呢

-------------------------原问题---------------------------
最近在学习爬取动态网页，想咨询一下:
我利用以下代码抓取的网页内容和chrome F12的elements相比少掉了我想要的内容，比如说<div class="search-result" id="searchResult"> 后紧接的搜索结果内容，搜索了一下网上的内容，好像是与javescript有空，需要如何操作才能抓到呢，想请教下思路

import urllib.request
weburl = 'http://search.ickey.cn/?keyword=SC1894&num='
webheader = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
req = urllib.request.Request(url = weburl, headers = webheader)
webPage = urllib.request.urlopen(req)
data = webPage.read()

data = data.decode('UTF-8')
print(data)

ajax python爬虫

阅读 7.3k

5 个回答

得票最新