针对某个网址我想:
1、将所有的图片下载到自己的服务器上
2、将原网页的图片路径替换成自己服务器上的图片路径
3、将图片替换后的带标签的原网页保存到数据库中。
现在我已经第1、3步都已经没问题,其中下载图片用的是ImagesPipeline,但是我不知道怎样进行图片的替换。望大神给予思路或者提供一些参考代码,不胜感谢~~
针对某个网址我想:
1、将所有的图片下载到自己的服务器上
2、将原网页的图片路径替换成自己服务器上的图片路径
3、将图片替换后的带标签的原网页保存到数据库中。
现在我已经第1、3步都已经没问题,其中下载图片用的是ImagesPipeline,但是我不知道怎样进行图片的替换。望大神给予思路或者提供一些参考代码,不胜感谢~~
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
2 回答1.9k 阅读✓ 已解决
网页其实就是一段html字符串咯,那替换里面的值就很简单啦
下载图片的时候记录一下图片原本的路径
保存图片的时候记录一下图片保存的路径
htmlStr.replace('原网页路径/图片.jpg', '服务器路径/图片.jpg')