python爬虫，图片是无格式的

发布于
2018-01-25

例如这个地址：http://huaban.com/pins/2817226/zoom/
F12查看到

<img id="zoomr_img" src="//img.hb.aicdn.com/a181ad7982b873c0aede230c74057b5071aed7c5bac2e-CZAvQ5" width="420" height="6170" data-baiduimageplus-ignore="1">

可以看到，图片地址是无格式的，打开这个链接，是个图片，但是浏览器另存会出错。
这种url生成图片的原理是什么，python爬虫该怎么分析这种地址呢。

python

阅读 6.9k

3 个回答

剑心无痕

✓ 已被采纳

import requests
url = 'http://img.hb.aicdn.com/a181ad7982b873c0aede230c74057b5071aed7c5bac2e-CZAvQ5'
r = requests.get(url)
with open('1.bmp', 'wb') as w:
    w.write(r.content)

图片其实就是二进制。

http://img.hb.aicdn.com/a181ad7982b873c0aede230c74057b5071aed7c5bac2e-CZAvQ5

和http://img.hb.aicdn.com/1.bmp意思是一样的，只不过后端把1.bmp保存成a181ad7982b873c0aede230c74057b5071aed7c5bac2e-CZAvQ5而已，后面的扩展名没有意义（.后面的扩展名只是便于理解，在Linux中一切皆文件，在windows中其实也一样，只不过为了用户方便，不同扩展名有不同的默认打开的方式而已）

import requests
url = 'http://img.hb.aicdn.com/a181ad7982b873c0aede230c74057b5071aed7c5bac2e-CZAvQ5'
r = requests.get(url)
with open('1.jpg', 'wb') as w:
    w.write(r.content)

一样的，后缀名就是个摆设，一切皆文件

忆先

4.2k2317

发布于
2018-01-26

可以先把图片保存下来，然后用标准库imghdr判断文件类型,然后重新保存文件或者修改文件名。

import imghdr
imghdr.what('pathto/tempImage') # gif, jpg, png...

dodopy

2.4k1218

发布于
2018-01-26

import urllib
url = 'http://img.hb.aicdn.com/a181ad7982b873c0aede230c74057b5071aed7c5bac2e-CZAvQ5'
urllib.urlretrieve(url, 'D:/picture.jpg')

代码测试正常，python 2.7.14

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python爬虫，图片是无格式的

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？