问题是这样,如图:
是这样的效果,感觉很不好啊。
如果我在七牛空间的robots.txt里面,对这抓取的图准许抓取,是不是会好一些,例如
User-agent: *
Disallow: /
Allow: /pgdtcz.qiniudn.com/wp-content/uploads/2014/03/281.jpg
Allow: /pgdtcz.qiniudn.com/wp-content/uploads/2014/03/1811.jpg
我这样写是不是可以让他抓取到图片呢
顺便说下,网址是www.pgdtcz.com 大家可以搜索看下效果,谢谢
关于allow中的用法:
Allow:/filepath
不建议拼接URL
形如 /pgdtcz.qiniudn.com/wp-content/uploads/2014/03/281.jpg
spider将会爬取 yourdomain.com/pgdtcz.qiniudn.com/wp-content/uploads/2014/03/281.jpg,这个url是404.
所以建议您:
1 优化bucket中的robots文件,如下
User-agent: *
Disallow: /
User-agent: Googlebot-Image
Allow: /
User-agent: Baiduspider-image
Allow: /
2 调整Allow中的写法,
使用
Allow:/wp-content/uploads/2014/03/281.jpg
3 检查是否配置了防盗链功能,防盗链功能会影响外部引用的正常显示。
希望这些信息有帮助。
附上参考文档:http://www.robotstxt.org/robotstxt.html