import urllib
import chardet
def test_chardet(url):
content = urllib.urlopen(url).read()
result = chardet.detect(content) #获取内容编码
encoding = result["encoding"] #取出编码
return encoding
urls = ["http://www.baidu.com",
"http://www.google.com",
"http://www.sogou.com"
"http://so.123.com.cn"
]
for url in urls:
print url,test_chardet(url)
如上代码,for循环没懂什么意思,是不是把urls中的值都取出来?这个有点抽象啊,不太好理解
就是把
urls
每次遍历取出:第一次遍历:
url="http://www.baidu.com"
第二次遍历:
url="http://www.google.com"
第三次遍历:
url="http://www.sogou.com"
第四次遍历:
url="http://so.123.com.cn"