Python字符转化问题

发布于
2018-01-23

https://www.noscodespromo.com...
爬取这个页面的时候,已经字符转义
(头部
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
也对源码进行decode("windows-1252").encode("utf-8")
)
但就是正则匹配的时候相关字符还是被转了
求高手指教

python python爬虫 python2.7

阅读 3k

3 个回答

得票最新

可好了

1.6k1316

发布于
2018-01-23

原文不就是这个字符吗?

东哥起飞

3.8k8

发布于
2018-01-23

您好，您下载的源码也是乱码的吗？
你可以试试去掉encode('utf-8')看好不好用。

# -*- coding:utf-8 -*-

from urllib import request

html = request.urlopen('https://www.noscodespromo.com/store/videdressing.com')
print(html.read().decode('windows-1252'))

我在python3.x试了一下，源码没什么问题，如下：

源码没问题的话，正则应该不会出错吧。