爬虫gb2312编码网站时的问题？

新手上路，请多包涵

我要获取a标签的文本我这样写：

--coding:utf-8--

import time
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
import chardet

html = urlopen("http://www.gdmzzx.com/html/xiaoyuandongtai/")
bsObj = BeautifulSoup(html)
list_all = bsObj.findAll("a",href = re.compile("/html/xiaoyuandongtai/.+"))
for each in list_all:


print(isinstance(each.get_text(),str))
print(each.get_text())
#print(chardet.detect(each))
#print(each.get_text().encode("utf-8"))

但是得到一团乱码我应该怎么写？

我知道怎么写了
bsObj = BeautifulSoup(html,fromEncoding = "gbk")

node.js javascript

html5 html

python

阅读 3.1k

2 个回答

得票最新

同意并接受

7.2k21127

发布于
2016-11-19

bsObj = BeautifulSoup(html.read())

洛克

31516

发布于
2016-11-19

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

爬虫gb2312编码网站时的问题？

--coding:utf-8--

你尚未登录，登录后可以

js 如何将Key属性相同的放在同一个数组？

前端代码更新如何通知用户刷新页面？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

H5页面点击按钮使用window.open 打开并展示一个pdf，安卓变成下载了？

想在H5项目，Vue3中实现扫一扫的功能，怎么实现比较好？

如何解决浏览器清除缓存导致axios请求404？

爬虫gb2312编码网站时的问题？

--coding:utf-8--

你尚未登录，登录后可以

js 如何将Key属性相同的放在同一个数组？

前端代码更新如何通知用户刷新页面？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

H5页面 点击按钮使用window.open 打开并展示一个pdf，安卓变成下载了？

想在H5项目，Vue3中实现扫一扫的功能，怎么实现比较好？

如何解决浏览器清除缓存导致axios请求404？

H5页面点击按钮使用window.open 打开并展示一个pdf，安卓变成下载了？