python lxml解析gbk

hhxx
  • 569

单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教

自用自答,不好好看官网文档真害人,文档中的解决方法贴一下:

parser = etree.XMLParser(encoding='gbk') #这里还可以传入很多参数来定制你的parser
tree = etree.parser(file, parser=parser)

可以解决读gbk的问题,lxml功能确实很强大,建议大家使用前先大致看看文档吧,能省很多时间的,谢谢大家的作答!希望上面的代码可以帮到大家

回复
阅读 5k
2 个回答

把你的文本 .decode(encoding="gbk")输出试试

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏