python把HTML存入Mysql

用pyspider爬虫爬取了html
需要把整个html部分都保存
但在保存的时候遇到一个问题
就是标签里面带有“”引号这个问题,导致无法存到数据库,不知道你们一般是怎么解决的

阅读 9.7k
4 个回答

不明白为什么要用数据库来保存HTML内容。保存文件名不可以吗...

\" 转移一下就行了.

parser自己爬到的内容
HTMLParser
实现自己格式化后存库

如果你是用的MySQLdb的话,这个库有个函数叫escape_string(str)
它可以把字符串中的符号转义掉:

html_escaped = MySQLdb.escape_string(html.encode('utf-8'))

这样就可以存入MySQL了。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题