cgi.escape 似乎是一种可能的选择。效果好吗？有什么被认为更好的东西吗？原文由 Josh Gibson 发布，翻译遵循 CC BY-SA 4.0 许可协议

在 Python 中转义 HTML 的最简单方法是什么？

2 个回答

得票最新

社区维基

1

发布于
2022-12-15

✓ 已被采纳

html.escape 现在是正确答案，在 3.2 之前的 python 中它曾经是 cgi.escape 。它逃脱了：

< 至 <
> 至 >
& 至 &

这对所有 HTML 来说已经足够了。

编辑：如果您有非 ascii 字符，您也想转义，以便包含在另一个使用不同编码的编码文档中，如 Craig 所说，只需使用：

 data.encode('ascii', 'xmlcharrefreplace')

不要忘记解码 data 到 unicode 首先，使用它被编码的任何编码。

但是，根据我的经验，如果您从一开始就一直使用 unicode ，那么这种编码是无用的。只需在末尾编码为文档标头中指定的编码（ utf-8 以获得最大兼容性）。

例子：

 >>> cgi.escape(u'<a>bá</a>').encode('ascii', 'xmlcharrefreplace')
'&lt;a&gt;b&#225;&lt;/a&gt;

同样值得注意（感谢 Greg）的是额外的 quote 参数 cgi.escape 需要。将其设置为 True ， cgi.escape 也会转义双引号字符（ " ），因此您可以在 XML/HTML 中使用结果值。

编辑：请注意，cgi.escape 在 Python 3.2 中已被弃用，取而代之的是 html.escape ，除了 quote 默认为 True。

原文由 nosklo 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

1

发布于
2022-12-15

在 Python 3.2 中引入了一个新的 html 模块，用于转义 HTML 标记中的保留字符。

它有一个功能 escape() ：

 >>> import html
>>> html.escape('x > 2 && x < 7 single quote: \' double quote: "')
'x &gt; 2 &amp;&amp; x &lt; 7 single quote: &#x27; double quote: &quot;'

原文由 Maciej Ziarko 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

在 Python 中转义 HTML 的最简单方法是什么？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

问一个鼠标滚动事件，这种是怎么实现的？

form对象根据表单dom元素的name属性获取元素对象是基于什么标准的？兼容性如何？

Stack Overflow 翻译