这是一个快速的 Perl 问题:
如何将 ü
或 '
等 HTML 特殊字符转换为普通的 ASCII 文本?
我从这样的事情开始:
s/\&#(\d+);/chr($1)/eg;
并且可以为所有 HTML 字符编写它,但是像这样的功能可能已经存在了?
请注意,我不需要完整的 HTML->Text 转换器。我已经用 HTML::Parser
解析了 HTML。我只需要用我得到的特殊字符转换文本。
原文由 Frank 发布,翻译遵循 CC BY-SA 4.0 许可协议
看看 HTML::Entities :
你可以猜出输出。