如何将带有“(ISO-8859-1)字符的字符串转换为普通(UTF-8)字符?

新手上路,请多包涵
<li>Jain R.K. and Iyengar S.R.K., “Advanced Engineering Mathematicsâ€, Narosa Publications,</li>

我在数据库中有很多原始 html 字符串。所有的文字都有这些奇怪的字符。我怎样才能将其转换为普通文本以将其保存回数据库中。

 $final = '<li>Jain R.K. and Iyengar S.R.K., “Advanced Engineering Mathematicsâ€, Narosa Publications,</li>';
$final = utf8_encode($final);

$final = htmlspecialchars_decode($final);

$final = html_entity_decode($final, ENT_QUOTES, "UTF-8");

$final = utf8_decode($final);

echo $final;

我试过上面的代码,它在网络浏览器中正确显示,但仍然在数据库中保存相同的奇怪字符。

数据库的字符集是utf-8

原文由 muthukrishnan 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 386
2 个回答
$final = '<li>Jain R.K. and Iyengar S.R.K., “Advanced Engineering Mathematicsâ€, Narosa Publications,</li>';

$final = str_replace("Â", "", $final);
$final = str_replace("’", "'", $final);
$final = str_replace("“", '"', $final);
$final = str_replace('–', '-', $final);
$final = str_replace('â€', '"', $final);

对于过去的数据,我用 UTF-8 字符替换了奇怪的字符。

对于未来的数据,我在 php、html 和数据库连接中将字符集设置为 utf8。

原文由 muthukrishnan 发布,翻译遵循 CC BY-SA 3.0 许可协议

“ 是 --- 的“ ”。您可以尝试避免使用非 ascii 引号,但这只会延迟再次陷入麻烦。

您需要在表和连接中使用 utf8mb4 。请参阅 此处 了解 Mojibake 的可能原因。

原文由 Rick James 发布,翻译遵循 CC BY-SA 3.0 许可协议

推荐问题
logo
Stack Overflow 翻译
子站问答
访问
宣传栏