如下html字符串:
<!DOCTYPE HTML>
<html>
<head>
<meta charset="UTF-8" />
<style type="text/css"></style>
<img src="123.jpg" />
<div>
<img src="456.jpg" />
</div>
</html>
处理完如下:
<!DOCTYPE HTML>
<html>
<head>
<meta charset=\"UTF-8\" />
<style type=\"text/css\"></style>
<img src="123.jpg" />
<div>
<img src="456.jpg" />
</div>
</html>
想了想,要是直接把所有不属于img的引号找到比较困难,但是可以先把img的字符串整体先提取出来并保存,替换成特殊字符串,然后再去找到所有的引号,替换成\",之后再把保存的img字符串替换回来。