在一个网站的源代码里看到这样的乱码。这是怎么弄出来的？

发布于
2021-05-05

在一个网站的源代码里看到这样的乱码。这是怎么弄出来的？

这个排名还很高
是怎么解码
怎么弄上的呢？谢谢

javascript 前端

阅读 2.1k

2 个回答

我是跳跳吧

发布于
2021-05-05

更新于
2021-05-05

HTML 实体：https://developer.mozilla.org...

数字值是字符对应的 unicode。

发布于
2021-05-06

更新于
2021-05-06

这个是在后端渲染的时候编译的，好处就是不管网页的编码是什么，都可以正常的显示汉字，而不会出现乱码。爬虫之类的也是用浏览器那一套解析的，和你人眼看的是不一样的。
下面是搜的
比如在php中可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。
js：

 function htmlentities(str)
 {
      var r = "";
      for( i=0; i<str.length; i++ )
      {
           temp = str.charCodeAt(i);
           r += "&#"+temp+";";
      }
     
     //  也可以用一句正则表达式解决
     // r = str.replace(/[\d\D]/g, function($0) { return "&#" + $0.charCodeAt(0) + ";"; });
     return r;
 }

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题