在一个网站的源代码里看到这样的乱码。这是怎么弄出来的?

image.png
在一个网站的源代码里看到这样的乱码。这是怎么弄出来的?

这个排名还很高
是怎么解码
怎么弄上的呢? 谢谢

阅读 2k
2 个回答

这个是在后端渲染的时候编译的,好处就是不管网页的编码是什么,都可以正常的显示汉字,而不会出现乱码。爬虫之类的也是用浏览器那一套解析的,和你人眼看的是不一样的。
下面是搜的
比如在php中可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。
js:

 function htmlentities(str)
 {
      var r = "";
      for( i=0; i<str.length; i++ )
      {
           temp = str.charCodeAt(i);
           r += "&#"+temp+";";
      }
     
     //  也可以用一句正则表达式解决
     // r = str.replace(/[\d\D]/g, function($0) { return "&#" + $0.charCodeAt(0) + ";"; });
     return r;
 }
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题