json数据返回格式是&#x53D8这种类型，应该怎么处理转成中文？

调用一个网站接口读取帖子时发现标题名称返回的是变&#x6001这样的类型，该怎么进行处理

json

阅读 5.5k

4 个回答

苏生不惑

✓ 已被采纳

// 替换数字为10进制，然后转为字符串
var decode = function(str) {
  return str.replace(/&#x(\w+)/g, function(match, s) {
    return String.fromCharCode(parseInt(s,16));
  });
};
decode('&#x53D8&#x6001');//变态

6WQnWG37

6332710

发布于
2014-06-10

更新于
2014-06-11

这个是 XML 字符实体, 他有两种形态 &#XXXX; 和 &#xXXXX; 分别指的是 10 进程和 16 进程.
比较正式的方法是: 把他们用正则替换成 unicode 字符再处理. (伪)

喜欢看文档的戳这里
http://www.w3.org/TR/REC-xml/#sec-physical-struct

没人指出 @苏生的错误吗? 虽然是可用的, 但是不够严谨.
http://refiddle.com/12q2

字符匹配
使用正确字符匹配, 并不能够正确完成.
(正则分号缺失. 正确字符匹配请戳上面文档)
匹配不严谨
a. 无效16进程会被匹配. 例如 &#xS3D8;.
b. 缺失 10 进程

下面是根据 @苏生的答案基础修改完成的

decodeER = (string) ->
  return undefined unless string?
  string.replace /&#([0-9]+);/g, (str, p1) ->
    String.fromCharCode p1
  .replace /&#x([0-9a-fA-F]+);/g, (str, p1) ->
    String.fromCharCode parseInt p1, 16

我一直用一种有点 hacking 的方法：

var fakeDecoder = document.createElement('textarea');
fakeDecoder.innerHTML = '&#x6001';
console.log(fakeDecoder.value);    // "变"

不确信这样的方式靠谱不靠谱，也期待比较正经点的解决方案。

jflame

1.8k41522

发布于
2014-06-10

这不就是UTF-8形式的汉字吗？
后台直接使用也应该可以吧。
不过，我似乎没遇到过这样UTF-8字符。是不是LZ你没setEncoding啊？
比如：

    var req = https.request(options, function(res) {
        res.setEncoding('utf8');
        res.on('data', function(data) {
            var json = JSON.parse(data);
                ...
        })
    });

其实UTF-8也是Unicode的一种啊。
手动把&#x53D8换成\u53D8也应该没问题吧

查看全部 4 个回答

推荐问题

JSON数据键的值，应该如何写多次换行的内容呢？
在使用JSON写代码的我想要记录一个代码内容（多个换行的内容）： {代码...} 但是这样记录后：请问，我不想要填写一行，想要直接复制进去，我也可以方便查看内容。请问应该如何填写呢？
1 回答760 阅读✓ 已解决

json数据返回格式是&#x53D8这种类型，应该怎么处理转成中文？

JSON数据键的值，应该如何写多次换行的内容呢？