Python 的 urllib.parse.quote() 和 urllib.parse.unquote() 的等效 JavaScript 函数

新手上路,请多包涵
阅读 815
2 个回答

好的,我想我将使用混合自定义函数集:

编码:使用 encodeURIComponent(),然后将斜杠放回原处。

解码:解码找到的任何 %hex 值。

这是我最终使用的更完整的变体(它也能正确处理 Unicode):

 function quoteUrl(url, safe) {
    if (typeof(safe) !== 'string') {
        safe = '/';    // Don't escape slashes by default
    }

    url = encodeURIComponent(url);

    // Unescape characters that were in the safe list
    toUnencode = [  ];
    for (var i = safe.length - 1; i >= 0; --i) {
        var encoded = encodeURIComponent(safe[i]);
        if (encoded !== safe.charAt(i)) {    // Ignore safe char if it wasn't escaped
            toUnencode.push(encoded);
        }
    }

    url = url.replace(new RegExp(toUnencode.join('|'), 'ig'), decodeURIComponent);

    return url;
}

var unquoteUrl = decodeURIComponent;    // Make alias to have symmetric function names

请注意,如果在编码时不需要“安全”字符( '/' 在 Python 中默认为),那么你可以只使用内置的 encodeURIComponent()decodeURIComponent() 直接发挥作用。

此外,如果字符串中有 Unicode 字符(即代码点 >= 128 的字符),那么为了保持与 JavaScript 的兼容性 encodeURIComponent() ,Python quote_url() 必须是:

 def quote_url(url, safe):
    """URL-encodes a string (either str (i.e. ASCII) or unicode);
    uses de-facto UTF-8 encoding to handle Unicode codepoints in given string.
    """
    return urllib.quote(unicode(url).encode('utf-8'), safe)

unquote_url() 将是:

 def unquote_url(url):
    """Decodes a URL that was encoded using quote_url.
    Returns a unicode instance.
    """
    return urllib.unquote(url).decode('utf-8')

原文由 Cameron 发布,翻译遵循 CC BY-SA 2.5 许可协议

JavaScript               |  Python
-----------------------------------
encodeURI(str)           |  urllib.parse.quote(str, safe='~@#$&()*!+=:;,?/\'');
-----------------------------------
encodeURIComponent(str)  |  urllib.parse.quote(str, safe='~()*!\'')

在 Python 3.7+ 上,您可以从 — 中删除 ~ safe=

原文由 mjhm 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
logo
Stack Overflow 翻译
子站问答
访问
宣传栏