java 如何判断 一个 字符串 是否 被 urlencode 过

java 如何判断 一个 字符串 是否 被 urlencode 过?
为了防止重复endcode

阅读 30.7k
3 个回答

urldecode一下,decode前后一致即未encode过,前后不一致即encode过。(具体原理可参看URLDecoder的源码)

看了其他几位同学的回答。简单的补充一下:
1、对于"a-z", "A-Z", "0-9", ".", "-", "*", "_",encode/decode前后不产生任何变化,所以实际上无需判断;
2、" "被转换成"+",如果原字符串本来就含有"+",上述方法无效;
3、其他的字符,根据不同的字符集先被转换成一到多个byte,然后每个byte被表示成类似"%xy"的字符串,其中xy是该byte值的16进制表示形式。所以对于原字符串本来含有"%"或者"%xy",上述方法也无效,对于"%xy",如果xy为非法字符,则会抛出IllegalArgumentException。
所以如果需要得到精确的结果,需要自己另加额外的控制标志位。

仅仅比较decode后的字符串是否一致的做法并不正确,当你的字符串包含%字符但不是合法的转义字符时,URLDecoder.decode会抛出异常。事实上并没有一个非常直接的办法。除非加上一些附加的判断条件。比如做一个URLEncodedString类,或者在字符串里面加一个自己的特殊前缀等等。

这种事情靠的是约定、良好的设计,url编码本身没法识别。

举例来说,如果原字符串是 A%20B 或者编码后的字符串是 abcd ,都是没法识别的。

如果一定要这么做的话,那你只能把它变成你自己的url编码,增加一个额外的标志。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题