如何将一个很长的String变短,再根据短的String还原?

1.有一个很长的字符串(长度大概为1000),现需要转化为一个短的长度为12的字符串

2.在另一个项目中获取到这个短的字符串以后,去解析获取到原字符串

这有点类似于对字符串的加密与解密。

尝试过MD5,但没有办法解密得到原字符串。

尝试过des,但是加密后的字符串不符合要求,长度太长

所以是否有一种其他的算法,可以解决这个问题。并不一定使用加密解密,我只是想把字符串变短,然后在另外一个项目获得这个短的字符串,再还原回去

阅读 35.5k
6 个回答

谢谢大家的解决方案,最终解决办法为:采用短网址生成方法,生成一个唯一的短字符串。
然后保存到数据库中,与源数据一一对应,新的系统,从数据库中取到相应的数据

相关实现代码:

    /**
     * 短网址生成方法
     * 这个方法会,生成四个短字符串,每一个字符串的长度为6
     * 这个方法是从网上搜索的一个方法,但不知道出自何处了,稍微将key换了一下
     * @param url
     * @return
     */
public static String[] shortUrl(String url) {

        // 可以自定义生成 MD5 加密字符传前的混合 KEY
        String key = UUID.randomUUID().toString();
        
        //混淆key,加上当前时间,并且取一个随机字符串
        key = System.currentTimeMillis() + key;
        // 要使用生成 URL 的字符

        String[] chars = new String[] { "a", "b", "c", "d", "e", "f", "g", "h",

                "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t",

                "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5",

                "6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H",

                "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T",

                "U", "V", "W", "X", "Y", "Z"
        };

        // 对传入网址进行 MD5 加密
        String sMD5EncryptResult = EncryptionUtils.md5(key + url);

        String hex = sMD5EncryptResult;

        String[] resUrl = new String[4];

        for (int i = 0; i < 4; i++) {

            // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算

            String sTempSubString = hex.substring(i * 8, i * 8 + 8);

            // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用
            // long ,则会越界

            long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16);

            String outChars = "";

            for (int j = 0; j < 6; j++) {

                // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引

                long index = 0x0000003D & lHexLong;

                // 把取得的字符相加

                outChars += chars[(int) index];

                // 每次循环按位右移 5 位

                lHexLong = lHexLong >> 5;

            }

            // 把字符串存入对应索引的输出数组

            resUrl[i] = outChars;

        }
        
        return resUrl;
    }

    /**
     * 获取我想要的字符串,将生成的两个相加,得到我想要的12位字符
     * @param url
     * @return
     */
    public static String getShortUrl(String url){
        String[] aResult = shortUrl(url);
        
        return aResult[0] + aResult[1];
    }
    
    //测试方法
    public static void main(String[] args) {
        StringBuilder sb = new StringBuilder();
        for(int i = 0;i<1000;i++){
            sb.append("ab");//长度为2000的一个字符串
        }
        
        String[] strings = shortUrl(sb.toString());
        for(int i = 0;i<strings.length;i++){
            System.out.println(strings[i]);
        }
        
        //验证生成的是否是唯一的
        List<String> list = new ArrayList<>();
        //生成1000万个短字符,已经足够使用
        for (int i = 0; i<10000000; i++){
            list.add(getShortUrl(sb.toString()));
        }
        
        //经测试生成1000万个短链接没有重复的
        //这里的判断重复的方法,是使用的SF上面一位网友的方法,我觉得比较优雅,只使用一次循环,而且也能判断,所以就使用了他的方法
        HashMap<String, Integer> hashMap = new HashMap<String, Integer>();
        for (String string : list) {
            if (hashMap.get(string) != null) {
                Integer value = hashMap.get(string);
                hashMap.put(string, value+1);
                System.out.println("the element:"+string+" is repeat");
            } else {
                hashMap.put(string, 1);
            }
        }
    }
    
    最后输出:
    BFVRfa
    muI7Nn
    3Ibeau
    aQRBzy
    
    输出表明确实没有重复的,答到需要的结果

最后调用getShortUrl生成我要的,保存数据库,然后一一对应取到,因为是使用的短网址生成方法,所以就以这个命名了,感谢提供此算法的网友

根据生成的,确实不知道怎么去逆向得到原来的,所以就使用了持久化去解决.这是我暂时的解决办法

http://blog.csdn.net/guobing9...

clipboard.png
效果还是不错的

还有一个思路,将数据存储到两方都可以访问的一个数据存储的地方,比如 Redis,key 使用 UUID 之类的唯一标识,这样对方通过 key 再从数据存储中获取

长度1000的字符串压缩到长度12,做不到吧。
参考下短网址的做法吧

我觉得这个是完全不可能的,MD5也只是一个特征算法,我们觉得他不会有重复不代表真的不会重复,MD5是32位也就是最多有36的32次方种组合,但是如果有一个长度为33的字符串由和MD5相同的字符组成,那他就有36的33次方种组合,必然是大于MD5的组合数的,把长度为33的字符串都MD5一次,就必然得出会有重复的MD5出现,所以说MD5是必然会对应多个不同的字符串的,只是概率太小我们就假设这是不存在的,如果要进行反运算,他就可能得出多个不同的数据,这么说你明白吗,他是不可能进行反运算的,所以MD5一般只是来比较两个值或者文件是否相同或者被篡改,并不能作为加密解密的技术。

那肯定是压缩算法啦
你看一下zip的算法,或者7-zip,有没有api提供

可以使用算法里的二叉树,将26个字母转换成平衡二叉树结构,使用1或0表示字母,将整个字符串全部转换成1和0表示并存入byte[]中,用new String(byte[])生成新字符串。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏