今天思考一道题的时候,学习了一些思路,其中 Manacher 算法很有必要记录下来。
本文参考了:http://blog.csdn.net/ggggiqny...

这道题的内容是:

给定字符串,找到它的最长回文子串

最简单的思路莫过于找到给定字符串的所有子字符串,然后一个个的判断他们是否是回文字符串,在判断的时候用一个变量把最长的回文字符串记录下来就可以了;
判断是不是回文字符串很容易

function isPalindrome(str) {
var newStr = str.split("").reverse().join("");
return newStr === str ? true : false;
}

获得所有子串也很容易

function getSubstring(str){
    var len = str.length;
    for(var i=0; i<len; i++){
        for(var j=i; j<len;j++){
            console.log(str.substring(i,j+1));
        }
    }
}    

这种简单粗暴的算法带来的后果就是:查找子串时间复杂度O(n^2),判断回文时间复杂度O(n),太费时间;浪费时间的主要原因是没有充分地利用获得的信息。

————————————————————分界线————————————————————————

Manacher算法非常巧妙,使用了一些辅助技巧使得整个算法的时间复杂度变为线性。
我们先明确两件事:

  • 一个字符串是回文字符串,其中间位置为m。若他的子串S[i,i+x]为回文串,则相对于m对称的另一端子串S[2m-i, 2m-(i+x)]必然是回文串。

  • 回文串必定是中心对称的,也就是:S[i] == S[2m-i]。

首先,Manacher算法使用了如下的一个技巧让我们不用考虑字符串的奇偶性问题:
每一个字符两边都加上一个特殊字符,比如以字符串"abba"为例,转换后变成"#a#b#b#a#"。这样一来字符串无论本来是奇数还是偶数,都会变成奇数。

function getNewString(str){
    var newStr = '#';   
    for(i = 0;i<len;i++){  
        newStr += str[i]+'#';  
    }  
}

然后设置了一个概念:创建一个新数组P, P[i]项表示以第i个字符为中心的回文字串的半径。比如

S  #  a  #  b  #  b  #  a  #  
P  1  2  1  2  5  2  1  2  1

通过表格可以发现,P[i]-1就是实际回文字串的长度(对应的是符号还是数字都没关系)。
所以我们的任务转化为了求解数组 P;
求解数组 P 是本算法核心,根据我的理解,将其概括为如下:
设置两个辅助参数:id 和 mx;id表示当前已记载过的边界最大的回文字符串的中心位置,mx此回文字符串的边界值,也就是id+p[i]
初始化一便数组P,以避免数组中有undefined:

 for(i = 0;i<newLen;i++){  
        p[i] = 0;  
    }

接下来开始讨论:
记 i 对应于中心点 id 的对应位置为j,即j = 2*id - i;
若当前已记载的最大边境 mx > i(即 i 位置对应的字符在已知回文字符串内),那么:

p[i] = Math.min(p[j], mx-i);

就是当前面比较的最远长度 mx > i 的时候,P[i]有一个最小值,这就是本算法最核心的性质。

目前确定的P[i]是回文半径范围内能确定的值,对于半径外的字符,因为不知能能否和已知回文串继续构成更大回文串,所以也要进行判断。

while ((newStr[i + p[i]] == newStr[i - p[i]]) && newStr[i + p[i]]){  
            p[i]++;  
        }  

最后一步,当有更大的回文串出现时,更新mx 和 id 的值

if (i + p[i] > mx) {  
            id = i;  
            mx = id + p[i];  
        }  

整体代码

function getArrayP(str){  
    var p = [],   
        mx = 0,  
        id = 0;  
    var i;  
     
    var newStr = '#';       // 将字符串转化为奇数长度获取到新的字符串 
    var len = str.length;  
    for(i = 0;i<len;i++){  
        newStr += str[i]+'#';  
    }  
    
    var newLen = newStr.length;  
    for(i = 0;i<newLen;i++){  
        p[i] = 0;  
    }  
    
    
    for (i = 0;i < newLen; i++) {   // 获取到所有的子回文的长度值组成的数组  
        
        p[i] = mx > i ? Math.min(p[2*id-i], mx-i) : 1;   
    
        while ((newStr[i + p[i]] == newStr[i - p[i]]) && newStr[i + p[i]]){           // 超出其半径的位置再做额外判断,确保 newStr[i + p[i]] 是存在的  
            p[i]++;  
        }  
        
        // 当有更大的回文串出现时,更新中心位置和最大边界值
        if (i + p[i] > mx) {  
            id = i;  
            mx = id + p[i];  
        }  
    }  
    return p;  
}  

获得数组 p 之后,我们就获取到P的最大值,上面的例子中,最大值是 p[4] = 5;因为回文半径算了自己在内,所以要减去1,所以回文字符串应该是从newStr[4-4]起,到newStr[4+4]为止。用newStr.subString(0,8)方法获得字符串后,再去掉『#』符号就可以了;

newstr.subString(0, 8).split('#').join("");

Cheri
141 声望74 粉丝

月清幽,待相逢日,何人能解忧楚。青鸟曾隔南北渡,今却流年轻负。醴泉水,凡花数,多情总被西风误。高楼独处。望斗转星移,桑田沧海,已无来时路。