最长公共子序列

1.问题描述

$对于母串X=<x1,x2,⋯,xm>, Y=<y1,y2,⋯,yn>,求最长公共子序列$

2.求解算法

2.1 暴力破解

$假设m<n ,对于母串X,可以找到2^m-1个子序列,然后依次在母串Y中匹配,算法的时间复杂度会达到指数级O(n * 2^m)$

2.2 动态规划

最优子结构:
$假设Z=<z1,z2,⋯,zk>是XX与YY的LCS, 我们观察到 $

  • $如果xm=yn,则zk=xm=yn,有Zk−1是Xm−1与Yn−1的LCS;$
  • $如果xm≠yn,则Zk是Xm与Yn−1的LCS,或者是Xm−1与Yn的LCS。$

因此,求解LCS的问题则变成递归求解的两个子问题。但是,上述的递归求解的办法中,重复的子问题多,效率低下。改进的办法——用空间换时间,用数组保存中间状态,方便后面的计算,这就是动态规划(DP)的核心思想了。
用二维数组ci记录串x1x2⋯xi与y1y2⋯yj的LCS长度,则可得到状态转移方程

状态转移方程
image.png

JAVA代码递归实现
public static int lcs(String s1, String s2) {
  char[][] c = new char[s1.length() + 1][s2.length() + 1];
  for (int i = 1; i <= s1.length(); i++) {
    c[i][0] = s1.charAt(i - 1);
  }
  for (int j = 1; j <= s2.length(); j++) {
    c[0][j] = s2.charAt(j - 1);
  }
  return recursion(c, s1.length(), s2.length());
}
public static int recursion(char[][] c, int i, int j) {
  if (i == 0 || j == 0) {
    return 0;
  }
  if (c[i][1] == c[1][j]) {
    return recursion(c, i - 1, j - 1) + 1;
  } 
  return Math.max(recursion(c, i, j - 1), recursion(c, i - 1, j));
}
JAVA代码自底向上动态规划实现
public static int lcs(String s1, String s2) {
  char[][] c = new char[s1.length() + 1][s2.length() + 1];
  int[][] dp = new int[s1.length() + 1][s2.length() + 1];
  // s1,s2字符串转二维数组
 for (int i = 1; i <= s1.length(); i++) {
    c[i][0] = s1.charAt(i - 1);
  }
  for (int j = 1; j <= s2.length(); j++) {
    c[0][j] = s2.charAt(j - 1);
  }
  // 初始化dp数组
 for (int i = 0; i <= s1.length(); i++) {
    dp[i][0] = 0;
  }
  for (int j = 0; j < s2.length(); j++) {
    dp[0][j] = 0;
  }
  // 填表
 for (int i = 1; i <= s1.length(); i++) {
    for (int j = 1; j <= s2.length(); j++) {
      if (c[i][0] == c[0][j]) {
        dp[i][j] = dp[i - 1][j - 1] + 1;
      } else {
        dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
      }
    }
  }
  return dp[s1.length()][s2.length()];
}

参考文献:
【动态规划】最长公共子序列与最长公共子串
动态规划 最长公共子序列 过程图解
动态规划解最长公共子序列(LCS)(附详细填表过程)
《算法导论》第四部分 高级设计和分析技术


花溪的小石头
180 声望8 粉丝

境由心造,一切只在当下的转念之间。