Skip to content

最长公共子序列

约 1643 字大约 5 分钟

动态规划递归递推

2025-02-27

1143. 最长公共子序列

给定两个字符串 text1text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。

  • 例如,"ace""abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。

两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。

示例 1:

输入:text1 = "abcde", text2 = "ace" 
输出:3  
解释:最长公共子序列是 "ace" ,它的长度为 3 。

示例 2:

输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc" ,它的长度为 3 。

示例 3:

输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0 。

提示:

  • 1 <= text1.length, text2.length <= 1000
  • text1text2 仅由小写英文字符组成。

动态规划-函数递归+备忘录

class Solution {
    // 备忘录,消除重叠子问题
    int[][] memo;

    int longestCommonSubsequence(String s1, String s2) {
        int m = s1.length(), n = s2.length();
        
        // 备忘录值为 -1 代表未曾计算
        memo = new int[m][n];
        for (int[] row : memo) {
            Arrays.fill(row, -1);
        }
        
        // 计算 s1[0..] 和 s2[0..] 的 lcs 长度
        return dp(s1, 0, s2, 0);
    }

    // 定义:计算 s1[i..] 和 s2[j..] 的最长公共子序列长度
    int dp(String s1, int i, String s2, int j) {
        // base case:越界
        if (i == s1.length() || j == s2.length()) {
            return 0;
        }
        // 如果之前计算过,则直接返回备忘录中的答案
        if (memo[i][j] != -1) {
            return memo[i][j];
        }
        
        // 根据 s1[i] 和 s2[j] 的情况做选择
        if (s1.charAt(i) == s2.charAt(j)) {
            // s1[i] 和 s2[j] 必然在 lcs 中
            memo[i][j] = 1 + dp(s1, i + 1, s2, j + 1);
        } else {
            // s1[i] 和 s2[j] 至少有一个不在 lcs 中
            memo[i][j] = Math.max(
                dp(s1, i + 1, s2, j),
                dp(s1, i, s2, j + 1)
            );
        }
        return memo[i][j];
    }
}
  • 时间复杂度: O(mn)O(m n) ,其中 mmnn 分别是字符串 text1t e x t_1 和 text t2t_2 的长度。
  • 空间复杂度: O(mn)O(m n) ,其中 mmnn 分别是字符串 text 1_1 和 text 2_2 的长度。创建了 mmnn 列的二维数组 memomemo

动态规划-数组递推-正序遍历

class Solution {
    public int longestCommonSubsequence(String s1, String s2) {
        int m = s1.length(), n = s2.length();
        // 定义:s1[0..i-1] 和 s2[0..j-1] 的 lcs 长度为 dp[i][j],i和j指的是前i个和前j个元素。
        // i=0或j=0时可以表示空字符串。如果i是索引,则i=0时是第一个字符,需要遍历计算dp[0][j],麻烦。
        int[][] dp = new int[m + 1][n + 1];
        // 目标:s1[0..m-1] 和 s2[0..n-1] 的 lcs 长度,即 dp[m][n]
        // base case: dp[0][..] = dp[..][0] = 0

        // i和j指的是前i个和前j个元素
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                // 长度到索引要减一
                if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    // s1[i-1] 和 s2[j-1] 必然在 lcs 中
                    dp[i][j] = 1 + dp[i - 1][j - 1];
                } else {
                    // s1[i-1] 和 s2[j-1] 至少有一个不在 lcs 中。公共子序列和子数组不一样,它是离散的。如果是子数组,则dp[i][j]需要变成0。重点。
                    dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
                }
            }
        }

        return dp[m][n];
    }
}
  • 时间复杂度: O(mn)O(m n) ,其中 mmnn 分别是字符串 text1t e x t_1 和 text_2 的长度。二维数组 dp 有 m+1m+1 行和 n+1n+1 列,需要对 dpd p 中的每个元素进行计算。
  • 空间复杂度: O(mn)O(m n) ,其中 mmnn 分别是字符串 text 1_1 和 text 2_2 的长度。创建了 m+1m+1n+1n+1 列的二维数组 dpd p

滚动更新

dp[i - 1][j]可以用dp[j]来代替,dp[i][j - 1]可以用dp[j-1]代替,但是dp[i - 1][j - 1]必须用一个变量来pre存储。 进入j循环后先获取此时的dp[j],因为此时dp[j]还未被更新,所以是上一轮的dp[j],相当于dp[i-1][j],它将在下一轮j循环中被用到, 因此相当于dp[i-1][j-1]。例如dp[2]=1+pre=1+dp[1],这个dp[1]是j=1时更新前的dp[1],即dp[i-1][1]而不是dp[i][1]。 重点是j循环中有两类dp[j],一类是更新前的dp[j],即dp[i-1][j],一类是更新后的dp[j],即dp[i][j]。

class Solution {
    public int longestCommonSubsequence(String s1, String s2) {
        int m = s1.length(), n = s2.length(); // 获取两个字符串的长度
        // 定义 dp 数组,dp[j] 表示 s1[0..i-1] 和 s2[0..j-1] 的最长公共子序列的长度
        int[] dp = new int[n + 1]; 
        // 目标:s1[0..m-1] 和 s2[0..n-1] 的最长公共子序列长度,即 dp[n]
        // base case: dp[0] = 0(初始化为 0 表示空字符串的最长公共子序列长度为 0)

        // 遍历 s1 的每个字符
        // pre是上一轮dp[j-1]更新后的值,temp是本轮dp[j]更新前的值,即上一轮dp[j]更新后的值。pre和temp都是上一轮的值。
        for (int i = 1; i <= m; i++) {
            // pre 用来存储 dp[j-1] 的值,相当于上一行的 dp[j-1]。j=0时是dp[j]默认值0
            int pre = 0;
            // 遍历 s2 的每个字符
            for (int j = 1; j <= n; j++) {
                // 进入j循环后先获取此时的dp[j],此时dp[j]还未被更新,所以是上一轮的dp[j],相当于dp[i-1][j],
                // 又因为它将在下一轮j循环中被用到,因此相当于dp[i-1][j-1]。
                // 例如dp[2]=1+pre=1+dp[1],这个dp[1]是j=1时更新前的dp[1],
                // 即dp[i-1][1]而不是dp[i][1]。重点是j循环中有两类dp[j],一类是更新前的dp[j],即dp[i-1][j],一类是更新后的dp[j],即dp[i][j]
                int temp = dp[j];
                
                // 现在 i 和 j 从 1 开始,所以要减一
                if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    // 如果 s1[i-1] 和 s2[j-1] 相同,则它们一定在最长公共子序列中
                    dp[j] = 1 + pre;
                } else {
                    // 否则,s1[i-1] 和 s2[j-1] 至少有一个不在最长公共子序列中
                    dp[j] = Math.max(dp[j - 1], dp[j]);
                }
                
                pre = temp; // 更新 pre 为当前 dp[j] 的值,用于下一次计算
            }
        }

        return dp[n]; // 返回最终的最长公共子序列长度
    }
}