最长公共子序列

约 1643 字大约 5 分钟

动态规划递归递推

2025-02-27

1143. 最长公共子序列

给定两个字符串 text1 和 text2，返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ，返回 0。

一个字符串的 子序列 是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。

例如，"ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。

两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。

示例 1：

输入：text1 = "abcde", text2 = "ace" 
输出：3  
解释：最长公共子序列是 "ace" ，它的长度为 3 。

示例 2：

输入：text1 = "abc", text2 = "abc"
输出：3
解释：最长公共子序列是 "abc" ，它的长度为 3 。

示例 3：

输入：text1 = "abc", text2 = "def"
输出：0
解释：两个字符串没有公共子序列，返回 0 。

提示：

1 <= text1.length, text2.length <= 1000
text1 和 text2 仅由小写英文字符组成。

动态规划-函数递归+备忘录

class Solution {
    // 备忘录，消除重叠子问题
    int[][] memo;

    int longestCommonSubsequence(String s1, String s2) {
        int m = s1.length(), n = s2.length();
        
        // 备忘录值为 -1 代表未曾计算
        memo = new int[m][n];
        for (int[] row : memo) {
            Arrays.fill(row, -1);
        }
        
        // 计算 s1[0..] 和 s2[0..] 的 lcs 长度
        return dp(s1, 0, s2, 0);
    }

    // 定义：计算 s1[i..] 和 s2[j..] 的最长公共子序列长度
    int dp(String s1, int i, String s2, int j) {
        // base case：越界
        if (i == s1.length() || j == s2.length()) {
            return 0;
        }
        // 如果之前计算过，则直接返回备忘录中的答案
        if (memo[i][j] != -1) {
            return memo[i][j];
        }
        
        // 根据 s1[i] 和 s2[j] 的情况做选择
        if (s1.charAt(i) == s2.charAt(j)) {
            // s1[i] 和 s2[j] 必然在 lcs 中
            memo[i][j] = 1 + dp(s1, i + 1, s2, j + 1);
        } else {
            // s1[i] 和 s2[j] 至少有一个不在 lcs 中
            memo[i][j] = Math.max(
                dp(s1, i + 1, s2, j),
                dp(s1, i, s2, j + 1)
            );
        }
        return memo[i][j];
    }
}

时间复杂度： $O(m n)$ ，其中 $m$ 和 $n$ 分别是字符串 $t e x t_1$ 和 text $t_2$ 的长度。
空间复杂度： $O(m n)$ ，其中 $m$ 和 $n$ 分别是字符串 text $_1$ 和 text $_2$ 的长度。创建了 $m$ 行 $n$ 列的二维数组 $memo$ 。

动态规划-数组递推-正序遍历

class Solution {
    public int longestCommonSubsequence(String s1, String s2) {
        int m = s1.length(), n = s2.length();
        // 定义：s1[0..i-1] 和 s2[0..j-1] 的 lcs 长度为 dp[i][j]，i和j指的是前i个和前j个元素。
        // i=0或j=0时可以表示空字符串。如果i是索引，则i=0时是第一个字符，需要遍历计算dp[0][j]，麻烦。
        int[][] dp = new int[m + 1][n + 1];
        // 目标：s1[0..m-1] 和 s2[0..n-1] 的 lcs 长度，即 dp[m][n]
        // base case: dp[0][..] = dp[..][0] = 0

        // i和j指的是前i个和前j个元素
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                // 长度到索引要减一
                if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    // s1[i-1] 和 s2[j-1] 必然在 lcs 中
                    dp[i][j] = 1 + dp[i - 1][j - 1];
                } else {
                    // s1[i-1] 和 s2[j-1] 至少有一个不在 lcs 中。公共子序列和子数组不一样，它是离散的。如果是子数组，则dp[i][j]需要变成0。重点。
                    dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
                }
            }
        }

        return dp[m][n];
    }
}

时间复杂度： $O(m n)$ ，其中 $m$ 和 $n$ 分别是字符串 $t e x t_1$ 和 text_2 的长度。二维数组 dp 有 $m+1$ 行和 $n+1$ 列，需要对 $d p$ 中的每个元素进行计算。
空间复杂度： $O(m n)$ ，其中 $m$ 和 $n$ 分别是字符串 text $_1$ 和 text $_2$ 的长度。创建了 $m+1$ 行 $n+1$ 列的二维数组 $d p$ 。

dp[i - 1][j]可以用dp[j]来代替，dp[i][j - 1]可以用dp[j-1]代替，但是dp[i - 1][j - 1]必须用一个变量来pre存储。进入j循环后先获取此时的dp[j]，因为此时dp[j]还未被更新，所以是上一轮的dp[j]，相当于dp[i-1][j]，它将在下一轮j循环中被用到，因此相当于dp[i-1][j-1]。例如dp[2]=1+pre=1+dp[1]，这个dp[1]是j=1时更新前的dp[1]，即dp[i-1][1]而不是dp[i][1]。重点是j循环中有两类dp[j]，一类是更新前的dp[j]，即dp[i-1][j]，一类是更新后的dp[j]，即dp[i][j]。

class Solution {
    public int longestCommonSubsequence(String s1, String s2) {
        int m = s1.length(), n = s2.length(); // 获取两个字符串的长度
        // 定义 dp 数组，dp[j] 表示 s1[0..i-1] 和 s2[0..j-1] 的最长公共子序列的长度
        int[] dp = new int[n + 1]; 
        // 目标：s1[0..m-1] 和 s2[0..n-1] 的最长公共子序列长度，即 dp[n]
        // base case: dp[0] = 0（初始化为 0 表示空字符串的最长公共子序列长度为 0）

        // 遍历 s1 的每个字符
        // pre是上一轮dp[j-1]更新后的值，temp是本轮dp[j]更新前的值，即上一轮dp[j]更新后的值。pre和temp都是上一轮的值。
        for (int i = 1; i <= m; i++) {
            // pre 用来存储 dp[j-1] 的值，相当于上一行的 dp[j-1]。j=0时是dp[j]默认值0
            int pre = 0;
            // 遍历 s2 的每个字符
            for (int j = 1; j <= n; j++) {
                // 进入j循环后先获取此时的dp[j]，此时dp[j]还未被更新，所以是上一轮的dp[j]，相当于dp[i-1][j]，
                // 又因为它将在下一轮j循环中被用到，因此相当于dp[i-1][j-1]。
                // 例如dp[2]=1+pre=1+dp[1]，这个dp[1]是j=1时更新前的dp[1]，
                // 即dp[i-1][1]而不是dp[i][1]。重点是j循环中有两类dp[j]，一类是更新前的dp[j]，即dp[i-1][j]，一类是更新后的dp[j]，即dp[i][j]
                int temp = dp[j];
                
                // 现在 i 和 j 从 1 开始，所以要减一
                if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    // 如果 s1[i-1] 和 s2[j-1] 相同，则它们一定在最长公共子序列中
                    dp[j] = 1 + pre;
                } else {
                    // 否则，s1[i-1] 和 s2[j-1] 至少有一个不在最长公共子序列中
                    dp[j] = Math.max(dp[j - 1], dp[j]);
                }
                
                pre = temp; // 更新 pre 为当前 dp[j] 的值，用于下一次计算
            }
        }

        return dp[n]; // 返回最终的最长公共子序列长度
    }
}

最长公共子序列

1143. 最长公共子序列

动态规划-函数递归+备忘录

动态规划-数组递推-正序遍历

滚动更新