最长公共子序列
1143. 最长公共子序列
给定两个字符串 text1
和 text2
,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0
。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
- 例如,
"ace"
是"abcde"
的子序列,但"aec"
不是"abcde"
的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。
示例 1:
输入:text1 = "abcde", text2 = "ace"
输出:3
解释:最长公共子序列是 "ace" ,它的长度为 3 。
示例 2:
输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc" ,它的长度为 3 。
示例 3:
输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0 。
提示:
1 <= text1.length, text2.length <= 1000
text1
和text2
仅由小写英文字符组成。
动态规划-函数递归+备忘录
class Solution {
// 备忘录,消除重叠子问题
int[][] memo;
int longestCommonSubsequence(String s1, String s2) {
int m = s1.length(), n = s2.length();
// 备忘录值为 -1 代表未曾计算
memo = new int[m][n];
for (int[] row : memo) {
Arrays.fill(row, -1);
}
// 计算 s1[0..] 和 s2[0..] 的 lcs 长度
return dp(s1, 0, s2, 0);
}
// 定义:计算 s1[i..] 和 s2[j..] 的最长公共子序列长度
int dp(String s1, int i, String s2, int j) {
// base case:越界
if (i == s1.length() || j == s2.length()) {
return 0;
}
// 如果之前计算过,则直接返回备忘录中的答案
if (memo[i][j] != -1) {
return memo[i][j];
}
// 根据 s1[i] 和 s2[j] 的情况做选择
if (s1.charAt(i) == s2.charAt(j)) {
// s1[i] 和 s2[j] 必然在 lcs 中
memo[i][j] = 1 + dp(s1, i + 1, s2, j + 1);
} else {
// s1[i] 和 s2[j] 至少有一个不在 lcs 中
memo[i][j] = Math.max(
dp(s1, i + 1, s2, j),
dp(s1, i, s2, j + 1)
);
}
return memo[i][j];
}
}
- 时间复杂度: O(mn) ,其中 m 和 n 分别是字符串 text1 和 text t2 的长度。
- 空间复杂度: O(mn) ,其中 m 和 n 分别是字符串 text 1 和 text 2 的长度。创建了 m 行 n 列的二维数组 memo 。
动态规划-数组递推-正序遍历
class Solution {
public int longestCommonSubsequence(String s1, String s2) {
int m = s1.length(), n = s2.length();
// 定义:s1[0..i-1] 和 s2[0..j-1] 的 lcs 长度为 dp[i][j],i和j指的是前i个和前j个元素。
// i=0或j=0时可以表示空字符串。如果i是索引,则i=0时是第一个字符,需要遍历计算dp[0][j],麻烦。
int[][] dp = new int[m + 1][n + 1];
// 目标:s1[0..m-1] 和 s2[0..n-1] 的 lcs 长度,即 dp[m][n]
// base case: dp[0][..] = dp[..][0] = 0
// i和j指的是前i个和前j个元素
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
// 长度到索引要减一
if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
// s1[i-1] 和 s2[j-1] 必然在 lcs 中
dp[i][j] = 1 + dp[i - 1][j - 1];
} else {
// s1[i-1] 和 s2[j-1] 至少有一个不在 lcs 中。公共子序列和子数组不一样,它是离散的。如果是子数组,则dp[i][j]需要变成0。重点。
dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
}
}
}
return dp[m][n];
}
}
- 时间复杂度: O(mn) ,其中 m 和 n 分别是字符串 text1 和 text_2 的长度。二维数组 dp 有 m+1 行和 n+1 列,需要对 dp 中的每个元素进行计算。
- 空间复杂度: O(mn) ,其中 m 和 n 分别是字符串 text 1 和 text 2 的长度。创建了 m+1 行 n+1 列的二维数组 dp 。
滚动更新
dp[i - 1][j]
可以用dp[j]来代替,dp[i][j - 1]
可以用dp[j-1]代替,但是dp[i - 1][j - 1]
必须用一个变量来pre存储。 进入j循环后先获取此时的dp[j],因为此时dp[j]还未被更新,所以是上一轮的dp[j],相当于dp[i-1][j]
,它将在下一轮j循环中被用到, 因此相当于dp[i-1][j-1]
。例如dp[2]=1+pre=1+dp[1],这个dp[1]是j=1时更新前的dp[1],即dp[i-1][1]
而不是dp[i][1]
。 重点是j循环中有两类dp[j],一类是更新前的dp[j],即dp[i-1][j]
,一类是更新后的dp[j],即dp[i
][j]。
class Solution {
public int longestCommonSubsequence(String s1, String s2) {
int m = s1.length(), n = s2.length(); // 获取两个字符串的长度
// 定义 dp 数组,dp[j] 表示 s1[0..i-1] 和 s2[0..j-1] 的最长公共子序列的长度
int[] dp = new int[n + 1];
// 目标:s1[0..m-1] 和 s2[0..n-1] 的最长公共子序列长度,即 dp[n]
// base case: dp[0] = 0(初始化为 0 表示空字符串的最长公共子序列长度为 0)
// 遍历 s1 的每个字符
// pre是上一轮dp[j-1]更新后的值,temp是本轮dp[j]更新前的值,即上一轮dp[j]更新后的值。pre和temp都是上一轮的值。
for (int i = 1; i <= m; i++) {
// pre 用来存储 dp[j-1] 的值,相当于上一行的 dp[j-1]。j=0时是dp[j]默认值0
int pre = 0;
// 遍历 s2 的每个字符
for (int j = 1; j <= n; j++) {
// 进入j循环后先获取此时的dp[j],此时dp[j]还未被更新,所以是上一轮的dp[j],相当于dp[i-1][j],
// 又因为它将在下一轮j循环中被用到,因此相当于dp[i-1][j-1]。
// 例如dp[2]=1+pre=1+dp[1],这个dp[1]是j=1时更新前的dp[1],
// 即dp[i-1][1]而不是dp[i][1]。重点是j循环中有两类dp[j],一类是更新前的dp[j],即dp[i-1][j],一类是更新后的dp[j],即dp[i][j]
int temp = dp[j];
// 现在 i 和 j 从 1 开始,所以要减一
if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
// 如果 s1[i-1] 和 s2[j-1] 相同,则它们一定在最长公共子序列中
dp[j] = 1 + pre;
} else {
// 否则,s1[i-1] 和 s2[j-1] 至少有一个不在最长公共子序列中
dp[j] = Math.max(dp[j - 1], dp[j]);
}
pre = temp; // 更新 pre 为当前 dp[j] 的值,用于下一次计算
}
}
return dp[n]; // 返回最终的最长公共子序列长度
}
}