单词拆分

约 937 字大约 3 分钟

2025-02-27

139. 单词拆分

给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。

注意：不要求字典中出现的单词全部都使用，并且字典中的单词可以重复使用。

示例 1：

输入: s = "leetcode", wordDict = ["leet", "code"]
输出: true
解释: 返回 true 因为 "leetcode" 可以由 "leet" 和 "code" 拼接成。

示例 2：

输入: s = "applepenapple", wordDict = ["apple", "pen"]
输出: true
解释: 返回 true 因为 "applepenapple" 可以由 "apple" "pen" "apple" 拼接成。
     注意，你可以重复使用字典中的单词。

示例 3：

输入: s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"]
输出: false

提示：

1 <= s.length <= 300
1 <= wordDict.length <= 1000
1 <= wordDict[i].length <= 20
s 和 wordDict[i] 仅有小写英文字母组成
wordDict 中的所有字符串 互不相同

把输入的字符串列表变成HashSet，便于快速查找单词是否存在， dp[i] 表示前 i 个字符组成的字符串是否可以由字典中的单词拼成，初始化 dp[0] 为 true，表示空字符串可以被拼成，遍历字符串的每个字符，遍历当前字符之前的所有字符，检查子字符串是否在字典中，如果 dp[j] 为 true 且 s.substring(j, i) 在字典中，则 dp[i] 设为 true，找到一个有效的拆分后即可跳出循环。返回 dp[s.length()]，表示整个字符串是否可以由字典中的单词拼成。

迭代不需要备忘录。或者说，迭代数组就是备忘录数组。

对于边界条件，我们定义 $dp[0]=true$ 表示空串且合法。

有能力的读者也可以考虑怎么结合字典树 Trie 来实现，这里不再展开。

public class Solution {
    public boolean wordBreak(String s, List<String> wordDict) {
        // 把输入的字符串列表变成HashSet，便于快速查找单词是否存在
        Set<String> wordDictSet = new HashSet<>(wordDict);
        
        // 定义 dp 数组，dp[i] 表示前 i 个字符组成的字符串是否可以由字典中的单词拼成。
        // 把i设计为个数而不是索引能简化for循环的边界问题。
        boolean[] dp = new boolean[s.length() + 1];
        dp[0] = true; // 初始化 dp[0] 为 true，表示空字符串可以被拼成
        
        // 遍历字符串的每个字符
        for (int i = 1; i <= s.length(); i++) {
            // 遍历当前字符之前的所有字符，检查子字符串是否在字典中
            for (int j = 0; j < i; j++) {
                // 如果 dp[j] 为 true 且 s.substring(j, i) 在字典中，则 dp[i] 设为 true。
                // 注意dp[j]表示前j个字符，即[0,j-1]子串是否在字典中。s.substring(j, i)表示[j,i-1]字符串
                if (dp[j] && wordDictSet.contains(s.substring(j, i))) {
                    dp[i] = true;
                    break; // 找到一个有效的拆分后可以跳出内循环
                }
            }
        }
        // 返回 dp[s.length()]，表示整个字符串是否可以由字典中的单词拼成
        return dp[s.length()];
    }
}

时间复杂度： $O\left(n^2\right)$ ，其中 $n$ 为字符串 $s$ 的长度。我们一共有 $O(n)$ 个状态需要计算，每次计算需要枚举 $O(n)$ 个分割点，哈希表判断一个字符串是否出现在给定的字符串列表需要 $O(1)$ 的时间，因此总时间复杂度为 $O\left(n^2\right)$ 。严格来说应该是O(n^3)，因为substring方法的时间复杂度是O(n)
空间复杂度： $O(n)$ ，其中 $n$ 为字符串 $s$ 的长度。我们需要 $O(n)$ 的空间存放 $d p$ 值以及哈希表亦需要 $O(n)$ 的空间复杂度，因此总空间复杂度为 $O(n)$ 。

单词拆分

139. 单词拆分

动态规划，数组迭代