Skip to content

单词拆分

约 937 字大约 3 分钟

2025-02-27

139. 单词拆分

给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s

注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。

示例 1:

输入: s = "leetcode", wordDict = ["leet", "code"]
输出: true
解释: 返回 true 因为 "leetcode" 可以由 "leet" 和 "code" 拼接成。

示例 2:

输入: s = "applepenapple", wordDict = ["apple", "pen"]
输出: true
解释: 返回 true 因为 "applepenapple" 可以由 "apple" "pen" "apple" 拼接成。
     注意,你可以重复使用字典中的单词。

示例 3:

输入: s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"]
输出: false

提示:

  • 1 <= s.length <= 300
  • 1 <= wordDict.length <= 1000
  • 1 <= wordDict[i].length <= 20
  • swordDict[i] 仅有小写英文字母组成
  • wordDict 中的所有字符串 互不相同

动态规划,数组迭代

把输入的字符串列表变成HashSet,便于快速查找单词是否存在, dp[i] 表示前 i 个字符组成的字符串是否可以由字典中的单词拼成, 初始化 dp[0] 为 true,表示空字符串可以被拼成,遍历字符串的每个字符, 遍历当前字符之前的所有字符,检查子字符串是否在字典中,如果 dp[j] 为 true 且 s.substring(j, i) 在字典中, 则 dp[i] 设为 true,找到一个有效的拆分后即可跳出循环。返回 dp[s.length()],表示整个字符串是否可以由字典中的单词拼成。

迭代不需要备忘录。或者说,迭代数组就是备忘录数组。

对于边界条件,我们定义 dp[0]=truedp[0]=true 表示空串且合法。

有能力的读者也可以考虑怎么结合字典树 Trie 来实现,这里不再展开。

public class Solution {
    public boolean wordBreak(String s, List<String> wordDict) {
        // 把输入的字符串列表变成HashSet,便于快速查找单词是否存在
        Set<String> wordDictSet = new HashSet<>(wordDict);
        
        // 定义 dp 数组,dp[i] 表示前 i 个字符组成的字符串是否可以由字典中的单词拼成。
        // 把i设计为个数而不是索引能简化for循环的边界问题。
        boolean[] dp = new boolean[s.length() + 1];
        dp[0] = true; // 初始化 dp[0] 为 true,表示空字符串可以被拼成
        
        // 遍历字符串的每个字符
        for (int i = 1; i <= s.length(); i++) {
            // 遍历当前字符之前的所有字符,检查子字符串是否在字典中
            for (int j = 0; j < i; j++) {
                // 如果 dp[j] 为 true 且 s.substring(j, i) 在字典中,则 dp[i] 设为 true。
                // 注意dp[j]表示前j个字符,即[0,j-1]子串是否在字典中。s.substring(j, i)表示[j,i-1]字符串
                if (dp[j] && wordDictSet.contains(s.substring(j, i))) {
                    dp[i] = true;
                    break; // 找到一个有效的拆分后可以跳出内循环
                }
            }
        }
        // 返回 dp[s.length()],表示整个字符串是否可以由字典中的单词拼成
        return dp[s.length()];
    }
}
  • 时间复杂度: O(n2)O\left(n^2\right) ,其中 nn 为字符串 ss 的长度。我们一共有 O(n)O(n) 个状态需要计算,每次计算需要枚举 O(n)O(n) 个分割点,哈希表判断一个字符串是否出现在给定的字符串列表需要 O(1)O(1)的时间,因此总时间复杂度为 O(n2)O\left(n^2\right) 。严格来说应该是O(n^3),因为substring方法的时间复杂度是O(n)
  • 空间复杂度: O(n)O(n) ,其中 nn 为字符串 ss 的长度。我们需要 O(n)O(n) 的空间存放 dpd p 值以及哈希表亦需要 O(n)O(n) 的空间复杂度,因此总空间复杂度为 O(n)O(n)