LeetCode 面试经典 150_滑动窗口_串联所有单词的子串(32_30_C++_困难)(滑动窗口:控制起点和滑动距离)

发布于:2025-09-02 ⋅ 阅读:(21) ⋅ 点赞:(0)

题目描述:

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同

s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如,如果 words = [“ab”,“cd”,“ef”], 那么 “abcdef”, “abefcd”,“cdabef”, “cdefab”,“efabcd”, 和 “efcdab” 都是串联子串。 “acdbef” 不是串联子串,因为他不是任何 words 排列的连接。
返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

输入输出样例:

示例 1:
输入:s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出:[0,9]
解释:因为 words.length== 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
子串 “barfoo” 开始位置是 0。它是 words 中以 [“bar”,“foo”] 顺序排列的连接。
子串 “foobar” 开始位置是 9。它是 words 中以 [“foo”,“bar”] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2:
输入:s = “wordgoodgoodgoodbestword”, words = [“word”,“good”,“best”,“word”]
输出:[]
解释:因为 words.length== 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。
s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
所以我们返回一个空数组。

示例 3:
输入:s = “barfoofoobarthefoobarman”, words = [“bar”,“foo”,“the”]
输出:[6,9,12]
解释:因为 words.length== 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。
子串 “foobarthe” 开始位置是 6。它是 words 中以 [“foo”,“bar”,“the”] 顺序排列的连接。
子串 “barthefoo” 开始位置是 9。它是 words 中以 [“bar”,“the”,“foo”] 顺序排列的连接。
子串 “thefoobar” 开始位置是 12。它是 words 中以 [“the”,“foo”,“bar”] 顺序排列的连接。

提示:
1 <= s.length <= 104
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 和 s 由小写英文字母组成

题解:

解题思路:

思路一(滑动窗口(暴力)):

1、具体思想为,将 s 的字符串与 words 中的字符串进行匹配,每次移动一个位置,如:第一次判断"[barfoo]thefoobarman",第二次判断"b[arfoot]hefoobarman"。因涉及到匹配问题可以很快想到使用哈希表存储 words 中的字符串。
① 首先创建一个哈希表(words_map)存储word中字符出现的次数 ,key=word[i] (string类型) value= word[i]在 word中出现的次数。
② 从左往右控制滑动窗口的大小为 words中字符的个数,创建一个哈希表(window_map)统计滑动窗口中与 word 中相同的字符串个数。
:s = “barfoothefoobarman”, words = [“foo”,“bar”]

  • words_map={“foo”:1,“bar”:1} (注意这里匹配的是words_map和window_map中
    相同字符串出现的次数是否相同)
  • “[barfoo]thefoobarman”,统计统计窗口中匹配字符串的个数,window_map={“foo”:1,“bar”:1}==words_map(匹配)
  • “b[arfoot]hefoobarman”,统计统计窗口中匹配字符串的个数,window_map={“foo”:0,“bar”:0}!=words_map(不匹配)
  • “barfoothefoo[barman]”,统计统计窗口中匹配字符串的个数(不匹配),window_map={“foo”:0,“bar”:1}!=words_map(不匹配)

此算法的时间复杂度会超时,因每一次移动窗口时只移动一位字符,每次需重新统计窗口中匹配字符串的个数

2、复杂度分析:
① 时间复杂度:O(ls×n×m),其中 ls 是输入 s 的长度,n 是 words 中每个单词的长度,其中 m 是 words 的单词数。最坏情况 每移动一位字符需对 word中所有单词进行匹配。
② 空间复杂度:O(m×n),其中 m 是 words 的单词数,n 是 words 中每个单词的长度。统计words中单词词频的消耗,和每次滑动窗口时,需要用一个哈希表保存单词频次。

思路二(滑动窗口(控制起点和滑动距离)):

1、此方法每次移动 word 中一个字符串的长度进行匹配,跳过了重复匹配的情况。
① 创建一个哈希表(words_map)存储word中字符出现的次数 ,key=word[i] (string) value= word[i]在 word中出现的次数。
② 从左往右控制滑动窗口的大小为 words中字符的个数,创建一个哈希表(window_map)统计滑动窗口中与 word 中相同的字符串个数。
:s = “barfoothefoobarman”, words = [“foo”,“bar”]
words_map={“foo”:1,“bar”:1}

  • 起点从 i=0 下标开始
  • “[bar]foothefoobarman”,window_map={“foo”:1,“bar”:0}!=words_map(匹配个数为1)(注意这里的匹配个数指的是匹配字符串出现的次数)
  • “[barfoo]thefoobarman”,window_map={“foo”:1,“bar”:1}==words_map(匹配个数为2),统计下标
  • “bar[foothe]foobarman”,"the"不存在words_map中,将窗口移动到"the"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoothe[foo]barman”,,window_map={“foo”:1,“bar”:0}!=words_map(匹配个数为1)
  • “barfoothefoo[barman]”,window_map={“foo”:0,“bar”:1}!=words_map(匹配个数为1)
  • 起点从 i=1 下标开始
  • “b[arf]oothefoobarman”,"arf"不存在words_map中,将窗口移动到"arf"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barf[oot]hefoobarman”,"oot"不存在words_map中,将窗口移动到"oot"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoot[hef]oobarman”,"hef"不存在words_map中,将窗口移动到"hef"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoothefoob[arm]an”,"arm"不存在words_map中,将窗口移动到"arm"的右侧,清空window_map={“foo”:0,“bar”:0}
  • 起点从 i=2 下标开始
  • “ba[rfo]othefoobarman”,"rfo"不存在words_map中,将窗口移动到"rfo"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfo[oth]efoobarman”,"oth"不存在words_map中,将窗口移动到"oth"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfooth[efo]obarman”,"efo"不存在words_map中,将窗口移动到"efo"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoothefooba[rma]n”,"rma"不存在words_map中,将窗口移动到"rma"的右侧,清空window_map={“foo”:0,“bar”:0}

解决了方法一中字符串重复匹配的问题。

2、复杂度分析
① 时间复杂度:O(ls×n),其中 ls 是输入 s 的长度,n 是 words 中每个单词的长度。需要做 n 次滑动窗口,每次需要遍历一次 s。
② 空间复杂度:O(m×n),其中 m 是 words 的单词数,n 是 words 中每个单词的长度。统计words中单词词频的消耗,和每次滑动窗口时,需要用一个哈希表保存单词频次。

代码实现

代码实现(思路一(滑动窗口(暴力))):
class Solution1 {
public:
    // 主函数,寻找所有符合条件的子串
    vector<int> findSubstring(string s, vector<string>& words) {
        // 获取单词的长度和单词的数量
        int word_len = words[0].size();  // 每个单词的长度
        int word_count = words.size();   // 单词的数量
        int allWords_len = word_count * word_len; // 所有单词的总长度(即匹配的子串长度)

        vector<int> ans; // 用于存储匹配的起始位置
        
        // 如果字符串的长度小于所有单词总长度,则无法匹配,直接返回空结果
        if (s.size() < allWords_len) {
            return ans;
        }

        // 创建一个哈希表,用于记录每个单词出现的频率
        unordered_map<string, int> words_map;
        for (const auto &word : words) {
            words_map[word]++;  // 统计每个单词在words中出现的次数
        }
        
        int left = 0; // 左指针,表示当前窗口的起始位置
        
        // 从右边开始遍历字符串,每次遍历的右边界是从第一个单词后开始
        for (int right = words.size() - 1; right < s.size(); right++) {
            int match = 0;  // 记录匹配的单词数量
            unordered_map<string, int> window_map;  // 当前窗口中每个单词的计数
            
            // 遍历窗口中的每个单词,尝试匹配所有单词
            for (int i = 0; i < word_count; i++) {
                // 获取当前窗口的单词(每个单词的长度是word_len)
                string tmp_str = s.substr(left + word_len * i, word_len);
                
                // 如果当前单词不在 words_map 中,则跳出循环
                if (!words_map.count(tmp_str)) {
                    break;
                }
                
                // 更新当前窗口中的单词频率
                window_map[tmp_str]++;
                
                // 如果当前窗口中的单词与原始单词频率匹配,则增加match计数
                if (window_map[tmp_str] == words_map[tmp_str]) {
                    match++;
                }
                
                // 如果当前单词的频率超过了words_map中的频率,说明有多余的单词,跳出循环
                if (window_map[tmp_str] > words_map[tmp_str]) {
                    match--;
                    break;
                }
            }

            // 如果match等于words_map中的单词数量,说明所有单词都已匹配
            if (match == words_map.size()) {
                ans.push_back(left);  // 将当前的起始位置添加到答案中
            }

            // 每次滑动窗口时,左指针右移
            left++;
        }
        
        // 返回所有符合条件的起始位置
        return ans;
    }
};
代码实现(思路二(滑动窗口(控制起点和滑动距离))):
class Solution2 {
public:
    vector<int> findSubstring(string s, vector<string>& words) {
        int word_len = words[0].size();
        int word_count = words.size();
        int allWords_len = word_count * word_len;
        vector<int> ans;
        
        // 如果总长度小于子串长度,直接返回
        if (s.size() < allWords_len) return ans;
        
        // 计算单词频率
        unordered_map<string, int> words_map;
        for (const auto &word : words) {
            words_map[word]++;
        }
        
        // 滑动窗口
        for (int i = 0; i < word_len; i++) {  // i 是偏移量,扫描每个可能的开始位置
            int left = i;
            int right = i;
            int match_count = 0;
            unordered_map<string, int> window_map;

            while (right + word_len <= s.size()) {
                string word = s.substr(right, word_len);
                right += word_len;

                // 如果当前单词是我们要找的词
                if (words_map.count(word)) {
                    window_map[word]++;
                    match_count++;

                    // 如果某个单词出现次数超出预期,缩小窗口
                    while (window_map[word] > words_map[word]) {
                        string left_word = s.substr(left, word_len);
                        window_map[left_word]--;
                        match_count--;
                        left += word_len;
                    }

                    // 如果所有单词匹配,记录结果
                    if (match_count == word_count) {
                        ans.push_back(left);
                    }
                } else {
                    // 如果当前单词不在字典中,重置窗口
                    window_map.clear();
                    match_count = 0;
                    left = right;
                }
            }
        }

        return ans;
    }
};
以思路一为例进行调试
#include<iostream>
#include<unordered_map>
#include<vector>
using namespace std;

class Solution1 {
public:
    // 主函数,寻找所有符合条件的子串
    vector<int> findSubstring(string s, vector<string>& words) {
        // 获取单词的长度和单词的数量
        int word_len = words[0].size();  // 每个单词的长度
        int word_count = words.size();   // 单词的数量
        int allWords_len = word_count * word_len; // 所有单词的总长度(即匹配的子串长度)

        vector<int> ans; // 用于存储匹配的起始位置
        
        // 如果字符串的长度小于所有单词总长度,则无法匹配,直接返回空结果
        if (s.size() < allWords_len) {
            return ans;
        }

        // 创建一个哈希表,用于记录每个单词出现的频率
        unordered_map<string, int> words_map;
        for (const auto &word : words) {
            words_map[word]++;  // 统计每个单词在words中出现的次数
        }
        
        int left = 0; // 左指针,表示当前窗口的起始位置
        
        // 从右边开始遍历字符串,每次遍历的右边界是从第一个单词后开始
        for (int right = words.size() - 1; right < s.size(); right++) {
            int match = 0;  // 记录匹配的单词数量
            unordered_map<string, int> window_map;  // 当前窗口中每个单词的计数
            
            // 遍历窗口中的每个单词,尝试匹配所有单词
            for (int i = 0; i < word_count; i++) {
                // 获取当前窗口的单词(每个单词的长度是word_len)
                string tmp_str = s.substr(left + word_len * i, word_len);
                
                // 如果当前单词不在 words_map 中,则跳出循环
                if (!words_map.count(tmp_str)) {
                    break;
                }
                
                // 更新当前窗口中的单词频率
                window_map[tmp_str]++;
                
                // 如果当前窗口中的单词与原始单词频率匹配,则增加match计数
                if (window_map[tmp_str] == words_map[tmp_str]) {
                    match++;
                }
                
                // 如果当前单词的频率超过了words_map中的频率,说明有多余的单词,跳出循环
                if (window_map[tmp_str] > words_map[tmp_str]) {
                    match--;
                    break;
                }
            }

            // 如果match等于words_map中的单词数量,说明所有单词都已匹配
            if (match == words_map.size()) {
                ans.push_back(left);  // 将当前的起始位置添加到答案中
            }

            // 每次滑动窗口时,左指针右移
            left++;
        }
        
        // 返回所有符合条件的起始位置
        return ans;
    }
};

int main(int argc, char const *argv[])
{
    string s="barfoothefoobarma";
    vector<string> words={"foo","bar"};

    Solution1 s1;
    vector<int> ans= s1.findSubstring(s,words);
    for (auto &i : ans){
        cout<<i<<" ";
    }
    
    return 0;
}

LeetCode 面试经典 150_滑动窗口_串联所有单词的子串(32_30)原题链接
欢迎大家和我沟通交流(✿◠‿◠)


网站公告

今日签到

点亮在社区的每一天
去签到