LeetCode（30）：與所有單詞相關聯的字串

本文轉載自查看原文 2018-06-04 16:51 2068 Algorithm

Hard！

題目描述：

給定一個字符串 s 和一些長度相同的單詞 words。在 s 中找出可以恰好串聯 words 中所有單詞的子串的起始位置。

注意子串要與 words 中的單詞完全匹配，中間不能有其他字符，但不需要考慮 words 中單詞串聯的順序。

示例 1:

輸入:
  s = "barfoothefoobarman",
  words = ["foo","bar"]
輸出: [0,9]
解釋: 從索引 0 和 9 開始的子串分別是 "barfoor" 和 "foobar" 。
輸出的順序不重要, [9,0] 也是有效答案。

示例 2:

輸入:
  s = "wordgoodstudentgoodword",
  words = ["word","student"]
輸出: []

解題思路：

這道題讓我們求串聯所有單詞的子串，就是說給定一個長字符串，再給定幾個長度相同的單詞，讓我們找出串聯給定所有單詞的子串的起始位置，還是蠻有難度的一道題。這道題我們需要用到兩個哈希表，第一個哈希表先把所有的單詞存進去，然后從開頭開始一個個遍歷，停止條件為當剩余字符個數小於單詞集里所有字符的長度。這時候我們需要定義第二個哈希表，然后每次找出給定單詞長度的子串，看其是否在第一個哈希表里，如果沒有，則break，如果有，則加入第二個哈希表，但相同的詞只能出現一次，如果多了，也break。如果正好匹配完給定單詞集里所有的單詞，則把i存入結果中，具體參見代碼如下：

C++解法一：

 1 class Solution {
 2 public:
 3     vector<int> findSubstring(string s, vector<string>& words) {
 4         vector<int> res;
 5         if (s.empty() || words.empty()) return res;
 6         int n = words.size(), m = words[0].size();
 7         unordered_map<string, int> m1;
 8         for (auto &a : words) ++m1[a];
 9         for (int i = 0; i <= (int)s.size() - n * m; ++i) {
10             unordered_map<string, int> m2;
11             int j = 0; 
12             for (j = 0; j < n; ++j) {
13                 string t = s.substr(i + j * m, m);
14                 if (m1.find(t) == m1.end()) break;
15                 ++m2[t];
16                 if (m2[t] > m1[t]) break;
17             }
18             if (j == n) res.push_back(i);
19         }
20         return res;
21     }
22 };

這道題還有一種O(n)時間復雜度的解法，設計思路非常巧妙，但是感覺很難想出來。

這種方法不再是一個字符一個字符的遍歷，而是一個詞一個詞的遍歷，比如根據題目中的例子，字符串s的長度n為18，words數組中有兩個單詞(cnt=2)，每個單詞的長度len均為3，那么遍歷的順序為0，3，6，8，12，15，然后偏移一個字符1，4，7，9，13，16，然后再偏移一個字符2，5，8，10，14，17，這樣就可以把所有情況都遍歷到。

還是先用一個哈希表m1來記錄words里的所有詞，然后我們從0開始遍歷，用left來記錄左邊界的位置，count表示當前已經匹配的單詞的個數。然后我們一個單詞一個單詞的遍歷，如果當前遍歷的到的單詞t在m1中存在，那么我們將其加入另一個哈希表m2中，如果在m2中個數小於等於m1中的個數，那么我們count自增1，如果大於了，那么需要做一些處理，比如下面這種情況, s = barfoofoo, words = {bar, foo, abc}, 我們給words中新加了一個abc，目的是為了遍歷到barfoo不會停止，那么當遍歷到第二foo的時候, m2[foo]=2, 而此時m1[foo]=1，這時候已經不連續了，所以我們要移動左邊界left的位置，我們先把第一個詞t1=bar取出來，然后將m2[t1]自減1，如果此時m2[t1]<m1[t1]了，說明一個匹配沒了，那么對應的count也要自減1，然后左邊界加上個len，這樣就可以了。

如果某個時刻count和cnt相等了，說明我們成功匹配了一個位置，那么將當前左邊界left存入結果res中，此時去掉最左邊的一個詞，同時count自減1，左邊界右移len，繼續匹配。如果我們匹配到一個不在m1中的詞，那么說明跟前面已經斷開了，我們重置m2，count為0，左邊界left移到j+len

C++解法二：

 1 class Solution {
 2 public:
 3     vector<int> findSubstring(string s, vector<string>& words) {
 4         if (s.empty() || words.empty()) return {};
 5         vector<int> res;
 6         int n = s.size(), cnt = words.size(), len = words[0].size();
 7         unordered_map<string, int> m1;
 8         for (string w : words) ++m1[w];
 9         for (int i = 0; i < len; ++i) {
10             int left = i, count = 0;
11             unordered_map<string, int> m2;
12             for (int j = i; j <= n - len; j += len) {
13                 string t = s.substr(j, len);
14                 if (m1.count(t)) {
15                     ++m2[t];
16                     if (m2[t] <= m1[t]) {
17                         ++count;
18                     } else {
19                         while (m2[t] > m1[t]) {
20                             string t1 = s.substr(left, len);
21                             --m2[t1];
22                             if (m2[t1] < m1[t1]) --count;
23                             left += len;
24                         }
25                     }
26                     if (count == cnt) {
27                         res.push_back(left);
28                         --m2[s.substr(left, len)];
29                         --count;
30                         left += len;
31                     }
32                 } else {
33                     m2.clear();
34                     count = 0;
35                     left = j + len;
36                 }
37             }
38         }
39         return res;
40     }
41 };

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 LeetCode第30題：與所有單詞相關聯的字串 LeetCode 30與所有單詞相關聯的字串 FlowNet：simple / correlation 與相關聯操作 git將本地的git項目關聯到github倉庫相關聯 vue相關聯的下拉選擇器 [LeetCode] 30. Substring with Concatenation of All Words 串聯所有單詞的子串 iphone使用xib界面與和代碼相關聯的方法微信公眾號自定義菜單跳轉到相關聯小程序 EF 已有打開的與此 Command 相關聯的 DataReader，必須首先將它關閉 VS2010 - “當前不會命中斷點。沒有與此相關聯的可執行代碼。”