跳至正文

每日一题——(已摆烂)1044. 最长重复子串

1044. 最长重复子串

给你一个字符串 s ,考虑其所有 重复子串 :即,s 的连续子串,在 s 中出现 2 次或更多次。这些出现之间可能存在重叠。

返回 任意一个 可能具有最长长度的重复子串。如果 s 不含重复子串,那么答案为 “” 。


寄 看不懂

public class Solution {
    public string LongestDupSubstring(string s) {
        Random random = new Random();
        // 生成两个进制
        int a1 = random.Next(26, 101);
        int a2 = random.Next(26, 101);
        // 生成两个模
        int mod1 = random.Next(1000000006, int.MaxValue) + 1;
        int mod2 = random.Next(1000000006, int.MaxValue) + 1;
        int n = s.Length;
        // 先对所有字符进行编码
        int[] arr = new int[n];
        for (int i = 0; i < n; ++i) {
            arr[i] = s[i] - 'a';
        }
        // 二分查找的范围是[1, n-1]
        int l = 1, r = n - 1;
        int length = 0, start = -1;
        while (l <= r) {
            int m = l + (r - l + 1) / 2;
            int idx = Check(arr, m, a1, a2, mod1, mod2);
            if (idx != -1) {
                // 有重复子串,移动左边界
                l = m + 1;
                length = m;
                start = idx;
            } else {
                // 无重复子串,移动右边界
                r = m - 1;
            }
        }
        return start != -1 ? s.Substring(start, length) : "";
    }

    public int Check(int[] arr, int m, int a1, int a2, int mod1, int mod2) {
        int n = arr.Length;
        long aL1 = Pow(a1, m, mod1);
        long aL2 = Pow(a2, m, mod2);
        long h1 = 0, h2 = 0;
        for (int i = 0; i < m; ++i) {
            h1 = (h1 * a1 % mod1 + arr[i]) % mod1;
            h2 = (h2 * a2 % mod2 + arr[i]) % mod2;
            if (h1 < 0) {
                h1 += mod1;
            }
            if (h2 < 0) {
                h2 += mod2;
            }
        }
        // 存储一个编码组合是否出现过
        ISet<long> seen = new HashSet<long>();
        seen.Add(h1 * mod2 + h2);
        for (int start = 1; start <= n - m; ++start) {
            h1 = (h1 * a1 % mod1 - arr[start - 1] * aL1 % mod1 + arr[start + m - 1]) % mod1;
            h2 = (h2 * a2 % mod2 - arr[start - 1] * aL2 % mod2 + arr[start + m - 1]) % mod2;
            if (h1 < 0) {
                h1 += mod1;
            }
            if (h2 < 0) {
                h2 += mod2;
            }

            long num = h1 * mod2 + h2;
            // 如果重复,则返回重复串的起点
            if (!seen.Add(num)) {
                return start;
            }
        }
        // 没有重复,则返回-1
        return -1;
    }

    public long Pow(int a, int m, int mod) {
        long ans = 1;
        long contribute = a;
        while (m > 0) {
            if (m % 2 == 1) {
                ans = ans * contribute % mod;
                if (ans < 0) {
                    ans += mod;
                }
            }
            contribute = contribute * contribute % mod;
            if (contribute < 0) {
                contribute += mod;
            }
            m /= 2;
        }
        return ans;
    }
}

 

发表评论

您的电子邮箱地址不会被公开。