跳至主要內容

正则表达式匹配

soulballad算法剑指Offer剑指Offer约 792 字大约 3 分钟

题目:

​ 请实现一个函数用来匹配包含 ”.“ 和 ”*“ 的正则表达式。模式中的字符 "." 表示任意一个字符, 而 ”*“ 表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串 ”aaa“ 与模式 ”a.a“ 和 ”ab*ac*a” 匹配,但与 “aa.a” 和 ”ab*a“ 均不匹配。

分析:

  1. 特殊情况:

    1. 两个字符串都为空,返回true;
    2. 当第一个字符串不空,而第二个字符串空了,返回false(因为这样,就无法匹配成功了,而如果第一个字符串空了,第二个字符串非空,还是可能匹配成功的,比如第二个字符串是“aaaa”,由于‘*’之前的元素可以出现0次,所以有可能匹配成功)
  2. 正常情况:

    1. pattern下一个字符不为 ‘*’:这种情况比较简单,直接匹配当前字符:

      1. 如果匹配成功,继续匹配下一个;

      2. 如果匹配失败,直接返回false。

        注意这里的“匹配成功”,除了两个字符相同的情况外,还有一种情况,就是pattern的当前字符为 ‘.’ 。

    2. pattern下一个字符为 ‘*’ 时,稍微复杂一些,因为 ‘*’ 可以代表0个或多个。
      这里把这些情况都考虑到:

      1. 当 ‘*’ 匹配 0个字符时,str当前字符不变,pattern当前字符后移两位,跳过这个 ‘*’ 符号;
      2. 当 ‘*’ 匹配1个或多个时,str当前字符移向下一个,pattern 当前字符不变。(这里匹配1个或多个可以看成一种情况,因为:当匹配一个时,由于str移到了下一个字符,而pattern字符不变,就回到了上边的情况 1;当匹配多于一个字符时,相当于从str的下一个字符继续开始匹配)

代码:

public class MatchRegex {

    public static boolean match(char[] str, char[] pattern) {
        if (str == null || pattern == null) {
            return false;
        }

        int strIndex = 0;
        int patternIndex = 0;
        return matchCore(str, strIndex, pattern, patternIndex);
    }

    private static boolean matchCore(char[] str, int strIndex, char[] pattern, int patternIndex) {
        //有效性检验:str到尾,pattern到尾,匹配成功
        if (strIndex == str.length && patternIndex == pattern.length) {
            return true;
        }
        //pattern先到尾,匹配失败
        if (strIndex != str.length && patternIndex == pattern.length) {
            return false;
        }
        //模式第2个是*,且字符串第1个跟模式第1个匹配,分3种匹配模式;如不匹配,模式后移2位
        if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
            if ((strIndex != str.length && pattern[patternIndex] == str[strIndex])
                    || (strIndex != str.length && pattern[patternIndex] == '.')) {
                //模式后移2,视为x*匹配0个字符
                return matchCore(str, strIndex, pattern, patternIndex + 2)
                    	//视为模式匹配1个字符
                        || matchCore(str, strIndex + 1, pattern, patternIndex + 2)
                    	//*匹配1个,再匹配str中的下一个
                        || matchCore(str, strIndex + 1, pattern, patternIndex);
            } else {
                return matchCore(str, strIndex, pattern, patternIndex + 2);
            }
        }
        //模式第2个不是*,且字符串第1个跟模式第1个匹配,则都后移1位,否则直接返回false
        if ((strIndex != str.length && pattern[patternIndex] == str[strIndex])
                || (strIndex != str.length && pattern[patternIndex] == '.')) {
            return matchCore(str, strIndex + 1, pattern, patternIndex + 1);
        }

        return false;
    }
}

链接:https://www.nowcoder.com/questionTerminal/45327ae22b7b413ea21df13ee7d6429c

上次编辑于:
贡献者: soulballad