【重学数据结构与算法(JS)】字符串匹配算法(四)——Sunday算法

前言

惯例,最重要的匹配思路还是要贴一遍:

  1. 模式串主串进行比较

    • 从前往后比较
    • 从后往前比较
  2. 匹配时,比较主串模式串的下一个位置
  3. 失配时,

    • 模式串中寻找一个合适的位置

      • 如果找到,从这个位置开始与主串当前失配位置进行比较
      • 如果未找到,从模式串的头部与主串失配位置的下一个位置进行比较
    • 主串中找到一个合适的位置,重新与模式串进行比较

Sunday算法也许是三种里面最好理解也最好写的一种了,它的思路也是在于失配时如何跳过尽可能多的字符,具体的说,主要是优化了第3步,失配时,在主串中找到一个合适的位置,重新与模式串进行比较

算法介绍与分析

  • 主串模式串的首位开始比较,记

    • 主串 S
    • 模式串 P
    • 主串长度 slen
    • 模式串长度 plen
    • 主串位置指针 i
    • 模式串位置指针 j
    • 每次重新匹配时,模式串尾部对应主串位置的下一位 m
  • 判断 S[i]P[j] 是否相等

    • 如果相等

      • 判断 jplen-1 是否相等,如果相等则表示 表示模式串匹配完成,直接返回 i - j 即可
      • 如果不相等,则继续比较下一位,即 i++;j++;
    • 如果不相等

      • 查看 S[m] 字符是否存在于 P 中,如果存在,将 P 移至两字符对应的位置上
      • 如果不存在,则移至 S[m] 的后一位
  • 如果移动后, m > slen ,说明 S 已经遍历一遍,仍然没有找到目标,模式串 匹配失败。

栗子

初始状态,i = 0, j = 0, m = 4

QQ20200123-205626.png


比较 S[0]P[0],发现不相等,看 S[4] 处发现并没有在 P 中出现

QQ20200123-205718.png


直接将 P 移至 S[4] 的后一位,此时 i = 5, j = 0, m = 9

QQ20200123-205913.png


比较 S[5]P[0],发现不相等,看 S[9] 处发现有在 P 中出现

QQ20200123-210136.png


P 中的 iS 中的 i 对齐,此时 i = 8, j = 0, m = 12

QQ20200123-210415.png


比较 S[8]P[0],发现不相等,看 S[12] 处发现并没有在 P 中出现

QQ20200123-210651.png


直接将 P 移至 S[12] 的后一位,此时 i = 13, j = 0, m = 17

QQ20200123-210854.png


比较 S[13]P[0],发现不相等,看 S[17] 处发现有在 P 中出现

QQ20200123-211050.png


P 中的 nS 中的 n 对齐,此时 i = 15, j = 0, m = 18

QQ20200123-211352.png


继续匹配,直到 j === plen - 1 = 3,则匹配成功,得到结果 i - j = 18 - 3 = 15

QQ20200123-211750.png

代码实现

极端情况的排除

carbon.png

整体逻辑框架

  • 首先,肯定有一个循环,先找到终结条件,和 BF算法 一样,查找顺序也是从前往后,可以很快知道,i < slen 就是终结的条件
  • 其次,就是要对匹配和失配进行不同的处理

由此,我们就可以写出整体的框架:

carbon的副本.png

细节的完善

carbon的副本2.png

总结

Sunday算法 遵循匹配思路,失配时采取自己的优化策略,也尽可能的移动了最多的步数,达到提高效率的目的,且易理解。

后记

“字符串匹配算法”是“重学数据结构与算法”系列笔记:


前端的尤里卡时刻
一些基础巩固 一些原理解析 一些最佳实践 一些踩坑经历
113 声望
5 粉丝
0 条评论
推荐阅读
关于用设计模式刷 LeetCode 这件事
最近在过 《剑指Offer》 这本书上的题,尽量把每题的多种解法都自己捋一遍,在过到 面试题20. 表示数值的字符串 这一题的时候,Discuss 里有一个同学提出了 职责链模式 的解法,让人眼前一亮,另一方面是笔者最近...

LazyDuke3阅读 944

从零搭建 Node.js 企业级 Web 服务器(零):静态服务
过去 5 年,我前后在菜鸟网络和蚂蚁金服做开发工作,一方面支撑业务团队开发各类业务系统,另一方面在自己的技术团队做基础技术建设。期间借着 Node.js 的锋芒做了不少 Web 系统,有的至今生气蓬勃、有的早已夭折...

乌柏木150阅读 12.4k评论 10

正则表达式实例
收集在业务中经常使用的正则表达式实例,方便以后进行查找,减少工作量。常用正则表达式实例1. 校验基本日期格式 {代码...} {代码...} 2. 校验密码强度密码的强度必须是包含大小写字母和数字的组合,不能使用特殊...

寒青56阅读 7.9k评论 11

JavaScript有用的代码片段和trick
平时工作过程中可以用到的实用代码集棉。判断对象否为空 {代码...} 浮点数取整 {代码...} 注意:前三种方法只适用于32个位整数,对于负数的处理上和Math.floor是不同的。 {代码...} 生成6位数字验证码 {代码...} ...

jenemy46阅读 6k评论 12

从零搭建 Node.js 企业级 Web 服务器(十五):总结与展望
总结截止到本章 “从零搭建 Node.js 企业级 Web 服务器” 主题共计 16 章内容就更新完毕了,回顾第零章曾写道:搭建一个 Node.js 企业级 Web 服务器并非难事,只是必须做好几个关键事项这几件必须做好的关键事项就...

乌柏木66阅读 6.2k评论 16

再也不学AJAX了!(二)使用AJAX ① XMLHttpRequest
「再也不学 AJAX 了」是一个以 AJAX 为主题的系列文章,希望读者通过阅读本系列文章,能够对 AJAX 技术有更加深入的认识和理解,从此能够再也不用专门学习 AJAX。本篇文章为该系列的第二篇,最近更新于 2023 年 1...

libinfs40阅读 6.3k评论 12

封面图
从零搭建 Node.js 企业级 Web 服务器(一):接口与分层
分层规范从本章起,正式进入企业级 Web 服务器核心内容。通常,一块完整的业务逻辑是由视图层、控制层、服务层、模型层共同定义与实现的,如下图:从上至下,抽象层次逐渐加深。从下至上,业务细节逐渐清晰。视图...

乌柏木44阅读 7.4k评论 6

113 声望
5 粉丝
宣传栏