【重学数据结构与算法(JS)】字符串匹配算法(一)——BF算法

前言

一切都要从 LeetCode 的第 28 题 实现 strStr()开始说起,当自己脑子里的第一种暴力查找法写出来并 AC 之后,还是觉得不满足,决定把能找到的解法都理解了,于是便有了这个系列。

字符串匹配的整体思路

当我理解完四种经典的匹配算法之后,总结了一下这类操作的核心:

  1. 模式串主串进行比较

    • 从前往后比较
    • 从后往前比较
  2. 匹配时,比较主串模式串的下一个位置
  3. 失配时,

    • 模式串中寻找一个合适的位置

      * 如果找到,从这个位置开始与`主串`当前失配位置进行比较
      * 如果未找到,从`模式串`的头部与`主串`失配位置的下一个位置进行比较
    • 主串中找到一个合适的位置,重新与模式串进行比较

所以总的来说,之所以会有这么多种匹配算法,本质上就是一些大神对第1步和第3步进行了优化,这个核心思路一定要牢牢的先记在脑子里,这样之后理解优化的匹配算法就不会一脸懵逼。

算法介绍与分析

介绍

BF 算法,Brute-Force(暴力)法的简称,完全没有优化,每次失配时从主串的下一个位置进行比较,直到比较结束。

分析

算法描述如下:

  1. 模式串主串从前往后比较
  2. 匹配时,比较主串模式串的下一个位置
  3. 失配时,从主串下一个位置开始与模式串的头部重新开始比较

我们假设有 主串 ABABBBAAABABABBA模式串 ABABABB
下面放五张图来理解一下这个过程:
QQ20200112-160741.png

QQ20200112-161000.png

上面这两幅图,表现的是第1步和第2步,可以看出:

  1. S[0]P[0] 开始从头往后比较
  2. 如果匹配,比较S[i++]S[j++]

QQ20200112-161423.png

QQ20200112-161548.png

上面这两幅图,则表现的时第3步,可以看出:

  1. 如果 S[i]P[j] 失配
  2. j = 0P[0] 也就是模式串头部开始与主串下一个位置S[i - (j - 1)]开始继续进行匹配

重复上述两步,直到下图完全匹配或者找不到模式串为止

QQ20200112-162337.png

代码

思路还是很好理解的,但是代码怎么写呢?
其实我一直觉得刷 LeetCode 除了巩固与提高数据结构与算法的能力之外,最重要的就是训练一种把思路翻译成代码的能力,下面我来尝试翻译一下上述的算法思路。

1、先进行极端情况的排除

carbon.png

这个操作应该是刷题刷多了,像以前做数学题写“解”的操作

2、写出整体的结构

  1. 从算法的思路很容易看出,这里的“重复上诉两步”,明显是要翻译成循环操作
  2. 如果是循环,那么终止条件是什么,可以很快想到,只有两种终止情况:

    • 主串中没有找到 模式串的匹配,此时 i = haystack.length
    • 主串中找到了模式串的匹配,此时 j = needle.length
  3. 算法处理过程主要是两步,所以这里一定有一个分支结构

    • 匹配
    • 失配
  4. 如果没找到,直接 return -1 就好了,但要是找到了,应该怎么确定那个 index 的值呢?根据上面成功的图,我们可以发现,匹配的位置 8,是等于 主串的末尾 14 减去 模式串的末尾 6 得到的,也就是最后匹配的那个 index = i - j

carbon的副本.png

3、补充具体操作

根据算法分析里的描述,很容易知道

  1. 匹配,i++; j++; 比较各自的下一位
  2. 失配,i = i - (j - 1); j = 0;重新进行下一轮匹配

carbon的副本2.png

总结

至此,整个BF算法的分析与编写就完成了,虽然它是一个毫无优化的结构,但是体现出了所有字符串匹配算法的基本思想,计算机不是人,可以通过眼睛观察和大脑思考来进行定位,它只能通过一个一个字符的比较来进行判定,接下来的算法,就开始运用到一些骚操作来进行优化这个匹配的过程。

后记

“字符串匹配算法”是“重学数据结构与算法”系列笔记中的一个章节,细分为以下几个部分,之后会陆续填坑。


前端的尤里卡时刻
一些基础巩固 一些原理解析 一些最佳实践 一些踩坑经历
113 声望
5 粉丝
0 条评论
推荐阅读
关于用设计模式刷 LeetCode 这件事
最近在过 《剑指Offer》 这本书上的题,尽量把每题的多种解法都自己捋一遍,在过到 面试题20. 表示数值的字符串 这一题的时候,Discuss 里有一个同学提出了 职责链模式 的解法,让人眼前一亮,另一方面是笔者最近...

LazyDuke3阅读 946

从零搭建 Node.js 企业级 Web 服务器(零):静态服务
过去 5 年,我前后在菜鸟网络和蚂蚁金服做开发工作,一方面支撑业务团队开发各类业务系统,另一方面在自己的技术团队做基础技术建设。期间借着 Node.js 的锋芒做了不少 Web 系统,有的至今生气蓬勃、有的早已夭折...

乌柏木150阅读 12.4k评论 10

正则表达式实例
收集在业务中经常使用的正则表达式实例,方便以后进行查找,减少工作量。常用正则表达式实例1. 校验基本日期格式 {代码...} {代码...} 2. 校验密码强度密码的强度必须是包含大小写字母和数字的组合,不能使用特殊...

寒青56阅读 7.9k评论 11

JavaScript有用的代码片段和trick
平时工作过程中可以用到的实用代码集棉。判断对象否为空 {代码...} 浮点数取整 {代码...} 注意:前三种方法只适用于32个位整数,对于负数的处理上和Math.floor是不同的。 {代码...} 生成6位数字验证码 {代码...} ...

jenemy46阅读 6.1k评论 12

从零搭建 Node.js 企业级 Web 服务器(十五):总结与展望
总结截止到本章 “从零搭建 Node.js 企业级 Web 服务器” 主题共计 16 章内容就更新完毕了,回顾第零章曾写道:搭建一个 Node.js 企业级 Web 服务器并非难事,只是必须做好几个关键事项这几件必须做好的关键事项就...

乌柏木66阅读 6.2k评论 16

再也不学AJAX了!(二)使用AJAX ① XMLHttpRequest
「再也不学 AJAX 了」是一个以 AJAX 为主题的系列文章,希望读者通过阅读本系列文章,能够对 AJAX 技术有更加深入的认识和理解,从此能够再也不用专门学习 AJAX。本篇文章为该系列的第二篇,最近更新于 2023 年 1...

libinfs40阅读 6.4k评论 12

封面图
从零搭建 Node.js 企业级 Web 服务器(一):接口与分层
分层规范从本章起,正式进入企业级 Web 服务器核心内容。通常,一块完整的业务逻辑是由视图层、控制层、服务层、模型层共同定义与实现的,如下图:从上至下,抽象层次逐渐加深。从下至上,业务细节逐渐清晰。视图...

乌柏木44阅读 7.5k评论 6

113 声望
5 粉丝
宣传栏