2024年11月3日

转义,特殊字符

正如我们所看到的,反斜杠 \ 用于表示字符类,例如 \d。所以它是正则表达式中的一个特殊字符(就像在常规字符串中一样)。

还存在其它特殊字符,这些字符在正则表达式中有特殊的含义,例如 [ ] { } ( ) \ ^ $ . | ? * +。它们用于执行更强大的搜索。

现在并不需要尝试记住它们 —— 当我们分别学习它们的时候,你自然而然就会记住了。

转义

假如我们想要找到一个点号 .

要将特殊字符用作常规字符,请在其前面加上反斜杠:\.

这就是所谓的“转义字符”。

例如:

alert( "Chapter 5.1".match(/\d\.\d/) ); // 5.1(匹配了!)
alert( "Chapter 511".match(/\d\.\d/) ); // null(寻找一个真正的点 \.)

括号也是特殊字符,所以如果我们想要查找它们,我们应该使用 \(。下面的例子会查找一个字符串 "g()"

alert( "function g()".match(/g\(\)/) ); // "g()"

如果我们想查找反斜杠 \,我们就应该使用两个反斜杠:

alert( "1\\2".match(/\\/) ); // '\'

一个斜杠

斜杠符号 '/' 并不是一个特殊字符,但是它被用于在 Javascript 中开启和关闭正则匹配:/...pattern.../,所以我们也应该转义它。

下面是搜索斜杠 '/' 的表达式:

alert( "/".match(/\//) ); // '/'

从另一个方面看,如果我们没使用 /.../,而是使用另一种 new RegExp 的方式创建正则表达式,则不需要转义斜杠:

alert( "/".match(new RegExp("/")) ); // 找到了 /

new RegExp

如果我们使用 new RegExp 创建正则表达式,那么我们不必转义 /,但需要进行一些其他转义。

例如,考虑下面这个示例:

let reg = new RegExp("\d\.\d");

alert( "Chapter 5.1".match(reg) ); // null

在之前的示例中我们使用 /\d\.\d/ 进行类似的搜索没问题,但 new RegExp("\d\.\d") 不起作用,为什么?

因为反斜杠被字符串“消耗”了。我们可能还记得,常规字符串有自己的特殊字符,例如 \n,反斜杠用于转义。

下面是 “\d.\d” 的感知形式:

alert("\d\.\d"); // d.d

在字符串中的反斜杠表示转义或者类似 \n 这种只能在字符串中使用的特殊字符。这个引用会“消耗”并且解释这些字符,比如说:

  • \n —— 变成一个换行字符,
  • \u1234 —— 变成该编码所对应的 Unicode 字符,
  • ……而当没有特殊含义时:如 \d 或者 \z,碰到这种情况时则会自动移除反斜杠。

所以调用 new RegExp 会获得一个没有反斜杠的字符串。这就是搜索不起作用的原因!

如果要修复这个问题,我们需要双斜杠,因为引用会把 \\ 变为 \

let regStr = "\\d\\.\\d";
alert(regStr); // \d\.\d(现在对了)

let regexp = new RegExp(regStr);

alert( "Chapter 5.1".match(regexp) ); // 5.1

总结

  • 要在字面意义上搜索特殊字符 [ \ ^ $ . | ? * + ( ),我们需要在它们前面加上一个反斜杠 \(“转义它们”)。
  • 如果在 /.../ 内(但不在 new RegExp 内),我们还需要转义 /
  • 当将字符串传递给给 new RegExp 时,我们需要双反斜杠 \\,因为字符串引号会消耗一个反斜杠。
教程路线图

评论

在评论之前先阅读本内容…
  • 如果你发现教程有错误,或者有其他需要修改和提升的地方 — 请 提交一个 GitHub issue 或 pull request,而不是在这评论。
  • 如果你对教程的内容有不理解的地方 — 请详细说明。
  • 使用 <code> 标签插入只有几个词的代码,插入多行代码可以使用 <pre> 标签,对于超过 10 行的代码,建议你使用沙箱(plnkrJSBincodepen…)