腳本之家服務器常用軟件

快捷導航

我終于理解透了! 深入淺出wps正則表達式中的邊界\b和\B概念

發(fā)布時間：2025-07-03 10:48:42 作者：佚名

我要評論

在wps使用正則表達式的時候，會遇到需要精準匹配某些字符的情況，這時候 \b \B 就派上用場了,若是不理解這兩個正則表達式元字符，用起來便不會得心應手

有的小伙伴反饋WPS表格“正則表達式 \b與\B 單詞邊界概念太抽象了”，我咋理解不了呢？不用怕，我們再來深入的研究一下。

微軟Office LTSC 2021專業(yè)增強版簡體中文批量許可版 2024年09月更新

類型：辦公軟件
大小：2.2GB
語言：簡體中文
時間：2024-09-12

查看詳情

WPS Office 2024 V12.1.0.21541 官方最新正式版

類型：辦公軟件
大?。?/span>260MB
語言：簡體中文
時間：2025-06-09

查看詳情

\b（單詞邊界）含義：

匹配單詞的開始或結束位置，即單詞與非單詞字符（如空格、標點符號、字符串首尾）之間的“零寬度”邊界。

\B（非單詞邊界）含義：

匹配不在單詞邊界的空字符串，即單詞字符之間或非單詞字符之間的位置。

單看兩者的概念，我們好像云里霧里，不明其所以然。

其實我們可以這樣理解：

單詞邊界 \b 就像貼在單詞首尾的“隱形標簽”，用來標記單詞的開始或結束位置。非單詞邊界 \B 正好互補，匹配不在單詞邊界的字符，只匹配連續(xù)字符內部的位置。常用于連續(xù)文本中的子串提取。兩者定位的只是位置，本身不占用字符。

我知道你還沒聽懂，話不多說，上例子。

我們先來看\b（單詞邊界）占用的位置。

輸入公式:

=REGEXP(A2,"\b",2,"|")

我們利用"\b"定位A2中的單詞邊界，找到邊界后，用替換模式，在定位到的單詞邊界處替換為分隔符“|”，這樣我們可以更加直觀的看到單詞邊界在哪里。

很明顯：“location”的首尾處分別是單詞邊界，“cat”的首尾處分別是單詞邊界。

印證了我們之前抽象的概念：匹配單詞的首尾邊界。

應用理解1：

我們要將單獨的單詞“cat”，替換為“貓”，而“location”中的“cat”則無需替換。這時候就用到了單詞邊界的概念。

我們輸入公式：

=REGEXP(A2,"\bcat\b",2,"貓")

這樣我們將左右單詞邊界\b之間為單純“cat”的部分，即單獨的單詞“cat”定位提取，然后替換為"貓"。“location”中的“cat”部分自動忽略。

應用理解2：

我們想要將A2單元格內，單獨是4個字母的單詞提取出來。很明顯只有單詞“blue”符合這個要求。那么我們就可以利用\b（單詞邊界）的思路解決。

我們輸入公式：

=REGEXP(A2,"\b",2,"|")

首先我們先來觀察一下A2單元格內容的單詞邊界。利用"\b"定位單詞邊界，然后將邊界位置暫時替換為分隔符“|”，有助于我們肉眼直接觀察，將抽象具象化。

我們觀察到了單詞邊界的位置，其實就是3個單詞它們分別的首尾處。又一次印證了我們之前抽象的概念：匹配單詞的首尾邊界。\b是“單詞保鏢”，專管獨立內容。

我們完善單詞邊界：

=REGEXP(A2,"\b\w{4}\b",0)

\w{4}：表示精確到4個字符長度的任意字母

在上面3組單詞邊界的首尾處，符合\b\w{4}\b，即首尾單詞邊界\b中間為“4個字母”的只有“blue”了。所以用提取模式，將“blue”提取出來就好了。

我們再來看\B（非單詞邊界）占用的位置。

輸入公式：

=REGEXP(A2,"\B",2,"|")

利用"\B"，定位非單詞邊界位置，然后用替換模式，將定位到的非單詞邊界位置，用分隔符"|"替換。這樣做的好處仍然是化抽象為具象，更容易被肉眼觀察具體位置。

很明顯，我們觀察到：單詞非邊界位置，正好是單詞邊界位置的剩余位置，即排除了獨立單詞“location”與“cat”各首尾部分位置后，剩余的單詞內部，字母之間，符號之間的位置。

應用理解1：

我們要將連續(xù)內容“location”中的“cat”替換為“貓”。而單獨的單詞“cat”不做處理。這時候就用到了非單詞邊界。

輸入公式：

=REGEXP(A2,"\Bcat\B",2,"貓")

被非單詞邊界\B左右包圍起來的“cat”，只存在于“location”這個連續(xù)字母之中。所以用替換模式，將“location”中包含的“cat”替換為“貓”，獨立單詞“cat”將不做處理。

應用理解2：

我們想要在數(shù)字之間批量加上符號“-”。

輸入公式：

=REGEXP(A2,"\B",2,"-")

用非單詞邊界"\B"，定位到數(shù)字字符串中的非單詞邊界位置，即除了首尾位置后，字符內部中間部分的位置，也就是內部數(shù)字與數(shù)字之間的位置，用替換模式，將這些位置替換為“-”即可。

應用理解3：

我們想要提取任意統(tǒng)一4位數(shù)字的中間2位數(shù)字。

輸入公式：

=REGEXP(A2,"\B",2,"|")

利用非單詞邊界\B，將定位到的非單詞邊界位置先暫時用"|"替換，化抽象為具象，更容易被肉眼觀察非單詞邊界位置。

我們觀察到非單詞邊界位置，位于數(shù)字字符串內部的數(shù)字之間的位置。

我們繼續(xù)完善非單詞邊界：

=REGEXP(A2,"\B\d{2}\B",0)

d{2}：為任意的2位數(shù)字。

符合左右被非單詞邊界\B包圍的任意的2位數(shù)字，只有數(shù)字字符串中間的2位數(shù)字。用提取模式進行提取即可。

推薦閱讀：超全面使用方法! WPS表格更新的16個新函數(shù)個個都是yyds

Tag：邊界表達式正則 wps

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

我終于理解透了! 深入淺出wps正則表達式中的邊界\b和\B概念

相關文章

最新評論

文章分類

大家感興趣的內容

最近更新的內容