欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

如何快速提取表格中的款式和尺碼? wps中regexp超級(jí)正則提取函數(shù)的妙用

  發(fā)布時(shí)間:2025-09-02 08:11:12   作者:佚名   我要評(píng)論
wps表格中的數(shù)據(jù)很亂,有尺碼和款式,想要分類提取,整理好數(shù)據(jù),該怎么操作呢?下面我們可以使用regexp函數(shù)實(shí)現(xiàn)

問(wèn)題描述:我有一列登記較為混亂的產(chǎn)品及尺碼的信息,想要將對(duì)應(yīng)的款式與尺碼分為N組對(duì)應(yīng)關(guān)系,每?jī)闪袨橐唤M重新制表,有希望批量實(shí)現(xiàn)嗎?

小編一開(kāi)始也認(rèn)為,這么混亂的數(shù)據(jù),基本就別奢求能實(shí)現(xiàn)了,沒(méi)有想到就用了一個(gè)正則表達(dá)式函數(shù)就搞定了,不禁感嘆,正則真的挺強(qiáng)大。

如下圖所示:

A列為混亂的商品信息。商品信息中包括但不限于:款式名稱(有字母&數(shù)字格式、純數(shù)字格式、字母&符號(hào)&數(shù)字格式)、顏色(漢字格式、符號(hào)&漢字格式)、尺碼(尺碼是大寫(xiě)字母,尺碼范圍是M~XXL)、以及一些位置不固定的其他字符(漢字、符號(hào)等)。

由于一個(gè)單元格中可能包含1~N組“款式”與“尺碼”,所以我們想要重新提取并整理數(shù)據(jù)到新表。每?jī)闪袨橐唤M,分別是“款式”與“尺碼”一一對(duì)應(yīng)。這樣橫向布局分成N組。

正則表達(dá)式的英文是“regular sets”或“regular expressions”這兩個(gè)術(shù)語(yǔ)。

“regular”是有“規(guī)則的、有規(guī)律的”意思。正則表達(dá)式就是用于描述字符串的規(guī)則和模式,通過(guò)特定的語(yǔ)法和符號(hào)來(lái)匹配符合某種規(guī)律的字符串。

雖然上面的數(shù)據(jù)很亂,但總體上來(lái)說(shuō):

都是“任意字符”+款式1+“任意字符”+尺碼1+“任意字符”+款式2+“任意字符”+尺碼2+“任意字符”,這樣的模式構(gòu)成。

并且款式與尺碼的格式也比較固定,可能性不會(huì)出現(xiàn)的太多。

那么我們就利用這兩點(diǎn)來(lái)構(gòu)建正則表達(dá)式。

第一步:提取款式名稱

輸入REGEXP正則表達(dá)式函數(shù):

=REGEXP(A2,"[A-z]+\d+-\d+")

第一種款式名格式為:字母+數(shù)字+“-”+數(shù)字 格式。那么我們即構(gòu)建這種模式的正則表達(dá)式。

  • [A-z]+:表示一個(gè)或多個(gè)任意的字母
  • \d+:表示一個(gè)或多個(gè)任意的數(shù)字
  • [A-z]+\d+-\d+:整體表示任意的 “字母+數(shù)字+“-””+數(shù)字 這種格式。

繼續(xù)完善正則表達(dá)式:

=REGEXP(A2,"([A-z]+\d+-\d+)|[A-z]+\d+")

  • 第二種款式名格式為:字母+數(shù)字 格式。那么我們即構(gòu)建這種模式的正則表達(dá)式。
  • [A-z]+\d+:表示任意的 字母+數(shù)字 的組合。

第一種格式的款式名正則式用“()”括起來(lái),代表一個(gè)分組,可以確保不與后面正則式產(chǎn)生混亂。

用正則“或”邏輯符號(hào)“|”與第一種款式名格式連接,表示兩種格式是“或”的關(guān)系,同時(shí)存在且提取。

繼續(xù)完善正則表達(dá)式:

=REGEXP(A2,"([A-z]+\d+-\d+)|([A-z]+\d+)|\d+")

第三種款式名格式為:純數(shù)字 格式。那么我們即構(gòu)建這種模式的正則表達(dá)式。

  • \d+:表示任意的一個(gè)或多個(gè)數(shù)字,代表 純數(shù)字 格式。

第二種格式的款式名正則式用“()”括起來(lái),代表一個(gè)分組,可以確保不與后面正則式產(chǎn)生混亂。

用正則“或”邏輯符號(hào)“|”與第二種款式名格式連接,表示三種格式是“或”的關(guān)系,同時(shí)存在且提取。

這樣我們發(fā)現(xiàn):

所有的 款式名 就都提取到了。

第二步:提取尺碼

繼續(xù)完善正則表達(dá)式函數(shù):

=REGEXP(A2,"([A-z]+\d+-\d+)|([A-z]+\d+)|(\d+)|M|L|XL|XXL")

上一步 提取 款式名 格式的“純數(shù)字”部分要用“()”括起來(lái)分組,確保不與后面的正則式產(chǎn)生混亂。

文章開(kāi)始提干中已經(jīng)明確了,尺碼是M~XXL中的任意一種。

  • M|L|XL|XXL:表示M或L或XL或XXL中的任意一個(gè)元素。
  • 再用邏輯符“|”:將“款式名”部分與“尺碼”部分連接??梢源_保分別提取“款式名”與“尺碼”,且可實(shí)現(xiàn) 款式&尺碼 分多組依次提取的效果。

推薦閱讀:交叉重復(fù)提取妙計(jì)! wps中REGEXP正則表達(dá)式函數(shù)用法

相關(guān)文章

最新評(píng)論