欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PostgreSQL模式匹配與正則表達(dá)式方法總結(jié)

 更新時間:2022年11月16日 16:12:15   作者:夢想家DBA  
在postgresql中使用正則表達(dá)式時需要使用關(guān)鍵字“~”,以表示該關(guān)鍵字之前的內(nèi)容需匹配之后的正則表達(dá)式,這篇文章主要給大家介紹了關(guān)于PostgreSQL模式匹配與正則表達(dá)式的相關(guān)資料,需要的朋友可以參考下

1.1 PostgreSQL中的模式匹配和正則表達(dá)式

PostgreSQL提供了以下3種實現(xiàn)模式匹配的方法:

  • ·傳統(tǒng)SQL的LIKE操作符。
  • ·SQL99標(biāo)準(zhǔn)新增的SIMILAR TO操作符。
  • ·POSIX風(fēng)格的正則表達(dá)式。

另外,還有一個模式匹配函數(shù)substring可用,它可以使用SIMILAR TO風(fēng)格或者POSIX風(fēng)格的正則表達(dá)式。后面會詳細(xì)介紹substring函數(shù)的使用方法。

1.2 傳統(tǒng)SQL的LIKE操作符

傳統(tǒng)的LIKE操作符比較簡單,其中百分號“%”代表0個或任意個字符,而下劃線“_”代表任意一個字符,示例如下:

maxwelldb=# select * from mytab3;
 id |   note   
----+----------
  1 | abcabefg
  2 | abxyz
  3 | 123abc
  4 | ab_abefg
  5 | ab%abefg
  6 | ababefg
(6 rows)
 
maxwelldb=# select * from mytab3 where note like 'ab_ab%';
 id |   note   
----+----------
  1 | abcabefg
  4 | ab_abefg
  5 | ab%abefg
(3 rows)
 
maxwelldb=# select * from mytab3 where note like 'ab%ab%';
 id |   note   
----+----------
  1 | abcabefg
  4 | ab_abefg
  5 | ab%abefg
  6 | ababefg
(4 rows)

如果想匹配字符串中的百分號“%”自身或下劃線“_”自身怎么辦呢?可以在字符串前加轉(zhuǎn)義字符反斜杠“\”,示例如下:

maxwelldb=# select * from mytab3 where note like '%\%%';
 id |   note   
----+----------
  5 | ab%abefg
(1 row)
 
maxwelldb=# select * from mytab3 where note like '%\_%';
 id |   note   
----+----------
  4 | ab_abefg
(1 row)

轉(zhuǎn)義字符也可以通過ESCAPE子句指定為其他字符,如指定成“#”,命令如下:

maxwelldb=# select * from mytab3 where note like '%#%%' escape '#';
 id |   note   
----+----------
  5 | ab%abefg
(1 row)
 
maxwelldb=# select * from mytab3 where note like '%#_%' escape '#';
 id |   note   
----+----------
  4 | ab_abefg
(1 row)
 
maxwelldb=# 

轉(zhuǎn)義字符本身可以通過使用連續(xù)兩個轉(zhuǎn)義字符去除轉(zhuǎn)義字符的特殊意義,示例如下:

maxwelldb=# insert into mytab3 value3(7,'\');
ERROR:  syntax error at or near "value3"
LINE 1: insert into mytab3 value3(7,'\');
                           ^
maxwelldb=# insert into mytab3 values(7,'\');
INSERT 0 1
maxwelldb=# insert into mytab3 values(8,'#');
INSERT 0 1
maxwelldb=# select * from mytab3 where note like '%\\%';
 id | note 
----+------
  7 | \
(1 row)
 
maxwelldb=# select * from mytab3 where note like '%##%' escape '#';
 id | note 
----+------
  8 | #
(1 row)

PostgreSQL還提供了標(biāo)準(zhǔn)SQL中沒有的ILIKE操作符,用于忽略大小寫的模式匹配。

PostgreSQL還提供了如下與LIKE等價的操作符。

·~~:等效于LIKE。

·~~*:等效于ILIKE。

·!~~:等效于NOT LIKE。

·!~~*:操作符NOT ILIKE。

1.3 SIMILAR TO正則表達(dá)式

SIMILAR TO是SQL99標(biāo)準(zhǔn)定義的正則表達(dá)式。SQL標(biāo)準(zhǔn)的正則表達(dá)式是混合了LIKE和普通的正則表達(dá)式的一個雜合體。

SIMILAR TO操作符只有匹配整個字符串時才能匹配成功,這一點與LIKE相同,而與普通的正則表達(dá)式只匹配部分的習(xí)慣不同。SIMILAR TO與LIKE一樣也使用下劃線和百分號分別匹配單個字符和任意字符串。

除了從LIKE借用的這些功能之外,SIMILAR TO還支持以下幾個與POSIX正則表達(dá)式相同的模式匹配元字符。

·|:表示選擇兩個候選項之一。

·*:表示重復(fù)前面的項0次或更多次。

·+:表示重復(fù)前面的項一次或更多次。

·?:表示重復(fù)前面的項0次或一次。

·{m}:表示重復(fù)前面的項m次。

·{m,}:表示重復(fù)前面的項m次或更多次。

·{m,n}:表示重復(fù)前面的項至少m次,不超過n次。

·括號():可以作為項目分組到一個獨立的邏輯項。

·[...]:聲明一個字符類,就像POSIX正則表達(dá)式。

在SIMILAR TO中英文的句號“.”并不是元字符。和LIKE操作符一樣,可以使用反斜杠關(guān)閉這些元字符所有的特殊含義,當(dāng)然也可以用ESCAPE聲明另外一個轉(zhuǎn)義字符。

maxwelldb=# select 'osdba' SIMILAR TO 'a';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' SIMILAR TO '%(b|a)';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdb' SIMILAR TO '%(s|d)%';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# 

1.4 POSIX正則表達(dá)式

POSIX正則表達(dá)式的模式匹配操作符有以下幾個。

·~:匹配正則表達(dá)式,區(qū)分大小寫。

·~*:匹配正則表達(dá)式,不區(qū)分大小寫。

·!~:不匹配正則表達(dá)式,區(qū)分大小寫。

·!~*:不匹配正則表達(dá)式,不區(qū)分大小寫。

POSIX正則表達(dá)式提供了比LIKE和SIMILAR TO操作符更強大的模式匹配方法。許多UNIX的命令如egrep、sed、awk都使用類似的模式匹配語言。

maxwelldb=# 
maxwelldb=# select 'osdba' ~ 'a';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' ~ '(b|a)*';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdb' ~ '.*(b|a).*';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' ~ '(s|d).*';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# 

在POSIX正則表達(dá)式中,百分號與下劃線沒有像LIKE或SIMILAR TO操作符中的特殊意義,示例如下:

 maxwelldb=# select 'osdba' ~ '%';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' ~ '_sdba';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# 

在POSIX正則表達(dá)式中與SIMILAR TO和LIKE操作符不一樣的是,只要部分匹配到字符串就返回真,這與UNIX中的grep命令是一樣的。

maxwelldb=# select 'osdba' ~ 'os';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# 

如果想匹配開頭或結(jié)尾,需要使用POSIX中的“^”或“$”元字符,示例如下:

maxwelldb=# select 'aosdba' ~ 'os';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'aosdba' ~ '^os';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' ~ 'db';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' ~ 'db$';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' ~ 'dba$';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# 

1.5 模式匹配函數(shù)substring

PostgreSQL中有一個很強大的函數(shù)substring,該函數(shù)可以使用正則表達(dá)式。substring有以下3種用法。

第一種:substring(<字符串>,<數(shù)字>,[數(shù)字])。

后兩個參數(shù)為數(shù)字,該函數(shù)和其他語言中的substr函數(shù)的含義相同,示例如下。

maxwelldb=# select substring('osdba',2);
 substring 
-----------
 sdba
(1 row)
 
maxwelldb=# 

第二種:substring(<字符串>,<字符串>)。

有兩個參數(shù)且都是字符串,這是一種使用POSIX正則表達(dá)式的方式。

前面說過,在PostgreSQL中有兩種正則表達(dá)式,一種被稱為SQL正則表達(dá)式;另一種被稱為POSIX正則表達(dá)式。POSIX正則表達(dá)式就是一般在腳本語言中使用的標(biāo)準(zhǔn)正則表達(dá)式,而SQL正則表達(dá)式首先是遵循SQL語句中的LIKE語法的,如字符“.”在POSIX正則表達(dá)式中代表任意字符,而在SQL表達(dá)式中就只能表示自己,表示任意字符的元字符是“_”。

SQL正則表達(dá)式中“%”可以表示任意個字符,而這在POSIX正則表達(dá)式中要用“.*”來表示。

同時SQL正則表達(dá)式也支持以下語法。

·|:表示選擇(兩個候選之一),這在POSIX正則表達(dá)式中不支持。

·*:表示重復(fù)前面的項0次或更多次。

·+:表示重復(fù)前面的項一次或更多次。

·():把項組合成一個邏輯項。

·[...]:聲明一個字符類。

SIMILAR TO中使用的就是SQL正則表達(dá)式,而“~”使用的是POSIX正則表達(dá)式,注意兩者間的如下區(qū)別:

maxwelldb=# select 'osdba' ~ 'sdb';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' similar to 'sdb';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' similar to '%sdb%';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# 

從上面的示例中可以看出,SQL正則表達(dá)式要求全部匹配才為真,而POSIX表達(dá)式中只要包含就為真。

只有兩個參數(shù)的substring中的正則表達(dá)式是POSIX正則表達(dá)式,而不是SQL正則表達(dá)式,示例如下:

maxwelldb=# select substring('osdba-5-osdba',E'(\\d+)');
 substring 
-----------
 5
(1 row)
 
maxwelldb=# 

這種方式的substring函數(shù)返回正則表達(dá)式中“()”中匹配的部分。

第三種:substring(<字符串>,<字符串>,<字符串)或substring(<字符串> from <字符串> for <字符串)。

這種形式的substring使用SQL正則表達(dá)式,第三個參數(shù)為指定一個轉(zhuǎn)義字符。示例如下:

maxwelldb=# select substring('osdba-5-osdba','%#"[0-9]+#"%','#');
 substring 
-----------
 5
(1 row)
 
maxwelldb=# 

總結(jié)

到此這篇關(guān)于PostgreSQL模式匹配與正則表達(dá)式的文章就介紹到這了,更多相關(guān)PostgreSQL模式匹配與正則內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論