快捷導(dǎo)航

SQL多表聯(lián)合查詢時(shí)如何采用字段模糊匹配

更新時(shí)間：2022年11月02日 09:30:59 作者：Eureka丶

這篇文章主要介紹了SQL多表聯(lián)合查詢時(shí)如何采用字段模糊匹配，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教

先說一下背景和要求

背景：由于業(yè)務(wù)或是其他不描述的原因的問題導(dǎo)致原有存儲(chǔ)的數(shù)據(jù)發(fā)生變動(dòng)，與現(xiàn)有數(shù)據(jù)有差別，但還是能勉強(qiáng)看明白數(shù)據(jù)內(nèi)容。

要求：實(shí)現(xiàn)A表的名稱字段和B表的名稱字段要模糊匹配。

上圖：

假如A表長(zhǎng)這樣：

B表長(zhǎng)這樣：

然后我要想變成這樣：

簡(jiǎn)單說就是在我關(guān)聯(lián)查詢兩表時(shí)，條件字段的取值看起來不一樣，但是意思是一樣的，應(yīng)該要把這種數(shù)據(jù)關(guān)聯(lián)起來。但是SQL里面“=”兩邊又必須嚴(yán)格相同，所以現(xiàn)在怎么辦呢？

方法一

可以采用類似于LIKE模糊查詢的辦法。

MySQL：

SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b
WHERE INSTR(a.`name`,b.newname)>0 OR INSTR(b.newname,a.`name`)>0

或者

SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b
WHERE a.`name` LIKE CONCAT('%',b.newname,'%') OR b.newname LIKE CONCAT('%',a.`name`,'%')

Oracle：

SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b
WHERE a.`name` LIKE '%'||b.newname||'%'

SQL Server：

SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b
WHERE a.`name` LIKE '%'+b.newname+'%' OR b.newname LIKE '%'+a.`name`+'%'

順便說一下這里用到的字符串拼接功能在三類數(shù)據(jù)庫中的寫法：

SQL Server：

SELECT '123'+'456'

Oracle：

SELECT '123'||'456' FROM dual
或
SELECT CONCAT('123','456') FROM dual

MySQL：

SELECT CONCAT('123','456')

Oracle和MySQL中雖然都有CONCAT，但是Oracle中只能拼接2個(gè)字符串，所以建議用||的方式，MySQL中的CONCAT則可以拼接多個(gè)字符串。

此外，MySQL中的INSTR(STR,SUBSTR)函數(shù)，在一個(gè)字符串(STR)中搜索指定的字符(SUBSTR),返回發(fā)現(xiàn)指定的字符的位置(INDEX)。

STR—被搜索的字符串；
SUBSTR—希望搜索的字符串；

結(jié)論：在字符串STR里面，字符串SUBSTR出現(xiàn)的第一個(gè)位置(INDEX)，INDEX是從1開始計(jì)算，如果沒有找到就直接返回0，沒有返回負(fù)數(shù)的情況。

到這兒，有同學(xué)就會(huì)發(fā)現(xiàn)，你這應(yīng)用場(chǎng)景也太單一了吧，要是這種：A表被關(guān)聯(lián)字段值為“城鄉(xiāng)規(guī)劃”，B表被關(guān)聯(lián)字段值為“城市規(guī)劃”；或者A表被關(guān)聯(lián)字段值為“漂亮”，B表被關(guān)聯(lián)字段值為“美麗”。這樣的兩個(gè)字段值也是一個(gè)意思，但是用上面的方法就行不通了。

沒辦法了嘛？

有的。

方法二

你還可以使用NLP的算法來做上面最后提到的那種情況，關(guān)于這點(diǎn)，在我之前發(fā)表的文章《Word2Vec可視化展示》中已有詳細(xì)說明，感興趣的同學(xué)可以研究研究。

另外就是，不管哪種辦法，總有漏網(wǎng)之魚，也就是總有你匹配不到的情況，或是匹配錯(cuò)誤的情況。所以還需要根據(jù)自己的需求、業(yè)務(wù)以及數(shù)據(jù)情況，具體問題具體分析，結(jié)合各種方法開發(fā)代碼實(shí)現(xiàn)自己想要的功能，做到因地制宜。

那有同學(xué)又問了，就沒有那種一招打天下的辦法了嗎？

有的。