SQL多表聯(lián)合查詢時(shí)如何采用字段模糊匹配
先說一下背景和要求
背景:由于業(yè)務(wù)或是其他不描述的原因的問題導(dǎo)致原有存儲(chǔ)的數(shù)據(jù)發(fā)生變動(dòng),與現(xiàn)有數(shù)據(jù)有差別,但還是能勉強(qiáng)看明白數(shù)據(jù)內(nèi)容。
要求:實(shí)現(xiàn)A表的名稱字段和B表的名稱字段要模糊匹配。
上圖:
假如A表長(zhǎng)這樣:
B表長(zhǎng)這樣:
然后我要想變成這樣:
簡(jiǎn)單說就是在我關(guān)聯(lián)查詢兩表時(shí),條件字段的取值看起來不一樣,但是意思是一樣的,應(yīng)該要把這種數(shù)據(jù)關(guān)聯(lián)起來。但是SQL里面“=”兩邊又必須嚴(yán)格相同,所以現(xiàn)在怎么辦呢?
方法一
可以采用類似于LIKE模糊查詢的辦法。
MySQL:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE INSTR(a.`name`,b.newname)>0 OR INSTR(b.newname,a.`name`)>0
或者
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE CONCAT('%',b.newname,'%') OR b.newname LIKE CONCAT('%',a.`name`,'%')
Oracle:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE '%'||b.newname||'%'
SQL Server:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE '%'+b.newname+'%' OR b.newname LIKE '%'+a.`name`+'%'
順便說一下這里用到的字符串拼接功能在三類數(shù)據(jù)庫中的寫法:
SQL Server:
SELECT '123'+'456'
Oracle:
SELECT '123'||'456' FROM dual 或 SELECT CONCAT('123','456') FROM dual
MySQL:
SELECT CONCAT('123','456')
Oracle和MySQL中雖然都有CONCAT,但是Oracle中只能拼接2個(gè)字符串,所以建議用||的方式,MySQL中的CONCAT則可以拼接多個(gè)字符串。
此外,MySQL中的INSTR(STR,SUBSTR)函數(shù),在一個(gè)字符串(STR)中搜索指定的字符(SUBSTR),返回發(fā)現(xiàn)指定的字符的位置(INDEX)。
- STR—被搜索的字符串;
- SUBSTR—希望搜索的字符串;
結(jié)論:在字符串STR里面,字符串SUBSTR出現(xiàn)的第一個(gè)位置(INDEX),INDEX是從1開始計(jì)算,如果沒有找到就直接返回0,沒有返回負(fù)數(shù)的情況。
到這兒,有同學(xué)就會(huì)發(fā)現(xiàn),你這應(yīng)用場(chǎng)景也太單一了吧,要是這種:A表被關(guān)聯(lián)字段值為“城鄉(xiāng)規(guī)劃”,B表被關(guān)聯(lián)字段值為“城市規(guī)劃”;或者A表被關(guān)聯(lián)字段值為“漂亮”,B表被關(guān)聯(lián)字段值為“美麗”。這樣的兩個(gè)字段值也是一個(gè)意思,但是用上面的方法就行不通了。
沒辦法了嘛?
有的。
方法二
你還可以使用NLP的算法來做上面最后提到的那種情況,關(guān)于這點(diǎn),在我之前發(fā)表的文章《Word2Vec可視化展示》中已有詳細(xì)說明,感興趣的同學(xué)可以研究研究。
另外就是,不管哪種辦法,總有漏網(wǎng)之魚,也就是總有你匹配不到的情況,或是匹配錯(cuò)誤的情況。所以還需要根據(jù)自己的需求、業(yè)務(wù)以及數(shù)據(jù)情況,具體問題具體分析,結(jié)合各種方法開發(fā)代碼實(shí)現(xiàn)自己想要的功能,做到因地制宜。
那有同學(xué)又問了,就沒有那種一招打天下的辦法了嗎?
有的。
方法三
你可以用你的最強(qiáng)大腦去手動(dòng)處理~~~~~~~~~~
咳咳,我的意思是:就算要手動(dòng)處理,我們也要減少手動(dòng)處理的工作量嘛。要不“會(huì)急死人的”,真的“會(huì)急死人的”!
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Windows 11安裝SQL Server 2019出現(xiàn)"等待數(shù)據(jù)庫引擎恢復(fù)句
這篇文章主要介紹了Windows 11安裝SQL Server 2019出現(xiàn)"等待數(shù)據(jù)庫引擎恢復(fù)句柄失敗"問題完美解決方案,解決方案很簡(jiǎn)單,格式化您的硬盤,刪除分區(qū)并重新指定扇區(qū)大小,本文給大家介紹的非常詳細(xì),需要的朋友參考下吧2023-07-07SQL Server誤區(qū)30日談 第12天 TempDB的文件數(shù)和需要和CPU數(shù)目保持一致
TempDB的文件沒有必要分布在多個(gè)存儲(chǔ)器之間。如果你看到PAGELATCH類型的等待,即使你進(jìn)行了分布也不會(huì)改善性能,而如果PAGEIOLATCH型的等待,或許你需要多個(gè)存儲(chǔ)器,但這也不是必然-有可能你需要講整個(gè)TempDB遷移到另一個(gè)存儲(chǔ)系統(tǒng),而不是僅僅為TempDB增加一個(gè)文件2013-01-01SQLServer用存儲(chǔ)過程實(shí)現(xiàn)插入更新數(shù)據(jù)示例
這篇文章主要介紹了SQLServer如何用存儲(chǔ)過程實(shí)現(xiàn)插入更新數(shù)據(jù),需要的朋友可以參考下2014-08-08SQL Server中的集合運(yùn)算: UNION, EXCEPT和INTERSECT示例代碼詳解
這篇文章主要介紹了SQL Server中的集合運(yùn)算: UNION, EXCEPT和INTERSECT,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-08-08創(chuàng)建動(dòng)態(tài)MSSQL數(shù)據(jù)庫表
下面是利用SQL語句創(chuàng)建數(shù)據(jù)庫、表、存儲(chǔ)過程、視圖、索引、規(guī)則、修改表、查看數(shù)據(jù)等的方法。2009-06-06SQL中WHERE變量IS NULL條件導(dǎo)致全表掃描問題的解決方法
今天在評(píng)審接手的項(xiàng)目中的存儲(chǔ)過程時(shí),發(fā)現(xiàn)存在大量的在條件里判斷變量是否NULL的寫法2013-09-09sql?server多行數(shù)據(jù)合并一行顯示簡(jiǎn)單實(shí)現(xiàn)代碼
有時(shí)候我們需要將多行數(shù)據(jù)按照某一列進(jìn)行合并,以便更方便地進(jìn)行數(shù)據(jù)分析和處理,這篇文章主要給大家介紹了關(guān)于sql?server多行數(shù)據(jù)合并一行顯示簡(jiǎn)單實(shí)現(xiàn)的相關(guān)資料,需要的朋友可以參考下2023-12-12Sqlserver2000 數(shù)據(jù)庫備份實(shí)例代碼
每個(gè)星期天凌晨1點(diǎn)做一次完全備份,為保險(xiǎn)起見,備份到兩個(gè)同樣的完全備份文件test_full_A.bak和test_full_B.bak2010-07-07