SQL多表聯(lián)合查詢時如何采用字段模糊匹配
先說一下背景和要求
背景:由于業(yè)務或是其他不描述的原因的問題導致原有存儲的數(shù)據(jù)發(fā)生變動,與現(xiàn)有數(shù)據(jù)有差別,但還是能勉強看明白數(shù)據(jù)內(nèi)容。
要求:實現(xiàn)A表的名稱字段和B表的名稱字段要模糊匹配。
上圖:
假如A表長這樣:
B表長這樣:
然后我要想變成這樣:
簡單說就是在我關聯(lián)查詢兩表時,條件字段的取值看起來不一樣,但是意思是一樣的,應該要把這種數(shù)據(jù)關聯(lián)起來。但是SQL里面“=”兩邊又必須嚴格相同,所以現(xiàn)在怎么辦呢?
方法一
可以采用類似于LIKE模糊查詢的辦法。
MySQL:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE INSTR(a.`name`,b.newname)>0 OR INSTR(b.newname,a.`name`)>0
或者
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE CONCAT('%',b.newname,'%') OR b.newname LIKE CONCAT('%',a.`name`,'%')
Oracle:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE '%'||b.newname||'%'
SQL Server:
SELECT a.id,a.`name`,b.newid,b.newname FROM z_good a,z_good_new b WHERE a.`name` LIKE '%'+b.newname+'%' OR b.newname LIKE '%'+a.`name`+'%'
順便說一下這里用到的字符串拼接功能在三類數(shù)據(jù)庫中的寫法:
SQL Server:
SELECT '123'+'456'
Oracle:
SELECT '123'||'456' FROM dual 或 SELECT CONCAT('123','456') FROM dual
MySQL:
SELECT CONCAT('123','456')
Oracle和MySQL中雖然都有CONCAT,但是Oracle中只能拼接2個字符串,所以建議用||的方式,MySQL中的CONCAT則可以拼接多個字符串。
此外,MySQL中的INSTR(STR,SUBSTR)函數(shù),在一個字符串(STR)中搜索指定的字符(SUBSTR),返回發(fā)現(xiàn)指定的字符的位置(INDEX)。
- STR—被搜索的字符串;
- SUBSTR—希望搜索的字符串;
結論:在字符串STR里面,字符串SUBSTR出現(xiàn)的第一個位置(INDEX),INDEX是從1開始計算,如果沒有找到就直接返回0,沒有返回負數(shù)的情況。
到這兒,有同學就會發(fā)現(xiàn),你這應用場景也太單一了吧,要是這種:A表被關聯(lián)字段值為“城鄉(xiāng)規(guī)劃”,B表被關聯(lián)字段值為“城市規(guī)劃”;或者A表被關聯(lián)字段值為“漂亮”,B表被關聯(lián)字段值為“美麗”。這樣的兩個字段值也是一個意思,但是用上面的方法就行不通了。
沒辦法了嘛?
有的。
方法二
你還可以使用NLP的算法來做上面最后提到的那種情況,關于這點,在我之前發(fā)表的文章《Word2Vec可視化展示》中已有詳細說明,感興趣的同學可以研究研究。
另外就是,不管哪種辦法,總有漏網(wǎng)之魚,也就是總有你匹配不到的情況,或是匹配錯誤的情況。所以還需要根據(jù)自己的需求、業(yè)務以及數(shù)據(jù)情況,具體問題具體分析,結合各種方法開發(fā)代碼實現(xiàn)自己想要的功能,做到因地制宜。
那有同學又問了,就沒有那種一招打天下的辦法了嗎?
有的。
方法三
你可以用你的最強大腦去手動處理~~~~~~~~~~
咳咳,我的意思是:就算要手動處理,我們也要減少手動處理的工作量嘛。要不“會急死人的”,真的“會急死人的”!
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Windows 11安裝SQL Server 2019出現(xiàn)"等待數(shù)據(jù)庫引擎恢復句
這篇文章主要介紹了Windows 11安裝SQL Server 2019出現(xiàn)"等待數(shù)據(jù)庫引擎恢復句柄失敗"問題完美解決方案,解決方案很簡單,格式化您的硬盤,刪除分區(qū)并重新指定扇區(qū)大小,本文給大家介紹的非常詳細,需要的朋友參考下吧2023-07-07SQL Server誤區(qū)30日談 第12天 TempDB的文件數(shù)和需要和CPU數(shù)目保持一致
TempDB的文件沒有必要分布在多個存儲器之間。如果你看到PAGELATCH類型的等待,即使你進行了分布也不會改善性能,而如果PAGEIOLATCH型的等待,或許你需要多個存儲器,但這也不是必然-有可能你需要講整個TempDB遷移到另一個存儲系統(tǒng),而不是僅僅為TempDB增加一個文件2013-01-01SQLServer用存儲過程實現(xiàn)插入更新數(shù)據(jù)示例
這篇文章主要介紹了SQLServer如何用存儲過程實現(xiàn)插入更新數(shù)據(jù),需要的朋友可以參考下2014-08-08SQL Server中的集合運算: UNION, EXCEPT和INTERSECT示例代碼詳解
這篇文章主要介紹了SQL Server中的集合運算: UNION, EXCEPT和INTERSECT,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-08-08創(chuàng)建動態(tài)MSSQL數(shù)據(jù)庫表
下面是利用SQL語句創(chuàng)建數(shù)據(jù)庫、表、存儲過程、視圖、索引、規(guī)則、修改表、查看數(shù)據(jù)等的方法。2009-06-06SQL中WHERE變量IS NULL條件導致全表掃描問題的解決方法
今天在評審接手的項目中的存儲過程時,發(fā)現(xiàn)存在大量的在條件里判斷變量是否NULL的寫法2013-09-09sql?server多行數(shù)據(jù)合并一行顯示簡單實現(xiàn)代碼
有時候我們需要將多行數(shù)據(jù)按照某一列進行合并,以便更方便地進行數(shù)據(jù)分析和處理,這篇文章主要給大家介紹了關于sql?server多行數(shù)據(jù)合并一行顯示簡單實現(xiàn)的相關資料,需要的朋友可以參考下2023-12-12Sqlserver2000 數(shù)據(jù)庫備份實例代碼
每個星期天凌晨1點做一次完全備份,為保險起見,備份到兩個同樣的完全備份文件test_full_A.bak和test_full_B.bak2010-07-07