Linux下如何尋找相同文件的方法
隨著電腦的使用,系統(tǒng)里將產(chǎn)生很多垃圾,最典型的就是同一份文件被保存到了不同的位置,這樣導(dǎo)致的結(jié)果就是磁盤空間被大量占用,系統(tǒng)運(yùn)行越來(lái)越慢。
所以如果你的電腦空間告急的話,可以試著去刪除這樣的文件,釋放一些空間。在 Linux 下,我們可以通過(guò)識(shí)別文件的 inode 值來(lái)找出系統(tǒng)中的相同文件。
inode 是一個(gè)數(shù)據(jù)結(jié)構(gòu),記錄了文件所有信息,除了文件名和文件內(nèi)容。如果兩個(gè)或多個(gè)文件具有相同的 inode 值,即使它們的文件名不一樣,位置不一樣,它們的內(nèi)容、所有者、權(quán)限其實(shí)都是一樣的,我們可以將其視有相同文件。
這類型的文件其實(shí)就是所謂的「硬鏈接」。硬鏈接具有相同的 inode 值,但文件名不一樣。而軟鏈接其實(shí)就是快捷方式,它指向目標(biāo)文件,但有著自己的 inode 值。
$ ls -l my* -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 myfile lrwxrwxrwx 1 liangxu liangxu 6 Apr 15 11:18 myref -> myfile -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 mytwin
我們無(wú)法直接知道同一目錄下有哪些文件是有相同的 inode 值,但要識(shí)別起來(lái)也不難。其實(shí)我們只要使用 ls -i 命令,再以 inode 值進(jìn)行排序,就可以直接找到這些文件。
$ ls -i | sort -n | more ... 788000 myfile <== 788000 mytwin <== 801865 Name_Labels.pdf 786692 never leave home angry 920242 NFCU_Docs 800247 nmap-notes
在這個(gè)結(jié)果的第一列里,就是對(duì)應(yīng)的 inode 值。所以從這個(gè)結(jié)果里我們一眼就可以看出來(lái),哪些文件具有相同 inode 值。
如果你只是想找到一個(gè)文件的對(duì)應(yīng)硬鏈接文件,我們可以使用 find 命令,再加個(gè) -samefile 選項(xiàng)即可快速找到。
$ find . -samefile myfile ./myfile ./save/mycopy ./mytwin
這些文件都是有相同的 inode 值,不信的話可以再使用 ls 命令來(lái)查看更多信息:
$ find . -samefile myfile -ls 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./myfile 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./save/mycopy 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./mytwin
我們可以看到,除了文件名之外,這幾個(gè)文件名的信息完全一樣。細(xì)心的朋友可能會(huì)注意到,在第2列(硬連接數(shù))是4,而實(shí)際上我們找出來(lái)的文件只有3個(gè),這說(shuō)明還有一個(gè)文件與他們共享 inode 值,只是我們通過(guò)這條命令沒(méi)有找出來(lái)而已。
作為一個(gè)懶人,每次敲命令多麻煩,直接上腳本找出目錄下的相同文件!
#!/bin/bash # seaches for files sharing inodes prev="" # list files by inode ls -i | sort -n > /tmp/$0 # search through file for duplicate inode #s while read line do inode=`echo $line | awk '{print $1}'` if [ "$inode" == "$prev" ]; then grep $inode /tmp/$0 fi prev=$inode done < /tmp/$0 # clean up rm /tmp/$0
運(yùn)行結(jié)果:
$ ./findHardLinks 788000 myfile 788000 mytwin
當(dāng)然了,你還可以使用 find 命令,根據(jù) inode 值,找到系統(tǒng)里所有相同文件。
$ find / -inum 788000 -ls 2> /dev/null 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /tmp/mycopy 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/myfile 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/save/mycopy 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/mytwin
在這條命令里,我們將錯(cuò)誤提示重定向到 /dev/null 這個(gè)特殊文件里,這樣在搜索一些我們沒(méi)有權(quán)限訪問(wèn)的路徑時(shí),不會(huì)滿屏的 permission denied 。
到此這篇關(guān)于Linux下如何尋找相同文件的方法的文章就介紹到這了,更多相關(guān)Linux 尋找相同文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
redhat Server release 5.2 安裝配置簡(jiǎn)明教程
系統(tǒng)安裝:系統(tǒng)安裝采用光盤安裝,以前一直從USB移動(dòng)硬盤安裝,前幾天心血來(lái)潮,刻成了DVD,以示嚴(yán)肅和一切從頭開(kāi)始,呵呵。2009-08-08Linux UDP socket 設(shè)置為的非阻塞模式與阻塞模式區(qū)別
這篇文章主要介紹了Linux UDP socket 設(shè)置為的非阻塞模式與阻塞模式區(qū)別的相關(guān)資料,需要的朋友可以參考下2017-02-02linux服務(wù)器被植入ddgs、qW3xT.2挖礦病毒的處理實(shí)戰(zhàn)記錄
這篇文章主要給大家介紹了關(guān)于linux服務(wù)器被植入ddgs、qW3xT.2挖礦病毒的處理的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起看看吧2018-09-09Linux信號(hào)機(jī)制之信號(hào)的保存與處理技巧分享
本文旨在為廣大Linux學(xué)習(xí)者提供一份詳盡而實(shí)用的指南,幫助他們深入理解Linux中的信號(hào)機(jī)制,掌握信號(hào)的保存與處理技巧,我們將從信號(hào)的基本概念出發(fā),逐步深入到信號(hào)的捕獲、保存、處理以及恢復(fù)等各個(gè)環(huán)節(jié),通過(guò)生動(dòng)的實(shí)例和詳細(xì)的解釋,讓讀者能夠輕松掌握2024-10-10Linux下利用python實(shí)現(xiàn)語(yǔ)音識(shí)別詳細(xì)教程
早期語(yǔ)音識(shí)別系統(tǒng)僅能識(shí)別單個(gè)講話者以及只有約十幾個(gè)單詞的詞匯量?,F(xiàn)代語(yǔ)音識(shí)別系統(tǒng)已經(jīng)取得了很大進(jìn)步,對(duì)于 Python 使用者而言,一些語(yǔ)音識(shí)別服務(wù)可通過(guò) API 在線使用,且其中大部分也提供了 Python SDK,感興趣的小伙伴可以參考閱讀2023-03-03Linux一個(gè)增強(qiáng)的截圖及分享工具:ScreenCloud
今天小編就為大家分享一篇關(guān)于Linux一個(gè)增強(qiáng)的截圖及分享工具:ScreenCloud,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2018-10-10Apache 配置多端口 多虛擬主機(jī) 局域網(wǎng)訪問(wèn)示例
這篇文章主要介紹了Apache如何配置多端口 多虛擬主機(jī) 局域網(wǎng)訪問(wèn),需要的朋友可以參考下2014-05-05