曾多次想要在 Linux 下比較目錄 a 和目錄 b 中檔案列表的差別,然後對目錄 a 比目錄 b 中多出的檔案、少掉的檔案分別做處理。但是,在網上搜尋了多次也都沒找到能直接處理好的工具。
所以想了很多不少方法,自我感覺都不錯,而且網上似乎沒有這方面的文章,所以分享出來給大家。如果各位有更好的工具或者方法,盼請留下說明 (本文第 2 部分:圖形化的比較結果蒐集自網上,我也沒有在圖形化介面下操作的需要,所以沒有多做介紹)
以下是本文有些地方涉及到的目錄結構。
[root@node1 ~]# tree directory1 directory2
directory1
├── 1.png
├── 2.png
└── 3.png
directory2
├── 2.png
├── 3.png
└── 4.png
1. 命令列輸出的結果
方法一:使用 diff
diff -r directory1 directory2
但是 diff 會對每個檔案中的每一行都做比較,所以檔案較多或者檔案較大的時候會非常慢。請謹慎使用。
方法二:使用 diff 結合 tree
diff <(tree -Ci –noreport /mnt/f/自然馬) <(tree -Ci –noreport /mnt/i/自然馬) < /mnt/f/自然馬 — > /mnt/i/自然馬
87a88
> xyz.avi
488d488
< rsync.txt 534d533 < 542D0.mp4 說明: 1.tree的-C選項是輸出顏色,如果只是看一下目錄的不同,可以使用該選項,但在結合其他命令使用的時候建議不要使用該選項,因為顏色也會轉換為對應的編碼而輸出; 2.-i是不縮排,建議不要省略-i,否則diff的結果很難看,也不好繼續後續的檔案操作; 3.–noreport是不輸出報告結果,建議不要省略該選項。 4. 該方法效率很高。 方法三:find結合diff find directory1 -printf “%Pn” | sort > file1
find directory2 -printf “%Pn” | sort | diff file1 –
2d1
< 1.png 4a4 > 4.png
說明:
1.<代表的行是directory1中有而directory2沒有的檔案,>則相反,是 directory2 中有而 directory1 中沒有。
2. 不要省略-printf “%Pn”,此處的%P 表示 find 的結果中去掉字首路徑,詳細內容 man find 。例如,find /root/ -printf “%Pn” 的結果中將顯示/root/a/xyz.txt 中去掉/root/後的結果:a/xyz.txt 。
3. 效率很高,輸出也簡潔。
如果不想使用-printf,那麼先進入各目錄再 find 也行。
[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1)
[root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -)
2d1
< ./1.png 4a4 > ./4.png
上面將命令放進括號中執行是為了在子 shell 中切換目錄,不用影響當前所在目錄。
方法四:使用 rsync
rsync -rvn –delete directory1/ directory2 | sed -n ‘2,/^$/{/^$/!p}’
deleting a/xyz.avi
rsync.txt
新建資料夾/542D0.mp4
其中 deleting 所在的行就是 directory2 中多出的檔案。其他的都是 directory 中多出的檔案。
如果想區分出不同的是目錄還是檔案。可以加上”-i” 選項。
rsync -rvn -i –delete directory1/ directory2 | sed -n ‘2,/^$/{/^$/!p}’
*deleting  a/xyz.avi
>f+++++++++ rsync.txt
>f+++++++++ 新建資料夾/542D0.mp4
其中>f+++++++++中的 f 代表的是檔案,d 代表的目錄。
上面的 rsync 比較目錄有幾點要說明:
1. 一定不能缺少-n 選項,它表示 dry run,也就是試著進行 rsync 同步,但不會真的同步。
2. 第一個目錄 (directory1/) 後一定不能缺少斜線,否則表示將 directory1 整個目錄同步到 directory2 目錄下。
3. 其它選項,如”-r -v –delete” 也都不能缺少,它們的意義想必都知道。
4.sed 的作用是過濾掉和檔案不相關的內容。
5. 以上rsync假定了比較的兩個目錄中只有普通檔案和目錄,沒有軟連結、塊裝置等特殊檔案。如果有,請考慮加上對應的選項或者使用-a替代-r,否則結果中將出現skipping non-regular file的提示。但請注意,如果有軟連結,且加了對應選項(-l或-a或其他相關選項),則可能會出現fileA–>fileB 的輸出。
6. 效率很高,因為 rsync 的原因,篩選的可定製性也非常強。
2. 圖形化的比較結果
方法一:使用 vimdiff
vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort) # 或者 vimdiff <(find directory1 -printf “%Pn”| sort) <(find directory2 -printf “%Pn”| sort) 方法二:使用meld meld是python寫的一個圖形化檔案/目錄比較工具,所以必須先安裝圖形介面或設定好圖形介面接受協議。它的功能非常豐富,和win下的beyond compare有異曲同工之妙。 meld具體的使用方式就不介紹了。 3. 將兩目錄中不同的檔案篩選出來 個人建議使用命令列輸出的結果中的方法方法三和方法四,因為它們都能很好地保留目錄字首。 以方法三為例: find directory1 -printf “%Pn” | sort > file1
find directory2 -printf “%Pn” | sort | diff file1 –
以下是實驗所需目錄結構:
[root@node1 ~]# tree /root/a;tree /root/b
/root/a
├── 1.png
├── 2.png
└── 3.png
0 directories, 3 files
/root/b
├── 2.png
├── 3.png
├── 4.png
└── xen
└── scripts
└── block-drbd
首先比較這兩個目錄得到檔案列表的差異。
find /root/a -printf “%Pn” | sort > /tmp/file1
find /root/b -printf “%Pn” | sort | diff /tmp/file1 – >diff.txt
然後從 diff.txt 中過濾出/root/a 中多出的檔案和/root/b 中多出的檔案。
# /root/a 中多出的檔案
awk ‘//{printf(“%s%sn”,”/tmp/etc/”,$2)}’ diff.txt
/tmp/etc/4.png
/tmp/etc/xen
/tmp/etc/xen/scripts
/tmp/etc/xen/scripts/block-drbd
需要注意的是,如果多了某個目錄,則這個目錄和其內所有檔案都會列出來。如果要將多出的檔案複製到其他地方,應當要注意這一點。
如果只想要比較出/root/a 和/root/b 下的檔案和目錄的不同,不再遞迴到子目錄中比較。那麼可以在 find 上繼續加工一番:
find /root/a -maxdepth 1 -printf “%Pn” | sort > /tmp/file1
find /root/b -maxdepth 1 -printf “%Pn” | sort | diff /tmp/file1 – >diff.txt
# /root/a 中多出的檔案
awk ‘//{printf(“%s%sn”,”/tmp/etc/”,$2)}’ diff.txt
/tmp/etc/4.png
/tmp/etc/xen
這樣一來,/root/b 中多出的檔案就是 4.png 和 xen,xen 目錄中的檔案不再列出。