Linux怎么清除文件中的隱私數(shù)據(jù)
我們平時(shí)創(chuàng)建的文件、圖片都包含著很多信息,很容易被人利用,所以要清除文件中的元數(shù)據(jù),以保護(hù)個(gè)人隱私。下面學(xué)習(xí)啦小編就給大家介紹下如何清除文件中的隱私數(shù)據(jù),一起來(lái)學(xué)習(xí)下吧。
典型的數(shù)據(jù)文件通常關(guān)聯(lián)著“元數(shù)據(jù)”,其包含這個(gè)文件的描述信息,表現(xiàn)為一系列屬性-值的集合。元數(shù)據(jù)一般包括創(chuàng)建者名稱(chēng)、生成文件的工具、文件創(chuàng)建/修改時(shí)期、創(chuàng)建位置和編輯歷史等等。幾種流行的元數(shù)據(jù)標(biāo)準(zhǔn)有 EXIF(圖片)、RDF(web資源)和DOI(數(shù)字文檔)等。
雖然元數(shù)據(jù)在數(shù)據(jù)管理領(lǐng)域有它的優(yōu)點(diǎn),但事實(shí)上它會(huì)危害你的隱私。相機(jī)圖片中的EXIF格式數(shù)據(jù)會(huì)泄露出可識(shí)別的個(gè)人信息,比如相機(jī)型號(hào)、拍攝相關(guān)的GPS坐標(biāo)和用戶(hù)偏愛(ài)的照片編輯軟件等。在文檔和電子表格中的元數(shù)據(jù)包含作者/所屬單位信息和相關(guān)的編輯歷史。不一定這么絕對(duì),但諸如metagoofil一類(lèi)的元數(shù)據(jù)收集工具在信息收集的過(guò)程中常最作為入侵測(cè)試的一部分被利用。
對(duì)那些想要從共享數(shù)據(jù)中擦除一切個(gè)人元數(shù)據(jù)的用戶(hù)來(lái)說(shuō),有一些方法從數(shù)據(jù)文件中移除元數(shù)據(jù)。你可以使用已有的文檔或圖片編輯軟件,通常有自帶的元數(shù)據(jù)編輯功能。在這個(gè)教程里,我會(huì)介紹一種不錯(cuò)的、單獨(dú)的元數(shù)據(jù)清理工具,其目標(biāo)只有一個(gè):匿名一切私有元數(shù)據(jù)。
MAT(元數(shù)據(jù)匿名工具箱)是一款專(zhuān)業(yè)的元數(shù)據(jù)清理器,使用Python編寫(xiě)。它屬于Tor旗下的項(xiàng)目,而且是Live 版的隱私增強(qiáng)操作系統(tǒng) Trails 的標(biāo)配應(yīng)用。
與諸如exiftool等只能對(duì)有限種類(lèi)的文件類(lèi)型進(jìn)行寫(xiě)入的工具相比,MAT支持從各種各樣的文件中消除元數(shù)據(jù):圖片(png、jpg)、文檔(odt、docx、pptx、xlsx和pdf)、歸檔文件(tar、tar.bz2)和音頻(mp3、ogg、flac)等。
在Linux上安裝MAT
在基于Debian的系統(tǒng)(Ubuntu或Linux Mint)上,已經(jīng)打包好MAT,所以安裝很直接:
$ sudo apt-get install mat
在Fedora上,并沒(méi)有預(yù)先生成的MAT軟件包,所以你需要從源碼生成。這是我在Fedora上生成MAT的步驟(不成功的話(huà),請(qǐng)查看教程底部):
$ sudo yum install python-devel intltool python-pdfrw perl-Image-ExifTool python-mutagen$ sudo pip install hachoir-core hachoir-parser$ wget https://mat.boum.org/files/mat-0.5.tar.xz$ tar xf mat-0.5.tar.xz$ cd mat-0.5$ python setup.py install
使用MAT-GUI匿名元數(shù)據(jù)
一旦安裝好,通過(guò)GUI和命令行都可以使用MAT。輸入這個(gè)命令啟動(dòng)MAT的GUI:
$ mat-gui
嘗試清理一個(gè)包含如下內(nèi)置元數(shù)據(jù)的實(shí)例文檔文件(如private.odt)。
點(diǎn)擊“添加”按鈕來(lái)添加需要清理的文件到MAT中。一旦載入文件,點(diǎn)擊“確認(rèn)”按鈕對(duì)所有隱藏的元數(shù)據(jù)信息進(jìn)行掃描。
只要元數(shù)據(jù)被MAT檢測(cè)到,“State”狀態(tài)就會(huì)被標(biāo)記成“Dirty”。雙擊文件可以查看檢測(cè)到的元數(shù)據(jù)。
點(diǎn)擊“清理”按鈕來(lái)清除文件中的元數(shù)據(jù)。MAT會(huì)自動(dòng)清空文件中的所有私有元數(shù)據(jù)字段。
清除后的狀態(tài)中不包含任何私有可辨識(shí)的痕跡:
從命令行匿名元數(shù)據(jù)
$ mat -c 。
正如前面提到的,另一種調(diào)用MAT的方式是從命令行,使用mat命令可達(dá)到。
為了檢查任何敏感的元數(shù)據(jù),先前往文件所在的目錄,然后運(yùn)行:
$ mat -c 。
這樣會(huì)掃描當(dāng)前目錄和其子目錄下的所有文件,并報(bào)告它們的狀態(tài)(已清理或未清理)。