今日も以下を見ながら勧めましょう。
bitcurator-access-redaction Quick Start Guide
https://distro.ibiblio.org/bitcurator/docs/BCR-Quickstart.pdf
Githubのマニュアル
https://github.com/BitCurator/bitcurator-access-redaction
夏休みが終わりました。参加者は、前回のことを何にも覚えてません。ちゃんと休めたという証拠です。
次のマニュアルを見ながら、プライバシー関係または個人識別情報の自動墨消しの機能を確認していきます。
bitcurator-access-redaction Quick Start Guide
https://distro.ibiblio.org/bitcurator/docs/BCR-Quickstart.pdf
Githubのマニュアル
以下、ページ数は、上記PDFファイルのものです。
前回の作業で、テスト用のイメージファイルが作成されています。test_image.rawです。
墨消しの前にイメージファイルの内容を確認します(p. 8)。
右クリック、Scripts > Image Mount を選択し、イメージファイルをマウントして、GUIで内容を見ることができます。もちろん、Read onlyで、内容変更できません。
テストの簡略化のため、処理するtest_image.rawをデスクトップに移動(p. 9)。
$ cp ~/bca-redtools-X.X.X/libredact/test/test_image.raw ~/Desktop
GUI上でのマウス操作でも構いません。
fiwalkをtest_image.rawにかける。
$ fiwalk -f -X ~/Desktop/test_image_fw.xml ~/Desktop/test_image.raw
fiwalkはこちらhttps://confluence.educopia.org/display/BC/Generate+Filesystem+Metadata+as+DFXML。
ファイルを分析し、メタデータをxmlファイルで作成します。
前回、あまり理解できなかった墨消しの環境設定にトライします。
test_image.raw用に作られたp. 14の事例を一つずつ試していきます。
test_image_config.txtの作成の仕方はこちら。
$ cd ~/desktop
$ vi test_image_config.txt
test_image_config.txtにp. 14をコピーペーストしました。
1行目の
# Targets The Whale.txt
FILE_NAME_MATCH *Whale.txt FUZZ
のみを確認しようと思います。FUZZ(ぼやかす)の意味が不明なので、やってみて理解するつもりです。
次の命令文で実行します。
$ redact-cli -c ~/Desktop/test_image_config.txt
Note! In the BitCurator Environment, both Python 2.7 and Python 3.5 are installed, and the "pip" command links to Python 3.5 version of pip. You must use "pip2" to install with Python 2.7 (currently required due to a dependency on pylightgrep).
# インプットするファイルの指定
INPUT_FILE /home/bcadmin/Desktop/test_image.raw
# 事前に作成したDigital Forensic XMLファイルの指定
DFXML_FILE /home/bcadmin/Desktop/test_image_fw.xml
# アウトプットフアィルの指定
OUTPUT_FILE /home/bcadmin/Desktop/test_image_redacted.raw
# Targets The Whale.txt
FILE_NAME_MATCH *Whale.txt FUZZ
# Targets Dorian Gray.txt
FILE_MD5 114583cd8355334071e9343a929f6f7c FILL 0x44
# Targets DRINKME.TXT
FILE_SHA1 7f9f0286e16e9c74c992e682e27487a9eb691e86 FILL 0x44
# Fill Kafka sequences in Metamorphsis.txt with K
SEQ_EQUAL Kafka FILL 0x4B
# employmentなんとかのファイルにある社会保障番号のようなものを0x44(ASCIIではアルファベットD)で埋める
SEQ_MATCH \d{3}-?\d{2}-?\d{4} FILL 0x44
# Scrub EATME.TXT
FILE_SEQ_EQUAL pineapple-upside-down-cake SCRUB
# Scrub Alice in Wonderland
FILE_DIRNAME_EQUAL looking-glass SCRUB
# Ignore EATME.TXT.BACKUP
IGNORE *.BACKUP
# Commit the redaction (write out a redacted disk image)
COMMITRule Command Format: [target condition] [action]
Target Conditions:FILE_NAME_EQUAL <filename> - target a file with the given filenameFILE_NAME_MATCH <pattern> - target any file with a given filename patternFILE_DIRNAME_EQUAL <directory> - target all files in the directoryFILE_MD5 <md5> - target any file with the given md5FILE_SHA1 <sha1> - target any file with the given sha1FILE_SEQ_EQUAL <string> - target any file that contains <a string>FILE_SEQ_MATCH <pattern> - target any file that contains a sequence matching <a pattern>SEQ_EQUAL <string> - target any sequences equal to <a string>SEQ_MATCH <pattern> - target any sequences matching <a pattern>
Actions:SCRUB overwrite the bytes in the target with zeroesFILL 0x44 overwrite by filling with a given character (here, 0x44, or ASCII 'D')FUZZ fuzz the binary, but not the strings 
例えるなら、VirtualBoxが「野球場」でVagrantが、チームごとの「マネジャー」です。
野球場があれば、人数さえ揃えばどこでも野球をすることができます。でも、チームごとのマネジャーがいれば、どのような場合に、どのようなプレーをするかメンバーで共有することができますし、チームメンバーのコンディションを管理してくれます。これによって、効率的に試合を進められることができます。
同じように、VirtualBoxがあればどこでも仮想環境を構築することができるけど、Vagrantがあれば、チームメンバーのコンディションを管理・把握した上で、同じ開発で環境を進めることができます。(https://qiita.com/kenju/items/00050972fdf74e37e71f から引用)
Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...