2020年6月6日土曜日

【58】Bitcurator モジュールNLPを試す…が!!!

世の中は通常モードに戻りつつあるようですが、道場は今日もリモートで勉強会です。作業の性格上、リモートの方がいいのかもしれませんが…
ということで、今日も初めていきます!

Bitcurator NLPを試す

前回、Bitcuratorの一連の作業を確認し、続けてモジュール・NLPのダウンロードで終了しました。その続きです。
一応の確認ですが、NLPについては、
概要: https://bitcurator.net/bitcurator-nlp/
Wiki: https://github.com/bitcurator/bitcurator-nlp/wiki
ダウンロード・作業手順: https://github.com/bitcurator/bitcurator-nlp-gentm
を確認してください。
以下は、作業手順に沿って進めていきます(いきたかった)。

Disk Image Selection and Configuration

ここでは、対象となるディスク・イメージを選択しますが、今回は、標準で入っているサンプル・イメージを使用することにしましたので、この作業はスキップします。オリジナルのディスク・イメージを使用する場合は、
/home/bitcurator-nlp-gentm/config.txt
を開き、テキストを修正・加筆します。
例)[image_section]
govdocs45sampler.E01 = 1     ⇨⇨⇨⇨     [my-image-name1].E01 = 1 
※[]括弧内を対象ファイルの名前にします。

Running the Tool

それでは、NLPを動かします。ターミナルを開き、
$ python bcnlp_tm.py
でGO!
ImportError: No module named pytsk3
あれ…あれれ…エラー…メッセージです。"pytsk3"が無いということらしいです。
ここから本日の道場は、流浪します。そうです。久しぶりの
"STUCK"
です。

エラーの分析

そこで、ダウンロードしたはずのモジュールがないというならば、改めてダウンロードしてみようということになり、
$ sudo ./setup.sh
を再度実行しました。そこで、インストールの流れを確認したところ、
  1. ディレクトリの権限問題
    The directory '/home/bcadmin/.cache/pip/http' or its parent directory is not owned by the current user and the cache has been disabled. Please check the permissions and owner of that directory. If executing pip with sudo, you may want sudo's -H flag.
  2. セットアップで指示されているファイルが無い
    STATUS: nlp-webtools: Building and installing libuna
    rm: cannot remove 'libuna-alpha-20170112.tar.gz': No such file or directory
  3. モジュールがない
    STATUS: nlp-webtools: Building and installing The Sleuth Kit
    fatal: not a git repository (or any of the parent directories): .git
  4. pythonのバージョンがサポート外かもしれない
    Complete output from command python setup.py egg_info:  Unsupported Python version: 2.7.17 (default, Apr 15 2020, 17:20:14)
     [GCC 7.5.0], version 3.5 or higher required.
などの、エラーを確認し、それぞれの検証をした結果、

  1. ディレクトリの権限をrootにするために下記のコマンドを実行した結果、解決
    $ sudo chown -R root /home/bcadmin/.cache/pip/
  2. 'libuna-alpha-20170112.tar.gz'は"setup.sh"を見ると無くても問題ない
     l.187: # Newer versions break a lot of stuff. Keep 20150927 for now.
  3. 分からず
  4. 後に調べてみると、python2は2.7が最後となっていることがわかりました。がこれが問題なのかどうかはわかりません。検証が必要
との結果に。いろいろと試してみましたが…どれも宿題となります。
また、BitcuratorをインストールしたVMにNLPをインストールすることが問題なのでは?といった意見も出ましたが、未検証です。

ということで、今回の作業は終わりです。

次回は、6月19日19時からとなります。
世の中が通常モードにもどりつつありますが、強制参加ではありませんので、時間があるときに顔を出していただければ!
ということで、次回お目にかかりましょう!

最近の投稿

【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む

 Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...

人気の投稿