2020年5月1日金曜日

【54】ePADD(Processing + Discovery module)

今日の勉強会もZoomで進めます。
京都組は、お腹を壊していた人もいたのに、さっそくハンバーガーにビールを手にして現れました。笑 

今日もePADDの続きです~ マニュアルは↓

ePADD User Manual
https://docs.google.com/document/d/1CVIpWK5FNs5KWVHgvtWTa7u0tZjUrFrBHq6_6ZJVfEA/edit#heading=h.3znysh7

文字コードについて
まずは、文字コードに関する議論から入りました。
メールを送受信する際の、文字コードについて理解する必要があるようです。そこで、メールのメッセージソースを見てみることにします。そこには、どういう文字コードで送受信したかが記録されているとのことですが… 先生の説明を消化できぬ我々でございます。汗

ということで、以下の記事が参考になりそうなので、皆勉強しましょう。

日本語メールの仕組み
https://sendgrid.kke.co.jp/blog/?p=10958

メールの文字コードを理解する
https://www.atmarkit.co.jp/ait/articles/0602/18/news009.html


Entitiesの数がModuleで異なる件
ということで、今日のePADDは日本語なしで試します。
今日は、前回Discovery Moduleへ入れたメールを見るところから続けます。しかし、Entitiesの数はAppraisal Moduleでは216ですが、Processing Module, Discovery Moduleでは228で、数が増えています。なぜでしょう… 

この原因は色々考えても答えが出ず時間だけが過ぎたので、スキップすることにしました。次回何かでひらめくことを期待します。

非公開設定問題
前回モリヤさんから来たメールに、公開制限を付けたものが見えなくなった問題に移ります。

非公開設定の変更は、時間が過ぎてもDiscovery Moduleに自動で反映されるのではなく、Appraisal Moduleで設定を変える仕様になっているようです。しかし、前回我々はProcessing Moduleで公開制限を設定したので、一旦そこに行って制限を解除します。

作業順番です。
  1. Discovery moduleで変更し、保存
  2. Discovery moduleでエクスポートします。
  3. エクスポートしたデータは「ePADD  archive of hoei-epadd-demo-Discovery」 フォルダーへ保存されます。
  4. それを、Discovery moduleが参照する「epadd-discovery」フォルダーへコピーペーします。
  5. その後、Discovery moduleを再度開きます。

これで、制限が解除されメールが読めるようになりました。

ここで

気づき1つ目
公開の制限はマニュアルではAppraisalで行うようになっています(Guiede3.3)。しかし、Processing Moduleでもその機能が含まれているので(Guide4.3)、非公開の設定は可能です。で、我々がProcessing Moduleで設定をしたわけです。

同じことが両Moduleでできるのは、どうしてでしょう?おそらく、ドナーがAppraisal moduleで色々設定をした場合、アーキビストはProcessing Moduleでそれをドナーと相談して変更するためだと思われます。

気づき2つ目
しかし、アーキビストは大量のメールの公開期間をどうやって確認するのでしょうか。自動で教えてくれる機能がないと、やってられない気が… Moduleを行ったり来たりすることが少し面倒のようにも思われますが、それくらい気を付けて行う作業であることを意味しているようにも思われます。これについては、もう少し調べる必要があるようです。

---------------------------------
次回
2020年5月8日(金)19:00~
ePADDの続きです。英語のメールデータを入れてみましょう。
Lexiconはここです。
https://library.stanford.edu/projects/epadd/community/lexicon-working-group

その次は、Bitcuratorについて勉強します
http://bitcurator.net/bitcurator-nlp/


最近の投稿

【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む

 Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...

人気の投稿