京都組は、お腹を壊していた人もいたのに、さっそくハンバーガーにビールを手にして現れました。笑
今日もePADDの続きです~ マニュアルは↓
ePADD User Manual
https://docs.google.com/document/d/1CVIpWK5FNs5KWVHgvtWTa7u0tZjUrFrBHq6_6ZJVfEA/edit#heading=h.3znysh7
文字コードについて
まずは、文字コードに関する議論から入りました。
メールを送受信する際の、文字コードについて理解する必要があるようです。そこで、メールのメッセージソースを見てみることにします。そこには、どういう文字コードで送受信したかが記録されているとのことですが… 先生の説明を消化できぬ我々でございます。汗
ということで、以下の記事が参考になりそうなので、皆勉強しましょう。
日本語メールの仕組み
https://sendgrid.kke.co.jp/blog/?p=10958
メールの文字コードを理解する
https://www.atmarkit.co.jp/ait/articles/0602/18/news009.html
Entitiesの数がModuleで異なる件
ということで、今日のePADDは日本語なしで試します。
今日は、前回Discovery Moduleへ入れたメールを見るところから続けます。しかし、Entitiesの数はAppraisal Moduleでは216ですが、Processing Module, Discovery Moduleでは228で、数が増えています。なぜでしょう…
この原因は色々考えても答えが出ず時間だけが過ぎたので、スキップすることにしました。次回何かでひらめくことを期待します。
非公開設定問題
前回モリヤさんから来たメールに、公開制限を付けたものが見えなくなった問題に移ります。
非公開設定の変更は、時間が過ぎてもDiscovery Moduleに自動で反映されるのではなく、Appraisal Moduleで設定を変える仕様になっているようです。しかし、前回我々はProcessing Moduleで公開制限を設定したので、一旦そこに行って制限を解除します。
作業順番です。
- Discovery moduleで変更し、保存
- Discovery moduleでエクスポートします。
- エクスポートしたデータは「ePADD archive of hoei-epadd-demo-Discovery」 フォルダーへ保存されます。
- それを、Discovery moduleが参照する「epadd-discovery」フォルダーへコピーペーします。
- その後、Discovery moduleを再度開きます。
これで、制限が解除されメールが読めるようになりました。
ここで
気づき1つ目
公開の制限はマニュアルではAppraisalで行うようになっています(Guiede3.3)。しかし、Processing Moduleでもその機能が含まれているので(Guide4.3)、非公開の設定は可能です。で、我々がProcessing Moduleで設定をしたわけです。
同じことが両Moduleでできるのは、どうしてでしょう?おそらく、ドナーがAppraisal moduleで色々設定をした場合、アーキビストはProcessing Moduleでそれをドナーと相談して変更するためだと思われます。
気づき2つ目
しかし、アーキビストは大量のメールの公開期間をどうやって確認するのでしょうか。自動で教えてくれる機能がないと、やってられない気が… Moduleを行ったり来たりすることが少し面倒のようにも思われますが、それくらい気を付けて行う作業であることを意味しているようにも思われます。これについては、もう少し調べる必要があるようです。
---------------------------------
次回
2020年5月8日(金)19:00~
ePADDの続きです。英語のメールデータを入れてみましょう。
Lexiconはここです。
https://library.stanford.edu/projects/epadd/community/lexicon-working-group
その次は、Bitcuratorについて勉強します
http://bitcurator.net/bitcurator-nlp/