2018年10月26日金曜日

【22】AICの作成

こんばんは。
今日も勉強する社会人の夜が始まりました!
今日は東京の道場のほか、京都とロンドンから参加しています〜(ワオ〜)

まず、AtoMの話から〜(^..^)/

今師匠がAtoMメニューの日本語を修正しているとのことです。
まだメニューの和訳が完全ではないので、師匠がそれを修正してくださっています。ArtifectureからAtoMをインストールするだけでは、日本語がまだ完全ではありません。AtoMの中には、日本語化するためのファイルがいくつかありますが、その中で指定されている日本語を直してあげれば、現在の変な日本語訳を変更することができます。しかし、Artifectureで指定したファイルだけでは足りないとのことです。

また、英語に訳語を当てはめるだけでは意味がおかしい場合もあるので、微調整が必要です。

例えば、英語の日本語訳を入れ替えるだけにしてしまうと
英文:A is succeeded by B 
和文:Aによって引き継がれるB
のようになります。

そのため、メニューを見ながら日本語を確認する必要があります。もし、きちんとした日本語訳ができて、それをArtifectureに提供すれば、将来はダウンロードするだけでより完成度の高い日本語版を皆が使えるようになります。(その時を楽しみにしましょう!)

ではでは、今日の本番ですが、ArchivematicaでAICを作成します〜

マニュアルはここ↓

今日は上記のマニュアル通りやってみることにします!
素直にマニュアル通りに作業を進めると、問題なくAICのを作成する事ができました。ArchivemeticaがあるPCではうまく動かず、途中で別のPCを使うなど、若干手間はかかりましたが、マニュアルに問題がない事の確認ができました。(笑)

なので、AICの作成は、マニュアル通りやってくださいね〜 (これだけ?)


========================
次回
Archivematicaの機能でやったことないもので遊んでみます(appraisalとか)。
Archivemeticaの機能とOAISで指定している機能がどのように対応しているかを勉強します。







2018年10月5日金曜日

【21】DIPのアップロード&CSVでの追記(成功版)

勉強会の日雨が多いのは、ここに雨男がいるからなのかもしれません。(* ̄m ̄)
今日は、風邪も流行り初めたせいで欠席もあり、少人数で始めます!

前回の話し
AtoMでCSVを再登録するときに、画像がなくなるのは、CSVに出てくるURLの画像を探せないのでは?もしくは再登録する時のオプションのせい?

実験1
CSVのテンプレートにあるdigitalObjectURI項目をdigitalOpjectPathへ変更して登録してみます(こういう方法もあるらしいです)。(usr/…にあるフォルダに、確かに画像ファイルが存在することも確認しました。)登録してみた結果、やはり再登録すると画像が登録されませんでした。

コマンドラインで画像ファイルをよくよくみると、一つの画像ファイルに対して、サムネイルが2つ生成されるようです(もちろんファイル名はすべて異なる)。CSVで再登録する時に入れるファイルは、もとの画像ファイルのURIだけなので、サムネイルは探せないのが当然なのでは?とういう話がでました。

Danさんが教えてくれたのは、サムネイルをregenerateする方法です(前回のブログを参考にしてね)。すべてのサムネイルを再生成するらしい。バックアップを取った際にもサムネイルを再生成する必要があるので、そういうときにDanさんが教えてくれた方法を試す必要があるかもしれません。(今日の作業では、どうも原因が違う気がしたため、試していません。)

このことを総合して考えると、画像がなくなることの原因のもう一つとして、再登録する際にreplaceしているからかもしれないことに気づきました。つまり、追加された部分だけをupdateするのではなく、すべてをreplaceしてしまうので、もとの画像とのつながりが保持できないのでは?ということです。


ここで再登録する再のオプションをupdateにして、実験します。
すべての実験では、以下の作業は同じです。

  1. ArchivemeticaでDIPを作成
  2. AtoMのあるフォンドに目かけてDIPをアップロード
  3. CSVを出力
  4. reference codeの列は不要なので削除、第二条件を合わせる
  5. 第一条件と他のどこかを追記する

実験2
update matches and ...のオプションにして、LegacyIDとCSVの名前を決めて、再登録します。前の実験は、replace してしまっているので画像がなくなっているけど、今回のオプションでは画像が残るのではないかという推測です。

結果画像がちゃんと残って追記できました。


実験3
今度は追記成功したCSVを出力して、第一条件をあわせて、第二条件を変更してupdateがちゃんとできるかを確認します。title名だけを変更して、update matches and ... オプションにチェックを入れて登録してみます。

問題:一つだけtitleが変更されませんでした。
原因:5つのデータの中で、2つのidentifierが重複していました。更新されなかった1つのデータは、identifierを直して何度登録しても更新に失敗しました。
結果:一回間違えた操作をすると更新がうまくできなくなるので、注意が必要かもしれません。


実験4
実験3を正しく再度試します。今回は、DIPを作成してAtoMへアップロードする手順は省略してAtoMだけで試します。第一条件をあわせて、第二条件を変更して追記ができるかやってみます。この作業は、すでに第一条件(Legacy ID, CSV名)が決まっていることが前提です。

問題:何故かデータが新たに作成されました。
推測:CSVを登録する再に、作業中のCSVを開いたままやっているけど、問題ないか?システムでは作業中のCSVがそのまま登録されるということはなんか変で、何かしら区別をつけるはずという推測で(つまり、CSV名が同じではないので追記されてしまう)、CSVを閉じてから再登録してみます。
結果:新しく追加されず、ちゃんと追記されました。やはり、CSVを開いたまま同一ファイルを登録することは影響があるようです。


今日のまとめ
  • LegacyIDはCSVを登録したときに登録される。なので、DIPをアップロードしただけではLegacyIDはAtoMに登録されない。
  • 第二条件をあわせて、LegacyID, CSV名を決めて、update matches and...のオプションでCSVを登録する。このときのIDとCSV名はきちんと保存管理する必要がある。
  • 次回の追記作業は、このCSVファイルを利用して行う。CSVをAtoMからexportする必要はない。(exportしたものを使う場合は、referece code例が追加されているので削除し、Legacy ID, CSV名もexport時のものは削除して、元のファイルに一致させてから使う必要がある。)


気づいた注意点

  • CSVは開いたままでもAtoMに登録することができるが、どうもエラーの原因になっているよう。必ず閉じてから登録する。
  • 第一条件、第二条件が矛盾る操作をしてしまうと、データが狂って予想以外の動作をする可能性がある(今回は、identifierの重複でデータがおかしくなりました)ので、注意する。
  • AtoMは目録の公開用なので、登録したCSVの管理や、LegacyIDの管理は組織でやらなければならない。CSVは一回登録したら名前を変えないようにする(更新の時には、古いバージョンの方の名前を変えるなど)。


原因不明のエラー
ArchivemeticaからAtoMの階層情報を読み込めず、edit metadataから階層設定ができない現象。以前にも同じことが起こって急に直ったのですが、今回も同様。原因不明です。


まだ残った疑問
CSVをexportした再に出てくるLegacyID項目の番号(本当のLegacyIDではない)がなぜ必要かがわからない。


今日はなんとなく結論を導き出すことができました。結構色々遠回りもしましたが、それがあって今日の結論に至ったと思います。とういうことで、今日は割と効率よく作業を進めることができました!
ハッピー v(^o^ )ー~) ニヤ


=======================
次回
AICについて勉強します。
実務を考えながらユーザーマニュアルを作成するステップに進みます〜 イェーイ~




最近の投稿

【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む

 Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...

人気の投稿