2018年8月25日土曜日

【18】AtoMへCSVで追記

めずらしく、いや、いつものことですが、ぼーとしている頭で道場始まりました。夏バテに一週間の疲労がピークに達している金曜日なのです。ということで、今日のブログは適当に書きます〜(笑)

前回の作業を思い出すのにおよそ30分が経過。(ほら、大丈夫かい?)
でもなかなか次のステップがわからず(笑)、前回のブログに書いてある次回の作業を素直にまずやってみることになりました。

今日の作業
DIPを作成し、AtoMにいれ、CSVを出して、また入れます。(本当にざっくりですみません)

つまり、
1)ArchivemeticaからAtoMにDipをいれる
2)AtoMからCSVをexport
3)そのcsvをAtoMにimport
4)この時、注意するオプション

  • update optionにチェック
  • file nameはexportしたときのnameをそのまま使う

です。

【実験1】
AtoMのターゲットfonds:shumutam(シリーズ1個)
ここに、Archivemeticaから作成したDIPを、アップロード。ここまではいつもの通りで、ちゃんとshumutamにシリーズが反映されました。

なので、CSVをexportします〜

そのCSVに編集を加えず、update optionにチェックして、出した時のファイル名をそのまま使ってimportしてみます〜 (え~と、この作業の目的がなんだったのか、記憶が曖昧ですが、とにかく今日は素直にやります。)

結果、ターゲットのフォンドに新しいシリーズが追加されました。exportされたCSVにあるlegacy IDをそのままimportしているので、新しいシリーズとして認識されました。(まぁ、当然のことか・・・)

しかし、CSVにちゃんと入れた画像のリンクがAtoMに反映されませんでした。しかも、複数あるなか、一番目の画像のURLだけが反映されました。(ほぉ~(*゚с゚*) 実に不可解だ~)

【実験2】
そこで、第2案として前回のブログにある「後日追記」を試してみることにしました。
https://irisawadojo.blogspot.com/2018/08/2018-08-1dipatom.html

exportしたCSVには、フォンドのsource idだけをkeymapから探して入力し、ほかは我々が決めて書き換えてしまう方法です。そこで、フォンド以外のデータのlegacy IDに、shumuta2, 3, 4を入れてみました。そしてreplaceのoptionにチェックしてimport(これは追記ではなく書き換えです)。

じゃじゃん〜

しかし、ここでよくわからず、skip unmatched records にチェックを入れたらunmatched dataがdeleteされ(ココまではOK)、replaceができませんでした(これはダメ)。なので、CSVで入れようとしたデータが登録されませんでした。(えへへ〜〜 実際登録する際には注意しましょう!)

とういうことで、CSVを再度アップロードしました。

じゃじゃん〜

結果、ちゃんと決めたLegacy IDで登録されました。


  ※ただいま議論中~ (何となく雰囲気伝わりますか? ^^;)

【今日の結論】
  1. DIPをAtoMのターゲットフォンドにuploadした時点では、AtoMにデータは反映されるが、legacy IDはまだない。keymapを見るとまだフォンドのlegacy ID(keymap上ではsource ID)しかないことがわかる。
  2. その状態で、CSVをexportし、title, identifier, repository(第2条件)を合わせて、Legacy IDとsource file name(第一条件)は我々が決める。
    今日の実験では、フォンドのlegacy IDを一致させましたが、結局最初DIPを入れる際には、各レポジトリで管理するlegacy IDをここで初めて指定するのが一般的だと考えられるので、upload時にデータを同定する第1条件は考えず、第2条件を合わせればOKなのではというのが今日の発見です。つまり、フォンドのlegacy IDも我々が決めれば大丈夫。
  3. importする際には、ignore matches and create new...(後日追記:これはDelete matches and replace with imported records..の間違いです)のoptionにチェックして、フォンドを書き換える。この時点で、指定したlegacy ID, source file nameがkeymapに登録される。
  4. 次は、今のsource fileに(今度は、第一条件を合わせれば良い)archival descriptionをガンガン書いて、追記するoptionにチェックして(replaceでの問題ないような気がしますが…)AtoMへアップロードすれば、DIPを入れることができる・・・・・・・かな?

そこで、誰かが言いました。
「でも~~ 画像が読み込めないのはつらいですね!」
その通りです。

archivemeticaにある画像のURLを確認し、CSVにURLをちゃんと入力して、再度AtoMにCSVをimportしてみましたが、やはり失敗しました。

ここで時間切れです。
ガソリンを入れて、栄養も取らないと長く走れませんので。大事です。では、次回をお楽しみに!

====================
次回
今日の復習(欠席した人のためにですよ!皆来て~)
画像が行方不明になる理由を考えます。




最近の投稿

【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む

 Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...

人気の投稿