2018年5月25日金曜日

【12】AtoMからエクスポートしたCSVに追記してインポート

今日はイライラする中年女性2名とお送りします〜 (ーー;)
それに、勉強会始まる前からガソリンを入れたので、ちゃんと走ることを祈ります!(笑)

今日の目標は、AtoMからエクポートしたCSVに追記をしてインポートすることです!
関連するマニュアルはここ↓
https://www.accesstomemory.org/en/docs/2.4/user-manual/import-export/csv-import/#update-existing-descriptions-via-csv-import

====================================

おさらい〜〜
前回はarchivemeticaのDIPをそのままAtoMへConimalフォンドとして入力した。そのため、アーカイバル記述がない状態。今日はその記述をCSVで追記する。今までは、フォンドへ追記する際には、既存のデータをすべて空にしてからではないといけなかったが(追記ではなく上書きになるということかな)、空にしなくても変更になった部分だけをCSVで追記できるようになった。これは最近追加された機能なので、やった人はあまりないと思う。

本番に戻ります〜

まずConimalのデータをAtoMからエクスポートしましょう。
Manage jobsからConimal(前回入力したフォンド)のCSVをダウンロードする。

あれ?
ダウンロードをするとすべてのデータのCSVがエクスポートされた。


(一時期メモ不能・・・・なにやっているの皆〜〜〜 @..@ )

なんとか状況を把握したので、再開します。

本来は、Conimalフォンドのedit > administrative areaからsource nameの部分に元となるCSVのファイル名が表示されるはずだが、Conimalにはそれがなかった。
おそらくCSVを利用してデータ入力したのではなく、ArchivemeticaからDIPを入力したからかも。
(でもSource nameがないのはおかしいのでは? ーーa )


ではでは、CSVを利用してデータを入力して、source nameが現れるかやってみよう。

まず、エクスポートしたConimalのCR(Carriage Return)を消す。
方法は色々あるが、以下の2つでやってみた。
① unbuntuで新しい名前でCSVを保存し直すとCRが削除される。(へ〜コマンド打たなくてもいいんだ〜)
② CR削除してくれるアプリを利用して削除する。UTF-8へ変換しつつ、改行をLF(Line feed)にする。→つまり、Linuxで使う改行コードにしてあげること。(よくわからない人はhttps://irisawadojo.blogspot.jp/2018/05/csv-import.html をみてね!)


前処理をして、importしたが、失敗。
エラー:invalid script: cript   (はぁ? なに?)
→ CSVのscrip項目にcriptと入力したのが原因のよう。ISO15924の英語はラテン語のコードLatnを入れなければならない。でも今回はLatnを入れずに、scrip項目のデータは空白のままにした。

でもでも、またエラー。 (T..T)
(もうやめよう・・・)

しばし、議論です。

シーンとなったので、ちょっと整理しようと言ってみたが…
1名だけはい!と言ってくれました。ありがとう。 T.T

皆整理する気はまったくなく(笑)、議論は続き、CSVのフォンド名がないことに気づく。Lagacy IDとsource nameがマッチしない場合、title, repository, identifierの3つがマッチするかを見るとマニュアルにあったので、気になりConimalとフォンド名(titleがないってことかな?)を入力して再度インポートします。

でもでも、またエラー(しょぼん…ほら〜もうやめようってば〜)

最後は、マニュアルのせいにして終わるか。違うか。(へへへ)

それでも諦めず今度は、CSVのフォンド情報だけを入れて更新されるか確認します!
やっぱりだめ。

(だからもうやめようよ〜)

あれ、皆ちょっと喧嘩ぽくなったぞ(爆笑)

それでも諦めず、普通にCSVをインポートしてみたらインポートされた。まぁ、ここまでは当たり前だけど、managemet jobsのレポートを見ると、ちゃんとConimalにはなかった「id」というのが付与されている。

やはりsource nameがなかったことidがなくて行のマッチングがずっと失敗したことが気になる。Legacy ID Mappingの部分に出ていたsource_idというのがもしかしたら原因?
でもそうかな〜わからないな〜どうかな〜ほんとうに?わからん〜


というところまでなんとか議論を勧めたが、今回は結構ストレスが溜まった作業になりました。皆二次会で発散してね〜 

以上!(^^)/


========================================

次回は、Archivemetica のDIPをuploadするのではなく、ただのCSVを利用してデータをAtoMにインポートしてみる....かな?





最近の投稿

【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む

 Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...

人気の投稿