今日はイライラする中年女性2名とお送りします〜 (ーー;)
それに、勉強会始まる前からガソリンを入れたので、ちゃんと走ることを祈ります!(笑)
今日の目標は、AtoMからエクポートしたCSVに追記をしてインポートすることです!
関連するマニュアルはここ↓
https://www.accesstomemory.org/en/docs/2.4/user-manual/import-export/csv-import/#update-existing-descriptions-via-csv-import
====================================
おさらい〜〜
前回はarchivemeticaのDIPをそのままAtoMへConimalフォンドとして入力した。そのため、アーカイバル記述がない状態。今日はその記述をCSVで追記する。今までは、フォンドへ追記する際には、既存のデータをすべて空にしてからではないといけなかったが(追記ではなく上書きになるということかな)、空にしなくても変更になった部分だけをCSVで追記できるようになった。これは最近追加された機能なので、やった人はあまりないと思う。
本番に戻ります〜
まずConimalのデータをAtoMからエクスポートしましょう。
Manage jobsからConimal(前回入力したフォンド)のCSVをダウンロードする。
あれ?
ダウンロードをするとすべてのデータのCSVがエクスポートされた。
(一時期メモ不能・・・・なにやっているの皆〜〜〜 @..@ )
なんとか状況を把握したので、再開します。
本来は、Conimalフォンドのedit > administrative areaからsource nameの部分に元となるCSVのファイル名が表示されるはずだが、Conimalにはそれがなかった。
おそらくCSVを利用してデータ入力したのではなく、ArchivemeticaからDIPを入力したからかも。
(でもSource nameがないのはおかしいのでは? ーーa )
ではでは、CSVを利用してデータを入力して、source nameが現れるかやってみよう。
まず、エクスポートしたConimalのCR(Carriage Return)を消す。
方法は色々あるが、以下の2つでやってみた。
① unbuntuで新しい名前でCSVを保存し直すとCRが削除される。(へ〜コマンド打たなくてもいいんだ〜)
② CR削除してくれるアプリを利用して削除する。UTF-8へ変換しつつ、改行をLF(Line feed)にする。→つまり、Linuxで使う改行コードにしてあげること。(よくわからない人はhttps://irisawadojo.blogspot.jp/2018/05/csv-import.html をみてね!)
前処理をして、importしたが、失敗。
エラー:invalid script: cript (はぁ? なに?)
→ CSVのscrip項目にcriptと入力したのが原因のよう。ISO15924の英語はラテン語のコードLatnを入れなければならない。でも今回はLatnを入れずに、scrip項目のデータは空白のままにした。
でもでも、またエラー。 (T..T)
(もうやめよう・・・)
しばし、議論です。
シーンとなったので、ちょっと整理しようと言ってみたが…
1名だけはい!と言ってくれました。ありがとう。 T.T
皆整理する気はまったくなく(笑)、議論は続き、CSVのフォンド名がないことに気づく。Lagacy IDとsource nameがマッチしない場合、title, repository, identifierの3つがマッチするかを見るとマニュアルにあったので、気になりConimalとフォンド名(titleがないってことかな?)を入力して再度インポートします。
でもでも、またエラー(しょぼん…ほら〜もうやめようってば〜)
最後は、マニュアルのせいにして終わるか。違うか。(へへへ)
それでも諦めず今度は、CSVのフォンド情報だけを入れて更新されるか確認します!
やっぱりだめ。
(だからもうやめようよ〜)
あれ、皆ちょっと喧嘩ぽくなったぞ(爆笑)
それでも諦めず、普通にCSVをインポートしてみたらインポートされた。まぁ、ここまでは当たり前だけど、managemet jobsのレポートを見ると、ちゃんとConimalにはなかった「id」というのが付与されている。
やはりsource nameがなかったこと、idがなくて行のマッチングがずっと失敗したことが気になる。Legacy ID Mappingの部分に出ていたsource_idというのがもしかしたら原因?
でもそうかな〜わからないな〜どうかな〜ほんとうに?わからん〜
というところまでなんとか議論を勧めたが、今回は結構ストレスが溜まった作業になりました。皆二次会で発散してね〜
以上!(^^)/
========================================
次回は、Archivemetica のDIPをuploadするのではなく、ただのCSVを利用してデータをAtoMにインポートしてみる....かな?
2018年5月25日金曜日
最近の投稿
【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む
Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...
人気の投稿
-
ほとんどやる気のないHが担当で、更新が遅れに遅れました。すみません。 Archivematicaには、画像(JPGやTIFFファイル)のOCR機能があります。オープンソースのTesseract (テッセラクト)を使っています。 https://www.archivematica....
-
今日もAlfrescoの続きです。 前回の続きということで、今日はワークフローを触ってみます。 前回「コロナ政策」というサイトを作り、メンバーも追加して、いくつか文書を登録している状態ですので、今日は登録されている文書を編集→起案(ワークフロー開始)→レビューしてもらうという流れ...
-
今日は19時22分まで4人しかあるまらず、泣く泣く元(ウォン)が初めてブログを書きます。えーとー一回でもウォンにあったことのある方はご存じでしょうが、ものすごい散漫でせっかちですので、通じない日本語や表現の下手さなどにはくれぐれもご容赦ください。また下手な表現には遠慮なくご指摘く...
-
今日は橋本さんのAlfresco Community Editに現Alfresco Governance Services(RM=」Records Management」)Moduleを追加する作業!の失敗事例の紹介から始まりました。 なんか...OSSのコミュニティ版にもOSS...
-
今回は、前回の続きからスタートです。開始直後は皆さんお仕事が忙しく、参加者が少なかったことから、今後の展開についての議論に飛びがちでした。。。 まずは、前回インストールしたAlfrescoを端末から起動します。 cd alfresco/ docker-compo...