2018年4月30日月曜日

METS、OAIS関連参考情報です。

参考資料アップします〜

■国立国会図書館デジタルコレクションのOAIS参照モデルへの準拠状況

国立国会図書館デジタルコレクションのOAIS参照モデルへの準拠状況「近代デジタルライブラリー」からの転換から引用 https://www.jstage.jst.go.jp/article/johokanri/58/9/58_683/_pdf 


これは以前橋本さんが説明してくれたスライドですが、OAISをオープンソースを利用してどう実現するか理解するのにとても役にたちました。わかりやすい。

Blog about MIT Libraries' Digital Archives Workから引用
https://libraries.mit.edu/digital-archives/integrating-tools/





■ これは4月の勉強会でMETSファイルを分析する際に参考にしたものです。
  オランダではなく、デンマークの人でした。^^;



Eld Zierau, The Royal Library of Denmark

2018年4月20日金曜日

【10】METSとPREMISの中身を確認

今日は、データのtrnasferからもう一度やってやってみる。

平野さんが用意してくれたword1個, jpeg2個, pdf1個の合計4ファイルと、CSVファイルを最初からトランスファーするした。


入力するファイルは以下
filename
sample20180407/objects/animal.jpg
sample20180407/objects/animal_and_text.docx
sample20180407/objects/coffee.jpg
sample20180407/objects/coffee_and_text.pdf

Transfer name:GCAS01
Accession no.:180420_1
Fonds: Anico  ※transferからAtoMへのupload成功第1号 (^_^)/
シリーズ:anmimal, coffee

上記4つのファイルとAnicoフォンドとして入力するはずが、間違えて、animal だけをシリーズとして作成してしまった。そのため、あとからAnico>coffeeをセットにして、create SIPしたので当初の意図と違うが、そのまま進んだ。

★皆の疑問:animalとAnicoのメタデータはすべて別別に生成されたが、animalがAnicoのシリーズであることはわかっているのだろうか?



疑問はあったがそのまま進み、無事METSファイルの確認ができた。
今日の目標は「METSの中mを理解すること」だったから。

残りの時間は、ゆっくりMETSを分析したよ〜画面を動かしながら文字を追っていくにはかなりの動体視力が求められる。\(@‥@)/


Archivemeticaの、Discrtiptive metadataはDublin coreを入力した時にだけ生成される、他の記述的メタデータ標準は対応してないらいし。


<dmdSec> : Descriptive Section
→ 今回DCを入れてないのでMETSファイルには生成されなかった。

<amdSec> : Administrator Section
  • <techMD> : Technical metadata、Exifファイルなど、画像のRAWファイルにあるものなどすべて      
  • <digiprovMD> : Digital provenance metadata
    →wordからPDF化したこと、どのPCで作成したとか、全て記録されている。


ということで、PREMISとMETSのすごさに圧倒されて終わり〜
またね〜




2018年4月8日日曜日

Archivematica demoで遊んでみる

とりあえずサンプルデータで、数の少ない単純なものをつかって、複数回トランスファー→store AIPまでやってみた。最後に、test5で、backlogのSIPをarrangeするのを試してみた。2度ほど失敗(笑)。2つしかないobjectsを、新しいディレクトリを2つつくって一個ずつ入れてみた。しかし、Upload DIPのreviewから見ると、DIPのディレクトリ構造は変わっていない。

でも、METSではちゃんと分かれている。
-<mets:div TYPE="Directory" LABEL="objects">
-<mets:div TYPE="Directory" LABEL="object_jpg">
-<mets:div TYPE="Item" LABEL="Landing_zone-cbdfc906-ff07-443c-8b29-e4f96bcdf297.tif">
<mets:fptr FILEID="file-cbdfc906-ff07-443c-8b29-e4f96bcdf297"/>
 </mets:div>
-<mets:div TYPE="Item" LABEL="Landing_zone.jpg">
<mets:fptr FILEID="file-bb3bbfdb-88a5-4259-9406-f2d0c0767867"/>
</mets:div>
</mets:div>
-<mets:div TYPE="Directory" LABEL="object_others">
-<mets:div TYPE="Item" LABEL="MARBLES-31f507c7-bc3d-493a-9ca1-6235a588255e.tif">
<mets:fptr FILEID="file-31f507c7-bc3d-493a-9ca1-6235a588255e"/>
</mets:div>
-<mets:div TYPE="Item" LABEL="MARBLES.TGA">
<mets:fptr FILEID="file-0ab7311a-8564-4ce3-9d28-b99e29836af5"/>
</mets:div>
</mets:div>

AIPをダウンロードして見てみると、こちらもちゃんと分かれている。

ユーザーインターフェースで見えることと、システムの中で起こっていることとは違うということなのだろうか。うーむ。

何はともあれ、とにかくnormalizeされたファイルと、オリジナルのファイルと、サムネイルとがちゃんとAIPに入っていること、全体がbagitの定める通りの構造になっていること、そしてAIPとDIPのMETSは同じだということは自分でも確認できたのでよかったです。はい。

あと、METS structmapに出てくるFILEIDやLABELは、METSの中での関連づけや意味のわかりやすさのためにある属性で、具体的なオブジェクトの名前的なものではないようだ。オブジェクトは基本的にPREMISのobjectIdentfierで一意に識別される。当たり前といえば当たり前なのだが、あまりに情報量が多いので、心が揺れてしまう。

それから、スクリーンショットを取るならGoogleのアプリ、FireShotがおすすめ。どんなに長ーい画面でも一発でキャプチャーできます。
https://chrome.google.com/webstore/detail/take-webpage-screenshots/mcbpblocgmgfnpjjppndjkmgjaogfceg?hl=ja

おすすめ文献

メモです。

この修論、おすすめかも?直接ダウンロード形式でリンク張れないので、下記書誌情報でググってください。ざっと眺めただけですが、いま道場でやっていることをちゃんと研究の形に仕上げている、という感じです。

Jasmin Karoline Boehmer. Evaluation of the Archivematica Ingest Functionality: Metadata and Rights Management for Digital Data Objects of Local Authorities.
A dissertation submitted to Aberystwyth University in partial fulfillment of the requirements for the degree of M.Sc under Alternative Regulations, Department of Information Studies, Aberystwyth University,2016.
https://zenodo.org/record/235478/files/Boehmer_Evaluation-of-the-Archivematica-Ingest-Functionality_160921.pdf

あと、ずっとなんなのかなーと思っていたBagitのspecificationはここから。
http://www.digitalpreservation.gov//documents/bagitspec.pdf

AIP structure と合わせて読むべし。
https://wiki.archivematica.org/AIP_structure#Directory_Structure

Archivematica 1.7,Storage Service 0.11のリリースノート

昨日(2018-04-07)、2018-04-06の日付でリリースノートが出ていたのですが、今日(2018-04-08)は日付がMMDDになってますね。道場の取り組みで関係ありそうなのはDIP upload のあたりでしょうか。

https://wiki.archivematica.org/Archivematica_1.7_and_Storage_Service_0.11_release_notes

2018年4月6日金曜日

【9】SIP, DIPの確認

前回のメタデータの確認
  • Archivemeticaの前回作成したAIPを確認。
  • 階層情報を設定できなかったときにすべてアイテムレベルになってしまったときのメタデータと、階層情報入れたときすべてMETSに残る。
  • DIPはIngestのMicro-serviceのupload DIPからReviewすると確認できる。
  • METSファイルに一つのファイルに付き2つのメタデータが生成されている。JPGの場合、TIFFがついて2個。PDFもPDFがついて2個。docxだけ一つ。normalizationの際に原本とコピーを作成する模様。PREMISにPDF/Aに変換したことが書いてある。
  • フォーマット情報:https://wiki.archivematica.org/Format_policies
  • 皆の疑問:AIPとDIPが同じであるようだが、それで問題はないだろうか?

最近の投稿

【108】Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを読む

 Gijs Aangenendt氏の修士論文、Archives in the Digital Age: The use of AI and machine learning in the Swedish archival sectorを半分読みました。 前半は、AIを扱ったアーカ...

人気の投稿