📚 デジタルアーカイブ ダウンローダー
東北大学デジタルアーカイブ(または他の OAI-PMH 対応サイト)から、コレクション単位でメタデータを取得し Excel/CSV にまとめます。
1サイトに接続する
プリセットから選ぶか、別の OAI-PMH エンドポイントの URL を直接入力してください。
2コレクションを選ぶ
取得したい資料群をクリックしてください。件数が表示されています。
該当するコレクションがありません。
3データの詳しさを選ぶ
分からない場合は「詳細(推奨)」のままで問題ありません。
4取得とダウンロード
取得後、表・集計・年表で確認できます。Excel で開ける CSV としてダウンロード可能です。
⚙️ 上級者向け:技術メモを開く
このツールは OAI-PMH プロトコルで通信しており、HTML スクレイピングは行っていません。使用動詞: Identify / ListMetadataFormats / ListSets / ListIdentifiers / ListRecords。resumptionToken でページングします。
列名は {prefix}:{localName}、xml:lang 属性付きの場合は @lang を末尾に付けています(例: dc:title@ja)。同一要素の複数値は改行で連結。_ 始まりの列は <header> 由来(OAI 識別子・更新日・所属セット・status)。
サーバ負荷配慮のため、ページ間に 200ms の sleep を入れています。CORS は Access-Control-Allow-Origin: * で許可されているため、ブラウザから直接 fetch しています。
CORS が許可されている任意の OAI-PMH エンドポイントで動作します。データに著作権・利用条件がある場合は必ず提供元の規約をご確認ください。