prasinos' work memo

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

CAにおもしろい記事があった。

http://current.ndl.go.jp/node/15943

OCLC、MARCデータの検証報告書を公開

Posted 2010年3月18日

OCLCが、フィールド番号などのMARCタグのスキーマがどれだけ実 際に役立っているのかを検証したリポートを公表しています。各タグがWorldcatでどれだけ用いられているか、レコード照合(マッチング)にはどんな タグが用いられているか、検索システム(common library search systems)で索引化されているタグはどのくらいか、Encoding Level(データの完成度のレベル)情報は信頼できるか、ローカルの特殊資料目録とWorldcat等でタグの用いられ方は違うか 、などを調査し、「MARCの将来」を考察しているものです。

Implications of MARC Tag Usage on Library Metadata Practices http://www.oclc.org/research/publications/library/2010/2010-06.pdf

New Report, “Implications of MARC Tag Usage on Library Metadata Practices”(2010/3/13付けOCLCのニュース) http://www.oclc.org/research/news/2010-03-12.htm

Key findings より

  • Only a small subset of MARC 21 fields are used in WorldCat. Even when considering the MARC fields that are heavily used in non-book formats, there are only 21 to 30 tags that occur in 10% or more records.
  • There is little consistency between the various routines used by machines in matching based upon MARC data elements. The fields shared by machine standards for matching of records sampled in this study are limited to five elements from the leader; (後略するが要するに LOC, ISBN, タイトルだけ)
  • The complexity of the algorithms using MARC data for matching cannot be overestimated.
  • Only a subset of fields is indexed by common library search systems.
  • Note fields are in common use, but machines are not necessarily good at interpreting the free text which generally characterizes their contents.
  • Encoding level as a criterion for selecting the “most complete” record is far from reliable. (笑)

そのほか

  • まあその、比較的ニートな標準が長期間運用されたあとでさえ、このような調査は必要だ。
  • 140 Million レコードってすごい。1億4千万ですよ。
  • MARC というのはファンシーな XML ではなく、むしろ本レポートでも書いているけどレガシーシステムに属する。
スポンサーサイト

FC2Ad

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。