推荐文档列表

制定中文元数据标准的思考

时间:2021-10-02 08:31:09 教育论文 我要投稿

关于制定中文元数据标准的思考

  【内容提要】作者认为,中文元数据标准应以DC为基本框架,并完全遵循和保留DC的结构、特点及扩展方式等,坚决防止CNMARC化倾向;中文元数据标准应形成一个完整的体系,对所涉及的相关的中文标准、规则、方案等,按照通用性、易用性等原则进行修改和制定;这一标准体系应成为全球各类中文信息资源著录和检索的标准。

【摘  要  题】信息资源建设与管理

  元数据是“关于数据的数据”或“关于数据的结构化数据”,现在常说的元数据,是特指在标记语言(SGML、HTML、XML)环境下,对网络信息资源进行描述的解决方案,主要是用于网络信息资源的发现、存储、管理和检索利用。在当前网络信息呈异常迅猛发展之势,大量的多样性的数字化资源,使得信息的利用和查找十分困难。为了解决这一问题,在国外已有了很多的元数据研究项目和成果,建立和运行了一些描述网络信息资源的元数据模式。元数据的应用,为网络信息资源的有序组织、适度控制和高效检索利用,提供了便利的条件。近年来,中文网络信息资源也在迅速增长,尽快研究和制定中文核心元数据标准,已是非常迫切的了。在制定中文元数据标准时,既要考虑到中文元数据处理的特殊性和中文资源的应用特点,更要从全球的信息大环境出发,分析、研究和借鉴国际上先进的、通用的元数据标准,在尽量保持与国际标准接轨的基础上,制定符合中文资源应用需要的扩展与应用规范。

    1 中文元数据标准应以DC为基本框架

  在国际上众多的元数据方案中,Dublin  Core  Element  Set(都柏林核心元素集,简称DC),以其结构简单、语意互通和可扩展等特性,事实上已成为国际范围内通用的网络信息资源描述的元数据标准。DC经过几次国际会议的研讨和修订,已逐步完善和成熟。所以,制定中文元数据标准应以DC元数据为基本框架。国内在四五年前就已开始了对DC的探讨和研究,但至今尚未完全形成依托中文环境的DC元数据标准。当前应进一步加紧深入地对其进行研究和规范,形成中文元数据的一个标准核心集,以适应中文网络信息资源的发展。中文元数据标准应完全按照DC元数据集来建立,在具体作法上要注意以下一些问题。

  (1)完全按照DC元数据的框架结构来制定中文元数据标准。由于网络信息资源在时空上的广泛性和开放性,与传统的文献著录的相对封闭性有着很大的不同,因此,中文元数据标准的制定,应强调与国际接轨,保持完整的一致性。也就是说要完全遵循DC元数据的框架结构来构建中文元数据标准,而不应该提出“以DC为主,参考其它元数据标准”来搞中文元数据标准。我们应汲取CNMARC的教训,避免把中文元数据标准搞成“CNDC”。中文元数据标准应该只是对DC元数据进行本地化和中文化的处理,对它的内涵、外延等用中文予以标准地诠释,方便使用中文的著录者和检索者理解与利用,仅对于著录和检索中文信息资源的一些特殊性和应用特点等有限的方面进行规范的规定和定义。

  (2)中文元数据标准的制定,应完全保留DC元数据的基本特点。一般地讲,内在性、可扩展性、独立句法结构、可选择性、可重复性和可修饰性是DC的6大特点,在实践中集中地表现为DC元数据的简易性、通用性、兼容性以及灵活的可扩展性,这些特性是DC能够成

[1] [2] [3]