如何提高《中图法》与《杜威法》类目的相似度
[摘 要]不同分类法之间的可互操作是数字图书馆建设的一个重要课题,而提高分类法之间的相似程度是该操作系统得以实现的重要手段之一。通过对《杜威法》与《中图法》两部分类法的社会科学类目名称及其所涵盖的范围的分析比较,求同存异,并在今后的修订工作中有意识地通过调整类目、扩充类名、增加注释,互见及组配等方式提高两分类法之间相似值。
[关键词]《杜威法》;《中图法》;相似度
DOI:10.3969/j.issn.1008-0821.2010.08.041
[中图分类号]G254.1 [文献标识码]A [文章编号]1008-0821(2010)08-0149-03
On How to Increase Similarity Between DDC and CLCYao Bo
(Nanjing Library,Nanjing 210018,China)
[Abstract]A higher similarity between DDC and CLC helps greatly increase their interoperablility capability which plays an important role in the digital library construction.It is therefore expected that seeking common ground while reserving differences is supposed to be taken in consideration in the future revision of CLC by means of adjustment of category,expansion of subject headings and more applications of combination technique and notation.
[Keywords]DDC;CLC;similarity measurement interoperablility
检索语言之间的互操作可以提高网络资源检索效率,实现资源共享,它是情报检索语言发展的重要趋势。在ISO25964(草案)中也已经明确提出这方面的要求。由此,不同分类法之间的互操作必然会成为未来发展方向。早在1987年,瑞典皇家图书馆就完成了瑞典图书分类法和DDC19的互操作。此后电子版、网络版分类法的相继问世更推动了分类法互操作的发展,成绩斐然。我国情报检索语言互操作相关研究始于20世纪60~70年代。自90年代以来,分类法之间的互操作研究取得了一些成果,主要是国内主要分类法之间的互操作,但由于软件水平差,用户操作不便而未能得到推广。近年来,相关理论得到了进一步的完善,特别是在2004年,戴剑波编制了CLC4和DDC21自动映射系统,即通过计算类目概念的相似度,并根据相似度最大的原则对概念因素进行匹配。该理论为实现我国分类法和西方分类法互操作起了很大作用。但是我国的分类法无论是在类目名称、概念,还是排列次序上都和国外主要的分类法有着很大的差距,这必然会对自动映射系统的实现造成很大的阻碍。这在社会科学中尤为明显。因此,我们可以在保证中图法类目基本稳定的前提下,依据相似度最大化原则,对照国外主要的分类法的类目,通过增加注释、扩充类名、调整类目、增加主题词等方式主动地与之形成类目概念之间的各种对应关系,最终形成分类号之间的相互映射。鉴于杜威分类法(DDC)是世界上运用最为广泛的分类法之一,并同时能与多个分类法、叙词表相互映射,可以选择它作为中图法的最佳映射对象。限于篇幅,本文仅从《中图法》C社会科学总论与《杜威法》中相应类目进行相关比较研究,窥斑见豹,供大家参考。
1 两种分类法的概况
《杜威法》(DDC)、《中国图书馆分类法》(CLC)同属等级列举式分类法,是以知识分类为基础,依据概念的划分与概括原理,把概括文献内容与事物的各种类目组成一个层层隶属、详细列举的等级结构体系的一种文献分类法。主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,适合从学科、专业角度系统检索和利用文献。两部分类法描述的学科领域和知识总量基本相同,在类目划分原则相近的情况下,CLC4类目与DDC21类目表达的概念必然存在着很大程度的相似性。
DDC是世界上运用最为广泛的分类法之一,至今已历百余年,经22次修订,现已用30多种文字出版,被135个国家和地区采用,成为世界上历史最久且使用最广的分类法。在体系结构上,杜威分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。除了三位数分类外,一般会有两位数字的附加码, 以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间以小数点隔开。而CLC自1975年在全国推广使用以来仅33年,期间进行了3次换版修订,平均周期长达8年。CLC是建立在5个基本部类的基础上的22个大类的知识分类框架,它是以字母与数字混合制的标记符号与层累小数制的标记组合方式来组成的,与DDC存在较大差异。
随着计算机技术、网络技术的发展,1993年,《杜威法》就推出其电子版MD-DOS版,第二年升级为窗口版“视窗杜威”(Dewey for Windows),2000年又推出了网络版视窗杜威,并于每个季度发布一次更新过的版本,最新的第22版杜威分类则是在2003年与其网络版同时推出。现在的杜威网络版日臻成熟,除了季报,还有月报。值得一提的是杜威分类博客在奥巴马当选新一届美国总统的第二天,博客中就发布了相关文献的最新分类号,例:
Changes to Dewey
973.931 Administration of George W.Bush,2001-2009
973.932 Administration of Barack Obama,2009-
相比之下,《中图法》在网络版方面的发展相对滞后。虽然我国在2000年出版《中图法》电子版的同时,也建立了中图法网站,但其网络版至今仍处在建状态。
如何提高《中图法》与《杜威法》类目的相似度Aug.,20102 《中图法》C大类社会科学总论与《杜威法》相应类目的映射从表1中可以看到两个分类法中的社会科学类目数相近,分别用字母C~K与阿拉伯数字300~390表示。在类名上,除政治、经济、法律、教育等学科同被列入社科门类,其余的却大相径庭。表1 两种分类法中社科类目对照表
《中图法》《杜威法》C社会科学总论300社会科学D政治、法律310一般统计学E军事320政治学F经济330经济学G文化、科学、教育、体育340法律H语言文字350公共行政管理及军事学I文学360社会问题与社会服务;协会 续表1
《中图法》《杜威法》J艺术370教育K历史地理380商业、通信及交通390礼仪及民俗学
其差别成因在于:《中图法》是以马、列、毛思想为基础,知识门类分为哲学、社会科学、自然科学三大部类,其中社会科学是包括了人文科学的广义的社会科学,以社会现象为研究对象。而西方社会把社会科学的研究对象限于个人及团体的社会活动等,因此在类名上出现了较大区别。
虽然两种分类法的排列次序不能一一对应,但我们却能很容易通过DDC的类名用词在CLC分类表中找到所对应的类目(见表2),具有较高的相似度。表2 类目对照表
《中图法》《杜威法》C8310一般统计学D0320政治学F0330经济学D9340法律3 对有差异的类目应提高相似度,形成映射关系
在具体修订工作中,应保证中图法类目的基本稳定,并依据相似度最大化原则,增加注释、扩充类名、调整类目,主动地与之形成类目概念之间的各种对应关系。
3.1 把相关度高的文献集中在一起,增加与杜威分类法的相似度实用性是《杜威法》一大特点,其类目设计与实际工作紧密相联。以《中图法》C931管理技术与方法为例,其相应的《杜威法》类目却为科学(自然科学)门类之后的技术类650门类。从表3可以看出,《中图法》下位类C931.4办公室工作在类名设计上与《杜威法》有着很大的区别。表3 两种分类法中办公室类目对照表
《中图法》《杜威法》C931.4 办公室工作
…办公室自动化等入此651 办公服务
C931.46 文书工作?秘书学、文书学入此651.2 设备与供应
C931.47 会议组织与管理651.3 办公室管理.37 文书工作.374 秘书及相关服务
办公室实务入此.374 1 秘书工作
包括秘书、速记员及打字员 续表3
《中图法》《杜威法》.374 3 相关服务
包括了文件工作、收发工作及接待工作651.5 档案管理651.7 档案的创建与传输651.8 数据处理?计算机应用651.9 各类型办公室工作入此652 文字处理652.1 书写652.3 键盘录入652.4 复制652.8 密码使用653 速记653.1 速记实务基础653.2 略记653.3 机器系统653.4 手写系统
《中图法》仅以3个类目大而化之,而《杜威法》分类类目多达20个,罗列出若干办公室相关技术,如档案管理、秘书、速记等,并把各类型办公室工作集中于此。此外杜威分类把文字处理等相关秘书工作归类于652,紧邻651办公工作。而在《中图法》,各类却散见于G类、TP类与H类等,不利于文献集中。可以通过增加类号或增加注释等方式把相关度高的文献集中在一起,同时又能增加与杜威分类法的相似度。
再以医院办公室工作为例,在《中图法》中归于R类(医学),而《杜威法》中则归于651(办公服务类),见表4:表4 两种分类法中“医院办公室工作”的分类号对比
《中图法》《杜威法》头标区 -----nam0-22-----450-
ID号 002505036
通用数据 20031118d2003 em y0chiy50 ea
题名与责任 医院办公室管理规范全书[专著]/黄雨三主编
中图分类号 R197.322-65Merriam-Websters medical office handbook/
Springfield,Ma.:Merriam-Webster,c1996.
Call #:651.9.1 M
Subjects Medical offices--Management--Handbooks,manuals,etc.Medical secretaries--Handbooks,manuals,etc.
可在《中图法》C931.4类目下增设一新类号C931.4X各类型办公室工作,或用组配号C931.4X:R197.322-65把相关文献集中起来,同时与《杜威法》相映射。
3.2 提高逻辑结构的相似度
西方社会科学发展历史比中国要早得多,成熟度高,所以在类目设计上《中图法》可以借鉴其先进的地方。例如通过《杜威法》301社会学与人类学与305.8民族的类目之间的关系可看出,人类学的地位理当比民族学高,这与《中图法》中C912.4文化人类学与C95民族学的类目位置正好相反。另据百度百科,文化人类学作为人类学分支被划分出来。当时,它仅是狭义的文化人类学。20世纪20年代以后,随着研究范围的深入和扩大,文化人类学才形成包括民族学、考古学和语言学等分支的学科。狭义的文化人类学亦即民族学,早在19世纪中叶就已确立为一门独立的学科。法、英、美等国均建立了民族学会,出版发行了一些民族学专业刊物。由此可见,文化人类学至少也应与民族学平级,而不应低于民族学。
3.3 借鉴DDC之长,增加类目
《杜威法》比《中图法》更具体,更细化。这在社会科学类目体系上也有所反应,例如在杜威分类22版新增了从650.144应聘人员角度对面试的研究,从招聘方则入658.31124,位于人力资源管理的下位类。在我国,有关应聘面试技巧的书也日益增多,一般入C913.2职业(据国图数据),而招聘则入经济类,由此可见,《中图法》中对相关主题也进行了区别对待,只是没有单独立类。借鉴杜威分类,我们可以在C913.2下增设应聘或面试新类名,加大类目扩展深度。
4 结 语
综上所述,可以看出《中图法》与《杜威法》之间虽然存有差距,但可以通过研究他们之间的类目类名相互映射的关系,以调整类目、扩充类名、增加注释,互见及组配等方式来进行中图法修订工作,取他之长补已之短,并以此强化与杜威分类法的对应关系,提高之间的相似度,增加实现两分类法之间互操作之可行性。
参考文献
[1]戴剑波,候汉清.图书分类法映射系统设计原理[J].情报学报,2005,24(3):299-303.
[2][EB].
[3]田素梅.两部分类法中的社会科学类目体系比较研究[J].图书情报工作,1998,(4):32-35..
[4]《中国图书馆分类法》编辑委员会.《中国图书馆分类法》第四版[M].北京:北京图书馆出版社,1999.
[5]Dewey,W.Dewey Decimal Classification and Relative Index.
[6]《中国图书馆分类法》编辑委员会.《中国图书馆分类法》使用手册[M].北京:北京图书馆出版社,1999.
[7]国家图书馆《中国图书馆分类法》编辑委员会.分类法研究与修订调研报告[R].北京:北京图书馆出版社,2007.