国内科技图书被引查证研究
报告》中显示人文社科类图书形式文献(包括著作、汇编、法规文献、标准)被引比重接近60%,超过期刊类文献[1],表明科技图书被引报告可以成为一种见证学术影响力的重要手段。《中国人文社会科学图书学术影响力报告》[2]借助中文社会科学引文数据库(CSSCI)近10年的引用数据,统计出了各学科学术论文引用最多的图书,并将此作为对各学科产生重要学术影响的图书向学界推荐。其他学者的研究也表明,科技图书作为科学研究中的一种重要学术成果,通过被引量化分析可体现著者的科研成果被他人认可、利用的程度及效度,反映着该书籍的学术价值及著者的学术影响力[3]。目前,在我国的科研专家选拔、人才评定、重大项目立项或评奖等工作中,相关人员的论文及科技图书的被引情况确实正在成为一项重要的评判指标。同时,随着我国科技文献数据信息化产业的迅速发展,目前已有多种检索期刊论文引文的数据库可供使用,如中国科学引文数据库、中文社会科学引文数据库等,一般的科技查新人员已较熟悉这些数据库的期刊论文被引检索方法,国内也已有一些关于期刊论文被引查证的相关研究[4]。但在当前的数据库条件下,如何应科研工作发展及用户的要求,合理选择适用的数据库及其他检索工具,出具相对全面准确的国内科技图书被引查证量化分析报告,这对我国为数不少的查新人员来说还是一项具有挑战性的新工作。作者通过近期的查证实践进行了相关研究,与同行们探讨。
1 研究样本
以实际工作中接收的不同年份出版的两本图书被引查证作为典型案例。图书1:荫士安,汪之顼,王茵,等主译.现代营养学(第九版).人民卫生出版社,2008。图书2:荫士安主译.现代营养学(第八版).化学工业出版社,2004。
2 所检索的数据库
本次实践探索查找了国内能进行引文检索的绝大部分相关中文数据库及一些搜索引擎,以分析这些数据库或检索工具用于图书类著作被引查证的价值。如,中国科学引文数据库(CSCD)、中文社会科学引文数据库(CSSCI)、维普的中国科技期刊引文数据库(CCJCD)、清华同方的中国引文数据库(CCD)、清华同方的中国知识资源总库及中国学术文献网络出版总库、万方数据知识服务平台(万方)、中国生物医学文献数据库全文版(CBM)、中国生物医学期刊引文数据库(CMCI)、超星数字图书馆(超星)、书生之家、读秀学术搜索(读秀)、谷歌及百度等。检索时间为2011年12月~2012年1月。
3 检索结果分析
3.1 “图书1”的综合被引情况
“图书1”共被引12次,他引10次、自引2次;被期刊文献引用9次,被会议论文引用1次,被图书引用2次。另外“读秀”公司的相关引文分析表明,“图书1”的被引用指数为0.1739,被引用次数为32(包括上述的被图书引用2次),但因仅能看到2条图书引用记录,故其统计的被引用次数32次仅供参考。
3.2 “图书2”的综合被引情况
“图书2”被引82次,他引80次、自引2次;被期刊文献引用53次、被会议论文引用5次、被学位论文引用23次、被图书引用1次。但经过对引证文献原文的参考文献比对,实际情况并非如此,其被引的82次中包含了“图书1”的8频次被引。“图书2”的真实被引结果为:被引74次,其中他引73次、自引1次;被期刊文献引用46次、被会议论文引用4次、被学位论文引用23次、被图书引用1次。
3.3 两本图书在各数据库中的被引检出量及收引特点
以“出版”或“出版社”或“图书”作为检索词粗略统计各大数据库的图书类著作的被引量(见表1)。以此数值为最低收录线,比较各数据库在图书类著作被引检索中的价值。研究表明,这些数据库对图书类著作的被引收录结果差异巨大,采用不同的检索手段各数据库检出的相关收录情况有的大相径庭,需对应实际情况随时调整检索方法。研究发现,对图书类著作的被引检索仅利用国内现成的那些引文数据库十分不妥。
4 各数据库中的图书被引查证实践
4.1 清华同方的中国引文数据库(CCD)
在CCD图书类型引文下的被引书名栏目输入“现代营养学”获得8条检索结果,但其中仅显示“图书2”有被引81频次的记录(2011年 12月27日检索),其引证文献为期刊文献、学位论文文献、会议论文文献,无图书类著作引用它的记录。但经过对原参考文献的核对,其中8篇引证文献实际上是“图书1”的引证文献。
而对“图书1”,无论用“现代营养学”在被引书名栏目检索,还是用“荫士安、王茵”等在被引作者栏目检索,结果均为零,表明无“图书1”的被引收录。“图书1”的被引情况只能通过相关引证文献的查找才得以核实。
从介绍中可看到,CCD的源数据库包括中国图书全文数据库(包含自1949年起国内公开出版的3877本图书全文,主要遴选了国内外部分经典专著),但该全文库目前在一般的网络检索中并不能被使用。经对图书被引检索发现,CCD中1979~2008年含有所描述的全部类型文献的被引数据,但少有2008年后出版的图书、专利类文献被引用收录入中国引文数据库。
在CCD中,还有引文的统计,包括作者统计、机构统计、出版社统计等,但统计的数据都来源于期刊。如在出版社统计中输入“人民卫生出版社”,可见其出版的图书2011年共有4176本已被引22984频次(2011年12月27日检索);2006年出版的图书记录有641本,当年被引的有84种,当年被引频次443次;但其2007年后出版的图书未见有被数据库收录,这也间接说明了“图书1”未被CCD收录的事实。
4.2 中国知识资源总库
在该平台,可选择多个数据库进行跨库检索。在选择数据库的过程中要注意不同数据库的组合,如加入报纸库或引文库进行跨库检索,检索栏目中缺失对参考文献的检索。检索“图书1”的被引情况,时间段限定从2008年起,在参考文献栏目输入:“荫士安” AND “现代营养学” AND “(九版 OR 9版 OR 第九版 OR 第9版 OR 人民卫生出版 OR 人民卫生出版社)” 精确检索,获得27条检出记录,其中有9条被引记录匹配。在该平台的跨库检索中,尤其要注意考虑检索词的全面性。从以下的例子中可看出其重要性,如在参考文献栏目输入“第九版”进行精确检索,获得1420条检索结果;而减少检索词长度,输入“九版” 进行精确检索,却仅获得425条检索结果(2012年1月20日)。
目前,清华同方数据库在网络上可供检索的多以中国学术文献网络出版总库的形式出现,该总库的跨库检索不包括CCD在内,除设计有简单检索、标准检索、高级检索、专业检索、学者检索等功能外,还有引文检索入口,但从这个入口着手,不管是在被引作者还是被引文献题名栏目中的检索,“图书1”与“图书2”的被引结果均为零。这就需要用到标准检索或高级检索中的全文栏目,输入“现代营养学” AND “(九版 OR 9版 OR 2008) AND “人民卫生出版社”AND “荫士安”,共获得39条记录。逐条阅读筛选,一般情况下可首选浏览数据库的文摘页面,在此页面可看到参考文献,包括已被单独分类的图书类型的参考文献。实际上,可能是因为要对应总库中的中国图书全文数据库,实践查证中发现所有的“图书1”的被引在文摘显示页面的参考文献中均显示成了“图书2”,在该库中的图书查证通过原文查找才获取了相关证据。像“图书1” 的作者文雯的引证文献,其参考文献的原文标注为:“荫士安,汪之顼,王荫.现代营养学[M].第2版.北京:人民卫生出版社,2008:863,875”。其在清华同方的中国学术文献网络出版总库的该文相应文摘页面,图书参考文献栏显示的是:“(美)B.A.鲍曼(BarbaraA.Bowman),(美)R.M.拉塞尔(RobertM.Russell)主编,荫士安,汪之顼主译.现代营养学[M]. 化学工业出版社, 2004”。
4.3 中国科学引文数据库(CSCD)
从数据库的“引文检索”入口,输入被引作者=荫士安,共检索到 109条结果。从其检索结果分析中可浏览到“图书1”被3篇期刊论文引用的情况、“图书2”被6篇期刊论文引用的情况。其中搜到的“图书1”2011年的1条引文记录(作者孙娟)均未在其他数据库检索中出现过。
4.4 中文社会科学引文数据库(CSSCI)
在CSSCI的篇名检索入口,输入“现代营养学”,显示命中结果5篇,总计被引8篇次,其中“图书2”2007年被引1次、2009年被引1次,与清华同方数据库中的被引频次差距甚远。其余的为闻之梅主译的“现代营养学”的被引记录,没有“图书1”的被引记录。
另外,该检索平台的标识与输入错误很多,应尽量用简短的检索词或少用检索词组合,例如用“作者=荫士安 AND 篇名=现代营养学”组合检索,结果为零,究其原因,“图书2”中的主译作者“荫士安”在CSSCI中1篇未标注出来(仅标注了原作者),另1篇标注成了“萌士安”。
4.5 维普的中国科技期刊引文数据库(CCJCD)
在该库参考文献入口,非期刊类的论文或论著、图书类著作均不能被检索到,需切换到源文献入口,在篇名栏目输入“现代营养学”,获得12条记录,其中包括“闻芝梅主译.现代营养学.第7版.北京:北京人民出版社,1998”等,其引用文献均为期刊文献。均未检索到“图书1”与“图书2”的被引记录。
4.6 中国生物医学文献数据库全文版(CBM)
在1978~2011年12月的CBM参考文献入口检索,被引的“图书”有298721次,其中“人民卫生出版”有114863条、“现代营养学”有139条。与其他数据库类似,该库的相关检索词也要考虑其尽可能的全面,像“人民卫生出版社”,参考文献中的标识有人民卫生出版、人民卫生出版社、人民卫生出版式社、人民卫生出版出版社、人民卫生出版社等。
4.7 读秀学术搜索
在读秀图书书名栏目输入“现代营养学”,获得“图书1”及“图书2”的2本书样,点击“图书1”介绍页面,右上有读秀公司统计出来的该书被引用指数0.1739、被引用次数为32次(2012年1月10日检索)。其中最有价值的还是在该页面中显示有2本图书引用“图书1”的记录(实用儿童营养学,董小燕著,人民卫生出版社,2009.11;现代临床营养学,顾景范编,科学出版社,2009.03)。所以对图书被引的检索,“读秀”可能成为了解图书类著作间互引的重要手段。但读者还无法自行通过逻辑检索获取有关图书的被引频次。如“图书2”,读秀公司没有相关的引用分析。
4.8 其他数据库
万方数据知识服务平台有少量图书收录记录,但与期刊文献不同,这些记录上无图书类著作被引的标识或链接。其数字化期刊库中也无参考文献栏目可供检索。而以往文献研究中采用的万方公司的中国科技论文与引文分析数据库(CSTPC)目前无法在该数据平台上获取。
CMCI中的数据无论是引用文献还是被引文献均为期刊文献。同样,书生之家无图书被引的检索入口及记录,也无图书被引检索的必要。
超星数据库中可通过全文检索手段获取图书类著作参考书目中的有关记录,本次实践发现了“图书2”被列于一书的参考书目中,但其获取具体的信息有一定的难度。而谷歌及百度搜索引擎目前对图书被引查证无任何价值。
5 结语
本次实践研究发现,在现有的数据库条件下进行图书类著作的被引查证还是有不少的问题。首先,图书间互引的查证还很困难,除可找到的读秀公司提供的部分图书互引的统计结果外,国内的其他中文数据库中,绝大多数只能找到图书类著作被期刊论文、学位论文、会议论文引证的结果;其次,虽然清华同方的中国引文数据库及中国知识资源总库是检索科技图书类著作被引的最重要数据库,但其数据库的特点及数据库平台间的交互关系,使得检索时须十分谨慎,有时候必须花大量的时间与精力去浏览引证文献的原始参考文献数据,才能保证相关引证事实的真实性;再次,本研究仅限于科技图书,对于其他种类图书被引的查证,结果可能会有所差异。
参考文献:
[1]苏新宁.中国人文社会科学学术影响力报告[M].北京:中国社会科学出版社,2007.
[2]苏新宁主编.中国人文社会科学图书学术影响力报告[M].北京:中国社会科学出版社,2011.
[3]杨思洛等.基于引文分析的图书影响力研究[J].情报资料工作,2010,(1):89-92.
[4]贾玉英.图书情报学17种核心期刊载文被引分析[J].情报科学.2011,29(3):401-405,411.
作者简介:杜娟(1964-),女,浙江省医学科学院情报研究所副研究馆员;胡天天(1983-),女,浙江省医学科学院情报研究所研究实习员;潘杏梅(1956-),女,浙江省科技信息研究院研究馆员。
上一篇:怎么吃?吃好比好吃更重要