文献数据库

浏览

计算机可读的、有组织的相关文献信息的集合。在文献数据库中,文献信息不是以传统的文字,而是将文字用二进制编码的方式表示,按一定的数据结构,有组织地存储在计算机中,从而使计算机能够识别和处理。文献数据库是当前通过遍布于全世界的通信网络进行联机情报检索的最早的和主要的处理和检索对象。

文献数据库起源于二次文献编辑出版的计算机化。20世纪60年代初,各文摘社为克服因信息爆炸而带来的困难,纷纷引进了先进的计算机技术。将经过整理、加工的文献信息输入到计算机中,由计算机进行编辑和排版,输出后排版印刷为文摘刊物和各种索引。同时,仍保留在计算机中的机器可读的文献信息,作为二次文献编辑出版的副产品,发展成为文献数据库。由于机器可读信息大多记录在计算机的磁带上,因此也称文献数据库为磁带版二次文献。早期的文献数据库有1964年正式对外发行的美国国立医学图书馆医学文献分析与检索系统(MEDLARS),美国化学文摘社的《化学文摘数据库》(CACON)等。

文献数据库的内容与其传统的文献信息是相对应的。一种书刊或一篇文献的内容和形式特征经著录后形成一条款目。款目是文献信息的基本单位。在文献数据库中,一条款目称为一条记录,记录也是构成文献数据库的基本单位。款目由篇名、作者和主题等著录项目组成,著录项目在文献数据库中称为字段。一个字段又可细分为若干个子字段。这样,文献数据库是由一系列连续的记录、字段和子字段组成,并形成了一个分级树型结构。

文献数据库经过20年的发展,全世界已从1965年20个数据库发展到80年代末约4000个商用数据库,几乎覆盖了主要国家的所有文献。数据库的规模有小、中、大、超大规模之分,小型文献数据库年增长几百条记录,超大规模数据库年增长50万条记录以上。文献数据库的内容也不限于二次文献,已发展为3 种类型:

(1)全文数据库,存储文献全文;

(2)书目数据库,存储内容为题录或除题录外,还包括文摘、提要或简介;

(3)书目相关数据库,仅存储索引词和文献号,不存储其他书目信息。

文献数据库主要用于情报检索,包括:

(1)由计算机处理直接进行联机情报检索和定题情报检索

(2)生产传统性的文献产品,如文摘刊物、书目、索引、专题目录等;

(3)生产机读文献产品,如综合或专题文献数据库磁带、软盘等;

(4)生产文献缩微产品,如计算机输出缩微片(COM)。

文献数据库的发展趋势是:

(1)文献数据库生产产业化;

(2)高密度存储,如采用光盘;

(3)向全文数据库发展,采用自然语言检索;

(4)多文种,即一个数据库可用多种语言检索。