情报检索理论

浏览

对研究情报存储和检索的规律性以及情报检索系统的设计、运行与评价等问题进行研究所得的概念与认识。一般包括 6个研究领域:

(1)情报检索语言

(2)情报检索文档;

(3)情报检索策略;

(4)情报检索效率;

(5)情报检索系统

(6)情报加工自动化

情报检索语言是情报检索理论的核心。分为分类检索语言主题检索语言两大类。两类语言正在相互渗透融合, 结果产生一系列新型检索语言。 为了克服相对固定的分类表和词表同灵活多变的文献用语之间的矛盾,目前着重研究利用自然语言标引与检索等问题。

情报检索文档的研究内容一般指情报检索系统中的文档逻辑结构。检索文档组建与检索策略密切相关。情报检索策略是实现检索目标的途径和方法。它直接影响检索文档的结构和检索效率。传统的检索策略理论大都以二值相关性为基础,这同实际的检索过程有一定的差距,目前正大力发展以多值相关性为基础的情报检索理论体系,并研究各种情报检索模型,如矢量空间检索模型、概率检索模型、模糊检索模型等。

情报检索效率的评价是情报检索理论研究中的一个重要领域。一般以相关文献的查全率和查准率为评价的主要指标。情报检索效率的理论研究集中在 4个问题上:

(1)查全率(R)与查准率(P)的数学定义及 R-P关系中的一些特殊点的解释;

(2)R-P的互逆相关性;

(3)检索效率的新评价指标;

(4)影响检索效率的因素及其改进措施。

情报检索系统的研究内容,涉及到系统的模式、算法、设计原则和运行最佳化。对于大型情报检索系统要运用系统工程的原理与方法。

情报加工自动化主要包括自动分类自动标引和自动编制文摘。随着信息技术人工智能技术的发展,情报加工作业将全面实现自动化。

微型机、光盘技术和光纤通信的广泛应用,将引起情报检索技术重大的变革。情报检索系统将实现智能化,可识别声音、图形和处理自然语言,亦可模仿人脑进行推理判断和咨询。相应地,情报检索理论必将改观,以研究知识的表述、转换、组合、推导和利用为中心的理论体系将得到发展。