随着海军舰船技术的迅速发展,各种技术装备不断加载到舰船上,使得舰船技术资料的数据量不断增大,而且技术资料的种类繁多、格式又多样,因此如何管理这些技术资料,并能快速地从中查找所需的信息,是一个亟待解决的问题。本文根据海军舰船方面技术人员的实际需要,对技术资料综合管理系统进行了深入的研究和设计,从而可以为用户提供更准确的信息。本文首先按照软件工程的开发流程,结合用户的需求,对技术资料综合管理系统进行了分析和详细的描述,并以此为前提,对该系统的逻辑架构和物理架构进行概要设计,然后对持久层的各个功能模块分别进行了分析和设计。
由于本系统提供的直接功能是检索功能,因此着重分析设计了业务逻辑层的全文检索模块。其次,由于中文分词技术和查询优化技术是全文检索技术研究中存在的两个重要问题,因此本文着重对中文分词技术和查询优化技术进行算法设计。首先对现有的中文分词技术和分词算法进行了分析,介绍了中文分词的难点——歧义词问题,然后对比分析了几种歧义词识别和处理的算法,在此基础上提出了一种改进的歧义识别算法,并且采取了一种有效的歧义处理方法。本文还对查询优化的一个分支——查询扩展技术进行了分析,根据本系统的实际需要,采用了一种查询扩展方法,并对其进行了实验验证,结果表明该算法可以有效地提高本系统的检索性能。本文具体的研究内容总结为如下几个方面:1)对中文分词歧义识别算法进行了改进优化,提出了结合逐字扫描法和逆向最大匹配的歧义识别算法;2)运用了统计规则的歧义消除算法,对识别的歧义词进行了消解;3)采用基于文档与搜索结果上下文的查询扩展方法,并对查询进行了优化。更多
本文关键词: