基于知识库的智能问答系统构建技术研究-AET-电子技术应用

基于知识库的智能问答系统构建技术研究

网络安全与数据治理

王亮，张强，魏韵萧

中国人民解放军91001部队

摘要： 随着信息技术的迅猛发展，数据中心积累了海量的数据，如何高效地从这些数据中获取有价值的信息，成为制约数据中心发挥军事效能的关键问题。智能问答系统作为一种能够理解用户自然语言问题并提供准确答案的工具，在数据中心领域具有广阔的应用前景。提出了基于数据中心知识库的智能问答系统构建技术。首先，聚焦军事领域不同应用场景下用户多样性数据需求，建立数据检索需求模型。其次，针对不同维度数据检索需求模型，提出多样性知识检索关联算法，定义检索需求与候选数据集之间的关联度、推荐度等参数，依据上述参数计算候选数据集与检索需求的匹配度，从而找到最为相关的候选数据集。接着，将生成的候选数据集与用户的检索需求一同传递至大语言模型中，通过检索增强生成算法，生成高质量的答案。最后，通过实验验证，该技术在回答数据中心相关问题时展现出了较好的效果，有助于提升数据中心多源知识库的综合利用水平和服务质量。

关键词： 数据中心多源知识库大语言模型智能问答

中图分类号：TP181文献标志码：ADOI:10.19358/j.issn.2097-1788.2026.04.009
中文引用格式：王亮，张强，魏韵萧. 基于知识库的智能问答系统构建技术研究［J］.网络安全与数据治理，2026，45（4）：68-73.
英文引用格式：Wang Liang，Zhang Qiang，Wei Yunxiao. Research on construction technology of intelligent questionanswering system based on knowledge bases of data center［J］.Cyber Security and Data Governance，2026，45（4）：68-73.

Research on construction technology of intelligent question-answering system based on knowledge bases of data center

Wang Liang，Zhang Qiang，Wei Yunxiao

The 91001 Unit of the Chinese People′s Liberation Army

Abstract： With the rapid development of information technology, data centers have accumulated massive amounts of data. How to efficiently obtain valuable information from this data has become a key issue restricting data centers from exerting their military effectiveness. To address this issue, considering that intelligent question-answering systems, as tools capable of understanding users′ natural language questions and providing accurate answers, have broad application prospects in the field of data centers, this paper proposes a construction technology for intelligent questionanswering systems based on data center knowledge bases. First, focusing on users′ diverse data needs in different application scenarios within the military field, a data retrieval demand model is established. Second, for data retrieval demand models of different dimensions, a diverse knowledge retrieval correlation algorithm is proposed. Parameters such as correlation degree and recommendation degree between retrieval demands and candidate datasets are defined. Based on these parameters, the matching degree between candidate datasets and retrieval demands is calculated to find the most relevant candidate datasets. Then, the generated candidate datasets and users′ retrieval demands are transmitted to the large language model together, and high-quality answers are generated through the retrievalaugmented generation algorithm. Finally, verified through experiments, this technology has shown good performance in answering data center-related questions, which helps improve the comprehensive utilization level and service quality of multisource knowledge bases in data centers.

Key words : data center; multi-source knowledge bases; large language model; intelligent question-answering

引言

数据中心作为数据信息资源存储与处理的核心载体，承载着各业务领域的多源异构知识库，积淀了海量的数据信息资源。在业务应用场景中，针对知识库的信息获取，主要还是使用传统的人工检索文档或数据库的方式，存在着较大的效率瓶颈，难以满足高效信息获取的现实诉求。近年来，大语言模型(Large Language Model, LLM)技术在自然语言处理(Natural Language Processing, NLP)领域取得突破性进展［1-3］。凭借大模型参数规模和强大的语义学习能力，大语言模型能够对海量文本数据进行深度语义理解与知识挖掘，对各类自然语言的任务处理表现优异。如何依托大语言模型相关技术，提升数据中心多源异构知识库的检索效能，提高不同用户群体从海量数据中获取信息的便捷性与实用性，已成为数据中心业务保障中亟待解决的关键问题。智能问答系统的出现为该问题提供了有效的解决方案［4-5］，它通过自然语言交互模式精准理解用户查询意图并快速返回精准答案，显著提升了信息获取效率。

目前大量学者在数据智能检索与推荐方面进行了广泛研究，并取得了一定成果。陈晓云等［6］提出Apriori与IOGA融合的增量关联规则挖掘方法，有效提升AI问数机器人问答准确性。张超等［7］针对非结构化数据检索效率问题，提出基于语义智能识别的多模态检索方法，实现精准检索。袁凤源等［8］提出FFSREGNN方法，通过图神经网络与注意力机制融合特征，生成有效语义表示。杨运强［9］基于知识图谱构建智能问答系统，解决知识获取与语义理解难题。超木日力格等［10］提出MMSAF模型，借助高阶语义增强与自适应模态融合优化推荐效果。许惠惠［11］基于BERT模型构建算法框架，验证其在常识问答中的应用价值。李俊燕等［12］借助LLM，整合多模态遥感信息构建本地知识库，采用混合检索增强生成算法，结合轻量化Embedding模型语义映射，形成检索—推理链路，构建智能问答系统以实现遥感信息高效管理与智能化应用。董永涛等［13］利用大语言模型和检索增强生成技术，构建装备故障智能问答系统，提高了故障诊断效率。

考虑到军队数据中心主要承载军事领域业务数据信息，涉密程度高、专业性强，而且关联复杂、形式多样，导致传统大语言模型检索技术缺乏领域适配性，不仅对特定领域专业术语的解析精度不足，而且难以满足本地化数据存储与敏感涉密信息保护的核心诉求。为此，针对数据中心海量本地多源异构知识资源，本文提出面向军事领域的知识库驱动型智能问答构建方案。首先面向军事各业务场景中用户差异化的数据查询诉求，构建规范化的数据检索需求表征模型。在此基础上，设计多维度知识关联检索机制，通过量化检索需求与候选数据集间的关联程度、适配权重等指标，实现高相关候选数据的精准匹配与筛选。进而将筛选后的知识数据与用户原始查询一同注入大语言模型，结合检索增强生成策略，生成精准可靠的问答回复。在严格落实敏感涉密数据安全管控的基础上，基于局域网环境开展系统实验。结果显示，所提方法在问答效果上具备较好优势，有助于提高多源异构知识库的整合利用效率与智能化服务水平。

本文详细内容请下载：

https://www.chinaaet.com/resource/share/2000007061

作者信息：

王亮，张强，魏韵萧

中国人民解放军91001部队

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容