面向社交平台应急关联信息的文本分类综述-AET-电子技术应用

面向社交平台应急关联信息的文本分类综述

网络安全与数据治理

姜钰棋, 强子珊，卜凡亮

中国人民公安大学信息网络安全学院

摘要： 紧急事件发生初期，及时从海量社交平台数据中挖掘有效信息为应急响应提供决策参考具有重要意义。随着自然语言处理技术飞速发展，文本分类已被逐渐运用于该领域，主要可分为基于传统机器学习的K近邻、朴素贝叶斯、决策树、支持向量机等方法，以及基于深度学习的CNN、RNN、GCN、Transformer等方法。从算法原理、发展历程、适用领域及性能优劣等方面对当前主流的文本分类方法进行分析，调研了社交平台应急关联信息文本分类的研究现状与热点，归纳了现有方法面临的问题与挑战，展望了未来研究方向，为后续科研工作提供参考与启示。

关键词： 文本分类机器学习深度学习社交平台应急关联信息

中图分类号：TP391.1;TP18文献标识码：ADOI:10.19358/j.issn.2097-1788.2024.05.001
引用格式：姜钰棋, 强子珊，卜凡亮.面向社交平台应急关联信息的文本分类综述［J］.网络安全与数据治理，2024，43（5）：1-10，34.

Overview of text classification for emergency related information on social platforms

Jiang Yuqi, Qiang Zishan, Bu Fanliang

College of Information Network Security, People′s Public Security University of China

Abstract： In the early stages of an emergency event, timely extraction of valuable information from massive social media data holds great significance in providing decision-making references for emergency response. With the rapid development of natural language processing, text classification has gradually been applied in this field, mainly divided into traditional machine learning based methods such as K-Nearest Neighbor, Naive Bayes, Decision Tree, Support Vector Machines, and deep learning based methods such as CNN, RNN, GCN and Transformer. This paper analyzes the current mainstream text classification methods from aspects including algorithm principles, development history, applicable fields, advantages and disadvantages. It investigates the research status and hotspots of text classification for emergency-related information on social media platforms, summarizes the problems and challenges faced by existing methods, and presents future research directions, providing references and inspiration for subsequent scientific research work.

Key words : text classification; machine learning; deep learning; emergency related information on social platforms

引言

突发事件具有不可控性与未知性，一旦发生，后果往往难以设想。在应急处置过程中，如果要有效提升应急救援协调能力，降低突发事件带来风险并减少损失，那么对事件关联信息进行及时准确的收集、处理和共享就显得至关重要。

随着互联网技术的发展与智能终端的普及，网络文本逐渐成为大数据背景下一种重要的信息资源。在突发事件发生的紧急情况下，社交媒体会充当重要的信息交流平台，实时传递紧急事件的相关情况。因此，社交平台应急关联信息文本分类的研究已成为互联网时代的热点问题之一。许多学者开始关注社交平台应急关联信息的文本分类问题。即通过将社交平台上的信息划分为不同的类别来实现快速甄别，为应急救援部门提供及时、可靠的决策支持。所采用的研究方法可分为基于机器学习的传统分类算法与基于深度学习的分类模型。伴随着BERT［1］等大规模语言模型的问世，基于预训练模型的文本分类研究取得了突破性进展，分类准确度不断提升。随之而来的挑战也不可忽视。例如，社交平台上获取的信息通常是非结构化且由多种模态组成的，并且可能伴随大量的噪声信息，会大大增加分类的难度，使分类结果的准确性难以得到保证。因此，如何有效地筛选与处理信息数据，同时融合多模态数据进行更全面的分析，仍需进行深入的研究。此外，如何提高分类算法的鲁棒性和泛化能力，也是需要进一步深究的问题。

本文详细内容请下载：

https://www.chinaaet.com/resource/share/2000006009

作者信息：

姜钰棋, 强子珊，卜凡亮

（中国人民公安大学信息网络安全学院，北京100240）

Magazine.Subscription.jpg

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容