基于多模态特征融合的社交媒体账号分类方法
网络安全与数据治理 10期
汤智伟,明 杨,费高雷,翟学萌,胡光岷
(电子科技大学信息与通信工程学院,四川成都611731)
摘要: 社交媒体账号分类方法从账号的属性信息出发,通过构建账号特征从而对账号进行分类,对从海量社交媒体数据中挖掘有价值的信息具有十分重要的作用。现有社交媒体账号分类一般基于用户发布的信息提取特征,存在账号信息描述不完整、分类有效性低的问题。针对上述问题,提出了一种基于多模态特征融合的社交媒体账号分类方法。该方法综合考虑账号自身属性、文本以及账号之间的社交关系等信息,使用张量分析的方法对账号所表现的多模态特征进行融合。相比现有方法,所提方法可以更好地利用账号的各种信息,获得更好的分类效果。通过实验,所提方法准确率达到了93.74%。
中图分类号:TP181
文献标识码:A
DOI:10.19358/j.issn.2097-1788.2023.10.001
引用格式:汤智伟,明杨,费高雷,等.基于多模态特征融合的社交媒体账号分类方法[J].网络安全与数据治理,2023,42(10):1-7.
文献标识码:A
DOI:10.19358/j.issn.2097-1788.2023.10.001
引用格式:汤智伟,明杨,费高雷,等.基于多模态特征融合的社交媒体账号分类方法[J].网络安全与数据治理,2023,42(10):1-7.
Social media account classification based on multimodal feature fusion
Tang Zhiwei,Ming Yang,Fei Gaolei,Zhai Xuemeng,Hu Guangmin
(School of Information and Communication Engineering, University of Electronic Science and Technology of China, Chengdu 611731, China)
Abstract: Social media account classification methods start from the attribute information of the account, construct the account features and classify the account, which is very important for mining valuable information from the massive social media data. Existing social media account classification is generally based on extracting features from the information posted by users, which has the problems of incomplete description of account information and low effectiveness of classification. To solve the problems above, the paper proposes a social media account classification method based on multimodal feature fusion. The method uses tensor analysis to fuse the multimodal features expressed by the account after comprehensively considering the information of the account′s own attributes, the text, and the social relationships between the accounts. Compared with the existing methods, the method proposed in this paper can better utilize the various information of accounts and obtain better classification results. Through experiments, the method in this paper achieves an accuracy rate of 93.74%.
Key words : social media; account classification; feature fusion; tensor decomposition
0 引言
随着社交媒体的兴起,用户账号的分类成为了研究者关注的问题。这涉及检测异常账号和识别相关主题账号。传统方法主要从账号文本信息或社交关系中提取特征,但存在特征单一和缺乏融合的问题[1] 。
为了更充分挖掘数据信息[2] ,多模态学习崭露头角。多模态学习充分利用不同信息类型之间的相关性与互补性,提供更全面的特征表示[3] 。多模态融合有两大优点:模态之间互补相关[4] ,且系统具备强容错性。然而,在社交媒体账号分类领域,多模态研究相对较少。
本文提出了一种多模态特征融合的社交媒体账号分类方法。在特征提取阶段,综合考虑了账号属性、文本和社交关系等多模态信息。在融合过程中,采用张量方法将这些多模态特征整合,以张量分解降低数据复杂性。多模态特征融合有助于捕捉各模态之间的联系,提高账号分类准确性和模型泛化性。
本文详细内容请下载:https://www.chinaaet.com/resource/share/2000005731
作者信息:
汤智伟,明杨,费高雷,翟学萌,胡光岷
(电子科技大学信息与通信工程学院,四川成都611731)
此内容为AET网站原创,未经授权禁止转载。