基于注意力与Bi-LSTM混合算法的车企舆情情感分析
信息技术与网络安全
李宸严,刘 继
(新疆财经大学 统计与数据科学学院,新疆 乌鲁木齐830012)
摘要: 随着大数据时代的来临,网络舆情对消费者情感分析和商家营销策略产生重大影响。如何利用大数据技术提高车企舆情情感分析效能,受到文本挖掘研究者广泛关注。针对传统RNN在长文本分类中的长期依赖问题,提出了一种注意力机制与Bi-LSTM结合的混合分类算法(At-Bi-LSTM)。算法利用Bi-LSTM分析车企网络评论的情感,引入注意力机制计算不同单词对评论情感的贡献权重,降低长文本中无关词对分类结果的影响。实验证明,At-Bi-LSTM算法在车企舆情情感分类上取得了比朴素贝叶斯、SVM、LSTM更好的分类效果。
中图分类号: TP391.1
文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2021.01.008
引用格式: 李宸严,刘继。 基于注意力与Bi-LSTM混合算法的车企舆情情感分析[J].信息技术与网络安全,2021,40(1):45-49.
文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2021.01.008
引用格式: 李宸严,刘继。 基于注意力与Bi-LSTM混合算法的车企舆情情感分析[J].信息技术与网络安全,2021,40(1):45-49.
Public opinion sentiment analysis of automobile enterprises based on attention mechanism and Bi-LSTM
Li Chenyan,Liu Ji
(School of Statistics and Data Science,Xinjiang University of Finance,Wulumuqi 830012,China)
Abstract: With the advent of the era of big data, online public opinion has a significant impact on consumer sentiment analysis and business marketing strategy. How to use big data technology to improve the efficiency of sentiment analysis of automobile enterprises′ public opinion has been widely concerned by text mining researchers. Aiming at the long-term dependence of traditional RNN in long text classification, a hybrid classification algorithm(At-BI-LSTM) combining attention mechanism and Bi-LSTM is proposed. The algorithm uses Bi-LSTM to analyze the emotion of online reviews of automobile enterprises, and introduces attention mechanism to calculate the contribution weight of different words to the sentiment of comments, so as to reduce the influence of irrelevant words in long text on classification results. Experiments show that At-BI-LSTM algorithm achieves better classification effect than Naive Bayes, SVM and LSTM.
Key words : attention mechanism;Bi-LSTM;public opinion of car enterprises;emotion classification
0 引言
2020年7月,习近平总书记在一汽研发总院调研时指出:汽车制造业国际竞争激烈,要把民族汽车品牌搞上去,如何提升品牌的形象和溢价效应是首要问题。随着互联网的发展,车企的发展规划、车辆品质、创新水平都受到广泛关注[1]。网络评论暗含网民丰富的情感,通过对评论情感的挖掘,车企可了解近期的网络舆情,从而采取相应的应对措施。因此研究车企网络舆情情感,对提高车企形象、维护车企利益具有十分重要的意义。
舆情情感识别的关键在于对文本情感的识别[2]。当前情感识别方法有两类:基于情感词典的方法、基于机器学习的方法。基于情感词典的方法利用情感词能映射情感倾向的特点,通过测度单词与情感标签的关联度来构建情感词典,依据文本中的情感词判断其情感类别[3]。此方法虽能实现文本的情感分类,但存在三方面问题:(1)网络用语的盛行对情感词典的构建和维护提出了新的挑战;(2)处理二义性的词语时分类效果不佳;(3)无法考虑上下文的语义信息。基于机器学习的方法逐步成了情感识别领域的主旋律。PANG B等[4]人最先在电影评论的情感分析中应用了最大熵、SVM、朴素贝叶斯三种机器学习方法。大量实验证明,基于机器学习的方法在解决情感识别问题时的性能优秀。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003316
作者信息:
李宸严,刘 继
(新疆财经大学 统计与数据科学学院,新疆 乌鲁木齐830012)
此内容为AET网站原创,未经授权禁止转载。