基于爬虫和TFIDF-NB算法的微博情感分析
所属分类:技术论文
上传者:aetmagazine
文档大小:544 K
标签: 微博舆情 网络爬虫 情感分类
所需积分:0分积分不够怎么办?
文档介绍:针对微博网络舆情信息量大、无规则、随机变化的特点,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,设计与实现了一个基于Scrapy框架的微博评论爬虫,将某热点事件的若干条微博评论进行爬取并存进数据库,然后进行文本分割、LDA(Latent Dirichlet Allocation)主题聚类,最后使用TFIDF-NB算法进行情感分类。实验结果表明,TFIDF-NB算法平均准确率高于线性支持向量机算法和K近邻算法,在精确率和召回率方面高于K近邻算法,具有较好的情感分类效果。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。