不可靠语料库的提纯及词权度量指标IDF的改进
所属分类:技术论文
上传者:aet
文档大小:447 K
所需积分:0分积分不够怎么办?
文档介绍:不良短信的泛滥严重影响了社会风气,干扰了人们正常的生活秩序,研发不良短信过滤技术具有相当高的实用价值。研究了文本分类中的两个问题,可应用于不良短信过滤。其一是应用聚类方法进行不可靠语料集的提纯,实验表明,该方法对不可靠数据的提纯效果比较明显;其二是关于IDF词权度量指标的一点改进。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。