文献标识码: A
DOI:10.16157/j.issn.0258-7998.212080
中文引用格式: 魏若冰,何家峰,邱晓芳,等. 基于SGCN的化合物致癌性预测模型[J].电子技术应用,2022,48(6):33-35,41.
英文引用格式: Wei Ruobing,He Jiafeng,Qiu Xiaofang,et al. Predict the carcinogenicity of compounds with SGCN[J]. Application of Electronic Technique,2022,48(6):33-35,41.
0 引言
由于技术的发展,新化合物的合成速度加快,每年诞生的化合物数以万计[1-2],传统的评价方法不可能对所有的化合物进行评估。并且近年来患癌人数不断增多[3],目前仍不清楚大多数的癌症是由于暴露于何种致癌化合物而导致的。世界卫生组织国际癌症机构(IARC)致癌清单中只有429种化合物被归为具有致癌性物质,但仍有500余种化合物未进行判定。传统的化合物致癌性评估主要通过实验测试进行,试验周期长且成本昂贵,不确定因素过多,因此迫切需要开发替代方法和工具来评估化合物的致癌性。
利用计算机进行毒性预测[4]是安全评价的重要手段,能够大幅度节省非临床安全评价试验成本,提高试验设计的科学性和准确性。随着机器学习的不断发展,支持向量机(SVM)、随机森林、神经网络(Random Forest)和K-最近邻(KNN)等机器学习算法已被广泛用于化合物毒性预测中[5-7]。此外,对致癌性化合物的预测也有一些报道。2004年,张晓昀等人[8]用人工神经网络中误差反向传播网络(BPNN)和径向基函数网络(RBFNN)对化合物的致癌性强弱进行了分类,模型的分类准确率达到了80%以上;2005年,张振山等人[9]用PCA对分子描述符降维,利用决策森林的方法预测化合物致癌性;在2007年,谢莹等人[10]基于gSpan算法,挖掘与已知毒性化合物具有相同字结构的化合物,进行未知化合物的毒性预测;2017年,梁倩倩等人[11]基于量化构效关系(QSAR)方法预测N-亚硝基化学物(NOCs)的致癌性,同年,阎爱侠等人[12]构建化合物的多维描述符,分别采用4种机器学习方法(朴素贝叶斯、随机森林、多层感知机和支持向量机),模型的平均正确率达到74%±3%。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000004415。
作者信息:
魏若冰,何家峰,邱晓芳,刘 旗
(广东工业大学 信息工程学院,广东 广州 510006)