基于浮栅器件的低位宽卷积神经网络研究 | |
所属分类:技术论文 | |
上传者:zhoubin333 | |
文档大小:450 K | |
标签: 卷积神经网络 量化 存算一体 | |
所需积分:0分积分不够怎么办? | |
文档介绍:浮栅器件(Flash)能够将存储和计算的特性相结合,实现存算一体化,但是单个浮栅单元最多只能存储位宽为4 bit的数据。面向Nor Flash,研究了卷积神经网络参数的低位宽量化,对经典的AlexNet、VGGNet以及ResNet通过量化感知训练。采用非对称量化,将模型参数从32位浮点数量化至4位定点数,模型大小变为原来的1/8,针对Cifar10数据集,4位量化模型的准确率相对于全精度网络仅下降不到2%。最后将量化完成的卷积神经网络模型使用Nor Flash阵列加速。Hspice仿真结果表明,相对于全精度模型,部署在Nor Flash阵列中的量化模型精度仅下降2.25%,验证了卷积神经网络部署在Nor Flash上的可行性。 | |
现在下载 | |
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。 |
Copyright © 2005-2024 华北计算机系统工程研究所版权所有 京ICP备10017138号-2