面向图像识别的深度学习VLIW处理器设计

作者:李林 张盛兵 吴鹃

关键词: 图像识别 深度学习 卷积神经网络 超长指令字(VLIW) 处理器 可扩展

摘要:为了适应航空航天领域高分辨率图像识别和本地化高效处理的需求,解决现有研究中计算并行性不足的问题,在对深度卷积神经网络模型各层计算优化的基础上,设计了一款可扩展的多处理器簇的深度学习超长指令字(VLIW)处理器体系结构。设计中采用了特征图和神经元的并行处理,基于VLIW的指令级并行,多处理器簇的数据级并行以及流水线技术。FPGA原型系统测试结果表明,该处理器可有效完成图像分类和目标检测应用;当工作频率为200 MHz时,处理器的峰值性能可以达到128 GOP/s;针对选取的测试基准,该处理器的计算速度至少是CPU的12倍,是GPU的7倍;对比软件框架运行结果,处理器的测试精度的平均误差不超过1%。


上一篇:一种面向分布式读写分离系统的数据同步策略
下一篇:高温氧化对304不锈钢红外发射率影响研究

版权所有 @  西北工业大学   陕ICP备05000471号
地址:西安市友谊西路127号   邮编:710072