一、杯赛题目:基于FPGA CNN加速器的SSD_MobileNetV1模型目标检测实现
1. 基于百度Paddle-lite v2.9框架①(必须)、海云捷迅自研CNN加速器(可选,也可以使用自己设计的加速器)(包含卷积、DW卷积、RELU、RELU6、量化算法,其中量化是把计算好的32位定点转为浮点再转为8位定点输出)。
2. 基于该加速器Linux驱动示例,可以看到数据重整的方法。根据算子运行位置(PS、PL)的不同,参照驱动示例来重新排列数据。
3. 基于VOC数据集进行训练。
4. 对模型在要求的设计指标内进行各种优化操作,包括剪枝、量化等。
5. 提出设计方案,实现并完成指定测试图片集的目标检测功能。
6. 基础部分60分(满足设计指标),附加部分40分(在满足设计指标的情况下,按照推理速度进行评分)。最后总分按两部分相加得到。
7. 备注:海云捷迅会提供(杯赛钉钉群内下载):
1) FPGA配置文件
2) CNN加速器相对应的Linux驱动示例
3) Paddle-lite v2.9①、SSD_MobileNetV1②(全精度版本) 的Demo程序;驱动示例;CNN加速器FPGA配置文件
1. 模型部署完成,能正确识别图片数据。
2. 帧率不低于2帧。
3. 精度不低于65%。
在满足设计指标的情况下,按照推理速度进行评分
性能/帧率(FPS) | 分值 |
2.5 | 10 |
3 | 13 |
3.5 | 16 |
4 | 20 |
4.5 | 22 |
5 | 24 |
6 | 26 |
7 | 28 |
8 | 30 |
9 | 35 |
10 | 40 |
1. 汇报PPT:项目介绍、关键技术介绍、性能指标
2. 详细设计方案:系统架构分析、关键技术分析、性能分析
3. 工程源码、仿真以及测试报告。
内容 | 分值 | 评分要求 |
1.性能指标 | 30分 | 1.能正确的实现模型部署,并达到2帧要求。15分 |
2.精度不低于65%。15分 | ||
3.设计完整性 | 15分 | 1.完整的设计方案。5分 |
2.完整的源码工程以及注释。5分 | ||
3.完整的仿真以及测试报告。5分 | ||
4.文档质量 | 15分 | 1. 汇报PPT重点突出、条理清晰。5分 |
2. 设计方案原理分析合理、逻辑清晰。5分 | ||
3、源码规范,注释清晰,仿真以及测试报告详细充分。5分 |
1. 基于Paddle-lite v2.9的DEMO工程。包括驱动文件以及FPGA配置文件。
2. 海云捷迅人工边缘智能实验平台使用手册。
3. 飞桨官方网站https://www.paddlepaddle.org.cn/
4. 《Cyclone V Hard Processor System Technical Reference Manual》
5. 《AIGO_C5MB_V10 Schematic》
6. 《Cyclone V SoC 开发板产品手册》
1. 参加杯赛的作品,杯赛出题企业有权在同等条件下优先购买参加本企业杯赛及单项奖获奖团队作品的知识产权。
2. 大赛组委会对参赛作品的提交材料拥有使用权和展示权。
①此PaddleLite版本是经过移植版本,非官方版本。如果需要进行训练,需要使用PaddleDetection 2.1(官方版本,可自行修改、优化),git commit:c37747460e3476c2e841f6cd2502959894a1c22c,可能需要依赖于PaddlePaddle(2.1.3)
②为飞桨官方全精度SSD_MobileNetV1模型
③提交资料以模板为准