关键词:AI,深度学习,工业AI,工业视觉检测,工业质检
摘要:客户研发了一款基于人工智能深度学习的工业图像采集、标注、训练和分析系统,能够解决传统机器视觉系统难以应对的复杂检测场景,但对于硬件的规格、性能、处理能力、稳定性、适配性、噪音、温度、湿度等有很高的要求及标准,因此舜源科技从运算能力、运行稳定性、质量可靠性等维度为客户提供了一套可定制化服务的解决方案。
客户介绍
客户是一家为工业领域提供人工智能解决方案的公司,专注于端到端AI技术基础研究及计算机视觉技术应用研发,聚焦于电子制造业、汽车零部件制造业和精密机加工制造业,用AI机器人替代人工及传统机器视觉设备做表面外观缺陷检测,致力于用先进的人工智能技术赋能高端制造业。
项目背景
客户研发了一款基于人工智能深度学习的工业图像采集、标注、训练和分析系统,能够解决传统机器视觉系统难以应对的复杂检测场景,通过机器训练扩大识别种类、提升准确率、加快识别速度、节省人力成本、优化整体效率。但是不管是工业相机/传感器等检测设备对数据的精确采集,还是运行智能检测系统所需算力要求,均对硬件的规格、性能、处理能力、稳定性、适配性、噪音、温度、湿度等有很高的要求及标准。因此需要定制化搭建强自适应、高效加速、灵活拓展、软硬结合的系统基础架构。
解决方案
客户本次提供的软件系统为新一代高性能产品,对硬件的要求非常高。在和舜源合作前,客户搭载过市面上很多标准的IT基础架构产品进行测试,但是在测试的过程中一直没有办法很好地保障系统运行的稳定性。针对这种情况,舜源科技从运算能力、运行稳定性、质量可靠性等维度为客户提供了一套可定制化服务的解决方案。
超强算力设计
为了更好地发挥新产品系统的性能,本次方案采用10张英伟达高性能GPU卡作为算力平台,单张GPU卡的算力在默认哈希值为106MHS的环境中测试,最高可达到121MHS左右,算力水平远超行业同类产品,完全满足工业领域更高精密检测需求。
机箱结构设计
10卡GPU方案在行业应用中目前没有可参考的成功案例,强劲的计算性能对空间结构设计、散热设计和供电设计都有严苛的要求,考虑到之前在测试中发现的问题,在此次方案优化中,我们对机箱的结构系统做了重新设计调整,优化后的4U结构机箱系统可以支持搭载10张双宽全高GPU卡,同时可兼容NVIDIA GTX及RTX系列的GPU卡。
稳定性设计
1、散热设计是这次方案需要重点考量的问题,我们采用GPU卡仓前置设计方案,确保GPU在运行中能吸入更多低温空气,降低显卡的热度;
2、设立有独立GPU散热风道,形成前进后出的通风散热通道,可以及时带走机箱内的大量热量,确保服务器的稳定运行;
3、设计多重供电方案,确保在追求最大计算性能的情况下,也能为整个系统架构提供稳定的供电保障,保障计算系统的可持续性运行。
优质服务保障
1、提供项目专属对接工程师;
2、提供从方案设计、架构部署到系统环境部署搭建、测试保障体系等全流程的解决方案服务;
3、提供优质的培训及售后服务。我们针对本项目所提供的设备进行技术培训,包括运行操作、维修保养及设备简易故障的判别、排除等;同时具有7*24小时值班制度,维修、维护人员实时快速响应售后问题。