物流效率提速中,百度飞桨与京东物流激发出时代火花

点击左上方蓝字关注我们

数字经济的高速发展,给物流产业带来了翻天覆地的变化,以大数据、人工智能等新技术实现的科技赋能对行业的变革作用愈发凸显。9月29日,在AIIA2020人工智能开发者大会百度产业AI技术应用公开课上,京东物流智能供应链产业平台研发总监王梓晨受邀出席,与现场嘉宾分享京东物流与百度飞桨深度学习平台碰撞出来的“火花”,以及在飞桨助力下的智能园区综合解决方案。

(图示:京东物流智能供应链产业平台研发总监王梓晨发表演讲)

以下为演讲实录:

百度飞桨助力京东物流

大家好,我是来自京东物流的王梓晨,也是百度黄埔学院第三期的学员,今天我分享的主题是当京东物流邂逅飞桨。对于物流行业而言,成本、效率、体验是永恒不变的追求,京东物流通过不断挖掘新场景,探寻新模式,以做出更好的产品,致力于做全物流行业的基础供应链设施。

京东物流团队已经利用飞桨进行了许多实践,先是在京东快递的小程序上,通过智能文本识别,将照片或者粘贴的文字信息自动识别出姓名、地址、电话等详细内容。紧接着,针对整个物流园区,从库房下单、分拣中心到运输整个全流程,飞桨的图像分类套件PaddleClas、目标检测套件PaddleDetection、图像分割套件PaddleSeg等开发套件都给予了很大帮助。

随着计算机视觉的应用越来越多,我们逐渐将应用部署在边缘侧,给用户更直接、性能更好的体验。在部署时,采用飞桨PaddleSlim的模型压缩技术对需要大算力的模型进行压缩。经过团队实测,部署在边缘侧的服务器,甚至是仅有一点计算能力的小摄像头上面,整体效率提升可达65%以上。现在,我们逐渐从中心侧部署转移到每个库房的端侧,以及摄像头的端侧部署,同时也用到了百度零门槛AI定制开发平台EasyDL,和一套辅助团队进行可视化模型开发的工具VisualDL。

在实际用ERNIE做的时候还是遇到很多问题,比如在做物流信息输入时,需要识别出来姓名、地址、电话。但拿名字来说,不是人们都输入真实姓名的,很多人只输入像橘子、漂流瓶等昵称,这样使得我们将百家姓全部拷贝下来都不行,这时候就可以用ERNIE来帮助我们进行识别。不仅姓名识别是这样,电话识别也不容易。

因为很多人都会在前面加上区号,比如:香港区号+852,是很难和座机号码识别区分。但这都不是最难的,最难的应该是地址,可能很多人都不知道自己所在的乡镇街道,而现在的物流行业又非常依赖乡镇街道这个四级地址,第一是因为便于计算运费,第二是根据它来计算时效,根据它来计算库存。如何让用户输入具体地址,让系统倒推,对我们来说十分的困难。

但最终我们依靠京东几十亿地址库和ERNIE也成功实现了,当然也是不断做一些纠正。如果我们都能打很好的标的话,这个问题就不是很难的问题,之所以需要用数据解决这些问题,是由于我们不可能有那么多人打那么好的标。整个过程还是比较困难,我们对它前后的关系之间做了一个简单模型,类似“到了给我打电话”、“到了放到门卫”、“右转二百米”等信息都需要我们过滤,ERNIE会帮我们筛选这些词,大大提升了效率。我们最终识别了不同的标志,并用其来做分割,识别出来标准的行政区划以及送达关键的地址。到现在整个姓名和电话识别率已经非常高了,地址识别率也是在98%以上,目前数据已经可以达到98.9%以上。

(图示:物流行业的“追求”)

智能园区综合解决方案

接下来说到我们最近在做的一些CV的场景,以前传统的物流仓库+分检公司,工作人员至少八千以上,所有都是人工操作。我们目标就是让传统的人工操作全都变成机器自动操作,所以我们逐渐从一些摄像头切换到自己集成的摄像头,做了全流程CV方面的监控方案,并搭载传感器IoT设备对它进行优化。

车辆进入园区时识别车牌、通知车辆前往月台、检测车辆是否有违规操作、装车时间是否符合规范,这都是CV检测的场景。以月台抵达车辆识别场景为例,识别车辆是否抵达需要先识别车牌,但从一个大体积的图象中直接识别车牌是非常困难的。

所以第一步,我们先把车辆标记出来,检测车辆;第二步再去找对应的车牌,但车牌的种类非常多,双重车牌,货车车牌五花八门,我们从视频流24帧里取4—6帧来做样本的提取之后,先对这些数据进行初步的预训练,在做预训练过程中发现很多样本不均衡,由于光照、曲面、折射角等等造成图像本身的问题。

我们通过飞桨不断提升前置和后期质检类的工作,最终实现全国双层车牌识别达到99.5%以上。我们对整个过程做一个总结,同时也结合在黄埔学院第三期的课程,通过POC验证关键的四步做提炼。

首先第一步是明确需求,如何将业务模型转化为技术描述,界定出清晰的技术指标;第二步是数据优化,接不同的摄像头后,视频流如何截取、如何做样本均衡、如何做清洗的过程;第三步是模型选型,车牌识别预训练的过程,如何通过一个比较好的模型来做训练,以及如何做一些域值的分割以及边缘检测工作;第四步是部署,我们在部署上不断压缩成本的同时,也希望给用户更直接的反馈,我们从原来T+1的算法逐渐变成了T+2、T+3,服务到一线操作人员这一层。后期我们也搭载了不同的IoT硬件,并且发现飞桨“神奇”的轻量化推理引擎Paddle Lite,能够兼容多种芯片。

在今年刚上黄埔学院第三期课程时,讲师分享的口罩识别案例与我们之前和公安局人脸库打通做的巡检机器人产生了联系。京东的园区内,已经用巡检机器人代替了巡检人员。巡检机器人和公安系统打通,当发现疑似犯罪分子时会持续跟踪目标。今年3、4月份我将口罩识别模型加进去以后,戴口罩识别的场景也及时覆盖了。

我们基于飞桨逐渐做了更多的场景,比如说是否戴了安全帽,是否穿了反光衣,以及包裹在滑道行进过程中是否可能在某一个角堵塞、什么原因造成堵塞、有什么人员干预会比较好,比如说是分检员决定包裹流向的处理,还是交接过程的人员处理,根据不同的职责对各种异常做不同的处理。其中飞桨PaddleSlim和Paddle Lite在这些场景应用中大放异彩。

(图示:智能识别预警管理)

协同共生的生态联盟

我们整体应用上线后,也沉淀了很多基础的东西,这是一个从SAAS到PAAS的结构。我们拥有各种对外的、大型的SAAS服务,SAAS还分了很多层,比如提供快递服务里面的智能文本识别,以及其他下沉的业务组件,同时也用AI、区块链、IoT等组件,加之我们的业务推进打造更好的PAAS层组件。

(图示:技术即服务:T-PaaS底座)

PAAS组件一定是最小的解决业务问题的技术组件,通过对PAAS做了多层,最上层是承接SAAS和业务问题,底层是对接各种不同的设备。整体我们希望不断沉淀出更好的京东物流+飞桨的T-PaaS组件。所以我们在飞桨上做了很多物流的最佳实践,构建了很多基础模型库,针对物流行业解决了现在很多痛点问题,我们不断在成本效率和体验上做优化。

在不断使用飞桨的过程中,也是不断的在贡献,我们将方案输出给其他物流公司,让他们也加入我们一起为飞桨助力。飞桨无形中将包括物流公司在内,和其他的伙伴做了链接,大家不断的在使用飞桨做优化、提建议。飞桨正促进着全国的生态建设,通过数据来驱动,为所有开发者建立一个协同效应。

最后希望我们能为行业赋能,中国制造加油!

课程回放链接:

https://aistudio.baidu.com/aistudio/education/group/info/1561

如在使用过程中有问题,可加入飞桨官方QQ群进行交流:1108045677。

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

·飞桨官网地址·

https://www.paddlepaddle.org.cn/

·飞桨开源框架项目地址·

GitHub: 

https://github.com/PaddlePaddle/Paddle 

Gitee: 

https://gitee.com/paddlepaddle/Paddle


扫描二维码 | 关注我们

微信号 : PaddleOpenSource

点击下方“阅读原文”,进入AI快车道全国巡回报名页面

↓↓↓