小微企业如何实现智能化转型?百度EasyDL助瀚才咨询实现AI落地

新基建背景下,各企业的智能化转型升级将催生更多新应用、新场景,推动着自身领域高效与高质量的发展,作为“新基建”的七大领域之一,AI 不断深入到各行各业。对于小微型企业,如何让AI落地于实际业务、更好应用于企业战略,也是众多企业CEO与创业者探求的问题之一。

9月29日,AIIA2020人工智能开发者大会百度产业AI技术应用公开课上,北京瀚才咨询有限公司(以下简称:瀚才咨询)行业总监谭笑然从小微型企业实践者的角度,为大家分享使用百度面向企业开发者提供的零门槛AI开发平台——EasyDL,将AI落地业务应用的经验。

(图示:瀚才咨询行业总监谭笑然发表演讲)

以下为演讲实录:

大家好,我叫谭笑然来自北京瀚才咨询,是一名拥有八年猎头经验的90后,考古学本科,没有任何技术背景,2018年开始涉足人工智能与猎头行业的业务结合。之前几位分享主要是一些规模型以上的工业、制造业企业。我今天站在一个小微型企业的角度上跟大家来聊一聊,EasyDL这个产品对于小微企业在复杂文本分类业务上的感受。

先做个简单的介绍,我们公司其实只有4个人,是由四个独立猎头组成的工作室,也正是因为这样的组织形态致使我们没有了在企业工作时候的基础服务,我们四个人各自在家办公,也没有固定的办公场所没有办法招人,迫使我们不得不尝试通过技术的手段来解决业务中的一些问题。我本人由于是文科,所以对于技术目前只具备非常简单的代码能力。之后,和EasyDL结缘也是2018年看到猎聘展示了通过视频面试加上AI技术,通过识别语言、语速、表情识别出候选人个人特征和风格,我也是在那个分享上感受到人工智能强大的力量,开始尝试把业务和工作相结合。

接下来,从三个方向简单说一下今天的分享,包括行业痛点、解决方案和达成效果。猎头行业往上升格一点叫现代服务业,本质是对于信息收集处理和再利用的过程,高端一些像艺术品拍卖行,中端一些像猎头,以及大家身边的中介都属于现代服务业的范畴。对于这个行业来讲,从业人员对行业知识了解程度、技能水平以及信息的处理能力,很大程度上决定了客户服务水平和工作的效率。

猎头行业痛点

人才信息辨别难

首先,猎头行业痛点就是以下几点:

  • 我们工作中会涉及到大量的信息。

  • 大量信息对于行业新人来讲,没有办法很好的处理、辨别。

  • 这些信息很大程度上决定了服务的质量。

  • 行业经验积累要靠时间,无法在很快的时间内简单快捷高效地赋能新人。

于是我们开始尝试用人工智能来解决这个问题

(图示:猎头行业痛点)

举一个地产行业的例子。这两张图都是猎聘的截图,两个人职位都叫事业部总经理,但实际上两个人分别任职于旭辉、中粮,其中一个人主管几个省,每年所负责项目年产值、年销售额超百亿,另一个人主管一个项目,项目销售额在三五个亿到十几亿之间,但是职位叫法一样。对于工作人员、新入行朋友来讲,怎么来分辨旭辉事业部和中粮事业部总经理?

大家可能会觉得这个信息规则很好总结下来传递给对方,但大家可以想一下,互联网行业头部、独角兽、小厂有多少家,事业部、专业方向有多少,不同公司采用不同的职级序列,关键这些信息随时都是在变化,这是一个不可控的因素。更大的不可控因素是简历,同样的阿里P6有人给自己定职位叫“专业总监”,有人叫“资深运营专员”,这是作为猎头无法控制的。所以,我们就开始尝试通过人工智能的手段,通过大数据的手段将行业专家的经验总结归纳起来,用于训练业务中遇到的各种数据。

(图示:同title不同级的“事业部经理”)

业务、技术

双解决方案并行

我们的解决方案主要分为业务解决方案、技术的解决方案。我完全不会写代码,技术这部分EasyDL作为面向没有开发能力或者微量开发能力的用户群体来讲已经做的非常好了,界面完全是可视化,整个流程不需要一点代码技术就可以完成定制模型的生产,解决业务需求。比如,解决方案前期用的经典版,准确率已经可以达到85%,后期使用EasyDL专业版,对模型进行进一步调优,准确率提高到了95%。

(图示:瀚才咨询业务解决方案)

今天主要从业务层面来跟大家说一下我们的解决方案。我们的文本是无穷无尽的,就算数量有限,可以编文本,把用于训练的文本资料尽可能地贴近我们的业务需求。在业务流程中有几个点:

第一,训练的原始材料要足够干净,百度提供了足够多的技术和相关的解决方案,比如OCR、分词等很多功能,可以把文本分类原始语料弄得足够干净,相比之下,我们之前的方案并没有把语料进行清理,很长时间内训练出来的结果是非常差的状态。

第二,对于文本分类可以通过用若干个模型来达成最终的分类的业务需求,一个人公司加职位用了三个模型,包括职能模型、职级模型和公司系数模型,把这三个模型结果放在一块,最后得到的结果就是关于这一条信息的准确结果。如果不拆开来讲,想用一个模型达成三个方向的效果,往往效果不会特别的好,所以第二点就是大家一定要把业务或者想分类的方向拆的足够细,最后才能达成比较好的效果。

第三,EasyDL产品中今年5月份新增了智能标注功能,通过标注少量的数据就可达到与全量标注接近的效果,很多类似于中小企业、小微企业没有用上先进的技术,可能都是在了标注这一个环节深陷泥潭。实际上在5月份进行标注功能升级之后,从一次完全人工的文本标注用了4个人一个月的时间,到一个人用一个星期就能把十万条数据标注清楚,这是非常大的提升,也非常有效地帮助了我们后续版本的迭代。

最后,百度EasyDL产品其实有着非常强大的运算能力,外行人这么理解的,其实他们给了我们机会可以通过小步快跑、不断迭代的方式不断实验出你的分类方向,你的模型的设置,模型中标签设置是否有效、是否符合业务方向。以上这四点是在业务层面解决方案上的分享,如果一些朋友涉及到研发和业务层面冲突情况,至少文本分类的领域,我觉得在业务上可以用更小的成本来达成我们要的目标,而不一定非得让程序员改代码,实际上EasyDL没有用代码。

而实施技术上的常规方案时,我们先经历了数据的清洗,图片、表格文档的识别工作,把文本清理干净之后经历了人工和智能两轮的文本标注、数据标注,最后经历了若干轮的迭代以及模型的验证,最后有了四个目前正在使用、效果还不错的模型。

(图示:瀚才咨询EasyDL定制文本分类技术方案)

EasyDL模型辨别近50万

候选人简历,准确率高达九成

目前,最好的模型准确率达到了95%,至少有十来个标签,十多个选项的文本分类上能够达到这样的准确率,我个人觉得还是很高的状态。现在这五个模型已经良好运行了将近一年,帮助我们成功识别了将近50万候选人的简历,帮助我们给候选人简历都打好了业务中对应的标签。可能过往需要几个应届生做一天的工作,现在十分钟以内就可以通过筛选标签找到合适的人选。工作效率、经济效率也有一个非常大的提升。

(图示:瀚才咨询EasyDL模型达成效果)

这次分享,我想跟大家分享下技术给我们工作带来的改变,我们4个人的小工作室,每个人年均产值不到一百万,只要我们想也可以拥抱技术,也可以享受技术给我们带来的工作效率上的改变,我们“小作坊”做出来的东西也能给身边的朋友使用,以后如果有机会的话也希望做成一个能够商用的产品,希望能够对行业工作效率有一些帮助,谢谢大家。