CCF BDCI大赛开启,国际级项目等你来战

点击左上方蓝字关注我们

在今年,诸多线下活动及赛事由于疫情的影响不约而同地选择了取消或者延期,甚至连奥运会也被迫延期到明年。但相对而言,线上赛事在今年却并未受到太大影响,甚至随着更多赛事改为线上,比赛的数量和质量都有了进一步提升,越来越多的开发者都投入到了参赛的行列中来一展身手。

在人工智能和大数据竞赛领域,由中国计算机学会举办的CCF 大数据与计算智能大赛(CCF BDCI)依旧是众多开发者追逐的顶级赛事。CCF BDCI大赛至今已经成功举办七届,累计吸引到来自全球25个国家、1500余所高校、1800家企事业单位及80余所科研机构的9万余人参与,有100多所高校将赛题作为大作业及毕业设计选题,足可见赛事的全球性影响力及其权威性、价值性。

飞桨领跑“自主平台”赛道,百度携手CCF打造CV+NLP双赛题

值得关注的是,本届CCF BDCI大赛在原有赛道外,首度设立了全新的“自主平台”赛道,百度首发 “遥感影像地块分割” 赛题,飞桨作为该赛题的指定深度学习平台为选手提供技术支持。不仅如此,百度和清华大学在算法赛道贡献了千言:多技能对话赛题。两道赛题总奖池达15万。无论你是CV还是NLP方向的开发者,这里都有你展示的舞台!

百度工程师为你答疑解惑,AI Studio练习场助你冲榜

本届大赛的赛题由来自百度视觉技术与自然语言学习的资深工程师亲手打造,赛题及数据均来自一线产业实践场景。为了能够让更多开发者深入理解赛题,并从比赛中学习到产业实践中最前沿的深度学习技术,来自百度的出题人将于10月28日、29日为参赛选手直播讲解赛题,从赛题的实际应用场景、基线模型搭建思路等角度详细解答你的困惑。快快扫码获取报名方式!

不仅如此,百度大脑AI Studio同步开放了【遥感影像地块分割】和【千言:多技能对话】练习场。并为各位参赛者带来了如下几大福利:

  • 额外测试提交机会:练习场为参赛选手提供A榜阶段每天附加1次的提交机会,助力你更好地验证模型效果。

  • 免费GPU算力:百度大脑AI Studio练习场为参赛选手额外发放100小时 GPU Tesla V100算力卡,报名即可在数据下载页获得算力码申请地址。

  • 官方基线系统:报名即可在数据下载页获得可一键Fork的基线系统。

  • 练习赛附加奖项:除主赛场奖池外,在练习赛中排名前50的选手可获得飞桨纪念品一份。

目前,【遥感影像地块分割】和【千言:多技能对话】赛题已经正式对外发布,快来一探究竟吧!

遥感影像地块分割

多源异构遥感数据 真实场景语义分割

在刚刚过去的夏天里,我国南方诸多地区遭遇洪涝灾害,对大家的经济生活造成了重大损失。自然灾难无情,但我们却逐渐有了更多的技术能力,在洪涝灾害预测、抗洪救灾等方面发挥作用,遥感技术便是其中之一。

通过对典型涉灾区域的基础地理数据集以及受灾前后的遥感数据集进行分析,遥感技术能够为地方政府、减灾机构和科研院所提供大量科学的数据支撑和信息保障,帮助把灾害损失降至最低,也能加速灾后重建。

此外,对遥感影像进行像素级内容解析,业界人士可以对遥感影像中感兴趣的类别进行提取和分类。遥感影像地块分割不仅在防汛救灾领域体现出极高的实用价值,在城乡规划、工业领域也受到了广泛关注。

本次大赛希望选手能够利用人工智能技术,对多来源、多场景的异构遥感影像数据进行充分挖掘,打造高效、实用的算法,提高遥感影像的分析提取能力。具体来看,需要考察选手基于飞桨打造的遥感影像语义分割模型在建筑、耕地、林地、水体、道路、草地6个类别上的效果

在复赛阶段,测评指标会加入区域连续性等评判标准。由于遥感影像的特殊性,道路、河流分割一直是遥感领域的一大难题。道路、河流这类区域在遥感图像上宽度一般不超过10个像素,使用视觉算法进行分割时,往往不能保证这类区域被完整、连续地分割出来。复赛阶段就是针对这类实际难题展开角逐。

本次比赛数据来自中科北纬(北京)科技有限公司提供的真实遥感数据,中科北纬是一家集应用软件研发、技术服务于一体的科技创新型企业,也是测绘地理信息全产业链的解决方案提供商。参赛队可以基于这些数据构建自己的语义分割模型,解决实际问题。

千言:多技能对话

百度X清华强强联合  多技能多领域综合评判

近年来,人机对话技术受到了学术界和产业界的广泛关注。学术上,智能人机对话是人工智能领域中最具挑战的技术难题之一,涵盖任务式对话与开放域对话,其发展影响及推动着语音识别与合成、自然语言理解、对话管理以及自然语言生成等研究的进展;产业上,众多产业界巨头相继推出了人机对话技术相关产品,并将人机对话技术作为其公司的重点研发方向。以上极大地推动了人机对话技术在学术界和产业界的发展。

作为智能人机对话的重要子课题,开放域对话技术旨在建立一个开放域的多轮对话系统,使得机器可以流畅自然地与人进行语言交互,既可以进行日常问候类的闲聊,又可以完成特定功能,以使得开放域对话技术具有实际应用价值,例如进行对话式推荐,或围绕一个主题进行深入的知识对话等。

目前,学术界已经公开了多个面向开放域对话建模的开源数据集。但大多数研究工作仅关注模型在单一或少量数据集上的效果。尽管一些模型在单一数据集上取得了很好的效果,但缺乏在多个不同技能、不同领域数据上的评价,与真正很好的解决开放域对话这一技术挑战还有一定距离。因此,本次竞赛数据基于百度发起的千言数据集(

https://www.luge.ai)及清华开放数据集(

https://github.com/thu-coai/CDial-GPT)进行构建,这个数据集收集了一系列公开的开放域对话数据,并对数据进行了统一的整理以及提供了统一的评测方式,期望从多个技能、多个领域的角度对模型效果进行综合评价。其中,“千言”是百度联合中国计算机学会自然语言处理专委会、中国中文信息学会评测工作委员会共同发起的,由来自国内多家高校和企业的数据资源研发者共同建设的中文开源数据集及评测项目。本次竞赛数据集旨在为研究人员和开发者提供学术和技术交流的平台,进一步提升开放域对话的研究水平,推动自然语言理解和人工智能领域技术的应用和发展。

本次竞赛的开放域对话数据集包含多个数据,涵盖了多个功能场景:包括日常闲聊对话,知识对话、推荐对话等。我们旨在衡量开放域对话模型在各个不同技能上的效果和模型通用性。

海阔凭鱼跃,天高任鸟飞。作为国内AI及大数据方面的大型比赛擂台,CCF BDCI的规模与影响力均属行业顶级,同时赛题全面、评审专业、奖品丰厚。如果你也想要一展身手,与各路大神同台竞技,那么千万不要错过哦!