击败微软谷歌! 中国领军企业旷视科技称雄世界AI大赛
作者: 来源: 2021-04-05 20:06:33
当地时间10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)的 “Joint COCO and Places Recognition Challenge” Workshop 中公布了 COCO 及 Places 竞赛排名情况。中国领军人工智能企业旷视科技Face++团队一举击败了来自微软、Facebook、Google、商汤科技等企业,以及卡内基梅隆大学、北京大学、香港中文大学、上海交通大学等高校的竞争者,拿下三项世界冠军,成为了第一个在 COCO 竞赛中获得多项冠军的中国企业。
据悉,在COCO、Places共七项的挑战项目中,旷视科技研究院团队(Megvii)参与了四项挑战,并赢取了三项第一、一项第二的成绩。
MS COCO (Microsoft Common Objects in Context,常见物体图像识别) Challenge 是继 ImageNet(已停办)之后,计算机视觉领域最受关注和最权威的比赛之一,也目前是图像(物体)识别方向的唯一标杆,更是目前国际领域唯一一个能够汇集 Google、Microsoft、Facebook 三大巨头,国际顶尖院校以及优秀创新企业共同参与的大赛。与关注整体图像的 ImageNet 图像分类任务相比,COCO 中的物体检测任务更关注的是图像中出现的每个物体的个体(比如各种小物体,各种遮挡物体),因此要求算法对图像细节有更好的理解。这个比赛也代表了继 ImageNet 后的图像识别的最高水平。
图:旷视科技Face++参赛团队
COCO 从2015年开始举办,至今已经三届,前两届物体检测冠军分别是 MSRA 和 Google。今年的 COCO 包含四个 Task: Detection Challenge(物体检测)、Instances segmentation(物体分割)、(Human) Keypoint Challenge(人体关键点检测)、Stuff Segmentation(背景语义分割)。其中旷视科技Face++团队参与了前三项任务的挑战,并取得了两项第一(物体检测、人体关键点),一项第二(物体分割)的杰出成绩。
图:COCO Challenges Ranking Result
而 Places 是由 MIT 和 CMU 等高校牵头,在今年新设立的一项旨在深度理解图像场景的国际级计算机视觉类竞赛,今年与 COCO 联合举行。Places 2017 共设有三个任务:Scene Parsing(场景分割)、Instance Segmentation(物体分割)、Semantic Boundary Detection(边缘检测)。旷视科技Face++团队只参与了其中物体分割的挑战,并击败了主要竞争对手 Google,赢得了该任务的冠军。
图:旷视科技团队超过第二名Google 4.5个绝对百分点
而对于产业界来说,机器对于人体、物体和场景的理解十分重要。此次旷视研究院在 COCO 和 Places 竞赛中的成绩足以印证旷视科技在全球范围内的技术领先性。利用具有竞争力的技术优势,旷视研究院与产品中心将持续在产品开发中共同推进技术转化,展开行为识别、场景分割、物体检测和物体分割等技术在互联网金融、智能安防、城市大脑、新零售、手机等实用场景或行业中的应用探索,以实现技术价值最大化。
旷视科技首席科学家、研究院院长孙剑表示,这次旷视科技能够一举在这个竞争最激烈的比赛中,第一次代表中国企业拿到分量最重的三项冠军,主要依赖三个法宝:
1. 旷视拥有自研并全员使用的深度学习引擎 MegBrain,它使我们可以以最快的速度系统化训练算法;
2. 旷视研究院拥有对深度学习和计算机视觉算法长期而深入的研究积累。虽然旷视很少在国际数据集竞赛上“刷榜”,但其实内部的技术指标一直都非常高,借这次机会拿出来和大家分享一下;
3. 旷视研究院除了拥有充沛的计算资源,更重要的是拥有一个鼓励不断高速创新的环境、和追求极致的文化。
“最后遥祝我们远在威尼斯的团队,我为你们感到骄傲、为中国科技企业感到骄傲!”旷视科技首席科学家孙剑博士表示。此外,参与竞赛的旷视研究员也在采访时发表了自己的感想:“对于我来说,赢了是团队好输了当然是自己做得不够好。这次比赛,我特别要介绍旷视研究院的Platform组。他们负责维护和建立上千块GPU的集群,支持各种功能。而我们,动辄要求几十上百块GPU跨机训练,给他们造成了前所未有的压力。但是,他们每次几乎立即处理问题,并以最快的速度解决。这是我见过的最敬业,效率最高的Team. 每一块奖牌后面都应该有他们的名字。”