旷视研究院院长孙剑讲述：中国技术何以打败Facebook、Google拿下世界第一

美丽说/2017-11-20/ 分类：科学技术/阅读：

COCO 2017竞赛，在旷视科技首席科学家、研究院院长孙剑博士的带领下，旷视研究院一举夺得三个冠军：参与了COCO物体检测、物体分割和人体关键点检测三项任务的挑战，取得了两项第一(物体检测、人体关键点)，一项第二(物体分割);还在Places语义分割环节战胜谷 ...

　　COCO 2017竞赛，在旷视科技首席科学家、研究院院长孙剑博士的带领下，旷视研究院一举夺得三个冠军：参与了COCO物体检测、物体分割和人体关键点检测三项任务的挑战，取得了两项第一(物体检测、人体关键点)，一项第二(物体分割);还在Places语义分割环节战胜谷歌夺得第一。孙剑博士也是深度残差网络ResNet作者之一，最近倍受关注的AlphaGo Zero的一个关键技术便是ResNet。

　　2017年11月8日，孙剑博士出席了由新智元举办的 AI World 2017世界人工智能大会上，并发表了《视觉端计算：从ResNet到ShuffleNet》的主题演讲。

　　孙剑博士此前提到，旷视成功的秘诀是创新，不断地创新，持续不断地创新。在接受新智元专访时，他分享了如何做到本质创新的秘诀：本质创新是希望能触及问题的本质，但也分两个层次。

　　“大层次来看，算法要解决问题，有两种: 一种是定义问题、理解问题。今天，人工智能很多问题是不清楚的，因为人工智能属于跨学科的研究，以机器学习为基础，有计算机视觉、语音处理等等问题牵扯在一起，其中很多问题没有定义清楚。所以在讲算法创新的时候，首先要看需要解决什么问题。我认为最高层次的算法创新是对问题的理解以及新的看法。所以首先要理解清楚问题，才能够有本质创新。换句话说，只有方向正确了，才可能做出好的算法，这是比较高的层次。

　　另外，对问题的理解需要挺长时间。如果想真正深刻理解一个问题的话，非常聪明的人可能要花两三年，不聪明的人可能需要五年，这样才可能对问题有非常深刻的理解。理解以前都做了什么?你现在做的这个东西是不是有意义的?这是上一层的算法创新，深入理解和清楚定义问题本质之后，算法才有意义。

　　下面一层的算法创新是说，今天在一定时期内发现了一个新问题，然后去找一个算法把这个问题又快又好地解决。

　　这里遵守两条准则，第一条准则是这个算法必须有一定的推广性，不能太特殊。比如说做物体识别，举个例子，原来我们曾经做过猫头检测，利用猫的耳朵比较尖的特性做了算法，这个问题解决了，但没有通用性，影响力就不大。

　　第二个原则就是别人会不会用、会不会重复使用你的算法。如果你是在学术界或者要公开算法的话，只有别人主动愿意用你的算法，才能形成网络效应。你自己很看好，但是别人不看好，或者说别人并不去主动用你这个东西，说明你的这个东西没有触到用户的痛点。其实，你的同行也是你算法的用户，如果他们不得不主动使用你的算法，这就说明真正触及到了问题的本质，这条是非常重要的。我们以前在大公司做的一些算法，今天还有很多人用。我们今天在Face++做的算法(ShuffleNet)，第二天就有公开的开源社区，去实现这个算法，他们在不少大公司和创业公司都第一时间用了这个算法。这就说明你的算法特别好用，这样的东西就是本质性创新。”

　　旷视研究院院长的带兵之道：读《孙子兵法》，鼓励出论文，不在乎数量

　　孙剑博士曾谈到，在带领团队拿到COCO竞赛冠军方面，做好了三件事：建团队、激励团队、培养团队。在接受新智元专访时，孙剑详细分享了如何带领好一个团队，吸引更多的人才。

　　他说：“带团队这件事情其实是多层次的。我最近看《孙子兵法》上讲的，为将者首先要智勇双全，要仁、要严、要信，还要做到明，谁做得对、谁做得不对要非常明。大致就是建立一个很好的文化，建立一些大的框架，哪些是我们应该做的，哪些是不应该做的。要围绕着我们公司的价值观，我们公司价值观叫“追求、极致、简单、可靠”，这几个字对一个团队非常重要。“追求、极致”有两个含义，一个是说我们要做到最好，另一个是说做这件事情的时候要付出最大的努力，把所有的潜力都发挥出来。”

　　“从人才观上的话，我们当然是希望找最聪明的人，我们要求并不高，你只要数学还不错就可以。你如果线性代数还可以，编程还可以的话就可以做这件事情。我们的环境非常扁平化，所有的数据代码基本上都是共享的，所有的知识都是共通的，包括我们内部的MegBrain。你如果想了解每个细节，就可以找MegBrain的开发者，他会给你讲细节，到底MegBrain怎么设计的、怎么优化，你会学到这些东西，可以有一个很自由的空间来做这件事情。还有一个很大的因素，让大家觉得创新是安全的，是他愿意冒风险去做的。我大多数时候都不会说不要做这个、不要做那个，而是说你试试看，这样让大家有一个安全的、愿意探索的环境，提高命中率。”

　　在AI人才非常稀缺的今天，孙剑表示，在研究院，我们鼓励出论文。这在国内外的创业公司里面应该是少数现象。“因为很多优秀人才希望他们的工作一部分可以被看到。我们通过这样的方式吸引人才”，他说。

　　但是，旷视对论文数量没有要求。“我们对任何的事情都没有数量要求，哪怕你只有一篇论文，但只要满足创新的两条原则，第一它是通用的，第二别人愿意用，只要有一篇这样的论文就可以。我以前自己做研究，每次会议投稿时会花很长时间只做两篇论文，我自己主做一篇，另一篇让学生做，或者跟别人一起做一篇。我们不追求数量，只要有一篇了不起的论文就可以。”

　　以下是旷视科技Face++首席科学家孙剑博士在新智元AI World 2017世界人工智能大会上的演讲：

　　孙剑AI WORLD 2017世界人工智能大会演讲：

　　《视觉端计算：从ResNet到ShuffleNet 》

　　孙剑：各位好，非常高兴新智元提供了这样一个机会把我们做计算机视觉研究的人聚在一起，也非常高兴见到以前的老朋友，比如腾讯的贾佳亚博士，我们之前曾经一起做计算机图形学和计算机摄影学。刚才贾佳亚展示了一张图：那是2004年我们俩合作的第一篇siggraph论文。当时非常难，不亚于今天去 COCO 或者 ImageNet拿一个冠军。今天到场的嘉宾中，华先胜博士也是我在微软的同事。计算机视觉在深度学习的推动下，发生了天翻地覆的变化，今天也在此分享一些我最近的工作。

版权声明 本文仅代表作者观点，不代表本站立场。
本文系作者授权本站发表，未经许可，不得转载。

TAG：

阅读：

扩展阅读：

下一篇：2017中国信息技术主管大会在京召开上一篇：微软广州云暨移动应用孵化平台启动 1亿南沙产投基金发起

旷视研究院院长孙剑讲述：中国技术何以打败Facebook、Google拿下世界第一

快速导航