当前位置:首页 > 人工智能 >

依图科技朱珑和他的人工智能创业经

2021-05-07 19:30:37

前段时间做“关注系列报道”,有人推荐我采访依图科技的创始人兼CEO朱珑,他的简历很让我感兴趣。一是他的背景。大学洛杉矶分校统计学博士,师从Alan Yuille教授(艾伦`尤尔,视觉学界奠基人之一,也是霍金教授的得意门生)从事视觉的统计建模和计算的研究,之后在麻省理工学院实验室担任博士后研究员,2011年获得国际视觉算法竞赛“图像目标检测”项目冠军。无论是师从的导师还是所在的实验室,都在领域赫赫有名。

二是他在做(),而且是在2012年还没有热的时候就开始。所以关于全球的发展、关于,我想朱珑应该有很多值得关注的信息。

因为朱珑在上海,所以第一次约的是电话采访,但效果不理想。在朱珑出差北京的时候,又有了一次面对面的交流采访。采访前30分钟交流的是()业界话题,朱珑给出的核心信息是这一轮的热潮是“”(deeplearning)带来的,其他的方法、技术、流派通通过时,甚至包括现在已经取得很多商业成功的IBM的Watson体系,也没入他的“法眼”。

这与上次对他电话采访时观点一致,我并不完全认同朱珑的观点,目前通用的技术没有出现,任何流派都有它善于的领域,考量它得看解决问题的成本和效率。基于此,我想关于业界话题和流派之争继续交流下去,恐无其他答案。

于是决定停止业界的话题,把采访转向朱珑的,因为任何观点最好的证明是要看它解决问题的效果。依图科技刚刚拿了几千万美元的B轮,从天使轮的真格基金,A轮的红杉资本、高榕资本,到B轮云峰基金等,也都不是钱多了没事随便乱花的主,人不会仅仅看朱珑的背景而一投再投,朱珑和依图身上有什么可以复制的经

市场的“痛点”在哪?公安局长给三分钟时间

朱珑首先进入公安领域既有必然性也有偶然性。对于者,如何把一个看似稍纵即逝,只在眼前闪了一下的偶然性变成必然性,紧紧抓住是关键。

2012年的时候,没有现在热。尽管在2010年,IBM的系统Watson已经在电视《边缘》节目中战胜人类赢得冠军,但还没有像今年谷歌AlphaGo与李世石下棋那样,引来全民关注。在Yann lecun(FaceBook实验室主任)实验室做研究的朱珑还是闻到了“要来”的气息。

尽管当时很多同学毕业去了华尔街,朱珑也可以在博士毕业后去做教授,但朱珑还是决定回国,并找到了当时在阿里云平台做技术负责人的同学林晨曦,准备一起。因为朱珑觉得做了这么多年的研究,要想创造价值还得放到具体的业务应用场景中、以解决实际问题来创造价值。通常把理想变成现实最好的路径就做公司,用产品化的方式解决问题。

问朱珑为什么觉得2012年的时候的工业化应用已具备条件,他没按常理给出“数据积累、需求、算法技术成熟”等等的逻辑答案,只是说虽然当时还没有被产业界广泛采用,但是有一种感觉就是它离产业化非常近、非常近了。“就是那样一种感觉。”

通常“学院派”出身的人更喜欢分享产业话题。但是两次接触下来感觉朱珑则刚好相反,很多事情在他看来就是“一种感觉”,如果大家在一个层级里,你能够懂得这感觉,但如果不在一个层级里,说再多似乎对方也不会懂。“要想有大师一样的视觉,得有大师一样的积累。”而在现实的世界里回答问题,得要拿实际解决问题的效果说话。朱珑说他和中国行业客户打交道,“如果你拿不出特别好解决问题的效果来,他们特别瞧不起你。”

目前看,现在的机会在2B的行业市场,因为有需求、有购买力。而从的机会来看,市场机会在行业监控市场,这个市场有巨大的刚需,无论是、还是城市管理或是等都有旺盛需求和很多痛点。在几个可选的行业中,应该说朱珑首先进入公安领域既有必然性也有偶然性。从必然性来看,公安刑侦破案需要大量的视频、图像的比对需求,尤其需要从海量视频监控数据中精准、快速找到要找的犯罪目标,目前国内在这个维度与国外技术相比还是相对落后的。从偶然性来看,这与苏州市公安局副局长所给出的“三分钟”见面机会密切相关。对于者,如何把一个看似稍纵即逝,只在眼前闪了一下的偶然性变成必然性,紧紧抓住,是关键。

在各种市场机会的切入中,朱珑透过各个渠道找到了苏州公安局主管技术的副局长。副局长只在课间休息给了朱珑三分钟见面机会。看着朱珑的一大堆“学术”背景,全球三大实验室的博士,图像目标测试的冠军,局长说:“好呀,我们现在套牌车的识别率不到30%,如果你能将识别率提升到70%,我就考虑用你们的。”因为很多名牌大学都没把这个课题做下来,局长只认效果。学术背景只能“敲敲门”,能否进来还得看你的“砖”够不够“硬”,副局长给了朱珑几个星期的时间。

找到“魔鬼”和捅开“窗户纸”

如何捅破问题的“窗户纸”?怎么优化、取舍、结合?怎么把“魔鬼”找到?需要物理学家精准描述世界的气质和找到“魔鬼”细节的感觉。

接下苏州公安局长话的活儿,朱珑和林晨曦他们做了几个维度的事情。一是研究实际应用场景,找到解决问题的关键维度。其二把图像识别理论和产业难题和业务结合,变成这个应用场景的算法模型。“不是产品,它需要和具体的应用场景结合,解决具体问题。”一个算法模型并不适合所有的应用场景。这两个维度都非常关键。

就像网吧监控和道路行车监控需要捕捉的关键点就不一样,车牌识别之所以识别率不高,事实上选择识别的维度同样是关键。在过去对车牌的识别焦点主要车牌上,光线、车速,都会影响它的识别效果,而且还有很多套牌车,随时换牌。

朱珑他们想到如果能够将“车牌”与“车脸”同时识别,其识别率精准率就大大提高。因为很多套牌车常常会更换车牌,但是“车脸”和“车型”却不能更换,主流车型就那么几十种,“车脸”就那么几十种种,依图是第一个想到把这两个维度结合在一起的。就像人对一个车第一眼的识别和记忆一定是“车脸、颜色、车牌”同时摄入而不只是去盯着车牌的道理一样。

似乎想到“车脸”这事不是难事,但很多事情就这么一层“窗户纸”,当所有的人都把注意力集中在车牌这个“死胡同”出不来的时候,谁能够跳出想到其他关键维度,这个灵感就是那种说不清楚的“感觉”。这个感觉应该来自两个维度,除了朱珑在各名师下“耳语目染”的积累,同时也应该与他们每天见5拨警察,和他们几乎是泡在一起,体会他们的现实场景和工作场景的“悟道”有关。

我搜索依图科技的公众号,看过一段朱珑与上海交大学生做讲座的视频,有几个印象很深的信息。一是朱珑说Alan Yuille给了他物理学家精准描述这个世界的“气质”。

他谈及了他的导师Alan Yuille教授,这个霍金的学生,物理学博士毕业,既在UCLA统计系任职,同时又在心理学系、系、精神病学、行为学系任客座教授,研究过量子引力、、视觉、神经建模、认知模型等。朱珑说:“这个导师给了我不一样的物理学家精准描述这个世界的气质,一种不一样的颗粒度。”

很多人应该会觉得朱珑认为导师给了他“物理学家描述这个世界的气质”,这个说法比较有趣,通常很少有人说导师给了自己一个气质。不过应该说朱珑的表述是精准的,百度里关于气质的定义是就是“表现在心理活动的强度、速度、灵活性与指向性等方面的一种稳定的心理特征。”对事物感受的强度、速度、灵活性和指向性不一样,才能做出和别人不一样的东西,这确实是朱珑老挂在嘴边的“那种感觉”。

二是“idea is cheap”,魔鬼藏于细节之处。”朱珑说,不管是在学术界还是行业领域,在全球顶级的学府、实验室和企业中,每个创新的idea都是聪明人都会想到的,而在英雄所见略同之后,决定成功的关键在于执行的每个细节中,这是由数学、物理、工程等基本功体现出来的。

几个星期之后,朱珑何团队是如期做到了超过局长希望的识别率,超过了预期,也敲开了公安领域的门。除了车,后来依图又做了人脸的识别,有一个数据,依图系统在武汉公安局的实现证件照首位命中率是97%,盘查照对比首位命中率是94%,识别对比命中率是全球领先水平。四年时间,目前依图的产品进入了公安、、、海关、电信、地产等,从识别车、识别图、识别人脸,从抓嫌犯到保平安到城市管理以及。

为什么朱珑能够把识别率做到更好,仔细体会朱珑讲过的这些话,里面有“秘籍”。现在有很多行业的痛点,如何捅破这些“窗户纸”?怎么优化、如何取舍,怎么结合,怎么把“魔鬼”找到?这其中的“玄机”或许从朱珑的话里你会有启示。

IBM在对未来技术创新趋势分析中这样认为:未来新一代信息技术比较大的创新机会,一是在IT基础学科领域,二是在IT与行业结合点上。正是这个IT与行业的结合点,是难点也有大量的机会。比如要做输变电的创新,IT人就必须爬到电线杆上去。朱珑和他的团队就得“泡”在公安的各种场景里。只有这样才可能找到“藏在细节里的魔鬼”。

记者曾经采访IBM研究院Watson项目的研究院员,IBM一开始做Watson的时候,把业界最好各个细分领域的技术成果放入系统中,回答问题的精准率并没有提高多少,却是通过不同方式的配比和调优和取舍,最后准确率不断提升到99%。

朱珑的下一个“尴尬”

进入领域有几个难题,一是怎么解决资源、数据源的问题,怎么把经验和结合?二是怎么让医生建立对机器判断的信任问题

朱珑没有透露目前依图的销售收入。从依图官方介绍信息上看,依图目前员工是100多人,人均估值超千万美元,按照这个数字推算,依图的目前的估值超过10亿美元。目前依图还在招兵买马中。下一个领域朱珑最想做的是什么

朱珑说了一件“自己像傻子一样”的尴尬事。去医院看病,费了很多时间取号排队,见了医生,只是几分钟就把他给打发了,开了几盒药。“什么病?什么原因?怎么得出的结论?为什么开这些药?这些药和其他同类的药有什么区别?疗效怎么样?对于我适用吗?”所有的问题全部没有答案,就领了一堆药回去了。“一个顶级的IA科学家在领域看病的时候完全就是一个傻子。”

“我得解决人在生命面前变成医学‘文盲’的这个脆弱”。朱珑决定进入领域,从识别图像入手,怎么就知道这个片子上有病灶?怎么就知道它是不是?朱珑给学生做讲座的时候说过一句话,人眼不容易分辨出双胞胎的细微差异,但是很容易就分辨出来,机器可以看到人眼看不到的东西。应该帮助医生提高诊断质量和盖上患者就诊体验,朱珑接下来想重点做这个事情。

进入领域有几个难题,一是怎么解决资源、数据源的问题,怎么把经验和结合?二是怎么让医生建立对机器判断的信任问题?记者曾经采访过英特尔中国研究院院长宋继强谈及IBMWatson在领域的推进,宋继强认为,目前Watson最大的成果是已经建立起机构、医生对Watson的一定的接受度和信任度。

大公司有大公司的玩法,公司有公司的路数。朱珑曾经说,目前各大公司在上的水平怎么样其实他清楚,因为在这些公司的做核心人是他的同学或做研究的前同事,这个人在做什么,水平如何,能做到什么程度,彼此清楚。

所以在不在核心圈子,是不是关键人很重要,对于进入一个新的领域也应该同理,都要找到对的核心人。就像当初朱珑找林晨曦,除了他俩是同学对路子外,林晨曦做,有大规模分布式计算的能力,和朱珑的能力互补,计算能力和能力是图像识别都需要的两方面。接下来朱珑会找一个有核心资源的人。

“一个人是不是我想找的人,是一种感觉,交谈10分钟能够知道。”朱珑说有了第一步才有可能有第二步,只有解决了第一个问题,把东西做出来,效果显现出来,才有可能建立信任度和接受度的问题。公司要做的不就是把一个个的“0”变成“1”吗,有了“1”才有可能“2”有“3”,“3”生万物嘛。什么时候都有机会,因为这个世界永远都需要更便宜、更高效的解决之道。


工资条 https://www.yygongzi.com/
忆笙生活网