巨大的需求之下 人工智能如何更快落地?

文/小羿

1月17日,由网易科技主办的“网易创业Club周年庆典”在北京举行。在大会现场,北极光创投副总裁蔡伟、依图科技联合创始人林晨曦、图灵机器人CEO俞志晨、SenseTime CEO徐立围绕“人工智能如何进入商业世界”展开了一系列对话。

目前机器人在哪些方面达到了人的水平?

巨大的需求之下 人工智能如何更快落地?

从人工智能的发展阶段来看,大家都觉得经过狭义的人工智能,弱人工智能,进入到广义的人工智能,强人工智能,到最后的超级智能。然而,从这些阶段来看,中国乃至整个世界还是在弱人工智能的情况下。所谓弱人工智能,在某一个领域,某一个方面,机器能够达到人的水平。具体细分的领域,机器人在哪些地方已经达到人的水平了?

SenseTime CEO徐立介绍,人工智能和人最大区别,人对很多事情不是非常确定,在做的时候,目标会发生变化。但是人工智能,需要确定的。在情感领域,人工智能不擅长,它擅长确定性的事务。在偏主观的方面,人更胜一筹。

林晨曦认为,机器有天生不会疲劳的优势,稳定的优势等等。在细分领域下,有特定的任务当中,人工智能的技术或者是计算机视觉技术已经在非常多细小的领域里面大大超越人的水平。比如人脸识别,机器对陌生人的识别已经远远超过人的水平,比如让一个人比对两张陌生人照片,对人很困难,机器就可以。

图灵机器人CEO俞志晨认为,其实从过去的发展来看,真正跟人类生活贴近的话,还是在一些所谓的智能增强(IA)。不管是我们过去用的计算机、手机,还有包括将来的机器人产品,将来能够更好地跟人互动。还有一个观点是,将来的人工智能(AI)可能不需要人的存在,像无人汽车是辅助驾驶未来可能不需要人的干预。但是从目前产品的本质来看,智能增强会更加实在一些,更加务实一些,谈人工智能还是比较抽象,很虚的事情,这是我自己的看法。

总之,人工智能在某些特定的领域已经达到或者是超过人的水平,还有一个IA在机器人领域是更实用,更适合市场发展的观点。

对于技术和市场的匹配度,有哪些挑战?

依图科技联合创始人林晨曦认为,机器人行业起来的时候有非常大的困难,因为试错的成本除了商业的成本之外,还多了技术的成本。林晨曦谈到:“人工智能是由核心技术驱动的行业。很多时候,你看到很多商业机会的时候,你不知道这个技术能不能达到。我们创业,是有了技术,再看市场中有哪些机会,可以最快应用这个技术。”徐立称,从技术到行业应用的角度看,人工智能落地能力的延伸,以及如何落地更快、更接地气是一个很大挑战。

俞志晨则指出了一个非常尖锐的问题,他说,”不管是大公司还是小公司,都在扯人工智能,但是你会看到,基本上找不到一个消费级的产品,说它是人工智能,远没到那个阶段,离我们真正的预期还有很远很远。“基于此,图灵机器人要想摆脱市场整体尴尬现状,会聚焦在针对儿童市场的机器人产品上,”我们希望在儿童机器人领域真正体现人工智能的能力和水平出来,我们的远景也很直接,希望智能机器人产品能够走进每个家庭。“

蔡伟总结到,我们在做人工智能的时候不能盲目追求于它的水平有多么多么高,而是如何找到合适的市场切入点。也许这个时候进去没有那么高的壁垒,但是能迅速打开这个市场,慢慢再往上延伸,这是非常好的,特别是对于一个创业公司非常有益的一些经验。

深度学习是否将统治人工智能的算法?

巨大的需求之下 人工智能如何更快落地?

深度学习,是一种处理大数据的模式,具备预测性。深度学习是网络的,表达能力足够强的,是一种记忆性的学习。它其实是看足够多的数据,把他能见过的东西都进行记忆,使得网络能处理更多的场景。那么,未来更好的应用场景是在哪里,未来在人工智能的算法里,是继续深度学习继续统治这样的市场,还是各种算法都能找到它各自的应用场景?

 

徐立认为,深度学习是人工智能领域一个很关键性的技术,未来发展的潜力还是非常大。不过,他同时指出,深度学习目前还是在初步的阶段。谷歌和Facebook的做法是通过不停的尝试,通过试验性来做,还没有理论上的突破。在这个阶段,人工智能和深度学习的关键技术还处于飞速的发展期。在这个阶段可以带来的每年的突破其实是非常大的。俞志晨称,深度学习至少从目前来讲,在可确定模式的智能领域还是可以解决很多问题的,但是在将来还是需要在一些底层技术,包括在一些模式方面有很大的突破。

林晨曦却不大同意这种观点,他认为,在一些典型的任务上,原来传统的模式长时间不能突破这个瓶颈,当深度学习突破了,大家就觉得这件事情非常非常的有效果。“事实上,不用深度学习的方法也能让人突破到很高指标的时候,其实这件事情是双方可以探讨的,只是算法层面上来讲可以探讨的。”林晨曦说道。

而图灵机器人CEO俞志晨则表示,家用机器人在接下来的几年会以快速的方式进入家庭。

以下为对话实录:

主持人: 除了VR,另外一个比较热的领域是人工智能,发展到今天到底有多智能,有没有可能代替人脑,有没有可能会出现很多好莱坞影片里面很多恐怖或者是让我们期待的景象,有请北极光创投副总裁蔡伟做5分钟的演讲,人工智能如何进入商业世界,有请蔡总!

蔡伟:非常荣幸今天能够参加网易创意俱乐部的周年庆典,如果大家对人工智能的发展经历比较熟悉的话就会知道,人工智能不是新的概念,在1956年美国的约翰·麦卡锡提出人工智能的概念之后,已经过了半个多世纪了。在这个过程里面,人工智能经历了两轮的停滞和发展,其中有两次资金非常衰竭的冬天,在1973年和1987年,还有两次各种理论跟范式大发展的春天。从2012年开始,人工智能经历了井喷的发展,主要原因是基于以下三个因素。

第一个是计算能力的突破,GPU等并行计算能力的发展。

第二个是互联网,移动互联网时代带来的大数据的积累。

第三个是先进的人工智能算法的提高,包括深度学习里面的卷积神经网络,长短期记忆等等。

从投资者的角度来看,我们最近一直聊人工智能对未来的发展,大家都有一个共同的共识,人工智能可能是未来除了移动互联网之外,在未来十年一个非常非常重要的平台。我们其实可以看到一些数据,据统计,2014年,VC在人工智能领域投资的金额就有3亿美金,比2013年涨了三倍,2015年的统计数据还没出来,我们有一个预估,这个数字是在两倍到三倍以上。如果拿这个数跟今天在移动互联网VC的投资相比还是非常小的。我们可以看到这中间的成长空间是很大的。同时人工智能并不仅仅只是一个资金的竞争,同时也是一个人才的竞争。如果对人工智能非常熟悉的朋友也可能知道,有些学术的大牛都纷纷进入谷歌、Facebook、百度的人工智能实验室,Uber今年建立的人工智能实验室,几乎整个请了CMU旗下的机器人国家研究所整个的团队。在这样的形势下,大家都觉得发展得很快,同时从用户的角度,像刚才大家提到的电视、电影、小说都描述了一个生动的场景。比如说像斯皮尔伯格《A.I》,他会懂得感情,2015年有一个《机械姬》,机器人出现了自己的意识同时也战胜了人类。宅男比较喜欢的《HER》,在中国有中文译名叫《云端情人》,很多人都被剧中系统好听的声音以及超级牛的能力,令男主角深深陷入到爱情的萨曼莎折服。从用户的角度,会给整个社会设立一个希望值,这个希望值还比较高。

人工智能发展到现在,到底到什么程度,有哪些已经达到或者是已经超过了人类的水平,有那些还离得比较远。与此同时,从技术应用到回归商业本质,应用回归到市场的时候,匹配度有多少。去年开始深度学习已经是横扫了整个人工智能算法的市场,他的未来还会是同样的进程吗?作为一个初创公司,如何跟科技的巨头进行竞争,这些都是非常有意思的议题。我也不想在这里做一个论断,我想在下面的对话环节中,跟三位优秀在人工智能非常优秀的企业家共同交流这些有兴趣的议题。

主持人:我们按照蔡总的指示,有请依图科技联合创始人林晨曦、图灵机器人CEO俞志晨、SenseTime CEO徐立。三位一同对话人工智能如何进入商业世界,有请三位。

蔡伟:如果大家对人工智能的发展有些了解的话就会知道,我左边坐的这三位CEO或者是联合创始人,他们的公司都是非常优秀,领先于同级一两个身位的企业。我想先请三位公司的老总对他们自己和公司做一个简单的介绍。

林晨曦:大家下午好!我是来自依图科技的联合创始人,我叫林晨曦,在创办依图科技之前,我是在阿里巴巴云计算负责底层飞天操作系统,我的搭档朱珑今天没有来,他是美国UCLA大学毕业的,他的老板是霍金的学生,之后他在MIT和NYU都待过,NYU的老板是卷积神经网的发明人。

俞志晨:大家好,我是图灵机器人的俞志晨,我们2014年11月份发布的第一款产品是一个在云端开放的AI引擎,主要提供了对答系统,我们一年时间有差不多13万的企业和开发者,因为它主要是面向开发者和中小企业的。去年11月份发布了一个图灵OS,是一款操作系统,主要是面向家用机型这一块儿,我们主要是在机器人和人工智能这一块儿做了很多事情。

徐立:我是SenseTime的CEO徐立,我们公司的中文名字叫商汤科技,我们三家都是做2B的这么一个业务模式的,可能大家并不太知道我们的产品是什么,我也来说一下我们想要做的,也是用人工智能去改变更多的智能产品,能够改变大家真正的生活。

我们的目标是在“改变”这两个字上,而不是改善,我们想做的还是有突破性的进展。最近我们也发布了一些产品,我们和合作伙伴一起联合发布的,大家如果能听得到的话,前段时间微博放出来的面孔相册用的是我们的人脸技术,微博相机里面图像的滤镜,不知道大家用不用美图,美图秀秀的人脸美妆这一部分。这两天我们合作伙伴告诉我们,有一个相对比较火的应用,脸萌的Faceu,人脸的技术也是我们提供的,我们想用这一些智能的技术来慢慢改善大家的生活。

蔡伟:谢谢三位老总的介绍。包括主持人大家都有一个非常好奇的问题,从人工智能的发展阶段来看,大家都觉得经过狭义的人工智能,弱人工智能,进入到广义的人工智能,强人工智能,到最后的超级智能。从这个阶段来看,中国,整个世界还是在弱人工智能的情况下。所谓弱人工智能,在某一个领域,某一个方面,机器能够达到人的水平,我想请问一下三位老总,从目前具体细分的领域,有哪些地方你们觉得机器已经达到人的水平了?比如说图象识别、语音处理、自然语义处理、机器人等等,请三位老总从各自的角度分别谈一下。

徐立:我谈谈我对人工智能这个点的看法,人工智能和人最大的区别,人对有些事情并不是非常确定的,人在做很多事情的时候,目标是会发生变化的。我们说人工智能,机器学习的时候,通常需要设定一个唯一的确定的目标。刚才蔡总说到的,在什么领域上,或者在某些领域上不能超越人的情况,我认为这是分成两层。一类偏主观的,偏情感的东西,我想现在机器并不擅长做。它擅长做的事情是一些比较确定性的,人能够给出明确指令目标的,他可以通过大的数据,通过这样的运作来达到超越人的目标。对于我们来说,我们公司现在的研究员2014年3月份曾经发布了一款产品,第一次在市场上超过了人眼识别的准确率。这就是我们在做人脸识别这么一件事情上,同样的我们也会做另外一件事情,测颜值,哪件事情更容易超过人呢?看上去好象识别非常难,但是现在我们识别这件事情,判断是还是不是,如果是一个明确的答案比较容易做到,在给定的场景下超越人,当然这是在限定的场景下。另外一种偏主观的,判断人漂不漂亮的问题上,人可能还更胜一筹,这是我的理解。

俞志晨:人工智能这件事情听起来特别抽象,太虚了,其实从早期人工智能开始到现在,更大的争议,在产业界,AI和IA之间的分歧,IA是智能增强,AI是人工智能,这两个主线是过去几十年科技产业界的交叉式发展的过程,人工智能更多的是偏学术的更多一些,产业界还是在IA的关注度更高一点。其实从过去的发展来看,真正跟人类生活贴近的话,还是在一些所谓的智能增强,不管是我们过去用的计算机、手机,还有包括将来的机器人产品,将来能够更好地跟人互动。这里的主线,将来的人工智能机器人到底还要不要人存在,一个观点,很多的工作,无人汽车是辅助驾驶,还是根本不需要人存在的东西。这两个观点是关于人工智能,机器人大的主线。从目前来看,最终从产品的本质来看,智能增强会更加实在一些,更加务实一些,谈人工智能还是比较抽象,很虚的事情,这是我自己的看法。

林晨曦:我说说我们依图的想法,前面提到了人工智能这个话题其实非常大,关键词也是随着时间的演化,一会儿火起来,一会儿又冷淡下去,一会儿又再火起来,承载着大家对它不同的期待。依图这家公司实际上只是做了中间很小一块儿,计算机视觉这一块儿,我们谨小慎微的希望觉得能够参与或者是见证这样的过程,机器能够看懂三岁小孩眼中的世界,这是我们定义一下,假定三岁小孩眼中的世界能看懂的话,机器就已经具备了一定的视觉智能的角度。这件事情到底做下来的时间会有多长呢?非常难说,我觉得学术界没有一个统一的结论多少年之后完全看到了三岁小孩的世界,可能是十年,也可能是二十年,也可能是五十年,我们大概是抱着这样的心态,开始做这家公司,开始做这家尝试的。

如果落到细分的领域上来讲,这些年的过程当中,我们也看到了非常多让人惊奇,比较意外的这些现象,刚才提到了人脸识别,商汤科技也提到了,我们公司开始做人脸识别的时候,也从来没有想到有一刻人脸识别的技术,尤其是在对陌生人识别的水平上远远超过人的水平。可能大家都会觉得每天看很多人,每天都认识非常多的人,从来都不会觉得人脸识别是一件困难的事情。但是对于一个人来讲,拿两张陌生人的照片让你比对是不是一个人,事实上这是非常困难的过程,机器的准确率远高于人,这还是不考虑人长期看这些照片产生疲劳的情况下。

机器有天生不会疲劳的优势,稳定的优势等等。在细分领域下,有特定的任务当中,今天其实人工智能的技术或者是计算机视觉技术已经在非常多细小的领域里面大大超越人的水平,可以在商业的领域产生非常巨大的价值。

蔡伟:人工智能在某些特定的领域已经达到或者是超过人的水平,还有一个IA在机器人领域是更实用,更适合市场发展的观点。

今天年会的议题就是“回归商业本质”,人工智能很多技术上非常大,可能发展为很多不同的阶段,具体到三位的公司里面,都会面临技术和市场所匹配的问题。有时候技术没有那么强,即使技术没达到,但是也是有市场的。有可能已经比人强,但是市场的需求还更高,这个匹配度反而还没那么高。我想问一下三位,对于技术和市场的匹配度,在三位从事的领域是怎样的,从现在来看面临的挑战会是哪些?

林晨曦:我们从事的行业叫计算机视觉,这个行业这几年刚刚开始突然变得火起来,我们在创业的头一天,大概2012年的时候认真讨论过这个问题,问题在于什么呢?这个行业为什么不会更早火起来,或者更多的企业开始来做,或者这个创业中遇到最大的困难在哪里?试想一下,人工智能这个行业还是非常由技术驱动的行业,这个核心技术是有非常强的技术门槛,导致于它不同于其他的商业模式创新的模式,在美国可能硅谷也好,纽约也好,会有很多投资人看到一件事情非常有商业价值,他可能就会在哈佛或者是MIT找一个学生,给他一笔天使投资,就可以做这个商业创新的试错的过程。

计算机视觉这个领域,由于入门门槛太高了,使得当你看到了很多的商业机会的时候,你其实并不知道它技术的可行性到底到没到。换句话说,一笔投资出去了,没有做成,你不知道是这个技术在这个时代做不成的,还是找错人了,如果是好的人,这个可能做得成。导致整个行业起来的时候有非常大的困难,因为试错的成本除了商业的成本之外,还多了技术的成本。

我搭档拉我创业的时候,我们从阿里巴巴出来的时候有一个很大的优势,因为十多年对计算机视觉长时间的积累,他告诉我的画面是这样的,他的双眼看到这个世界的时候,他能知道这个看懂这个世界的这个物体大概还需要多少时间,多少人员。这是从技术角度出来的一个能力,有了这个能力之后,最重要的事情是在市场上摸索,看市场当中有什么是可以最快速落地的,又跟这个技术是相匹配的,它的技术门槛的确是比较高的。

依图从2012年开始,我们整体上是非常低调的,开始做的事情主要是泛安全的行业,公共安全的行业,我们可能服务最重要的客户是公安这个领域,跟老百姓来讲,很多时候都不会关注到这个领域。但是这个领域实际上他对图象和视频的理解需求是非常刚性的。

跟大家汇报几个概念上的数字,重大案件90%的破案手段是要用到视频的,这些视频的过程当中需要人用肉眼去看,其中有一个著名的周克华案件,这个案件发生的时候,南京警方动用几千名警员,包括警察学院的学生一起去视频里面翻看视频,找可疑的线索。谣传当时把南京市面上的硬盘都买光了,为了拷贝这些视频。大家可以想像,这是刚性需求非常强的地方,的确是太需要这些技术了。我们也是找了技术最容易落地,技术难度不是特别高的物体开始做起,就是汽车的识别。除了车牌的识别之外,还可以做车辆品牌的识别,这个点非常准,原因是什么呢?所有犯罪的车辆没有会挂自己牌子的,这是很显然的一件事情,因为不可能今天挂着自己的牌还去犯罪。一旦你脱离了这个牌子之后,你就很难从茫茫车海中找到这辆车子,这是计算机视觉里面相对比较容易的技术,门槛不算高的技术,但是实际上它的落地应用非常大。

2015年,金融这个行业对人脸识别的需求火热了起来,主要是银监会讨论远程开户能不能用生物识别技术等等这些话题。突然之间各大银行就关注了这件事情。事实上招商银行是我们最重要的合作伙伴,我们给他提供服务的时候,他落地的第一款产品完全不是远程开户这款产品上,而是他恰恰是在有人监管,柜台的柜面上进行开户这个产品上。原因是什么呢?刚刚已经提到了,人脸识别技术已经比人的肉眼去识别一个陌生人要更加精确得多。大家都知道去银行开户的时候需要拿着自己的身份证开户,因为需要实名,否则就乱套了,这里面有非常多的安全隐患。但是这个过程中,事实上人的错误率是100起冒用别人帐号来开户的这种产品当中,可能是会有五六起,因为各种原因,失误也好,实在判断不了也好,就漏过去了。机器可以把这种错误率达到万分之一,甚至十万分之一的级别。在这个领域里面,落地的过程完全不是大家在讨论的远程开户,或者是这些产品,事实上是有人的场景都需要用机器。实际上这是非常大的市场,有人的市场是更需要机器的,而并不是没有人的市场才需要机器。

俞志晨:其实我们主要还是面向的消费这一端更多一点。我们的技术,图灵技术在中文的语音理解这一块儿的积累,包括体验这一块儿,还是不错的。当时我们一开始统计了一下,有15个场景,这里面有十几万的合作伙伴,开发者,太多了,我们后来主打的方向还是偏家用这一块儿,因为我们认为家用机器人未来是一个主要的方向,主要是面向终端消费者。家用机器人的场景很大,我们后来又进一步的细分,把家用机器人主要切入点是从儿童切入的,我们认为目前来看,家用的场景,基本上是以小孩为主,小孩在整个家庭里面是消费重心,而且也是很多场景的中心,我们希望把很多人工智能的技术和产品在家用这个领域做得更好,更深。我们过去一年多做了很多事情,我们联合国内国际最好的动漫产业公司来做,比如说迪士尼,国内最大的儿童动漫公司奥飞动漫,日本的多啦A梦来做了机器人产品。把过去虚拟世界看到的形象变成现实当中的机器人产品,未来如果家里有小孩的话,可能看到得会比较多,可能家长不会买玩具,也不会买故事机之类的东西,一定会买一个机器人产品,这个东西未来是一个大的趋势。

未来成人这一块儿的市场,我们觉得还需要一点点时间,我们目前的技术还做不到这么好的程度,还需要成熟和完善。我们的目标很明确,现在的技术可能只是小孩的水平,我们认为目前的人工智能的水平是小孩的水平的话,我们希望能够把机器人变成真正是能够成为小孩的伴侣,一个小伙伴。我们可以看到,不管是大公司还是小公司,都在扯人工智能,但是你会看到,基本上找不到一个消费级的产品,说它是人工智能,远没到那个阶段,离我们真正的预期还有很远很远,小孩买的机器人产品,我们都希望真正体现人工智能的能力和水平出来,我们的远景也很直接,希望智能机器人产品能够走进每个家庭,所以我们一直是面向2C更多一点。

徐立:我来说一下商汤科技对人工智能技术落地的一些看法。从我们来看,可以分成两个层次,第一类就是人工智能能够落地的能力的延伸,帮助人去做他做不到的事情,我们有一些图像智能的产品,如果像北京现在这种雾霾天,远处的东西看得不清楚,我们可以通过大量的数据,使得机器,通过手机看出去就是清晰的世界,这一切是延伸了人的能力。但是这个落地当中会存在一定的问题,我们可以做到超越人的能力,甚至帮助人做一些他不能做的事情,但是同样会面临的一个问题,我们不知道这些需求到底是不是真实的。商业落地的过程中需要不断探索,举例子,我们能够识别某一类特殊的物体,准确率、能力远超于人的眼睛,但是这是不是行业的刚需是很难说的。长远来看人工智能,必然是可以使得机器能做更多人不能做的事情,所以我们也会朝着这个方向去发展。

第二类落地更快,更接地气的,有人工的地方,代替现有的人工,一方面是安防监控,有大量的数据,但是破案的时候需要大量的人去看,早期数据量没有那么大,或者有人口红利的情况下,找大量的人去看一下,或者通过人的方式人肉搜索,而现在人口红利不断的消失,而且效率优先,这可能是人工智能替代的点,这个是存在刚需的。

 

另外我们自己也在做金融,偏互联网金融一些,刚才说的柜面的事情,其实是辅助人。另外还有一些需求,现在有一些消费金融,互联网金融存在一些困惑,不像传统银行一样有柜面,所有的事情都是需要远程的移动App来解决,比如说我要开户,我要认证,我要做各种事情,其实后台要有大量的人去看。这些客户前期发生的情况下,其实是可以用人来看,这种App前期发展的情况,但是一旦量放大了,存在效率的问题,几百、几千人就不能服务这么大量的数据。在这种情况下,人工智能就会变成刚需,我们也是比较意外的,2015年突然之间,这部分需求来得比较强烈。总结下来,原来需要大量人力的情况下,这部分人进去,相对来说行业的机会比较多,而且一定会切准行业目前的需求。我们认为之后的发展落地,就朝着这两个方面,一个方面是能力的发展,一方面是代替重复劳动,使得它变得更有效率。

蔡伟:我觉得三位老总分享得特别好,我们在做人工智能的时候不能盲目追求于它的水平有多么多么高,而是如何找到合适的市场切入点,也许这个时候进去没有那么高的壁垒,但是能迅速打开这个市场,慢慢再往上延伸,这是非常好的,特别是对于一个创业公司非常有益的一些经验。

接下来我想问一下,其实从去年开始到现在,深度学习成为人工智能领域非常热的词汇,从语音识别、图象识别到无人驾驶,确实深度学习在中间起了很大的作用,我们现在收到的很多商业计划书都写着某某某行业正在深度学习,这个词已经变成了屠龙宝刀,号令天下,莫敢不从。所有的人工智能都是采用深度学习的方式。我们也注意到,深入学习在小数据的学习当中还是比较弱的。12月份的时候,《自然》发了一篇论文,可以用贝叶斯的方法,使机器在比较短的时间内达到学写字的系统。所以我讲了这么多,想问的是深度学习优和局限是什么,未来更好的应用场景是在哪里,未来在人工智能的算法里,是继续深度学习继续统治这样的市场,还是各种算法都能找到它各自的应用场景?

徐立:蔡总之前是学术圈的吧,我觉得蔡总对这个行业还是比较了解,我自己之前也是做这方面研究工作的,我想谈谈深度学习也好,现在的点,我们为什么能够在这个点用技术创业,中国的创业环境技术创业相对是比较难的。早几年如果创业的话,投资人可能问一个问题,如果现在行业的领头人,或者是BAT还是同样做你的技术怎么办?我们认为技术创业其实分为各个时期,一种是技术相对平坦期,技术本身没有特别大的发展,只是在学术上有一些前沿性的发展,这个时候技术创业相对比较困难,大公司通过砸资源就可以把一件事情做到八九成,你提供技术的意义就失去了,一般作为行业领头公司都会选择自己做。

另外一个,某一个技术到了突然的过了临界线,就到了爆发期,技术创业这件事情就变得渐渐可能起来,因为你在这上面的投入,回报率非常大,可以带来很强的技术领先性,如果大企业没有这么专注做这件事情的时候,不得不采用你的技术,你可以利用技术形成壁垒,形成市场效应,说回来,深度学习就是这么一个很关键性的技术。在传统领域,其实是针对小数据市场去做这样的学习,大数据市场去做预测,这个逻辑是比较难行得通的,不管数学模型做到多好,都是对这个世界有一个假设,这个假设是不是符合真实的情况很难说,这也是为什么前十年当中,学术上有很多论文的进展,实际上工业上的进展推动还是比较缓慢的。

深度学习这个技术的优势在于它改变了这种模式,它是可以用来处理这么大规模的数据,更关键的,我理解传统的意义,尽量做到预测性的,深度学习是网络的,表达能力足够强的,是一种记忆性的学习。它其实是看足够多的数据,把他能见过的东西都进行记忆,使得网络能处理更多的场景。

退回来,我们认为在现在的阶段,深度学习还是在初步的阶段,为什么呢?因为首先结构的演化,网络自己设计的能力,甚至是我们现在说要把模型再做一些针对某些场景的适配,谷歌和Facebook的做法,通过不停的尝试,通过试验性来做,还没有理论上的突破。在这个阶段,我认为人工智能也好,深度学习的关键技术也好,还处于飞速的发展期。在这个阶段可以带来的每年的突破其实是非常大的。

举一个例子,我们参加一个大规模的物体识别竞赛,这个竞赛是谷歌、微软、百度这些公司都参加的,他做的事情就是从互联网上的照片,你能把照片中的物体定位好,同时告诉他,这个物体是什么,今年还延伸到了视频上。这么一类物体的检测,一开始的准确度大概是11%,第二年就变成了22%,第三年我们参加的时候,我们拿的第二,谷歌第一,是40%,今年是60%。这个增长和以前视觉里面每年一个点,两个点的增长,速度是完全不一样的。在这种阶段,如果专注于这个技术的突破,专注做这件事情,深度学习可以带来突破性的变化。这就使得你可以领先于,甚至大的公司的巨头一个身段,让他们不得不采用我们的技术。所以我认为,深度学习未来发展的潜力还是非常大,他可以改变的东西还是很多,目前只是在比较初步的阶段。

俞志晨:刚刚蔡总说的,为什么很多人会加深度学习,因为主要是to VC的,这个门槛还是挺高的。真正在全球,包括在国内,有这个技术的还是比较少,不多,这两年的市场比较热,所以很多人开始往“+”这个关键词,机器人也“+”,人工智能也“+”,什么热就加什么,VC喜欢看,也不能怪创业者,主要是VC的问题。

我觉得深度学习,我自己感觉在人工智能可模式化的领域,深度学习这个领域还是比较好的,存在很大不确定因素,包括开放性的场景,深度学习目前来看效果并不是特别明显,比如说在一些涉及到人的,比如说复杂的语义这一块儿,中文的处理也是满复杂的,还有情感、思维、认知这一块儿,包括表达,人的语言是有表达能力的,没有什么明确模式可言的东西。在这个领域,目前深度学习并不是很好,这一块儿未来可能会产生新的方式去解决,所以我觉得深度学习,至少目前来讲,在这些可确定模式的智能领域,还是可以解决很多问题的,但是在将来,还是需要在一些底层技术,包括在一些模式方面有很大的突破,这是我的看法,谢谢!

林晨曦:深度学习这个话题跟人工智能一样特别火,什么地方看到一个公司或者是技术都要提到这个词,可能因为在美国有一个博士,做了一个深度学习的模型,做出来的效果比谷歌的效果还要好,一个人做过了谷歌那么大一家公司,使得这个事情突然火起来了。我刚刚讲到我的搭档在NYU的工作,他做的事情就是做深度学习和图模型底层的理论到底有多少一致性,或者有多少区别,非常理论的东西。讲起来也比较复杂,总的来讲,深度学习到底能解决问题,这是今天事实上大家还不知道的,学术上还没有完全定论的东西,科学界还没有定论的东西。比较有趣的一件事情,在依图科技做人脸识别的过程当中,大家都知道我们在公安部和各大银行测试的成绩是非常靠前的,包括公安部里面的测试都是第一,我们这样的技术没有对外说,事实上我们完全没有用深度学习的技术,这个消息如果是在美国的学术圈可谓是重磅炸弹,大家可以反过头回思前两年是不是该这么热衷于深度学习这条道路。这条道路为什么会火起来?因为在一些典型的任务上,原来传统的模式长时间不能突破这个瓶颈,当深度学习突破了,大家就觉得这件事情非常非常的有效果,大家就一拥而上。事实上,不用深度学习的方法也能让人突破到很高指标的时候,其实这件事情是双方可以探讨的,只是算法层面上来讲可以探讨的。这个大概是学术上的一些问题,可能讲起来也比较深奥或者是绕口。

总的来讲,大家在探索人工智能这个事物本身,探索、学习人工智能是怎么发生的,我们在学习的过程当中,实际上理论上还有非常多悬而未决的问题,至于深度学习能做到多大的范围,他的数据学习的能力有多大,到数据到什么指数量级的时候,这个模型就不再学得动,不是网络加深就能解决的,还有非常非常多深奥的问题留给大家,这是这个行业让人激动的地方。

蔡伟:非常谢谢三位,由于时间有限,最后一个问题,快速简单的回答一下。因为大家都会觉得,特别是在看这个行业的时候会认为人工智能可能是继移动互联网之后未来发展的平台,人工智能,AI+,人工智能+很多应用场景,可以应用在不同的场景里面,包括IBM的Motion,在医疗和金融都有不同的突破,还有有一个机器人的记者,可以替代简单的劳动,从三位的角度来看,未来五年里面,哪些行业和应用领域,人工智能应用的市场会得到快速的增长。

林晨曦:这个问题也很大,我们之前选择了做计算机视觉也是相当于对这个问题有了初步的判断,计算机视觉是特别特殊的行业,比语音难一点,语音的数据跟视觉的图象数据相比更简单,图象的数据里面有更多的复杂性,噪音,遮挡等等,有光照、场景等等各种复杂性在这里。视觉研究的问题,一个个物体本身就是属于人类世界当中比较具体的问题,文本这一块儿,语言这一块儿可能要处理一些比较抽象的问题,同样是学习,大家很容易学习,这是一辆车子,这是一个人脸,但是大家要学习一个词,叫等价,或者学习一个词叫入行,这都是非常抽象的概念。相对而言,计算机视觉属于人工智能比较前端的一部分,他是在学习比较具体的问题这个概念的过程当中。三岁的小孩想要学会等价或者是入行几乎是不太现实的,这是比较难的,这也是我们对计算机视觉在人工智能格局当中的判断。

另外一个角度,很多技术的发展都是由需求而演化的,大家可以知道智能硬件在不停地往前走,机器人最近也开始火起来,但是这个过程当中都会需要有一个最基本的视觉的输入,使得它能作为很多决策的依据。我们觉得未来五年当中,不同场景下面,计算机视觉还是会有非常快速的蓬勃发展的阶段。

俞志晨:正好接着林晨曦的话,机器人从2014年底开始火起来,只不过科技圈稍微慢了一拍,家用机器人在接下来的几年会以快速的方式进入家庭,而且一个关键点,家用机器人又是融合了非常非常多的人工智能技术,不管是语音也好,还是视觉,语义,还是情感,思维认知。要把家用机器人做好的话,是一件挑战非常大的事情。可以看到这一两年,在整个人工智能机器人,互联网在融合,让家用机器人能够得到快速的普及,我自己觉得在近期的几年,家用机器人的市场发展可能会比我们想象得快很多。我刚刚说的儿童也好,包括将来每个人的家里面会有一些智能化机器人产品,是指能跟人更好的互动,生活服务可以结合在一起,包括娱乐、社交也可以更好地结合在一起,这类机器人是近期一个大的方向,可以关注一下,谢谢!

徐立:商汤科技是这么看这个事的,首先我们认为现在人工智能之所以能够有现在这样的发展,完全是因为其实数据突然之间爆炸了,处理大数据的能力也存在了,所以我们自己做视觉,做图象这一块儿最大的原因,也是我们觉得这方面的数据源足够大,我们在这方面也足够专业。之后从长远的发展来看,未来这几年,在哪些地方可以引爆炸?一方面是行业有标准化、结构化数据的地方,大的数据,包括医疗也好,智能硬件采集回来的数据也好,机器人也好,都是可能存在这种结构化大量数据的时候,现在的这些工具,其实在里面可以发挥出非常大的力量来进行这样的突破。

 

蔡伟:非常感谢三位老总,人工智能路还很长,挑战也很多,机会也很多,希望在座有志于这个行业的人都能进入这个里面进行创业,或者是进入一些公司,今天对话的这部分就结束了,非常谢谢三位老总!另外一方面,现有数据情况下,互相的关系非常复杂,用现有的从顶而上的方法,可能没有发现其中规律的时候,我们可能是用这种大数据的方法从中推导出来一些更深层次的应用,比如说我们有合作伙伴在做的新浪微博的大数据分析,从中可以导出来新的规则,这一类随着信息量越来越多,会给出不同的价值,我们认为这两方面会有新的点出来。

 

您可以复制这个链接分享给其他人:https://www.yitutech.com/node/282