绿公司年会 | 依图创始人朱珑:AI无与伦比的时代来临

2017-04-24 00:00:00

无与伦比的AI时代:难辨的技术,没有权威的时代

5922c7434cb28.jpg

AI现在是一个很难评价的领域,真假非常难辨,泡沫非常难辨。AI属于科学的范畴,本身离大众很远,业内最好的AI实验室也很难去评价另外一个实验室的工作。而在讨论一个客观存在,很严肃的科学时,谈论者的身份也可能因为预设的立场而存在误差。

同时这也是一个没有权威的时代。今天,就算美国最好的人工智能实验室要了解全球最先进的技术在发生什么,也了解的不那么全面,因为现在人工智能发展的速度太快了,各地都在跳跃性的发展。谷歌一个AI的总监也不见得理解透自己公司的另外一个部门的所有进展。10年前,学术界3个全球最好的教授加上实验室师兄弟3个人凑在一起,差不多就能把这个领域全球的进展,甚至未来3年的进展就都预测了。而今天,AI处在一个没有权威的时代,任何一个新的技术,都可能有突破性的社会意义和学术价值。

人工智能的科学实践,在帮助人类拓展智慧和能力的边界

人工智能首先解决的是3岁小孩应该具备的能力,本质是获得人成为人的最重要的能力。

大约在三年前,机器做的图像识别超越了普通人的识别能力,这是人工智能很重要的一个界线。机器在很多最基础的识别功能上超过人类,就可以替代人从事这部分工作。

以人像比对为例,机器不但在对陌生人的比对识别上超过人,对非常熟悉的人的辨识,也可以很稳定的超越人类。机器可以告诉你中国十三亿人中有多人长得像你,到你妈妈都分辨不出的程度,机器也可能比你更认识你女朋友。而在专业领域,机器识别的能力可能超越了35年训练出来的专家。

今天的人工智能,把机器的边界不断往前推进的时候,它能够帮助人类看到我们的智慧、天生的能力边界在哪里。

中国人脸识别技术的一些应用场景超过了美国,并在全世界范围内有实际意义。

今天,中国将人脸识别技术应用在垂直领域的场景,非常的先进。这些应用场景不仅仅解决中国的问题,在世界范围内都非常领先。

以依图实践的警务领域,过去民警工作中希望用到的科技手段,这2年下来基本都能做到了,更重要的意义是你们看过的美国科幻大片里面的场景,我们都能做,而且基本上只有中国能做到。

尽管AI今天发展速度非常快也非常热,包括BAT、创业者或是投资人的业内人士,还是低估了AI最前沿的技术跳跃性进步的可能。

朱珑演讲全文:

我们在新闻当中都是推崇本科生创业,甚至推崇没毕业的本科生去创业。我比较极端一点,我是博士后,中国人还好比较尊敬这个学历。但其实学术界的人来创业,也是一个重新学习的过程。尤其商业领域上,如果不是特别有天赋,从履历上来讲天生是一个短板,所以我是一个非典型的创业,这种非典型的创业也给我有一个非常特殊的视角,对科学、对学术的理解,以及我创业几年来,有些共同点和不同点,也有一些不同的思考。

我有三段学术历史,前2段历史,邓总(注:北极光创投创始人邓锋)刚才介绍的比较多了,我拿天使轮融资的时候,见到真格基金徐小平老师,讲到MIT我的第二段学术经历,徐老师就要投了。去年我碰见徐老师,我才和他说我是人工智能的行家,因为我第三段的学术背景。

深度学习是在20132014年开始在全世界火起来的,我第三个实验室的老板(Yann Lecun ,现任Facebook人工智能实验室的负责人)在深度学习领域从业了30年。在我创业的时候,也就是2012年,在全球深度学习相对而言都是一个非常冷门的专业,非常好的博士生并不去到这样的实验室、渠道这个学科中来。直到2013年,到中国可能是2014年,一夜之间全球的博士开始跳到这个专业来学习,那就凸现了过去在这个专业领域里人才储备的不足。讲这个过程是说,非常短的时间里有非常巨大的变化。

人工智能比较火,谈的人比较多,对我来说是非常难谈的。我先给两个定义:

一个是难辨的技术,真假非常难辨,泡沫非常难辨。但是谈的人又多,专家非常多,无论是投资人、高校的人,还有创业的从业者。我自己有一个理解,现在是一个没有权威的时代。

我今年年初在硅谷呆了一个月,有一些体会跟大家分享一下。什么是难辨的技术?人工智能属于科学的范畴,科学是离大众很远的。不要说,我们最好的实验室,去评价另外一个实验室的工作,如果只看论文,看公开流通的文章,不是那么容易评论,评估成本是很高的,还要根据多年来两个实验室的交流,以及互相理解的基础,才能评价他们的工作,这对圈内人已经是比较难,更何况现在流动非常大。

我们对科学预设了一个立场,就是客观事实。但很多在市面上评价的东西都是比较主观的,很多科学家、教授、研究员并不在业界的一线,尽管他是全职教授,或者是名牌大学的教授,很多他听到的进展,更多来自于新闻,比如说依图科技的进展,也是看新闻了解到。但新闻可能不是最核心、最领先的一些技术,以这个不是那么严谨的素材做预测和评论的时候,其实是和真相差距比较大的。

科学是一个很严肃的东西,是一个客观存在的东西,但是谈的时候这个误差是比较大的,容易被谈的这个人的身份有一个预设的牵引。

另外一个是,这是一个没有权威的时代。

我在硅谷最好的实验室呆过,他们要了解今天全球最先进的技术在发生什么,也不是了解的那么全面。为什么?因为现在人工智能发展的速度太快了,甚至在各地都有跳跃性的发展。谷歌一个AI的总监不见得理解透他公司的另外一个部门的所有进展,对他们来讲是比较困难的;全球最好的专家要理解全球最好的技术,不见得是全面的。更不用说今天在美国顶级的学术界或者名牌学校里面的老教授,它已经很难很难点评全球最好的技术在发生什么。

这和10年前的学术界是不一样的,学术界3个全球最好的教授,实验室师兄弟几个人凑在一起,差不多把全球的进展,甚至未来3年的进展就都预测了。

这就是一个没有权威的时代,任何一个今天新的技术,有可能是有突破性的社会意义和学术价值。这是我的一个体会。

因为科学很难谈,所以我先从不需要任何专业背景,不需要跨越文化的东西,就是知识的东西,来看看AI今天是一个什么状态。

大家可以看一下这四对图,你看哪一组是同一个人,哪一组不是同一个人。你们通过这个过程来感受一下你到底是怎么认识人的,当你辨别人的时候,到底是看眼睛像不像,还是嘴巴像不像。

我做简单一个提问,左上角是同一个人吗?举一下手,差不多一一半。右上角是同一个人吗?举一下手?这个二十分之一。左下角?这个差不多四分之一。右下角是同一个人吗?举一下手?差不多三分之一接近一半。结论是右下角。

机器很容易找到一张图来迷惑或者超过人的辨识边界。这个话题很有意思,在非常早期的时候,大概3年前,出现了非常重要的边界线。机器做的识别,跟普通的人作为一个识别的基础比较的话,机器的识别能力已经超过人类了,这是一个很重要的界线。很多最基础的功能上机器超过人类,机器就可以替代人从事这部分工作,有太多场合可以替代,比如机器几乎不会存在速度和体力的问题,一秒钟看1个人,还是5秒钟看10亿人机器都可以,很多场合都可以被替代,这是很重要的分界线。

刚识别这四组人像的问题,有的人可能会问,在座的100多位都不认识这几个人,有可能识别不了,大家对陌生人的识别能力下降,可是对熟悉的、我的朋友的辨识,机器不太可能超越我。

我们做了一个实验。我们有一个公安的客户,他在一千万数据库当中,把他女朋友的照片放进去搜索,然后拿出相似的前十名出来,打乱了出来,问他哪个是他女朋友,他辨别不出来的,有可能一个是证件照一个是生活照的原因,有可能因为年龄的原因,也可能有化妆的原因。所以你非常熟悉的人,比如你女朋友,你不见得比机器更认识你的女朋友,因为光照角度、化妆,人是很容易受主观性的影响。今天机器做到一个程度,对非常熟悉的人的辨识,机器也可以很稳定的超越人类。再拓展一点,识别人,跟今天在座的观众差不多的体验。到更专业的领域,医学上,一个专家他可能训练了3年或者5年,机器还是可能超越人类。

我们还做了一个统计,我们尝试想回答一个问题,在中国大约13亿人中有多少人和你长得一样?长得一样的标准,就是你妈辨别不清楚谁是谁,这个问题纯粹是对世界的好奇。结论是每一亿个人中有一个人和你一样,全中国平均有12个人跟你长得一样,你找得到12个“替身”,而且是你妈辨别不出来。这是很重要的一个科学统计的结果,这是在其他任何地方都不知道的结论。这是什么意思呢?我们做人工智能,除了产业化的意义意外,今天的人工智能,把机器的边界不断往前推进的时候,它能够帮助人类看到我们的智慧、天生的能力边界在哪里。从前这个课题没法被讨论没法被回答,以前没有这么大规模的科学手段,这非常有意义。

虽然人脸识别非常普罗大众,大家讨论智能,容易讲AlphaGo,讲棋手。那我对智能有一个很重要的理解,人工智能应该是先解决一件什么事情,其中应该是人天生就会具备的能力,他应该是3岁、5岁小孩就应该有的能力,这是人成为人的一个最重要的基础,它的很多智能是由这些衍生出来的,不是人的掌握的那些知识,知识如果就能被替代的话,他说的我这种智能就是体现差异的,不是棋手才有的智能,也不是英国人美国人特有的智能,也不是上大学的人有的智能,只要你是人就会有这个智能。谈论这个事情,是回答人最本质的东西。

再往下,我们谈一谈社会上的意义,有的人可能听说过这个案子,我们基本上应该是布了全球最大的人脸搜索引擎,公安可以通过这个搜索引擎追逃逃犯。这个案子是十几年前的杀人犯,逃到庙里做主持,通过一个系统交叉比对,就是把这个通缉犯来和现有的十几亿人或者一个省的一个亿人,做大规模的几万亿次的或者几十万亿次的交叉比对,大部分逃犯可能都是改了证件做了漂白的,这个可以说是大海捞针的方式。

另外一个会在派出所发生,老人带着小孩走丢了,他说不清楚自己是谁,记不起身份证号码,以前这个很难办,公安也不知道该去收容所还是社保,很难处理这件事情。现在在派出所拍一下就知道这个人是谁,也比较简单。

这个是讲这个摄像头用到了哪些位置,像是在公共的摄像头,办案过程已经锁定了嫌疑人,公共摄像头抓拍到了嫌疑人,比较远而且是运动的、模糊的、低清像素的情况下,基本都能识别出来。

这是在网吧,以前的小案件很难报案,几百块或者几千块钱,比如手机被人偷,既没法查也比较难抓,现在是这种角落里的摄像头,即便有角度的差异,也基本上都可以查得出来。

还有比较典型的应用是在ATM机上,以前也比较难做,ATM机上鱼眼摄像头拍到人像,现在可以用这些人像抓捕疑犯。

中国的人工智能局面,先进的技术结合垂直的场景,研究也具有世界范围内领先,有意义

今天的人脸识别技术在不同的区域、不同的场景下,能做到非常多事情。作为从业者,特别是从科学到创业圈,还是非常激动人心的,特别是我和一线的民警聊,过去民警工作中希望用到的科技手段,这2年下来基本都能做到了,更重要的意义是你们看过的美国科幻大片里面的场景,我可以回答,我们都能做,而且基本上只有中国能做到。

美国和其他国家,像这种视频条件和人脸识别的技术都很难做到。美国的人脸识别技术很好,好在哪里?美国只是谷歌的技术好,最多再加一个Facebook的技术好,但它的创业氛围和政府的圈子的意识不见得是最领先的。

今天的局面是,像我这样的留学生回国的比较多,中国出现这种先进的技术和垂直领域相结合的产品是比较有代表性的,做出来不只是解决中国的问题,在世界范围内都是非常领先的。

我们刚介绍做人脸识别,其实我们还做其他方面,这是新的统计建模和人工智能在城市管理的应用。做一件什么事情呢?在杭州试点,把道路上的车和灯以及路,比如有多少个车道,道路上车辆通过的速度,这些参数拿进来进行建模,能够给交通一些优化的建议,比如说红灯可以从50秒调到40秒,能使道路通行的速度提高5%或10%,类似的预测在宏观上做交通管理。如果有个大的事件或活动,要做个预测,过去都是凭着政府管理者的经验,都是经验型的,不是科学、大数据驱动的决策机制。现在可以靠真正的科学来辅助决策。

还有比较直接的应用,是在医学领域的肺的CT片,科学统计结果,今天机器可以做到和医院副主任医师看CT片子相当的水平。

这个是属于自然语言理解的范畴,大家看左上角,这是机器对小孩发烧状况的描述,机器是可以通过技术,把专业的医学中的自由文本转化成带有语意结构的,比如身体的部位,病灶程度、属性等,全部能精确的摘要出来,形成智能的决策,给出相似的可能性的症状,以及相似的病例和一些诊疗方案。

以上就是一些不同的人工智能在今天在不同场所应用,希望给大家一些人工智最前沿的传达。

AI在今天发展速度是非常快的,即使现在非常热的情况下,以BAT、创业者或是投资人,大家还是低估AI最前沿的技术有可能有跳跃性的进步。58fdd83ac39ac.jpg朱珑对话华先胜

商业被技术解锁是加速度的,今天人工智能比肩或者超越工业革命

过去10年、30年所热门的东西,到今天不仅是概念,从工业级的实验数据上看到非常深远的未来。我们今天说人工智能热起来,是从结果来说的,所有领域的结果让大家感觉到信心。

人工智能应用的场景是不断被商业解锁的,技术在商业化落地的过程,商业跟技术结合越来越加速。实际的应用场景有时候是超越你想象,今天的智能,我们的想象已经跟不上人工智能发展的速度了,千万不要担心技术跟不上我们的想像力。

技术发展的差距关键在人,人的技术远见很大程度影响了人工智能的发展速度

资源、数据、钱,会影响整个行业的发展,即便都具备了,你说大的公司敢投1亿美金吗?找不到那个人的时候,有钱也不敢投。

拥有技术的远见,能够知道数据在哪里,数据的商业价值在哪里,技术预测。行业真正一流的高手之间差距就是非常大的,最牛的人之间反而有可能是差距越来越大。同一件事情到你手里,信的人和不信的人,发展速度差别是巨大的。

最好的人只有最好的人才能判断,你只能选择信我或不信我。

越垂直、越分散的领域,创业公司有很大的机会。

AI本身不是一款产品,科学家没有特别天生的优势。技术对商业场景的理解,非常重要,需要高手。作为翻译者或沟通者,这是比AI人才更稀缺的。

依图在公安领域、医疗领域的部署,首先做好对人的理解,对部门之间的理解,其次是对产品和技术的理解。保持谦卑的学习心态,比公安的人更懂公安,比医生更懂医生。

即便是有人际关系壁垒、数据和专业知识壁垒的垂直领域,人工智能产品本身依然是最能打动人的。

越垂直、越分散的领域,大公司不见得有机会,创业公司有很大的机会。

人工智能的社会影响,不止是安全问题,经济形态的巨变更值得思考

技术带来的社会影响其实是一个长久的话题,今天人工智能可能因为超越人的智能边界的时候,会更加敏感。

技术都有两面性,一定会出现有利的地方和不利的地方。目前AI技术并没有跟其他的互联网技术,或者是其他信息技术在安全性上,或者是其他层面上带来的威胁有本质的区别。

其实不是安全问题,或者不止是安全的问题。“智能”大了之后的社会分工,我觉得十年之内有巨大的动荡,不仅是中国,全世界都会面临这个问题。我为什么是我?我大学上了到底有没有用?将来的小孩到底学什么,要重新开始思考。今天我们开始重新认识自己。未来20年,人类社会分工,或者经济形态会有巨大的变化。

对话全文

邓峰:请来了我们学界很资深的一个人士,是人工智能领域的,美国计算机协会2015年的杰出科学家,IEEE Fellow院士,阿里巴巴集团人工智能研究机构的资深总监华先胜,我们请华先胜来给我们朱珑一起对话。中国人工智能是一个不是很大,全球都不是很大的圈子,现在说招一个人工智能的人才,那给的工资都极高极高的,两位之前也很熟悉,华先生您听了朱珑的演讲的话,您有什么想挑战朱珑的。

华先胜:我经常说一句话,叫人工智能风生水起,视觉计算遍地开花。刚才朱珑前面讲的更多的是视觉内容,就是这些花开了能不能结果其实是很难讲的。我们回忆一下这个人工智能的发展,人工智能其实不是一个年轻的概念,大概60年前1952年的时候提出来的,那个时候大家也非常的兴奋,十年以后人工智能就要超越人类了,大概过了十几年以后发现不行,这个人工智能不下去了,到了80年代的时候,因为这个神经网络的出现,而不是今天的深度学习网络,包括这个一批算法的出现,大家又很激动很激动,这个人工智能来了,又要来了,过了十几年以后又进展不下去了。那么我想问朱珑一个问题就是,这一次人工智能起来以后,我怎么能知道它不是一个虚假的春天呢?前面两个春天都已经证明这其实不是“幻像”,今天有什么不一样呢?

朱珑:我自己的理解,首先讲不一样的程度吧。我觉得说今天人工智能比肩或者超越工业革命毫不夸张。

很多人在谈论的时候是用了这个词汇,但实际行动上并不是这么大定义的,他实际嘴上说说,如果是这么大的,你应该把房子卖了都放进来对吧,但是实际行动是跟不上说话的这个程度,这个是讲定义的程度。

第二个事情跟以前不一样,以前讲的概念,或者是30年前人工智能比较热的时候,今天2012年那场会,2013年深度学习热起来,深度学习我在那个实验室待着,就是刚才说了很多科学家或者是年轻人并不爱学这个,它是一个冷门。

概念其实在那里躺着,已经躺了超过10年时间,算法和模型并没有本质的变化,今天热起来是从结果来说的,是所有的领域的结果让大家感觉到信心,比如谷歌把钱给砸下去了。以前的热是说有钱人跑到MIT说,听说你在做脑科学,1000万美金给你,我们一定要参与一下这种脑科学计划,能不能做成。

今天是因为商业价值,看到了商业巨大的进展,这跟过去十年、过去30年所有的热门的东西,不仅是概念,是在实验数据上,工业级的实验数据上看到非常深远,或者说这种科学意义上的统计意义上的,我觉得这是最重要的不同。

华先胜:OK,这个我觉得是有道理的,跟以前不一样了,我们现在看到了一些结果,尽管我们看到的结果其实也是一个局部的,当然还有这个关于深度学习技术真正在大规模的计算环境下能够计算,这个深度学习技术的发展,计算能力的提升,网络的提升,网络带宽的提升,数据产生的容易,包括这个用户的参与,用户的参与本身就是一个强的反馈,是看到的成果可能会更向前发展,真正产生作用。

那么第二个问题是想问问你这家创业公司,视觉技术,因为我本身也是做视觉技术的,在高手之间,算法的差别几乎是越来越小,对于数据而言一家创业公司跟BAT相比好象也毫无优势,从计算平台的角度来讲小公司更没有计算平台了,阿里云有计算平台,谷歌、百度,百度有没有不好说,至少微软这些公司都有大的计算平台。从商业的角度来讲,创业公司跟这些公司比商业也是很难比的,那么怎么样让一个创业公司在这里面能够胜出呢?我打一个比方,假如有一天,微软、阿里云免费了,这些技术免费了,大家注意媒体同事请注意,我没有说阿里云免费我只是打一个比方,不然我回去就被炒了,假如有一天这些大公司免费了,你怎么办呢?

朱珑:这个问题在我创业的第一天就被问过。因为我自己的身份还是有一定的立场能讲这句话,什么意思呢?我在全球最好的人工智能实验室待过,所以我天生回来的时候就很平静的。有人问我,问百度就是问谷歌说做的怎么怎么样,我知道我师弟几斤几两在那边做的,不是因为谷歌强他就牛逼了,这是由做人工智能领域最强的那个人决定的。

有数据有钱,1亿美金给他,他能不能做成,不见得!这个差很远的,但我这个观点不代表是为所有的创业者说话,而是说,这个事情的本质是由最强的那个人决定的,大的公司之间的博奕,微软和谷歌之间谁有那1亿美金呀,大家都有,现在创业公司1亿美金都很轻松,钱也不是问题。

资源、数据、都有钱,你说大的公司敢投1亿美金吗?找不到那个人的时候,有钱也不敢投。

邓峰:刚才我理解,听出点火药味来了,我们这儿人还是很牛,但是数据是关键,人家比你数据多。

朱珑:首先数据是非常关键的,但是这里谈技术的时候,我经常被同事们问。技术有几个层次,其中有一个叫做技术的远见,大家是不谈的,大家只是谈算法,远见是什么意思呢?

技术未来在哪里,就是说其实技术的理解能够知道数据在哪里,继续值钱到哪里,这不是大公司就一定知道的,大公司太多了,你看BAT跟谷歌对数据的理解还千差万别,他敢投这个人工智能科学家,敢投5000人3000人下去,BAT是不敢投这么多人的,他不知道business在哪里,也不知道技术的预测。其实最一流的高手他差距就是非常大的,最牛的人之间反而有可能是差距越来越大。

创业公司有数据的瓶颈,四、五年前数据是约束我们的,这个倒是真的。但还要看你要进入哪个市场,比如医疗市场,医疗是一个非常分割的市场,今天没有哪个大公司把这个数据通吃或者垄断了。

哪一些市场是特殊的?有用户场景的。有大量用户场景是大公司的强优势,我觉得小公司基本没戏,既使是你有技术。这要区分来看,有一些领域,比如说人脸,大家都做人脸识别,那用网络上的数据,其实大公司小公司都没有太大差异,都能收集到1亿、2亿的数据,但是到比如刚才说的ATM机刷脸取款的那些场景,既使是非常大众化的人脸识别这个领域,BAT也没有ATM机的数据,你也得从最简单的开始做起。越垂直、越分散的领域,大公司不见得有优势,这是创业公司很大的机会。

华先胜:看来你对于自己的科学家的团队还是很有信心的,实际上我觉得大家都知道这个智能的发展,人工智能这个技术落地确实是有很多的因素在里面,有科学家,或者叫算法,算法是由科学家发明的,所以我把他混在一起来谈,有数据,有平台,有商业模式,有用户,这些因素基本上是缺一不可的,他可能应用强调这部分更多一点,有一些应用可能强调另外一个因素更多一点,其实我有些同意刚才朱珑的一些看法,特别是讲到要深入一个行业去,我觉得是非常重要的。人工智能远远还没有到我想到一个算法然后就work,不是这样的。还差的远的很。

第三个问题,刚才讲到很多监控的问题,智能的发展对将来会不会产生一些负面的影响?比如安全方面,隐私方面,这些将来带来的问题,带来的困扰。就相当于计算机发展的过程当中刚开始PC的时候有病毒,后来网络有木马,现在数据和web2.03.0等等这些概念出来,假新闻等等之类的都会带来负面的一些因素。我想问一下,虽然跟你的创业公司不见得有直接相关,我想问一下你在这方面有什么样的看法。

朱珑:技术带来的社会影响其实是一个长久的话题,人工智能可能今天因为超越人的智能边界的时候,会更加敏感。我觉得两个方面,第一个方面就是它其实不是安全问题,或者不止是安全的问题。“智能”大了之后的社会分工,我觉得十年之内有巨大的动荡,不仅是中国,全世界都会面临这个问题。我为什么是我?我大学上了到底有没有用?大家如果家里有小孩,今天可以开始思考到底学什么。这个课题在过去的教育学家的课题可能这一页应该翻过去了,要重新开始思考。

没有人是特别知道应对30年后的世界,现在学什么才是对的,因为今天我们开始重新认识自己。未来20年,人类社会分工,或者经济形态会有巨大的变化。以前大家都学车,那以后无人车都有了,你学车就被人笑话对不对。

第一个层面是说,这个会有非常不平衡的情况出现,而且政府一定是滞后的,因为这个时间越长,没有人有特别强的预测能力和管控能力,所以这是第一个层面;

第二个事情是,目前AI技术并没有跟其他的互联网技术,或者是其他信息技术在安全性上,或者是其他层面上带来的威胁有本质的区别。技术都有两面性,一定会出现有利的地方和不利的地方,在过去因为有黑客互联网就不发展了?不太可能。我觉得AI并没有特别强的特殊性。

华先胜:刚才朱珑讲到了一个非常有意思的关于人脸识别技术,机器识别的能力,但是其实还有另外一点,机器识别的局限性。比如我们对一个人的时候,哪怕这个人的侧面,哪怕是一个背影,哪怕是灯光灰暗的,哪怕是有人遮挡的,人是能够识别的,机器很多情况下就歇菜了,也就是说这个机器是在某一个方面是强的,在某一方面是弱的。

比如说,现在还有一个例子就是对话这件事,你在某一个行业里面,或者说你只是问他一些,告诉它订机票,查天气,叫个车,那是很好的,你要随便跟他聊聊天,说这个北京天气怎么样,饭馆怎么样,或者是杭州呢?它就说杭州有美丽的西湖,就不知道你的联系到说杭州的天气怎么样。那么人工智能的局限会不会限制将来的发展?到底怎么样结合人的智能和机器的智能的这个长处去产生真正的影响?

朱珑:刚才这个问题也比较一般难见到。我本来给大家解释那条曲线,稍微有点复杂,我刚才跳过去了。那条曲线,横轴是不同的年限,纵轴是错误率,大概是这么一条下滑的曲线,曲线上不同的点是什么呢?就是每一万人当中把你识别出来超过95%的这种点,再往下一个点就是10万,100万人,1000万人,1亿人,10亿人。技术是这样子发展的,什么意思?刚才1万人、10万人对应的是算法的识别性能,也是对应算法适用的场景性能在10倍、10倍的提高。场景是不断被解锁的,而且这个过程是一个非常大非常大的加速的过程。

过去我们很难想象ATM机这种边界是可以做的,实际的应用场景有的时候是超越你想象的。我们是业界最前沿的,有时候都会受到惊讶,举个例子,警察拿着人脸识别去辨认尸体,这不是设计者最初能够设计到的,我也不是这么弄的,警察说这个也可以,尸体不知道身份,他就可以查出来。他应用于这个事情的时候,大大超越设计者的想象。今天的智能,我们的想象已经跟不上人工智能发展的速度了,所以千万不要担心人工智能技术跟不上我们的想象。 

邓峰:我举一个例子,你虽然做的很准,但是你很难应用。拿医学图像处理来说,大家知道照X光,或者是各种各样的CTMRI,你可能有很多东西,如果你的影象科医生是很好的,医生他看的比较准,不好的医师可能看不好,经验不丰富看不了那么准。人工智能来做非常好,现在这个准确率也有提高,但是问题在哪儿呢?因为我们用了深度学习的方法,导致什么呢?他看的图片以后,他可能看了几百万的图片,其中有可能有几十万是病人,他就告诉你这个可能是有癌症,或者说准确率多高有癌症,但是他解释不出来为什么。你要给到这个临床医生他给你看,他说,你这个左胸和右胸的这个纹理不够清晰,或者是哪儿不够清晰,结节的形状,结节的大小等等,他会说一些这个东西,可是人工智能给你回答的只是说你这个疑似癌症。这怎么在实际当中用?你没法跟病人解释怎么办?

朱珑:我来解释一下,刚刚那个片子可能大家没有细节看,我没有展开。我刚才有一个CT的片子,我们出的报告恰恰是你说的,里面对结节的大小,它的体积、可疑性等都有描述,我们会出诊断报告。就是说它是可以被解读、可以跟医生交流的,他是做一个描述性的东西,不是只回答患癌或健康。

邓锋:你已经不是简单的深度学习了,你已经走到结合其他的东西来做的方向了。

朱珑:可以这么说吧。刚才说的问题是有一部分存在的,甚至是大部分存在的。时间就是2017年比2016年快太多,2016年比2015年快太多。

我举一个例子,2016年我们的产品能够被部署到医院,就用了半年时间。在公安系统同样的这个事情我做了两年半的时间。

就是说技术在商业化落地的过程,商业跟技术结合的过程越来越加速。当然这个可能是我们一家公司的特例,或者说不是现在市面上的公司都这样,但我觉得总体趋势是这样的。

邓峰:加速是最恐怖的一个事儿。

朱珑:对。

邓峰:我们下面开放给下面的听众,大家可以提问。

听众:您好,想问一下朱总,人工智能在技术层面还有在发生哪些重要的变化吗?短期之内是否,还有像Hinton2006年时发的那个同等重量级的那种论文的出现。刚刚您也在自己的演讲中提到,AI的技术在这两年有跳跃性的进步,想问一下您指的跳跃性的进步都有哪些?

朱珑:是这样,这个算法就是技术本身十年前就有了,不是在这十年有跳跃性的发展。整个世界认识它是跳跃性的,这些科学家憋着,憋着,也不是因为那个GPU、大数据,也是也不是,什么意思呢?当年我在MIT的时候,全球就少数的几家团队用GPU,就敢用GPU,他就相信那么大的数据能够上去有效果。既使是发明的这个人,他当时并不如Hinton那么坚定。就是说,同一件事情到你手里,信的人和不信的人,发展速度差别是巨大的。因为任何的转型,或者说往前突破都有风险和成本,你要学习新的语言,学习新的东西。

大家不要有一个误区是最近有什么特别明显的发展,这个技术是这几年有逐渐的增加。跳跃性的意思不是代表这个技术,或者科学家理解上的跳跃性,是说这个东西在工业上或者说在应用上会有跳跃性的发展。

比如说,今天大家开始探讨记忆,因为我们很多是识别大脑的智能的一些比较单一的功能,现在记忆推理都可以,或者说在尝试并且是科学可验证的手段,向人的水平逼近,所以这些能做了,好多事情就能够实现,包括人机对话等等。

听众:谢谢,我想问朱总一个问题,刚才朱总提到,现在这个阶段人工智能的技术也是没有特别的权威,很多算法也是并不是什么特别创新的,或者是特别的算法,我想请教,作为一个商业机构依图科技最核心的竞争能力是什么?您如果要往前发展,希望成为下一代BAT或者是成为一个独角兽的话,您最核心的战略推动是什么?谢谢。 

朱珑:讲到技术好不好理解,这个投资机构怎么辨别。我讲一个笑话,就是红杉资本周逵总最后要投我们的时候,问我你这个技术,你说你最好,这个能判断吗?我说怎么判断?你判断不了,你只有信我或不信我,最好的人你是不可能有能力判断的,你只能选择信我或不信我,我是说“最好的人”,不是前10%的人,最好的人只有最好的人才能判断。

那最好的人判断他其实也不是通过这个结果,他有很多细节,他输入的很多观点是一致的,他是有体系的,三年前他是可以,三年后可以被验证的,是有信用的,不是只是一句话喊对了,他100句话都说对了,他不是只是这一点上说对了。

我讲一个具体的。今天很流行的说法是AI要跟to B结合,投资人或其他很多人认为这是想当然的事情。但是5年前,进我办公室的人第一句话都是在问,你为什么不做to C?潜台词是没有to B这件事情的。

今天to B变成人们一个共识了,投资人还是问我怎样去辨别团队。我觉得AI本身不是一款产品,科学家没有特别天生的优势。AI的任何技术不是产品。比如说在公安系统中,我们的后台不是只有算法,而是端到端的。公安的业务平台,对他的科技口、刑侦口和交通口的战法应用,以及业务部门怎么分发到派出所,怎么配合,这些对产品的定义理解非常重要。医疗行业也是一样,只是一个算法或截面的改动,对算法的要求差距就很大。这就非常需要对技术和商业场景相结合的理解,非常需要高手。作为翻译者或沟通者,这个角色非常重要。这是比AI人才更稀缺的。

邓峰:我解读一下,举一个例子,拿医疗影像处理来说,很多团队都在做静态图像对比。大家看到大量的数据公司做的很好,但是实际应用中发现不太好用,为什么会这样?因为最大的问题是图片。技术员拍摄的X光、CT,可能因为拍摄水平不高,图像不标准。如果只是从技术的角度上考虑,不从产品的角度考虑,做的再好也没用。怎么能够让产品帮助技术员实时的把照片拍好,这可能是产品很重要的点。这跟人工智能和影像识别没有太大的关系。这点我很同意,我们要从行业切入,从用户的刚需和痛点做好产品。再往后推,可能是人工智能的技术。还有问题吗? 

听众:我们是做医疗方面的,刚刚朱总谈到您觉得进入医疗领域还蛮快的,我自己在行业里面觉得这个过程还挺慢。我特别认同场景这件事情。您举了几个例子,我自己的感觉是它没有在创造价值的场景下发挥作用。您觉得在进入医疗行业时,会不会有一些阻碍的因素?

朱珑:我们做医疗并不是第一次做垂直行业。我们首先做的是公安领域。这是一个很深的而且不是那么好做的垂直行业。这里面存在进入垂直行业的共性方法。这些方法和经验是对人的理解,对部门之间的理解。这是对进入医疗行业有帮助的。其次,对产品和技术的理解,在垂直行业中也会碰到,在医疗行业也会有共性。所以我们在公安领域里面有一个口号,就是我要比公安的人更懂公安。医疗也是类似的情况,所以我们会有比较谦卑的学习心态,让我们比医生更懂医生。我要和医生、生物学家、药厂、投资人聊,比他们都懂这个行业。我觉得这个是很关键的。

邓峰:我问的问题可能更直接,其实进入医疗行业是强关系型的,跟技术和产品的关系不大,主要是靠客户管理,对吧。

朱珑:是。

邓峰:人工智能这个时代,是不是还要通过强关系才能交易,才能进医院。

朱珑:你刚才说的是现状。我们在医疗行业感受到的和公安领域非常相近的地方是产品真的能打动人。我第一天进入医疗行业,一点医疗的算法和产品都不具备,但是我只问一句话,就是你最突出的问题是什么,或者哪些是有数据基础可以做的。两个月之后我就带来一个样本在这里试验。他们真的关心这件事情,因为能解决他们的问题,真的有用。做的时间要足够快,从算法定制到产品研发到给出结果,这个威力是非常大的。

邓峰:非常好,我知道观众还有很多的问题,但是时间有限。最后大家一起感谢一下我们的演讲人和我们的嘉宾。

 58fdd8ed932dc.jpg


2
Top