最近几年来,人工智能大热,人工智能大拿也开始变得为人们所熟知,比如人工智能教父Geoffrey Hinton、人工智能领域的三大奠基人之一Joshua Bengio、谷歌AI女神李飞飞、Facebook AI掌门杨立昆、中国人所熟知的大牛吴恩达等。
然而有一位牛人被称为递归神经网络之父,发明了LSTM(长短期记忆网络),有效地解决了人工智能系统的记忆问题。他的想法以不同的形式体现在每一台智能手机、每一个社交网络和数字助理上。他绝对可以称得上是人工智能行业内名符其实的先驱,但是,他却在很大程度上还鲜为人知,他就是瑞士人工智能实验室(IDSIA)的研发主任Jürgen Schmidhuber,他是一位教授,一位研究人员,同时也是拥有25名员工的人工智能创业公司Nnaisense的联合创始人。
几十年来,Schmidhuber和其他一些人工智能专家一直都在运用相似的研究方法来研究如何实现通用人工智能,但直到六年前,能力强大的计算机和海量数据的结合才开始将他们的理论转化为现实。他曾自信地表示,“我认为只有像我们这样的小团队才能制造出一个AGI(通用人工智能)。我们已经有了很多成功的基本要素。”
Schmidhuber的AGI(通用人工智能)梦始于德国的巴伐利亚州。他来自于一个中产阶级家庭,父母分别是建筑师和教师,他从小就崇拜爱因斯坦,渴望能比爱因斯坦走得更远。他一边喝着拿铁咖啡一边说:“十几岁的时候,我意识到,作为一个人,最伟大的事情就是去建造一个能通过学习来超越人类智能的东西。物理学只是基本,因为它是关于世界的本质和世界是如何运作的,但还有一件事是你可以做的,那就是成为一个更好的物理学家。”
Schmidhuber决心创造一个比他心目中的英雄爱因斯坦更聪明的物理学家
Schmidhuber在过去四十年的时间里一直全身心地为实现这一目标而努力。他的弟弟Christof记得,在阿尔卑斯山的长途家庭旅行中,尤尔根在后座上一直进行着哲学思考。Christof说:“他告诉我,人类可以制造出比自己更聪明的智能机器人。他还说,人可以用原子来重建一个大脑原子,可以用铜线代替我们缓慢的神经元作为连接物。直觉上,我反对这种想法,即人造大脑可以模仿人类的感受和自由意志。但最终,我意识到他是对的。”克里斯多夫在进入金融行业之前,曾在核物理领域担任研究员。
高中毕业后,Schmidhuber学习了计算机科学和数学,从1981年开始在西德军队服役了15个月。他和他的指挥官们相处得不太好。Christof说:“Jürgen不喜欢被人使唤,特别是如果这意味着让他做一些他认为无用的事情。在大学里,他获得了计算机科学博士学位,并发表了他的首篇论文,论文与人工智能和神经网络,以及硬件和软件的混合体模仿大脑内部神经网络结构相关。他的在线履历详细地列出了他在学术界的经历,包括“拒绝加州理工学院的博士后录取通知”,还有他在4年的时间里完成了他的学士和硕士学位,而一般人通常需要6.05年的时间。
Schmidhuber在卢加诺生活了23年,这里有湖边游艇和Angelo Dalle Molle的豪华山间别墅。Angelo Dalle Molle是一名意大利利口酒进口商。Dalle Molle发明了一种由洋蓟制成的流行开胃酒,并从中赚了一大笔钱。Angelo Dalle Molle还梦想着建立一个拥有智能机器劳动力的乌托邦,所以在1988年,他捐赠了数百万美元来创建卢加诺市的Dalle Molle人工智能研究机构,简称Idsia(缩写为意大利语)。Idsia最早雇佣的学者之一就是Schmidhuber,该机构与当地大学的合作,以及源源不断注入的政府资金,合力把这个小镇变成了天堂里的人工智能中心,一个产生了大量科学发现的地方。
感谢Schmidhuber,机器具有学习所需的记忆。
Schmidhuber每年都会在位于卢加诺市中心的提契诺大学(Università della Svizzera Italiana)教授一门课程。他还在市郊的一个Idsia实验室工作,这个实验室位于一个加油站、一条高速公路和多山的农场之间,农场里有马、驴和山羊。2014年,Schmidhuber和四名前学生在离大学几个街区的地方创立了Nnaisense公司,目的是在制造业、健康和金融领域寻求商业伙伴关系,以及进行纯粹的研究。
现年55岁的Schmidhuber身材高大,体型匀称,留着精心修剪斑白山羊胡。他喜欢穿一身黑或一身白,包括一件尼式服上衣和一顶帽子。他那充满诗意的慕尼黑口音,不时穿插着节奏和语调的突然变化,让人想起Christoph Waltz作品《无耻混蛋(Inglourious Basterds)》中的Colonel Hans Landa上校。你不得不密切注意他的诗意的口音和严肃话语混合所产生的效果,因为这通常让人感觉像是一件不太好的大事即将发生。
和他更广为人知的人工智能同行一样,Schmidhuber的大部分时间都是走在计算机科学的边缘。他相信要实现真正的网络意识的最好机会在于神经网络。神经网络在20世纪50年代是一个时髦的想法,但是技术上的限制使神经网络到了21世纪依然处于无法实现的状态。那些一直致力于神经网络理论的人让他们的同事们感到不解,不知道这些聪明的人是如何做出如此糟糕的生活选择。
相对较小的卢加诺队是创造真正人工智能的黑马候选人。
接着,一件有趣的事情发生了。到2000年代中期,互联网正在大量收集用于训练神经网络所需的大量数据集,而运行最新视频游戏的快速图形芯片也被证明是处理数据的完美工具,Schmidhuber和他的同事们开始发现他们的算法比传统编程技术更能解决问题。2012年,神经网络在识别图像和语音方面表现得很好,然后在更大范围的任务中也表现不错。今天,包含所有这一切进步的人工智能软件在我们所有的办公室、家庭和口袋里的智能手机上运行。(包括谷歌、亚马逊、Facebook、百度和微软在内的公司都把自己的未来押在了神经网络技术的进一步飞跃上。
我们很难浏览所有的人工智能研究论文,即使就是在这过去的六年时间里发表的论文,但是在过去的几十年里发表的全部论文中只有一小部分是必读论文。这一领域的第一篇具有重大意义的论文发表于1986年,当时辛顿写了关于一篇反向传播的文章(也有人称之为“backprop”),这是一种通过对接收到的数据的重要性进行排序来调整神经网络的方法。
1989年,杨立昆写了另一篇具有重大意义的论文,文章描述了卷积神经网络。卷积神经网络分解了对于计算机来说很复杂的问题,比如在照片中找到一只猫,能将问题分解成小一级的模块。第三个突破性的文章则发表于1997年,是Schmidhuber的文章。他称之为长短期记忆,或者简称LSTM,“你可以用五行代码写下来,”他说,轻描淡写得就像谈论辣椒食谱一样。
与众不同的无人机
然后,Schmidhuber对其基本理论进行了长时间的解释,他首先列出了导致他得出结论的知识分子课程,引用了俄罗斯数学家Alexey Ivakhnenko在1965年和芬兰数学家Seppo Linnainmaa在1970年做的研究,接下来,他解释了LSTM更具体的问题,因为神经网络进行了数百万次的计算,LSTM代码寻找有趣的发现和相关性。它为数据分析增加了时间背景,能记住之前发生的事情,并对如何将其应用于神经网络的最新发现作出结论。这种复杂程度使人工智能有可能开始将其结论构建到一个更广泛的系统中——根据大量的文本(例如,“each(每个)”这个单词做主语时会使用一个单数动词)来教授自己有关语言的细微差别。
Schmidhuber把这种人工智能训练比作人类大脑将大的时刻过滤成长期记忆,而让更平常的记忆消失的方式。他说:“LSTM可以学会把重要的东西放在记忆里,忽略那些不重要的东西。在当今世界,LSTM可以在许多非常重要的事情上表现出色,其中最著名的是语音识别和语言翻译,还有图像字幕,你可以在那里看到一个图像,然后你就能写出能解释你所看到的东西的词语。”
这些力量使LSTM成为可以说是最商业化的人工智能成就,它的应用非常广泛,从预测疾病到作曲。这只是Schmidhuber的网站中所列举出的众多发现中的一个,他的网站还提供了大量关于各个发现的起源和影响的详细资料。Müller-Freitag说:“他做出了如此多的巨大贡献。他在很多方面都远远领先于他的时代。”
最负盛名的人工智能会议是神经信息处理系统大会(NIPS)。该会始于1987年,是几百个顽固的人举行的相当非正式的聚会,在过去的几年里,与会人数从1000人增长到超过6000人。在NIPS,人工智能超级明星们展示他们最新最伟大的研究成果。这个会议也同样少不了Schmidhuber的身影。
2016年在巴塞罗那召开的神经信息处理系统大会上,一位名叫Ian Goodfellow的后起之秀就“生成对抗网络”为主题进行了两个小时的演讲。他是谷歌的一名研究科学家,他开创了一种通过推动神经网络竞争来加速其解决问题的方法。在演讲开始前,他被介绍为“我们今天社区中最具创造力和最有影响力的研究人员之一”之时,他低着头站着,双手紧握。他戴着眼镜,留着西瓜头发型。他害羞地站在讲台后面,开始演讲,他的脸颊仍然因为别人对他的赞美而发红。
在一个小时的时间里,一切进行得很顺利,他的幻灯片满是方程式和人工智能的复杂问题。正当他刚刚开始谈论一种叫做噪音对比估计的东西,台下观众中出现了一个非常熟悉的德国声音:“我能问个问题吗?”
Schmidhuber开始说到:“你的幻灯片做的很好。“Goodfellow则把目光锁定在他的身上。Schmidhuber绘制了一段自1992年开始的对抗网络的历史,强调了他的研究和Goodfellow的研究之间的联系,他说了将近三分钟的时间,接着他问到:“我想知道你是否对这些旧的对抗网络的相似点和不同点做怎样的评论?”他的意思很明显,他认为Goodfellow剽窃了他的研究。
移动机器人
Goodfellow原本死死地盯着Schmidhuber,听完之后,他转而恼怒地笑了一下。Goodfellow对台下的听众说道:“他实际上知道我的观点,因为我们通过电子邮件进行了交流。我不太喜欢公开的对抗。”一大部分观众都称赞了这个年轻人。当掌声逐渐平息时,他说他不认为过去的对抗网络和他的研究非常相似,他在最近的一篇论文中也提到了这一点,而Schmidhuber也已对此了解。
Schmidhuber却并没有就此罢休,他又一次插话说道:“只是为了完整性”,他接着又继续说了一段时间,试图削弱Goodfellow的反应。Goodfellow已经完全失去了耐心,他说:“我更愿意把时间花在讲授生成对抗网络上。”语罢,台下听众报以掌声。Schmidhuber又尝试要发言,但Goodfellow没有理会这一请求,而是接着继续进行演讲。
阿尔伯塔大学的人工智能研究人员Kory Mathewson说:“Ian绝对是这个世界上的天才,Jürgen只会站起来说,‘这不是一个有趣的想法。我们几年前就想到过了'”。他亲眼目睹了一些Schmidhuber与他们冲突的画面,并说类似的冲突已经成为了某些潜在的仪式,“也就是说,年轻的研究人员可能希望有一天能与Schmidhuber产生类似的冲突。”
Schmidhuber渴望获得同样认可的愿望甚至超出了他自己的工作。他的网站充满了看起来像过时的Pinterest页面的板块,排列着各种各样的发现,从自动驾驶汽车到所谓的“万物理论”,即数学可以正确地描述宇宙的概念。大多数历史学家倾向于把Charles Babbage和Alan Turing这样的英国人视为现代计算之父,而Schmidhuber则认为现代计算起源于从德国工程师Konrad Zuse。
他说:“每当我看到有人做了重要的事情,而他没有得到认可,但有人又说另一个人先做了那件事,那么我是第一个把这个信息传递给《自然》杂志、《科学》杂志或其他期刊上的人。你可以通过时间脉络来证明谁先做了什么。说得好听点,其他的一切都是再创造,说得难听一点,这是剽窃。”
许多人工智能领域的人认为,Schmidhuber高估了理论,低估了实际应用价值。在一场始于《自然》杂志,并蔓延到互联网留言板上的争吵中,Schmidhuber立刻怼上了所有的人工智能大佬,指责他们扭曲了人工智能的历史,抹去了他和其他人最初的想法。杨立昆对此感到愤愤不平,他回答说,一个接一个地反驳这个说法是“毫无意义的”,而且很多人也有自己的想法。杨立昆写到:“但是你没有看到我抱怨。这就是科学和技术进步的方式。”
一些参与NIPS大会的研究人员对这种社区和公平竞争的精神感到自豪。但也有一些人认为,Schmidhuber没有被历史公平地对待,仅仅是因为他有些冒犯之举。Mathewson说:“我们不应该仅仅因为他们的个性而败坏别人的工作。一半的科学是在交流科学,他努力做到这一点,即使他没有以最传统的方式去做。”
Schmidhuber很清楚,他的行为伤害了他在行业内的地位,并削弱了他的想法所能产生影响。他要求这个故事“删除任何与其他研究人员的竞争”,并补充说他对自己的工作已经找到了进入主流的方式感到满意。他说:“每个人都在使用LSTM。每个人都在引用它,所以它很好。生活是美好的。”
在一个阳光明媚的二月天,Schmidhuber正去往一个他常去的地方,他的Idsia实验室看起来很无聊,但里面满满的都是实验性的无人驾驶飞机和人形机器人。在他的桌子后面,书架上放着几百卷的《科学》和《自然》杂志,外加两罐超大号的乳清蛋白粉。在实验室附近,一个成年人大小的算盘可以提醒人们,这个地方曾经是一所学校。
接下来,Schmidhuber步行穿过了他任教的大学,前往Nnaisense公司。公司里的员工都是Schmidhuber之前的学生。他说,以私人利率付工资来让员工承担雄心勃勃的项目,是一种让卢加诺人才不去寻找更有利可图的公司工作的方法,比如伦敦谷歌旗下的人工智能技术有限公司DeepMind。DeepMind的联合创始人Shane Legg,他曾是Schmidhuber的学生,他曾多次提到这个事实。
Nnaisense公司已经从西班牙投资公司Alma Mundi Ventures那里获得了数百万美元资金,并与几家公司合作。在办公室里,一套三款微型汽车帮助完善了奥迪的自动停车软件。Nnaisense希望能与名为Quantenstein的人工智能股票交易软件合作,为未来的研究提供资金。Quantenstein是Nnaisense与一家金融公司合作开发的。Schmidhuber说,他的团队还开发了一种强大的医疗技术,但他不会说出客户的名字,也不会描述这个系统,他说:“我们可能永远不会透露这一信息。”
这个谦虚、安静的办公室看起来不像一个不停运转的人工智能超级大国,但Schmidhuber的团队经常能击败像DeepMind、Facebook和微软这样的资金更充裕的竞争对手。在2017年NIPS大会上,Nnaisense击败了其他441名选手,赢得了Learning to Run比赛,这是要求模拟一个拟人化的人工智能,以最快的速度在虚拟障碍课程中冲刺。这些提交的视频最初就像是大学兄弟会聚会的最后几个小时,因为你能看到视频中的身体停止、活动、摇摆和摔倒,慢慢地从错误中吸取教训。Nnaisense的版本看起来非常健壮,以每秒4.6米的速度运行,超过了中国团队4.2米每秒的速度。这一胜利让Nnaisense获得了一台功能强大的价值7万美元的电脑,“重要的是展示我们能做什么,”联合创始人Jan koutnekk说。
在午餐时间,Schmidhuber和他的员工抱怨人工智能目前对广告的关注。Schmidhuber说:“今天人工智能的大部分利润都来自于市场营销。”他的团队想要拓展业务,打造人工智能处理不同任务和承担更多工作的能力。他说,“当你拥有可以制造机器和处理复杂流程的机器时,那时才会创造真正的财富。”他的最终目标依然还是通用人工智能。“你会想要拥有能制造苹果手机的人工智能。”
实现通用人工智能还很远。在目前,人类必须做大量的手工操作才能让人工智能系统运转。翻译常常很别扭,电脑把热狗识别成腊肠狗,而自动驾驶汽车也会发生车祸。Schmidhuber坚持认为,要实现AGI只是时间的问题。他说,拥有顶尖精英的公司积累了一大笔财富的一段时间之后,机器劳动力的未来将重塑世界各地的社会。
他说:“在不远的将来,我将能够与一个小机器人交谈,教它做一些复杂的事情,比如通过展示和讲述来组装智能手机,制作T恤,以及目前发展中国家的贫困儿童在奴隶般的条件下完成的所有这些事情。人类将会活得更久、更健康、更快乐、生活得更轻松,因为现在需要人类劳动力的许多工作都将被机器所取代。然后会有数万亿种不同类型的人工智能和一种快速变化的复杂的人工智能生态,这种生态扩张得到方式是人类所无法效仿的。”
与许多人推崇工智能产品不同的是,Schmidhuber并没有否认人工智能技术的进步会让某些工作消失。他说,某些国家和团体将会比其他国家更好地适应不断蒸发的劳动力市场。赢家:拥有强大福利体系的斯堪的纳维亚国家(在那里,“如果你没有工作,你也不会死”);女性(“比男性更难取代,因为她们是一般的问题解决者”);还有创造性的类型(“如果某人是一个能通过书籍唤起人类经验深度的作者,那么那里似乎有一些有价值的东西”)。
虽然Schmidhuber有一些像这样的浪漫想法,但他却像大多数的人工智能大佬一样,对代码极为痴迷。他们相信机器最终会超越我们,他们陶醉于这个新的世界秩序将带来的效率和清晰度。即使是这些人的抽象方面也被算法所取代。Schmidhuber的业余爱好是“低复杂性艺术”,它使用数学公式来产生计算机生成的图像。通常,这些作品只会在屏幕上呈现出少量的斜线,他说:“这与提取你想用最少的信息量来描述的艺术的本质相关”。
在Schmidhuber坚信AGI一定能实现的背后是他的信念——我们生活在一个矩阵式的计算机模拟中。他说:“这就是我的想法,因为这是对一切事物最简单的解释。“他的理论认为,人类一开始就设定为要不断追逐进步,并将继续制造更强大的计算机,直到我们让自己变得过时或者决定与智能机器合并为止。Schmidhuber预言说:“要么你变成了一个真正不同于人类的东西,要么你出于怀旧的原因依然以人的身份存在。但你不会成为一个主要的决策者,你不会在塑造世界的过程中扮演任何角色。”
至于为什么他觉得有必要帮助打造AGI,他说这是他的人性。一个人必须澄清事实,然后推进记录,即使有几个人或几十亿人在这一过程中感到不安。他说:“我是这个古老的竞争过程的结果,这一过程不可抗拒。基本上,我无法起到任何帮助。”