10月25日至27日,在以“智能科学的发展与应用”为主题的第二届智能科学国际会议上,被称为AI界鼻祖的迈克尔·乔丹亲临现场,为正在风口上的“人工智能”泼了一盆冷水。
“在未来十年之内,人工智能系统的‘智能’还非常有限,你并不会觉得它能和人类一样智能了。我认为未来十年这些AI系统还不能像人类这样有这么高的灵活性和创造性。”乔丹说。
乔丹与深度学习鼻祖Geoffrey Hinton一起,被认为是人工智能领域两位“根目录级”人物,他的学生有深度学习领域权威Yoshua Bengio,贝叶斯学习领域权威Zoubin Ghahramani,以及前百度首席科学家吴恩达等等。其本人现执教于加州大学伯克利分校,任电气工程与计算机科学系和统计系杰出教授。 他还是是美国科学院、美国工程院、美国艺术与科学院三院院士,是机器学习领域唯一一位获此成就的科学家。他曾指出机器学习与统计学之间的联系,并推动机器学习界广泛认识到贝叶斯网络的重要性。他还以近似推断变分方法的形式化、最大期望算法在机器学习的普及方面的工作而知名。
提起人工智能,很多人脑海里的第一个形象通常是机器人。就像电影《我,机器人》中的智能机器人一样,人类可以与它进行智能的互动。因此,有些人觉得人工智能就是指这方面的进展。它可以和你沟通,甚至照顾你的衣食起居。
但乔丹认为,这样的机器人,短期内做不出来。
从计算机视觉角度来说,目前,计算机已经能够在复杂的图像中准确识别出特定的物体。但是目前计算机还缺乏对视觉场景常识性的理解。例如,如果一个人走近舞台的边缘,人类会感觉到他很有可能从舞台上摔下来,“人类可以从场景中判断接下来会发生什么,以及为什么会出现现在的场景。但计算机还远没有实现这方面的能力。”
从语音识别角度来看,当前从语音到文字的相互转化,已经在诸多语种中成功得以应用。但计算机的听觉能力还十分局限。例如,如果你闭上眼睛,只凭听觉来感受周围的环境,你可以知道你身处的是安静的公园还是繁华的街道,还可以根据声音来推断周围的人和物的方位,“计算机目前还缺乏这一类的常识性认知,如果再加上复杂的语言信息,那就更是难上加难。”
自然语言处理,对计算机而言是最困难的。“我们看到机器翻译目前已经取得了很大的进展,但是它仍然会错漏语言中的诸多细节。”乔丹说,当下的机器翻译使用的神经网络技术能对海量的不同语言数据进行计算和匹配,但人类学习语言的方式和计算机大不一样。
例如,问答系统,目前问答系统的研究只能回答一些条件明确、答案简单的问题,而无法对真实世界问答场景中复杂的问题作出复杂回答。而人们语言中的语义繁复多样,有同义词、近义词和反义词等等,一个词组在不同的语言场景中可能蕴含多种含义,不同语言之间的表达方式和习惯更是有所不同。“对于人类来说,我们在从小到大的学习过程中学会了如何辨别复杂的语境,但计算机目前还远不能做到这一点。”
再说机器人科学角度,目前,在工业界正在使用的机器人只能程序化地完成一些固定的任务,这与人们想象中的“人工智能机器人”区别较大,“机器人科学有助于实现人工智能研究的最终愿景——我们希望未来人工智能机器人能够自主地运行,并与我们互动。”
乔丹预测,有些智能化应用确实可能成为现实。例如未来10年,自动驾驶汽车甚至是无人驾驶的出租车有可能实现。“虽然眼下这些技术的使用体验还不甚良好,但是可以期许的是,未来10年这些前沿技术应该可以为人们所用。”
至于AI系统在人机交互的过程中能够产生什么样的理解,是否能实现预测、计划等高级智能的问题,乔丹认为,实际上离这一步还非常遥远,“至少要花几十年的时间,甚至数百年时间才能让机器人了解人类。”