《AI 3.0》(Artificial Intelligence: A Guide for Thinking Humans)这本书由梅拉妮·米歇尔所著,深入探讨了人工智能(AI)的发展历程、现状以及未来的可能性。
梅拉妮·米歇尔(Melanie Mitchell),波特兰州立大学计算机科学教授,曾在美国圣塔菲研究所(Santa Fe Institute)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)工作,主要的研究领域为类比推理、复杂系统、遗传算法等。在圣塔菲研究所时,米歇尔主导了复杂系统领域的研究工作,并教授了相关的在线课程。她的在线课程 Introduction to Complexity 已有近30000名学生选修,成为Coursera排名前50位的在线课程之一。
全书分为五个部分,每个部分聚焦于AI的不同方面,核心是AI发展的三个阶段:
AI 1.0(逻辑智能):这个阶段的人工智能主要基于规则和逻辑,它依赖于明确的指令和程序来执行特定的任务。这些系统通常被称为专家系统,它们在特定的领域内模拟专家的决策过程,但缺乏灵活性和适应性。
AI 2.0(计算智能):这个阶段的人工智能以数据驱动和机器学习为核心,特别是深度学习的发展,使得机器能够从大量数据中学习模式,并在诸如图像识别、语音识别等任务上取得显著成就。AI 2.0 的系统能够处理更复杂的任务,但仍然局限于它们被训练来执行的特定领域。
AI 3.0 (AGI)是在AI 2.0的基础上,进一步发展,旨在实现更接近人类智能的人工智能系统,这些系统能够更好地理解环境、进行决策,并与人类进行更自然的交互。AI 3.0 强调的是人工智能的自主性、创造性和适应性,以及在更广泛领域内的应用能力。
以下是对每个章节内容的详细总结:
序言:
杰文斯悖论(Jevons paradox):威廉姆·斯坦利·杰文斯(William Stanley Jevons)是19世纪英国的数学家、哲学家和经济学家,现代经济学中的边际效用理论的主要奠基人。在英国工业革命时期,工业大量消耗煤资源并产生了严重的污染,引发了利用技术提高燃煤效率的讨论,但杰文斯的研究表明:烧煤效率越高,耗煤量将会越大。这就是杰文斯悖论:技术进步可以提高自然资源的利用效率,但结果是增加而不是减少人们对这种资源的需求,因为效率的提高会导致生产规模的扩大,这会进一步刺激需要。
工智能在视觉系统上的应用,以及一切所谓深度学习(deep learning)算法,从数学角度上看,无非是使用20世纪七八十年代的多层神经网络(multilayer neural network),通过傅立叶变换来求解对象的特征方程的过程。
人工智能应用ConvNets分为两个过程:第一个过程是猜测对象的特征函数,也就是为对象建模的过程(识别);第二个过程则是根据对象的输入-输出响应序列,进一步调节对象参数的过程,这一过程也是“学习”的内在含义。也就是说,做卷积分析,就是面对一个不知其内部构造如何的对象,通过输入一个已知的函数,观察输出函数,最终给出对目标对象内部构造的一个猜测。
第一部分:若想对未来下注,先要厘清人工智能为何仍然无法超越人类智能
第1章:介绍了AI的起源和早期发展,包括符号AI和亚符号AI的提出,以及早期AI的局限性和遇到的挑战。
一个用于识别手写“8”的感知机的示意图:
第2章:讨论了神经网络和机器学习的发展,特别是深度学习如何成为现代AI的核心技术。
在过去60多年的人工智能研究中,人们围绕符号和亚符号方法的相对优势进行了大量的讨论。符号系统可以由人类设计,被输入人类知识,并使用人类可理解的逻辑推理来解决问题。例如,一个于20世纪70年代早期开发的专家系统“MYCIN”,被给定了大约600条规则,用于帮助内科医生来诊断和治疗血液疾病。设计MYCIN的程序员在与内科医学专家经过辛苦面谈后开发了这些规则。针对一个病人的症状和医学检测结果,MYCIN能够同时对规则进行逻辑推理和概率判断来做出诊断,并能够解释其推理过程。简而言之,MYCIN是符号人工智能的一个典型范例。
相比而言,正如我们所看到的那样,亚符号系统往往难以阐释,并且没人知道如何直接将复杂的人类知识和逻辑编码到这些系统中。亚符号系统似乎更适合那些人类难以定义其中规则的感知任务。例如,你很难写出能够完成识别手写数字、接住棒球或识别你母亲声音等任务的规则,而你基本上是连下意识的思考都没有经过就自动完成了这些事情。正如哲学家安迪·克拉克(Andy Clark)所说,亚符号人工智能系统的本质是“不擅长逻辑,擅长接飞盘”。
第3章:探讨了图灵测试和AI的奇点理论,以及这些理论对AI未来发展的影响。
第二部分:视觉识别:始终是“看”起来容易“做”起来难
第4章:分析了深度学习在视觉识别领域的进展,特别是ConvNets如何改变计算机视觉。
视皮层中不同层的神经元检测到的视觉特征简图:
第5章:讲述了ImageNet竞赛如何推动AI视觉识别技术的发展。
第6章:讨论了AI在视觉识别方面与人类视觉的差异,以及AI在这一领域的局限性。
第三部分:游戏与推理:开发具有更接近人类水平的学习和推理能力的机器
第8章:介绍了强化学习在训练机器人方面的应用。
第9章:探讨了AI在玩游戏方面的进展,特别是AlphaGo如何击败人类围棋冠军。
第10章:讨论了AI在游戏领域的成就如何转化为通用AI的潜力。
第四部分:自然语言:让计算机理解它所“阅读”的内容
第11章:探讨了自然语言处理的挑战,包括语音识别和情感分类。
第12章:讨论了机器翻译的进展和挑战,以及AI在理解自然语言方面的局限性。
第13章:分析了虚拟助理如何理解和回应人类的问题。
第五部分:常识——人工智能打破意义障碍的关键
第14章:探讨了AI如何理解和应用常识,以及这对于AI发展的重要性。
第15章:讨论了知识、抽象和类比如何赋予AI核心常识。
人类智能的一个必不可少的方面,是感知并反思自己的思维能力,这也是人工智能领域近来很少讨论的一点,在心理学中,这被称作“元认知”。
自20世纪50年代以来,人工智能的主流方法都隐晦地接受了笛卡儿的这一论点,假设通用人工智能可以通过非实体的程序来实现。但是,有一小部分人工智能研究群体一直主张所谓的具身假说:如果一台机器没有与世界进行交互的实体,那它就无法获得人类水平的智能。这种观点认为:一台放置在桌子上的计算机,甚至是生长在缸中的非实体的大脑,都永远无法获得实现通用智能所需的对概念的理解能力。只有那种既是物化的又在世界中很活跃的机器,才能在其领域中达到人类水平的智能。
结语:提出了6个关键问题,探讨了AI的未来潜力和挑战。
实现足够可靠的、在几乎所有情境下都能自主行驶的完全自动驾驶汽车的技术还不存在,我们也很难预测什么时候这些问题才能被解决,专家们的预测从几年到几十年不等。一句值得记住的格言是:对于一项复杂的技术项目,完成其前90%的工作往往只需要花费10%的时间,而完成最后10%则需要花费90%的时间。