哲学家和其他人一样,在追求真理中,自由地运用任何方法。哲学没有任何独有的方法。
——波普尔
王东 著
书号:978-7-5130-8867-1
定价:68.00元
历经3次寒冬,人工智能在2012年以深度学习的面貌再次崛起,同时借助数据、算法和算力快速发展并以肉眼可见的速度迅速商业落地,在众多领域展现出惊人的能力。在深度学习崛起的十年后,2022年12月,人工智能企业OpenAI发布了现象级的聊天对话模型ChatGPT,又重新点燃了人们对通用人工智能(Artificial General Intelligence,AGI)的热情。而人工智能与科学发现(scientific discovery),这两个激动人心的领域在这十年间也产生越来越多的交集,这种交集带我们走向一种基于数据和智能的更加快速和自动化的科学发现以及技术创新。人工智能现在可以精准预测蛋白质折叠甚至帮助创造新蛋白质、发现新的化学结构,帮助解决量子多体问题,我们几乎每天都能看到大量基于人工智能(AI-based)的科学发现并且还在不断加速。随着科学中实验仪器的不断智能化,数据的产生和分析也在不断地自动化,在可预见的未来大部分科学实践流程中的工作都会有人工智能辅助甚至被人工智能代替。
这些近代科学蓬勃发展几百年以来首次出现的新现象自然会带来很多新问题以及对旧问题的新思考,这些问题其实自通用电子计算机和人工智能学科诞生之初就有很多科学家和哲学家在讨论。比如从方法论角度,能否通过计算的方式去模拟科学发现的过程、去模拟科学概念和知识创新甚至去获得新的重大的科学发现?再比如从认识论的角度还有一些更加深刻的问题——科学,尤其是自然科学,是否还是人类的专利?当然肯定有人会说,人工智能系统也是人类构建的,类似深度学习这类人工智能方法虽然还存在可解释性等问题,但是归根到底是人类技术的产物,人工智能驱动的科学也是人类的科学。但与传统的人类做科学的方式相比较,人工智能参与的科学确实有不同的地方。这种不同不仅仅是机器的强大的曲线拟合能力和人类简单的归纳能力之间的不同,物理学家安德森说多即是不同(more is different),当数据多到一定程度的时候,当数据的层级足够低足够基础的时候,曲线拟合所带来的可能就不仅仅是经验规律,还可能是更加普适的科学理论。
本书是对类似上述问题的一些回答,是作者近几年跟随人工智能以及数据和智能驱动科学发展的一个研究集合。
本书可分为三个部分。第一部分从经验的角度考察人工智能尤其是机器学习在科学发现中的作用,分析机器学习当前能够达到的科学发现的层级,提出一个在当前的技术条件下用机器学习发现新概念和新思想的路径。第二部分对科学哲学中的科学理论结构研究进行综述和分析,尝试从一种基于具身数学认知的科学实践哲学的角度,分析机器的科学发现与人类的科学发现之间的关系。第三部分是案例研究,用科学史上的经典案例——相对论相关的以太漂移——的历史数据作为训练数据,看机器学习能否在真实的科学发现场景中带来新的概念和思想,为第一部分提出的设想提供实证支持。
本书虽然名为“人工智能与科学发现”,但并未涉及人工智能的所有领域,而主要关注人工智能中的机器学习(machine learning)与科学发现的关系。科学发现是近代以来人类发展中最重要的活动,是知识甚至“真理”的最有效的生产方法。人工智能与科学发现的哲学研究是一个广阔的话题,仅从方法论和认识论的角度看就可以有很多不同的进路,本书仅取其中的一小部分,不企图做一个大而全的刻画,而是从机器学习入手,先现实地考察机器学习帮助下的科学发现能够达到的层次,再从数学认知和科学实践入手考察机器发现与人类发现之间可能存在的关系。
王东,安徽合肥人,本科就读于烟台大学计算机学院,硕博就读于中国人民大学哲学院,后于清华大学社科学院博士后工作两年。现为北京工商大学马克思主义学院讲师。近期主要研究兴趣在于一般科学哲学、人工智能哲学、认知科学哲学。
一边是爆炸性全域发展并深度渗入人类社会各个运行环节的人工智能,一边是对于近现代人类文明发展来说至关重要的科学发现活动,两者已经产生交集并不断交融深入。人工智能驱动的科学发现目前发展到何种程度,人工智能会不会或者在什么程度上能替代人类科学家?机器的科学发现是否与人类的科学发现一样,还是能够超越人类的认知达到我们无法理解的层级?这些问题是本书尝试从哲学角度去探讨的。
第1部分 机器学习与科学发现的层级
第1章 智能驱动的科学发现
1.1智能驱动的科学新发现
1.1.1天文学、宇宙学
1.1.2物理学
1.1.3生物学与医学
1.1.4数学
1.2基于人工智能的科学再发现研究
1.2.1早期自动科学再发现研究
1.2.2发现科学概念
1.2.3发现科学公式
1.3当前智能驱动科学发现的局限
第2章 机器学习
2.1机器学习简介
2.2人工神经网络
2.2.1从人工神经元到感知机
2.2.2前馈多层神经网络及其通用性
2.3降维与自编码器
2.4符号回归
2.5人工智能的可解释性
第3章 人工智能与科学发现的层级
3.1科学发现、科学知识及其种类
3.2科学发现的种类和层级
3.3智能驱动科学发现的层级
3.3.1当前人工智能能够达到的发现的层次
3.3.2一种特殊科学发现情形下的机器学习
第4章 数据与智能驱动科学发现相关的争论
4.1数据密集型科学发现及其哲学讨论
4.1.1问题的提出与争议
4.1.2争论中存在的问题
4.1.3从认知的角度考察数据在科学活动中的作用
4.2智能驱动科学发现与自动科学发现的哲学讨论
4.2.1方法论相关争议
4.2.2方法论争论的原因分析
第1部分的问题讨论
第2部 分机器学习与科学发现的关系
第5章 科学理论的结构和内容
5.1何为科学理论
5.2形式化重构的观点
5.2.1语法的观点
5.2.2语义的观点
5.2.3通过范畴提升对语法与语义的同构
5.3语用——实践的观点及其认知进路
第6章 科学与数学认知
6.1数学在自然科学中不可思议的有效性
6.2数学认知
6.3基于认知语言学的具身数学认知
6.3.1理论
6.3.2具身数学认知的哲学观——自然主义的
反实在论
6.3.3数学作为同构的认知过程及其问题
6.4应用——自由落体定律的负数解
6.4.1为何二次方程会有两个解
6.4.2为何在应用到自由落体中时要舍去负数解
第7章 机器学习与科学发现过程
7.1科学实践过程的同构
7.2机器学习与发现的逻辑
7.3认知同构理论的问题
第3部分案例研究
第8章 语言模型与科学发现
8.1预训练大规模语言模型及其能力
8.2大语言模型与自动科学发现
8.2.1大语言模型与智能驱动科学发现
8.2.2大语言模型与自动科学发现
8.2.3大语言模型实现科学发现的具体路径
第9章 科学史案例建模研究
9.1以太相关现象与理论
9.1.1光行差
9.1.2斐索流水实验
9.1.3迈克尔逊莫雷实验
9.2机器学习建模
9.2.1模型1.0(带预设)
9.2.2AI-Einstein 2.0——无预设
后记
参考文献
来源:知识产权出版社
本期策划:马晨哲