在过去两代人中,探究微分学的大多数数学家一直主张无穷小量是荒谬的。尽管凭借惯常的谨慎,他们经常会附加上“不管怎样,极小量的概念非常难,以至于我们几乎无法充满自信地去探讨这个概念”。因此,极限学说被创造出来,以规避这一难题,或者如同某些人所说的,是为了解释“极小量”这个词的含义。所有的教科书里都以这样或那样的形式教授了这一学说,尽管某些教科书只是将其作为重要性的替代观点。就运算而言,它基本上是够用了,虽然在应用中自有其疑难。
在我熟悉格奥尔格·康托尔博士的著作[尽管其中很多著作已经刊登在《数学年刊》(Mathematische Annalen)和《博尔夏特期刊》(Borchardt’s Journal)上,但尚未发表在《数学年报》(Acta Mathematica)上,它们是最早闻名的数学期刊]之前,他已经针对相对量逻辑创造出一套严格的符号体系,对这一问题给出了解答,其明确清楚地表明:极小量的概念并不包含矛盾。在康托尔的著作中,同样的观点得到了其非凡才能和敏锐逻辑的捍卫。
普遍的观点是:有限数是我们唯一可推理的数,至少以普通的推理方式是如此,或者正如某些作家所表达的,有限数是唯一可利用算术来推理的数。但这是一种荒谬的偏见。很久以前我就曾表明,有限集合与无限集合及其结果只在一种情况下才有区别,即有限集合适用于一种特别且不常见的推理方式,这种方式被其发现者德·摩根称为“换位量三段论”。
巴尔扎克在其著作《婚姻心理学》(Physiologie Du Mariage)的引言中写道:每一个年轻的法国男人都会吹嘘曾勾引过某个法国女人。如今,由于一个女人只能被勾引一次,而且法国女人和法国男人一样多,这样的话,如果这些吹嘘都是真的,那么就没有法国女人能逃过勾引。如果其数量是有限的,那么推理有效。但是,如果人口一直在持续增长,被勾引的人平均年龄要比引诱者年轻,那么结论就未必正确。同样地,德·摩根作为一个保险精算师或许已经提出过,如果一家保险公司向其投保者支付的数额(包括利息)平均要高于投保者所支付的,那必定会赔钱。但是,每一位现代的保险精算师都会明白其中的错误,因为业务在持续增长。但是,战争或是其他的大灾难会导致投保者的类别成为一个有限数,结论终究将会是非常准确的。以上两个推理便是“换位量三段论”的例子。
有限与无限集合的区别在于前者适用于换位量三段论,这一命题应当被视作科学算法的基础。
如果一个人不知道如何进行逻辑推理,我得说许多相当优秀的数学家(是的,著名数学家)都归在这一类人下面,如若单凭以往做其他推理的经验来盲目地进行推理,那他自然会不停地陷入关于无限数的错误中。事实上,这类人完全不会推理。但是,对于会做推理的少数人而言,关于无限数的推理要比有限数的容易,因为不需要运用复杂的换位量三段论。例如,整体比局部大并非公理,只是因为人们的推理水平低下——比如欧几里德——它才变成了一条公理。这是一个运用换位量三段论很容易证明的定理,不过如果用其他方式就证明不出来。关于有限集合,它是正确的;但对于无限集合,它就是错误的。因此,整数的部分是偶数。但偶数与整数一样多,这是一个显而易见的命题,因为如果整个整数序列中的每个数字都翻倍的话,那其结果将会是偶数序列。
1,2,3,4,5,6……
2,4,6,8,10,12……
因此,每一个整数都对应于一个不同的偶数。事实上,有多少不同的数字就会有多少不同的倍数,这个倍数就是偶数。
实际上,无限集合只有两个量级:即可数集与不可数集。有限集合区别于无限集合的地方在于,前者适用于一种特殊的推理方式:换位量三段论。可数集区别于不可数集的地方在于,可数集适用于一种特定的推理方式:费马推理。这种推理方式有时会被不恰当地称作“数学归纳法”。我在之前提到的那篇论文里做过说明。我将以此推理方式的一个例子,来讲讲欧拉对于整数次幂的二项式定理证明。这一定理表述的是(x+y)n(n为整数)可展开为一连串二项式的和,第一项是xny0;其余每一项相比其前一项,x的指数减1,再乘以该指数;同时y的指数加1,再除以增加的指数。那么,假定这一命题在指数为某值(例如n=M)的情况下是正确的,那么在n=M+1的情况下也应该是正确的。将(x+y)M的展开项中的一项写成Axpyq,那么这一项和紧跟着的两项将会是:
那么,当(x+y)M乘以x+y就等于(x+y)M+1,我们先乘以x再乘以y而不是乘以x,然后再将两个结果相加。当我们乘以x时,上面三项中的第二项将是唯一含有xpyq+1的项,而第三项将是唯一含有xp-1yq+2的项;当我们乘以y时,第一项将是唯一含有xpyq+1的项,而第二项将是唯一含有xp-1yq+2的项。因此,加入相似的项,我们会发现在(x+y)M+1的展开项中xpyq+1的系数将会是上面三项中前两项系数的总和。因此,(x+y)M+1的展开项中相连的两项将会是:
于是从中可以看出,相连的项遵循这一规则。如果一个整数次幂遵循这一规则的话,那么下一个更高次幂也将如此。由于一次幂明显是遵循这一规则的,因此,所有次幂也都遵循这一规则。
这种推理适用于能够按顺序排列的任何对象的集合,虽然集合可能是无穷的,但却是可以编号的,因此其中的每个元素都能得到一个确定的整数。例如,所有的整数就构成一个可数集。此外,任何由某个有限整数集依据确定的规则运算得出的集合也是可数集。集合中的数字可依顺序排列。假设F为运算符号。首先对1运算,得出F(1);然后再对1运算,得到F(1,1);接下来引入2这个变量,得到第三个结果,以F(2)表示;然后是第四个,以F(2,1)表示;接着是第五个,以F(1,2)表示;第六个则是F(2,2)。接下来要使用第三个变量了,第七个就以F(1,1,1)表示,第八个以F(2,1,1)表示,第九个以F(1,2,1)表示,第十个以F(2,2,1)表示,第十一个以F(1,1,2)表示,第十二个以F(2,1,2)表示,第十三个以F(1,2,2)表示,第十四个以F(2,2,2)表示。然后再引入3这个变量,依此类推,轮流引入新的变量和新的数字。这样,很显然所有变量的整数值的每次排列在序列中都将获得一个编号的位置。[55]
无穷但可数的集合(之所以说“可数”,是因为集合中的所有数字可以按顺序排列,让每个数字都对应一个不同的整数)已经很大了。但也有一些集合是不可数的。无限小数的各个数位构成的集合就是不可数集。自欧几里德时代以来,人们就已经认识到,某些数字是不尽根的或不可通约的,且不能以任何有限小数或是循环小数确切地表示出来。例如圆的周长与直径的比值,我们知道它接近3.1415926。这个数字的计算结果有超过700位数,而且在这700位数的排列顺序中看不出哪怕是最微小的规律性。这完美地证明了这个数字还有其他很多数字都是不可通约的。全体不可通约数的集合是不可数的,这已经得到了康托尔的明确证明。在此我就不做证明了。但很容易理解,要将一个集合与另外一个集合区分开来,通常就需要利用无穷系列的数字。如果这些数字不能被确切地表示和区分的话,那显然它们就无法排列成一个线性序列。
显而易见,一条线上或一段时间间隔内总共有多少个点,就会有多少个实数。这些便是不可数集。很多数学家曾鲁莽地假定,一个面上或一个体内的点要多于一条线上的点。但这遭到了康托尔的驳斥。实际上,很显然,对于每一个坐标值集合而言只有一个确切的数字。例如,假定坐标值都介于0到+1之间,然后将第一个坐标的第一个数字放在第一个小数的位置,并将第二个坐标的第一个数字放在第二个小数的位置,依此类推,在第一个数字都被分配完之后,再以同样的方式继续分配第二个数字,如果我们通过这种方法来构成一个数字的话,很显然从这个最终得到的数字上就能够读出坐标值。因此,三个一组或四个一组的数字(每个数字都有不可数的值)与单个的不可通约数拥有一样多的值。
假若维度数是无限的,那这一理论就不适用;不可数集的集合可能要比不可数集还要大,我们不妨称之为“无穷无限集”(endlessly infinite)。可是,这类集合中的单一元素是无法被指出的,甚至无法近似,因此实际上这个量级只能以最普遍的方式来进行推理。
尽管无限集合只有两个量级,但是当各元素在特定条件下按照顺序排列时,量级的区别就因此而显现出来了。因此,如果一个无限序列以一分为二的形式翻倍,且继而形成的第一部分和第二部分被按照与原来相同的顺序排列,那么这个翻倍的无限序列(只要以原来的顺序排列)将会是原来那个序列的两倍大。同理,两个不可数集合的乘积(即由两个集合中每一个体组成的所有可能配对的集合)如果保持其连续的顺序,那么凭借这一顺序,就会比原来两个集合中的任何一个都大得多。