2．我们对外部世界的经验

2025年1月24日　　来源：意识的解释　作者：（美）丹尼尔·丹尼特　提供人：zhanbai93......

让我们先谈谈最粗糙的外部感觉：味觉和嗅觉。大多数人都知道，我们的味蕾其实只对甜、酸、咸和苦有感觉，在很大程度上，我们“用鼻子辨味”，这就是我们感冒后食物就没有滋味的原因。鼻腔的上皮细胞掌管嗅觉，视网膜的上皮细胞掌管视觉。上皮细胞彼此之间很不相同，不同的上皮细胞对不同类型的空气传播分子的敏感程度不同。分子的形状最重要。分子飘进鼻孔，就像许多微小的钥匙一样，打开了上皮中的特定感觉细胞。分子往往可以在惊人的十亿分之几的低浓度中被轻易地检测到。其他动物的嗅觉比我们人类的嗅觉强得多，它们不仅可以在痕迹更微弱的条件下分辨更多的气味（大警犬就是一个我们熟悉的例子），而且对气味的时空解析能力也比我们的强。我们也许可以感觉到房间里低浓度甲醛分子的存在，但就算我们能做到这一点，我们也不能嗅出这些甲醛分子是在一条线状轨迹上，还是位于一个飘着某些可以闻到的个别特定分子的区域里；换句话说，整间屋子或至少屋子的某个角落里，似乎完全弥漫着这种气味。这种情况没有任何神秘之处：可以说，分子任意地逛进我们的鼻孔，它们到达上皮的特定位置，却没有提供多少信息来说明它们来自这个世界的哪个地方。就此而言，气味分子与光子不同，光子沿视觉上的直线流动，通过虹膜上的小孔，到达视网膜上的一个位置，这个位置从几何结构上映射一个外部的光源或光源路径。如果我们视觉的解析度像嗅觉的一样贫乏，那么，即便一只鸟从头顶飞过，我们也会觉得，一时间天空中到处都是鸟。[有些物种的视觉真有这么贫乏，也就是说，它们的视觉解析度与分辨力与此相差无几，但动物看东西的视觉如此贫乏会是什么样子（如果真有这回事），这是另外一回事，我们将在后面某一章中讨论。]

我们的味觉与嗅觉从现象学的角度结合在一起，我们的触觉与肌肉运动知觉，即对我们的肢体和身体其他部分的位置与运动的感觉，也是如此。我们“感觉”事物的方式很多，可以触摸、抓握和推挤，由此所产生的有意识的感觉，虽然于朴素的反省而言，似乎只是在直截了当地“翻译”皮下触觉感受器所受的刺激，但它们同样产生于一个复杂精细的过程，该过程整合了各个来源的信息。试试蒙上你的眼睛，手里拿根棍子（钢笔或铅笔也行）。用棍子触碰你周围的各种东西，留意你能否毫不费力地分辨出它们的质地，就像你的神经系统有传感器分布在棍子的末端一样。你得费特别大的劲儿——而且一般效果不佳——才能体会到你的指尖对棍子有着怎样的感觉，体会到在棍子与不同表面相接触时的颤动和阻力。棍子与皮下触觉感受器的交互作用（在多数情况下会得到几乎听不到的声音的帮助），可以提供一些信息，你的大脑会把这些信息整合为一种有意识的识别活动，识别出纸张、卡片、毛织品或玻璃的质地，但这些复杂的整合过程对意识来说绝不是透明的。也就是说，我们不会也无法注意到，“我们”是如何做到这一点的。举个比较间接的例子：想想在拐弯时，你如何能感觉到，车轮之下的公路油污位置比较滑。接触的现象学焦点就在橡胶轮胎与路面接触的地方，它不在你受神经支配的身体上，不在你这个在汽车座位上坐着的、穿着衣服的身体上，也不在你戴着手套握着方向盘的手上。

现在，还是蒙着眼，但丢下棍子，让人递给你一件瓷器、一件塑料制品，或几块经过细致打磨的木器和金属。它们确实极为光滑，你却不难分辨出它们不同的光滑程度，这可不是因为你的指尖有专门的瓷器触觉感受器或塑料触觉感受器。材质导热性能方面的差异才是最重要的因素，而这并不是它的本质属性：你自己也许都会惊讶，有时只用棍子去“感觉”它们，你也可以相当容易地区分这些不同物质的表面。你能成功办到这一点必定取决于你感觉到的棍子颤动，或者在敲击或刮擦物体时你听到的难以描述却可探测到的差别。但是，你的一些神经末梢看起来就像在棍子上，因为你在棍子的末梢感觉到了不同表面的差异。

接下来，我们考虑听觉。听的现象学包括我们所能听到的各种声音：音乐、说话声、砰砰声、口哨声、警报声、鸟叫声、嘀嗒声。思考听觉的理论家常常忍不住“奏响头脑里的小乐队”。这是一种错误的看法；为了确保我们可以识别并且避免这种错误，我要借助一个寓言来生动地说明它。

从前，大约在19世纪中叶，一个胡思乱想的发明家与一位意志坚定的哲学家进行了一场论战。这位发明家宣布，他的目标是设计一个装置，这个装置可以高保真地自动“记录”和“重放”管弦乐队和合唱团所表演的贝多芬第九交响曲。这个哲学家则说：“胡说八道。那根本就不可能。我很容易就能设想出一个机械装置，它按顺序记录钢琴键的弹奏，然后又让这一顺序在钢琴上重现出来，例如，用一卷打孔纸也许就能做到这一点。但想想吧，在表演贝多芬第九交响曲时的声音与演奏模式，各式各样、变化多端！音域与音质各不相同的人声就有上百种，弦乐器、铜管、木管和打击乐器也有好几十种。一个设备如果能够同时重奏如此多样的声音，它一定会是一个笨重的怪物，最大的教堂管风琴在它面前也会相形见绌。如果它真能如你所提出的那样进行‘高保真’表演，那么，它无疑就必须真的把一队人类奴隶合成一体，去操纵各个声音元件；要做到你所说的，去‘记录’某次表演的所有细微动作，就必须有成百上千份分乐谱，每个音乐家一份，同时还要有数千甚至数百万个乐谱注释。”

奇怪的是，这位哲学家的论点居然在今天还有说服力；我们这个时代的一个惊人事实是，所有这些声音其实都可以通过一种傅里叶变换（Fourier transform）得到忠实的传达，这样就得到一条波形线，这条线可以刻入一个演奏时间很长的磁盘，或利用磁性复制到磁带上，或利用光学效果复制到胶片的声道上。更加令人吃惊的是，就那么一个锥形纸盒，通过单波形线驱动电磁铁带来前后振动，就能发出喇叭吹响、班卓琴拨动、人们说话以及完好的酒瓶在人行道上被摔碎的声音。哲学家想象不出任何具有如此能力的东西，于是错将自己想象力的失败，当作自己在必然性方面的洞见。

傅里叶变换的“魔力”为人们的思考打开了许多新的可能空间，但我们应该指出，它本身并没有消除那个困扰哲学家的问题，而只是推迟了问题。因为，虽然我们这些老油条可以嘲笑说，哲学家未能理解，刺激耳朵的空气的压缩与稀释模式可以怎样得到记录和复制，但是，只要我们想想下一个问题，这种自鸣得意的笑容马上就会从我们的脸上消失：一旦耳朵正确地接收了信号，信号会怎样？

从耳朵出发的、一组经过编码的调制信号序列（这些序列现在经过某种分析，被分解为若干平行的流，这让人不安地想起那个哲学家所说的成百上千份分乐谱）会向内前进，到达大脑黑暗的中心。这些信号序列既不是听到的声音，也不是磁盘上的波形线；它们是电化学脉冲序列，沿着神经元的轴突上行流动。在大脑里，难道就一定没有某个更靠近中心的地方，这些信号序列在这里控制着那台功能强大的心智剧场管风琴的演奏？这些无声的信号究竟是在什么时候最终被翻译成主体听到的声音的？

我们不想在大脑中找出像吉他弦一样振动的地方，就像我们不想在大脑里找到在我们想象一头紫色母牛时会变成紫色的地方一样。这些做法显然没有前途，赖尔（Ryle, 1949）将其称为范畴错误。但是，我们要在大脑里发现什么东西，才能使我们确认在此已经抵达听觉经验过程的终点了呢？[2]大脑里各个事件的物理特性的复合，如何就等于——甚至刚好就说明了——我们听到的各种声音的奇妙特性呢？

乍一看，这些特性似乎不可分析，或用现象学家喜欢的一个形容词来说，不可言传（ineffable）。但是，在这些貌似不可再分的、同质的特性中，至少会有一些特性，在接受某种操作之后，可以转变成复合的和可描述的特性。拿起一把吉他，拨动低音E空弦（不要压在任何品柱上）。仔细听。这个声音有可以描述的组成部分吗？它有浑然一体、不可言传的吉他声吗？很多人会选择后一种方式来描述他们的现象学。现在再次拨动空弦，然后小心地把一个指头轻轻按在八度音品柱上，形成一个高音“和声”。你会突然听见一个新的声音：它可能“更纯”，当然也高了一个八度。有些人坚持认为，这是一个全新的声音，而另一些人则以别的方式来描述这种经验，他们说，“这个音符已经没有低音”——只有高音留下来了。然后第三次拨动空弦。这次你可以听到在第二次拨动中分离出来的和谐泛音，而且声音惊人地清晰。第一次拨动时听到的同质和不可言传的状态消失了，取而代之的是一种二元状态，就像任何和声一样，这个状态是直接可以理解的，也是可以清楚言传的。

这种经验方面的差异确实显著，但在第三次拨弦时你才能把握到这种复杂状态一直存在于那里（得到回应或区分）。已有研究表明，只有通过泛音的复杂模式，你才能分辨出声音是吉他发出的，而不是琵琶或大键琴的。这样的研究也许有助于我们说明各种听觉经验的不同性质，为此只需要分析信息成分和整合这些信息成分的过程，这样我们也许就能预测，甚至能以合成的方式唤起特定的听觉经验，但是，这类研究似乎仍然没有触及一个问题：这些特性相当于什么？为什么吉他发出的和谐泛音模式，听起来是这样的，而琵琶引起的模式，听起来又是那样的？即使我们指明，在起初不可言传的性质中，至少会有一些终究还是可以进行一定数量的分析和描述，我们也只是弱化了这个遗留的问题，而仍然没有解答它。[3]

有关听觉感知过程的研究表明，有一些专门机制，可以解码不同类型的声音，这些机制有点儿像那位哲学家所幻想的回放机器的组件。特别是说话的声音似乎就是由这样的机制来处理的，工程师会把它们称为专用机制（dedicated mechanism）。说话的知觉现象学表明，大脑中出现的输入的全盘重构活动，就像一个录音工程师的录音棚，不同的声道记录在此混合、增强并做出各种调整，以产生立体声“母版”，后续的不同介质的声音记录就是由此母版拷贝而来的。

例如，在听人用我们的母语讲话时，我们是把这些话听成一个不同词语的序列，这些词语之间有少数短暂的沉默空白。这就是说，我们对词语之间的分界有清晰的感觉，而这些分界不可能由色边或色线构成，似乎也不以嘀嗒声为标志，那么，这些分界除了是各种不同时长的沉默空白——就像莫尔斯电码里隔开字母与单词的空白一样——还能是什么？如果实验者以不同的方式要被试注意并评估单词之间的空白，被试做起来并不困难。空白看来是存在的。但是，如果我们看看输入信号的声音能量轮廓图，就会看到最低能量区（与沉默最为接近的时刻）根本就不能与单词的边界完全相符。分割说话声的活动，就是一个把边界加到声音上的过程，这些加上去的边界基于语言的语法结构，而不是声波的物理结构（Liberman and Studdert-Kennedy, 1977）。这就有助于解释，为什么在听别人用外语说话时，我们听到的是一串混乱的、没有分隔的声音激流：大脑“录音棚”的专用机制缺乏必要的语法框架来对语句进行正确的分隔，所以它们最多只能做到传递某种形式的输入信号，而这些信号大都未经修整。

当我们感知语言时，我们注意的不只是单词及其语法类型。（如果这是我们注意的所有东西，那么我们就无法分辨自己是在听还是在读。）单词可以得到清楚的划界、清楚的次序安排和清楚的意义确认，同时又都包裹在感性的外衣之下。例如，我刚听到我的朋友尼克·汉弗莱清晰的英格兰腔，他的声音气势略显逼人，但没有嘲笑之意。我仿佛听到他的笑声，而这在我的经验中包含的感觉是，那个发笑的人就在话语的背后，就如乌云之后的太阳，随时等着蹦出来。我们觉察到的这些性质，不只是语调升降，还包括粗声粗气、喘息、口齿不清，更不用说嘟囔的牢骚、害怕的抖音和沮丧的平音了。而且，就如我们在吉他的例子中所看到的，那些初看起来完全不可再分的、同质的性质，常常还是可以分析的，只要做少量的实验和分离就可以。我们能毫不费力地辨认问句的发问声音，辨认英式疑问句与美式疑问句的差别，但是，我们必须先做一些主题与变奏方面的实验，才能自信或确切地描述，产生那些不同的听觉味道（flavors）的语调声线到底存在什么差别。

在这里，“味道”似乎确实是一个正确的比喻，这无疑是因为，我们分析味道的能力太过有限。有许多常见但仍然令人吃惊的例证说明，我们是用鼻子来辨味的，这就表明，我们的味觉能力与嗅觉能力非常粗糙，我们甚至很难确定自己获得信息的途径。这种不知不觉的状态并不限于味觉与嗅觉；我们听到低频的声音，比如教堂管风琴所奏出的最低音，这种听觉发生的原因，主要是躯体对振动的感觉，而不是耳朵里的振动。我们惊讶地了解到，我们之所以能听到“比我能唱出来的最低的F#正好低两个八度的F#音阶”，实际上借助的是我的凭空摸索[4]而不是我的耳朵。

最后，让我们简要考察一下视觉。在眼睛睁开的时候，我们会有一个宽阔的场域感觉——通常被称为现象场域或视野，各种事物就在其中出现，它们有颜色，离我们有着不同的纵深或横向距离，或动或静。我们天真地以为，所有经验到的特征都是外在事物的客观性质，我们“直接地”观察到了它们。但是，甚至在孩提时代，我们就能很快地辨别出介于主观与客观之间的一些东西：眼花、闪烁、微光、模糊的边沿。我们知道，这些东西是对象、光线和我们的视觉器官以一定方式相互作用的结果。我们仍然认为这些东西是“在那里的”，而不是在我们身上的，但也有少数例外情况：直视太阳或在眼睛已习惯黑暗后突然看到亮光时我们会感到刺痛，或在眩晕时我们眼里的现象场域会令人恶心地旋转。这些情况似乎最好被描述为“眼睛里的感觉”，它们更像是在揉眼睛时我们能感受到的压力与发痒，而不是我们看到的事物所具有的正常的、在那里存在的性质。

图像也是我们在物理世界中看到的、在那里存在的东西。图像是要被看的东西，这如此明显，以至于我们往往会忘记，它们只是最近才被加到人类的可见环境中的，只有几万年的历史。得益于人类新近的艺术和巧妙技艺，现在我们身边到处都是图画和表格，包括静态和动态的。这些物理图像本来只是视觉感知过程中的一种原材料，但现在它们已经变成视觉感知“终端产品”的一个几乎不可抗拒的模型——“头脑中的图像”。我们倾向于说：“视觉的产物当然是头脑（或心智）中的图像。它还能怎样呢？当然不会是一种曲调或一种味道！”在我们继续前进之前，我们会以多种方式来处理这种奇怪但又普遍存在的想象力的混乱状况。但是，我们可以先从这样一个提醒开始：对盲人来说，画廊是一种资源浪费，所以，头脑中的图像也需要头脑中的眼睛去看（且不说采光要好）。假定头脑中有一双心智之眼看头脑里的图像。那么，由这些内在的眼睛所产生的图像，又有谁在看呢？我们如何才能避免图像与看图者的无穷倒退？只有发现某个看图者，他的知觉能够避免产生又一幅需要看图者的图像，我们才能打破这种倒退。也许，打破这个倒退的地方，就正好是最开始的第一步？

幸运的是，有一些独立的理由能够说明，为什么我们可以怀疑这种图像在头脑中的观点。如果视觉包含一些在头脑里的图像，我们（我们的内在自我）还特别熟悉这些图像，那么，画出这些画是否就容易一些呢？想想吧，画出一幅写实画是多么困难！比如画出瓶里的玫瑰。一枝与原物一样大小的玫瑰在你面前几尺远的地方，我们可以设想它就在你便笺簿的左边（我真希望你仔细地设想这种情况）。那枝真实玫瑰的所有可见细节，对你来说似乎都是生动的、鲜明的，而且还能亲身接近；但是，现在让你把它转为黑白的、二维的玫瑰画，向右调整几度，每个细节都不遗漏，这一看似简单的过程，其实极有挑战性，大多数人马上会放弃，觉得自己根本画不出来。将三维转换成二维对我们来说居然特别困难，这种情况有些令人吃惊，因为初看起来它不过是一次逆转换（把一个写实的二维图像看成三维的图像或者物体），做起来应该毫不费力，不知不觉就能完成。其实，正是因为我们在抑制这种逆向诠释时遇到了困难，所以复制一幅简单线条画的过程才成了一项要求很高的任务。

这不只是一个“手眼协调”的问题，因为能够相当灵巧地绣花或毫不费力地灵活组装怀表的人，在勾画线条画方面同样会相当吃力。有人也许会说，这里还有一个眼脑协调的问题。那些掌握这门技艺的人知道，这要求有特殊的注意力习惯和一些技巧，比如只要轻微地散去眼睛的焦点，我们就能以某种方式抑制自己所知信息的贡献（硬币是圆形的，桌子角是方形的），如此一来，我们才能注意到图像里线条的实际角度（硬币是椭圆形的，桌子角是梯形的）。以下这种做法常常也会有所帮助：架上一个想象的纵横网格或一对十字丝[5]，可以帮助我们判断所看见的线条的实际角度。学习画画在很大程度上就是学习推翻正常的视觉过程，这样，人在经验这个世界里的东西时，就更像是在看一幅画。当然这种经验绝不可能就只是在看一幅画，但是，一旦它向某个方向调整，人们就能通过更进一步的转换技巧，把所经验的东西多多少少地“拷贝”到纸上。

就粗浅的反思来看，视野似乎在细节上是均匀的，并以中心为焦点向边界扩散，但一个简单的实验表明，情况并非如此。取一副扑克牌，将其中一张牌的牌面朝下，这样你就不知道它是哪张牌。把它拿到你视野的左边缘或右边缘，让它正面朝你，小心地保持眼睛直视正前方（找个目标点，一直看着它）。你会发现，你甚至无法分辨，这张牌是红心、黑桃，还是一张人头牌。不过，要注意的是，你可以清楚地察觉到这张牌的任何快速移动过程。你看得见有东西在移动，却无法看见正在移动的东西的形状与颜色。现在，开始把牌移向你的视野中心，再次注意别转移你的视线。你在什么时候可以认出牌的颜色？在什么时候可以认出花色和数字？注意，你会先分辨出它是不是一张人头牌，之后你才能分辨出它是J、Q，还是K。你可能会吃惊：把牌拿到距你的视野中心如此近的地方，你还是不能认出它来。

我们的周边视觉（peripheral vision，盲点周围两到三度以外的所有视觉）就有这种令人震惊的缺陷，我们通常不了解这一点，这是因为我们的眼睛与电视摄像机不同，并不是静止地瞄准世界，而是做着毫不间断的且大多未被注意的视觉标签游戏，不断标记出视野里可能引起自身兴趣的东西。我们的眼睛或者平稳地追踪，或者飞快地跳视，为我们的大脑提供高清晰度的信息，以了解任何暂时占据视网膜中央凹处的东西（眼球中央凹处的分辨力比视网膜周边区域的分辨力约高10倍）。

我们的视觉现象学，或者说视觉经验的内容，在格式上与任何别的表征模式都不相同，这些内容既不是图片，也不是电影、句子、地图、比例模型和表格。考虑这种情况：当你扫视有成千上万名观众的体育场时，你的经验中会呈现出什么。一个个的人都离你太远，你认不出来，除非有些大尺度的明显特征帮助你来辨认（比如总统——是的，你真的能认出他来，就是他；他就是你正好可以辨认出来的，在红、白、蓝旗帜中央的那个人）。从视觉上，你可以辨别出那黑压压的一片都是人，因为他们以可见的、人类那样的方式在移动。你关于黑压压人群的视觉经验的确有全局性的要素（这群人看起来就像在那里的一堆东西，这就好像，透过窗户所见到的树的某一部分看起来就像榆树，或者一块地板看起来就像布满了灰尘一样），但你并非只是看到一个好像明确标记着“一群东西”的大圆球，你看到的是成千上万个具体的细节：晃动的红帽子和反光的眼镜，许多蓝队服，在风中摇晃的标语旗帜，还有高举的拳头。如果我们试图以“印象派的风格”来描绘出你的经验，那么，即使色块斑斓驳杂，你也不能捕捉到其中的内容；你没有关于色块斑斓驳杂的经验，就如在斜着看一个硬币时，你没有椭圆的经验一样。油画（二维彩色画）也许大致近似来自一个三维场景的视网膜输入，因此它们带给你这样一种印象：这幅画与你看现场时的视觉经验相似。但是，这样的画并不是关于由此造成的印象的描绘，而只是能够引起或激起这种印象的东西。

我们不可能像描绘正义、旋律或幸福那样画出一幅写实主义的视觉现象学的图像。但是，把人的视觉经验说成头脑中的画像，这种做法常常是方便的，甚至是无法抗拒的。这是我们的视觉现象学运转方式的一部分，所以它也是我们在以下几章中必须解释的部分内容。

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。