• 精选
  • 会员

诵读困难症患者的语音障碍问题

2025年1月26日  来源:如何阅读 作者:马克·塞登伯格 提供人:zhanbai93......

造成诵读困难的发育异常最初体现在儿童的口语中,随后出现在阅读中。尽管诵读困难症儿童的言语与非诵读困难症患者没有明显的不同,但他们有着更加不明显的语音缺陷,这些缺陷会影响学习文字、声音和言语以及三者间的映射。我们的诵读困难症模拟模型能够说明该过程是如何发生的。

如图8-1所示,该模型与我所描述的其他模型类似。单元的输入层表示正字法;输出层表示语音。在正字法和语音之间还有一个由100个隐藏单元组成的中间层。清理单元就像一层隐藏的单元,与语音单元层相连接,形成一个反馈回路。该模型以拼写模式作为输入,并通过加权连接将激活传递到隐藏单元,之后再传递到语音层单元。在更简单的网络模型中,处理过程便到此为止。而在这个网络模型中,激活被传递到清理层,然后再返回语音单元层。这个过程一直持续到语音单元层中的单元趋于稳定(大幅度变化停止)。模型适应这种运行模式所需的时间与人们做同样事情所需的时间是相关联的。


图8-1 哈姆和塞登伯格关于单词阅读和诵读困难症的模型示意图(1999)

有关图表各部分的说明请参阅前文描述

资料来源:Harm and Seidenberg (1999), Figure 9, p. 13.

该模型首先学习了数千个单词的语音编码,这与即将开始学习阅读的儿童在阅读前就已从会话中掌握了许多词的事实相似。然后该模型接受阅读任务的训练:系统设定一个拼写模式,为数千个拥有该拼写模式的单词生成正确的语音代码。在该模型学习了文字和语音之间的映射关系后,我们观察了单词组和非单词组在隐藏单元(位于正字法和语音单元层之间)内的激活模式。45例如单词eat(吃)、meat(肉)和treat(对待),其中的字母组合ea读作/i:/。图8-2(左图)展示了在经过训练的正常模型中,这些单词和非单词geat在隐藏单元中的激活。在每个单元里,激活水平在-0.5和+0.5之间变化;激活水平由正方形的大小表示;正值用黑色表示,负值用灰色表示。这些模式非常相似,因为模型采用了eat-meat-treat这些单词中的共享结构,-eat的字母组合发音为“eat”。这样,该模型就可以在单词读音没有被训练过的情况下,将拼写相似的非单词geat读出来。


图8-2 eat、meat、treat和geat的隐藏单元激活水平的快照

左图:正常模型;右图:诵读困难症模型。两种模型都学会了单词的正确发音,但是诵读困难症模型需要进行更多的训练实验。正常模型能够正确推断出geat的读音,但诵读困难症模型做不到这一点。该图展示了每个词在“正字法→语音”路径中100个隐藏单元的相对激活水平。

资料来源:Harm & Seidenberg (1999), Figure 15, p. 25.

诵读困难症模型以同样的方式接受训练46,但是它存在语音缺陷47;语音吸引因子的内部单元之间的激活传递方式比正常模型更“嘈杂”,即更加不精确,更加多变。该模型也学习了大部分单词,但也进行了更多的训练实验。该模型为eat、meat和treat等词生成了正确的语音,却读错了geat。如图8-2(右图)所示,很明显,与正常模型相比,诵读困难症模型对隐藏单元的调谐更加不精确。更多的单元需要参与提供正确的发音,也有更多的单元处于极值。

诵读困难症模型的运行方式就像一个儿童的行为,逐一学习单个单词,极少去思考与其相似的其他单词。要做到这一点则需要更多的学习实验。如果未能注意到-eat这一拼写模式,模型(以及儿童)便不能“发出”像geat这样的生词的读音。

让我们明确一点:这个模型是高度简化的。它无法捕捉到一个儿童实际可能经历的每一步的各种细节。我们不会教模型唱字母歌,然后再逐一讲解单词。这个模型甚至不知道单词是有语义的。然而,它却为一个基本问题提供了答案:为什么一个微小的语音异常能够对学习阅读造成重大的影响?因为这种缺陷会妨碍模型去发现单词的语音构成,导致一些拥有重叠部分的单词被认为是不相似的单词。该模型未能学会拼写原则,它只获得了字母与音素对应的部分知识,但更重要的是,这种缺陷影响了模型去发现其他单元内的统计学规律,例如单词的押韵(比如-eat结构的发音)以及许多其他决定了英语发音的因素。该模型的运行方式与诵读困难症患者的两个基本特征一致:学习单词的速度更慢并且更不善于读出生词和编造的非单词。研究结果表明诵读困难症患者的大脑发育方式阻碍了他们去发现正字法和语音之间的共性特征。该模型还表明了语音缺陷虽然对会话感知没有什么影响,却会干扰阅读行为。阅读是一项“非自然”任务,更容易受到语音缺陷的影响。

在我和迈克尔·哈姆(Michael Harm)从事这项研究的20世纪90年代,能够表明诵读困难症的几个行为特征源自语音缺陷便已是一种进步。然而,我们无法将研究与儿童的行为直接关联。当时也没有相关的大脑研究方面的证据。虽然该模型的运行方式在一些重要方面与诵读困难症患者的表现相符合,但这并不能确保它们的潜在机制是相同的。尽管该模型看似提供了强有力的因果关系测试:我们训练了一个语音受损的模型,它以可识别的方式干扰了单词学习,但计算模型终究不是真实的儿童。每个模型都是一种简化,因此在某些细节层面有可能是错误的,这一事实表明人们对真实生活进行模拟时需要更加谨慎。我们的发现也期待着更有力证据的出现。

既然人们现在已经获得了更多关于大脑结构、功能和发育的信息,噪声的假设也显得十分合理——事实上,这比我们在1999年所预期的还要好得多。越来越多的行为研究证据表明,诵读困难症患者会将拥有同样结构的单词模式视为“有很大差异”。让我们来看一下2012年麻省理工学院的泰勒·佩拉基奥尼(Tyler Perrachione)为他的博士论文所做的一项行为研究48:参与者都是年轻人,他们要么是诵读困难症患者,要么是正常的阅读者。他们在一台核磁共振扫描仪里听一系列单词的录音,当听到的单词与所显示的图片匹配时便做出相应的反应。这项任务只需要他们专心听录音。研究感兴趣的是由口语单词所激发的大脑活动水平的数据,这与功能磁共振成像研究主要测量血氧饱和水平有关。在一些测试中,所有的单词都由同一个受试者朗读,而在另一些测试中,这些词由四个受试者朗读,他们的声音会随着单词变化随机改变。

对于所有的实验参与者来说,听单词会激活他们大脑中负责言语理解的区域。没有诵读困难症的参与者展现出了一种适应效应:当他们听到同一个人连续读出的单词时,大脑这些区域的激活程度会比听到多人朗读单词时的激活程度低。因为参与者识别出了这个朗读者的言语特点,所以激活程度也就随之降低。如果朗读者的声音不断变化,听众就不会形成适应性。这项研究的关键发现是诵读困难症患者所展现的适应效果要小得多。在单人朗读单词和多人朗读单词两种情况下,他们的激活水平都非常相似。因此,与非诵读困难症患者相比,诵读困难症患者会将由同一个朗读者读出的相似单词视为更独特、更不相似的单词。正如在我们的模型中,诵读困难症患者并没有注意到单词之间的重叠(即朗读者的音质)。这一点非常有趣,因为与非诵读困难症患者相比,诵读困难症患者对音质表现出了更大的敏感性,即使是同一个朗读者的语音也是不断变化的。通常情况下,诵读困难症患者比非诵读困难症患者表现差,但在这个实验中,情况却恰恰相反。

佩拉基奥尼随后用其他刺激重复了这个实验。诵读困难症患者比非诵读困难症患者表现出更差的适应效果,无论是在口语单词(听到同一个朗读者重复说出同一个词与听到同一个朗读者说出一系列不同的单词)和书面单词(看到同样的单词与看到一系列不同的单词)方面都有所体现。尽管诵读困难症患者在这些实验中始终表现出更差的适应效果,但是他们的适应程度有所不同。佩拉基奥尼还说明了实验的分析结果,表明在一项识别生词的普通标准化实验中(该实验被称为“单词挑战”),参与者的适应程度与他们的表现呈正相关性。

研究人员在其他实验室用其他语言和刺激材料展开了研究,他们也得到了相似的结果。49看来,我们在诵读困难症模型中观察到的效应可能比我们所了解的更普遍,至少对一些个体来说,语言和非语言刺激以及视觉和听觉模式都发生了变化。诵读困难症患者认为eat、meat和treat这样的单词“太不一样了”,同样的情况也会发生在其他有重复字母组合的口语或书面单词上。我们所研究的效应来自语音体系中的噪声处理过程,但我们很容易想象出与正字法或其他信息更密切相关的大脑区域也会有类似的效应。

对于在实际生活中学习读写的儿童来说,这样的影响会使学习任务变得更加困难。50就像口语一样,在阅读的过程中,人们必须学会归纳,并将学到的知识应用到新的实践中。而把每一次实践都当作与已学知识毫无关联的做法是站不住脚的。打个比方,如果我们不去归纳而单独去学习每个名词的复数形式,book的复数为books,beer的复数是beers,那么这样的学习是无穷尽的。归纳要求人们将某一模式的显著特征进行汇总,并忽略不相关的其他内容(如字体变化)。单词首字母是大写还是小写也与名词复数这一知识点无关,但单词的首字母是不是b则是相关的(因为deer一词的复数是deer)。行为学与神经影像学的研究表明,诵读困难症患者在某种(未知的)程度上无法进行归纳,认为许多事例都“很不一样”。这可能是由于我们模型中的“噪声”或其他机制故障(如未能抑制无关信息)造成的。

这种情况造成的最大影响是诵读困难症患者不得不多次重复学习重要的内容。我们设计的模型在没有其他帮助的情况下逐一学习了eat和其他包括-eat字母组合的单词的拼写-语音映射。这种学习的效率很低,并且使得模型对geat一词生成了错误的读音。我们可以重新思考一下字母分类的问题。让我们设想最有效、最简单的解决方式是使用单一的吸引因子去识别所有带K字母的单词,因为这些单词的差别并不大。然后设想在一些情况下(如“噪声处理”),大脑会通过在次要维度里划分K字母来解决这个问题,例如K和K(字体不同)。51假设现在有两个K字处理器,那么同样包括字母K的两个单词(kite和kite)的处理方式是不同的。更糟糕的是,字母的发音和字母模式必须学习两次。当然,如果语音方面也发生同样的情况,也会出现多个版本(例如,对于kite一词的高音调和低音调发音的不同吸引因子)。这也可能使单词的发音变得复杂,这就要求说话者选择一种语音表达法来发音。由于该系统是交互式的,因此语音层面的多个版本也将反馈在正字法层面上。如果不能识别共同结构并忽略不相关的内容,阅读会变得非常困难。

上述例子是简化的卡通版本。没有人真正知道大脑是如何识别字母K的,但是该识别过程很有可能会涉及成千上万的神经元,这些神经元具有非常复杂且不断变化的连接结构。因此,对其的解决办法也不会像只涉及几百个单元和简单连接的人工神经网络中的吸引子因子动态那样运行。但是卡通版本的例子说明了行为学和神经影像学的数据中可以观测到的一些诵读困难症患者的特征:无法识别共同结构甚至精确重复,且对无关信息过度敏感。

噪声假设令人兴奋,因为它使得人们可以在如今科学可以触及的多个层面上进行研究:行为;计算机制;大脑的结构、功能和化学反应;遗传对发育的影响。我们必须强调的是,这些发现虽具有启发性,却远没有得到证实,而且噪声假设也没有排除其他原因。我们不知道有多少诵读困难症患者或者非诵读困难症患者会表现出这种行为,不知道假定的损伤的严重程度,大脑的不同区域是否会受到影响,也不知道无法归纳朗读者声音特征的孩子是否表现出其他非典型行为,更不知道这些缺陷是不是阅读问题的直接原因。我们检查了模型的语音成分中的噪声,但其他证据表明,噪声也可能形成于从正字法到语音的映射或早期视觉处理中。在模型中,噪声是一个参数,可以为其设定一个能产生诵读困难症效应的数值,但若这个参数超过某个数值,模型便几乎无法学习。噪声是有趣的,因为它可以影响人的多种行为,从而解释一些被认为是诵读困难症潜在成因的近因缺陷;然而,这是一个非常笼统的概念,我们需要将它与特定的神经发育机制更紧密地联系起来。我将在下一章讨论这一领域的最新研究结果。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000