外貌研究使用了越来越多的研究方法:从以实验室为基础的研究到应用性的诊所情境,并且都采取了定性和定量两种研究取向。
实验室研究
实验室研究有时候会因为缺乏生态效度和忽视社会文化影响而受到批评,然而实验室研究可以提供有价值的实验证据,并能更好地了解可见差异个体报告的问题。例如,空间关系学或人际距离的研究结果已经证明,对社会交往的主观体验可以进行客观研究(Rumsey等,1982)。在控制了自然情境和实验室情境的一系列研究中,研究者发现面对面交流和社会交往的水平以在“现实生活”中不可能的方式发生了变化。拉姆齐和布尔进行了一系列的研究,使用化妆来操纵无可见差异个体的面部缺陷,以提供实验证据支持个体的自我报告,即人们通常回避有可见缺陷个体。如果不采用被试内设计,则不可能获得这样的证据。也就无法对缺陷的呈现或消失进行直接比较,而不受其他因素如性别、社会技巧或外貌其他方面的混淆影响。
对化妆的研究也表明,仅仅一个预料中的消极反应就足以使有可见差异个体对社会交往产生不同的感知和报告。例如,那些相信自己脸上有伪造疤痕的被试,会将他人对其的消极反应和交往归因于他人对自己异常外貌的偏见(Kleck和Strenta,1980;Strenta和Kleck,1985)。事实上,被试脸上的伪造疤痕已被秘密地擦除掉,并且在克莱克和斯特伦塔的研究中被试看起来没有可见差异。很明显这种操作只有在控制的实验设计中,加上一定程度的欺骗才能实现。这些发现为心理治疗策略提供了清晰的基本原理,并促使后续研究提供证据,因为社交技巧比外貌缺陷更能预测成功的概率,因此社交技巧训练是一项合理的干预措施。
控制的实验研究也能系统地考查媒体对身体焦虑和身体意象满意度的影响。本领域研究之所以成为应用的焦点,是因为最近英国医药协会等机构担忧,媒体大肆宣传过瘦模特而导致人们的身体不满意程度和饮食失调发生率增加。哈利韦尔和迪特马尔使用电脑图像软件对广告中模特的身材变化进行了操控。虽然模特的“吸引力”没有发生变化,但她们的图片却被拉长,促使她们看起来或“瘦”(英国人身材8号)或处于“平均水平”(英国人身材14号)。结果表明,看到瘦模特的女性其身体焦虑感增加,并将瘦和外貌的社会文化理想标准内化了。这项研究认为,广告中使用身材处于平均水平的模特可以降低女性的身体焦虑感,但仍然会提高产品销售量。这些研究对广告业有明确的暗示,并认为将重点放在降低外貌的社会文化态度的内化水平上的干预措施也许是有益的,干预的可能途径和这种干预的有效性有待考察。未来的研究也许会尝试引入更发达的技术,使得电视广告中的图像能用相似的方式被操纵,也能考察“普通”外貌而不是“完美”外貌的影响。然而,针对媒体影响的实验室研究被批评为生态效度不高(Grogan,1999),因为被试在不熟悉的环境中只专注于广告,因此结果不能代表被试正常环境中受到媒体的影响。
吸引力测量
“吸引力”这一概念已经被证明对研究者来讲存在许多问题。许多早期实验研究使用了“富有吸引力”和“无吸引力”的个体的照片,但我们清楚的是,吸引力不只在于身体特征。对人类面部和身体的系统测量[见罗伯茨–哈里(Roberts-Harry)(1997)关于人体测量技术的文献综述]并不等同于对其吸引力的评估,目前依然有人试图通过电脑制作出所谓的“完美”面孔来,有趣的是,这些图像往往被认为是“毫无生气的”。很明显,像吸引力这样的主观概念需要进行主观评估。
自我报告研究
目前许多关于缺陷的心理社会影响的研究都发表在医学刊物上,大部分是相关调查和描述性研究,考察特殊的医学疾病如烧伤(Wallace和Lees,1988)、葡萄酒色斑(Lanigan和Cotterill,1989)和白癜风(Porter等,1986)。这些研究通常集中于疾病的心理社会方面,外貌问题被看作补充问题。例如,在对青少年癌症的心理社会影响的研究中,研究者对外貌问题的注意很少,然而,许多青少年报告说外貌的改变是疾病和治疗中最令人抑郁的部分(Eiser,1998;Rowland,1990)。
那些对可见差异个体面对的问题中某些最为清晰的描述来自自我报告数据。像帕特里奇这样的个人记录在激励对改变外貌的学术研究和解决问题方面影响很大(Partridge,1990),然而个案研究作为一种研究方法得到的关注还是相当少。
本领域的绝大多数研究都是回溯性的、定量的、跨情境的和相关性的研究。而这类研究存在着一定问题,因为当被试表达他们现在对于身体和外貌的情感和担忧时,他们也许无法描绘出真实的过去体验,从而混淆了消极体验和积极体验。实验过程中还可能出现认知失调,导致被试调整早期自我观点以使过去和现在的情境达到协调。这一点已经在乳房切除术后进行整形手术的女性的研究中得到了证实(O’Gorman和McCrum,1988;Reaby和Hort,1995)。此外,近期发生的被试事件和研究情境可能会影响个体的感知和自我报告。实际上,“身体是一个不断变化的研究对象”(Cash,2002b:41),个体对于外貌的看法在其一生中都在不断发生变化。对于外貌或身体意象的状态报告每天都会发生变化,甚至在一整天内也会发生变化。然而,尽管会发生波动,个体还是能够在当前(状态)身体满意和特质身体满意之间达到一个自我平衡。在梅林科(Melynk)的一项研究中,108名美国大学生被要求填写《身体意象状态量表》(BISS)(Cash等,2002),并且每天填写两次、一共填写6天,结果发现被试对外貌的特质满意度与报告的状态身体意象息息相关(Melynk等,2004)。
纵向研究
我们现在迫切需要进行纵向研究,以探讨适应的动态性、波动性本质以及考察与个体一生中重要时期有关的问题。例如,跨时间段研究(Sheerin等,1995)发现患有葡萄酒色斑的儿童并没有因为自己的外貌而受到困扰,相反患有此病的青少年和成人则受到了困扰。预测性、纵向研究能够区分出这些问题在什么时间,以及怎样变得显著起来,特别是针对白癜风这种逐渐恶化的疾病。这也清楚暗示了研究者应该根据不同年龄段设计合适的护理方案,同时也表明了皮肤病与压力之间的关系。
在有关非缺陷者的文献中,纵向研究倾向于聚焦个体对身体不满意的程度和体重(Heatherton等,1997;Rizvi等,1999),而最近的研究则集中于青少年群体(Holsen等,2001)。对有可见差异个体进行完全的预测性、纵向研究通常非常困难。干预前外科手术或医学数据收集是切实可行的[例如,评估对患有葡萄酒色斑(Hansen等,2003)或牛皮癣(Fortune等,2005)的患者进行的治疗的心理社会影响],但该手段通常无法收集到患者在缺陷前的基线数据。预测性研究(Dropkin,2001)考察了75名头颈癌患者在进行外科手术治疗前的焦虑和自我护理的关系,术后第五天可以作为有效区分他们对自己改变后的外貌接受的关键点。但是,研究者对患者只进行了6天的术后跟踪调查,还需要进一步的纵向研究。即使像这个例子,收集了术前的基线数据,进行和接受诊断的过程也已经影响了患者对自己身体的看法和情感。这一点已经在考察女性进行化学治疗的体验的当前研究中得到了证明。在治疗开始前的访谈中,被试描述了她们对于手术效果的期望怎样影响了她们对自己目前外貌的评价(Harcourt和Frith)。
在理想情况下,采用纵向、预测性设计招募被试,在一整年里进行数据收集,这样做对研究是有益的。然而,在纵向研究中分散的数据收集时间,例如每6个月收集一次,仍然有可能错过一些对个体来说特殊重要的时间点,而且纵向研究对研究者和被试都有特别高的要求。纵向研究中不断重复的参与研究可能影响个体对外貌的看法。鲁施(Rusch)等人进行了一项纵向研究,被试是57名由于持续外伤需要进行整形手术的儿童的家长。几乎所有被试(98%)都被确认有创伤后应激障碍(PTSD),在受伤后的5天内他们都表现出焦虑或抑郁症状。一个月后,他们的创伤后应激障碍降低到82%,12个月后进一步降低到44%。鲁施和同事认为,频繁的研究访谈被许多家长看作非正式的干预,能增加他们同子女谈论心理社会问题的可能性或警惕性。这也提出了一个问题:研究情境的设定是否超出了预先的标准?(Rusch等,2000)
最后,纵向研究也需要考虑心理社会干预的长期效果。虽然罗宾逊(Robinson)等人评估了社会交往技巧训练计划,并进行了为期6个月的追踪研究,但还是只有极少数的研究考虑了护理的长期效果(Robinson等,1996)。
随机控制实验
在目前强调责任和以证据为基础的实践的气氛下,随机控制实验得到了广泛的应用并拥有了强大的说服力(见罗宾逊于2002年的文献综述)。基于随机控制实验,健康临床医生、管理人员和政策制定者被用来评估治疗和干预的有效性,因此,以这种方法进行的研究也许更能被读者和权威医学杂志接受。虽然健康心理学家(尤其是那些在应用型健康机构工作的健康心理学家)必须意识到随机控制实验的价值,他们也要注意随机控制实验在心理社会医疗中适用性的争论(Bottomley,1997;Robson,2002)。我们认为,在使用随机控制实验来评价与外貌相关的医疗的影响时,需要进行谨慎的考虑。
特别是,即使在随机控制实验中能够相对容易地对药物治疗进行控制和标准化,与外貌相关的外科手术和心理社会干预也有许多不同的问题。像疤痕的变异(例如发展为瘢痕瘤的倾向)这种个体差异是无法控制的,但它对外貌相关手术的主观或客观结果产生影响,在适应中手术可能是影响因素,也可能不是。
最重要的是,随机控制实验剥夺了病人对治疗的选择,并假设被试只是被动的反应者,而不是有意识的、能够交互的参与者(Robson,2002)。实际上,给予被试的仅为是否参加实验的选择,他们对自己的治疗没有主动决定权。当随机控制实验被用来比较不同整形结果的手术产生的心理社会影响时,这尤其重要。例如,迪恩(Dean)等人于1983年使用了随机控制实验来比较进行过乳腺癌切除手术的女性,观察她们分别在立即实施乳房重塑手术和延迟实施乳房重塑手术时的心理影响。在这种情况下,随机化意味着女性对于自己未来的外貌完全听天由命。这增加了样本出现偏差的可能性,因为那些想积极参与对自己外貌的决定或是对重塑手术持支持或反对态度的女性,不可能被分配到控制组,因此研究结果也许只能应用于那些对治疗方式没有特殊偏好的亚集患者。然而,在这一特殊研究中,必须考虑到随机控制实验的适宜性——随着时间的推移,它在伦理实践上能否被接受。最近,在比较三种不同的延迟乳房重塑手术方法的心理社会影响时,随机控制实验被认为是适合的(Brandberg等,1999)。在这种情况下,所有被试都要做出进行某种延迟重塑手术的最初决定,而且要在她们身体其他部位的供区进行移植。布兰德堡和同事指出,患者渴望随机化的事实支持了患者对复杂的手术也许不想做出决定这一观点(Deber等,1996)。
最后,使用随机控制实验来评估心理社会干预,并不能告诉我们为什么干预是有益或无益的。被试报告的改进,可能是由于干预内容的结果,也可能是干预给予的方式,或者仅是处于团体干预中,有机会接触有相似担忧的其他个体。实际上,关于情境和过程它告诉我们的很少。同样,对研究者和其他人(也就是那些推动心理社会干预的人)而言,他们不可能不关注个体被分配到哪种条件下(Papadopoulos等,1999b)。我们需要更娴熟地设计和评估来确定干预的哪些方面是有用的。
尽管随机控制实验还存在一些问题,但我们并不会因此而否决这种方法。这种方法依然被证明是有效的。例如,在评估提供给有面部缺陷的个体认知——行为指导的宣传时(Newell和Clark,2000)。有一个危险因素是,如果不是因为随机控制实验易于操作、具有预测性,那么现代外科手术的技术也许会被更新的没有心理社会益处的手术所取代。随机控制实验将可能被证明是研究程序中一个非常有价值的组成成分,而不是唯一的(Robson,2002)。研究者所面临的未来挑战是确保随机控制实验被恰当谨慎地使用,并激发出不同方法的发展。
影响调适的多种变量
在许多情况下,研究结果会提及对外貌的调适,但对这一过程中包含了哪些影响因素还不清楚。在决定个体差异方面具有一定潜在作用的因素是很多的,包括社会支持、应对、自尊、归因风格和对外貌的投资(Moss,1997)。然而,如果包含所有变量,那么研究会让被试难以承担,并且为了达到统计效力,研究中还必须采用大样本。因此研究人员必须做出困难的选择:选择哪些变量、忽略哪些变量。
同样,进行定量研究也需要一个合适的结果变量测量工具,并且文献再一次表明,可能出现的结果范围很大,特别是关于焦虑、身体意象和生活质量的。虽然针对这些结构中的每一种都有很多测量工具,但使用最广泛的两种是《德里福德外貌量表》(DAS)和《医院焦虑、抑郁量表》(HADS)(见表2.1)。
表2.1 在外貌研究中经常用于结果检测的量表范例
这些结果常常被用来表示适应程度,但准确来讲,在这种情境下适应的含义又是什么?研究中通常对适应没有明确定义。它是一个过程还是结果?我们指的是低水平的抑郁还是高质量的生活?能否将其定义为不再寻求进一步治疗来“改进”外貌?如果我们采取最后一种观点,那么我们又如何解释卫生保健专业人员报告的情境,即那些先前被认为适应良好的个体,寻求机会进行新的和开创性的外貌改进的外科手术?
因为外貌产生的心理社会影响是如此复杂,孤立地测量一、两个因素并不合适,我们需要在全面评估和大量问卷之间进行平衡。然而,研究者却面临几个两难困境:第一,进行调查的结构如身体意象特别复杂,许多研究者不能清晰地陈述出要集中于哪一个定义或是结构的哪一方面[见汤普森(2004)、汤普森和范登堡(2002)关于身体意象评估的评论]。
第二,测量心理社会功能的一般工具可能无法测量到与外貌相关的某些特殊方面(例如,社会焦虑而不是一般焦虑)。公认的测量方法也受到了批评,因为它依赖于研究者对外貌做出的假设,而不能获得被试自己的观点(见下面对定性研究方法使用的考察)。尽管本研究领域已经取得一定进展,但许多测量工具却缺乏可接受的信效度水平(White,2002)。例如,《身体意象量表》(Hopwood等,2001)用于心理测量属性的确认,似乎对患乳腺癌的女性来讲,该量表是测量她们身体意象的有效的、可靠的测量工具。汤普森列出了一个有用的建议清单,供研究者和临床医师选择测量身体意象的工具(Thompson,2004)。
尽管有这些局限性,临床医生和研究者依然致力于寻找对外貌的心理社会影响进行定量测量的34种测量工具的综述,其中包括一些被广泛使用的测量工具[如GHQ(general health questionnaire,《一般健康问卷》)和罗森伯格自尊量表]。钦(Ching)和同事指出,“心理”测量工具与进行对整形手术结果的测量相关,具有较低的表面效度。但是,这些量表评估的是大范围的心理结构,不一定特指外貌。钦和他的合作者根据《德里福德外貌量表》(DAS)较好的内容效度、表面效度和预测效度,对其评定较高。但同其他测量工具一样,DAS的假设是基于病态和病理学的,这一点与研究者强调外貌的积极方面的要求是背道而驰的。此外,这些测量工具也是模棱两可的,因为个体对外貌的普遍担忧或许与他们正在接受治疗的客观病情或“缺陷”有关,又或许没有关系。
同样,我们又怎能确信诸如焦虑、抑郁这些结果变量一定是与我们正在考察的疾病相关的外貌担忧所造成的?可见差异者同样存在人际关系、工作、经济等方面的问题,所以将抑郁水平归因为可见差异是不合适的。因为标准化测量工具通常评估的是主要变量,缺陷只是个体生活中一个特殊的、定义范围较窄的方面(Koo,1995)。一些关于生活质量的测量工具特意包含了外貌这个维度。例如,欧洲癌症研究与治疗组织(EORTC)设计的一份生活质量测量工具,就包含了乳腺癌患者的身体意象分量表,WHOQOL(世界卫生组织生活质量问卷)也涉及了外貌测量。这些测量工具的发展与应用是考虑到医学或外科手术发展是对外貌影响的一种方式,还有一种方式是给予外貌问题与当前对生活质量的同样多的关注。
克服适合的测量工具问题的一种途径就是发展灵活的方法论(见Rumsey等,2004)。这包括使用《视觉模拟量表》(VAS),补充已被公认的、标准化的测量工具。发展和检验《视觉模拟量表》是为了快速、容易地评估诸如对社会支持的满意度这类问题,而社会支持被认为是重要的,并且目前也没有其他合适的测量工具。