• 精选
  • 会员

对话MSRA副院长周明:展望未来,NLP有哪些发展趋势?

2019年3月9日  来源:机器之心 作者: 提供人:yanpan88......

机器之心:往未来看的话,您觉得 2019 年哪些研究会有更大的研究潜力?

周明:如果要算的话,我觉得有三个点比较令人关注。

第一,刚才说的预训练模型。过去一年基本上大家都在谈论预训练模型。尤其 BERT 一出来,几乎所有任务都用 BERT,结果是很多任务的水平都获得提升。所以未来的一年我可以预料的是,预训练模型会持续热起来。包括怎么训练一个更好的预训练模型,包括怎么把预训练模型更好地应用在某一项具体任务里面。

第二,就是低资源 NLP 任务的研究。在无语料或者小语料的场合如何做一定的学习、建模和推理?进一步开发半监督学习、无监督学习方法,利用 Transfer Learning、Multi-task Learning 等等方法,把其他语言、任务或者开放领域的模型巧妙嫁接或者借用到新的语言、任务或者领域中来,在某一个具体的任务(比如机器翻译、阅读理解、问答等)上更好地体现出来。

第三,就是所谓基于知识,甚至基于常识的一些应用。就是如何把知识和常识建立起来,如何巧妙地加入到模型里头,然后如何评测知识和常识所带来的效果。我认为未来这一年这个可能会成为一个关注点。

机器之心:您在刚才提到的署名文章《NLP 将迎来黄金十年》一文中指出,NLP 将向四个方面倾斜,分别是:1)将知识和常识引入到目前基于数据的学习系统中;2)低资源的 NLP 任务的学习方法;3)上下文建模、多轮语义理解;4)基于语义分析、知识和常识的可解释 NLP。这些您刚才也有提到。您们团队这边在这些方面的研究思路是什么?

周明:首先方法论上,我刚才所说的预训练模型,还有半监督学习,Transfer learning,多任务学习、我们会尽全力推进。然后在具体应用上,我们会把机器翻译、阅读理解、问答、聊天对话,可能还有一些其他的方面作为一个出发点。然后针对这些具体的任务,把刚才所说的那些方法实施一下,看看效果,然后不断迭代。

你看我们有两条腿走路,一个是方法,一个是应用,让它俩不停的迭代。应用给很多方法提供了挑战,然后很多方法给应用提供了新的一些想法,两者可以相得益彰。

此外,一方面,我们期待项目做得好,应用本身做得好,可以服务于很多的用户,通过微软的产品也好,或者奉献给开源社区也好。利用用户的反馈持续调整和改进我们的研究方向和思路。另一方面,方法论上,我们希望在新的神经网络架构下能够清晰地描述出来一些任务(例如自然语言理解)的理论体系,这包括 modeling、learning、reasoning。三个 ing 的东西实际上是自然语言作为一个学科,建立其背后最重要的技术体系和理论体系。现在在这三个方面都已经有很好的研究了,但是散落在很多地方,不太成完整的体系,所以我们希望通过做项目和研究,能够回答自然语言(尤其是基于神经网络计算的自然语言)的理论体系是什么。在理论体系支撑下,希望最后形成一个技术体系。我们将发布一些工具或者开源系统帮助国内外从事自然语言研究的人,让他们能够快速借鉴已有的方法,不再重复做研究,从而把时间用于去做一些他自己感兴趣的应用。

机器之心:在多模态融合方面您们团队也有较广泛的研究,发表了多篇论文。现在这个研究领域有什么进展?

周明:首先多模态融合这个事情非常有意思。由于神经网络的进展,使得多模态(语言、文字、图像、视频)的编码和解码可以在同一个框架下统一进行了。由于内在语义不一样,以前真的不太清楚语言分析的结果怎么与图像分析的结果一起结合、一起应用;现在则可以用一种模式来建模,编码、解码。从而实现端对端的学习,可以一体化畅通无阻。

第二,应用上,也相应地产生了很多有趣的应用,比如说 capturing,就是对一个图像或视频理解之后用一段文字描写出来。过去一年或者两年有很多这样的研究。还有关于视频或者图像的问答,(CQA)。CQA 过去 1 到 2 年,有很多进展,包括我们组也做了一些 CQA 的工作,比如说引入常识知识来帮助提升 CQA 的水平。

第三,就是把图像识别的结果作为自然语言系统的输入,做写诗、作词、谱曲的工作。微软小冰写诗也是这样的工作。用户上传一个图片,小冰理解了这个图片,理解的结果可以用几个关键词代表。然后利用关键词再产生更多的联想关键词,进而把一首歌词或者一首诗生成出来。

机器之心:前几天看冯志伟老师的一个文章,标题为《语言学家在自然语言处理研究中大有可为》。语言学在 NLP 历史上起到什么样的作用?目前来看的话,语言学对 NLP 还有作用吗?

周明:冯老师写的文章是从语言学角度来看待这个问题,我觉得角度很好,我们也关注这些问题。

过去来讲,自然语言处理刚起步的时候都是基于语言学的,所以语言学对自然语言处理的发展起到了重要的奠基作用,包括基于规则的 NLP 系统对句法分析和机器翻译的重要贡献。

但这几年,我们也注意到,由于大数据(带标的数据)越来越容易拿到了,所以通过机器学习(统计机器学习或神经网络学习)的手段,就可以做端对端的训练。若只看结果的话,如果有充足的数据,似乎不用语言学的知识就能得到很好的结果。比如说基于神经网络的机器翻译就没有用到语言学的知识。这是目前大家都看到的一个趋势。

但这并不代表语言学真的没什么用处。举个例子,低资源的翻译,此时双语语料很小,用常规的机器学习来得到的机器翻译系统,其翻译质量和泛化能力都非常不足。这时候可以考虑把语言学的知识融入其中,希望得到一个更好的翻译结果。从这一点意义上看,在半监督学习或者低资源的自然语言任务中,语言学知识加上人类的领域知识,肯定是能发挥作用的。

但是,我认为现在还没有一个特别好的方法把两者融合起来,也没有把语言学知识或领域知识给予充分的表达,以体现它的能力。这方面在研究上还有欠缺,但恰恰也是未来的一个研究焦点。

语言学对 NLP 研究有没有用?我觉得需要 case by case 地去看待这个情况。不能简单地说有用或者无用,要针对具体任务、所能得到的资源(数据、知识和规则)的数目和质量,来综合考虑各种方法。比如数据足够充分,可以倾向于端对端的自动学习,数据不够充分,且具备可用的知识和规则,则没有理由不去利用知识和规则,以快速建立系统。当系统运行起来,需要考虑不停地追加数据、知识和用户的反馈以改进系统。所以一个实用的 NLP 系统,是数据、知识和用户一起磨炼而成的。

机器之心:我们注意到微软亚洲研究院从 1998 年到去年正好 20 年;而您是 1999 年加入微软,到 2019 年也正好 20 年。这期间有哪些让您觉得特别难忘的事情?

周明:去年微软亚洲研究院 20 周年,我们举办了一系列活动,邀请了很多老朋友(包括学术界的、工业界的)以及来自微软总部的同事们,大家聚在一起畅谈。这个时候正好是回顾过去,展望未来的时候。所以大家也就想,过去二十年到底发生了什么事,有哪些给我们留下深刻的印象。我这边也想了一下。

我想到的是,过去 20 年首先是一个不断发展的 20 年,整个微软亚洲研究院从无到有,从小到大,经历了一个波澜起伏的过程。有的时候我们发展很顺利,有的时候也经历了一些挫折。但是不管怎样,我们总是不断进步,发展得越来越好。

第二,我很荣幸经历了从第一届院长李开复到现在我们洪院长他们领导的所有过程。所以对我来讲,我既是这 20 年的亲历者、见证人,同时更有意义的是,我是一个受益者和学习者。这 20 年我学到了很多很多东西,我从清华加入到微软,发现确实有很多新鲜的东西值得学习。微软有很强的产品和市场团队,还有微软研究院以及微软亚洲研究院这很强的研究氛围。我作为一个员工,从各个角度获得了很好的学习和体验机会。具体来讲,无论研究方法、团队合作、产品意识、还有国内国外合作的境界。我觉得在这些方面都得到很好的历练。

如果说做的项目的话,举几个例子说说我们的历程。我们一开始是做微软的输入法,中文的和日文的。到了 2004 年开始做微软对联(注:微软亚洲研究院的 NLP 团队属于国内最早做对联和诗歌的),2008 年到 2012 年左右我们做了必应词典,还有 2012 年的微软研究院创始人 Rick Rashid 在「二十一世纪的计算大会」上演示了实时语音机器翻译系统,最近两三年我们参与了微软小冰的合作。这几年我们还做了神经网络机器翻译,以及机器阅读理解等等。我觉得每一个项目都有我们自己的特点。从开始立项,经过不停的方案调整,实验不同的方法。这个过程中,每一个人都得到了很好的历练,也提升了自己的研究能力。回顾这些事情,经历了一个又一个的项目,我和我的同事们感到很骄傲、很自豪。

但是,我想把视角从单纯的研究项目本身,投射到关乎 NLP 发展的更宽阔的天地。实际上微软亚洲研究院过去的 20 年为提升全球 NLP,尤其是中国的 NLP,发挥了独到的作用。作为一个大公司,一个负责任的公司,不应该只想到自己,还应该想想它能否正面的帮助这个领域发展,帮助所在国家和地区在这个领域的发展。做一个有意义的贡献者。拿 NLP 这个领域来讲,微软中国研究院(后改名微软亚洲研究院)刚成立的时候,中国只有一篇 ACL 文章,是清华大学黄昌宁老师的研究组写的。

在 1998 年微软亚洲研究院成立之初,我们就制定了与有关学会、学校合作的计划,通过暑期学校、联合实验室、学术大会、各项大学合作项目等一揽子计划共同提升 NLP 的研究水平。我们过去 20 年,在 NLP 领域就培养了超过 500 名实习生、20 名博士生、20 名博士后。这些人绝大多数都去了学校或其他公司。这些人也都逐渐成为了所在单位的技术核心或者领导人物;他们又带动了更多人的成长。所以通过二十年,中国的 NLP 发展越来越好,已经连续五年在 NLP 顶会例如 ACL 论文数量排名世界第二。

现在中国各大公司的 NLP 组,有世界级的专家带领,也服务于世界级的任务,无论是文章发表还是产品,都是世界级的水平。这个事实背后,我想说跟与微软亚洲研究院在中国恰逢其时地推动了这个领域的发展有巨大的关系。

微软亚洲研究院号称 IT 界或人工智能界的黄埔军校;我们也可以自豪地说,在 NLP 领域我们也是黄埔军校。所以我每念于此,我都感到非常地骄傲和自豪。

NLP

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000