作者:施晨露
“你觉得这个对你有吸引力吗?”微信通话那端,走走的语速很快。和记者每聊一段,间歇,她不止一次反问道。
春节前夕,原《收获》编辑走走领衔的“谷臻故事工场”推出了AI浓缩书项目“谷臻小简”,打出的广告语是“浓缩一本书最精华10%”,“再厚的书,一小时也能读完”。
“谷臻故事工场”的前身“收获故事工场”,是一群文学编辑的理想——上世纪80年代,包括《收获》在内的纯文学杂志是“第五代”导演案头必备的素材。曾经有个传说,张艺谋是《收获》付梓前的第一读者。确实,当时不少经典电影都改编自发表于文学杂志的小说。后来,影视制作的环境发生了剧变,《收获》编辑部仍然时不时做一些义务的影视版权代理工作,前些年口碑上佳的《烈日灼心》正是根据《收获》发表的长篇小说《太阳黑子》改编的。
《收获》想做“剧本工厂”,发挥原创作品集聚的优势,在互联网+环境下,整合华语文学圈,提升优秀文学作品的影响力、传播力及IP价值,“收获故事工场”应运而生。走走是这个孵化项目的负责人。2017年上海国际电影节影视市场上,《收获》杂志首次以“收获故事工场”展位亮相。
种子播下了,开出了花,结出了不同的果。如今亮相的“AI浓缩书”更像是一个意外长出的枝丫。走走十几年在《收获》编辑部积累下的人脉,让文学圈的很多作家、评论家、编辑,加入了主动在社交圈“安利”这个新生项目的行列。一次次、一张张海报的转发中,新的问题随之而来:人工智能为阅读“加速”,对阅读来说,真是一件好事吗?
AI读非虚构类作品,准确率高达85%
“你知道吗?那些网络小说动辄三五百万字,我都快把眼睛看瞎了。”
拿到天使轮投资的“收获故事工场”变身“谷臻故事工场”后,走走离开了工作10多年的《收获》杂志,全身心投入到文学影视IP的孵化中。做影视版权,第一步就是要在纷繁的小说“海洋”中,选出有改编潜质的作品。海量的阅读,对人来说,显然是巨大的负担。
有没有一个软件可以迅速把小说读完,并且直接提取情节?技术团队经过8个月的开发,果真做出了这个“读书神器”,也就是如今的AI“谷臻小简”。提取完情节,能不能直接出故事梗概?对AI的要求步步提升的过程中,走走和她的团队发现,原来,“人工智能”也有短板和长板。要浓缩一部小说的精华,目前,人工智能的阅读水平仍旧比不上人。“这也不奇怪,读小说的过程是感性的,联想我们自己的阅读经验,常常是被一部小说中的一句话所打动。浓缩过的小说,很可能丢失的就是打动你的那句话,那就价值尽失了。”
尽管对付小说还不够功力,但“谷臻小简”阅读人文社科历史经管类作品的准确率相当高。用走走的话来说,除了小说,所有非虚构类作品,它都在行。“我们用《富爸爸穷爸爸》做了一个实验。这本20年前的财商类畅销书,AI只用了不到5秒,就浓缩出了1万多字的精华内容和全书框架。我们比对后发现,大部分干货都在里面了。”
这之后,AI“谷臻小简”又“读”了很多书,经过这些书的原作者或编辑的比对确认,准确率达到85%以上。“AI做的是整句摘取的工作,标点内不做改动,为你提炼出这本书的结构、精华和观点,把作者的思考路径和整本书的框架都理出来。”走走说,上线“AI浓缩书”项目的初衷是希望更尊重一本书的原作者。以她多年的编辑经验出发,比起接受他人的解读,第一手的阅读更加靠谱。“比如解说《人类简史》《未来简史》这样的书,解说者的水平真的够得上书和作者本身吗?”
知识付费还是知识焦虑,AI更“客观”?
“每个人都有自己思考的能力和权利,我们不代替读者咀嚼。”
这一两年,以得到、樊登读书会等为代表的知识付费阅读平台如火如荼。走走的话很容易被联想为一种“叫板”。
“两年前开始加入知识付费大军,从刚刚兴起的喜马拉雅、蜻蜓FM,到罗胖的得到APP,再到樊登读书会,一个不落,全部注册会员。每天早上听,晚上听,走路听,坐车听,忙里偷闲也会听一听。大量信息流入大脑,各种最新资讯、社会热点、名人成功学、心灵鸡汤、科学理论、各种书籍名言,一通狂轰乱炸。每天要是不听一听,生怕被社会抛弃,生怕自己知识落后。这样的日子大概过了一年多,突然有一天,再次打开手机,看着听过的音频记录,忽然觉得好陌生。每个标题都好像见过,但没有一段内容记得了。”网友“一草一竹”记录的心路历程颇有代表性——每段内容少则十几分钟,多则几十分钟,加起来也有上千小时了,竟然什么都没有记住,“这是在学习呢,还是在浪费时间和金钱呢?每天都好像在追求进步,实则是空虚、焦虑作祟。”
“听书平台很多,说书的方式各有不同,有的照本宣科,一字一字读完,有的会自己归纳、提炼,说出书中的精华。”90后用户吴颖的手机上,装着喜马拉雅、十点读书、樊登读书等多个APP,“会根据内容使用,碎片化时间拼起来能读完一本书,对上班族很有吸引力”。但最近,她也发现,有的“听书”节目把书的内容说得面目全非,“听书完全是一种接受的过程,不像看书还能前后翻阅鉴定一下内容,听书是跟着解说者的思路往下走,有时候节目会迎合用户的口味,把经典变得特别简单,有些甚至扭曲了,而你听着,浑然不知,很难去判断节目的质量。”
春节前,“谷臻小简”AI浓缩书项目在喜马拉雅以“AI导读”的形式上线——经过AI浓缩的书的“干货”再由AI朗读软件“讯飞有声”进行录制,成为用户可以订阅的专辑。专辑页面上,对于主讲人的介绍写道,“实现AI导读的谷臻小简是谁?国内首个实现人工智能浓缩书的产品、AI客观提取10%全书干货、速读社科历史、经管励志、人文传记精华——世界是主观的,知识是客观的。”
显然,“客观”,是AI浓缩书项目希望吸引用户的卖点和痛点。
软件是一个杠杆,看你撬动的是什么
当知识成为一种产品,当阅读在碎片化时间中沉浮,用AI为阅读“加速”,是一件好事吗?又一种新形式的知识付费,能给读者带来多少真的知识?滤去多少知识带来的焦虑?
走走设想了一个场景,在纸质书的时代,或许很普遍——你会走进一家书店,花上几十分钟到一两个小时,在书架里翻翻拣拣读读,选定自己喜欢、想要完整阅读的书带回家。在她看来,“AI导读”其实就是帮助读者完成“翻翻拣拣读读”的过程,你可以通过AI浓缩的框架、观点、精华,判断这本书到底是不是你需要的,如果有兴趣,可以继续阅读全书。
“AI浓缩书”建立在电子书版权基础上,10%一般也是电子书可以提供试读章节的上限,目前已在喜马拉雅上线了30个专辑,与国内10多家出版机构合作,此后还将在亚马逊、豆瓣、掌阅、懒人听书等各大平台上线,与更多出版机构的合作也在陆续洽谈之中。
在喜马拉雅,目前订阅者最多的两个专辑是《10人以下小团队管理》和《全球通史(上)》,前者已有将近6000次播放记录。之所以称为专辑,而不是一本书,是因为经过AI的提炼,书的内容可以形成多种形式的“知识包”乃至课程。比如《全球通史》,就基于包括埃及、德国、柬埔寨、泰国、加拿大、土耳其等8个主题在内的上海社科院出版社系列出版物,形成上中下三个专辑,23集音频内容。名为“党员学习小书包”的专辑则包含了《丹麦廉政建设》《今天怎样做党委书记:一个任职30年国企党委书记的自述与思考》《上海国企党建实践与探索》等多本书的精华,针对性颇强。
“AI导读确实更适合知识性、学习性的阅读。对于虚构类图书,一来AI不具备浓缩能力,二来读者享受的体验本就是阅读的过程而不是结果。从我们目前上线的内容来看,试听后购买整个专辑的转换率挺高的。”走走说,《10人以下小团队管理》的订阅者最多,用户的选择也是一种启发,“应该是目前的创业环境导致的,这个标题的指向性又非常明确,很多人就是需要10人以下小团队的管理经验。这其实是一本老书,对出版社来说,可能也是翻新库存内容价值的一种途径。未来,我们还可以在AI导读的产品页面同时提供纸质书的下单渠道,希望也能为整个出版环节创造更多价值。”
“一个软件是一个杠杆,看你撬动的是什么。我们想撬动的是一个百科全书式的知识图书馆的导读系统。甚至,在你的家庭里,也可以建立这样一个系统,传递家庭藏书的知识体系。”她又问,“你觉得这个对你有吸引力吗?”
当AI评选文学榜单——
一个AI,何以从771部小说中,准确指认出另一个AI的身影?
除了阅读非虚构类图书,并为未知的读者进行“导读”,别忘了,AI“谷臻小简”的开发初衷是为了阅读小说、虚构故事,选出其中适合影视改编的那一批。诞生至今,它已经“阅读”过几千部剧本,近万部网络文学与纯文学作品,并为它们开出改编评估报告。
AI还能为文学带来什么改变?最近,“谷臻小简”评出了国内第一个AI文学榜单,一至六十名的排名榜在《思南文学选刊》2019年1月号上揭晓。国内20本主流文学杂志提供了2018年刊发的全部771部短篇小说,最受人工智能青睐的是科幻作家陈楸帆的作品《出神状态》。有趣的是,这篇小说实际上是作者陈楸帆尝试让人工智能参与创作而共同完成的。“一个AI,何以从771部小说中,准确指认出另一个AI的身影?”走走不禁感慨。也有作家点评,“AI更喜欢读科幻,很合理”。
“谷臻小简”是这样介入评审工作的:先从各家杂志中挑选出三篇作品,再进行综合排名。由于各家杂志送来作品的进度不同,截至2019年1月20日,它的最爱读物始终是莫言的《等待摩西》。1月21日下午2点53分,参与此次评选的《小说界》和《鸭绿江》作品赶到,新增80部短篇小说。晚上7点20分,有趣的事情发生了,“谷臻小简”最终选出的年度短篇是陈楸帆发表于《小说界》2018年第4期的《出神状态》。
陈楸帆曾在谷歌公司工作,公司同事送给陈楸帆一个礼物——会写作的AI,正是这个AI,模仿他写了两段小说,被他放入了作品中。在《出神状态》结尾有这样一段话:(注:带*号楷体字部分为AI程序通过深度学习作者风格创作而成,未经人工修改。)据AI的开发者介绍,对于这个会写作的AI的训练数据包括陈楸帆既往的十几部小说作品,以及作为参考语料的赫胥黎、阿瑟·克拉克、威廉·吉布森、尼尔·斯蒂芬森等人的科幻小说作品。第一次看到AI程序写出来的句子时,陈楸帆的感觉是,既像又不像自己写的,有先锋派的味道。
“谷臻小简”对文学作品的判断方式是以情节曲线、人物情绪的纠结度为判断标准,是数据化的结果。对于这份人工智能选出的文学榜,走走认为,它的确从771部短篇小说中选出了非常值得阅读的一批,但它也面无表情地选出了存在问题的一批。这里的问题,指的是语言乏味、思路简单、情节俗套等。也就是说,尽管人工智能可以用闪电般的速度读完几百万字,理解情绪,提取结构,把握叙事节奏感,但只要它还没法甄别语言的好坏,或许所有写作者就没必要感到焦虑:人工智能目前还没法从根本上改变这个古老的行业,编辑与评论家也无需担心被抢了“饭碗”。
AI“读”出的《出神状态》曲线
“做AI榜单,一是想看看人工智能目前的进展,它对文学作品的判断到了什么程度,二也是因为对目前的各种文学榜单,大家多少存在一些不满足”,《思南文学选刊》副主编、AI榜策划者之一黄德海说,没有人为因素干扰的文学榜单会是怎样的呢?AI带来了一种视角,但能不能用AI检验一个作家的语言水准,检验对人性探索的深度,是AI榜之后的课题。
文学之美能否被量化?这是一个待解的课题,如同要解释两个AI究竟是如何在黑暗中握手相认的一样。但鉴于人工智能的阅读广度和速度,它被用于文学榜的初选评定上,可能很快就会实现。“因为,任何文学榜单的评委不可能比它读得多。”黄德海说。
“人类和机器都有缺点,而人和机器合作,最大的好处是能节省大量时间,克服人类在速度、注意力、先入为主、自身喜好等方面的局限。与此同时,人类也面临着巨大的挑战,比如,如何认识人类在这些判断之下的位置,如何在AI高速发展的时候提高自身的竞争力,如何理解甚至参与创造AI的写作伦理……我们置身其中的,是一个无法轻易做出判断的尝试。”走走说。
栏目主编:施晨露 文字编辑:施晨露 题图来源:视觉中国 图片编辑:邵竞