注册

他用大数据分析了1500部文学名著后,发现了写作的奥秘


来源:遍地文学 作者:

托尔斯泰有句名言,“幸福的家庭都是相似的;不幸的家庭各有各的不幸。”这句话很好理解,令人幸福的因素具有普遍性,所以人们的感受会趋向一致,幸福的家庭也就呈现出一定的共性。

托尔斯泰有句名言,“幸福的家庭都是相似的;不幸的家庭各有各的不幸。”

这句话很好理解,令人幸福的因素具有普遍性,所以人们的感受会趋向一致,幸福的家庭也就呈现出一定的共性。

世间一切美好的东西,其特点都具有一定的共性。很多文学作品之所以经久不衰,成为经典,也是因为它们具有一定的共性。

因此,我们可以说,“伟大的作品都是相似的,平庸的作品各有问题”。

不过这只是我们的直观感受,或者经验之谈。这种说法有没有依据呢?当然有,美国作家本·布拉特的著作《纳博科夫最喜欢的词》,为我们提供了充分的依据。

在《纳博科夫最喜欢的词》中,本·布拉特利用大数据,分析了1500部经典著作后,证实了一点,伟大的作品其实是有相似性的。

一、为什么大数据可以用来分析文学作品?

我们已经身处大数据时代,最明显的感受就是网络上的广告推送。

有网友戏言,自己已经被某平台监控了,他刚想要看某部电影,平台就给他推送了。

这其实是平台用大数据分析了用户行为之后,进行了内容精准推送。

平台自然有它自己的一套算法,不过有一点可以肯定,就是对关键词的抓取是大数据分析的一项重要内容。也就是说,用户平时浏览的内容中,平台可以通过后台抓取关键词,然后进行精准推送。

关键词必然是文字(数字也属于文字),文学作品也是由文字构成,只要是文字,就有其内在的逻辑和规则,也为大数据提供了使用前提。

伟大的文学作品,能够激起更多人的情感共鸣。人类情感有着特定的内在模式,文学作品是用文字来表达情感,自然也存在特定的模式。

既然有内在规则,我们就可以用大数据进行分析。

二、大数据分析文学作品有什么用?

在《纳博科夫最喜欢的词》中,本·布拉特分析了1500部经典著作。

这些著作是200多年来的英文作品,包括世界名著和畅销书。比如狄更斯的《双城记》、海明威的《老人与海》、斯蒂芬·金的悬疑作品以及大量被改编成影视的畅销书。

本·布拉特使用大数据确认了一点:每个作家成名之后,都有其特定的风格,而且这种风格不会改变。

这种风格包括作者的语言习惯、写作习惯等等。典型的例子就是斯蒂芬·金,为了不让人认出来,他曾经改过笔名,创作了几部新作品,不过用大数据还是可以确定这些新作品就是他写的。

这种内在不变的风格,为历史研究提供了一个方法,比如确认历史上的一些作品的作者。

在美国历史上,《联邦党人文集》中有12篇文章的作者有争议,汉密尔顿和麦迪逊都声称自己是作者。1963年,统计学家使用大数据确认了这12篇文章的作者是麦迪逊,解决了这个历史疑问。(那个时代电脑不够强大,统计学家不得不使用人工方法来进行工作。)

中国历史中有大量的悬案,比如《红楼梦》的作者到底是谁,学术界一直说法纷纭。早期的研究者已经有意识地通过对比写作风格等方式来确定作者,但是没有足够的证据支持,他们的研究缺乏说服力。如今的大数据,为确认《红楼梦》作者之类的事,提供了一个新的研究方法。

除此以外,本·布拉特用大数据分析出了伟大作品的一些相似性,而这些相似性不仅为我们打开了艺术创作领域的新视角,而且对我们自身的写作很有帮助,这应该是本·布拉特所做的这项工作最重要的意义。

三、伟大作品都有哪些相似性?

本·布拉特分析的1500部著作都是英文作品,或者是被翻译成英文的作品。

这1500部作品,很多也被翻译成中文引进国内,比如斯蒂芬·金的悬疑小说,《魔戒》,《哈利波特》等等。这些作品在中国也受到了欢迎,说明伟大作品可以跨越语言的差异。

不过,《纳博科夫最喜欢的词》中所得出的结论,是根据英语的用法来的,和中文的用法差异比较大。但我们可以结合中文的用法,归纳得出以下三点:

1、注重细节,尽量避免模糊的词。

人们常说,细节决定成败。艺术创作其实是非常注重细节的,写作更是如此。

海明威以简洁风格著称,其实我们读海明威的中文译本,并不太能理解这种简洁是什么意思。

在英文中,简洁的意思就是尽量不用ly结尾的副词,比如悲伤地、暴躁的。

在中文里,这些词是概括性的词语,不具体,很模糊。放在文学作品里,这类词其实不会给读者留下具体印象。

本·布拉特还发现伟大作品会尽量避免使用标点符号在表达情感,也很少用“突然”这种词。

在中文里,这些词的意思都比较模糊,不具体。

因此,我们写作时需要避开这些雷区,描述必须精确,尤其是对细节的描写要具体。

2、用词简单,尽量降低阅读难度。

伟大作品的阅读难度都比较低,而且随着时代的发展,阅读难度越来越低。这一点中英文作品是相通的。

具体的要求是尽量用短句,常见的词,不用长句,让更广大的读者能够读懂。

这一点中国人早就意识到了,相传白居易写诗,会读给八十岁的老妇人听,老妇人能听懂了,他才会满意。

而伟大领袖则一直强调,写文章、作演讲,要让不识字的农民也听得懂。他自己也是这么做的,他可以跟当时不识字的农民讲哲学理论,而且能让农民完全听懂。

3、制造悬念,特别是开头和结尾。

伟大的作品都有一个引人入胜的开头,以及令人无限遐想的结尾。好的开头可以激发读者的兴趣,而好的结尾则可以引起读者的期待。简言之,都是要制造悬念。

很多伟大作品的开篇都成了名言名句,比如托尔斯泰在《安娜·卡列尼娜》的开头,“幸福的家庭都是相似的;不幸的家庭各有各的不幸”;狄更斯的《双城记》开头“这是最好的时代,这是最坏的时代”;《白鹿原》开头“白嘉轩后来引以豪壮的是一生里娶过七房女人”等等。这些开头都是在制造悬念。

结尾的悬念不仅体现在每一章节,还体现在整部作品的结局。章节的结尾制造悬念可以吸引读者继续阅读,而整部作品留下悬念则给读者遐想的空间。

这一点中国人也早就发现了,而且创造了一个专门的词“留白”。留白适用于许多艺术领域,除了文学,还适用于绘画、电影等等。

以上可以视为大数据得出的写作黄金三法则。其实这三个法则很多教写作的书里都有提到,大数据证实了这三个法则的真实存在和有效性。三个法则可以视为写作的奥秘,为我们自身写作提供助力。

不过还有一个问题值得我们思考,上述法则是大数据分析出来的,我们知道人工智能的基石就是大数据,这是不是意味着人工智能未来可以进行文学创作,从而完全替代人类呢?

这个问题会让很多人产生焦虑。一些科幻作品中,就有人工智能创作文学作品,取代人类的故事。而在现实层面,前不久市面上出了一款文章生成器,可以自动生成文章,还出现了人工智能创作的绘画。

可以让人类更深刻的理解艺术,发现那些平时注意不到的信息,找到更多的灵感,从而更好的进行创作

本·布拉特《纳博科夫最喜欢的词》中也提到了这个问题,他比较乐观,认为大数据或者人工智能的进步,。

原文地址|http://www.bdwenxue.com/wenhua/wenyixinwen/201912/23895.html
未经授权请勿转载!

责任编辑:

 
最新评论
条评论
发表评论
验证码:
-->

推荐文章

-->
-->