还记得电影《杜利特医生》吗?神奇的杜利特医生听得懂动物们的语言,能和它们自由交谈。当然,这只是童话。长久以来,语言都被认为是人类所独有的。在过去数十年,不少学者相信,相比起人类复杂的语言,动物们的语音系统更为简单,属于一类被称为“马尔可夫过程”的随机过程。
然而,8月20日发表在《英国皇家科学会会刊》上的一篇研究指出,并不是所有动物的语音系统都是马尔可夫过程。在分析了7种动物的叫声集后,研究人员认为它们的语音系统并没有人们之前认为的那么“随机”。这项研究不仅增加了人们对动物语音系统特性的了解,而且为人类语言的演化提供了新思路。
也许有一天,在语言学家和动物学家们的努力下,人人都能成为杜利特……
传统观点
动物的发音遵循简单的马尔可夫链
马尔可夫链因俄罗斯数学家安德烈·马尔可夫得名,用来描述只受有限个过去事件影响的一串过程。该过程中,在给定当前知识或信息的情况下,只有当前的状态用来预测将来,过去对于预测将来是无关的。推而广之,只有有限个事件能决定接下来会发生什么。
这样的系统不仅简单易研究,而且还意味着,如果发出新声音的过程满足这个特点,不需要太多“脑力”记得过去的音就能做到,也难怪科学家们会热衷于用此分析动物的语音系统。
“‘动物的发声顺序遵循马尔可夫链’这个假设,兴起于诺姆·乔姆斯基1957年出版的《句法结构》一书,”论文的通讯作者,剑桥大学动物学系的阿里克·克尔什鲍姆博士介绍道。乔姆斯基是语言学领域的巨擘,他的许多理论都为计算语言学提供了基石。“这本书里,”克尔什鲍姆接着说,“乔姆斯基将‘正则文法’(相当于马尔可夫链)和‘上下文无关文法’区分开,并且认为后者是真正语言的基本特性。因为动物没有语言,当时人们假设,它们之间的交流所符合的,一定是更简单的马尔可夫结构。”
最新研究
收集七种动物的声音,以《哈姆雷特》为模本进行对比分析
然而,这个判断就像一条咬着自己尾巴的蛇——因为人们确信动物没有语言,于是用简单的马尔可夫链来研究它们的语音系统,而出于马尔可夫过程和人类语言的使用过程相差太大,大家进一步觉得动物没有语言。
不过,只要多分析一些动物叫声的录音,也许这个循环就会被打破。“我们这项工作诞生于美国田纳西诺克斯维尔国家数学与生物合成研究所组织的一个国际研讨会。”克尔什鲍姆回顾道,“(会上)一些研究者提出,他们研究的物种貌似语音序列并不那么‘随机’。我们随后答应去分析这些物种的数据。”
他们研究的动物有十姊妹雀(又叫孟加拉雀)、卡罗山雀、犬吻蝠、岩蹄兔、短肢领航鲸、逆戟鲸和红毛猩猩。“虽然这个物种列表不一定能代表所有的动物,但它们确实涵盖了很大范围的门类;”克尔什鲍姆说,“相比只检验一两种物种,我们的结论也进而更加广泛适用。”
研究人员收集了以上七种动物的叫声集并加以分析。研究者们将音频抽象成了数据序列,并选取了《哈姆雷特》作为人类语言的语料库,一同与计算机中对各种过程的模拟进行比对分析。
研究结果
从动物的“话”到人类的语言,中间的演化还是个谜
结果表明,除了猩猩和蹄兔,几乎所有的动物都属于非马尔可夫的“更新过程”——这个过程相比马尔可夫过程要求更多的对过去的记忆。
“更新过程与马尔可夫过程类似,但一旦新元素被选择,更新过程能允许这些元素形成任意长的重复。”克尔什鲍姆向果壳网介绍道,“这很重要,因为这打破了马尔可夫过程最基本的假设,也即未来的事件只由过去的有限个事件决定。”
人类语言的复杂性远非马尔可夫过程能描述,而这项研究表明不少动物的语音系统也不是简单的马尔可夫链。这能说明它们的“话”是人类语言的某种原型吗?
克尔什鲍姆不这么认为:“据我们所知,没有动物具有和‘原语言’类似的东西。这是语言演化之谜的一部分。” 由于大部分情况下,研究者们无从得知动物们想表达什么意思,故而也无法在表意层面做出更多分析。“我们检验的大部分语音序列并不包含能参考的信息,因此非常难以判断这些序列到底有多像语言。”他说。
“我们和其余工作者试图解码的关键之谜在于,人类的语言是怎么从极为简单的起源演化而来的,而中间观察不到过渡。”克尔什鲍姆指出,“我们的结果不一定能表明动物有和我们类似的话语系统,但确实能说明这个演化上的突跃并没有之前想象的那样,跨度大得不现实。”
现代快报记者 白雁 整理自果壳网