讲座全文|语言演化与高更三问之“人是何物”

语言演化与高更三问·第二问

人是何物？

主讲人：王士元

美国加州大学伯克利分校荣休教授

香港理工大学讲座教授

本文是在2018年3月30日华东师范大学思勉讲座上、王士元教授所作报告的录音与PPT基础上整理而成的，略有删改。

整理：张明辉、袁丹 校订：蔡雅菁

人是有语言的动物

自从人类“站起来”以后，手变得灵活了，喉咙也得到了改造。如图1所示，本来我们的喉咙比较高，当直立以后喉咙就下降了；本来我们的软腭与喉咙里的一块软骨是相互接触的，因此是一个“密闭空间”，但喉咙下降之后，会厌部位就形成了一个“开放空间”，为言语发声创造了条件。

图1. 喉头下降与语言发展：猩猩→远古人→现代人

下面我想更进一步谈谈高更第二问“我们是何物”？当然，我们是有语言的动物。而语言又为何物？语言首先是我们沟通交流最重要的工具，同时也是我们思想/思维最重要的载体和最基本的条件。但在19、20世纪，关于“语言是怎么来的”一直是学界一个讳莫如深的话题，许多人即使长篇大论也难以廓清。因此，当时巴黎、伦敦等语言学会便下令会议期间禁止讨论语言起源问题。

图2. 人类与其他动物沟通方式的设计特征比较

一直到1960年，美国语言学家Hockett写了一篇文章The origin of speech才系统地讨论这个问题。他指出语言是人类多样沟通方式中非常独特的一种；并提出13种设计特征（design features）来说明人类语言的独特性：声耳渠道、四散传播定向接受、迅速消失、互换性、整体反馈、专门化、语义性、任意性、分离性、跨越时空、能产性、传统传播和模式二重性。同时，如图2所示，他还比较了人、类人猿、灵长类、陆生哺乳动物和爬虫类的沟通方式所利用的设计特征的差异，并强调只有人类语言涵盖了全部特征。

其他动物的沟通方式

而研究其他动物的行为、感知和沟通方式对我们了解智能也很有必要。比如图3，德国昆虫学家Karl von Frisch就率先发现了蜜蜂的舞蹈语言，即蜜蜂能够利用∞形舞的频率与角度传递蜜源距离和方向信息：①舞动的频率越高表示蜜源距离越近，反之则越远；②跳“摆尾舞”时的中轴线与垂直线的角度，表示太阳与蜜源方向的角度。此外，他还发现蜜蜂的舞蹈语言存在各种方言，比如小蜜蜂（dwarf honeybee）、巨型蜜蜂（giant honeybee）、印度蜜蜂、澳大利亚蜜蜂和意大利蜜蜂等在表达同样的蜜源距离与方位信息上，会利用不同的舞蹈形状和时间节奏来传递。

图3. 蜜蜂的舞蹈语言与方言

除了von Frisch之外，另外两位科学家也在动物行为和习性研究方面作出了卓越的贡献：奥地利动物学家Konrad Lorenz发现了“小鸭子怎么找妈妈”；荷兰裔英国动物学家Nikolas Tinbergen发现了“海鸥怎么分辨自己产的蛋”。因此，von Frisch、Lorenz和Tinbergen共享了1973年的诺贝尔生理学或医学奖。

还有一种很有意思的动物是鸟。在动物之中，除了人之外，鸟也很倚重声音来沟通交流。伯克利大学著名的动物行为学家——Peter Marler，经常早起、带着录音仪器到大学后面的山上去录鸟鸣。山上有两种小鸟：白冠带鹀（white-crowned sparrow）和北美歌雀（song sparrow）。他想知道这两种小鸟怎样学会各自属种的鸣叫，为此，他做了4组不同的实验，如图4所示。

图4. 不同刺激输入环境下白冠带鹀的鸣叫习得

他用控制变量的方法给刚出生的白冠带鹀输入a、b、c、d四种不同形式的鸟鸣旋律、并在观察它们在不同阶段的习得效果：①a组，在前50天感应期（sensitive period）输入白冠带鹀和北美歌雀的鸣叫声。②b组，感应期内只输入北美歌雀的叫声；③c组，感应期间无声音输入；④d组，感应期间只输入白冠带鹀的叫声但参与实验的雄性小白冠带鹀是只聋鸟。实验结果发现：a组的小白冠带鹀能学会自己属种的鸣叫而不被北美歌雀的声音干扰；但b、c、d组的却学不会。

由此表明，白冠带鹀在习得自己属种鸣叫的过程中存在时间限制，正如我们习得外语的过程中存在“关键期”（critical period）一样，它们也存在关键期，大约是出生后前50天。此外还有一个相似之处是，婴儿在习得语言之前存在一个牙牙学语（bubbling）的阶段，雏鸟在习得特定鸣叫之前也存在一个吱呀初鸣（subsong）的阶段。这再次表明动物行为存在很多共同之处。

前文提到，Lorenz曾研究过“小鸭子怎么找妈妈”，他发现刚出生的小鸭子会把它所见到的第一个能动的物体当成妈妈，这种行为叫“印刻现象”（imprinting）。根据这一点，Lorenz让刚出生的小鸭子第一眼就看到自己，从而成功充当起了它们的“妈妈”，所以他在澳大利亚的田野、街头行走时总是有一群小鸭子跟着他，如图5。

图5. Lorenz利用“印刻现象”充当起了小鸭子的“妈妈”

尽管如此，我们对动物行为的了解仍然有限。几乎每几个星期就会有新的、有趣的发现。比如，曾经我们一度认为蝙蝠之间没有沟通，但近年的研究已经证实蝙蝠拥有非常复杂的、有规律的沟通系统（Morell，2014）。这里我们不再做过多的介绍。若有兴趣可参看王士元（1991）主编的The Emergence of Language: Development and Evolution ，里面收录了一些这方面的材料。

人类语言的基本特征

所以语言到底是有什么样的特色呢？战国荀子曾经说过：“名无固宜，约之以命，约定俗成谓之宜，异于约则谓之不宜”、“名有固善，径易而不拂，谓之善名”。这几句话其实洞见了语言一个非常基本的特征：任意性（arbitrariness，这也是前文Hockett提出的13个设计特征之一），即语言符号的音义结合关系是任意的、约定俗成的。

荀子是一个非常伟大的思想家，王士元（1991）曾经写过一篇文章Language in China: a chapter in the history of linguistics ，里面相当一部分讨论了荀子的思想。不谋而合，芝加哥大学的哲学家Anthony Yu（余国藩，2008）也写过一篇论文Cratylus and the Xunzi on names ，对荀子的“名”做了更深入的探讨。

但语言符号的音义结合关系是否真的是“完全任意”的呢？如图6所示，有一个大家都不知道的语言的其中两个词：kiki和booba，它们各自指称的是左图还是右图呢？如果拿这个图给不同语言背景的受试者做个调查，许多人会认为kiki指称左图，booba指称右图。所以，音义结合并非完全任意，它们之间可能存在某种关系。另外，加州大学圣地亚哥分校的Ramachandran和Hubbard（2001）也举了很多例子来说明语音和语义之间的结合关系并不是完全任意的。

图6. 某语言中的两个词“kiki”和“booba”各指何物？

因此，语言的特征并不尽如Hockett提出的13种设定那样，有时候比较复杂。此外，还有一个Hockett未曾提及，但也与语言密切相关的特征，就是“歧义”（ambiguity）。在语言表达中，如果不联系特定背景，经常会产生歧义。比如汉语的一个句子“鸡不吃了”就可以有两种解读：“不吃鸡了”和“鸡不吃东西”，前者将“鸡”理解为 “吃”的受事，后者则理解为“吃”的施事。再如另一个句子“我们没有做不好的事情”，其两种歧义表达和对应的句子成分分析可如图7所示。

图7. “我们没有做不好的事情”的歧义结构分析

这样的例子在汉语中不胜枚举，其他语言亦然。比如英语句子“It’s too hot to eat”中的“it”可以有不同的指称（食物、天气、调料、动物……），另外“hot”也有两个基本义项“热”和“辣”；所以组合起来就有好多不同的意思。再比如日语句子“学生が好きな先生”也有两个意思：①喜欢学生的先生；②学生喜欢的先生。

当然对语言感兴趣的不止是语言学家。例如人工智能领域的开拓者之一、1978年诺贝尔经济学奖得主Herbert Simon就曾直言：语言一定要等到动力系统中不同的功能（如呼吸、发声、咀嚼等）交互在一起并同步化（synchronized）才能获得原动力（initial boost），只有这样我们才能发出成千上万区别性的词，并且在长段话语中这些词的发音能足够迅速地储存到我们的工作记忆中。具备了这些条件，我们才能拥有复杂的思想和精密的语言（Simon，1962）。王士元（1978）在印度的一次讲演中提出了类似主张：

“许多这些能力在他种动物中也不同程度地存在着(看看黑猩猩使用工具与解决问题的例子)。在人类演化中，这些能力也许比语言更早出现，渐渐一步一步地，这些能力在语言精练的过程中越来越为人所运用，好像完成了一片片的马赛克拼贴画一样。同样地，这些能力也被运用在其他精细的人类组织中，特别是在数学与音乐方面。”

——W.S-Y. Wang., 1978. Explorations in language evolution. Reprinted on p.116 in Explorations in Language.

总而言之，语言是建立在很多已有的能力上的，因此我觉得类似于“语言是一种特别的器官”这样的说法是无稽之谈。

人类和语言的起源：单源or多源？

讨论了语言的一些基本特征后，我们再来谈谈语言的起源。语言的起源和人类的起源密切相关，但又有不同。两者在学界都有两派观点：单源论（monogenesis）和多源论（polygenesis）。

作为一个物种，人类的起源更可能是“单源的”：

化石证据方面，迄今发现的最早阶段的人类化石大多都在非洲（如“少女Lucy”遗骸）；基因证据方面，目前母系和父系的DNA研究也都支持“非洲起源假说”（The Out of Africa Hypothesis）。

图8. “线粒体夏娃”与非洲起源假说：基于mtDNA比较绘制的人类母系脉络谱系树

图8展示的是Rebecca Louise Cann的一项研究成果（Cann, Stoneking and Wilson，1987）。她到医院收集了几百个胎盘，提取并比较了胎盘中的线粒体（mitochondrial）DNA（下文简称“mtDNA”），并绘制了如图所示的环形树。mtDNA存在于细胞内但在细胞核外，仅包含37个基因，其结构类型是反映母系脉络的重要指标。从图8这棵“树”上可以看到：140多个胎盘中，最早分化的7个全部为非洲裔。这篇文章是第一次从基因角度讨论现代人是否起源于非洲的问题。

图9. 基于Y染色体序列变异所绘制的父系脉络谱系树

mtDNA能体现母系遗传，而Y染色体（Y chromosome）则体现父系遗传；较之前者，后者的基因要多得多。斯坦福大学的一组研究人员（Underhill、Shen、Lin等，2000）就接着比较了Y染色体的序列变异并绘制了如图9所示的树形图，与mtDNA的考察结果类似，最先分出来的8个Y染色体全部为非洲裔，这再一次佐证了“非洲起源论”的合理性。在此基础上，他们首次绘制了全球的人类演化迁徙地图，如图10所示。据此图可知，大约在10万年前，现代人从起源地非洲开始四散迁徙，并在不同的时间到达不同的区域。

图10. 人类演化及迁徙路径地图

相较于人类的起源，语言的起源则更可能是“多源的”。Freedman和王士元（1996）合著过论文Language Polygenesis: A Probabilistic Model，文中运用统计学上的泊松模型（Poisson Model）来比较单源和多源的概率，结果如图11所示：表征多源的概率曲线（粗线）随着地点数期望值的递增而趋升，因此更支持语言多源论。

图11. 语言起源的“泊松模型”：横轴为地点数期望值；纵轴为概率

世界语言的谱系

但无论语言的起源是单源还是多源，现在世界上大概有六七千种不同的语言，如何将这些语言组织起来并归类呢？著名语言学家Greenberg就在语言谱系分类上作出了有益的的尝试，如图12所示，他将世界语言分层12个大语系：克瓦桑语系、尼日尔-刚果语系、尼罗河-撒哈拉语系、德拉威语系、亚非语系、达罗毗荼语系、卡特维利语系、欧亚语系、得内-高加索语系（包括汉藏语）、南方语系、印度洋-太平洋语系、澳大利亚语系和美洲印第安语系。

图12. Greenberg关于世界语系的划分图示

他认为世界上为数众多的语言都是从这12大语系中发展出来的。通过观察同一语系（如得内-高加索语）在全球不同地域的分布，也能佐证这些区域的人类存在亲缘关系。因此语言和化石、基因一样，也是考察人类亲缘谱系关系的重要证据。

我认为中国语言学有非常好的传统，从荀子、杨雄到许慎、陈第，都作出了重要的研究。但相对不足的是，我们的眼光总是局限于汉语，而不太关注语言和语言之间的区别与联系。汉语只是全世界七千多种语言中的一种，我们应当把视野拓宽，同样关注汉语和其他语言之间的关系。过去在汉语研究领域贡献卓著的语言学家中很多都是外国人，我希望不久、也相信不久的将来，中国学者也能成为某门外语研究领域中的权威。

下面我将介绍一个罕见的语言中的例子。图13所示是有关斯瓦希里语形态句法的4个句子。如果学过法文、德文或俄文，我们就知道名词的种类很多，能区分阴性、阳性甚至中性；并且在使用了某类名词后，整个句子的形态都要表达该名词的类别。而斯瓦希里语的名词种类更加复杂、多达八九种，图13只显示了其中的第一个名词类（前两句）和第四个名词类（后两句）。

图13. 斯瓦希里语中包含第一与第四类名词的例句及其单复数形态表达

在第一个名词类的第一句话中， “人”的词根是tu，“好”是zuri，“一个”是moja，“那个”是yule，“摔倒”是meanguka；其中标红的“M m m yu a”皆是与第一类名词相关的单数形态标记。若要表示“两个人摔倒”则需以第二句的形式表达；可以看到在复数表达中“M m m yu a”都变成了“wa”，两句唯一不同的实词是moja（一）和wili（二），其余皆为语法所规定。而在第四类名词的两句话中，单复数词头就分别变成了ki和vi。我希望将来中国语言学家也能更多地参与到这些语言的研究中。

前面我们提到了Greenberg对世界语言的划分，其中有一个大语系就是欧亚语系。图14更加具体地显示了欧亚语系中的分支语系的分布范围，包括：印欧语、阿尔泰语、韩-日-阿依努语、爱斯基摩-阿留申语、乌拉尔语、吉利亚克语及楚科奇-勘察加语等，其中深蓝色的是印欧语。最后我想梳理一下印欧语及其分支的谱系研究。

图14. 欧亚语系中诸分支语系的分布范围

西方学界普遍认为现代语言学发轫于印欧语的历史比较研究。英国法官William Jones首次发现印度梵文和他所熟知的欧洲诸语间（尤其是波斯文、拉丁文和希腊文）存在诸多类似，因此1786年他在一次演说中直言这些语言是同源的。之后一代代学者继续沿着他的道路探索印欧语的亲属关系及传递过程。其中有两位德国语言学家August Schleicher和Johannes Schmidt相继提出了两大经典理论：前者首倡“时间-纵向传递-树形图理论”，后者则力主“空间-横向传递-波浪理论”，至今仍有深刻影响。

基于这些研究，我们不但可以用图15所示的谱系树来展示从原始印欧语（Proto-Indo-European，简称PIE）中派生出来的144种语言及彼此的亲缘关系，还能如图16所示更进一步量化欧洲诸语言的分化时间（Gray & Atkinson，2003）；从该图可知，欧洲语言的分化时间大约在5500年以前。

图15. 从原始印欧语派生出来的144种语言及亲缘关系

图16. 欧洲诸语言的分化时间

而语言谱系关系的推定及分化时间的量化，其最主要的依据就是词。通过词形比较即很容易发现各语言之间的亲疏远近关系。图17罗列了部分印欧语和日语的整数词（1~10）。正因为亲属语言间往往具有共同的词汇、相近的形态甚至严整的语音对应规律，所以如果能找出这些规律，就能很好地解释如何从原始印欧语变化到日耳曼语。

图17. 部分印欧语及日语整数词（1~10）的词形比较

比如德国著名的语言学家Jacob Grimm就发现了三类有关印欧语辅音递变的现象，被称为“格林姆定律”（Grimm’s law），这三条规律能很好地勾勒出“原始印欧语（PIE）→日耳曼语”的演变过程。图18左列举了印欧语中部分非日耳曼语和日耳曼语（以英语为例）的几组同源词，通过比较这些词中不同调音部位（双唇、齿龈、软腭）辅音的变化形式来简示“格林姆定律”的具体涵义：

规律1：浊送气音变为浊不送气音

规律2：浊塞音变为清塞音

规律3：清塞音变为清擦音

图18. 格林姆定律及汉语方言中类似音变的例证

其他语言中也有类似的辅音音变现象。图18右侧就分别列举了汉语方言上海话、台湾闽南语和香港粤语部分例字的读音，来依次说明这些方言相对于普通话分别存在d＞t、p＞f及k＞h的音变。

至此，可以对本文做一个简单的小结。我们重点探讨了语言演化和高更三问中的第二问“人是何物”，并在人类与其他动物沟通方式差异的比较中作出了最关键的回答“人是有语言的动物”、“语言是人类最重要的的指标”，其后又讨论了语言的基本特征、语言的起源与谱系等相关问题。

第三讲“我们向何处去”将讨论语言与大脑的关系，敬请期待！

参考文献（部分）

① C. F. Hockett, 1960. The origin of speech, Scientific American 203, pp. 88-96. Reprinted in W. S-Y. Wang, ed. 1982, Human Communication. Language and its Psychobiological Bases.

②V. Morell, 2014. When the bat sings, Science 344 : 1334.

③W. S-Y. Wang (ed.), 1991. The Emergence of Language: Development and Evolution. Scientific American.

④ W.S-Y. Wang, 1989. Language in China: a chapter in the history of linguistics. Journal of Chinese Linguistics 17: pp.183-222.

⑤VS, Ramachandran & EM., Hubbard., 2001. Synaesthesia: A window into perception, thought and language. Journal of Consciousness Studies 8 (12): 3-34 (32).

⑥ R. Cann., M. Stoneking., and A. Wilson., 1987. Mitochondrial DNA and human evolution. Nature 325: 31-36.

⑦ P. A. Underhill, P. Shen, A. Lin, Li Jin, …, M. W. Feldman, L. L. Cavalli-Sforza & P. J. Oefner., 2000. Y chromosome sequence variation & the history of human populations. Nature Genetics 26: pp. 358–361.

⑧ D. A. Freedman, & W.S-Y. Wang., 1996. Language polygenesis: a probabilistic model. Anthropological Science 104. 2. 131-8.

⑨R.D. Gray, Q.D. Atkinson, 2003. Language-tree divergence times support the Anatolian theory of Indo-European origin. Nature 426: 435-9.

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。