老友记| 中国第一位'程序员':我在东汉玩'编码'
许先生,名慎,字叔重,性别男,爱好不详。生于东汉,汝南郡召陵县人。没学过Java也不懂C ,精通古文经学和今文经学,做过太尉南阁祭酒,参加过国家图书整理工作。由于做学问厉害到没朋友,学界人称“五经无双”。 计算机系的于是不服了:你一个中文系的,和程序员扯的是哪辈子亲戚关系? 许先生的名字里,既有“慎”又有“重”,不过他对传统文化却有一颗相当火热躁动的心。他觉得自己那个时代,学术风气不正,群众对古文字有误解和偏见。一些砖家学者,凭着主观臆断争抢着“说字解经”,曲解文字的历史和意义。许先生实在不能忍,喷这些“俗儒鄙夫”“未尝睹字例之条”——不懂汉字造字之初的原理和方法,就敢穿凿附会、乱讲一气。 许先生于是想,老夫要自己搞一套东西,把汉字都收进来,归归类、排排序,剖析剖析每个字的正确含义,纠正时下人们对汉字的错误用法。 对,编字典。不过这个字典前头得加一个牛气哄哄的定语:中国第一部。 说干就干,然而我们的古人立即遇到了一个现在看来根本不是问题,但在1900年前是个大问题的问题: 按照字音?字义?笔画数?不行,都不够perfect。 我们许先生“五经无双”这个头衔可不是盖的,他在酝酿一个大招。 他要创制一种方法——通过识别每个汉字的身高体重血型星座DNA,对它们进行分类、排序、标签。 大约在公元100年,这是中国乃至世界文字学史需要铭记的一年。这一年,许先生大功告成,中国第一部字典《说文解字》初稿诞生,前后用了10多年。之后增补修订,直到公元121年,终于慎重定稿。 全书收录9353个小篆字,异体字1163个,说解共用133441字。多少个字不是重点,重点是许先生创制了一个伟大概念:部首。 没错,就是中国人都知道的汉字部首。其实,秦代在搞“书同文”的时候,已经基本确定了汉字的偏旁;许先生的创新,是把这些偏旁根据意义划分成540个部首,再根据每个字的形状和意义,把它们归入这540部。 为什么说部首这个概念伟大?不只因为从此开创了按部首编撰字典的排序、检索体例,一直沿用至今;更因为,这背后还有一个更伟大的概念:“六书”。 就跟“六个核桃”不是真的六个核桃一样,“六书”也不是六本书,而是一套理论,汉字造字法的理论。一枚小小的受精卵,发育成数万亿个人体细胞,靠的是啥?细胞的有丝分裂;我们老祖宗画的一个图画、一枚符号,最后繁殖成包含数万个单字、能够完整记录语言的文字系统,靠的是啥?这里头,肯定也有套路。 套路被许先生给摸出来了。他认为老祖宗造字,无非六大套路:第一是指事,用象征性的符号来表示意义,比如“一”“上”“下”;第二是象形,直接把物体的外形勾画出来,比如“日”“月”;第三是会意,两个表意的字合体表示新的意义,比如人在囗中,就是“囚”;第四是形声,一个表意的字和一个标音的字合成一个新字,比如“江”“河”,这是最能产的一种造字法;第五是转注,意义上相同或相近的字互引解释,比如“豕”是个象形字,各地由于方言不同,又根据“豕”造出了“猪”“彘”等同义的方言字;第六是假借,本来没有这个字,借一个发音相近的字来表示,比如甲骨文的“北”像两个人背靠背,本义是“背”,后来被借去表示北方的北…… 这六种造字法,就是许先生定义的“六书”。一枚汉字造出来的过程,基本逃不脱这六种套路。《说文解字》通篇9353个眼花缭乱的小篆字,被许先生用这一套理论,给理得顺顺溜溜、清清楚楚。 现在就可以看出许先生的厉害之处了:先秦以来分析汉字的书并不少,但从汉字的造字起源全面系统地分析汉字的结构和字义,许先生是第一个这么玩儿的。 这一玩,玩出了新意,玩出了高度,关键是,玩出了中国文献语言学的千年根基。日后火遍古代中国的文字学、音韵学、训诂学,大体不出 《说文解字》涉及的范围。今人整理厚重的古籍文献,手头也离不开这一本薄薄的册子。 最狂拽酷炫的,还是《说文解字》里那套前无古人、后启来者的编码思想。 《淮南子》里说,很久很久以前,仓颉造出文字的那一刻,天雨粟、鬼夜哭。 文字如一道光,劈开蒙昧的迷雾,播洒文明的甘泽。中华民族的智慧洪流从此一泻千里势不可挡,吓得老天爷瓜子都掉了。 但在“程序员”许先生冷静睿智的眼里,汉字无非就是一套庞大的符号系统,要想对它们进行规范科学的管理使用,并防止它们在时空光缆的传输过程中失真,编个码是很必要的。 清代人王筠说,《说文解字》通过五百四十个部首对汉字进行排序检索,此为“经”;以六书理论说解汉字的结构和本义,此为“纬”。 经纬相交,形成了一套“编码网络”。每个汉字符号进入这个网络里,都会获得一个代码。这个代码就像一张不朽的名片,记载着每个汉字的前世今生,往前带着我们靠近更古老的甲骨文和金文,往后则蕴藏着汉字演变发展的无限可能。 对啊,汉字从来不是一成不变的。从栩栩如生的殷墟甲骨文,到规旋矩折的籀文小篆,从横平竖直的隶书楷体,再到今天的简化字,几千年来汉字更新迭代了N.0版本,以适应不同时代“用户”的需求,但传承的脉络没有断过,最核心的数据也从未丢失。 为什么?因为背后有中华文明这强大的CPU作支撑,也因为千百年来有无数像许先生这样的“程序员”,前仆后继,用最狂热的激情守护祖先传下的文明数据,又用最冷静的科学态度对这些数据进行整理和维护。 他们的情怀,也许可以用许先生在《说文解字·叙》里一句慷慨激昂的话来抒发:“盖文字者,经艺之本,王政之始,前人所以垂后,后人所以识古!” 他们看得通透,文字是沟通古今文明的桥梁。但他们也许没有想到,“六书”这把为汉字量身开发的密钥,还激活了人类古文字的普遍规律——今天人们发现,世界上很多原始文字、古文字的构形造字法,居然都可以拿“六书”来分析分析。“六书”的兼容性,已经超出了汉字的范围,对于人类其他古文字也是普遍适用的。比如纳西族的东巴文,甚至古埃及文、玛雅文,都可以放进许先生的编码程序里跑一跑。 受时代的局限,许先生的“编码程序”有很多漏洞和不足,但经过后世不断地打补丁和更新,加上甲骨文这一“逆天”的发现,汉文字学如今在世界上已是傲视群雄。今天,汉字又有了Unicode计算机编码,古老符号加入信息时代的轰趴,照样可以轻松“hold”住场。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。