下午,艾平在书房专心译解,蓝沣洁则在客厅翻翻书、看看电视,两只巴哥都特别喜欢在这位新朋友的附近转悠。
译解工作现在真的是举步维艰,从密码学角度看,语言学的翻译等同于经典密码学的破译。大致类似于已知某个符号集和它对应的符号集,求解映射关系。只要获得的已知目标符号集(古语言)和其对应的符号集(现代语言)的集合空间足够大,这个映射关系就是有解的。但问题是,目前石碑全文只有400多个字,这个集合空间实在是不够大啊!
一般遇到一种未知的文字,书写方向和数字系统往往是最先作为突破口。
以人们日常的书写习惯,一段文字并不是每一行都会写满,只要确定哪一边留有空白,基本上是可以确定这种文字是往那个方向书写的。
而数字系统也是相对容易破译的,相对于记事的抽象文字,数字是直观的,也比较容易辨认。
接下来很重要的一步就是,要确定未知文字是表意文字还是表音文字。最简单的方法就是数字符。一般情况下,越多不同字符的就会是表意文字,习惯来讲是超过100个;越少的字符则会是表音文字,例如英文26个,阿拉伯文28个,俄文33个,希伯来文22个,少的原因很简单,因为这些字符已经能满足人类的日常需要了。
这12块石碑,艾平很快就看出来书写方向,也判断出人鱼的文字和中文一样,是表意文字。
但是这几步也就只是破译工作万里长城的第一步而已,就跟我们学英语一样,尽管知道英语是从左往右书写的十进制表音文字,但这对实际的阅读工作并没有提供实际性的解决方案。
接下来的工作就会比较复杂,并不能一概而论,大多数的方法就是寻找这种未知语言的近亲语言,以近亲语言的字符对照,逐个击破。像埃及象形文字的后裔就是科普特语,玛雅文字虽然无人可读,但玛雅语言却一直被玛雅人后裔使用。
并不是每一种语言最终都能被破译,比如古印度河文明所留下的文字,不仅文字的符号完全未知,而且所记录的语言就像从未在这个星球上出现过似的。
就这石碑上的四百来字,艾平来回推演过无数次了,真是毫无进展啊!这译解难度,已经完全超出了他原先的预计。
“这可怎么办啊!”艾平此刻内心烦躁,看着满桌子的材料挠着头说道。