第591章 伦道夫之问 鸦的碎碎念
眼就认出对方了。
乔治&183;布希,阿美莉卡驻联合国大使。
「大使先生?」米勒试图让自己镇定,「如果这是因为我在《纽约时报》上发表的那篇关于语言结构的文章,我想宪法第一修正案应该————」
「这与文章无关,乔治。」布希打断了他,语气中的焦虑难以掩盖,「虽然我也很喜欢你关于神奇数字7的理论,但今晚,我们需要你解决一个更大的数字问题。」
布希把一张列印纸推到桌子中央。
那是希瓦娜在联合国大会现场的发言。
上面只有短短几行,全是方块字。
「告诉我,博士。为什么是中文?」
布希指着文件上的汉字:「刚才在联合国大会的现场,希瓦娜出现了,她的声音突然出现在现场代表的耳机里。
没错,就是你眼前这些方块字。
尽管外星论坛由联合国官方语言构成,可以实现语言之间翻译,但她说话是用中文。
教授,我们需要你的帮助,需要你的大脑。」
米勒愣了一下。
作为克劳德&183;香农的信徒,作为将资讯理论引入语言学的先驱,米勒的大脑迅速切换到了学术模式。
「不,大使先生。」
米勒推开速溶咖啡,从口袋里掏出派克钢笔,甚至都顾不上找布希要纸,他直接在木桌上画了一条线。
「我想这大概只和信息密度有关。
假设我们现在已经能够去到几百光年外。
我们要和母星进行沟通。
那么我们只会关心一件事,那就是信道的容量和熵。」
「熵?」布希皱眉。
「克劳德&183;香农在1948年提出的概念,信息的不确定性,或者说,信息的密度。」
米勒在桌子上写下了一句英语:
he quik brwn f jup ver he zy dg
「看,大使先生。英语,以及所有的印欧语系,本质上是一种线性的一维编码。它是表音的。为了确保信息在传输中不失真,英语进化出了大量的冗余。」
「为了表达光子这个概念,我们需要六个字母,六个字节。为了构建语法,我们需要he、a、i这些在信息学上几乎为零的噪音词汇。」
「在香农的公式里,英语的平均信息熵大约是每字母10到15比特。如果算上冗余,它的效率其实很低。它就像是莫尔斯电码,为了准确,牺牲了长度。」
接着,米勒在下面写下了两个汉字:
光子他用笔尖点了点那两个方块:「但中文,中文是个怪物。」
「它不是一维的线,它是二维的图。它是表意文字。每一个汉字,都是一个被高度压缩的信息包。它直接指向意义,跳过了声音的转码。」
「根据最新的语言统计学研究,如果不考虑上下文冗余,单个汉字的平均信息熵高达965比特,甚至是11比特以上。」
布希显得有些困惑:「说人话,博士。」
「意思是,在同样的存储空间,或者同样的传输时间内,中文能容纳的信息量是英语的两倍甚至三倍。」
章节内容不完整,请退出阅读模式查看完整内容!