对信息进行压缩的最有效的方法之一就是编码。移动电话和因特网在传送信息时都要进行编码,这是一个自动的过程,作为使用者我们不需要亲自参与。与平常使用的单词缩写相比,优秀的编码系统可以以惊人的效率对信息进行压缩。
摩斯为电报设计的点划编码系统就较好地保证了效率。根据摩斯的编码,英语中最常用的字母E相对应的编码最短,只用一个点来表示,而其他不常用的字母,如 Z,就用比较长的编码表示。和其他电报编码相比,摩斯码以更简洁的形式传达了更多的内容,所以得到了广泛的应用。这些原则同样适用于我们今天对音频、视频以及数字图片等信息的编码压缩。通过这些编码压缩系统的成功运用,我们可以看到信息就像是海绵一样,里面所含的"空气"要远远多于"实质内容"。在完整保留实质内容的前提下,完全可以把多余的空气挤出去。
而在申农提出信息论之前,所有研究人员关注的问题就是:到底什么是信息中不可缺少的"实质内容"?对大多数人来说,信息的"实质内容"就是信息的含义。除了含义,构成信息的所有其他成分都可以不要。没有含义,就不能构成通信。
然而,申农所提出的最激进的理论就是:含义在信息传输中无关紧要。按拉普拉斯的话说,含义只是申农不需要的一个假设。申农所提出的信息的概念是和偶然性联系在一起的。申农这样定义信息不光是因为偶然发生的噪音会影响信息的传输。只有在信息接收方不知道信息发送方所说的内容且无法预测该内容的情况下,才能构成信息的存在。由于真实的信息无法预测,所以信息的传输实际上是由一连串的偶然事件构成的,就像赌场轮盘的旋转和骰子的滚动一样。
如果真的如申农所提出的理论一样,信息的含义可以抛弃,那么每个单条信息中不可压缩的内容又会是什么呢?克劳德 申农认为,信息中不可压缩的内容可以通过数字进行描述。问题的关键在于构成信息的各种符号的不可预测性到底有多高。
前不久,有家电话公司在广告中讲到了一个由于移动电话噪音而引起误会的笑话。有个农场工人打电话订购"两百头公牛",由于噪音太大,结果送来了两百只德国猎狗;还有个女人给丈夫的办公室打电话,让丈夫回家时买瓶洗发香波,结果她丈夫买回了一条杀人鲸。
从上面这两则广告中我们可以看到,虽然平常可能没有意识到,但实际上我们都从潜意识上认同并理解申农的关于信息的概念。我们试着分析一下杀人鲸那条广告的内容:1)妻子说:"买瓶香波";2)丈夫听成了"买条杀人鲸";3)丈夫随即结束了通话,说了声再见,就回家了,在路上买了条杀人鲸。
使我们感到可笑的只是上面的第三个行为。之所以可笑,是因为在日常生活中,几乎不可能会有"买条杀人鲸"这样的要求。在实际的交谈对话中,人们总会努力猜测对方接下来要说什么话。我们会不断更新自己对谈话所了解的信息,预测下面会说到什么内容,以及什么样的内容与当前的对话完全无关。参与对话的双方越亲近(不论是从个人关系上讲还是从文化背景上讲),这种预测就会越准确。很多结婚多年的夫妇只要对方说出几个字就可以猜出下面是什么内容。青春期的密友有时只要收到一条三个字符的短信就会兴奋地大呼小叫。
但是,如果你和谈话的另一方初次见面,或者文化背景不同,那么,上面提出的各种缩略形式就会失去作用。如果所传达的信息无法预测,即使和自己的爱人也不能使用过于简略的形式。
如果你真的希望你爱人买条杀人鲸回来,你不会仅仅说:"买条杀人鲸。"你至少需要做上一番解释。信息传达的内容越不可预测,信息本身就越不可压缩,而所需要的带宽就越大。这也就是申农的观点所传达的内容:信息的关键在于内容在多大程度上可以预见。
申农并不是从这个角度对信息进行定义的第一个人。在他之前,同样曾经在贝尔实验室工作的科学家哈里 奈奎斯特和拉尔夫 哈特莱就提出的类似的想法。申农在大学期间读过拉尔夫 哈特莱的论文并将其称之为"对自己有最大的影响"。第25节:第一章(21)
在提出这些关于信息论的设想之后,申农需要给信息中不可压缩的实质内容起个名字。对于这种不可压缩的实质内容,哈里 奈奎斯特称之为情报,拉尔夫哈特莱称之为信息。在申农早期的论文中,申农偏向于使用哈里奈奎斯特提法。在军事行动中,"情报"这个词常常和密码破译工作联系在一起。同时,"情报"还可以用来指含义,而申农的理论和信息的含义完全无关。普林斯顿的高级研究所的数学家约翰 冯诺伊曼建议申农使用"熵"来命名这个概念。熵是个物理学的概念,大致用来描述偶然性、混乱无序、以及不确定性。熵这个概念是在研究蒸汽引擎的过程中产生的。经过研究,科学家发现偶然产生的热能无论使用什么方法也不能转换成可以使用的能量。必须保证一定的温差(由高温的蒸汽推动活塞压缩冷空气),蒸汽引擎才能运行。随着温差的减小,蒸汽引擎会慢慢停止运转。物理学家把这个过程描述为熵的增加。根据著名的热力学第二定律,宇宙中的熵总是在不断增加的。一切事物都会慢慢衰败,最终把能量耗尽。
约翰 冯诺伊曼告诉申农,用"熵"来命名这个概念谁也挑不出毛病来,因为很少有人知道"熵"的真正含义。约翰 冯诺伊曼这样说并不完全是开玩笑。事实上,物理学中熵的方程等式与申农理论中信息等式的形式完全相同(两个等式都使用同样的概率算法)。申农接受了约翰冯诺伊曼建议,不但用"熵"来给自己提出的概念命名,而且借用了熵的代数符号,罗马字母"H"。申农后来把自己在马萨诸塞州的房子命名为"熵宅",只要你看看房子里的布置就会觉得这个名字起得恰如其分。
在提到这件事时,罗伯特 法诺回忆道:"当时我不喜欢信息论这个名字。而且,申农也不喜欢。"但是,很多人都很喜欢"信息"这个字眼,结果,不光申农的理论被冠以"信息论"这个名字,而且就连信息内容这个概念也用信息来替代了。
赶潮流
关于信息论的研究,申农超越了所有前人的成就,他的研究成果使所有人都大为震惊。申农提出的理论不仅在当时,甚至在现在也必须用神奇这个词语来形容。
在研究中申农发现,通过将信息进行编码,可以对通信渠道的信息传输能力进行几乎百分之百地利用开发。在申农之前还没有过任何人在实际操作中成功地做到这点,所以人们对申农提出的理论感到非常震惊。根据申农的理论,当时通用的几种编码系统,包括摩斯电报码、美国信息互换标准代码(ASCII),以及所谓的 "简明英语"编码,都远远没有充分利用通信渠道的信息传输能力。当时常用的编码系统对于信息的压缩整理只是相当于把一堆圆形保龄球放在方方正正的柳条筐里,不论怎么精心码放,总会有相当大的无法利用的空间。因为任何人也做不到在保龄球装筐时一点空隙都不留,而把所有的空间都充分利用起来。虽然不能把柳条筐完全塞满保龄球,但是,按照申农提出的理论,我们却可以在通信渠道中完全塞满信息。
申农的另一项发现是针对信息传输中的噪音干扰问题的。在申农公布这一发现之前,人们认为只有使用更大的信息传输带宽,才能保证把噪音干扰降到最低。举个简单的例子,作为预防措施,我们可以把同一条信息重复发送三遍,把竹竿捡起来,把竹竿捡起来,把竹竿捡起来。信息接收方收到的内容可能是,把竹竿捡起来,把猪肝捡起来,把竹竿捡起来。这样,通过把三条信息加以比较,信息接收方自然就可以分辨出正确的信息内容。但这种做法有个缺点:必须占用三倍的带宽资源。
根据申农提出的理论,我们可以做到两全其美,既节省带宽资源,又保证信息传输的准确。方法就是通过采用新的编码系统来把产生噪音干扰的可能性降到最低,这样就可以在不多占用带宽的同时保证信息传输的准确度了。但是,申农提出的理论和当时通讯工程人员几十年积累的经验构成了冲突。罗伯特法诺的反应是:"把信息失真降到你想的那么小吗?几十年来从没有人往这个方向想。我不知道他是怎么产生这个想法的,更不知道他为什么会坚持这个想法。"虽然申农的理论在当时遭到了广泛的反对,但几十年后,他的理论却成了世界上几乎所有通讯工程系统运行的基础。第26节:第一章(22)
起初,人们根本无法想像申农的理论能够付诸实践。当时还是上世纪四十年代,谁也想像不到几十年后我们能在超市里一边购物一边打手机的情形。贝尔实验室的约翰 皮尔斯就对申农理论能否付诸实施提出过质疑,他坚信占用更多的带宽把信息重复发送是解决噪音干扰问题的唯一方法。
进行数字编码工作必须使用计算机设备,在当时,计算机设备的使用成本要远远高于铺设线缆的开支。
但是,当时的苏联卫星研究机构以及美国的航天项目改变了人们的看法。在太空中给卫星设备更换一块电池就要花费几百万美元的巨资。考虑到这项成本,必须要保证在卫星设施的通讯传输中尽可能地节约有限的电力和带宽资源。这样,经过美国宇航局进行的初始开发之后,数字编码和集成电路技术的成本大为降低,最后终于在老百姓日常生活的各个方面得到广泛应用。
如果没有申农提出的理论,我们这个世界将会大不一样。我们使用的所有数字通讯工具都会饱受各种噪音干扰,包括脉冲干扰、静电干扰,以及宇宙射线干扰。计算机每次启动时都要从磁盘上读取数以兆计的数据,而且只要其中有几个比特的信息发生错误,电脑程序就会出现问题,发生死机的状况。根据申农提出的理论,通过采取相关措施,我们可以把数据误读现象发生的概率降到最低。因特网文件共享在某种程度上也要归功于申农的理论成果。如果没有根据申农理论开发的纠错编码系统,音乐文件和电影文件每经过一次拷贝或传输就会损失一些内容。正如几年前有个记者所说的:"没有申农就没有网络下载。"
到了上世纪五十年代,大众媒体开始认识到申农理论的重要意义。当时美国的"财富"杂志把申农的信息论评价为"全人类最引以为自豪、举世无双的一项伟大的科学理论",并预言信息论将"迅速而深刻地改变人类对世界的看法"。
事实上,信息论这个提法听起来就给人一种包罗万象的感觉。在上世纪五十年代和上世纪六十年代,人们又把计算机科学、人工智能、以及机器人研究全都纳入了信息论的范畴(虽然申农对上述的几个领域都非常感兴趣,但他却认为不应将其归入信息论的范畴)。当时的思想家们凭着直觉已经预感到了一场以计算机、网络技术、以及大众媒体为主导的文化变革的来临。
在1949年,一本名为《通讯的数学理论》的书中再次刊登了申农的那篇论文,这本书的前言这样写道:"通讯这个词将以最广泛的定义被使用在这本书中。在提到通讯时,我们指一切信息传输和交流的过程。在这里,通讯不光指书面和口头的交流,同时还包括音乐,平面艺术、戏剧、芭蕾舞以及人类的所有行为。这本书的前言的作者就是申农以前的雇主华伦 魏佛。在这篇文章中,华伦魏佛把信息论归纳进了人文科学的领域,虽然这样做是否正确仍然值得商榷。
在申农的影响之下,研究传媒理论的马歇尔麦克卢汉在他1964年出版的《理解媒体》一书中首先使用了"信息时代"的提法。在随后的几十年间,麦克卢汉的预言得到了应验。"信息时代"这个提法简洁地概括了电子媒体(以及当时的模拟媒体技术)给人类社会带来的巨大变化。但是,当时的麦克卢汉一定没有想到申农的信息论竟然能带来如此一场翻天覆地的变化。信息论一经提出,就在各个领域得到了积极的应用,包括语义学、语言学、心理学、经济学、管理学、量子物理学、文艺评论、园林设计、音乐、视觉艺术、甚至宗教领域(1949年,通过约翰 皮尔斯的介绍,申农曾和科幻小说作家罗恩 贺伯特写信进行了一些交流讨论。当时罗恩贺伯特刚刚提出了所谓的"戴尼提心灵改善技术",于是申农就介绍他和研究神经生理学的华伦麦库洛奇认识。直到今天,贺伯特创立的山达基科学教派在经文中以及因特网网站上还经常提到申农的名字和信息论的相关术语。英国作家乔治奥威尔曾说过:"要想发财,就去创立宗教"。贺伯特创立山达基科学教派也许就是这个初衷)。第27节:第一章(23)
在提出信息论之后,申农只是利用信息论的定律对爱尔兰作家乔伊斯的《芬尼根的守灵》一书进行了一些漫不经心的分析。他的妻子贝蒂曾和皮尔斯合作写了世界上最早的几首"计算机音乐"。此外,还有几个研究信息论的学者,其中最著名的就是比利克洛维,曾经和当时纽约的一些先锋艺术家进行了一些合作,其中有约翰 凯奇、罗伯特 劳森伯格、白南尊、安迪 沃霍尔、大卫图德,还有几个住在贝尔实验室曼哈顿分部附近的艺术家。这些艺术家中很多人都对申农有所了解,至少听说过他的名字,有些艺术家对信息论的主要观点还有所研究。对于约翰 凯奇和罗伯特劳森伯格这样致力于探索极简主义的艺术家来说,信息论似乎有着不同寻常的意义,虽然当时没人能说清楚这种不同寻常的意义到底是什么。
不久,申农开始觉得人们对信息论的宣传有些夸大其词。于是在一篇1956年发表的社论文章中,克劳德申农指出很多人利用信息论"赶潮流"。申农认为,当时很多人对信息论缺乏深入了解,但却利用信息论这个概念大做文章,夸大了信息论与很多与之毫不相干的学科之间的联系。其他学者,如诺伯特 维勒和彼得 埃利亚斯,对申农的观点做出了积极的回应。彼得埃利亚斯在一篇文章中尖锐地呼吁禁止发表《信息论、光合作用与宗教之间的关系》之类的论文。
对于申农、诺伯特 维勒和彼得埃利亚斯来说,信息论和其他领域的关系远远没有麦克卢汉声称的那么广泛。但是,如果说到信息论和通讯以外的其他领域之间是否存在关系,这个问题的答案当然是肯定的。当时有位名叫约翰 凯利的物理学家在一篇论文中就对此进行了证明,这篇论文的标题是《信息论与赌博的关系》。
约翰 凯利
1894年,最早来到美国南部得克萨斯州科西卡纳定居的一批新移民在打井取水时意外发现了石油。随即,科西卡纳成为了美国南部最早的一个石油重镇。石油给科西卡纳带来了巨大的财富,当地盖起了歌剧院,甚至请来卡鲁索这样的巨星前来表演。接着,随着经济萧条的到来,一切都开始改变。石油价格暴跌至每桶10 美分,当地经济陷入混乱,通过邮递送货的水果蛋糕成了科西卡纳最持久的工业,直到现在也是如此。
1923年12月26日,约翰莱瑞凯利出生在科西卡纳。他的母亲莉莲从事教育工作,在得克萨斯州的教师退休机构上班。关于凯利所谓的父亲,本书作者找不到任何相关信息,因为凯利几乎从未和朋友说起过自己的父亲,也许凯利就从来没见过自己的父亲。根据美国1930年的人口普查记录,当时六岁的凯利家里除了妈妈就只有外祖母和姨妈了,几个人一起住在月租30美元的廉价公寓里。
凯利的青年时期正赶上第二次世界大战,曾经在空军作为飞行员服役四年。从空军退役之后,凯利到得克萨斯州立大学读书,本科和研究生学的都是毫无魔力的物理学。他硕士学位论文的课题是《弹性波速对于沉积岩中水性物质的变量影响》,与石油工业有着或多或少的关系。凯利在1953年发表的博士论文的课题是《不同物质第二阶段弹力属性的相关调查》,由于这个课题的重大学术意义,凯利得以在毕业后到贝尔实验室工作。
由于申农的声誉和影响,贝尔实验室当时已经成为了一家享誉世界的研究机构。由于ATandT在行业中的软垄断地位,贝尔实验室拥有雄厚的财力,可以在基础科学领域进行大规模的深入研究。所以说,当时的贝尔实验室和大学高校一样,从来都不用为实验资金发愁。但与大学高校不同的是贝尔实验室的研究人员没有教学任务。
凯利到贝尔实验室的莫利山分部工作时年仅30岁,长得非常英俊,不过看起来显得有些瘦弱。由于眼下有重重的眼袋,他显得比实际年龄要大一些,让人觉得有些神秘,甚至给人一种浪荡公子的印象。凯利烟瘾极大,抽起来一根接一根,而且喜欢喝酒,"总是寻欢作乐,喜欢享受人生"。凯利热衷于社交,说话嗓门很大,非常幽默,不喜欢领带皮鞋等正式衣服。由于说话带有浓重的得克萨斯口音,所以在贝尔实验室里显得与众不同。此外,凯利还非常喜欢枪械,在他收藏的枪支里有一把Magnum大口径左轮手枪。