智识分子:做个复杂的现代人
作者:万维钢
内容简介
常识是我们的敌人,我们即将迎来一个“不换思想就换人”的时代。
这是一本关于如何理解现代世界的书,作者在这本书中讲了一些现代人应该有,而且只有现代人才可能有的“智识”——智慧和见识。想要理解这个现代世界,乃至做正确的决策,就得有这种智识。它会纠正你想当然的判断,告诉你一些靠谱的社会科学的研究结果,让你理解或质疑专家的判断,也许你也能像专家一样思考。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究。
自序
这是一本关于现代世界的书。我想在这本书中讲些一个现代人应该有,而且只有现代人才可能有的“智识”——智慧和见识。想要理解这个现代世界,乃至做些决策,就得有这种智识。
从社会变革的大尺度来看,本书要说的思想都相当新,还没有来得及变成成语典故写进我们的文化基因。它们散落在各个学科的最新进展之中,常常不为外行所知。但是这些思想其实并不需要什么专业知识就能被理解和掌握,它们已经在科学家、哲学家、工程师、企业家、创业者、大学师生以及各行各业中对现代世界保持敏感兴趣的人群中传播。
这些人已不仅仅是传统意义上的 “知识分子”,而是“智识分子”。
我本是一个physicist,以科研为生,成就还没达到敢以中文“物理学家”自称的程度。按理说应该专注于物理研究,可我却读了好多非专业的书,写了好多跟物理学没关系的文章。我做这些不务正业的事并不是因为物理学家自由时间多,而实在是因为,这个风起云涌的现代世界,太有意思了——我甚至觉得如果你不去好好了解这个世界的最新思想,仅仅满足于当个特定专业的知识分子的话,简直就是白生在了现代一回。
而且你有可能面临掉队的危险。此时此刻的世界有三个重要趋势,对我们提出了智识上的挑战。
1. 三个趋势
第一个趋势是世界越来越复杂。
经济学家爱拿铅笔说事。一支铅笔看似简单,但如果你仔细想想,其中的石墨铅芯、木质外壳、笔头的金属皮和橡皮,从最初级的原材料提取到加工组装,中间不知道经过了多少人的手。没有任何一个人掌握制造铅笔的全套“手艺”,每个人所会的只不过是其中一步而已。
哈耶克告诉我们,这是市场的力量。知识其实是去中心化的,分布在人群之中,是市场把人们组织起来分工协作。所以如果你只会一样知识,没问题,只要你对价格信号做出合理反应就能生活得不错。反过来说如果有人想拥有全部的知识,试图去总揽全局甚至制订计划,那他只能帮倒忙。
但是现代世界比传统铅笔工人面临的局面还要复杂。如果我是一个工资不高、但是有点现代意识的铅笔工人,我就想问问为什么我不能拿高工资,这我就需要了解点经济学知识。我还想建议工厂在铅笔上印些字和花纹来促进销量,这大概涉及心理学。我关心我的工作是否稳定,有人说铅笔行业快不行了,我怎么评估这种言论的可信度?我会不会被机器人取代?我应该怎么跟老板搞办公室政治?如果我想让子女将来从事更高端的工作,我应该侧重应试教育还是素质教育?
没有谁只知道盯着价格信号,以上这些才是一个现代人的真实处境:每天面对很多的问题。怎么回答这些问题?大多数人的办法其实是模仿他人,因为自己思考也没用,看《三国演义》《孙子兵法》《厚黑学》也没用——适应传统简单社会的经验和思想越来越不适应现代社会。
第二个趋势是人工智能正在慢慢取代人的工作。
对这一点我会在书里细说。简而言之,局面比人们想象的严峻得多。直到目前为止仍然好使的很多谋生技能,甚至包括一些高级技能,都将很快被人工智能替代。我们即将迎来一个“不换思想就换人”的时代。
第三个趋势是尽管所有人的物质生活都在改善,整个社会阶级分层却正在扩大。
近年有关贫富差距的研究都在强调一个观点:穷人跟富人的最重要差别,并不在于金钱数量多少,甚至不在于得到机会的多少,而在于文化和观念。贫困并不仅仅是一个经济状态,而且还是一个思维模式。这个思维模式的差异并不仅仅是什么《穷爸爸富爸爸》之类投资理财的区别,而且还是一整套的东西。
比如说,对陌生人的信任程度,可能就反映了你的阶级高度。有人曾深入调查过美国波士顿地区意大利移民工薪阶层社区的社交习俗,发现对这些人来说,家人、亲戚和从小玩到大的熟人远远比任何外人都更值得信任。他们认为一切外面的东西都是神秘甚至是充满敌意的。而英国的另一项研究发现,工薪阶层和穷人更乐意说一些只有身边亲友才能听懂的话,根本不管外人能否理解——而中产阶级人士则尽量向所有人解释他在说什么。
对比中国人热衷的同乡情谊、校友之间的方言黑话,我们大多数国人在思想上是个什么阶层?我们是不是很容易陷入被传统熟人社会乃至从原始社会来的进化心理学所左右的思维模式之中?我们具备现代社会推崇的理性思维吗?
这个世界的定律不是心灵鸡汤,所以我必须得说,落后的思维模式很难被改变。我会在书中介绍几个试图改变贫困思维的研究,其中鲜有成功案例。
加拿大心理学家基思·斯坦诺维奇有本书叫《超越智商:为什么聪明人也会做蠢事》,用大量研究结果说明一个问题:智商跟理性是两码事,二者几乎不相关。理性能力——充分认识当前局面,做好最佳决策的能力——得另外学习。
在优质教育资源稀缺,不同阶层家庭文化的差异巨大的情况下,你猜谁更容易学到理性。
再考虑到前面两个趋势,世界越来越复杂、越来越不容易理解,人工智能又在逼着我们换脑子——在这样一个局面下,贫富差距怎么可能不越来越大呢?
这三个趋势将对我们构成极大的挑战。可以说只有少数人具备了现代社会的智识,大多数人的思想仍然停留在传统社会、有的甚至停留在原始社会。
怎么迎接这思想上的挑战呢?第一步,是听专家的吗?
2. 如何听取理工科专家的意见
理工科思维是最重要的现代化思维,讲究tradeoff(取舍)、量化和科学方法。我的上一本书就叫《万万没想到:用理工科思维理解世界》。但是别搞错了:如果只满足于自己的一个小领域,那么一个理工科方面的专家,未必就能用理工科思维去理解世界。
其实理工科专家大概都有个烦恼。别人问你个见识方面的问题,如果你不用自己本专业的知识回答,人们就会说你在这个领域根本不是专家;如果你用本专业的知识回答,你其实是个仅供参考的工具。
这话怎么讲呢?复杂世界中很少有哪个实际问题是只用一方面的知识就能解决的。据说,美国某著名科学家,有一次受邀上谈话节目谈环保问题,出了个大洋相。搞与环境相关研究的科学家肯定强调环保,但这位老兄比较极端,他居然说那些能源巨头公司的CEO们“犯了反人类罪”!
像这样的专家,别人不会认真对待你。用能源的是我们,反而要怪能源公司的CEO?而且还反人类罪?显然这位科学家的知识面太窄,他只知道自己学科里的这么一点点知识,以为就他研究的东西最重要。他根本没有tradeoff的思维,也不知道社会中其他方面需求的重要性。正所谓不当家不知柴米贵。
这种情况相当普遍,在公共问题上有些科学家和工程师的见识并不高明,而且还习惯性地过分强调自己专业的重要性。鼓吹全球变暖的气象学家大言不惭地要求不惜代价减少碳排放,仿佛经济规模变小根本就不是个事儿似的;搞航天的人认为每往航天事业投入一块钱就能带来七块钱的回报;搞生物能源的人说核电特别危险;搞物理的人说正负电子对撞机是20世纪80年代初百废待兴的中国最急需的科研项目……只有杨振宁先生最公平:作为搞物理的,他说21世纪是生物的世纪。
所以对待理工科专家,最好的办法是把他们的意见当成决策的参考。你可以在你的专业范围内给我提供最好的论点数据,但具体怎么决策,我还得再听听别人的论点和数据。
君子不器。如果仅仅满足于当某一特定小领域的技术型专家,恐怕是往大了说不足以做公共决策,往小了说不足以明白人生。
那么,听文科专家的行吗?
3. 理念与算数
理工科专家至少知道自己知识的局限性,文科专家经常认为自己无所不知。他们行走江湖不是靠“理性”,而是靠“理念”。
包括经济学、政治学、社会学在内诸多的人文学科仍然处在非常初级的阶段,这体现在学者们对很多重大问题还没有达成共识,他们分成了好多派别,常常冠以“××主义”的名字,有时候就如同武侠世界中的门派一样党同伐异。凯恩斯主义经济学认为消费刺激增长,政府应该出台经济刺激计划;供给派经济学则认为真正的英雄是企业家,所以最好的刺激办法是减税。自由派政治学者认为政府应该在社会生活中扮演重要角色,而保守派政治学者则要求小政府。
高税收高福利的北欧国家瑞典,是大政府的典型代表。作为民主党的美国总统,奥巴马执政期间实行了很多大政府的政策。有人写文章说奥巴马要把美国变得更像瑞典,而与此同时瑞典却在减少税收,去瑞典化,你奥巴马不是逆潮流而动的傻瓜吗?
结果一个数学家说你那叫线性脑袋!我们画张图,横坐标是政策有多像大政府瑞典,纵坐标是经济繁荣程度,那么图上这个曲线不太可能是直线。最大繁荣值不太可能正好在曲线的端点!最大值完全可以在中间某处,两端都不好。奥巴马和瑞典只不过从两个方向都在寻找这个值。
认准一个方向毫不动摇,是理念,是派系斗争,是意识形态,是情怀。知道过犹不及,该左左该右右,时刻为寻找最优值进行调整,才是理性态度。
解决问题的关键往往并不在于你有没有一个高大上的理念,而在于“度”,在于数字。复杂世界中几乎任何东西都有利有弊,用与不用不仅仅要看这个东西好不好,还要看你能承受多大代价。
独立自主、支持国货当然是个特别好的理念,但是洋务运动时期张之洞的湖北枪炮厂耗费巨资搞出来的汉阳造质量极差,同样的钱远远不如直接进口外国步枪。在国家急需强兵的时代,一味追求国产化可能就未必是最好的选择。新中国改革开放之初曾经几乎放弃军工研发,甚至让军队养猪经商,后来又放弃国产中国之星进口高铁技术,现在进口核电技术,这些政策都曾经备受批评,但你不知道其省下来的钱对发展经济起到了多大作用,运力和发电的急需能不能等国产技术。
想要学会寻找合适的“度”,你至少需要掌握两个不同的理念。然而我们在现实生活中遇到的很多公共知识分子们,却往往只知道不遗余力地宣传自己的唯一的那一个理念,有时候连事实都不顾了。
2015年9月5日, 是微博上有意思的一天。有三位名人,几乎同时发表了特别愚蠢的言论。名人A为了宣扬破除伪善的鸡汤理念,把一篇网络小说中虚构的光绪皇帝讲话当成真的评论转发;名人B为了宣扬爱国理念发表《人类起源于中国的猜想》——一篇被戏称为“分形式错误”的雄文——从小处到大处各种尺度上全错了;名人C为了宣扬扶持民营制造业的理念犯了统计错误。这已经不仅仅是理念,这是迷信。他们被自己的理念给劫持了。
崇尚自由市场的教授认为所有经济问题都应该用市场解决,鼓吹自由民主的专栏作家把美国政治的缺点都能变成煽情的素材,热爱儒家文化的历史爱好者看宋朝一切都是好的,自诩保守主义者的中国思想家对一战国际条约体系的推崇可能连现在的英国人和美国人都比不了。他们用半生之力铸就了一个属于自己的锤子,就把一切东西都视为钉子。
像这样试图以一招鲜吃遍天的学者,美国心理学家飞利浦·泰特洛克(Philip E. Tetlock)对他们有个专门的名词:刺猬。
4. 狐狸与刺猬
从20世纪80年代开始,泰特洛克搞了一项历时二十多年,影响深远的研究:用科学方法评估专家们对政治事件的预测能力。我们常常抱怨专家经常做出错误的预测,有时候讲得头头是道也只不过是事后诸葛亮。泰特洛克则使用了复杂而严谨的评估方法,一个最明显的效果就是能避免马后炮。比如说,他在苏联尚未解体的时候让专家们预测苏联未来的命运会比当时更好、更差还是保持现状,并且要求专家对各种情况设定一个概率。
二十多年后,一切问题水落石出,再回头看当初专家们的预测:专家的预测成绩,总体来说,还不如投个硬币随机选择。
所以在预测未来方面,很多专家的确是“砖家”。其实其他领域的专业也差不多是如此,如果你想知道未来哪个领域最值得投资或者什么专业最好找工作,问专家可能真不如自己猜。
但泰特洛克这个研究最值得称道的发现却是,并非所有专家都这么不堪,有的专家预测得相当准确!这个准确与否,与专家的专业从业时间,是否能接触到机密资料,他是自由派还是保守派、乐观派还是悲观派,都没关系。唯一有关系的是专家的思维方式。
泰特洛克把专家按思维方式分成了两类:刺猬和狐狸。刺猬型专家非常深入地了解自己的小领域,他们都有一个“大主意”。狐狸型专家则对什么知识都了解一点,有无数“小主意”。在总结此研究的《狐狸与刺猬:专家的政治判断》一书中,泰特洛克对这两种专家的思维方式是这么描写的:
刺猬式的思维方式是进取的,只知一件大事,在简约的名义下,寻求和扩大此事的解释力,以“掩盖”新的案例;狐狸式的思维方式更加折中,知道很多小事,与瞬息万变的世界保持同步,满足于根据时代找出合适的解决之道。
狐狸预测的准确度,远远超过了刺猬。
这个事实非常,非常重要。一直到近代,知识分子常以拥有不容置疑的信仰为荣,总想把自己的学说推广到根本不适用的领域,在学霸的路线上越走越远,树起主义的大旗吸引无数徒子徒孙,其实都是刺猬。他以为自己的一个大主意能解释所有问题,当现实不符合他的理论的时候,他忽略现实。当结果不符合他的预测的时候,他不但拒绝承认自己错了,反而还能找个理由说这恰恰说明自己当初是对的!
一棵树可能很简单,但树木组成的森林非常复杂,而刺猬则以为只要他能理解树,他就能解释森林。刺猬眼中的世界是简单的,简单到他用一个理论就能解释一切。他眼光简单,办事方法也简单,把自己蜷缩成一团,试图用浑身的刺去面对外面复杂的世界。
然而真正有见识的,其实是狐狸。
我敢说,现代化的道理千头万绪,唯有此事最为关键:不要被自己心中的“大主意”劫持。
所以我们智识分子的最根本教训,就是要做狐狸,不要做刺猬。泰特洛克用统计问卷的方法发现了狐狸思维相对于刺猬思维的种种特点,值得我们作为美德,甚至作为座右铭列举出来:
● 狐狸乐于接受新的信息;
● 狐狸对自己决策的信心远小于刺猬;
● 即使做过决定之后,狐狸仍然想从不同的视角进行再思考;
● 狐狸总爱不断修正自己的预测;
● 狐狸也许并不像刺猬一样对某个特定领域无比内行,但是他的知识面宽得多,了解很多事;
● 狐狸对很多事情持怀疑态度;
● 当考虑冲突的时候,狐狸能看到双方可能正确的方面;
● 狐狸喜欢与观点不同的人打交道;
● 狐狸在工作中并不追求明确的规则和秩序;
● 狐狸喜欢有多个答案的问题,他们在解决问题的时候常常能发现多个选择……
总而言之,狐狸眼中的世界是复杂的。世界任何时候都需要很多刺猬来提供观点和建议,但是刺猬在科学决策中的真正地位只不过是个吹鼓手和工具。狐狸,才是这个越来越复杂的世界真正宠爱的人。
怎样才能成为狐狸呢?
5. 十八般武艺
这意味着我们不能满足于当某一方面的“专才”,而应该广泛学习各种知识,掌握“通识”。想要解决社会、经济和生活问题,不能追求掌握一个一劳永逸的“正确”理论,而应该追求掌握一系列不同流派的思维方法,十八般武艺,多多益善。
这其实正是西方所谓“博雅教育”(liberal arts)的意义所在。博雅教育起源于古希腊,柏拉图提出“七艺”——有点像中国孔子那时候的“六艺”——被认为是一个自由的城市公民所应该掌握的若干个基本学科。这些学科有文法、修辞、逻辑、历史、天文学等,都是一些不能直接作为一门手艺出去赚钱,但是可以提高一个人思想见识水平的“素质教育”。
我国教育家很爱谈素质教育,还特别喜欢文学、音乐、美术这些领域,最主要的教育形式就是让小孩放学以后去上个钢琴班之类。为什么要搞素质教育?他们可能会告诉你,拉小提琴是为了效法爱因斯坦,给科研工作提供灵感,但人们心里想的往往是,素质教育可以把人变得像个“上等人”。
人们幻想自己的孩子接受了素质教育,长大以后就可以跟外国友人聊聊《傲慢与偏见》这种世界文学名著,跟商业伙伴打打高尔夫球,彰显贵族气质。
难道素质教育是化妆品吗?
博雅教育的本意其实是有很强的实用性的!这个用处并不在于谈恋爱找对象好找,而是为了学习怎么做决策!
古希腊“自由人”的反义词,不是罪犯,而是奴隶。奴隶只需要听话干活就可以了,其实生活未必有多差——美国南北战争时期南方媒体的一个重要论点就是奴隶生活稳定不用担心失业而且有终生的医保,比北方某些工人强——但奴隶不能对事情做决策。只有自由人,因为要管理奴隶,要为自己的生活做主,要对公共事务发表意见,才需要做决策。
博雅之学的本意是决策之学。
严肃文学可以让人学会体察他人的感受,了解真实世界中不同类型人的生活。逻辑可以让人学会推理和辩论。文法修辞可以让人学会怎么用语言争取别人的支持。历史可以让人学会借鉴前人的经验。数学可以让人学会取舍。天文学可以让人对世界的自然规律产生敬畏。这些学问不是什么用于打扮自己、被别人审美的“教养”,这些都是大人物办大事的实用技能!
所以博雅之学训练的不是什么“贵族品位”,而是真贵族,是社会的中流砥柱,是精英。
博雅之学,并不是告诉我们什么放诸四海而皆准的真理,而是提供一些寓言故事、名人典故和思维套路。你掌握的套路越多,办事的时候可供选择的思路就越多。至于遇到什么事应该用哪个套路去解决,这没有任何程序性固定办法,是一种艺术,只能自己选择。
比如说,如果你把经济学理论模型当成放诸四海皆准的真理,你什么事儿都不太可能干成。但是如果你把经济学理论当成仅供参考的寓言,你反而可能非常灵活地办成一些事情。
如果拿武侠小说打比方,那就是我们不能学那些只会本门武功——哪怕这个武功很厉害——而且还个性单一的配角。我们得学师从多位名家,招式复杂多变,性格也被女主角认为是捉摸不定的男主角。面对一个问题,你可以把它当成经济学问题,但你也可以把它当成政治问题,甚至物理问题。我们就如同使用武功一样不断尝试各种招法,一招不成再来一招。理论不好使不能怨老师教错了,只能怪自己会的招太少。
简单打不过复杂。只有复杂的人才能打败复杂。
想要学会这样的本事,就得读书。
6. 本书
这不是一本学术著作,不是一本教材,也不是一本完备的行动指南。我既不可能在书中完整地介绍所有有用的知识,也不打算列举这些知识的目录。我还不能保证书中说的理论都是对的,理查德·费曼有句话说,(物理学)理论进展之快常常超过书籍出版的速度。
我能保证的是书中所有内容都是有趣的。“有趣”其实是个特别高级的标准,为了达到这一点我付出了艰苦的努力。这本书的任务是给读者带来启发。如果现代世界的智识是我们追求的月亮,这本书是指向月亮的手指。
本书的第一部分“世界观祛魅”,试图向读者介绍一个跟传统看法不太一样的世界。网上的青年经常说什么东西能“改变我的三观”,而学者们对此有个格调稍微高一点的说法,叫作“budge my priors”——直译差不多是“使我心目中对世界的基本假设稍微移动了一下”。 常识是我们的敌人。社会上人们对一些常见问题的主流看法,很可能是错的。我期待这部分的内容能让你对世界的基本假设稍微移动一下。
第二部分“流水线时代的英雄”,重点谈教育问题,尤其是中国教育。我认为当前人们讨论教育根本没说到点子上——现代教育制度的本质不是什么培养有用人才,而是把人分类,让阶级分层。对这个问题你想得越明白,内心就会越难受。但是最后我会给一个光明结局,说说英雄是怎么突破教育和阶层的局限的。我还会提出一个基于大数据、自由意志、人工智能、信息论和供给派经济学的英雄定义。英雄的存在,可能是复杂世界的一大好处。
第三部分“智识分子的十八般武艺”,讲几个当前学界流行的观察世界的角度和解释世界的方法。这些方法有心理学的也有物理学的,有软的也有硬的,有大的也有小的,绝对不带门户之见。将来遇到一些一般人对付不了的问题,把这些武艺啪啪啪抖落出来,也许真能破解一二。
第四部分“未来,已经到来”展望未来,而且是迫在眉睫的未来。为了在人工智能时代保持人的创造性优势,我们需要新的工作策略,新的组织管理方式,和新的社会形态。这些策略、方式和形态,并不是什么科幻推理,而是早就已经发生了,甚至已经发生了好多年,只不过我们没有注意到。
科学家的职业病是希望什么好东西都是自己第一个发现的,然而这本书涉及的所有严肃理论都是别人的研究——我自己的研究,磁约束受控核聚变等离子体模拟,还不够符合这本书“有趣”的标准。但是我能追求这个:书中有些思想,是我第一个告诉中国读者的!
[1]
这个研究和后面说的英国的研究,都见于 Brink Lindsey, Human Capitalism 一书。
[2]
此书已有中文版,英文版书名是What Intelligence Tests Miss: The Psychology of Rational Thought。
[3]
此事见于Randy Olson,Don't Be Such a Scientist: Talking Substance in an Age of Style一书。
[4]
这个数学家叫Jordan Ellenberg,他写的一本书,How Not to Be Wrong: The Power of Mathematical Thinking 提到了此事。
[5]
截图见@捣蛋之父-Milgram 的微博 http://weibo.com/1777921765/Cz7Jtkp8w
[6]
此书已有中文版,英文版书名是Expert Political Judgment: How Good Is It? How Can We Know?“狐狸与刺猬”这个比喻最早出自哲学家以赛亚·柏林(Isaiah Berlin)。
[7]
顺便说一句,现在没有哪个外国友人拿“世界文学名著”当谈资,你还不如聊聊科技和政治。
[8]
事实上,经济学家Ariel Rubinstein有本书就叫《经济学寓言》(Economic Fables),特别强调经济学理论的局限性,认为最好把这些理论当寓言用。
PART Ⅰ
世界观祛魅
很庆幸,我们生活在一个受限制的世界。这个世界有很多好东西,是人人都想要,但是未必能得到的。想要得到这样的东西,你必须付出代价。
别用“常识”理解复杂世界
如果一个物理学家谈物理,哪怕他只是用大家都能听懂的语言做科普,外行一般也不太敢提出质疑。人们知道物理学是一个非常专业的尖端科学,没经过多年训练的人胡乱说话只能闹笑话。可是当一个社会学家谈论社会问题的时候,哪怕他旁征博引了好多东西方先贤的经典理论,别人还是可以毫无压力地批评他。不管专家怎么说,每一个出租车司机都认为自己知道汽油涨价是怎么回事儿,每一个网友都认为反腐败的出路是明摆着的,每一个球迷都认为如果从来没搞过足球的蔡振华能当足协主席,那么我也能当。
这也许怪不得大众。实践表明,像政治学这样的软科学,其“专家”的实用程度很可能并不显著高于“砖家”。
1984年,美国心理学家飞利浦·泰特洛克(Philip Tetlock)做了一个影响深远的研究。他调查了284个专门以预测政治经济趋势为职业的政治学家、智囊和外交官,向他们提出各种预测问题,比如戈尔巴乔夫有没有可能被政变搞下台。
泰特洛克要求专家们对其中大多数问题,比如某个国家未来的政治自由状况,提供出现三种可能性(保持现状,加强或者减弱)的大致概率。这个研究做了二十年,一直等到当年预测的事情全部水落石出。到2003年,泰特洛克总结了这些专家给的答案,发现他们的总成绩还不如索性把每个问题的三种可能性都均等地设为33%。也就是说,专家的预测水平还比不上直接抛硬币。更有讽刺意味的是,这些专家对自己专业领域的预测得分居然比在自己专业外领域更差。
所以《纽约人》杂志在评论泰特洛克描写自己此项研究的《狐狸与刺猬:专家的政治判断》(Expert Political Judgement: How Good Is It? How Can We Know?)这本书的时候对专家相当悲观,最后得出的结论居然是我们还是自己思考算了——尽管泰特洛克的研究显示专家的得分其实还是比普通人略高一点。
但社会科学并非无路可走,它可能正处在一个大发展的前夜。哥伦比亚大学Duncan Watts的新书《什么都是显然的:如果你知道答案的话》(Everything Is Obvious: Once You Know the Answer)提出,社会科学的发展方向应该是像硬科学一样,依靠实验和数据。传统专家的预测之所以不行,是因为他们依赖的很多直观“常识”,其实是一厢情愿的想当然。事实上,哪怕一个最简陋的统计模型,也能比专家预测得更好。
Watts的这个说法当然并不新鲜,已经有越来越多的人呼吁把数理方法作为社会科学研究的主要方法,而且这个方法也的确正在成为主流,现在大概已经很少有人在论文里拿一百年前的所谓经典说事了。此书的最大新意在于,因为Watts同时在雅虎研究院研究社交网络,他在书中描述了几个其本人参与的有趣研究。
谈起社交网络,中国读者会立即想到格拉德维尔(Malcolm Gladwell)的《引爆点》(The Tipping Point)。这本书提出,一件东西要想在人群中流行开来,需要某些特别有影响力的关键人物在其中推波助澜。这些关键人物是社交网络中的节点,是普罗大众中的意见领袖。正是因为他们的存在,我们才可能实现把地球上任意两个人用不多于六个人的社交关系网相互联系起来,也就是所谓“六度分隔”。
根据这个理论,扩大知名度的最好办法是找名人做广告。名人在微博上说一句话,应该比普通人的“口碑”重要得多。有传闻说,现在中国有百万粉丝的名人发一条营销微博可以获得一千元,其实这个数字还算是少的。美国女星Kim Kardashian一条tweet(用户发到Twitter上的信息)的价格是一万美元。
“关键人物”理论完美符合人们的思维常识。我们总是强调伟人对历史的推动,强调“一小撮”坏分子对社会秩序的破坏,强调明星对时尚潮流的引领。问题是,这个理论没有获得大规模统计实验的支持。
在现实生活中统计影响力非常困难,因为我们很难测量一个人是被谁影响的。现在微博客Twitter的出现给这种测量提供了可能。
Twitter的一个特别有利于研究的特点是,如果用户分享一个网址,这个网址的URL会被缩短,自动形成一个唯一的代码。通过跟踪这些短代码,Watts与合作者就可以分析信息如何在Twitter上扩散传播。具体来说,就是如果有人发布了这么一条代码,而他的一个“粉丝”如果转发这条代码的话,那么这次转发就可以被视为一次可观测的影响。广告商的愿望,是希望信息能够这样被一层接一层的转发传播开来,形成所谓“Twitter瀑布”。
然而通过分析2009年两个月之内160万用户的七千四百万条信息链,研究人员发现98%的信息根本就没有被推广传播。在这千万条信息中只有几十条被转发超过千次,而转发次数达到万次以上的只有一两条!我们平时看到的那些被反复转发的消息其实是特例中的特例。由此可见,想要通过发一两条热门微博成名,就好像买彩票中头奖一样困难。
那么名人的影响力到底怎么样呢?Watts等人使用了一个巧妙办法。他们使用统计模型,根据第一个月的数据把那些粉丝众多,并且成功引发了Twitter瀑布的“关键人物”挑出来,然后看他们在第二个月中的表现。结果相当出人意料:这些人在第二个月再次引发瀑布的可能性相当的随机。平均而言,“名人”的确比一般人更容易导致一条消息被广泛传播,但这个能力的实际效果起伏极大,一点都不可靠。也许最好的营销方式不是拿大价钱请少数名人,而是批量雇用有一般影响力的人。
如果一个东西突然流行开来,我们的常识思维总是以为这个东西一定有特别出类拔萃之处,或者就是其幕后一定有推手。但Twitter上的研究表明,所谓幕后推手其实并没有那么厉害。那么为什么某些书能够畅销,某些电影能够卖座,某些音乐能够上榜呢?完全是因为它们出类拔萃吗?Watts参与的另一项研究表明,成功很可能主要是因为……运气。
这是一个相当有名的实验。实验者创办了一个叫作Music Lab的网站,在几周之内招募到一万四千名受试者来给48首歌曲评分,如果他们愿意,也可以下载其中的歌曲。有些受试者的评分是完全独立的,他们只能看到歌曲的名字。而其余受试者则被分为八个组,他们可以看到每首歌被自己所在组的其他受试者下载的次数 ——他们可能会设想被下载次数越多的歌曲越好听,这样一来他们打分就会受到社会影响的左右。
实验表明那些好歌,也就是在独立组获得高分的歌曲,在社会影响组也是好歌,而且其流行程度比在独立组更高;而坏歌在社会影响组的表现也更差。所以当听众能够被彼此的选择影响的时候,流行的东西就会变得更加流行,出现胜者通吃的局面。
然而这个实验最重要的结果是,具体哪首歌能够登上排行榜的最前列,则是非常偶然的事件。有些歌曲可能会因为实验初期纯粹因为运气好获得更多下载次数,后来的受试者受这个影响就会以为这首歌好听,以至于给予它更多的关注,形成正反馈。最初的运气很大程度上决定了最后谁能脱颖而出。在独立组仅获得第26名的一首歌,在一个社会影响组居然排第一,而在另一个社会影响组则排第14名。尽管特别不好的歌肯定不能流行,但好歌想要流行还是需要很大的运气成分。总体来说,独立组排名前五的歌曲只有50%的可能性在社会影响组也进前五。
对能够互相影响的一群人,不能以常理度之。撒切尔夫人曾经说:“根本就没有社会这种东西。只有作为个人的男人和女人,以及他们的家庭。”可是你不能用研究一个人的办法来研究一群人。就算你能理解这群人中的每个人,你也未必能理解把这群人放在一起会发生什么。他们之间的社交网络结构,会导致一些非常偶然的事情发生,这些事情无法用任何常识去预测。一般人的历史观总是有意无意地把一个集团,比如说清廷,想象成一个有思想有行动的个人,好像辛亥革命就是清廷、孙中山和袁世凯三个人之间的事一样。这样的理论无法解释为什么孙黄数次起义数次失败,最后居然在一个完全想不到的时机成功了。
我们生活在一个彼此互相影响的社会。我们想起来去听一首歌,也许只不过因为朋友的推荐。我们想起来去看某个电影,也许只不过因为我们恰好在微博上“粉”了某人。旭日阳刚可能的确唱得不错,但在某个平行宇宙里他们将不会登上春晚舞台。如果历史重演一遍,芙蓉姐姐、周迅甚至李谷一都未必能成名,《哈利·波特》的第一集未必能获得出版,蒙娜丽莎不会是全世界有史以来最有名的画作。我们总是习惯于把事情的成败归结为人的素质,归结为领袖人物,甚至归结为阴谋论,好像什么都是注定的一样,而事实却是很多事情只不过是偶然而已。
常识只是特别善于在事后“解释”事件,这种解释根本谈不上真正的理解。十月革命爆发了,我们就说俄国局势导致革命必然要爆发,可是革命之前有谁能这么肯定呢?中国女篮以三分优势击败韩国队取得2012年的奥运参赛权,赛后总结自然全是成功经验,可是如果中国队最后两个球偶然没投进,媒体上必然又全是失败的反思。我们看这些事后的经验总结或者反思,总是觉得它们说的都挺有道理,简直是常识。专家们也正是根据这些道理去预测未来。可是事先你怎么能知道这些完全相反的道理哪个会起作用呢?
再比如,如果有人说来自农村的士兵会比城市士兵更适合部队生活,读者很可能会认为这是显然的——农村本来条件就比较艰苦,需要更多的体力劳动,所以农村士兵肯定更能适应部队。然而据社会学家Paul Lazarsfeld对二战期间美军的调查,事实恰恰相反。其实是城市士兵更适应部队生活,因为他们更习惯于拥挤、合作、命令、严格的衣着规定和社会礼仪。这两方面的常识看上去都有道理,在没有统计的情况下我们根本不知道哪个更重要。这就是为什么不做调查研究就没有发言权。
要想从复杂的随机事件中看到真正的规律,最好的办法是像搞自然科学一样进行大规模的重复实验。如果中国女篮跟韩国队在同样的条件下打100次能赢95次,我们就可以确信中国队强于韩国队。如果一首歌能在每一个社会影响组都进前五名,我们就可以确信这首歌的确出众。然而历史不能重复,我们不知道最后发生的结局是不是一个小概率事件,但我们却总能用“常识”给这个结局一个解释!像这样的解释如果用于预测未来,甚至制订计划,怎么可能不失败呢?
一个更实用的历史观是放弃“一切都是注定的”这个思想,把历史事件当成众多可能性中的一种,把未来当成一个概率分布,然后尽可能地使用统计方法,通过历史数据去计算未来事件的概率。与其追求用各种想当然的常识指导未来,不如把历史当做一个数据库,从中发掘统计规律。
搞自然科学的科学家经常认为社会科学更简单。如果你看那些社会科学的论文,会发现其中逻辑通俗易懂,结论往往也是显然的。物理学经常能得出一些违反直觉而又绝对正确的结论,然而社会科学中常识却总能大行其道。现在这种局面正在改观,自然科学的方法正在被引进到社会科学中去。但这个过程并不容易。亨廷顿曾经在某项研究中颇有科学精神地写道“62个国家的社会挫折和不稳定之间的相关系数是0.5”,然后一个数学教授跳出来说这纯属胡扯,“亨廷顿是怎么测量社会挫折的?难道他有一个社会挫折表吗?”其实像这样的批评也许只不过说明社会科学比自然科学更难做。
在没有互联网的年代想要找几万人做歌曲评分实验,或者分析成百上千万的社交网络和信息传播,都是根本不可能的事情。现在有了互联网,社会科学终于可以带给我们一些“不显然”的研究结果了。所以社会学家已经在使用新方法搞科研,遗憾的是实用专家们仍然停留在过去的理论上。一个原因也许是统计方法还没有来得及作出更多有实用价值的判断。但不论如何,正如Watts所说,现在社会科学已经有了自己的天文望远镜,就等开普勒出来总结行星运动三大定律了。
* * *
两点补充说明:
1. 我曾经在《分析 Facebook 上的两场捐款战》一文中使用过“关键人物理论”,并且以此对比中国用户的捐款数据,得出结论是中国用户对网络的使用习惯还停留在论坛时代。而当时数据的确显示有些人是有一定的影响力的。现在看来这两篇文章似乎有点矛盾,但数据也许并不矛盾。“影响力”肯定是存在的,但也许并没有人们事先设想的那么强。另一方面,这个捐款“实验”也可以作为对本文提到的url转发统计的一个很好的补充。
2. 我觉得新浪微博可能比Twitter更容易用来进行社交网络研究。首先转发次数是明摆着的,其次也许用户量更大,另外新浪这种明星体制也许会导致整个网络结构跟Twitter很不同。不论如何,希望能看到有人对新浪微博进行类似的大规模统计分析。