我们说过,算法是解题思路,好的算法,可以节省时间和资源。但它最终决定的是效率,而不是准确率。决定系统推荐准确率的,是数据量。数据量越大,样本量越大,机器接受的训练量越多,最终做出的预测就会越准确。以Farecast为例,一开始这家公司预测的准确率并不是特别高,但到2012年时,公司积累了近10亿条价格纪录,其预测准确度就已经上升到了75%,平均每张机票可以节省50美元。
TikTok的先发优势,确保了公司对其他竞争对手保持着数据量级上的碾压。不管是Facebook,还是腾讯,巨头们的“钞”能力在绝对的数据量面前,都毫无疑问地失效了。即便是有完全相同的一套算法,包装成为另一个App和它竞争,也不可能达到同等的准确度。这就像练武,算法是见招拆招的武功招式,数据是经年累月的内功修炼。就算招式练给你看,内力不够深厚,你也发挥不出效果。自2012年至今,这套算法系统不断更新,字节跳动就像一个从出生起就不断修炼上乘内功的人,骨骼清奇,筋脉健壮,后天修炼的人很难追上它的进度。
有朝一日,骨骼清奇的你去参加天下武林大会,前武林盟主发现你天赋异禀,再这样下去可能要威胁他的盟主之位,于是决定防患于未然,想要挑断你的手筋脚筋,废你武功。但又看了一会,他发现你这武功玄妙,废了可惜,于是决定做一回“丁春秋”,用吸星大法,把你毕生所学都给吸到他自己身上。再不济,至少给你种个生死符,不管你武功多高,最后都要听命于他——这就是特朗普。有幸的是,字节跳动有一个足够强硬的师门,最终如何尚未可知。
如果说数据是这个时代的石油,那么以TikTok的受欢迎程度,抢走这家公司,就等于掌握了一条连接着全世界油田的输油管道。有幸的是,过去多年间,中国科学家和软件工程师们通过智慧和努力,让这个管道现在掌握在我们自己的手里,不像半导体芯片和光刻机。2000年,微软研究中心的米歇尔和埃里克,为了改进Word中的语法检查功能,做了一项试验。他们首先选定了4种常见的算法。
一开始:A算法表现最差,准确率只有75%;B算法表现最好,准确率达到了86%;最佳和最差之间相差11%。接着他们开始给这些算法添加数据量。当数据量从500万个单词,提升到10亿个单词的时候,情况发生了彻底反转。A算法一跃成为最佳算法,准确率提升到了95%以上;B算法成为表现最差算法,但准确率也已经提升到了94%;最佳和最差之间相差只有1%。
这个试验结果意味着:即便算法不是最好的,只要我有压倒性的数据量,也可以在最终的准确率上和对手齐平。而刚好,我们的算法不弱,在数据量方面,还有着得天独厚的优势。以2015年来说,我们每天可以从互联网上爬取到的中文内容的吞吐量,大约是600万条(图文),美国大约是200万条/天,全欧共计50万~60万条/天,印度共计50万~60万条/天。这意味着,一天中文内容的训练量,就超过了全球其他所有地区的总和。领先如此之多的“训练量”,要是放在热血漫画里,俗称:努力。
不同的是,动漫男主们的出身无论如何都不可能由自己决定;一个企业的起点,却可以由领先于时代的前瞻性思维所决定。乔布斯构建苹果产品矩阵的时候,核心的理念就是“数字中枢”,从iPod到iPhone,再到iPad,更像是一种产品上的迭代。iPod可以过时,但基于这个理念很快就有了iPhone,每一个开创时代的现象级产品,背后都是一个领先时代的理念在支撑。欣慰的是,中国的企业也在努力用下一个时代的方式思考,做下一个时代的产品。比如华为鸿蒙,它做系统的逻辑就不是移动互联网的逻辑,而是物联网时代的逻辑。
你围追堵截,我可另辟蹊径;你废我武功,或许我不破不立。科技没有国界,但科学家有。我们不惧开放,但封锁也未尝不是我们的好机会。
扩展阅读
在关于互联网产业历史的书籍中,笔者首先推荐吴军博士的《浪潮之巅》。这本书是许多高校商学院和计算机学院的参考书,甚至是教科书。作者本身是著名的自然语言处理和搜索专家,也是硅谷风险投资人,具有很扎实的理论基础和成熟的产业视角,对科技公司发展壮大过程中风险投资、银行、产业规律各自扮演的角色有系统性的论述,对于了解互联网产业的历史和建立系统的产业分析框架很有价值。
此外,中央电视台2014年出品的10集大型电视纪录片《互联网时代》也很值得一看。制作组深入全球14个国家数十家大型跨国公司和科研机构进行采访,留下了与互联网各界近200位重量级专家学者们交流的珍贵采访和影像资料,对系统理解和分析互联网如何改变人类社会有很好的参考价值。
如果具体到中国互联网产业发展的历史和关键人物,笔者推荐林军的《沸腾十五年:中国互联网1995—2009》和其续作《沸腾新十年:移动互联网丛林里的勇敢穿越者》,这一系列作品记录了包括马化腾、丁磊、张朝阳、马云、李彦宏、王志东、史玉柱、雷军、周鸿祎等一系列中国互联网早期创业者的故事。另一本《人民日报》记者郭万盛所著的《奔腾年代:互联网与中国:1995—2018》,则比较关注一些网络公共事件对监管和社会的影响,可以作为细节补充参考。
如果想要了解大数据对社会基础逻辑的改变,笔者推荐美国学者维克托·迈尔·舍恩伯格的《大数据时代》。作者是大数据系统研究的开山鼻祖之一,也是大数据商业应用的引路人。这本书的理论基础和案例资料都十分扎实,是难得生动易读的专业著作。
在关于国内互联网大公司的传记当中,笔者推荐吴晓波写的《腾讯传》,作者走访了大量腾讯公司的高管,还原了腾讯发展过程当中的一些关键节点,探讨了这家公司崛起过程当中一些独特的时代背景,值得一读。
李志刚写的两本互联网企业的传记《创京东》和《九败一胜》,也是难得的佳作。李志刚的书,采访很扎实,写作细致,这两本书分别讲的是京东和美团的故事,尤其是对刘强东和王兴两位优秀的互联网创业者的人生经历有很详细的记录,很值得一看。
关于阿里巴巴的图书很多,这边我们推荐阿里前高管语嫣写的《生长》一书,这是一本为阿里巴巴“正本清源”的书。市场上有不少以阿里巴巴为主题的图书,但唯有这本《生长》才能被称为“真经”。语嫣是阿里合伙人级别高管,她在阿里工作18年之久,曾经担任过淘宝商城、口碑网、聚划算等重要子公司的总经理,亲历了淘宝网从0到10的整个发展阶段,有她这样背景且写书的阿里人除了曾鸣教授以外只有她一个。所以如果要学习原汁原味的阿里案例,《生长》绝对是不二之选。
差不多10年前,我和一个上海的小团一起去韩国旅游了一周。
见多识广的上海人对于各种小众品牌如数家珍,他们对于同类商品在韩国免税店的价格与上海恒隆广场的售价差额倒背如流,在他们的带领下,我们整个团里的人,迅速从韩国的免税店和百货商场里面找到了意大利产的服装、法国产的皮包、丹麦和芬兰产的小众配饰、美国和日本公司出品的电子产品、韩国本地的食品……大家互相借着护照,在韩国的免税店里面蹭着各种仅限一人购买的购物福利。
等到回国的时候,团里面几乎所有人的行李箱都塞得满满当当,好几个人为此专门购买了全新的rimova牌子的旅行箱,两位上海中年妇女在机场露出极为得意的笑容,说道:“这次真是买爽了。”还有一位刚刚当了父亲的中年男士,足足买了几十罐进口奶粉,这些东西价值不算高但是极为沉重,我就这样看着他凭借一己之力把这几十罐奶粉费力地搬到机场……
这可能是当时大多数中国人出国旅游时的典型场景,因为长期的物质匮乏,且中国产品相对于国外产品长期处于价值链中低端,所以中国人一有出国机会,就会疯狂购买进口商品,或者购买那些原本是中国产的国外牌子的产品,因为税务成本更低。
服装、箱包、化妆品、食品、家具、酒这些消费品的国产替代,是看起来最容易从技术上攻克,但是又最难以真正实现国产替代的一项。因为消费品的最大门槛在于品牌形象如何占据消费者心智,在这方面,那些早早占据高端市场的国外品牌,对于中国企业来说有着巨大的优势。
在很长一段时间里面,“日本、德国、美国的牌子品质就是好”“用国外的消费品就是有档次的表现”,是很多中国人的潜意识观点。
这个现象并非偶然。日本学者三浦展在其畅销书《第四消费时代》中曾经详细论述了日本也曾出现过类似的现象。在日本经济快速发展的20世纪七八十年代,日本人同样疯狂追逐着国外品牌的商品,热衷于LV的包、杰尼亚的西装、奔驰和宝马的汽车、香奈儿的香水,最高峰的时候日本人曾经占据全球消费品购物40%的份额,就像今天的中国一样。
然而随着日本社会的发展,日本社会开始迅速进入以无印良品、优衣库这些极简风、售价低廉的本土消费品主导的时代。
中国的情况比日本要复杂得多,中国的上海、深圳、北京这些发达城市,其经济发展水平和消费观念,已经越来越接近于欧美、日韩等发达地区,而中国广大的内陆地区的人民,经济水平和消费观念还只相当于20世纪六七十年代的日本。到2022年前后,中国广义的中产阶级人数,就已经突破4亿人,仅这部分人群的市场容量,都是相当惊人的。
中国巨大的国内消费市场,以及多层次的消费人群分布,给中国消费品的国产替代留下了巨大的发展空间。这些年来,新消费、新国货开始成为一股新的创业浪潮,一大批新国货品牌迅速发展壮大。
我们纯粹从投资和财务报表上来看,消费品产业也许是比大多数高科技产业更好的生意。以可口可乐和百事可乐为例,这种碳酸饮料生意被乔布斯蔑称为“卖糖水”,但是这种卖糖水的生意却是实实在在的好生意。表面上看起来,像台积电、三星这样的高科技公司的净利润每年通常高达数百万美元,但是这些公司的现金流通常都很差,因为它们每年需要迅速把赚来的钱用于研发、买设备、扩建新工厂,且在高度不确定的技术迭代当中,任何一次技术变革对于这类公司来说,可能都是灾难性的,例如摩托罗拉和诺基亚就在智能手机的技术变革当中轰然倒下。而可口可乐这种公司,其最值钱的资产是其在消费者心智当中建立起的品牌形象,这类公司的现金流情况往往非常好。可口可乐的CEO曾经形象地这样描述:假设明天全世界的可口可乐工厂全部着火,他们也可以迅速在第二天重建企业。
从这个角度来说,一个经济高度发达的国家,也一定需要实现主要消费品的国产替代。在这一点上,我们的邻国日本是非常值得我们研究和学习的,日本本土消费品公司开发出了大量适合日本国民消费的产品,例如三得利啤酒、明治奶粉、资生堂化妆品、力保健和宝矿力水特功能饮料、美津浓和亚瑟士运动鞋等。
也许在不久的将来,中国人会不再热衷于花大价钱购买进口消费品,而会产生中国的可口可乐、中国的雅诗兰黛、中国的耐克、中国的卡夫、中国的惠氏、中国的宜家、中国的三得利……