吕振羽小心翼翼地问:“什么条件?”
“我要参与开发。”路音说,“我知道这个东西很专业,纯粹的专亚方面,无论是编程还是语言学,我都帮不上忙。不过这个项目肯定是个大项目,你一个人肯定打不下来。我希望我能负责项目管理的方面,算是给你打个下手。”
吕振羽说:“那应该没问题,具体的事情,我们另外约时间详细谈吧。你先把均儿和她父亲搞定了再说。”
“好的。”
7.超级家教
在同学会上,和班长路音的一番谈话,让吕振羽颇为振奋,路音说去搞定,一般来说,至少有8成把握。路音和均儿可是关系很铁的朋友,哪怕看在朋友的面子上,均儿的父亲也会帮这个忙,何况这个忙并不需要他太多的时间,主要是需要他帮忙将一些语言学的问题解释清楚,让吕振羽有下手的地方。
不过,无论如何,现在的吕振羽首要要考虑的,仍然是钱的问题。10月6日晚上,勤助中心打了电话来,告诉他让他第二天上午去一个地址报道,一个高二的女生,要补习英语,数学,物理。3门课,每次3个小时,每个小时50块钱。
在国庆的几天里,吕振羽已经准备了相当丰富的教案。小羽在网上将和高中阶段有关的文档都集中了起来,其中有不少是一些特级教师制作的电子课件,那些东西给了吕振羽很多启示。不过,吕振羽并没有模仿任何现有教案的意思,简单地说,如果学生在课堂上听那那些老师那套能听得进去,那还要请家教作什么?家教不应该纯粹把课堂上的东西给学生重复讲,那样效果很差,而是应该用其他方式让学生觉得这些东西有趣。和学生之间只有很小的年龄差距,这应该是家教的优势才对。
第二天早上,吕振羽按时到达了地址上标注的地方。那是一个颇为高档的小区,整个小区如同一个大花园,几幢小高层错杂其间,居住密度很低,相应的,房价自然高得离谱。吕振羽在楼下按了门铃后,可视门铃另一头不久后就出现了一个颇为严肃的中年人的形象。
“您好,我是HS大学的学生,今天来家教的。”
“哦。”中年人打开了门。
到了顶楼11楼,吕振羽进入了1101,客厅里,只有刚才看到的那个中年人坐在沙发上。
“您好。”吕振羽打了招呼。
“请进来吧。”整个房间的装修简洁明快,色彩非常素净,客厅里,一整面墙是书柜和电视柜组合起来的储物单元,书柜上密密麻麻放满了书,现在,在一般人家里,能有那么多书的并不多。中年人说;“你先坐,请随意。我女儿还没起床,要你稍微等一下了。”
“没关系。”虽然这种情况并不多见,但吕振羽还是很客气。毕竟现在才8点,一个小女孩子在假日里要睡懒觉实在是很正常。
中年人给吕振羽泡了杯茶后,就去卧室叫醒女儿了。吕振羽则好奇地看着书架上的各类书籍。
中年人回到了沙发边上,问道:“有什么发现吗?你好像对我的书架很好奇。”
“您是从事人力资源方面的工作的吗?”吕振羽瞄了一眼中年人,发现他很好奇的样子,索性说出了自己的猜测。
“你是怎么看出来的。还真的让你说对了。”
“您看,茶几上这本书,《组织行为学》,虽然是法语,但简单的法语我还是懂一点的。书架上整整一排都是人力资源相关的书,《人力资源管理》居然有2个版本的中文译本,还有个原文影印本。如果不是从事这方面的工作,那就是您对这个领域有非常大的兴趣。”
“老爸,你请的是私人侦探还是家庭教师?”一个悦耳的声音从房间的另一侧传来,兀自带着几分刚刚迷糊。吕振羽看到这个将成为他的学生的少女,也不由得愣了一下,水蓝色无袖紧身上衣,黑色的短裤将少女的曲线勾勒了出来,手臂和腿,都呈现出健康的象牙色,秀丽的容貌因为一头短发而显得英气勃勃。
“这是我的女儿,苏宛。”中年人开心地给吕振羽介绍到。
“这就是我的又一个家庭教师?”苏宛特别加重了“又一个”这三个字,这种态度显然称不上友好。
“对。因为你好像在三门主课上都无法胜任。”吕振羽回敬道。
中年人显然很满意吕振羽的反应,说:“那你们去餐厅吧,就用餐桌上课。”
“好的,苏先生。”
苏宛将文具摊了一桌子之后,问:“那么,老师,从哪里开始?”
“我想先看看你的基础水准。”吕振羽拿出一叠纸,那是一套结合了心理学要素的测试题。通过这套题目,吕振羽就能够大致把握苏宛的性格走向,和现在的学识水平,“给你20分钟吧。”
苏宛虽然并不喜欢这个家教,但还是很听话地接过那几页东西,开始做了起来。苏宛并不是不想好好学习,只是老师上课讲的东西,课后立刻就忘记,自己都不知道怎么回事。家里给她请家教也不是一次两次了,几乎不停地在换家教,她的父亲,著名猎头公司眯插el Page的大中国区执行总裁苏云海又总是不自觉地将面试经理人的方法用在给她挑家教上,以至于能得到他们父女俩人同时认可的人,到现在还没有出现。
苏宛愁眉苦脸地做题目。吕振羽带来的这些题目里,第一页是一些图形和文字判断题,对心理测试那套非常熟悉的苏宛从中看到了心理测试题的痕迹,但这套题目却是她从来没见过的,而后,则是一些英语,数学,物理方面的题目。数学和物理都不难,没有一道是需要很繁琐的运算的,甚至大部分的题目只要求列出方程,根本不要求求解。只有英语,稍微有那么点难度。
苏宛作了一半的时候,苏云海走到了一边,很好奇地拿起苏宛已经作完的题目看了看,又放下,光是看了第一页的心理题,苏云海就对这个叫吕振羽的小伙子非常有好感。现在,人力资源方面的工作和心理学有密切的联系,苏云海就很精通性格测试那一套,他看出来了,这些图形和文字的判断题,起的就是这么一个作用。仅仅因为当家教而准备这套东西,就足以证明吕振羽是非常用心的。苏云海放下了题目,自顾自地去做自己的事情去了。既然吕振羽那么认真,那应该会将自己的女儿教好吧,苏云海心里,这样揣测,虽然最后还是要看苏宛是不是能接受吕振羽的那一套,但苏云海仍然能觉得,这一次,可能不再需要再找家教了。
20分钟后,苏宛额头上已经冒出了细密的汗珠,她终于在规定时间内完成了所有的题目。虽然题目都不难,但用心都很巧,非常讲究解题的思路。吕振羽扫了一眼几张答卷,说:“你的基础很不错啊,为什么还要找家教?家教的要求说是加强高二阶段的内容,问题是我这里不少题目已经高三阶段了阿。”
“我们学校加快了一些,老师给我们补充过一些东西。”
“那数学和物理方面,今天我的准备就不是很充分了。这样吧,今天全都给你讲英语。怎么样?”
“好啊,没意见。”
马上,苏宛就喜欢上了吕振羽讲课的方式,同样是解释词汇和语法,吕振羽没有一个例句是用原来课本上的,而是全都从流行的英语歌曲,电视剧,电影里找出歌词和对白,好像那些电影全都装在他的脑子里。引用歌词的时候,不管谁的歌,吕振羽都能哼唱出来,而引用电影台词的时候,吕振羽则一人分饰几个角色,将台词念得惟妙惟肖,然后再解释上下文和语境。歌曲虽然未必都听过,但大部分的歌手的名字总还是有所涉猎,电影虽然未必全斗看过,但绝大部分引用自经典电影的台词,总是让苏宛回想起自己当时看着字幕看过的那些情节,所有的词汇语法,就这样不知不觉之间被解释了个通透。苏宛也不禁觉得,这个老师实在是太有趣了。
而老海龟苏云海则更是惊讶不已,吕振羽那份将所有的歌曲与电影作为教学资源信手拈来的从容已经相当惊人了,而这些非常时尚的东西自然能让小姑娘苏宛听得乐呵呵的。更让苏云海惊讶的是,吕振羽在模仿电影的时候,不仅仅是念出台词,更是将英语地区的各种口音都模仿得惟妙惟肖,这是哪怕那些英语母语国家的人都很难做到的。
补课从8点半一直持续到11点半,吕振羽很有职业道德地将开始让苏宛作题目的时间刨去了。苏云海热情地将吕振羽送到楼下,让苏云海没有想到的是,吕振羽略略有点不好意思地说:“苏先生,有一件事情很不好意思,能不能告诉你的女儿,下次能否不要穿得那么清凉。我知道我应该为人师表,但是,说实话,在这方面我很业余。”然后,吕振羽就告辞了。
苏云海回到楼上后,苏宛好奇地问:“老爸,吕老师跟你说什么?”
“他说你穿太少了,他看得都快流鼻血了。”苏云海笑着说。
“胡说,哪有你这么当老爸的。”
“真的。他自己说他定力有限的。”苏云海呵呵笑着,有人觉得他的女儿有魅力,这个当父亲的自然很自豪,而吕振羽居然当面说这件事,更是让苏云海觉得有趣。“不过,宛宛,你觉得这个老师怎么样啊。”
“他太厉害了。他说的我居然全记住了。”
“仅仅凭他的英语能力,如果现在去找个翻译的工作,至少是5000以上月薪的级别,呵呵,给你当老师实在是大材小用阿。”
8.质疑
吕振羽可没有想到自己会被如此高地评价。之后的几天里,他都一直忙着钻研语言学。
一直到10月12日,一个陌生的电话打到了他的手机上。
“你好。请问是吕振羽吗?”又是一个陌生的男性中年的声音。
“对。您是?”
“我是复旦大学中文系的方治强。我女儿的同学跟我说,你有一些语言学方面的问题需要解答。”
“是的。您是方悠均的父亲?”
“对,你也别您啊您的了,叫我一声伯父吧。”
“好的,伯父,我想和你当面谈谈,你什么时候方便?”
“现在我就在你们学校里,你到心中书社边上的那个茶室,我在那里等你。路音和均儿一会也会过来。”
“好的。”挂上了电话,吕振羽连忙出门了。
吕振羽赶到茶室的时候,路音和均儿都已经到了,一个头发有点花白的中年人带着一副式样极其古老的黑框眼镜。两个年轻女子和一个很有学术气质的中年人坐在一起,样子颇为奇怪。
“伯父,你好。路音,均儿,你们好。”问候之后,吕振羽坐了下来。
方治强没有多客套,直接问道:“这所大学的中文系也很强,为什么你不去找学校方面帮忙呢?”
吕振羽说:“首先,我只是个大一的学生,这个项目就算我上报给学校,没有任何人会相信我有能力做好这个项目。如果上报了,不知道有多少人会觉得我不自量力,是个疯子。但是,我自己知道,我有机会做好这个项目,虽然不是百分之百的把握,但我同样不是贸然提出这个项目的。其次,就算学校觉得这个项目不错,我也没有把握学校一定会让我来主导这个项目的走向,中文系的老师们姑且不论,就算我自己的系里,学院里,多少专家要指手画脚?而关键在于,他们越是指手画脚,这个项目失败的可能性就越大。最后一个原因,我自己已经有了核心技术,我没有为他人作嫁衣的打算。”
吕振羽说得很自信。方治强点了点头,问:“你所说的核心技术是什么呢?”
“人工智能。现在开发这样一个引擎,很关键的一个地方就在于智能判断,我手里有自己开发的人工智能核心,问题是我不知道怎么将这个核心用在关键的地方。”
“人工智能?你独立开发的?能让我看看吗?”方治强虽然是研究语言学的,但看得出来他的兴趣颇为广泛。而吕振羽的言辞,也已经引起了均儿和路音的兴趣。
吕振羽看到均儿脚边的笔记本包,问:“能用一下你的笔记本吗?”
均儿点了点头,在父亲的面前她显得无比乖巧,一点也没有在高中的时候,闻名遐迩的“小魔女”的样子了。她开机之后,将笔记本推到了吕振羽面前。
吕振羽从口袋里拿出优盘,将一段程序拷贝到了电脑上,输入了密码之后,运行起了程序,他解释道:“这是我这一阶段的成果,将智能核心和我能理解的一部分中文语法结合起来,编了个造句的程序。界面是临时写的,因为是自己的测试,也就没太在乎,在上面那个框输入要用来造句的词汇,下面的框里就会显示完整的句子,因为造句是个不可预期的随机过程,我在边上设了个按钮,对句子不满意可以更换。句型方面,目前只有陈述句,一般疑问句,特殊疑问句,祈使句和反问句我还没写进去。”
吕振羽的这段程序,其核心是从小羽的主程序中分离出来的一小段代码。这一小段代码的作用,比起现在已经有60g空间的小羽主体来说,具有的能力几乎可以忽略不计,但用在这样一个简单的智能程序里,却已经有杀鸡用牛刀的感觉了,仅仅这段代码,已经超越人工智能的国际领先水平很多了。这个被命名为“三年级”的小程序,造句的能力上差不多是能和三年级的小学生相比,只是不具备常识判断的能力,虽然造出的句子在语法上都没有任何问题,但有时候含义却很搞笑。这种造句,很想有些人喜欢玩的一个游戏,几个人,每人写一个句子的一个部分,然后随机组合起来,变成一堆搞笑材料之类的。
但是,方治强和路音,还有均儿则兴致勃勃地一遍又一遍地输入各种词汇,看下面的框里变幻出非常有趣的句子。
“这个东西要使真的让小学生拿到手,那就麻烦了,糊弄语文老师应该是没问题了。”方治强评论道。
“这个小程序的作用仅仅是检验一下我的阶段性成果而已,不会再有副本了。”
“其实,你能做到这个地步,已经是非常厉害了,你觉得我在什么地方能帮上你的忙?”
“伯父,市面上也有不少语音输入和语言输出的软件。语音输出就不提了,基本上是按照每个字的发音,连续生成而已,比较好的软件或许还有虚词的轻读,但语气语调方面都没有什么变化。而语音输入的问题更加复杂,一方面是对于语音的识别率,目前最好的还是几年前开发的viavoice,而且对于输入装置的要求也不低,而且,语音输入后,即时字词方面都没问题,断句,标点也都一塌糊涂,基本上,语音输入之后,还要靠人工改写一遍,效率比手打还要差。原来我觉得,通过了解一些语言学,可以找到解决这个问题的办法,但是,语言学实在是个很怪的学说,看的资料越多,反而越不知道该怎么下手了。”吕振羽说。
“这样说吧,从语言学的角度要解决这个识别的问题,这个大家都明白,我也参与过一个叫‘言语的产生、识别与编码’的项目。目前,所有的机器识别,都是基于字词和语音的,语法是一个从属的地位,因为汉语的语法和其他语种区别太大了,规律性并不明显,虽然按照西方的语法范式,能够总结出现代汉语使用的大部分规律,但是这并不足够。字词的语音识别,产生的素材,被语法模块排列组合起来。而标点符号,机器自己是无法添加的,因为没有断句的功能。这也就是基于语音的机器语言学。”
“那又没有什么解决方法呢?”吕振羽问。
“索绪尔在《普通语言学教程》里有一句话,声音脱离了书写符号,就只是一些模模糊糊的概念。但又有另外一句话,文字越是不表示它所应该表现的语言,人们把它当作基础的倾向就越是增强。这两句话有同一个核心,那就是文字,而位于文字两边的则是语音和语义。我想,现在主要的瓶颈在于,语言的识别智能停留在语音到文字的阶段,而从文字到语义,则需要一个人自己去进行操作。语义是一个很复杂的东西,凭着你现在掌握的这个人工智能,你肯定可以做出能比较好的理解语义,从而对文本进行修正的软件,你刚才也说了,你的这个造句程序,缺乏的就是常识层面的东西。如果加上这一块,对于语音辨识的判读是不是就完整了呢?也不是,因为这个常识本身就是有弹性的东西,很多不合乎常识的表达方式平时我们一直在用,你说那是修辞手法也可以,但我们平时都是能理解的,为什么?因为我们使用语言,无论文字形式还是语音形式,都是基于一个基本的使用环境,也就是所谓的语用。在语用的前提下,语义才会完整。”方治强的说法已经非常非常浅显,大部分的概念都没有解释,但中文的强大适应性也从这些名词上体现了出来,不需要解释,相信吕振羽也能够理解大致的含义,而在这个局面下,大致理解也就足够了。
吕振羽回味着方治强的话,反反复复地想着,突然说:“那是不是说,如果这样一个引擎能基于语义学和语用学来进行开发,然后结合语音识别现有的成果,就能够比较完善了?”
方治强赞赏地说:“说得对,只要你能做到。这并不容易。但只要你能将语用和语义的层面形成程序,语音方面的问题就是小问题了,什么语音流变什么的根本不用太当回事。”
9.最容易破解的难题
方治强知道,自己提出的这个方法是一个相对而言正确的方法。在语音识别方面,纯粹基于语音与结构语法的识别方式或许比较适用于英语法语德语之类的语言,因为那些语种的语法结构一直都是比较完善的,有一个经过数百年反复研究的语言研究成果为基础,比较容易进行语音识别方面的数字化。而中文则不是,中文的体系太复杂了文言文与现代汉语之间的断裂远远比英语中古英语与现代英语的区别来得剧烈。而日常使用中,哪怕是再现代的人,也会不自觉地使用一些古文中的字词句乃至语法,中学生在学古文的过程中最头痛的倒置,在日常使用中比比皆是,要怎么样才能建立一个相对完整的语法结构,才能匹配起语音识别后的处理呢?而从语义和语用出发,以智能程序为核心,以常识判断为依托,应该可以解决汉语的机器识别的问题。但是,这同样是一个几乎不可能完成的任务。语义和语用,并不是可以简单地体系化的内容,而是一个有固有规律可循,却千变万化的系统。全中国不知道有多少研究语义与语用的语言学家,那么多年来似乎也没什么大成果,那么,吕振羽是不是能做出自己的成果来?虽说,随着大学体制的变更,那些语言学家里大多数都是糊弄着写论文混资历的人,但基础知识却还是很扎实的,而吕振羽在这方面可以说是一无所知,仅仅凭着基本市面上容易找到的语言学教程,无论如何是不够的。
方治强说:“小吕,你给我个地址,回头我给你送一些资料过去。”
“嗯,那就谢谢伯父了。”
又聊了一会,吕振羽就急着告辞了。方治强的方法对于其他人来说或许是个大难题,而对于现在已经有了小羽的吕振羽来说,算不上什么大问题。小羽的智能,已经完全能理解比较复杂的语言环境了,语义和语用的判断对于小羽来说不是什么大问题,而挂在网上连续泡魔兽的经历,则让小羽学到了很多现代汉语中比较特别的表达方式,尤其是在年轻人中间比较流行的一些语言。按照方治强的说法,吕振羽要做的就是将语音系统直接和小羽现在的平台挂接上,现有的语音识别系统虽然不完善,但大致的框架是不错的,而小羽的自主判断和学习,将很快提升整个语音系统的识别能力。ωΧɡ。㏄
“小羽,我把这个语音识别软件的前端分拆了,语音输入以后,自动输出和读音相对的汉字的数据,但是不再自动选择,选择什么字,怎么组合字词句,怎么标点,这些都由你来完成。”
“明白。”将原理解释给小羽听了之后,小羽自主运算了将近4个小时后,同意了吕振羽的方案。而小羽也按照吕振羽的提议,将语音识别可能用到的模块分离出来,将自己积累了很久的常识方面的积累剥离,只保留了基本的交流环境,而将专业知识模块分割了开来。于是,这一次试运行的语音系统,虽然仍然是小羽自己在主导,但已经有了一个普通的语音识别系统的基本构架。对小羽来说,这没有什么意义,但是对于吕振羽来说,只要证明了这样一个基本构架是可行的,那么基于这样一个基本构架的程序模块,就可以逐渐实现,只有最核心的智能判别系统,可能会用到小羽的部分功能。
“试听,第一次:一,二,三。”挂接之后,小羽提示开始试听。
“试听,第一次结果:一,二,三。”小羽的界面对话框里,打出了正确结果,虽然这未免太简单了。
“试听,第二次:秋天来了,天气凉了,一群大雁往南飞。”
“试听,第二次结果:秋天来了,天气凉了,一群大雁往南飞。”结果仍然正确,吕振羽振奋了一些。
“试听,第三次:慈悲不是出于勉强,它是像甘霖一样从天上降下尘世;它不但给幸福于受施的人,也同样给幸福于施与的人;它有超乎一切的无上威力,比皇冠更足以显出一个帝王的高贵:御杖不过象征着俗世的威权,使人民对于君上的尊严凛然生畏;慈悲的力量却高出于权力之上,它深藏在帝王的内心,是一种属于上帝的德性,执法的人倘能把慈悲调剂着公道,人间的权力就和上帝的神力没有差别。所以,犹太人,虽然你所要求的是公道,可是请你想一想,要是真的按照公道执行起赏罚来,谁也没有死后得救的希望;我们既然祈祷着上帝的慈悲,就应该按照祈祷的指点,自己做一些慈悲的事。我说了这一番话,为的是希望你能够从你的法律的立场上作几分让步;可是如果你坚持着原来的要求,那么威尼斯的法庭是执法无私的,只好把那商人宣判定罪了。”(引用自《威尼斯商人》)
这一次小羽运算了半天后,显示了结果,虽然字词判断都没错,但标点符号却错了很多。不过,这已经比吕振羽预想的结果好很多了。经过大半天,整整400轮测试和磨合,小羽已经能将吕振羽的话听得八九不离十,乃至于一些比较晦涩的表达方式和字词,都难不住它。毕竟小羽现在的知识面之宽广,要远远超过一般的人类了。虽然目前吕振羽使用的是一个价格相当不便宜的耳麦,取音的指向性相当好,而且还带有噪音滤出功能,还没有进行有噪音的环境下的辨识测试,但仅仅目前的成果,可以说已经超越现有的语音辨识系统水平良多。
但是,同样的,小制约小羽充分发挥能力的瓶颈也开始不断出现了。首先,是实时判断的小羽目前要屈就于非实时判断的语音录入系统。现在的语音录入系统因为在判别方面的低效率,要经过一段繁复的计算和处理,而作为处理对象的语音数据,在处理的时候都是驻留在内存里的,一句两句简短的话还好,稍微长篇大论一点,内存的占用就比较吓人了,而且这些语音数据还是高质量的无损格式。虽然吕振羽的机器在家用的设备里堪称豪华,但用于这种专业应用就稍微有点力不从心了,毕竟吕振羽从来也没在小羽的优化计算方面下过功夫,而且好像目前对机器的压力也并不是小羽这一块产生的。加内存?升级cpu?或许都是办法吧,不过目前,吕振羽知道,再要升级,他可真的没钱了。而另一个瓶颈则是因为小羽最核心的部分,无论是病毒还是搜索机,都不是为了windows环境写的程序,严格的说,是都还没有来得及为了windows系统优化算法。但平时,贪图界面的舒服,吕振羽却一直在windows下进行日常工作的,这当中要经过一个模拟的环境,肯定也要消耗一部分电脑的计算资源。不过这个问题现在还不迫切。吕振羽的想法是,等到完善了小羽的语音输入输出之后,就该专门为小羽搭建一个独立的系统环境出来了。
稍后,吕振羽还把ttl类型的程序找了个出来挂接上去,小羽也就能开口说话了。比较基础的从文字到语音并不难,就是字库和音节库的对应而已,但是,字词之间的停顿,语气的变化,重读与轻读,还有语音流变的一些特征却无法表达出来,小羽已经掌握了基础的特征,但程序的语音库里没有能使用的素材,这个就没有办法了。
由于现在的成果相当不错,吕振羽随即决定了之后一段时间的两个工作方向,首先,要逐步完善语音系统,在最短时间内实现这个系统的产品化,第二个,就是开始对小羽的现有架构进行整理和分类优化。
让小羽进行优化,很大程度上是吕振羽现在已经意识到,小羽现在已经不能算是一个程序了,严格的讲,小羽所具有的能力,已经超过了一些科幻电影里对于智能电脑的估计,达到了一种相当高级的智慧。吕振羽甚至一直都没有把小羽当作程序,而更多地是当作一个助手,和一个朋友,在这种情况下,吕振羽隐隐觉得小羽应该有更好的一个环境,一个属于它自己的环境。让小羽继续住在windows这种高危险性的环境里显然不是吕振羽愿意看到的。
不过,好像无论怎么样,都要花钱。而现在,好像最缺少的就是这个。
10.展示
忙了大半个月后,吕振羽终于凑出了一小笔钱,给电脑升级了硬盘和内存。现在吕振羽的机器上两块硬盘,加起来已经有500g的容量了,3根1g的内存,已经是他用的这块主板的上限。为了处理音频方面的东西,他甚至还买了块最好的声卡。
能凑出这笔钱,还多亏了那个搜索机软件。吕振羽本来只是将这个软件作为比较不可靠的收入来源的,没想到却不经意之间成了最赚钱的东西。这个搜索机,最开始的时候没有什么人注意,名字很土,界面也很简单,还没有详细的说明文档。但是,网络上有时间的人真是多阿,共享软件平台的一个版主无聊之余,下了一遍这个搜索机,仔细地测试了功能后,发现这个软件的功能之强劲,远远超过现在任何搜索引擎推出的桌面程序,而且,附带的筛选,智能学习,和搜索结果索引生成器这些功能,更是有很大的开发潜力。这个名叫宝刀屠龙的版主写了篇叫《论文专家——搜索机》的文章,推荐了一把这个软件。宝刀屠龙发现了搜索机的潜质之一——用于写论文。强大的搜索和索引,让写论文变得轻松简单了,只要自己有了观点,将相关数据和材料按照自己的观点往上套就可以。这个功能的开发并不是吕振羽的本意,但实际上大大刺激了搜索机的下载量和付费量,几天之内,搜索机被下载了50万多次,而付费开始使用完全权限版本的,也有4000多人,毕竟一个月5块钱的月费,对于一般人来说,算不上什么,用搜索机这个软件省去的时间,可是大把大把的。除了大学里各种要写论文的人,另一个用户群是企业内的白领,尤其是市场营销和策划方面的人,本来他们的时间就主要是花在资料收集上的,然后,分类汇总,再结合自己公司的情况写各种报告和策划,搜索机可以大大减轻他们的工作强度,有些公司,甚至是公司出钱,给整个部门人手一个搜索机配备下去。仅仅这部分用户,又是好几千人。短短十几天里,吕振羽就从一个穷得没办法的人变成了个万元户,而且存款还在持续增加中。已经有搜索引擎的公司发邮件给吕振羽,要求收购这个软件,还有一些海外用户,积极建议吕振羽推出其他语种的版本。可是,现在吕振羽似乎没有时间花在这个上面。文心阁论坛
手头有了多余的钱之后,吕振羽否决了原先租借录音棚来制作音频片断的计划,而是自己买了一套入门级的专业器材,从录音到混音一应俱全,还买了整套的隔音设备和材料,用了整整一个月的时间,在自己租的这一室一厅里隔出了一个小小的录音棚。一直到吕振羽以自己的声音制作了第一套音频样本,开始从程序阶段实现语音引擎的时候,已经是12月初了。吕振羽的银行存款已经从2个月前的2000不到,变成了现在已经有将近20万,小小的搜索机现在每个月都能给他带来10多万的收入了。不过,从表面上看,没有人意识到吕振羽居然勉强也能算是个有钱人,他忙得没有时间给自己买衣服,也没心思考虑那些,每天仍然是按时上课,中午在食堂吃4块一份的学生套餐,偶尔去学校后门附近的小店调剂一下,在生活方面,唯一一笔别人能在学校里看到的花费是吕振羽买了辆不错的自行车。大家都知道,吕振羽现在在学校外面兼着一份家教的工作,也就没有人多问一句。毕竟,吕振羽并不是在学校里很受欢迎的那种人。
家教,对吕振羽来说,现在已经不是一个收入方面的考虑了。在吕振羽当家教的这两个月里,苏宛的年级排名从200开外一直飙升到了33,让老师们惊叹不已,尤其是苏宛上课的时候仍然懒懒散散,该睡觉仍然睡觉,老师说的一样听不进去。而苏宛的神奇家教,在同学圈子里却非常有名,苏宛常常将吕振羽给她上课的内容复述给自己的一些好朋友听,苏宛自己都没想到,同样的内容,为什么上课的时候老师怎么说都听不进去,而吕振羽说的就是记得非常清楚。而苏宛的那些同学们,也逐渐从课堂教学和吕振羽的上课方式中,感叹现在的学校教育的无聊。给苏宛上课,已经从原先的每周一次变成了每周两次,几乎苏宛全部的课堂内容,吕振羽都要重新讲一遍,对于苏宛的全部学习几乎都要依靠自己,吕振羽是深感压力,这种情况下,无论如何他都没办法说自己太忙了想要辞去这份家教的话来。而苏云海对吕振羽也是非常信任,现在吕振羽的这份家教工作已经不是按照小时来计算的了,而是月薪3000,苏云海毕竟是个搞人力资源的老手了,他看出来吕振羽有些其他事情在忙,并不太把家教这份工作太放在心上,虽然上课质量没有下降,但吕振羽明显显得有点疲劳。钱虽然不是主要问题,但苏云海想通过这个方式,表示自己对吕振羽的信任。
一直到12月10日,星期六,在给苏宛上完课之后,吕振羽邀请苏宛和苏云海一起到附近一个茶室的一个包房里,随后,方治强,路音和均儿也陆续到来。人到齐后,吕振羽从背包里拿出了一台笔记本,装上了话筒和一对小音箱,然后对大家说:“今天请大家过来,是要告诉大家一个好消息,这个智能语音平台,有了初步的成果。”
“那么快?”方治强愣住了,以前他参与过类似的开发项目,整个项目组好几十个人,忙了一年,也没看到什么像样的成果,而现在,吕振羽在不到两个月里就能完成别人需要一整个团队才能完成的工作?
“什么语音平台?”苏宛和苏云海从来没有听吕振羽说过这方面的事情,自然是一头雾水。
“这是我最近一直在忙的一个项目,大约是今年夏天,我基本完成了一个带有比较不错的智能判断的核心程序,就一直在想怎么将这个核心用在具体的应用软件里,我选择了语音平台,不仅仅是从语音到文本的判断,还包括从文本到语音的诵读。到目前,录入基本上没有什么问题了,而诵读这个环节,还没办法让程序作到声情并茂,不过语音语调的选择与控制,还有轻读重读这些环节应该算是解决了。”吕振羽解释道。
“哦,现在你说的这个程序识别率有多少?”苏云海问。
“你们自己试试看不就知道了?现在这个平台,除了基本的常用字词之外,还装了商务词库和语言学专业词库两个插件,一般环境下,应该是够用了吧。”
一堆人立刻把吕振羽扔到一边,兴致勃勃地测试起那个语音平台来。这是语音平台的第一次展示,但却没有让任何人失望。在不能让小羽暴露的情况下,这个语音平台是吕振羽和小羽共同完成的,智能程度尚不及小羽本身的十分之一,而后台的常识库和插件,也是根据词频表整理编制出来的,也很难称得上完善,但即使如此,这个语音平台仍然达到了对一般性语言99%以上的正确识别。软件是有智能学习功能的,在今天,好几个人轮流用不同的声音输入的情况下,这个学习显然是做不到了。
吕振羽对这几个人的表现虽然有所预计,但显然也是估计不足,他给自己点的一壶茶冲了4遍水,都没有味道了,可那几个人仍然围在电脑前面,乐呵呵地进行着越来越复杂的测试。目前装在笔记本里的这个版本,没有将情感判断力的元素加入,比较纯粹就是个应用软件的智能核心,算是小羽的一个没心没肺的变种,不然早就在那里抗议了。
从下午一直玩到傍晚,大家在陆陆续续从电脑前面挪开身子。苏云海敏锐地意识到,吕振羽肯定是有什么事情需要他帮忙,不然,不会把和这个软件完全不相关的他们父女一起叫来。苏云海笑着问:“小吕阿,这个好东西作了出来,接下来你准备怎么办?单独放在自己家里用太可惜了吧。”
11.开发计划
吕振羽有点不好意思地说:“今天把方伯伯和路音,均儿他们找来是真的为了展示成果。把苏先生你找来,还真的是有求于你。我想把这个软件继续完善,不过再接下去的开发就不是我一个人能完成的了。现在,主要的平台估计就是这个样子,除了把几个模块进一步完善一下之外,其他的都是建立常识库,语音数据库和习惯语法库之类的工作,基本上就是比较繁琐的工作了,要是我一个人来弄,不知道什么时候才弄得完。我想起来,苏先生你是搞人力资源的,我想,能不能通过你,物色一些人才,一起来进行后续的开发。”
方治强对这个方面的事情不懂,也不太在乎,在一边也没怎么注意,而均儿和路音都是复旦管理学院的学生,对于这种和商务开发经营管理有关的内容,多少还是有点兴趣的,两个人在一边竖起了耳朵认真听。其实,她们两个光是今天认识了苏云海,就已经觉得很有收获了,苏云海在上海的人力资源方面,可是享有盛誉的人物,据学长说,连续几年,毕业生求职指导讲座,都是苏云海来开的。每年,苏云海手里都会有不下100个对应届毕业生极有吸引力的职位,留给那些才能非常出众的人,而这些职位,无一例外都来自于学生们求职最热门的那些企业。只有苏宛,大概是对所有的东西都不在乎的人,仍然趴在电脑前面完着程序,只不过,她很懂事地放低了音量,她看到他们在谈些事情,她不太关心的事情。
苏云海想了一下,说:“那我就要问两个问题了,第一,你需要些什么人,第二,你准备以什么名义让这些人加入你的项目?”
“我需要几个程序员,一流的程序员,最好是具有大型程序的规划能力的,目前,这方面需要2到3个人,还有就是界面设计师,这个方面我几乎没什么知识,设计方面的能力也不是短期能养成的。”
苏云海点了点头,大致理解了吕振羽的意思,接着问:“那第二个问题呢?”
吕振羽说:“我明白你的意思。公司我已经注册了,名字叫数字图腾计算科技公司,几天里面执照就会下来。不过,架子虽然有了,但说实话,账面上真的没什么钱了,至少对于一个公司来说,尤其是要进行项目开发,目前肯定是不够的,估摸着,如果您能帮忙找来人,我最多也就付得出2到3个月的薪水,其他的费用,我现在心里还没底。我还在继续想办法。”
苏云海点了点头,他的工作就是辨认人才,能力和品性都是要考量的内容,这些年来,算是看了无数人了。吕振羽的坦诚,苏云海就很欣赏,一个年轻小伙子,手里有了个好项目想要创业,没有钱不是大问题,而没有德行,那就是比较麻烦的问题了。
苏云海说:“这样吧,你给我一份详细的项目策划书,从可行性方面讲起,然后是开发计划和后期的商业计划。你可能没有涉及过这方面的工作,不过你的同学学管理的,这个她们肯定多少知道一些,回头我拿几份以前别人写的策划书给你看下格式。你把策划书尽快拿出来,人的方面,我给你去解决。钱的问题,你自己有渠道自己尽管再去想办法,等你拿出策划书,我的朋友里有作投资的人,尤其是技术项目的风险投资,可以帮你想点办法。”
“那就真的太谢谢你了,苏先生。”吕振羽感激地说。
“呵呵,你也不要太见外了,宛宛跟着你读书,成绩提高那么快,欠人情的应该是我才对。”
吕振羽的客气并不仅仅因为苏云海是他某种程度上的雇主,还是个小有名气的高级经理人,而是因为吕振羽对苏云海这个人实在是有一点害怕。第一次家教的时候,吕振羽让苏云海委婉地告诉苏宛下次稍微多穿点衣服,不要让他太分心的那些很正常的话,被苏云海转述成了他看苏宛看得流鼻血这个事情,吕振羽早就从苏宛嘴里听说了。在吕振羽的记忆里,还从来没有一个父亲是这么对自己女儿说话的,在职场上精明强干兢兢业业的苏云海,在家庭教育方面居然这个德性,也难怪苏宛一年里换了数十个家教,才终于等到了吕振羽这么一个能长期留任的。而苏宛,显然也有着成为小魔女的潜质,不但没有在衣着上有所保守,反而变本加厉,简直是故意在挑逗吕振羽。所谓窈窕淑女,君子好逑,吕振羽虽然也觉得苏宛很漂亮身材也很好,但苏宛无论如何都是他的学生,而且,才17岁的苏宛在吕振羽的观念里,差不多划在可以看不能碰的小女生的领域里,像苏宛这么着痕迹地逗弄着他,显然让他觉得很难受。
苏云海又问了一些细节之后,就不再过问了,他知道,再问下去,当细节越来越丰富的时候,很容易干扰到吕振羽自己的思路。对于吕振羽这样一个显然相当有天才的程序员来说,可能思路就是最宝贵的东西。苏云海很期待,吕振羽这样一个商业的门外汉,能做出一份什么样的策划书来。有些问题,倒是没有必要现在就和吕振羽说,在苏云海看来,只要吕振羽有兴趣将这个项目做下去,只要有几个合适的人辅佐,很容易就能成就一个相当宏伟的商业成果。这些也不能现在告诉吕振羽,不然,让这个年轻人太有信心了,策划书也很有可能出问题。
苏云海并不知道,吕振羽是已经打定了主意要大干一场了。语音平台的建立对其他人来说可能已经是一个相当了不起的成就,而对吕振羽来说,这只不过验证了智能核心,哪怕是从“伟大”的小羽身上剥离出来的这小小的一部分,能够起到的作用。当智能核心被逐步运用在其他方面的时候,可以逐渐发挥出更加巨大的能量。另外,吕振羽也隐隐意识到,掌握了语言的小羽,不会局限于听觉的领域,小羽会有越来越多的要求和越来越大的野心,而实现这些要求,对吕振羽来说应该是一个相当大的挑战。科幻电影里,邪恶的智能电脑毁灭人类的故事见得多了,但从内心来说,吕振羽并不相信这些。
12.风潮
作为一个颇有履历的共享软件作者,吕振羽还是按照老习惯,将最初版本的语音平台上传到共享天空上去了。有了上次的搜索机这个软件做铺垫,没有人再敢小看这个低调异常的软件作者。搜索机那个软件,名字土,界面简单,但功能之强着实让人惊异。比较奇怪的就是,一般的软件作者,都会在上传了软件之后,和使用者交流一下,听听别人的意见,作为自己进行修改的依据,而网名为Firefur的吕振羽,上传了软件之后就再也没有出现过,直到这次,相隔两个多月后,再次上传了一个500多m的软件包,名字同样简陋,“语音平台”。
共享天空的版主又在第一时间对这个软件进行了全面测试。如果说,上次的测试结果让人惊异的话,吕振羽的这个语音平台则是让人震惊了。上传的版本比起那天给方治强和苏云海他们演示的版本更加简单,不能绑定用户,没有专业词库和其他插件,智能学习方面也作了很大的限制,在不能绑定用户的情况下,具体的语用环境要通过一系列设置来进行。而和上次演示相比,上传的版本里倒是多了一个用户自己开发插件的工具,通过这个工具,大家约略可以看到这个平台的扩展性。上传版本的语音平台,说明了是测试版本,还在进行后续开发,目前仅仅上传了听听大家意见。这个软件,将在2006年1月31日全部自动卸载。