陈浩却感觉自己的头皮一阵发麻。把这篇论文里的任何一个人从谷歌挖出来都已经是足以震惊整个硅谷的地震了,而自己的老板竟然想把整个团队一锅端?这已经不是疯狂了,这是神话。
“这……这不可能。”陈浩下意识地反驳道,“这些人都是谷歌AI实验室最核心的宝贝,是他们通往未来的门票。别说我们现在这家已经‘破产’的公司,就算是微软、是亚马逊亲自下场,谷歌也绝不可能放人。”
“我知道。”刘江笑了笑,“所以我们不跟谷歌谈,我们只跟他们本人谈。”
他让助理又递过来一份文件,这次是一份打印出来的纸质报告,封面上写着【“八大神”背景及需求分析报告】。
“看看吧,”刘江示意陈浩,“这是我让钱博士和他在华尔-街的那帮朋友花了半个月时间挖出来的东西。”
陈浩颤抖着手翻开了报告。
报告的内容极其详尽,将那八位“大神”的个人情况剖析得淋漓尽致。
【Ashish Vaswani,印裔,团队领导者。近期刚刚第三次申请晋升谷歌Fellow(院士)失败,理由是‘管理经验不足’。其个人对谷歌内部僵化的晋升体系和日益严重的‘大公司病’已表露出明显的不满。】
【Niki Parmar,团队中唯一的女性,负责关键的算法实现。她的丈夫也在谷歌工作,但因为夫妻两人的国籍问题,他们的H1B签证(工作签证)续签遇到了麻烦。】
【Jakob Uszkoreit,德裔,Transformer架构的核心设计者之一。他近期最大的困扰,是他刚出生的女儿被诊断出患有一种罕见的遗传病,需要一笔天文数字的医疗费用。】
……
第127章 鱼饵
一份份看下去,陈浩的心越来越沉。
他发现这些在外界看来如同“神明”一般、遥不可及的天才们,在生活中也同样面临着和普通人一样的烦恼。
事业的瓶颈、身份的困扰、家庭的重担、对金钱的需求……
这些就是他们的“阿喀琉斯之踵”。
“没有挖不动的墙角,”刘江看着陈浩那张变幻不定的脸,淡淡地说道,“只有给不到位的价码。”
“他们每个人需要的,都不是简单的金钱。有人需要一个能让他自己说了算的平台,有人需要一个能解决他后顾之-忧的承诺,有人需要一个能让他实现财务自由后去追求更高理想的跳板。”
“而我们这次去香港,”他做出了最后的总结,“就是要去打造一个,能同时满足他们所有人需求的,全新的‘许愿池’。”
“一个不受任何大公司KPI束缚的,独立的,自由的,AI研究院。”
“一个由我个人出资,不计成本,不问回报,只追求最前沿技术突破的,‘AI乌托邦’。”
“而你,”刘江看着陈浩,“就是我任命的,这个‘乌托邦’的,第一任院长。”
陈浩感觉自己的大脑一片轰鸣,一股巨大的、前所未有的使命感和责任感瞬间充满了他的胸膛。
“那……那我具体需要做什么?”他声音干涩地问道。
“你什么都不用做。”刘江笑了,“你只需要安安静静地,在那篇论文下面,发一条评论就行了。”
“发……发评论?”
“对。”刘江递给他一个加密的U盘,“这里面是我让方哲帮你准备好的,一些关于你个人履历的‘包装’材料。包括你之前在国际奥林匹克信息学竞赛上拿到的金牌,也包括你在‘第二世界’AI实验室里取得的一些……呃,经过了‘艺术加工’的研究成果。”
“你用你的私人账号,在那篇论文下面,发一条评论。”
“评论的内容,要尽可能地‘学术’,要表现出你对他们这篇论文,有着极其深刻的、甚至超越了他们自己的理解。”
“你要,指出他们这套架构里,还存在的,一两个,他们自己,都尚未发现的,微小的,缺陷。”
“然后,”刘江的嘴角勾起一抹狐狸般的笑容,“在评论的最后,不经意地,透露一句。”
“你,和你的团队,即将在香港,举办一场,小型的,私密的,关于‘Transformer架构未来可能性’的,学术研讨会。”
“时间,就在下周末。”
“欢迎,全世界所有,真正看得懂这篇论文的‘同好’,前来交流。
陈浩看着刘江递过来的那个U盘,感觉像是接住了一块烧红的烙铁。
他那颗被0和1填满的、习惯了绝对诚实的技术宅大脑,第一次对老板的指令产生了本能的抗拒。
“老板,”他有些艰难地说道,“这样做是不是有点……不诚实?我只是一个大四的学生,虽然对AI有些自己的理解,但要我去指出那八位大神论文里的‘缺陷’……”
他后面的话没说出口,但意思很明确:【我,不配。】
“谁说你不配了?”刘江看着他那副缺乏自信的样子,有些好笑地反问道,“你觉得那八个人,生下来就是大神吗?他们在你这个年纪的时候,说不定还在为大学的绩点发愁呢。”
“陈浩你记住,”刘江的语气变得严肃了一些,“技术的世界里,从来不看年龄,只看实力和远见。而我今天之所以敢让你去‘碰瓷’,就是因为我手里,有一样他们八个人加起来都没有的东西。”
“什么东西?”
“未来。”刘江指了指自己的太阳穴,“我见过Transformer架构在未来十年里,所有可能的发展路线和应用场景。从GPT到BERT,从Sora到AlphaGo,我知道它所有的优点,也知道它所有的缺点。”
他看着陈浩,一字一句地说道:“U盘里,除了你的‘包装’材料,还有另外一份文件。那里面,详细记录了Transformer架构在初代版本里,存在的三个最致命的,也是最隐蔽的缺陷。”
“包括它在处理超长序列文本时,因为自注意力机制的二次方复杂度而导致的‘算力灾难’。”
“包括它在‘位置编码’上的先天不足,导致模型很难理解词语的真正顺序和逻辑关系。”
“甚至包括,它在应对‘对抗性攻击’时的脆弱性。”
“这些,都是谷歌那八位大神,需要再花至少三到五年的时间,才能在实践中慢慢发现和修正的问题。”
“而你,”刘江看着已经完全呆住的陈浩,“只需要把这些问题,用你自己的技术语言,‘翻译’出来,然后,像一个真正的‘先知’一样,‘点拨’他们一下。”
“就够了。”
陈浩感觉自己的世界观,在这一刻,被彻底重塑了。
他看着刘江,像在看一个,披着人皮的,无所不知的,神明。
他不再有任何的怀疑和犹豫,那颗属于技术天才的骄傲,和属于年轻人的热血,在这一刻,被彻底点燃了。
“我明白了,老板。”他的眼神里,充满了狂热的火焰,“我现在就去发!”
……
飞机,平稳地降落在香港国际机场。
一辆早已等候在停机坪的,挂着中港两地牌照的黑色埃尔法,将刘江和陈浩,接到了位于中环,四季酒店的顶层套房。
接下来的两天。
刘江,彻底给自己放了个假。
他没有去见任何商业伙伴,也没有处理任何公务。
只是像一个普通的游客一样,带着陈浩,逛了逛维多利亚港,吃了吃路边摊的牛杂,甚至还跑去兰桂坊,喝了一杯,不好不坏的威士忌。
他知道,自己已经把那枚,全世界最昂贵的“鱼饵”,扔进了大海。
现在,他需要做的,只有一件事。
安静地,等待。
等待那些,隐藏在深海里,最骄傲,也最饥饿的鲨鱼,闻到血腥味,自己,找上门来。
而陈浩,则把自己,完全锁在了酒店的房间里。
他废寝忘食地,研究着刘江给他的那份,如同“天书”一般的,未来技术文档。
然后,他登录了那个,全世界所有顶尖程序员,都奉为“圣地”的技术问答社区Stack Overflow。
他找到了,那篇,由谷歌AI团队官方发布的,《Attention Is All You Need》的论文链接。
他深吸一口气,将自己,这两天,呕心沥血,写下的一篇,长达五千字的,技术评论,发了上去。
【标题:关于Transformer架构中‘位置编码’解决方案的一些不成熟的思考】
这篇评论,就像一颗,投入深海的,小石子。
在最初的几个小时里,没有激起,任何水花。
但是,随着夜幕的降临。
随着,远在地球另一端的,美国硅谷,迎来了,新的一天。
一些,真正的大鱼,开始,浮出水-面了。
第一个,发现这篇评论的,是谷歌AI实验室里,一个,负责代码测试的,华裔实习生。
他本来,只是想在上班摸鱼的时候,看看大神们的论文下面,又有什么新的“彩虹屁”。
却无意中,看到了,陈浩这篇,看起来,专业到,有些“装逼过头”的,评论。
他本来,想嗤之以-鼻。
但,当他,顺着陈浩提出的那几个“看似荒谬”的论点,去重新审视Transformer的底层代码时。
他的脸色,变了。
他发现,自己,竟然,看不懂了。
不,应该说,他发现,这个叫“Chen Hao”的,神秘ID,对这套架构的理解,已经,远远地,超出了他,甚至,他导师的,认知范畴。
他感觉,自己,像一个,还在为“1+1=2”而沾沾自喜的小学生,却突然,看到了,一份,关于“微积分”的,天书。
他颤抖着,将这篇评论,转发到了,实验室的内部通讯群里。
并且,@了,所有人。
【主题:各位,都来看上帝。】
第128章 地震
美国加州,山景城,谷歌总部。
被称为“Googleplex”的庞大园区里此刻正是一天中阳光最好也最“懒散”的时刻,无处不在的免费零食、刚刚做好的手工咖啡、以及被精心修剪过的碧绿草坪共同营造出一种与世隔绝的乌托邦氛围。
这里是全世界所有程序员梦想中的天堂,也是禁锢着无数顶级天才的华丽牢笼。
无数穿着格子衬衫和连帽卫衣的顶级程序员正三三两两地端着免费的咖啡和点心,在园区里那堪比五星级度假村的草坪上享受着下午茶时光。
他们讨论的话题从下一代操作系统的内核架构,到附近新开的那家墨西哥餐厅的玉米饼味道怎么样,彼此之间充满了轻松而又优越的氛围。
然而在这片平静的“海面”之下,一场十二级的思想地震正在一个最核心也最小的圈子里疯狂地爆发。
谷歌AI大脑团队,内部通讯群。
这个只有不到二十个成员、汇集了整个谷歌乃至全世界在人工智能领域最顶尖的天才的私密群组里,此刻早已炸开了锅。
它的存在本身就是谷歌最核心的机密之一,群里的每一次闲聊都可能诞生一个价值百亿美金的新想法。
起因就是那个被华裔实习生以“都来看上帝”为标题转发进来的Stack Overflow的技术评论链接。
那个可怜的实习生因为过度的激动甚至忘了屏蔽自己的真实姓名,此刻正被他的导师按在会议室里,一遍又一遍地追问那个叫“Chen Hao”的ID到底是他从哪认识的“神仙亲戚”。
起初群里的大神们还都带着一种看热闹的优越的心态。
【Jakob Uszkoreit】:“哦?又有人来挑战我们的Transformer了?让我看看这次是哪个学校的教授又写了篇不痛不-痒的‘优化建议’。如果是MIT的我可以回复一下,如果是斯坦福的就算了。”
【Niki Parmar】:“哈哈我赌五美金他肯定又是抓着我们模型‘参数量太大’这个点不放。这些人永远只看得到成本却看不到我们架构的潜力。”
【Ashish Vaswani】:“都别吵了,我点进去看看……ID叫‘Chen Hao’?没听说过。让我看看他写了什么……”
短暂的几句玩笑话后整个群组陷入了长达十分钟的死一般的寂静。
这种寂静在线下代表着尴尬,但在这种顶级的线上技术群里它只代表着一件事所有人都被屏幕上的内容给震住了。
十分钟后第一个打破沉默的是团队的领导者Ashish Vaswani。