距离下一场报告开始,还有十分钟。
他侧过头,看向身旁的沈妍,轻声问道:“上午十点这场,有你想听的吗?”
沈妍闻言,拿出手机,点开备忘录,显然是早就做足了功课。
她滑动屏幕看了几眼,很快便抬起头:“有一个,在燕北的分会场。主题和人工智能算法相关,演讲者是麻省理工大学的安库尔莫伊特拉教授。”
麻省理工?
陈林和沈妍几乎是下意识地,同时将目光转向了身旁那位还处于神游天外状态的金发小姐姐。
安妮被两人这齐刷刷的目光看得一愣,总算是从刚才那足以颠覆人生观的巨大冲击中,勉强挣脱了出来。
她眨了眨那双漂亮的海蓝色大眼睛,有些茫然地问道:“怎么了?你们......为什么这么看着我?”
陈林没说话,只是拿出手机,熟练地点开大会的官方网页,找到了上午十点场次的日程安排。
他很快便找到了那位莫伊特拉教授的介绍页面,将手机屏幕转向安妮,指着上面那张深棕色皮肤、看起来颇有学者风范的阿三中年男人的照片,试探性地问道:
“这位,该不会就是你的导师吧?”
“是啊,这就是......”
安妮下意识地点了点头,话说到一半,像是忽然被踩了尾巴的猫,猛地从沙发上弹了起来,发出一声短促而尖锐的惊叫。
“啊!我导师的讲座!天哪,我差点给忘了!”
......
五分钟后,三号分会场。
陈林、沈妍和安妮三人,站在报告厅的后门口,看着眼前这人山人海的景象,齐齐感觉一阵头皮发麻。
这一次,别说是前排的黄金位置了,就连最后一排的犄角旮旯都早已座无虚席。
更夸张的是,报告厅两侧的过道里,都已经被见缝插针地摆上了一排排简陋的塑料方凳,上面同样坐满了人。
门口还有源源不断的人正试图往里挤,场面堪比早高峰的地铁。
“好家伙......”
陈林忍不住在心里发出一声惊叹。
这阵仗,比起刚才舒尔茨那场,人数起码翻了一倍都不止。
只能说,人工智能这个赛道,实在是太火了。再加上麻省理工这块金字招牌的加持,能吸引来这么多听众,倒也合情合理。
只不过,大会的场地都是事先分配好的。
同一时间,主会场那边也有一场重要的演讲即将开始,所以这边就算人再多,也只能想办法在这间教室里挤一挤了。
“我导师在学术圈还是挺有名的。”
安妮一边踮着脚尖,努力地在人群中找着自己导师的身影,一边还不忘介绍。
“虽然他不像陶哲轩教授和舒尔茨教授那么耀眼,但是能在博士毕业十五年内,就拿到麻省理工数学系的正式教职,还能同时担任我们学校‘统计与数据科学研究中心’的主任,这已经非常非常厉害了!”
这话倒是不假。
哪怕是陈林这种对学术圈不甚了解的门外汉,也知道能在麻省理工这种号称蓝星最强理工院校的地方,拿到终身教职,还身兼一个重要研究中心的一把手,这绝对是站在科研鄙视链最顶端的那一小撮人了。
三人坐下没多久,一位穿着深灰色西装、气质儒雅的阿三中年男人,便拿着笔记本电脑,不紧不慢地走上了讲台。
正是莫伊特拉教授。
和舒尔茨一样,他也没有任何多余的客套,调试好设备后,便直接开始了自己的演讲。
【大模型训练中的数据几何结构与训练动力学】
不得不说,安妮的导师确实是有真东西的。
整个演讲过程,干货满满,逻辑清晰。
他将大模型那复杂无比的训练过程,巧妙地类比为参数空间中的一种“梯度流”,然后从纯粹的几何学视角,深入浅出地分析了这种“梯度流”的几何性质,是如何影响模型的收敛性、泛化能力等核心指标的。
陈林和沈妍都听得津津有味。
尤其是陈林,更是越听眼睛越亮。
这位莫伊特拉教授的水平,确实是有东西啊!
整个演讲内容,提纲挈领,直指核心,将一个极其复杂的前沿问题,讲得条理分明。
最让陈林感到惊喜的是,莫伊特拉教授在展示那些纯数学理论的知识时,竟然还贴心地在PPT里面附上了对应的大模型训练伪代码。
这些代码,对于正在自学人工智能大模型的陈林而言,简直就是雪中送炭!
他毫不犹豫地拿出手机,对着那几页PPT就是一顿猛拍,准备回去之后再仔细地研究。
第一百五十九章 很有前途
四十五分钟的演讲时间很快便接近了尾声。
在最后几分钟,莫伊特拉教授面向所有听众,介绍了当前学术界在这个方向上,最为关注的几个前沿开放性问题:
“第一,数据流形的几何复杂性,比如其中存在的孔洞、高度弯曲的区域,究竟是如何影响模型训练难度的?”
“第二,我们是否可以利用这些几何学的洞察,来设计出更高效的优化器?比如说,一种能够主动适应损失景观(Loss Landscape)几何结构的自适应学习率算法。”
“第三,从几何学的视角来看,为什么参数量越大的模型,在训练时反而往往更容易被优化,更容易找到那些平坦的、泛化性能更好的极小值?”
介绍完这三个问题后,莫伊特拉教授便干脆利落地宣布了演讲结束。
台下,再次响起了雷鸣般的掌声。
“我目前的研究方向,就是导师刚才提到的第二个问题。”
安妮一边用力地鼓着掌,一边侧过头,用一种带着几分自豪的语气,对陈林和沈妍小声说道。
陈林闻言,若有所思地点了点头,随口点评了一句:“嗯,很有前途的研究方向。”
安妮立刻冲他白了一眼,嘲讽了一下陈林的这句恭维听起来真没什么营养。
实际上,陈林这句评价,可不是什么随口的敷衍。
就在刚才,莫伊特拉教授提出那个关于“设计更高效优化器”的问题时,陈林的脑海中,在【小小数学家】称号的加持下,几乎是瞬间就涌现出了好几条截然不同,但理论上都完全可行的研究思路。
这是一种非常罕见的情况。
以往,当他面对一个具体的数学问题时,系统往往只会给出一条最优解路径。
而现在,一次性冒出好几条思路,这只能说明一件事这个问题本身,拥有极大的探索空间,不同的研究路径,最终都可能在不同的应用场景下,取得最优的结果。
对于科研工作者而言,这意味着什么?
这意味着,这一个课题,就足以衍生出好几篇高质量的论文!
这还不叫“很有前途”?
不过,陈林并没有再多说什么,比如好为人师地指点一下安妮的研究方向。
安妮确实很漂亮,那张酷似达达里奥的脸蛋,对任何一个正常男性都有着不小的杀伤力。
但陈林毕竟和她今天才刚认识,关系远谈不上多好。
而且,就在上午听舒尔茨讲座的时候,他能隐隐感觉到,这个金发碧眼的漂亮姑娘,在最初和自己搭话时,眼神里其实带着一丝若有若无的审视,甚至可以说是一点点不易察觉的轻视。
那是一种属于世界顶尖学府精英的、下意识的优越感。
虽然安妮可能并没有存什么坏心思,后续在见识到自己和舒尔茨的交流后,态度也发生了一百八十度的大转弯,但最初的那点感觉,还是让陈林对她的好感度变得相当一般。
萍水相逢,相谈甚欢,也就仅此而已了。
就在这时,安妮似乎想起了什么,热情地提议道:“对了,今天晚上,一部分来自各个顶尖高校的学生,会在主办方安排的全季酒店那边,搞一个临时的交流会,主要是讨论一下今天白天听到的那些比较让大家感兴趣的演讲内容。你们有兴趣参加吗?”
陈林闻言,毫不犹豫地摇了摇头,找了个万金油借口:“我就不去了,我得抓紧时间,好好准备一下明天下午的演讲,晚上估计没什么时间。”
沈妍冰雪聪明,几乎是瞬间就听懂了陈林话里的潜台词,也跟着婉拒道:“我晚上也想早点休息,就不去了。”
安妮对此倒是觉得很正常,毕竟在学术会议期间,演讲者提前闭关准备,是再常见不过的事情。
她对着陈林比了个加油的手势,笑容灿烂地说道:“那好吧,预祝你明天演讲顺利!我和我导师应该都会去听的,你可要好好发挥哦!”
说完,她便落落大方地和两人道了别,转身朝另一个方向走去。
和安妮分开后,陈林和沈妍先是在酒店的自助餐厅解决了午饭。
下午的时光,便在不同的会场之间穿梭度过。
陈林陪着沈妍,听了两场她提前就做好了功课、非常感兴趣的讲座。
直到傍晚时分,两人才回到酒店。
在餐厅吃过晚饭后,便各自回了自己的房间。
晚上十点整。
陈林坐在自己那间豪华单人间的书桌前,放下了手中的笔,看着面前那几张写得满满当当的草稿纸,表情忽然变得有些小小的纠结。
倒不是研究出了什么问题。
恰恰相反,经过昨天和今天这两个晚上,总计将近六个小时的高强度研究,在【小小数学家】称号的加持下,他已经明显感觉到,自己距离提出一种能够直接应用于所有生成式大模型,并大幅降低其幻觉率的全新算法,已经越来越近了!
只要再给他两个小时,不,或许都不需要两个小时,他就有一定的把握,能将那层窗户纸捅破!
但问题是,他没有时间了。
对于【小小数学家】称号的使用限制,陈林早就研究得一清二楚。每天三小时,就是他的安全极限。
如果强行将使用时间延长到三个半小时,后果他早在今年五月份,第一次长时间给沈妍讲解算法时,就已经亲身体验过了第二天直接昏睡将近二十个小时,不省人事。
明天下午一点半,就是他上台演讲的时间。
无论如何,他都绝不能在这个节骨眼上掉链子。
陈林心里涌起一丝小小的遗憾。
虽然他很有信心,单凭自己目前已经取得的这些研究成果,就足以让明天到场的那些线上线下的观众们感觉不虚此行。
但是,不能在这样一个万众瞩目的舞台上,当着全世界同行的面,直接宣布自己已经找到了一种足以改变整个人工智能行业的全新算法,终究还是不够完美。
他自嘲地笑了笑。
看来,就算是拥有了系统的自己,也很难做到事事完美啊。
将纷乱的思绪甩出脑海,他先是将今天刚写好的几页草稿纸,和昨天写好的那一叠小心翼翼地整理到一起,放进文件夹。
随后,他打着哈欠钻进了柔软的被窝。
熟悉的疲惫感如潮水般袭来,没过五分钟,陈林便沉沉睡去。
第一百六十章 提前开始
第二天一大早,上午八点。
陈林在酒店餐厅吃早餐时,对坐在对面的沈妍说道:“我等会儿得先花点时间,把下午演讲要用的PPT再最后整理一下。上午第一场八点半的讲座,如果你有想听的,可能得自己先过去了。”
沈妍小口地喝着牛奶,闻言只是轻轻摇了摇头,语气一如既往地平静,看着陈林的眼神中却有一丝温柔。
“我等你。”
于是,陈林吃完早饭,又回到房间里,对着笔记本电脑忙活了半个多小时。
他将这两天晚上取得的最新研究进展,言简意赅地补充进了PPT的最后几页,并且将整个PPT的逻辑结构又重新梳理了一遍,确认万无一失后,才将电脑和那叠厚厚的草稿纸一起,郑重地放进了双肩包里。