“这就导致了,哪怕你在预训练阶段投入了天文数字的算力和数据,模型在某些特定任务上的表现,依旧不尽如人意。“
陈林听到这里,虽然很多专业术语他并不完全理解,但他能听出来,白迁对这个领域,有着非常深刻的思考。
他微微点头,示意白迁继续说下去。
白迁见陈林没有打断自己,反而露出了认真聆听的表情,整个人更加兴奋了。
他的语速越来越快,手舞足蹈地说道:
“所以,我这几年一直在思考一个问题“
“有没有可能,设计出一种全新的模型架构,以及一种全新的训练范式,能够从根本上解决这些问题?“
“我做了一些初步的研究,也有了一些成果。“
“但是,“白迁的语气忽然变得有些无奈,“在自动化所,我的研究方向,并不是主流。“
“所里的资源,大部分都投给了那些跟着业界主流路线走的项目。“
“我想要的算力,想要的数据,都拿不到。“
“所以,我的很多想法,都只能停留在理论阶段,没办法真正验证。“
白迁说到这里,忽然抬起头,那双眼睛里,闪烁着一种近乎狂热的光芒。
“但是,陈总,当我看到您在数学大会上的那场演算之后......“
“我忽然觉得,我在您这里,有机会实现我的愿望。“
“找到一种更好的大模型架构!“
陈林听到这番话,心中微微一动。
他能感受到,白迁对于人工智能这个领域,有着一种近乎偏执的热爱。
这种人,往往是最有潜力做出突破性成果的。
陈林沉吟了片刻,缓缓开口道:
“白博士,你给我简单讲一下你刚才说的,你自己的研究成果吗?“
白迁闻言,立刻点了点头,眼睛里的光芒更亮了。
“当然可以!“
他从随身的背包里,掏出一个平板电脑,飞快地点开了一个文件夹。
“陈总,您看......“
接下来的半个小时,白迁滔滔不绝地向陈林介绍着自己的研究成果。
什么动态稀疏激活机制、什么分层知识蒸馏、什么多模态对齐预训练......
一大堆专业术语,从白迁嘴里蹦出来,听得陈林是一愣一愣的。
虽然陈林很多细节都听不懂,但他能感觉到,白迁说的这些东西,非常有深度。
于是,陈林全程都保持着认真聆听的姿态,时不时还用赞许的眼神看着白迁,频频点头,给他提供情绪价值。
终于,白迁讲完了。
他似乎是意识到自己说得有点多,有些不好意思地挠了挠头。
“抱歉,陈总,我一说起这个,就有点收不住......“
第一百九十三章 互补
“没关系。“陈林笑着摆了摆手,“能看出来,你对这个领域非常有热情。“
“这是好事。“
他顿了顿,接着说道:
“白博士,我这边的想法是这样的。“
“如果你愿意来演海工作的话,我会给你提供足够的资源和自由度,让你去实现你的那些想法。“
“算力、数据、人员配备,这些都不是问题。“
“我唯一的要求,就是你能尽你所能,帮我把这个项目做成。“
白迁听到这番话,整个人都愣住了。
他瞪大了眼睛,不可置信地看着陈林。
“陈总,您......您是认真的吗?“
“当然。“陈林点了点头,“我从来不开玩笑。“
白迁的喉结上下滚动了一下,声音有些颤抖:
“那待遇方面......“
“月薪税后八万。“陈林直接报出了一个数字,“另外,如果项目做成了,会有额外的项目奖金。“
白迁听到这个数字,整个人都呆住了。
月薪税后八万!
这比他在自动化所的收入高太多了!
他深吸了一口气,努力让自己平静下来。
“陈总,能给我时间考虑一下吗?“
陈林笑了笑:“当然,这么重要的决定,你肯定需要时间考虑。“
“不过,“他顿了顿,“我希望你能尽快给我答复。因为我这边的项目,已经在筹备阶段了,越早启动越好。“
白迁用力地点了点头:“我明白!我会尽快给您答复的!“
两人又聊了几句,白迁便起身告辞了。
陈林将他送到门口,看着他离开的背影,嘴角勾起一丝满意的笑意。
这个白迁,是个货真价实的技术大牛。
如果能把他招进来,对项目的推进,会有巨大的帮助。
......
......
第二天,周二下午。
演海公司的会客区,再次来了客人。
陈林依旧坐在沙发上,对面,是一个看起来三十岁出头、戴着金丝眼镜、穿着一身剪裁得体的休闲西装的男人。
他就是潘思,彭总推荐的海归大佬。
和白迁那种典型的宅男气质完全不同,潘思身上,散发着一种成熟、自信、游刃有余的职场精英气息。
见面的时候,潘思主动伸出手,脸上带着得体的笑容:
“陈总,久仰大名!终于见到真人了!“
陈林也笑着和他握了握手:“潘博士客气了,我才应该说久仰大名。“
“在狗狗工作过的AI专家,可不多见。“
潘思笑了笑,摆了摆手:“过奖了,我在狗狗也就是个普通员工,没什么值得夸的。“
两人落座后,云清端着茶走了过来。
不过这一次,潘思接过茶杯的时候,表现得非常自然,还礼貌地对云清说了声“谢谢“。
云清笑着点了点头,转身离开。
陈林端起茶杯,抿了一口,率先开口道:
“潘博士,咱们也不绕弯子了,直接聊正事吧。“
“彭总那边,应该已经把我这边的情况,大致跟你说过了吧?“
潘思点了点头:“嗯,彭总跟我提过。陈总您这边是打算自己开发一个全新的AI大模型,对吧?“
“没错。“陈林点头,“而且,我希望这个模型,能够在各方面都超越目前市面上的主流大模型。“
潘思闻言,笑了笑,语气里带着几分调侃:
“陈总,您这个目标,可不小啊。“
“要知道,现在全世界做AI大模型的公司,没有一千也有八百。“
“想要做到'全面超越',难度可不是一般的大。“
陈林也笑了:“我知道难度大,但我相信,只要方向对了,资金和人才到位了,就一定能做出来。“
潘思微微点头,没有反驳。
他沉吟了片刻,缓缓开口道:
“陈总,我能问一下,您对于模型的技术路线,有什么具体的想法吗?“
陈林坦然地摇了摇头:“说实话,我对AI这块还不够专业。所以,我希望能听听你的意见。“
潘思听到这话,眼睛微微一亮。
“那我就直说了。“
他推了推眼镜,语气变得认真起来。
“我在狗狗工作的这几年,参与过好几个大模型的训练项目。“
“根据我的经验,我认为,目前业界主流的模型架构,比如Transformer、MoE这些,其实已经够用了。“
“它们在理论上,都已经被证明是有效的。“
“真正决定一个模型效果好坏的,不是架构本身,而是两个东西“
潘思伸出两根手指。
“第一,数据质量。“
“第二,对齐。“
陈林听到这话,微微挑了挑眉。
“能详细说说吗?“
“当然。“潘思点了点头,接着解释道:
“数据质量,指的是你用来训练模型的数据,到底有多干净、多高质量。“
“很多人以为,做AI大模型,就是把海量的数据塞进去,让模型自己学就行了。“
“但实际上,如果你的数据里有大量的噪声、错误、偏见,那么训练出来的模型,效果一定不会好。“
“所以,数据清洗,是一个非常非常重要的环节。“
“甚至可以说,“潘思的语气变得无比郑重,“一个模型能不能成功,50%以上,都取决于数据质量。“
陈林听到这里,若有所思地点了点头。