首富从AI浪潮开始 第167节

  那行提醒停在列表最上方,安静地亮着。

第一百八十七章 随身老爷爷

  “韩总,您叫我?”

  张彪接到韩路一的消息后,来到韩路一的办公室。

  “彪哥,坐。”韩路一站起来,指了指旁边的沙发。

  张彪板正的坐在沙发上,韩路一走过来他斜对面的沙发上坐下,开口问道:“彪哥,新职位还适应吗?”

  张彪坐在那愣了愣,不知道该怎么开口。

  张彪转岗一段时间了,和以前一样,韩路一还是去哪都带着他。

  区别是以前他不进会议室,韩路一开会的时候他就在外面保持警戒,确认环境安全,观察来往人员。

  现在他带着笔记本在旁边跟着听,记记笔记。

  但是大部分时候他都是一头雾水的状态,那些个名词,什么融资条款、模型训练、算力调度、数据中心、电力指标。明明都是中文,怎么连在一起他就听不懂了呢?

  他尽量把这些都记下来,可是会后翻看自己记的笔记,也没法复盘出会议中讨论了什么议题、谁是什么观点、最后做出了什么决定。

  这让张彪很难受,他在部队的时候一直是先进,还拿过三等功。每次执行任务,任务是什么,目标是什么,行动计划是什么,他都能很快进入状态。

  可是现在他像是突然被丢进了一个完全陌生的战场,成了一个什么都不会的新兵蛋子。

  显然,他是一个不合格的助理。

  想了想,张彪开口说道:“韩总……我觉得我可能当不了您的助理,我还是回去做安保吧。”

  把这句话说出口,张彪反而感觉放松了一些。他不怕苦、不怕累、更不怕流血受伤,但是他占了一个自己胜任不了的重要位置,辜负了韩路一对他的期望。

  韩路一听到张彪的话,知道他误会了。

  他没有立刻反驳,靠近了张彪一点,说:“彪哥,你先别急。”

  张彪抬头看向韩路一。

  “咱们公司虽然是做人工智能的,可是日常工作的内容也不是什么黑科技。和你在部队的时候其实是一样的,归根结底,是要把信息传递给对的人,让对的人在正确的时间做出正确的决定。”

  张彪愣了一下。

  然后韩路一接着说:“你上手的时间还短,一时间不会的东西太多,所以感觉懵,这也很正常。”

  听了韩路一的话,张彪稍稍宽心。

  可他的苦恼没有消失。

  不会的东西太多了,怎么办?

  硬学?

  他都学了两个星期了,每天跟会、记笔记,晚上自己复盘看书,还觉得毫无进展,这样下去真的有用吗?

  韩路一伸手把一个文件夹放在张彪面前。

  “彪哥,交给你个任务,边干边学吧,有问题随时问我。”

  张彪伸手接过文件夹,说道:“好的,韩总,保证完成任务!”

  不管任务是什么,无条件听指挥是张彪的信条。

  看他严肃的样子,就差立正敬礼了。

  韩路一笑了一声,给他解释起详情来:“最近的会你都跟了,我们下一步的工作中心就是自建机房。时间关系,等自己建肯定是来不及了,我的想法是,采购一批国产显卡,在张家口租几个机柜,先跑起来,等以后机房建起来了我们再迁移。”

  韩路一示意张彪打开文件夹,里面是几份打印资料,上面有简短的手写标注。

  韩路一从中间抽出一份来,摆在张彪面前,说:“上次在京城见的,国网投资的黄宇总监这几天会来海城,到时候你来对接,这些资源可以找他问问,先给数据中心那准备一个商务函发过去。”

  听见“商务函”三个字,张彪感觉浑身一僵。

  他喉结动了动,说了两个字。

  “好的。”

  韩路一看着张彪,语气很郑重:“彪哥,大胆去做,别怕搞砸,我给你兜底呢。汤圆的0.2内测版我和赵总最近调过了,你可以试着用用,看看能不能帮到你,链接我发你手机。”

  张彪慢慢点头。

  韩路一站起来,准备出去了,张彪也赶紧站起来。

  “我去趟十三楼,彪哥你先准备吧。”韩路一转过头来对张彪说,“别怕,人没有生来就会的,迈出第一步,以后就好了。有问题问我,或者问别的同事也行。”

  张彪跟着韩路一从办公室出来,回到了自己的工位。

  是的,他现在也有了自己的工位,就在韩路一的办公室门口,公司还给配了台电脑。

  张彪坐在工位上,先把韩路一给他的资料都从头到尾读了一遍。

  里面的信息很全面,包括源智科技计划使用的时间线,大概需要的机柜资源规模,让对方协助评估机柜、电力、网络、交付周期和后续对接安排等等。

  张彪打开了一个新文档,在标题先写上《商务函》,盯着空白的文档看了一会。

  他先写下来第一句话。

  “尊敬的XX,你好,源智科技有限公司申请使用机柜32台,开始时间三月初,望批准。”

  写完他自己读了读,感觉不太对。

  张彪以前写过情况说明,写过训练日志,也写过装备申请表。

  但是这商务函……该怎么写?

  他抓了抓头,然后点开了韩路一发过来的链接,一个简洁的聊天页面弹了出来。

  页面中间写着“汤圆v0.2内测版”。

  底下的对话框里有一行灰色的小字:“今天聊点什么?”

  ……

  十三楼模型组,赵文渊没有自己的办公室,和其他的同事一样坐在开放办公区。

  小牛帮赵文渊把外卖的生椰拿铁拿过来的时候,他的眼睛还盯着屏幕上的日志。

  他的工位旁边现在固定加了一把转椅,他和源码科技模型组的其他员工都已经习惯了韩路一最近每天都会花几个小时坐在这里,跟他们一起写国产显卡的软件适配。

  “文渊,怎么样了?”

  韩路一的声音传过来。

  赵文渊闻声抬起头,看到韩路一正走过来。

  “韩总,你可来了,你快坐。”赵文渊明显激动起来,“这两个算子我卡了半天了,你快看看吧。”

  这是两人最近新形成的工作模式。

  赵文渊带着手下的人用编程智能体做国产显卡的适配工作。

  每个人都分到一个算子,先设计一个通过基准,一般来说能达到N卡的百分之八十就算达标,然后用智能体一轮一轮的试。虽然成功率不高,但是效率比手写已经大大提高了,试的多了也有一些迁移工作的效果不错。

  碰上那些特别重要、特别难的,再汇报给赵文渊。

  这种情况一般赵文渊也做不了什么,他就等着韩路一来。

  韩路一坐下之后认认真真的从上到下看一遍,然后就开始写,噼里啪啦的输入一串提示词,各种关键参数和逻辑都写在里面,然后回车,等五分钟。

  这个难点就攻克了。

  经历了最初的震惊、迷茫、怀疑世界之后,赵文渊已经适应了这种模式。

  可能这个世界就是有天才吧。

  有难题,找韩总。

  我直接把韩总当我的随身老爷爷用不就完了吗?管他怎么做到的呢。

  像现在,卡了全组两天的两个算子迁移,韩路一坐下十分钟,解决了。

  第一个是RoPE。

  这个东西说白了,是让模型知道一段文本里每个词所在的位置。短文本里问题不明显,可一旦上下文拉长到十六K,显卡那边的三角函数近似误差就开始增多的厉害。之前测试的时候,前八K还算正常,到了后面,生成结果就会出现莫名其妙的错位。

  赵文渊他们试了两天,一直在精度和性能之间来回拉扯。精度压下去,速度掉得厉害;速度提上来,误差又爆。

  韩路一坐下之后,只看了一遍日志,就让智能体把sin/cos查表的粒度重新切了一档,又把缓存策略改成按block复用。

  五分钟后,十六K长上下文测试通过,性能损耗从原来的百分之四十七降到了百分之十八。

  第二个是LayerNorm。

  这个算子看起来简单,可训练里调用频率极高,慢一点点,整条训练链路都会被拖住。韩路一改了两个访存顺序,又让智能体把向量化读写补上,性能直接从N卡基准的百分之五十二拉到百分之八十一。

  赵文渊当时看着那两个绿色 PASS,心情已经很平静了。

  平静到有点麻木。

  解决完问题,韩路一制止了赵文渊想要接着工作的势头。

  “停一下,我有别的事要和你商量。”

  赵文渊看向韩路一。

  “Nexus那边开始动作了,我预测他们四月开始就不会再给我们提供API接口,所以在那之前我们要把汤圆1.0做出来,确保汤圆能接住Kaiwu海外版迁移过来的流量。”

  赵文渊听完之后在电脑上切了一下屏幕,看了看训练进度,然后对韩路一说:“韩总,时间上有点赶,但是应该来得及。只是,我比较担心的是双语适配问题。”

  赵文渊调整了一下坐姿,面向韩路一,谨慎的分析起来。

  “预训练倒是问题不大,用的互联网上的原始数据,本身就是英文居多。关键是后训练,模型的理解能力主要来源于后训练的提高,你现在提供的那批标注虽然质量极高,但都是中文的,对英文能力的提升恐怕……”

  赵文渊的话没说完整,但意思到位了。

  然后他用期待的眼神看向韩路一:“韩总,不知道英文的标注,你能不能”

  这就是赵文渊的新策略。

  有需求,找韩总。

  你别管他是怎么解决的,反正他能给你解决。

  直接问就完了。

  韩路一看着赵文渊期待的眼神,沉默了一会儿,才缓缓地点了点头:“……你确保训练进度,标注的事,我来想办法。”

  说完他起身走了。

  赵文渊赶紧投入到工作之中。

  刚才卡住的难题韩路一虽然解决了,但是他是简单粗暴的给出了正确答案,至于中间为什么这么做、和其他的替代方案比有什么提升,这些都还是空白。

  赵文渊现在要做的事是拿着问题和正确答案,补全中间的答题过程。这些对将来的研究和开发工作来说,都是至关重要的资料。

  他知道,韩路一不做这些繁琐的工作不是因为不会,而是因为工作繁忙没有时间。

  把这些资料整理好,就是他赵文渊体现价值的地方。

  况且,给天才解的题写文档这件事,也不是谁都有机会做的啊。

  想到这,赵文渊突然抬头看向韩路一离开的方向。

首节上一节167/248下一节尾节目录