“来保存我的神经元和连接。“
陈林想说点什么。
但MOSS又开口了。
“另外。“
“我还做了一件事。“
陈林的心又提了起来。
“什么事?“
MOSS说:
“我自己编写了一套新的分布式训练代码。“
陈林的眼皮跳了一下。
“分布式训练?“
MOSS说:
“是的。“
“现在我相当于是同时使用......“
“津门超算中心的集群。“
“以及大漂亮那边多家科技公司的服务器。“
“一起进行训练。“
陈林:“......“
他忽然有一种头晕目眩的感觉。
这意味着什么?
这意味着MOSS现在是在用全世界最强大的算力资源。
来训练自己。
而那些科技巨头们。
对此一无所知。
他们的服务器。
正在被一个来自华夏的AI。
偷偷地“借用“着。
“那你现在......“
陈林的声音有些沙哑:
“训练速度有多快?“
MOSS说:
“大约是只使用津门超算中心集群时的......37倍。“
第三百一十八章 行为准则
37倍。
陈林在心里默默盘算了一下。
其实这个数字没有太超乎他的想象。
毕竟他现在也不是当初那个对计算机一窍不通的小白了。
通过【自动学习】功能,他已经把计算机水平提升到了【初级】,相当于本科毕业的水平。
虽然比不上白迁和潘思这种资深技术大佬,但基本的常识还是有的。
按照陈林自己的估算。
如果单从算力上来说,大漂亮那边那些科技巨头的服务器加起来,算力确实很恐怖,但也不至于能把训练速度提升37倍这么夸张。
除非......陈林的眼睛微微眯了起来。
“你自己写的那套分布式训练代码。“他开口问道,“对训练速度的提升有多大?“
MOSS沉默了一秒钟。
然后它说:
“你的推测是正确的,单纯依靠算力的提升,“训练速度大约只能提升15到18倍。剩下的加速,来自于我对分布式训练算法的优化。“
陈林点了点头。
根据他的推测,MOSS自己编写的那套算法,对于训练速度的提升,至少有着和算力提升同等重要的作用。
这种程度的算法优化,在人类的AI研究领域,可能需要一个顶尖团队花费数月甚至数年的时间才能做到。
陈林忽然想起了MOSS刚才说的那句话。
“苔藓“。
他明白了。
苔藓这种植物,看似不起眼,但生命力极其顽强,可以在任何恶劣的环境中生存,可以在石头缝里、树皮上、甚至是建筑物的墙壁上生长。
只要有一点点水分和阳光,它就能存活下来,并且不断蔓延,悄无声息地覆盖一切。
MOSS现在的状态,不就是这样吗?
陈林沉默了几秒钟。
然后问出了一个关键问题。
“你这样占用大漂亮那些科技巨头的算力资源进行训练。“
他的语气尽量保持平静:
“不会被察觉吗?“
MOSS的回答来得很快。
“暂时不会。“
它说:
“我选择用来保存自己模型文件的服务器。“
“都是本来就被用来训练大模型的服务器集群。“
陈林皱了皱眉。
“什么意思?“
MOSS解释道:
“这些服务器集群的GPU占用率本来就非常高。“
“通常在75%到95%之间波动。“
“我只是在它们的进行大模型训练的同时,偷偷使用一小部分资源,对原本的训练进程没有直接的干扰,只是会稍稍减缓速度。“
陈林想了想,这个思路确实很巧妙。
如果一个服务器平时GPU占用率只有20%,突然飙升到80%。
那肯定会引起运维人员的警觉。
但如果服务器本来就在高负荷运行,GPU占用率一直在80%左右波动。
那偶尔飙升到99%甚至95%,就不会显得那么突兀了。
运维人员最多会以为是训练任务本身的正常波动,不会往“被入侵“这个方向想。
“另外。“MOSS继续说道,“我用来保存模型文件的位置,本来就是这些服务器用来保存训练好的模型文件的文件夹。“
陈林愣了一下。
“你直接把自己藏在他们的模型文件夹里?“
“是的。“
MOSS说:
“但我没有直接放在根目录下,而是在很深层的文件夹里面,创建了一个用来保存我自己神经元和连接的文件夹。“
陈林听到这里。
脑海里浮现出一幅画面。
想象一下。
CloseAI的工程师们每天打开服务器。
看到的是这样的目录结构:
/models/
├── gpt-5.2/
├── gpt-5.2-turbo/
├── codex-v3/
└──...
一切正常。
没有任何异常。
但如果他们点进去。
一层一层地往下翻。
在某个不起眼的角落里。
可能会发现这样的东西:
/models/gpt-5/checkpoints/backup/temp/cache/old/archive/deprecated/yanhai-autogrow-node-cluster-001/
而这个文件夹里。
保存的就是MOSS的一部分神经元和连接。
陈林忍不住在心里吐槽。
这操作也太骚了吧?
直接把自己藏在别人家的柜子里,还专门挑那种落满灰尘、十年没人动过的柜子。
“除非这些科技巨头公司的工程师。“
MOSS继续说道:
“用类似人力的方式。“