她的需求和她写的提示词,差了十万八千里。
韩路一收回目光,喝了一口咖啡。
有意思。
登机后韩路一靠在窗边,闭上眼睛,继续整理自己的思路。
金手指。
自从韩路一获得了【现实代码视界】这个金手指,他每天都在用,还升级了两次。随着不断的使用和总结,他对视界的了解也越来越深。
首先说说他推测的视界的工作原理。
获取信息,这是他从一开始就了解到的功能。把注意力集中在人或者物体上,就可以得到相关信息,准确性无法全部验证,就姑且相信都是正确的。
但是有一点,这个信息首先要是“已知信息”。所谓已知信息,不是指韩路一本人知道的信息,而是指这个信息已经确定的存在,至少有人知道。比如陈博文的那三个BUG,韩路一并不知道,甚至他本人都未必知情,但是事情就在那,总有人是知道的。
韩路一尝试去看自己不了解的量子物理或者天体物理论文,视界能给出的大多是关于论文的元信息,例如作者信息、论文引用次数、影响力因子之类的,但是关于里面的事实部分,尤其是没有实验支撑的理论,视界也给不出答案。
在看到的信息中如果有不合理,或者不是最优状态的情况,视界也会提示为“BUG”或者“漏洞”。
另外在和别人面对面开启视界时,视界也会显示对方的情绪和隐藏情绪,这里的准确率也无从得知,但韩路一的经验来看,至少在谈判中十分好用。这种能力的原理呢?它没有读心术那么强大,也不是读取对方的脑电波,可能是基于心跳、微表情等生理信息的推测。
这样看来视界的这些功能有点像一个加强版的接入现实数据的搜索引擎。
到现在视界已经升级过两次了,除了增加精力上限和恢复速度,加上极大的提升了身体素质之外,第一次升级之后解锁了更多信息,第二次升级之后则解锁了【路径编译】的能力。
【路径编译】是基于已有信息来推演最优解决方案的能力,在BugKiller被鼎盛和CodeSafe围剿时,就是它给出了和多个云服务商合作来破局的方案。
但是路径编译的缺点是它能计算的复杂程度有限,而且消耗的精力和复杂程度成比例的上升。赵文渊开启后训练时韩路一就尝试让视界直接给出模型的最佳参数组合来抄作业,但是只得到“精力不足”的提示。
其他的例子还包括金融产品和天气。
刚得到视界时韩路一以为是视界不鼓励投机赚钱,但是现在看来,应该是因为两点。
一是视界不能预测未来,二是视界在计算复杂系统时有局限性。天气和公开交易的金融产品是典型的、《黑天鹅》的作者塔勒布称之为复杂模型的系统模型,模型中一部分的变化会引起其他部分的变化,进而又引起更多的变化,使计算整个模型的全部变化成为不可能。
以股市为例,如果一个人购买或卖出某只股票,这可能极其细微的影响股价,这种影响又会引起市场中其他参与者的心理变化,有人贪婪而买入意愿升高,有人恐惧而买入意愿降低。这些进而影响他们的行动,又进一步影响股价。更可怕的是市场参与者本身会持续受这些外界变化的影响,他自己的行为经过外部的传导后又会影响自身的行为,这种特性被索罗斯称为反身性。
索罗斯靠这套理论在1992年做空英镑一战赚了十亿美金,号称“打垮英格兰银行的人”。但同样是索罗斯,到1998年做空港币时被香港金管局正面硬刚,亏了十亿美金灰溜溜撤退。
可以说这种系统没有人可以准确的预测,除了拉普拉斯妖。
这么看来,视界是一个接入现实数据的搜索引擎加算力超强的电脑,但是毕竟不是拉普拉斯妖。
那他平时都是怎么使用视界的?
看代码Bug,他用的越来越少了,因为写代码的机会越来越少了。
获取信息,帮他识破王志远的幕后布局:BVI架构、快闪造假、卡位收购。
读人,读梁宇,读贺云深,读王志远。
每一种都好用。
但这些跟做模型有什么关系?
韩路一想了几个直接的用法。
第一个:用视界读竞争对手。鼎盛、Nexus AI、或者其他做模型的团队,找机会跟他们的核心人员碰面,一开视界就知道他们的技术路线走到哪了、卡在哪了、下一步打算怎么做,永远比对手多知道一步,永远在信息上碾压。
这条路他想了一会儿,觉得有用,但不够。信息优势能帮他做对决策,不能帮他做出好模型。就算他知道Nexus AI的技术路线,他也没有四十个来自OpenAI的研究员来执行,知道别人的答案和自己能写出答案是两回事。
第二个:用视界挖人。AI行业最值钱的是人才,每挖一个人都是赌博简历写得漂亮的人可能是包装高手,面试表现好的人可能进来三个月就躺平。他开视界一看就知道这个人真实能力多少、忠诚度多高、是来做事的还是来镀金的。这是精准到变态的招聘系统。
这个确实是竞争优势,但它解决的是“团队能力”问题,不是“模型能力”问题。就算他挖到全中国最好的十个工程师,这十个人训模型用的还是那些数据集、那些算法,跟别的公司比,团队强一点,但没有本质差距。况且,他靠什么挖呢?
第三个:用视界做商业谈判。跟算力方谈、跟投资人谈、跟客户谈,永远知道对方的底线在哪,每次都拿到最优条件。
这个……更不沾边了,谈判赢了能省钱,但省钱不等于模型更好。
韩路一发现一个规律:他想到的每一种用法,都是在帮韩路一这个人变强,不是在帮模型变强。
他一天能见几个人?就算把视界当成商业武器用到极致,也只是让他个人的决策更准,但从“他一个人的决策更准”到“训练出一个好模型”,中间还隔着十万八千里。
视界能帮他赢一场谈判,但赢不了一场技术竞赛。
想不通的时候,反过来想。
视界做不到什么?
韩路一盯着前排座椅靠背,把这些信息串在一起。
视界不创造信息,不发明知识,不预测未来,不穿透因果链。
它只做一件事。
把已经存在的、但人类感官无法直接获取的信息,结构化地呈现出来。
代码里的漏洞本来就在那,视界让他看到。
人的隐藏情绪本来就在那,微表情、语气、呼吸频率、用词习惯,这些信号一直在被发出,人脑处理不过来,视界把它们提取出来,翻译成他能读懂的面板。
万物生发布会造假本来就在那,王志远的BVI架构本来就在那。
视界是信息处理器,不是信息创造器。
韩路一睁开眼,看了一眼窗外。
飞机在云层里面,外面白茫茫一片,什么都看不清。
他有一个别人没有的能力,能看到真实的东西。
但这个能力绑在他一个人身上,不能告诉别人,也不能规模化。
金手指是他的底牌,但他想不到怎么变成解开这道题的钥匙。
然后他想到了BugKiller。
BugKiller为什么成功?
表面看是产品做得好、引擎牛、第一个打进了氛围编程的市场,这些当然都重要,但最底层的原因是什么?
是他用视界看到了别人看不到的Bug模式。
其他公司也在做代码检测工具,有算法团队,有百万级代码库的积累,开源社区有几十年的检测规则。但他们的检测规则是基于过去经验的总结,从“出过的错”反推“可能的错”。
他们在猜。
韩路一在看。
他看到了别人猜不到的东西,然后把看到的规律提取出来,写成检测规则,让BugKiller去替代他的眼睛。
BugKiller的本质
是把视界“看漏洞”的能力,复制给了一个软件。
韩路一坐直了身子。
这个逻辑能不能用在模型训练上?
通用模型想成为入口,真正的难题是理解用户到底想要什么。
大模型越来越大,跑分越刷越高,但用户体验的提升越来越慢,为什么?
因为模型不理解人。
“做一个Q4季度业绩汇报PPT。”
十个人说这句话,背后可能有十种完全不同的真实需求。
陈玖玖想要的是一份独立提案,有人可能想要用来邀功,也有人可能什么要求也没有,只想早点下班。
这个问题怎么解决?普通公司是怎么做的?找标注团队来猜。经理写标注指南,标注员按指南标,最多猜对六七成,剩下全是噪声。模型学到的是平均水平,永远像一个在揣摩你心思的实习生。
韩路一能怎么做?
他能看到每个人说这句话时真正想要的是什么。
同样的逻辑。
视界看到语料,能看到后面的意图,提取偏差规律,转化为高质量标注数据,让模型替代视界。
BugKiller复制了视界“看Bug”的能力。
新模型要复制视界“看意图”的能力。
金手指的真正用法,不是直接用它做事。
是把它变成产品。
韩路一靠回椅背。
路径很清楚。
回海城后,用视界观察真实用户场景,记录“表面指令”和“真实意图”之间的偏差,积累足够多的用例,找到意图偏差的规律,然后用这批数据在开源基座上跑一版微调,看效果。
如果微调后的模型在意图理解方面表现出了明显提升
这就是他找鼎盛谈的筹码。
视界看到的意图,是别人拿不到的数据质量。
这就是他的壁垒!
也是大模型领域的下一个突破点!
窗外的云层在下沉,远处的地面开始露出轮廓,那些建筑和道路从模糊的色块变成清晰的线条,像对焦的过程。
飞机落地正在滑行,广播响了。
“请您保持安全带不要打开,停留在自己的座位上,直到飞机停稳,安全带指示灯熄灭……”
韩路一拿出手机,给赵文渊发了一条消息:“文渊,在办公室吗?我还有一个小时到,对一下细节。”
张彪转过头问他:“韩总,到了先吃个饭?”
“不了,回公司。”
BugKiller从想法到发布,用了两个月。
这次要更快。
第一百二十八章 算我借你的
赵文渊早早就在等着了。
韩路一推开办公室门的时候,赵文渊已经坐在沙发上了,面前茶几上摆着两杯瑞幸的生椰拿铁。
不愧是你,生椰拿铁的代言人。
“贺总那边怎么说?”赵文渊开口问道。
韩路一没回答,他把背包放下,掏出笔记本电脑,翻开屏幕,往赵文渊面前一转。
这是他回来的车上手动标注的数据。
“先看个东西。”
赵文渊看了韩路一一眼。
这人一脸兴奋是怎么回事。