吴英豪转过来,打了个招呼。又翻了翻日志:“最近的新入库的,我看看……几天前外部采购的了一批,放进去用了。”
刘大海点点头,说:“这批数据质量贼拉好了,Loss下来了,还比上一轮快不少,应该少不了这批数据的功劳。”
吴英豪愣了一下,随即起身往刘刘大海耳边凑了凑,语气里带了点小心翼翼的热切:“大海老师,这批数据进来的时候噪音很多的,是我们自己花时间处理的,好几个同事加班跑的清洗流程,您觉得效果好?”
吴英豪笃定了刘大海不会追问数据的具体来源,因为他从不过问,这也不是他的职责范围。
“洗得好啊!”刘大海说,语气很认真,“这批比之前做的都好,你们继续保持。”
吴英豪笑着应下,连连点头,快速地扫了下周围确认没有往这里留意他们谈话的同事。
刘大海回到工位,打开本周的训练周报,在进展一栏里加了几行:
「预训练本轮数据质量较上轮明显提升,Loss收敛速度加快约9%。初步判断与新入库语料质量相关,数据组本轮清洗工作到位。坤元预训练阶段进展顺利,按计划推进。」
他看了一遍,改了两个字,提交。
周报发出去,进了林绍峰的收件箱。林绍峰是负责算法和AI的副总裁,每周五下午会把各组的周报汇总,转给需要知道的人。这是固定流程,四五页纸,今天的内容不少,坤元这段藏在第三页中间,不长,没有标红,没有加粗。
当天晚上,张弛在手机上收到林绍峰转发过来的汇总周报。
他快速往下划,找和算力相关的部分。坤元的进展在第三页,他划过去,眼神在上面停了不到两秒,继续往下看。没什么特别的,预训练在跑,Loss在降,一切正常。
每个人都在站在自己的那块拼图上,看见的都是真的,拼成什么却没人知道。
……
与此同时,坐在办公室里标数据的韩路一疑惑地看了看视界:最近经验值是不是涨的更快了?
第一百八十五章 侦探小姜的第二个案件
早上八点四十五分,姜亦心把路上买的煎饼果子和豆浆放在工位上,然后去茶水间拿了一包薯片,坐进自己的格子间,美美的开始了她的“高效早起流程”。
她一边吃着早饭,一边打开飞书的未读消息。
满满的一屏幕。
这不是哪个卷王同事连夜发来的夺命连环call,而是她自己写的飞书机器人。
机器人的名字叫“早八摘要”。
这是姜亦心上个星期用智能体自己“氛围编程”出来的小工具。
虽然她现在已经转成了产品负责人,不再往公司主仓库里提交业务代码了,但她毕竟是计算机专业毕业的学霸,毕竟是开发转的产品,技术上可没手生。
从她和钱晓乐把编程智能体做出来之后,她自己就先成了一个重度用户。
以前上大学的时候姜亦心也会时不时给自己写一个效率小工具。
像她上大学的时候就给自己写过一个抢课脚本。
那时候学校的教务系统每到抢课日就像春运售票大厅,提前半小时页面就开始卡,到了放课那一秒,宿舍楼里此起彼伏全是刷新声。热门通识课更是重灾区,电影鉴赏、心理学导论、葡萄酒文化这种课,名额刚放出来,页面还没刷开,就已经显示余量为零。
姜亦心一开始也老老实实跟大家一起刷。开着三个浏览器,手机电脑一起上,眼睛盯着倒计时,手指按在F5上,结果连着两学期都只抢到一堆周五晚上和周一早八的课。
第三次抢课前,她终于忍不了了。
学计算机之前我老老实实抢课,学了计算机我还老老实实抢课,这计算机我不是白学了?
正好当时她们专业课学到网络安全,姜亦心把课上新学的知识全用上了。
她先是花了一个周末研究学校教务系统,抓包看请求,再分析登录态和验证码刷新逻辑。又一点一点把选课接口、课程 ID、提交参数和失败返回码扒出来。
最麻烦的是教务系统写得很烂,同一个操作有时候返回 JSON,有时候返回一段 HTML,错误提示还藏在页面脚本里,她连着好几天调到凌晨三点,才把整个流程跑通。
抢课那天,她没再疯狂刷新网页,只是提前把课程 ID填进配置文件,时间一到,脚本自动登录、轮询余量、提交选课。三秒钟后,屏幕上跳出一句“选课成功”。
后来这个脚本传到了同学手里先是给大刘用,然后是其他同寝的室友们也用,后来整个计算机系都在用。
再后来,就暴露了,别的专业同学说怎么电影鉴赏课全是计算机系的学生在上。
事情最后闹到教务处。
教他们网络安全的教授被教务处叫去帮忙,花了两天时间给教务系统补写了一套反脚本机制。
然后姜亦心就被叫去谈话了。她本来战战兢兢以为要被处分了,没想到教授见了她之后,直接带她现场考她的代码,问她自己写的脚本该怎么防。
最后不仅没给她处分,还给她的平时成绩打了满分。
这件事让姜亦心一战成名,成了计算机系闻名的学霸。
她现在想起来还挺骄傲的。
但是以前即使只是写个小工具,那也是体力活。
能写出来的是小部分,大部分项目都是创业未半而中道崩殂。
尤其是这种自用工具,需求来得快,消失得也快。经常是她兴致勃勃新建了一个文件夹,README写得比代码还完整,结果写到第三个异常处理就开始怀疑人生。
最后工具还没写完,事情先过去了。
文件夹里只剩下一堆名字很热血、完成度很可怜的半成品项目。
但是有了智能体之后就完全不一样了!
她只要把需求拆清楚,剩下的代码可以直接让智能体生成。
最后她自己再看一遍,改几处不顺手的地方,跑两次测试,一个多小时就把东西搭出来了。
这种感觉,有点儿上头!
想到一个提高效率的小点子,就能随手“氛围”出来,接入到自己熟悉的工作流里,有哪些智能体不能自己解决的权限问题,她还可以随时接管。
这个和使用开物的感觉不一样,开物专注于生成APP,给没有技术背景的用户使用,自带交互界面,最终呈现的是APP和终端用户之间的互动。
但是智能体反而是专为程序员设计的,可定制化程度更高,姜亦心可以自定义和外部信息的交互。
比如这个“早八摘要”机器人。
它每天早上定时抓几个外网的公开信息源:TechCrunch、The Verge、Product Hunt等几个科技媒体,几个AI自媒体账号,还有她手动加进去的一些关键词页面。
只要标题或者正文命中Nexus、Kaiwu、AI dev tool这一类关键词,就把内容通过AI生成摘要,每天早晨八点再通过飞书机器人把链接推过来。
对一个产品负责人来说,这已经够用了。
后台数据能告诉姜亦心自己的用户在做什么。
而这个小工具,则提醒她外面的人在做什么。
升职之后,姜亦心负责统筹源码公司所有的产品线,手下管着三个产品经理,既要跟进产品决策,也要负责一部分和Nexus的合作对接。所以她不能只盯着后台数据,也要盯着海外舆论和行业信号。
通常,“早八摘要”每天会推三到五条新闻。
但是今天推了九条。
前面几条都很常规。
一条是X上有用户分享Kaiwu使用心得又火了,说自己用 Kaiwu做了一个家庭预算管理工具,很多人在转发和求链接,原帖主顺势发了收费版。
一条是Product Hunt上有个热门话题,建议Kaiwu增加更多模板。
还有一条是TechCrunch的AI产品周报里提了一句Kaiwu,说它是最近增长很快的AI APP构建工具。
都是喜讯,姜亦心快速扫过,就准备继续往下看。
然后她的目光停在了第七条。
这是一条来自某科技媒体的付费墙简讯摘要。
标题很长。
《Nexus tests AI development tool for non-technical users》(Nexus开始测试一个面向非技术用户的AI开发工具)
姜亦心点开摘要。
大意是Nexus正在内测一款面向非技术用户的 AI开发工具,目标用户包括中小企业主、独立开发者和内容创作者。
单独看,这不算什么。
Nexus这个规模的独角兽公司,内部测试一个AI工具很正常。
姜亦心继续往下看。
第八条来自LinkedIn(领英海外版)。
是一个个人动态,发布动态的人叫David Chen(陈大卫)。
他是硅谷大厂出身,现在在Nexus AI产品部门,已经干了两年多了。
三天前,他发了一条很短的状态。
【Exciting new project. More soon.】(令人激动的新项目,还有更多)
下面有人评论问:“Is this related to dev tools?”(和开发工具有关吗?)
David Chen只回了一个笑脸。
这也不算什么。
大厂员工在LinkedIn上发这种半遮半掩的动态太常见了,纯吊你胃口,最后发布出来的东西很多都不怎样。
姜亦心继续看第九条。
这是一个自媒体博主发布的AI行业报告,整理了最近一周AI公司招聘动态。
其中有一条是Nexus的岗位。
【PM,AI Creation Tools】(产品经理,AI创作工具)
岗位描述里有一句话:熟悉亚太地区非技术用户的使用习惯,有AI工具的相关管理经验。
姜亦心盯着这句话,再加上科技媒体那条简讯,再加上Nexus员工那条 LinkedIn动态。
三条单独看都不算什么,但拼到一起,就只有一个意思Nexus要自己做一个Kaiwu。
而且,他们也瞄准了亚洲市场。
姜亦心眯了眯眼睛,眼神变得犀利起来。
她知道和Nexus的合同四月到期,她也察觉到Nexus那边的人对Kaiwu的态度越来越微妙。
他们一边继续通过Kaiwu拿真实用户场景的数据,一边在沟通里越来越少提长期规划,越来越多提“阶段性合作”“数据共享边界”“未来产品方向保持开放”。
之前这些东西只是让姜亦心觉得不舒服。现在她知道这个不舒服是哪来的了。
姜亦心有点儿方。
定了定神,她先给苏念念发了条飞书消息:
“苏总,你现在有空吗?有个事想跟你说。”
过了几分钟,苏念念回复了:
“来我办公室说。”
姜亦心把连在笔记本电脑上的数据线拔下来,抱起电脑直奔苏念念的办公室。
“什么事?”苏念念从办公桌后面抬起头。
姜亦心直接把屏幕摆在她面前。
“您先看看。”