俞霖尴尬一笑,他这是纯在开挂,和付元峰这种一步一个脚印走到现在的业内大佬是两个体系。
举个例子,假如俞霖和付元峰都在修仙界。
付元峰就是勤勤恳恳,努力修行到了大乘期。
俞霖则是路上捡了个蟠桃,吃了就飞升成仙了。
“俞霖,你知道我为什么把你叫过来吗?”
付元峰的话打断了俞霖的思绪。
俞霖摇摇头老实回答道:“不知道。”
“那你知道国外最近一直在宣传的ChatGPT吗?”
“这个我知道。”
“咱们这边也有在搞类似的东西,只是因为芯片算力的问题,远远比不上ChatGPT,但你的拟态神经元技术却让我看到了希望。
之前我们一直以为,硬件强才能训练出足够厉害的AI大模型,你的算法一出来,我就知道我们错了,错的很离谱......”
付元峰和俞霖说了一大堆,总结下来就是openai烧了几十亿美元干了五年,才在human in the loop的基础上,完成了ChatGPT的训练。
而俞霖送来的拟态神经元技术,可以将这个时间缩短起码千倍,耗费的金钱也只是那边的零头,且成品更加优秀。
俞霖听完以后倒没有太惊讶,毕竟这个技术可是出自夏晴那个平行时空,那边的科技本来就比俞霖所在的时空要发达的多。
事实上,就算没有拟态神经元技术,在某个平行时空的华夏,也做出了算法方面的突破。
在那个时空,有个名为DeepSeek的AI,这个AI采用了高达6710亿参数的MoE架构,每次计算仅激活370亿参数,通过动态路由算法显著降低计算和内存消耗。
这种架构在保持高性能的同时大幅提高了推理效率,相比传统Transformer架构,MoE结合多头潜在注意力(MLA)和DeepSeekMoE机制优化了长文本处理和语义捕捉能力,推理效率提升约40%。
有了算法和架构上的突破,DeepSeek V3的训练成本仅为557.6万美元,远低于GPT-4等模型的约1亿美元。
团队通过FP8混合精度训练框架、DualPipe管道并行算法以及跨节点通信优化,实现了高效训练,仅用278.8万H800GPU小时完成14.8万亿token的预训练,且训练过程稳定无回滚。
这种高效训练方法突破了算力瓶颈,尤其在芯片受限环境下表现出色。
DeepSeek在高效MoE架构、低成本训练、强化学习创新、模型蒸馏、多模态扩展等领域创新,狠狠打了某些芯片巨头的脸。
没有高性能的芯片,靠着算法和框架的突破,靠国产芯片适配,使DeepSeek的性能比肩国际顶尖模型,还通过开源和低成本策略重塑了AI行业生态,推动了技术普惠化和华夏AI的全球竞争力。
而来自夏晴那个时空的拟态神经元技术,比DeepSeek的算法和框架技术突破还要强出两到三个档次,这也就是付元峰如此激动的原因了。
“俞霖,国外的那个AI不出意外的话,会在年底上市,你这边有没有什么想法?你如果没有做这方面模型的计划,可以交给上头来办,上头......”
“那个......付院士,我这里其实已经有成品了。”俞霖打断了付元峰的话说道。
付元峰闻言眼前一亮:“有成品了?快拿出来让我看看!”
俞霖点点头,拿出一个U盘。
付元峰接过U盘并没有插在自己的电脑上,而是找来了另一台笔记本,把U盘插进去。
点开U盘后,里面是两个文件,一个是电脑版,一个是手机版,付元峰打开电脑版点击安装,很快知天的图标就出现在了他的笔记本电脑上。
然后付元峰点开了ChatGPT,同时开始测试。
仅仅过了十分钟,付元峰就直接关掉了ChatGPT,二者差距太大了,根本没有可比性。
之后付元峰就在专心测试知天的各项功能和反应速度。
不管是生成对话,看图写话,生成图片,甚至是生成视频,知天都能做到。
付元峰人都麻了,他看俞霖的眼神越来越古怪。
他是真想不明白,俞霖单枪匹马能写出拟态神经元技术就已经很厉害了,他居然还能以拟态神经元技术为基础,训练出一个如此完美的AI大模型。
测试了这么半天,付元峰愣是一个BUG都没发现。
一个人能做到这种程度,也太夸张了吧?这还是人吗?
两个小时后,付元峰的测试终于结束,他长叹了一口气道:“唉!真是长江后浪推前浪啊!俞霖你的知天很完美,完美到了能直接发布的地步,我反正是找不到一点BUG。
不过俞霖,我不建议你直接发布这个版本的知天,它太全面了,你这么一更新,后面很有可能会更无可更。”
俞霖闻言露出了笑容:“付院士不瞒您说,我还真不打算直接发布这个版本的知天,我会把知天的功能拆分一下,第一版只发布最基础的问答功能,后续慢慢增加其他功能。”
“那拟态神经元技术呢?你打算授权给国内的其他厂商使用吗?”付元峰问道。
这个问题俞霖有些迟疑,他一时也不知道该怎么回答。
俞霖也不傻,他的拟态神经元技术现在还在专利申请阶段,付元峰能得知这个技术,那就说明肯定是上头把技术给他看的。
也就是说,今天他和付元峰的谈话上头很有可能会知道,甚至说付元峰就代表了上头的态度。
因此俞霖不敢直接说出自己的想法,而是试探着问了一句:“您觉得我应该怎么做呢?”
“当然该怎么做就怎么做,安心赚你的钱,没有人会强迫你把技术共享。”
俞霖闻言眼前一亮,他明白了付元峰或者说上头的意思,这是允许他吃独食啊!
但很快,俞霖就想到了什么,他嘿嘿一笑道:“付院士,你这边需不需要我的拟态神经元技术呢?我可以免费授权给你。”
付元峰当即露出了孺子可教的表情,他拍了拍俞霖的肩膀道:“我这里先不急,明天我带你去见个人,他那边是需要你这项技术的。”
第73章 收获满满
第二天周六,也就是夏晴那边上台表演《赤伶》的这天。
俞霖在付元峰的带领下来到了帝都很出名的胡同里。
七拐八拐之后,两人在一间古色古香的院落前站定。
“付院士,这里不会是哪位大领导的家吧?”俞霖试探着问道。
付元峰没说话,径直带着俞霖走进了院子。
“小付你来啦!”一个满头白发,精神抖擞的老人冲付元峰打了个招呼。
“老师,好久不见。”付元峰语气恭敬地说道。
老人乐呵呵的招呼两人坐下,然后唤了一声:“小朱,给客人泡茶。”
“好嘞!”里屋的人应了一声,片刻后就有人端着带柄的小茶壶,以及一整套茶具过来了。
然后一个看起来三十岁左右的女人走过来,往那特制的带柄小茶炉中加了一把茶叶和一小勺细糖,仔细炒制着茶叶同细糖。
“小付,你带来的这位朋友是?”老人朝付元峰问道。
“老师,他就是拟态神经元技术的开发者俞霖,俞霖这是我老师,咱们国家AI领域的创始人,文红兵文老。”
“文老您好。”俞霖起身打了个招呼。
文红兵哈哈一笑,忙招呼俞霖坐下:“不用这么客气,小俞啊!不介意我这么叫你吧?”
“不介意,您随意。”
文红兵点点头继续说道:“小俞,你可能不知道,你的拟态神经元技术对我们华夏来说意义非凡,按理来说像这样的技术我们应该公开造福全人类的,毕竟科学无国界嘛!
但话又说回来了,我觉得科学家是有国籍的,所以这个技术我想恳求你自私一回,自己使用就可以了,国内军工和民生方面会用到你的算法,还请你不要给其他企业特别是国外的某些企业授权。
我知道,这类专利技术的授权费用是一笔天文数字,作为给你的补偿,你有什么要求可以随便提,只要我们能满足的会尽力满足。”
文红兵说话的功夫,小朱那边的茶叶已经翻炒的差不多了,炒制过后的细糖散发出浓浓的焦糖香味。
看着那莹白的细糖被炒至焦黄色,混合着那股浓浓的茶叶香气,俞霖深吸了一口气,闻着那香甜的焦糖茶香,有种心旷神怡的感觉。
只见小朱主动拿起一旁早已备好的牛奶,将牛奶倒入炒制着细糖与茶叶的小茶炉之中。
随着“呲啦”的一声,牛奶冲入茶炉,自莹白慢慢转成牛乳茶特有的焦褐色。
“我听说你们现在的年轻人都喜欢喝奶茶,小朱先给小俞来一杯。”
小朱听完文红兵的话,点头应是,然后给俞霖倒了一杯奶茶。
俞霖还是第一次喝这种奶茶,奶茶入口,茶香味很浓和牛奶的乳香味融合的非常完美。
“这样的奶茶很不错,我还是第一次这么喝。”
“你喜欢就好。”
“文老,您刚刚说的事儿,我这边没什么意见,我这人就是搞技术的,不会说什么漂亮话,我是华夏人给华夏做一些力所能及的贡献是应该的。
至于说补偿,文老不瞒您说,我这边是准备发布一个AI大模型的,我都已经喂养好了,只是这方面我没什么经验......”
“这个好办,小朱,你帮忙联系一下,我听说现在办企业不都有政策扶持吗?像小俞这样心怀家国的年轻人就更不能亏待了,相关的扶持都给安排上。
对了,给小俞在帝都搞一块地,让他以后留着盖公司总部,再有就是给小俞安排一台性能好点的超算,最后再给他另外搭建一个用来存储AI大模型相关数据的服务器中心。”
“好的,我这就去办!”
俞霖闻言嘴巴微张,这给的也太多了吧?
能修建公司总部的地,怎么不得50亩起步?帝都的50亩地,哪怕是商业用地,哪怕是5环外那都是天文数字了。
更别说还白送一台超算和服务器中心了。
有这三样东西,前面的政策哪怕只是说说而已也够了。
况且,这三样东西都给了,扶持就不可能是说说而已。
果然是背靠大树好乘凉啊!
中午,文红兵留俞霖和付元峰吃了个饭。
期间再没有谈过工作了,直到下午三点的时候,小朱拿来了三四份文件。
文红兵笑呵呵的把文件递给了俞霖,俞霖打开一看,顿时觉得口干舌燥。
这第一份文件就是一份商业用地租赁合同,四环处109亩的一块地,俞霖只需要支付一块钱就能租赁99年。
第二份文件是银行1亿元的无息贷款合同,且没有归还年限。
俞霖是土鳖没见过这种合同,他估摸着这意思应该就是还不还都可以。
第三份文件是津市一处办公楼的转让合同,老地址貌似还是在港口附近。
最后一份文件是拟态神经元技术的各项专利,一个星期不到居然已经办下来,这效率也太高了。
“小俞啊!钱我这边先给你申请了1亿,你要是觉得不够,可以和小朱说,让她那边给你多申请一些。
津市那边的办公楼是我给你选定的服务器中心,这里背靠港口,可以直接用海水对服务器进行冷却,你签了字之后,那边就会开始进行服务器建设的。
至于说超算,可能要等一段时间了,你要是着急的话,可以先申请一台小的用着,或者自己出钱买一台,咱们国家的超算是又便宜又好用,南方那些省份,随便一个小县城都有好几台超算呢!”
“没事,文老我不急。”俞霖没敢说自己对超算的需求不大。
按正常思维,拟态神经元技术开发完成了,下一步肯定会朝着各个方向拓展和使用该技术,这些都需要庞大的算力,因此超算是非常重要的。
而俞霖在吃下胶囊之后,对拟态神经元技术已经完全掌握了,包括后续的应用和开发,有没有超算对他来说是真的无所谓。
比起超算来,俞霖更喜欢钱。
不过他这会儿也不好意思说钱太少。
“算了,都拿这么多东西了,少就少点吧!等知天上市后,光是会员费就是天文数字,还在乎这点钱?”俞霖在心里想道。
第74章 付婷婷