我云养了一位天后 第38节

  俞霖尴尬一笑,他这是纯在开挂,和付元峰这种一步一个脚印走到现在的业内大佬是两个体系。

  举个例子,假如俞霖和付元峰都在修仙界。

  付元峰就是勤勤恳恳,努力修行到了大乘期。

  俞霖则是路上捡了个蟠桃,吃了就飞升成仙了。

  “俞霖,你知道我为什么把你叫过来吗?”

  付元峰的话打断了俞霖的思绪。

  俞霖摇摇头老实回答道:“不知道。”

  “那你知道国外最近一直在宣传的ChatGPT吗?”

  “这个我知道。”

  “咱们这边也有在搞类似的东西,只是因为芯片算力的问题,远远比不上ChatGPT,但你的拟态神经元技术却让我看到了希望。

  之前我们一直以为,硬件强才能训练出足够厉害的AI大模型,你的算法一出来,我就知道我们错了,错的很离谱......”

  付元峰和俞霖说了一大堆,总结下来就是openai烧了几十亿美元干了五年,才在human in the loop的基础上,完成了ChatGPT的训练。

  而俞霖送来的拟态神经元技术,可以将这个时间缩短起码千倍,耗费的金钱也只是那边的零头,且成品更加优秀。

  俞霖听完以后倒没有太惊讶,毕竟这个技术可是出自夏晴那个平行时空,那边的科技本来就比俞霖所在的时空要发达的多。

  事实上,就算没有拟态神经元技术,在某个平行时空的华夏,也做出了算法方面的突破。

  在那个时空,有个名为DeepSeek的AI,这个AI采用了高达6710亿参数的MoE架构,每次计算仅激活370亿参数,通过动态路由算法显著降低计算和内存消耗。

  这种架构在保持高性能的同时大幅提高了推理效率,相比传统Transformer架构,MoE结合多头潜在注意力(MLA)和DeepSeekMoE机制优化了长文本处理和语义捕捉能力,推理效率提升约40%。

  有了算法和架构上的突破,DeepSeek V3的训练成本仅为557.6万美元,远低于GPT-4等模型的约1亿美元。

  团队通过FP8混合精度训练框架、DualPipe管道并行算法以及跨节点通信优化,实现了高效训练,仅用278.8万H800GPU小时完成14.8万亿token的预训练,且训练过程稳定无回滚。

  这种高效训练方法突破了算力瓶颈,尤其在芯片受限环境下表现出色。

  DeepSeek在高效MoE架构、低成本训练、强化学习创新、模型蒸馏、多模态扩展等领域创新,狠狠打了某些芯片巨头的脸。

  没有高性能的芯片,靠着算法和框架的突破,靠国产芯片适配,使DeepSeek的性能比肩国际顶尖模型,还通过开源和低成本策略重塑了AI行业生态,推动了技术普惠化和华夏AI的全球竞争力。

  而来自夏晴那个时空的拟态神经元技术,比DeepSeek的算法和框架技术突破还要强出两到三个档次,这也就是付元峰如此激动的原因了。

  “俞霖,国外的那个AI不出意外的话,会在年底上市,你这边有没有什么想法?你如果没有做这方面模型的计划,可以交给上头来办,上头......”

  “那个......付院士,我这里其实已经有成品了。”俞霖打断了付元峰的话说道。

  付元峰闻言眼前一亮:“有成品了?快拿出来让我看看!”

  俞霖点点头,拿出一个U盘。

  付元峰接过U盘并没有插在自己的电脑上,而是找来了另一台笔记本,把U盘插进去。

  点开U盘后,里面是两个文件,一个是电脑版,一个是手机版,付元峰打开电脑版点击安装,很快知天的图标就出现在了他的笔记本电脑上。

  然后付元峰点开了ChatGPT,同时开始测试。

  仅仅过了十分钟,付元峰就直接关掉了ChatGPT,二者差距太大了,根本没有可比性。

  之后付元峰就在专心测试知天的各项功能和反应速度。

  不管是生成对话,看图写话,生成图片,甚至是生成视频,知天都能做到。

  付元峰人都麻了,他看俞霖的眼神越来越古怪。

  他是真想不明白,俞霖单枪匹马能写出拟态神经元技术就已经很厉害了,他居然还能以拟态神经元技术为基础,训练出一个如此完美的AI大模型。

  测试了这么半天,付元峰愣是一个BUG都没发现。

  一个人能做到这种程度,也太夸张了吧?这还是人吗?

  两个小时后,付元峰的测试终于结束,他长叹了一口气道:“唉!真是长江后浪推前浪啊!俞霖你的知天很完美,完美到了能直接发布的地步,我反正是找不到一点BUG。

  不过俞霖,我不建议你直接发布这个版本的知天,它太全面了,你这么一更新,后面很有可能会更无可更。”

  俞霖闻言露出了笑容:“付院士不瞒您说,我还真不打算直接发布这个版本的知天,我会把知天的功能拆分一下,第一版只发布最基础的问答功能,后续慢慢增加其他功能。”

  “那拟态神经元技术呢?你打算授权给国内的其他厂商使用吗?”付元峰问道。

  这个问题俞霖有些迟疑,他一时也不知道该怎么回答。

  俞霖也不傻,他的拟态神经元技术现在还在专利申请阶段,付元峰能得知这个技术,那就说明肯定是上头把技术给他看的。

  也就是说,今天他和付元峰的谈话上头很有可能会知道,甚至说付元峰就代表了上头的态度。

  因此俞霖不敢直接说出自己的想法,而是试探着问了一句:“您觉得我应该怎么做呢?”

  “当然该怎么做就怎么做,安心赚你的钱,没有人会强迫你把技术共享。”

  俞霖闻言眼前一亮,他明白了付元峰或者说上头的意思,这是允许他吃独食啊!

  但很快,俞霖就想到了什么,他嘿嘿一笑道:“付院士,你这边需不需要我的拟态神经元技术呢?我可以免费授权给你。”

  付元峰当即露出了孺子可教的表情,他拍了拍俞霖的肩膀道:“我这里先不急,明天我带你去见个人,他那边是需要你这项技术的。”

第73章 收获满满

  第二天周六,也就是夏晴那边上台表演《赤伶》的这天。

  俞霖在付元峰的带领下来到了帝都很出名的胡同里。

  七拐八拐之后,两人在一间古色古香的院落前站定。

  “付院士,这里不会是哪位大领导的家吧?”俞霖试探着问道。

  付元峰没说话,径直带着俞霖走进了院子。

  “小付你来啦!”一个满头白发,精神抖擞的老人冲付元峰打了个招呼。

  “老师,好久不见。”付元峰语气恭敬地说道。

  老人乐呵呵的招呼两人坐下,然后唤了一声:“小朱,给客人泡茶。”

  “好嘞!”里屋的人应了一声,片刻后就有人端着带柄的小茶壶,以及一整套茶具过来了。

  然后一个看起来三十岁左右的女人走过来,往那特制的带柄小茶炉中加了一把茶叶和一小勺细糖,仔细炒制着茶叶同细糖。

  “小付,你带来的这位朋友是?”老人朝付元峰问道。

  “老师,他就是拟态神经元技术的开发者俞霖,俞霖这是我老师,咱们国家AI领域的创始人,文红兵文老。”

  “文老您好。”俞霖起身打了个招呼。

  文红兵哈哈一笑,忙招呼俞霖坐下:“不用这么客气,小俞啊!不介意我这么叫你吧?”

  “不介意,您随意。”

  文红兵点点头继续说道:“小俞,你可能不知道,你的拟态神经元技术对我们华夏来说意义非凡,按理来说像这样的技术我们应该公开造福全人类的,毕竟科学无国界嘛!

  但话又说回来了,我觉得科学家是有国籍的,所以这个技术我想恳求你自私一回,自己使用就可以了,国内军工和民生方面会用到你的算法,还请你不要给其他企业特别是国外的某些企业授权。

  我知道,这类专利技术的授权费用是一笔天文数字,作为给你的补偿,你有什么要求可以随便提,只要我们能满足的会尽力满足。”

  文红兵说话的功夫,小朱那边的茶叶已经翻炒的差不多了,炒制过后的细糖散发出浓浓的焦糖香味。

  看着那莹白的细糖被炒至焦黄色,混合着那股浓浓的茶叶香气,俞霖深吸了一口气,闻着那香甜的焦糖茶香,有种心旷神怡的感觉。

  只见小朱主动拿起一旁早已备好的牛奶,将牛奶倒入炒制着细糖与茶叶的小茶炉之中。

  随着“呲啦”的一声,牛奶冲入茶炉,自莹白慢慢转成牛乳茶特有的焦褐色。

  “我听说你们现在的年轻人都喜欢喝奶茶,小朱先给小俞来一杯。”

  小朱听完文红兵的话,点头应是,然后给俞霖倒了一杯奶茶。

  俞霖还是第一次喝这种奶茶,奶茶入口,茶香味很浓和牛奶的乳香味融合的非常完美。

  “这样的奶茶很不错,我还是第一次这么喝。”

  “你喜欢就好。”

  “文老,您刚刚说的事儿,我这边没什么意见,我这人就是搞技术的,不会说什么漂亮话,我是华夏人给华夏做一些力所能及的贡献是应该的。

  至于说补偿,文老不瞒您说,我这边是准备发布一个AI大模型的,我都已经喂养好了,只是这方面我没什么经验......”

  “这个好办,小朱,你帮忙联系一下,我听说现在办企业不都有政策扶持吗?像小俞这样心怀家国的年轻人就更不能亏待了,相关的扶持都给安排上。

  对了,给小俞在帝都搞一块地,让他以后留着盖公司总部,再有就是给小俞安排一台性能好点的超算,最后再给他另外搭建一个用来存储AI大模型相关数据的服务器中心。”

  “好的,我这就去办!”

  俞霖闻言嘴巴微张,这给的也太多了吧?

  能修建公司总部的地,怎么不得50亩起步?帝都的50亩地,哪怕是商业用地,哪怕是5环外那都是天文数字了。

  更别说还白送一台超算和服务器中心了。

  有这三样东西,前面的政策哪怕只是说说而已也够了。

  况且,这三样东西都给了,扶持就不可能是说说而已。

  果然是背靠大树好乘凉啊!

  中午,文红兵留俞霖和付元峰吃了个饭。

  期间再没有谈过工作了,直到下午三点的时候,小朱拿来了三四份文件。

  文红兵笑呵呵的把文件递给了俞霖,俞霖打开一看,顿时觉得口干舌燥。

  这第一份文件就是一份商业用地租赁合同,四环处109亩的一块地,俞霖只需要支付一块钱就能租赁99年。

  第二份文件是银行1亿元的无息贷款合同,且没有归还年限。

  俞霖是土鳖没见过这种合同,他估摸着这意思应该就是还不还都可以。

  第三份文件是津市一处办公楼的转让合同,老地址貌似还是在港口附近。

  最后一份文件是拟态神经元技术的各项专利,一个星期不到居然已经办下来,这效率也太高了。

  “小俞啊!钱我这边先给你申请了1亿,你要是觉得不够,可以和小朱说,让她那边给你多申请一些。

  津市那边的办公楼是我给你选定的服务器中心,这里背靠港口,可以直接用海水对服务器进行冷却,你签了字之后,那边就会开始进行服务器建设的。

  至于说超算,可能要等一段时间了,你要是着急的话,可以先申请一台小的用着,或者自己出钱买一台,咱们国家的超算是又便宜又好用,南方那些省份,随便一个小县城都有好几台超算呢!”

  “没事,文老我不急。”俞霖没敢说自己对超算的需求不大。

  按正常思维,拟态神经元技术开发完成了,下一步肯定会朝着各个方向拓展和使用该技术,这些都需要庞大的算力,因此超算是非常重要的。

  而俞霖在吃下胶囊之后,对拟态神经元技术已经完全掌握了,包括后续的应用和开发,有没有超算对他来说是真的无所谓。

  比起超算来,俞霖更喜欢钱。

  不过他这会儿也不好意思说钱太少。

  “算了,都拿这么多东西了,少就少点吧!等知天上市后,光是会员费就是天文数字,还在乎这点钱?”俞霖在心里想道。

第74章 付婷婷

首节上一节38/141下一节尾节目录