天才一秒记住【久久文学】地址:https://www.jjwxx.com
掛断电话后,朱宋纯並没有坐回办公桌前。
他走到巨大的落地窗边,脑海中预演完这场即將到来的风暴。
“slrm……”
朱宋纯在心中默念著这个缩写。
作为一个在ai领域摸爬滚打三十年的老兵,他太清楚一项新技术从实验室走到產业链,中间隔著多少道鬼门关。
资源是有限的,时间是紧迫的。
要想在镁国人的眼皮子底下完成“换道超车”
,必须要有精密的战术编排,形成不可逆转的“飞轮效应”
。
“第一步,必须是晶片。”
朱宋纯目光一凛。
他当然知道“硬体彩票”
理论——通常是硬体决定了哪种算法能活下来,而不是反过来。
为一个新算法定製晶片是一场豪赌,贏了通吃,输了倾家荡產。
但在slrm面前,这註定是一场值得押上身家性命的赌局。
因为这可能是目前华国ai唯一一次掀翻桌子的机会。
“软体优化是有极限的。
在gpu架构上跑逻辑推理,就像是在沙地上跑f1赛车。
gpu的数千个cuda核心是为矩阵乘法这种『大吞吐、低逻辑的任务设计的。
而slrm的核心是『gumbel-box,充满了条件判断和非线性变换。”
“如果不解决底层硬体的適配问题,slrm永远只能是个『慢吞吞的数学玩具。”
“所以,必须由国家队进场。
海思、寒武纪,必须在下一代晶片的ip核中,硬化『gumbel-box算子,设计专用的lpu(逻辑处理单元)。”
专业计算卡相比通用卡的优势是巨大的。
当年比特幣挖矿,一开始大家也用显卡。
但后来比特大陆搞出了专用asic晶片,能效比直接提升了百倍,瞬间把显卡扫出了挖矿市场。
“slrm也是一样的道理。
它对製程不敏感,不需要追求台积电的3nm、5nm极致工艺。
哪怕是用国內成熟的14nm甚至28nm工艺,只要架构对了,去掉了gpu里那些为了图形渲染而存在的冗余单元,专攻逻辑推理运算,其能效比也能吊打英伟达的4nmh100。”
“这一步最慢,流片周期至少三个月,所以必须最先启动,作为『矛尖。”
……
“第二步,是生態的『躯干——编译器与中间表达(ir)。”
朱宋纯的思绪转向了软体层。
“光有晶片还不够,得让开发者用得爽。”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!