天才一秒记住【久久文学】地址:https://www.jjwxx.com
杰夫·迪恩拿起电话,声音不容置疑,“通知皮查伊,还有deepmind的哈萨比斯。
所有人,立刻上线。”
……
第二天,谷歌最高级別的战略会议室。
会议室里的气氛,冷静得近乎压抑。
这里坐著的,是谷歌技术体系的最高大脑:桑达尔·皮查伊(ceo)、杰夫·迪恩(首席科学家)、戴密斯·哈萨比斯(deepmind创始人)。
屏幕上投射的,正是徐辰的那篇论文。
“结论?”
皮查伊的声音听不出情绪。
杰夫·迪恩推了推眼镜,指著架构图上的核心模块:“从数学上讲,这是完美的。
它绕过了transformer最大的缺陷——注意力机制的计算冗余。
它用几何关係替代了注意力权重,这让逻辑推理变成了『查表而不是『计算。”
“但是,”
杰夫的话锋一转,切中了商业逻辑的要害,“这对我们现有的基础设施,是一个灾难。”
“解释一下。”
“我们的tpu,其核心架构是脉动阵列。
这种架构是为了大规模矩阵乘法而生的。
它就像是一个巨大的流水线工厂,只有当数据像洪流一样整齐划一地流过时,效率才最高。”
杰夫调出一张对比图:
“但徐辰提出的slrm模型,其核心算子是极值、交集和隨机採样。
这些操作充满了条件判断和非线性变换。”
“如果让tpu跑这个,就像是让一辆f1赛车去送外卖。
赛车很快,但它在红绿灯和楼道里会卡死。
我们的tpu利用率会从70%暴跌到5%以下。”
会议室陷入了死寂。
这意味著,谷歌引以为傲的算力护城河,在这个新算法面前,失效了。
“英伟达呢?”
哈萨比斯突然问道,“他们的gpu会好一点吗?”
“好不到哪去。”
杰夫摇头,“cuda核心虽然比tpu灵活,但本质上也是单指令多线程架构,依然依赖数据並行。
面对这种高维几何逻辑,gpu的缓存命中率会低得令人髮指。”
皮查伊的手指轻轻敲击著桌面。
作为ceo,他看到的不是技术难题,而是战略危机,也是战略机遇。
“如果这个算法是真的,那么谁先造出適合它的硬体,谁就定义了下一代ai。”
皮查伊抬起头,目光锐利:“成立『几何计算专项组。
deepmind负责算法復现,硬体团队立刻评估tpuv6架构调整的可能性。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!