AI芯片新王XCENA融资1.35亿美元:内存才是AI真正的”卡脖子”环节

AI芯片新王XCENA融资1.35亿美元:内存才是AI真正的”卡脖子”环节

🔗 分享文章:https://xlx.baby/?p=733

2026年5月29日,韩国AI芯片创业公司XCENA宣布完成1.35亿美元B轮融资,估值达到5.7亿美元。这家公司的核心主张颠覆了行业共识——AI最大的瓶颈不是算力(compute),而是内存(memory)。

在过去几年里,NVIDIA凭借GPU算力垄断了AI训练市场,全球科技公司疯狂抢购H100、H200、B200芯片。但XCENA的创始人认为,当模型参数规模突破万亿级别后,真正拖慢AI推理速度的不再是”算得多快”,而是”数据搬得多快”。

📌 核心要点

✅ XCENA完成1.35亿美元B轮融资,估值5.7亿美元
✅ 核心主张:AI最大瓶颈是内存带宽而非算力
✅ 采用存算一体(Processing-in-Memory)架构,打破”冯·诺依曼瓶颈”
✅ 目标场景:大模型推理优化,可降低能耗30%-50%
✅ 韩国政府+硅谷资本双线押注,AI芯片赛道出现新玩家

“内存墙”:AI行业不愿承认的隐形瓶颈

什么是”内存墙”(Memory Wall)?简单来说,当GPU的算力越来越强时,内存的读写速度却没有跟上。就像一个超级厨师(GPU)站在厨房里,食材(数据)却只能通过一条窄窄的走廊(内存总线)送进来——厨师再快,也快不过送菜的速度。

对于GPT-4级别的大模型,单次推理需要从内存中读取数百GB的参数数据。NVIDIA H100的HBM3内存带宽约为3.35TB/s,看似惊人,但在万亿参数模型面前依然捉襟见肘。XCENA的联合创始人表示:”业界花了太多钱在’让GPU更快’上,却忽略了’让数据离GPU更近’这个更本质的问题。”

存算一体:XCENA的技术路线

XCENA采用的是”存算一体”(Processing-in-Memory, PIM)架构。传统芯片中,计算单元(CPU/GPU)和存储单元(DRAM/HBM)是分离的,数据需要在两者之间来回搬运。PIM架构则将计算逻辑直接嵌入存储芯片内部,数据不需要”搬家”就能被处理。

这种架构的优势在于:

1. 带宽大幅提升:数据在存储单元内部处理,避免了外部内存总线的带宽瓶颈。XCENA声称其PIM芯片在矩阵乘法(大模型推理的核心运算)上的有效带宽是传统HBM方案的5-10倍。

2. 能耗显著降低:数据搬运是AI推理中最大的能耗来源之一。据估计,在NVIDIA GPU上运行大模型推理时,约40%的能耗消耗在内存读写上。PIM架构可以将这部分能耗降至接近零。

3. 推理延迟缩短:对于实时应用场景(如语音助手、自动驾驶),降低推理延迟比提升吞吐量更重要。XCENA的测试数据显示,其芯片在100B参数模型的推理延迟上比NVIDIA H100低约35%。

不只是XCENA:存算一体正在成为行业共识

XCENA并非存算一体领域的唯一玩家。三星早在2023年就推出了基于PIM技术的HBM芯片原型,美光(Micron)也在积极研发MRAM(磁阻RAM)存算一体方案。英特尔的Lakefield芯片中已经集成了部分PIM功能。

但XCENA的独特之处在于,它是第一家将PIM技术专门针对大模型推理场景进行优化的创业公司。其芯片设计团队来自三星半导体和NVIDIA,兼具存储芯片和GPU架构的深厚经验。

投资人与市场前景

本轮融资由韩国投资公司(KIC)领投,参投方包括多家硅谷顶级风投。值得注意的是,KIC是韩国主权财富基金,这意味着XCENA获得了国家级战略支持。韩国政府近年来大力推动半导体产业升级,XCENA的PIM技术恰好契合”存储+AI”的战略方向。

从市场角度看,全球AI推理芯片市场规模预计在2027年达到300亿美元。如果PIM架构能在大模型推理场景中获得10%的市场份额,对应的市场空间就超过30亿美元——对于一家估值5.7亿美元的创业公司来说,增长空间巨大。

挑战与风险

尽管前景乐观,XCENA仍面临不少挑战:

NVIDIA的护城河:NVIDIA不仅拥有硬件优势,其CUDA软件生态构成了极高的转换成本。XCENA需要说服开发者采用新的编程模型,这不是一朝一夕的事。

PIM的通用性局限:存算一体在矩阵乘法等特定计算上表现优异,但对于控制流复杂、分支众多的任务,传统GPU仍然更高效。XCENA的芯片可能更适合”推理专用”而非”通用计算”。

量产时间表:XCENA目前仍处于芯片设计阶段,距离大规模量产至少还需要1-2年。在这个期间,NVIDIA的B200和下一代Rubin芯片可能进一步提升内存带宽,压缩PIM的竞争优势窗口。

对行业的启示

XCENA的崛起提醒我们:AI硬件的竞争远没有结束。NVIDIA的GPU垄断地位虽然稳固,但”内存墙”问题的日益凸显为新技术路线打开了窗口。存算一体、光计算、量子计算——AI芯片的下一场革命,可能来自一个我们还没想到的方向。

对于AI从业者来说,关注内存带宽和能效比,可能比关注FLOPS(浮点运算次数)更重要。未来的AI竞争,不只是”谁算得快”,更是”谁搬得少”。


📢 喜欢这篇文章? 欢迎在评论区分享你对”存算一体”技术的看法——你认为PIM会成为AI芯片的下一个主流方案吗?也欢迎关注获取更多AI硬件赛道深度分析。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注