AI芯片新王XCENA融资1.35亿美元：内存才是AI真正的”卡脖子”环节

2026年5月29日，韩国AI芯片创业公司XCENA宣布完成1.35亿美元B轮融资，估值达到5.7亿美元。这家公司的核心主张颠覆了行业共识——AI最大的瓶颈不是算力（compute），而是内存（memory）。

在过去几年里，NVIDIA凭借GPU算力垄断了AI训练市场，全球科技公司疯狂抢购H100、H200、B200芯片。但XCENA的创始人认为，当模型参数规模突破万亿级别后，真正拖慢AI推理速度的不再是”算得多快”，而是”数据搬得多快”。

📌 核心要点

✅ XCENA完成1.35亿美元B轮融资，估值5.7亿美元
✅ 核心主张：AI最大瓶颈是内存带宽而非算力
✅ 采用存算一体（Processing-in-Memory）架构，打破”冯·诺依曼瓶颈”
✅ 目标场景：大模型推理优化，可降低能耗30%-50%
✅ 韩国政府+硅谷资本双线押注，AI芯片赛道出现新玩家

“内存墙”：AI行业不愿承认的隐形瓶颈

什么是”内存墙”（Memory Wall）？简单来说，当GPU的算力越来越强时，内存的读写速度却没有跟上。就像一个超级厨师（GPU）站在厨房里，食材（数据）却只能通过一条窄窄的走廊（内存总线）送进来——厨师再快，也快不过送菜的速度。

对于GPT-4级别的大模型，单次推理需要从内存中读取数百GB的参数数据。NVIDIA H100的HBM3内存带宽约为3.35TB/s，看似惊人，但在万亿参数模型面前依然捉襟见肘。XCENA的联合创始人表示：”业界花了太多钱在’让GPU更快’上，却忽略了’让数据离GPU更近’这个更本质的问题。”

存算一体：XCENA的技术路线

XCENA采用的是”存算一体”（Processing-in-Memory, PIM）架构。传统芯片中，计算单元（CPU/GPU）和存储单元（DRAM/HBM）是分离的，数据需要在两者之间来回搬运。PIM架构则将计算逻辑直接嵌入存储芯片内部，数据不需要”搬家”就能被处理。

这种架构的优势在于：

1. 带宽大幅提升：数据在存储单元内部处理，避免了外部内存总线的带宽瓶颈。XCENA声称其PIM芯片在矩阵乘法（大模型推理的核心运算）上的有效带宽是传统HBM方案的5-10倍。

2. 能耗显著降低：数据搬运是AI推理中最大的能耗来源之一。据估计，在NVIDIA GPU上运行大模型推理时，约40%的能耗消耗在内存读写上。PIM架构可以将这部分能耗降至接近零。

3. 推理延迟缩短：对于实时应用场景（如语音助手、自动驾驶），降低推理延迟比提升吞吐量更重要。XCENA的测试数据显示，其芯片在100B参数模型的推理延迟上比NVIDIA H100低约35%。

不只是XCENA：存算一体正在成为行业共识

XCENA并非存算一体领域的唯一玩家。三星早在2023年就推出了基于PIM技术的HBM芯片原型，美光（Micron）也在积极研发MRAM（磁阻RAM）存算一体方案。英特尔的Lakefield芯片中已经集成了部分PIM功能。

但XCENA的独特之处在于，它是第一家将PIM技术专门针对大模型推理场景进行优化的创业公司。其芯片设计团队来自三星半导体和NVIDIA，兼具存储芯片和GPU架构的深厚经验。

投资人与市场前景

本轮融资由韩国投资公司（KIC）领投，参投方包括多家硅谷顶级风投。值得注意的是，KIC是韩国主权财富基金，这意味着XCENA获得了国家级战略支持。韩国政府近年来大力推动半导体产业升级，XCENA的PIM技术恰好契合”存储+AI”的战略方向。

从市场角度看，全球AI推理芯片市场规模预计在2027年达到300亿美元。如果PIM架构能在大模型推理场景中获得10%的市场份额，对应的市场空间就超过30亿美元——对于一家估值5.7亿美元的创业公司来说，增长空间巨大。

挑战与风险

尽管前景乐观，XCENA仍面临不少挑战：

NVIDIA的护城河：NVIDIA不仅拥有硬件优势，其CUDA软件生态构成了极高的转换成本。XCENA需要说服开发者采用新的编程模型，这不是一朝一夕的事。

PIM的通用性局限：存算一体在矩阵乘法等特定计算上表现优异，但对于控制流复杂、分支众多的任务，传统GPU仍然更高效。XCENA的芯片可能更适合”推理专用”而非”通用计算”。

量产时间表：XCENA目前仍处于芯片设计阶段，距离大规模量产至少还需要1-2年。在这个期间，NVIDIA的B200和下一代Rubin芯片可能进一步提升内存带宽，压缩PIM的竞争优势窗口。

对行业的启示

XCENA的崛起提醒我们：AI硬件的竞争远没有结束。NVIDIA的GPU垄断地位虽然稳固，但”内存墙”问题的日益凸显为新技术路线打开了窗口。存算一体、光计算、量子计算——AI芯片的下一场革命，可能来自一个我们还没想到的方向。

对于AI从业者来说，关注内存带宽和能效比，可能比关注FLOPS（浮点运算次数）更重要。未来的AI竞争，不只是”谁算得快”，更是”谁搬得少”。

📢 喜欢这篇文章？ 欢迎在评论区分享你对”存算一体”技术的看法——你认为PIM会成为AI芯片的下一个主流方案吗？也欢迎关注获取更多AI硬件赛道深度分析。

AI芯片新王XCENA融资1.35亿美元：内存才是AI真正的”卡脖子”环节