AI芯片新贵XCENA融资1.35亿美元：所有人都在抢算力，它却赌「瓶颈在内存」

2026 年 5 月 29 日，韩国芯片初创公司 XCENA 宣布完成 1.35 亿美元融资，估值达到 5.7 亿美元。在 Nvidia、AMD、Groq 等巨头疯狂追逐更高算力的背景下，XCENA 却选择了另一条路——他们认为 AI 的真正瓶颈不是计算能力，而是内存。

这个反直觉的判断正在吸引越来越多投资者的关注。当 GPT-5、Gemini Ultra 等大模型的参数量突破万亿级别时，「把数据从内存搬到计算单元」的延迟成为了比「算得慢」更致命的性能杀手。XCENA 押注的，正是这个被大多数人忽视的赛道。

📌 核心要点

✅ 韩国芯片初创 XCENA 完成 1.35 亿美元融资，估值 5.7 亿美元
✅ 核心理念：AI 的最大瓶颈不是算力，而是内存带宽和延迟
✅ 万亿参数大模型时代，「搬运数据」的时间可能超过「计算」本身
✅ 在 Nvidia GPU 主导的 AI 芯片红海中，XCENA 开辟了内存优化的差异化赛道

为什么「内存」会成为 AI 的新瓶颈？

过去几年，AI 芯片行业的叙事几乎被「算力」垄断。Nvidia 的 H100、B200 GPU 不断刷新 TFLOPS（每秒万亿次浮点运算）纪录，AMD 的 MI300 系列紧追不舍，各国政府和企业争相建设 GPU 集群。但 XCENA 的创始人提出了一个尖锐的问题：如果你的计算单元足够快，但数据跟不上，再快的算力也是浪费。

这个问题的答案在大模型时代变得越来越明显。以 GPT-4 级别模型为例，其参数量约 1.76 万亿，每次推理需要将海量参数从内存加载到计算单元。随着模型规模向十万亿参数迈进，内存带宽（memory bandwidth）和内存延迟（memory latency）已经成为制约推理速度的首要因素，而非传统的计算吞吐量。

行业内有句行话：「算力在等数据」（compute is waiting for data）。在当前的 GPU 架构中，计算单元的空转率可能高达 30%-50%——不是因为算得慢，而是因为数据搬运太慢。XCENA 要解决的，正是这个「数据搬运」问题。

XCENA 的技术路线：不做通用 GPU，只做内存优化

与 Nvidia 走「通用 GPU + 大容量 HBM（高带宽内存）」路线不同，XCENA 选择了一条更专注的路径。根据 TechCrunch 报道，XCENA 的技术核心围绕以下几个方向：

近存计算（Compute-in-Memory）架构：传统芯片将计算单元和存储单元物理分离，数据需要在两者之间反复搬运。XCENA 的方案是将部分计算逻辑直接嵌入内存芯片中，大幅减少数据搬运距离。这种架构在矩阵乘法（大模型推理的核心运算）场景下尤其有效。

内存带宽优化：XCENA 开发了专有的内存控制器和互连技术，能够在不增加功耗的前提下显著提升内存带宽。对于推理场景（inference）而言，这意味着更低的延迟和更高的吞吐量。

针对推理场景的深度优化：与 Nvidia GPU 兼顾训练和推理不同，XCENA 从一开始就聚焦推理市场。推理场景对内存访问模式有独特的需求——大量参数需要被顺序读取但很少被修改，这与训练场景的随机读写模式截然不同。专用优化带来了显著的性能优势。

投资人的逻辑：AI 芯片红海中的差异化突围

XCENA 的 1.35 亿美元融资在 AI 芯片赛道中不算最高（Groq 正在筹集 6.5 亿美元，Nvidia 对非收购目标的投资达 200 亿美元），但其估值逻辑值得关注。5.7 亿美元的估值意味着投资人给予了约 4.2 倍的市销率溢价，反映出市场对「内存优化」赛道的信心。

市场时机恰到好处：2026 年，AI 推理市场正在经历爆发式增长。ChatGPT、Claude、Gemini 等大模型的日活用户突破数亿，推理算力需求增速远超训练需求。而推理恰恰是内存瓶颈最突出的场景——模型参数一旦训练完成就固定不变，推理时的大规模参数加载对内存带宽提出了极高要求。

韩国半导体产业的优势：XCENA 的韩国背景并非偶然。韩国拥有三星和 SK 海力士两大全球内存巨头，在 HBM（高带宽内存）领域占据主导地位。XCENA 可以深度整合韩国本土的内存制造产业链，这是美国或中国芯片初创难以复制的优势。

行业影响：内存赛道正在升温

XCENA 并非唯一押注内存优化的玩家。近年来，多个迹象表明「内存」正在成为 AI 芯片行业的新焦点：

Nvidia 的应对：Nvidia 最新的 Blackwell 架构大幅增加了 HBM 容量（从 H100 的 80GB 提升到 B200 的 192GB），并引入了第五代 NVLink 互连技术。这本身就说明 Nvidia 意识到内存带宽的重要性正在超越纯算力。

HBM 价格飙升：2025-2026 年，HBM3E 和 HBM4 内存的价格持续上涨，供不应求的局面反映出整个行业对高带宽内存的渴求。三星和 SK 海力士的 HBM 产能已被未来几年的订单锁死。

Chiplet 和先进封装：AMD、Intel 等公司正在通过 Chiplet 技术和 2.5D/3D 先进封装将内存更靠近计算单元，本质上是在解决同一个「内存墙」问题。XCENA 的近存计算方案可以看作是这一趋势的激进版本。

风险与挑战

尽管前景乐观，XCENA 仍面临不少挑战：

生态壁垒：Nvidia 的 CUDA 生态是 AI 芯片行业最深的护城河。XCENA 需要说服开发者和企业采用全新的硬件架构，这需要强大的软件栈支持和开发者工具链。

技术成熟度：近存计算仍是一项前沿技术，距离大规模商业化部署还有距离。XCENA 需要证明其方案在真实工作负载中的性能优势，而不仅仅是实验室基准测试。

巨头入场：如果 Nvidia、AMD 甚至三星自己决定大力投入近存计算领域，XCENA 的技术优势可能被快速稀释。初创公司的时间窗口有限。

结语

XCENA 的故事提醒我们：在 AI 芯片这场千亿美元级的军备竞赛中，「正确的方向」比「更大的投入」更重要。当所有人都在追逐更高的 TFLOPS 时，XCENA 选择了一条少有人走的路——优化内存。如果大模型继续向十万亿参数迈进，内存瓶颈只会越来越严重，XCENA 的押注可能恰恰踩中了下一个技术周期的脉搏。

对于关注 AI 基础设施的读者来说，XCENA 值得持续关注。它代表了 AI 芯片行业从「暴力堆算力」向「系统性优化」转型的趋势——而这，可能才是 AI 硬件的下一个十年。

AI芯片新贵XCENA融资1.35亿美元：所有人都在抢算力，它却赌「瓶颈在内存」