AI芯片新贵XCENA融资1.35亿美元:所有人都在抢算力,它却赌「瓶颈在内存」

AI芯片新贵XCENA融资1.35亿美元:所有人都在抢算力,它却赌「瓶颈在内存」

🔗 分享文章:https://xlx.baby/?p=727

2026 年 5 月 29 日,韩国芯片初创公司 XCENA 宣布完成 1.35 亿美元融资,估值达到 5.7 亿美元。在 Nvidia、AMD、Groq 等巨头疯狂追逐更高算力的背景下,XCENA 却选择了另一条路——他们认为 AI 的真正瓶颈不是计算能力,而是内存。

这个反直觉的判断正在吸引越来越多投资者的关注。当 GPT-5、Gemini Ultra 等大模型的参数量突破万亿级别时,「把数据从内存搬到计算单元」的延迟成为了比「算得慢」更致命的性能杀手。XCENA 押注的,正是这个被大多数人忽视的赛道。

📌 核心要点

✅ 韩国芯片初创 XCENA 完成 1.35 亿美元融资,估值 5.7 亿美元
✅ 核心理念:AI 的最大瓶颈不是算力,而是内存带宽和延迟
✅ 万亿参数大模型时代,「搬运数据」的时间可能超过「计算」本身
✅ 在 Nvidia GPU 主导的 AI 芯片红海中,XCENA 开辟了内存优化的差异化赛道

为什么「内存」会成为 AI 的新瓶颈?

过去几年,AI 芯片行业的叙事几乎被「算力」垄断。Nvidia 的 H100、B200 GPU 不断刷新 TFLOPS(每秒万亿次浮点运算)纪录,AMD 的 MI300 系列紧追不舍,各国政府和企业争相建设 GPU 集群。但 XCENA 的创始人提出了一个尖锐的问题:如果你的计算单元足够快,但数据跟不上,再快的算力也是浪费。

这个问题的答案在大模型时代变得越来越明显。以 GPT-4 级别模型为例,其参数量约 1.76 万亿,每次推理需要将海量参数从内存加载到计算单元。随着模型规模向十万亿参数迈进,内存带宽(memory bandwidth)和内存延迟(memory latency)已经成为制约推理速度的首要因素,而非传统的计算吞吐量。

行业内有句行话:「算力在等数据」(compute is waiting for data)。在当前的 GPU 架构中,计算单元的空转率可能高达 30%-50%——不是因为算得慢,而是因为数据搬运太慢。XCENA 要解决的,正是这个「数据搬运」问题。

XCENA 的技术路线:不做通用 GPU,只做内存优化

与 Nvidia 走「通用 GPU + 大容量 HBM(高带宽内存)」路线不同,XCENA 选择了一条更专注的路径。根据 TechCrunch 报道,XCENA 的技术核心围绕以下几个方向:

近存计算(Compute-in-Memory)架构:传统芯片将计算单元和存储单元物理分离,数据需要在两者之间反复搬运。XCENA 的方案是将部分计算逻辑直接嵌入内存芯片中,大幅减少数据搬运距离。这种架构在矩阵乘法(大模型推理的核心运算)场景下尤其有效。

内存带宽优化:XCENA 开发了专有的内存控制器和互连技术,能够在不增加功耗的前提下显著提升内存带宽。对于推理场景(inference)而言,这意味着更低的延迟和更高的吞吐量。

针对推理场景的深度优化:与 Nvidia GPU 兼顾训练和推理不同,XCENA 从一开始就聚焦推理市场。推理场景对内存访问模式有独特的需求——大量参数需要被顺序读取但很少被修改,这与训练场景的随机读写模式截然不同。专用优化带来了显著的性能优势。

投资人的逻辑:AI 芯片红海中的差异化突围

XCENA 的 1.35 亿美元融资在 AI 芯片赛道中不算最高(Groq 正在筹集 6.5 亿美元,Nvidia 对非收购目标的投资达 200 亿美元),但其估值逻辑值得关注。5.7 亿美元的估值意味着投资人给予了约 4.2 倍的市销率溢价,反映出市场对「内存优化」赛道的信心。

市场时机恰到好处:2026 年,AI 推理市场正在经历爆发式增长。ChatGPT、Claude、Gemini 等大模型的日活用户突破数亿,推理算力需求增速远超训练需求。而推理恰恰是内存瓶颈最突出的场景——模型参数一旦训练完成就固定不变,推理时的大规模参数加载对内存带宽提出了极高要求。

韩国半导体产业的优势:XCENA 的韩国背景并非偶然。韩国拥有三星和 SK 海力士两大全球内存巨头,在 HBM(高带宽内存)领域占据主导地位。XCENA 可以深度整合韩国本土的内存制造产业链,这是美国或中国芯片初创难以复制的优势。

行业影响:内存赛道正在升温

XCENA 并非唯一押注内存优化的玩家。近年来,多个迹象表明「内存」正在成为 AI 芯片行业的新焦点:

Nvidia 的应对:Nvidia 最新的 Blackwell 架构大幅增加了 HBM 容量(从 H100 的 80GB 提升到 B200 的 192GB),并引入了第五代 NVLink 互连技术。这本身就说明 Nvidia 意识到内存带宽的重要性正在超越纯算力。

HBM 价格飙升:2025-2026 年,HBM3E 和 HBM4 内存的价格持续上涨,供不应求的局面反映出整个行业对高带宽内存的渴求。三星和 SK 海力士的 HBM 产能已被未来几年的订单锁死。

Chiplet 和先进封装:AMD、Intel 等公司正在通过 Chiplet 技术和 2.5D/3D 先进封装将内存更靠近计算单元,本质上是在解决同一个「内存墙」问题。XCENA 的近存计算方案可以看作是这一趋势的激进版本。

风险与挑战

尽管前景乐观,XCENA 仍面临不少挑战:

生态壁垒:Nvidia 的 CUDA 生态是 AI 芯片行业最深的护城河。XCENA 需要说服开发者和企业采用全新的硬件架构,这需要强大的软件栈支持和开发者工具链。

技术成熟度:近存计算仍是一项前沿技术,距离大规模商业化部署还有距离。XCENA 需要证明其方案在真实工作负载中的性能优势,而不仅仅是实验室基准测试。

巨头入场:如果 Nvidia、AMD 甚至三星自己决定大力投入近存计算领域,XCENA 的技术优势可能被快速稀释。初创公司的时间窗口有限。

结语

XCENA 的故事提醒我们:在 AI 芯片这场千亿美元级的军备竞赛中,「正确的方向」比「更大的投入」更重要。当所有人都在追逐更高的 TFLOPS 时,XCENA 选择了一条少有人走的路——优化内存。如果大模型继续向十万亿参数迈进,内存瓶颈只会越来越严重,XCENA 的押注可能恰恰踩中了下一个技术周期的脉搏。

对于关注 AI 基础设施的读者来说,XCENA 值得持续关注。它代表了 AI 芯片行业从「暴力堆算力」向「系统性优化」转型的趋势——而这,可能才是 AI 硬件的下一个十年。

🔗 推荐阅读:This chip startup just raised $135M on a bet that AI’s biggest bottleneck isn’t compute — it’s memory (TechCrunch 原文)

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注