新闻动态
News
首页 > 新闻动态 > 新闻资讯
返回

回顾 VAST FWD 2026:听 VAST CEO Renen Hallak 谈构建智能新基础设施

VAST CEO Renen Hallak 表示人工智能时代的最终定义,将不再取决于模型,而是取决于那个管理数十亿 AI 智能体的数据、记忆、身份与协同的操作系统。

图片

在过去几年里,人工智能领域的讨论始终围绕着大模型展开。更大的模型、更优的模型,当然还有训练这些模型所需的更快的 GPU。

但如果你仔细聆听 VAST Data 创始人兼首席执行官 Renen Hallak 的观点,你就会发现模型并不是一个完整的系统。它们只是更深层、尚未完全成型的事物在表面层次的显现。他认为,真正的系统,是协同调度智能本身的基础设施层。

图片

今年 2 月,在盐湖城举办的首届 VAST FWD 年度大会上,面对座无虚席的现场观众,Renen Hallak 为我们勾勒了未来图景。他表示,人工智能时代的最终定义,将不再取决于模型,而是取决于那个管理数十亿 AI 智能体的数据、记忆、身份与协同的操作系统。

他指出,这一转型存在一个范式。硬件率先登场,随后迎来 “杀手级应用” 时刻,凸显硬件的核心价值。但最终,复杂性会超出管理边界,行业便会发明全新的操作系统来梳理混乱。

正如他所言,个人计算真正规模化发展,是在 Windows 和 Macintosh 将个人电脑从单一设备转变为可用平台之后;移动设备真正形成生态,是在 iOS 和 Android 将手机变成可编程环境之后。

Renen Hallak 认为,人工智能如今已抵达相同的关键时刻。GPU 是硬件,ChatGPT、Claude、Grok(及同类服务)是杀手级应用。而当下崭露头角的,正是将智能打造成连贯平台的操作系统。

他提醒现场观众,尽管 VAST Data 已推出诸多创新,但最初并非以此为目标。公司起步时,解决的是一个更为普通的问题。2016 年初,神经网络初显潜力,但底层基础设施却未能跟上。彼时,DeepMind 刚展示早期突破性成果,OpenAI 也才刚刚成立不久。尽管现在回想起来似乎很遥远,但英伟达首席执行官黄仁勋当时还未向埃隆・马斯克交付第一台 DGX 系统。

当时,Renen Hallak 和 VAST Data 联合创始人看到的,是一种迫在眉睫的基础设施约束。神经网络若能以超高速接入海量数据,便能发挥强大威力,但遗憾的是,负责存储和传输数据的系统,其底层设计受制于传统权衡,无法支撑这种规模。

我们与其他领域众多潜在客户进行了沟通,随后我们意识到,高性能与高容量之间的这种矛盾,正阻碍着所有大型分析项目。若不从核心解决,它终将成为人工智能发展的绊脚石。因此,我们构建了一种全新的架构…… 从零开始设计,旨在消除层级限制,打破这种权衡。

——VAST Data 创始人兼首席执行官 Renen Hallak

当时,传统存储架构迫使性用户在性能与容量之间做出妥协。速度快的系统存储容量小,容量大的系统速度慢,这是所有人都不得不接受的局限。这催生了大量变通方案,企业需耗费巨大精力在不同层级间迁移数据。

对传统企业而言,这种妥协尚可接受(部分原因是它已成为常态)。但对机器学习领域来说,毫不夸张地说,其影响是灾难性的。一旦训练数据集规模扩大,基础设施就会因层级复杂而崩溃,高效计算几乎无从谈起。

所以,VAST Data 的创始目标是什么?答案便是打破规模与性能之间的权衡。

围绕这一目标,公司构建的架构基于 “分解式与全共享” 的理念。计算与存储可独立扩展,同事作为统一的逻辑系统运行。元数据经过重新设计,以高效管理海量数据集。网络与闪存存储被视为整体组件,而非外围技术。

最终打造出的基础设施平台,消除了容量与速度之间的历史壁垒。当时看来,这是存储领域的重大突破。但回过头看,它更像是宏大蓝图的第一层。


VAST Data 产品架构的演进回顾

在此次的首届 VAST FWD 年度大会主题演讲中,Renen Hallak 追溯了这一架构如何随着客户需求不断演进,逐步登上计算层级的。

图片

第一阶段推出的 VAST DataStore,将对象、块和文件访问统一到一个单一环境中。它不再要求企业为不同工作负载部署独立基础设施,而是让所有数据共存于一个平台。最初,这被视为资源整合,但实际上,它打破了人工智能工作负载与海量企业数据之间的主要壁垒 —— 此前,这些数据因系统不兼容而孤立存在。

下一阶段,源于一个完全不同的问题。皮克斯(Pixar)等媒体公司需要在跨大洲协作中处理 PB 级数据集。

传统复制方式让全局工作流既缓慢又脆弱。VAST Data 推出了 DataSpace,提供全局一致的命名空间,允许数据在不同数据中心、云和边缘节点间访问,且保持数据一致性。一旦具备这一能力,系统的意义就超越了存储本身。数据现在可以无处不在,却仍隶属于单一逻辑环境。放眼望去,这个存储系统已更像一个全域记忆层。

随后,新的限制浮出水面。管理数十亿文件的企业发现,扫描和索引数据集可能耗时数小时甚至数天。当系统完成遍历庞大文件系统时,底层数据早已发生了变化。解决方案不是更快的扫描,而是在平台中直接嵌入全新数据库类型。该数据库允许结构化信息、元数据、向量嵌入和应用数据共存于同一基础设施层之内。企业无需维护独立数据库、对象存储和文件系统,而是可在单个平台内管理所有信息,并实现实时查询。

至此,Renen Hallak 意识到系统已经跨越了一个关键的门槛。VAST Data 不再构建存储,而是在打造一个数据平台。但转型并未止步于此。

下一步需求来自一家基因组学公司,希望针对其数据流程实现数据驱动。基础设施本身应该在新信息出现时触发计算,而不是应用程序不断查询存储系统。

这一需求催生了 VAST DataEngine,这是一个能直接在平台内协调函数、触发器、流和过滤器的运行时环境。数据不再等待应用程序询问,而是主动驱动计算本身。

回望这一架构,你会发现熟悉的轮廓逐渐变得清晰。存储成为核心服务,数据库层组织结构化信息,执行引擎协调计算。这些正是历史上构成操作系统内核的关键要素。


VAST AI OS 的诞生之路与使命

Renen Hallak 当初并非有意打造一个操作系统,但通过逐一解决基础设施问题,该平台逐渐具备了操作系统的特征。

基于对过去和现状的认知,Renen Hallak 拓展了视野,将人工智能的未来定义为一个关键岔路口。

一种可能是,现有模型仍是复杂的预测引擎。它们将生成更优质的文本、图像和软件,但计算的整体架构仍保持不变。

另一种可能则更具颠覆性。若预测下一个词能捕捉到推理的本质,那么未来十年,系统将有望执行复杂的认知任务。智能体将以人类无法企及的速度编写软件、设计实验、协调项目,并生成科学假设。

在这个世界里,核心挑战不再是智能本身,而是协同。数十亿智能体与数据、模型和基础设施交互,将引发海量活动,必须对其进行观测、审计和控制。

这些智能体将相互通信、创建新模型、访问敏感信息,并可能在现实世界中代表人类行动。因此必须有人追踪其行动、执行政策、管理身份并维持智能体所学知识的记忆。

因此,Renen Hallak 认为,这一责任应属于人工智能操作系统。

与传统操作系统不同,该系统无法运行在单台机器上。它必须同时在数据中心、云、边缘设备和机器人系统上运行。它必须能够管理结构化和非结构化数据,同时协调训练流程、推理工作负载和推理系统。它必须能够追踪数十亿智能体的内存和通信,同时执行安全和身份政策。换言之,它必须以全域规模协同智能。

Renen Hallak 借用英伟达首席执行官黄仁勋的比喻,描述更广泛的技术栈。最底层是能源,之上是芯片和硬件,然后是云平台、AI 模型和应用程序。

该技术栈的每一层都在为 AI 时代重新构建。VAST Data 计划扮演的角色,正处于核心位置 —— 软件基础设施层,负责协调硬件与智能系统之间的数据和计算流动。

如此看来,VAST Data 在过去十年来打造的成果,看起来不再像是独立的产品,而更像是新兴操作系统的组件。DataStore 管理非结构化信息,数据库层组织结构化数据,DataEngine 协调计算。它们共同构成一个系统内核,旨在以全球规模协同人工智能工作负载。

下一阶段,是向外扩展这一内核。


打造智能体经济所需的基础设施

他描述了正在整合到平台中的几种功能:全局 KV Cache,以降低推理延迟、提升 GPU 效率;支持智能体自主微调模型的基础设施;跨智能体交互强制执行身份和政策的安全系统;以及保密计算环境,让企业能在不暴露底层权重的情况下,通过专有模型实现价值。

每项功能都可以解决一项实际的工程挑战,但当它们结合在一起,它们开始看起来像管理成熟的自主智能体经济所需的基础设施。

Renen Hallak 在主题演讲结尾,暂时跳出架构讨论。他表示,人工智能最终可能带来非凡的丰富性。软件、知识和科学发现的生成成本,可能会大幅降低。但丰富性不会自动产生智慧。技术可以加速发现,但无法决定人类应该珍视什么。

极致的个性化意味着,我们的药物将为我们量身定制、专门设计。我们的娱乐 —— 每一部电影,都将生成一次、观看一次,然后被丢弃。极致的丰富性意味着,一切都将成为一次性的。智能体科学家每秒能够测试的理论数量,将超过整个人类在一代人时间里所能提出的总和。

——VAST Data 创始人兼首席执行官 Renen Hallak

在 VAST FWD 2026 上,Renen Hallak 环视着满屋子的工程师、研究人员和架构师,将未来十年定义为一项共同的责任。

他认为,今天构建的基础设施,可能会塑造第一代能够大规模进行推理的机器的行为。正如他所言,VAST Data 的故事不在于存储,而在于基础设施的悄然演进,直到它将成为一种新智能形式之下的无形操作系统。

如果他的论点正确,那么 AI 时代最重要的系统或许并非我们与之交互的模型,而是那个记录着它们所有知识的系统。


上一篇:算力领航,赋能千行百业 | 容天汇海邀您共赴2026深圳AI