全新

认识你的队友,Simular 1.0

加利福尼亚州旧金山
2025 年 12 月 1 日

今天,我们将启动 Simular 1.0,我们的原生桌面代理,可以在您已经使用的应用程序中执行复杂的多步骤任务。对我来说,这次发布是早在 “人工智能代理” 成为流行语之前就开始的旅程的高潮。

2019 年,当我在DeepMind研究多代理系统时,除了一位同事Jiachen,他后来成为我在Simular的联合创始人之外,很少有人对我正在探索的道路感到兴奋。快进到2025年:“人工智能代理” 一词无处不在,每家初创公司都声称正在建立一个。

但是有一个令人不安的现实:当今大多数 “代理人” 的行为实际上并不像特工。

它们无法执行漫长而复杂的工作流程。他们产生幻觉,无法重蹈覆辙。许多最受欢迎的 “代理” 用例实际上只是生成式人工智能——制作套牌、视频或图像——这些任务几乎不需要长远规划,也几乎不需要适应不断变化的现实世界网站和桌面环境。

对我们来说,真正的代理应该了解用户意图,启动任务,找到最佳的前进方向,可靠地重复之前取得的成功,所有这些都要靠自己。就像一个好队友一样。制造特工的传统途径是清除人类。我们认为,人类必须为机器注入正确的目标和价值观,做出判断并成为质量的看门人。

而且我们的 AI 代理并不是完全建立在 LLM 之上的。我们使用神经符号框架,将 LLM 的创造性、探索性与代码的确定性相结合,从而重复成功并保证可靠性。

一款支持你并向你学习的桌面代理

Simular 1.0 旨在将 AI 代理引入真实的日常工作流程。它由人工参与训练,允许用户在任何步骤使用自然语言重定向或更正代理。随着时间的推移,它会像真正的队友一样从这种监督中学习,在重复成功的工作流程方面变得越来越可靠。

Simular 1.0 还支持用户可以配置上下文任务触发器,以便根据计算机上的实时活动自动启动正确的工作流程。大脚怪, 我们最喜欢的 Simular 吉祥物,为这些任务触发器提供友好的提示和提醒,为用户提供更平易近人和人性化的感觉。

在过去的一年中,我们直接将技术带出研究实验室,并将其转化为企业使用的产品,从任务关键型保险工作流程到创意营销中的开放式网络导航任务,应有尽有。现在,我们正在向更广泛的消费者群开放这项功能。

代理行业人满为患吗?是的。但是浪潮并没有退缩。如果有的话,它正在加速。就在八个月前,我们的代理在计算机任务执行基准OSWorld上实现了34.5%的成功率。如今,这一比例为69.9%,接近人类的72%。随着代理开始可靠地执行真实的计算机任务,我们预计新的工作流程和用例将激增,这是以前根本不可能的。

研究和基准测试的背后是我们的目标。

计算机是为了帮助我们而创建的,而不是为了浪费我们的时间来点击、打字和切换选项卡。然而,这就是现代作品的样子。在 Simular,我们的使命是让人们重获时光。是时候感受真正的激情和他们的亲人了。

Simular 1.0 是朝着未来迈出的一步。感谢您一开始就和我们在一起。



2025 年 12 月

建造自主计算机并不意味着取代人类。这意味着合作。

下载 Simular 1.0(macOS 15+ 芯片)