作者: Kevin, the Researcher at BlockBooster

AI Agent 框架作为行业发展的关键拼图,可能蕴藏着推动技术落地与生态成熟的双重潜力。市场中热议的框架有:Eliza, Rig, Swarms, ZerePy等等。这些框架通过Github Repo吸引开发者,建立声望。以“库”发币的形式让这些框架,和光同时具备波和粒子的特质类似,Agent框架同时具备严肃外部性和Memecoin的特性。本文将重点解读框架的“波粒二象性”以及Agent框架为什么能成为最后一角。

Agent框架带来的外部性能够在泡沫消退后留下春芽

从GOAT诞生开始,Agent叙事冲击市场的力度不断上升,如同一位功夫大师,左拳“Memecoin”,右掌“行业希望”,你总会在其中一招里败下阵来。其实,AI Agent 的应用场景并未严格区分,平台、框架与具体应用之间界限模糊,但根据代币或协议的偏好仍可大致分类。但是,根据代币或者协议的发展偏好还是可以分为以下几类:

  • Launchpad:资产发型平台。Base 链上的 Virtuals Protocol 和 clanker,Solana 链的 Dasha。

  • AI Agent 应用:游离于Agent和Memecoin之间,在记忆内存的配置上有出彩的地方,比如GOAT,aixbt等。这些应用一般来说是单向输出的,输入条件非常有限。

  • AI Agent 引擎:Solana 链的 griffain 以及 base链的 Spectre AI。griffain可以做到从读写模式进化到读、写、行动的模式;Spectre AI 是RAG引擎,链上搜索。

  • AI Agent框架:对于框架平台来说,Agent本身就是资产,所以Agent 框架是Agent的资产发行平台,是Agent的Launchpad。目前具有代表性的项目有 ai16,Zerebro , ARC和这两天热议的Swarms。

  • 其他小方向:综合型Agent Simmi;AgentFi协议 Mode;证伪类Agent Seraph;实时 API Agent Creator.Bid。

进一步讨论Agent框架,可以看出它具有充分的外部性。不同于各大公链和协议的开发者只能在不同开发语言环境中选择,而行业内总的开发者规模并没有呈现对应市值增速的增长。Github Repo是Web2和Web3开发者建立共识的之所,在这里建立开发者社区,比任何一个协议单独开发出来的“一插即用”包对Web2开发者的吸引力和影响力更强大。

本文提到的4种框架都已开源:ai16z的 Eliza 框架获得6200颗星;Zerebro的ZerePy框架获得191颗星;ARC的RIG 框架获得1700颗星;Swarms的Swarms框架获得2100颗星。目前,Eliza 框架被广泛用于各种Agent应用,是覆盖面最广的框架。ZerePy的开发程度不算高,发展方向主要在X上,尚且不支持本地LLM和集成内存。 RIG的相对开发难度最高,但是能给开发者最大限度实现性能优化的自由。Swarms除了团队推出mcs之外还没有其他用例,但是Swarms可以集成不同框架,有较大想象空间。

此外,上述分类中,把Agent引擎和框架分割开来,或许或造成疑惑。但我认为二者是有区别的。首先,为什么是引擎?联想现实生活中的搜索引擎来类比是相对契合的。不同于同质化的Agent应用,Agent引擎的性能在其之上,但同时是完全封装的,通过api接口来调整的黑盒。用户可以以fork的形式来体验Agent引擎的性能,但是又不能像基础框架那样掌握全貌和定制自由。每个用户的引擎就像在调教好的Agent上生成一个镜像,是对镜像做交互。而框架本质上是为了适配链,因为在Agent做Agent框架,最终目的都是和对应的链有整合,怎样定义数据交互方式,怎样定义数据验证方式,怎样定义区块大小,怎样平衡共识和性能,这些是框架需要考虑的事情。而引擎呢?只需要在某一个方向,充分微调模型和设置数据交互还有内存之间的关系就行,性能是唯一评价标准,而框架则不然。

用“波粒二象性”的视角去评价Agent框架或许是确保走在正确方向上的前提

Agent执行一次输入输出的生命周期中,需要三个部分。首先是底层模型决定了思考深度和方式,然后内存是自定义的地方,在基础模型有了输出之后,根据内存再修改,最后在不同的客户端上完成输出操作。

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 0

来源:@SuhailKakar

为了证实Agent框架具有“波粒二象性”,“波”具有“Memecoin”的特征,代表社区文化和开发者活跃度,强调 Agent 的吸引力和传播能力;“粒”代表“行业预期”的特征,代表底层性能、实际用例和技术深度。我会分别从两个方面结合三个框架的开发教程为例进行说明:

快速拼接式的Eliza框架

  1. 设置环境

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 1

来源:@SuhailKakar
  1. 安装Eliza

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 2

来源:@SuhailKakar

3.配置文件

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 3

来源:@SuhailKakar

4.设置Agent性格

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 4

来源:@SuhailKakar

Eliza的框架相对来说,易于上手。它是基于TypeScript,这是大多数 Web 和 Web3 开发者都熟悉的语言。框架简洁,没有过度抽象,让开发者能够轻松地添加自己想要的功能。通过步骤3,看到Eliza可以多客户端集成,可以将其理解为多客户端集成的组装器。Eliza支持DC, TG和X等平台,还支持多种大语言模型,可以通过上述社交媒体实现输入,LLM模型来输出,并且支持内置记忆管理,可以让任意习惯的开发者快速部署AI Agent。

由于框架的简洁性和接口的丰富性,Eliza大大降低了接入的门槛,实现了相对统一的接口标准。

一键使用式的ZerePy框架

1.Fork ZerePy的库

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 5

来源: https://replit.com/@blormdev/ZerePy?v=1

2.配置X和GPT

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 6

来源: https://replit.com/@blormdev/ZerePy?v=1

3.设置Agent性格

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 7

来源: https://replit.com/@blormdev/ZerePy?v=1

性能优化式的Rig框架

以构建RAG(检索增强生成) Agent为例:

1.配置环境和OpenAI key

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 8

来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

2.设置 OpenAI 客户端并使用 Chunking 进行 PDF 处理

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 9

来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

3.设置文档结构和嵌入

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 10

来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

4.创建向量存储和 RAG agent

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 11

来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig(ARC)是一个基于 Rust 语言面向 LLM 工作流引擎的 AI 系统构建框架,它要解决更底层的性能优化问题,换句话说,ARC 是一个 AI 引擎「工具箱」,提供 AI 调用、性能优化、数据存储、异常处理等后台支撑服务。

Rig 要解决的是「调用」问题,以帮助开发者更好选择 LLM,更好优化提示词,更有效管理 token,以及如何处理并发处理、管理资源、降低延迟等,其侧重点在于 AI LLM 模型和 AI Agent 系统协作过程中如何「用好它」。

Rig 是一个开源 Rust 库,旨在简化 LLM 驱动的应用(包括 RAG Agent)的开发。因为Rig开放的程度更深,因此对开发者要求更高,对Rust和Agent的理解要求也更高。 这里的教程是最基础的RAG Agent的配置流程,RAG通过将LLM 与外部知识检索相结合来增强LLM。在官网的其他DEMO中,可以看到Rig具备以下特征:

  • LLM接口统一:支持不同LLM provider的一致api,简化集成。

  • 抽象工作流:预构建的模块化组件让Rig可以承接复杂AI系统的设计。

  • 集成向量存储:内置对裁体存储的支持,在RAG Agent等相似的搜索类Agent中提供高效性能。

  • 嵌入灵活:提供易于使用的 API,用于处理嵌入,在RAG Agent等相似的搜索类Agent开发时,降低语义理解的难度。

可以看出相比Eliza,Rig为开发者提供了额外的性能优化的空间,帮助开发者更好地调试LLM和Agent的调用和协作优化。Rig以 Rust 驱动性的性能、利用 Rust 优势零成本抽象和内存安全、高性能、低延迟的 LLM 操作。能够在底层层面上,提供更丰富的自由度。

分解组合式的Swarms框架

Swarms旨在提供企业级生产级多Agent编排框架,官网提供了几十种workflow和Agent并行串行架构,这里介绍其中一小部分。

Sequential Workflow

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 12

来源: https://docs.swarms.world

顺序 Swarm 架构以线性顺序处理任务。每个Agent在将结果传递给链中的下一个Agent之前完成其任务。此架构可确保有序处理,并且在任务具有依赖关系时非常有用。

用例:

  • 工作流程中的每个步骤都依赖于前一个步骤,例如装配线或顺序数据处理。

  • 需要严格按照操作顺序的场景。

层次化架构:

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 13

来源: https://docs.swarms.world

实现自上而下的控制,由上级Agent协调各下级Agent之间的任务。其中Agent同时执行任务,然后将其结果反馈到循环中进行最终聚合。这对于高度可并行化的任务非常有用。

电子表格式架构:

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 14

来源: https://docs.swarms.world

用于管理同时工作的多个代理的大规模群体架构。可同时管理数千个代理,每个代理都在自己的线程上运行。它是监督大规模代理输出的理想选择。

Swarms不仅是Agent框架,还可以兼容上述Eliza, ZerePy和Rig框架,以模块化的思想,在不同工作流和架构中最大化释放Agent性能,以解决对应问题。Swarms的构思和开发者社区进展都没问题。

AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读? image 15

  1. Eliza:易用性最强,适合初学者和快速原型开发,尤其适合社交媒体平台的AI交互。框架简洁,便于快速集成和修改,适合不需要过度性能优化的场景。

  2. ZerePy:一键式部署,适合快速开发Web3和社交平台的AI Agent应用。适合轻量级AI应用,框架简单,配置灵活,适用于快速搭建和迭代。

  3. Rig:侧重性能优化,尤其在高并发和高性能任务中表现出色,适用于需要细致控制和优化的开发者。框架较为复杂,需要一定的Rust知识,适合更有经验的开发者。

  4. Swarms:适合企业级应用,支持多Agent协作和复杂任务管理。框架灵活,支持大规模并行处理,并提供多种架构配置,但由于其复杂性,可能需要更强的技术背景来有效应用。

总体来说,Eliza 和 ZerePy 在易用性和快速开发方面具有优势,而 Rig 和 Swarms 更适合需要高性能和大规模处理的专业开发者或企业应用。

这就是Agent框架具有“行业希望”特性的原因,上述框架还处于早期阶段,当务之急是抢占先发优势并建立活跃的开发者社区。框架本身的性能高低以及相对Web2流行应用来说是否落后都不是主要矛盾。只有源源不断涌入开发者的框架才能最终胜出,因为Web3行业始终需要吸引市场的注意力,框架性能再强,基本面再雄厚,如果难以上手导致无人问津,则本末倒置。在能够框架自身能够吸引开发者的前提,具有更成熟和更完整的代币经济模型的框架会脱颖而出。

而Agent框架有着“Memecoin”特性这一点,则非常好理解。上述框架代币都没有合理的代币经济设计,代币没有用例或者用例非常单一,没有经过验证的商业模式,也没有行之有效的代币飞轮,框架仅仅是框架,和代币之间没有完成有机结合,代币价格的增长除了FOMO之外,难以获得基本面上的助力,没有足够的护城河来确保稳定且持久的价值增长。同时,上述的框架自身也显得比较粗糙,其实际价值和当前市值并不匹配,因此有着强烈的“Memecoin”的特性。

值得注意的是,Agent框架的“波粒二象性”并不是缺点,不能将其粗暴的理解为既不是纯粹的Memecoin,又没有代币用例的半罐水。正如我在上一篇文章中提到的观点:轻量化的Agent覆盖着模棱两可的Memecoin面纱,社区文化和基本面不会再成为矛盾,一种新的资产发展路径在逐渐浮出水面;尽管 Agent 框架初期存在泡沫与不确定性,但其吸引开发者和推动应用落地的潜力不容忽视。未来,具备完善代币经济模型和强大开发者生态的框架,或将成为这一赛道的关键支柱。