返回首页
最新
Athena Flow 是一个工作流运行时,通过其钩子系统封装了 Claude Code。它接收事件流,应用工作流和插件逻辑,将会话状态保存在 SQLite 中,并在一个交互式终端用户界面中呈现所有内容,配有实时事件流。
与其编写一次性的提示或单次脚本来自动化复杂的多步骤任务,不如一次性定义一个工作流——使用提示模板、循环、插件包和结构化的生命周期钩子——并在任何项目上运行它。
我发布的第一个工作流是 e2e-test-builder。它像人类一样导航您的应用,编写带有前置条件、步骤和预期结果的结构化测试用例规范,然后从中生成 Playwright 代码。浏览器层由我构建的一个名为 agent-web-interface 的独立 MCP 服务器处理,它生成语义页面快照,而不是原始 DOM——在与 Playwright MCP 的早期基准测试中,令牌减少了约 19%,任务完成速度提高了约 33%。
这个技术栈包含三个代码库:athena-flow 是运行时(钩子 -> UDS -> 事件管道 -> TUI),agent-web-interface 是用于高效令牌浏览器交互的 MCP 服务器,而 athena-workflow-marketplace 是工作流和插件的存放地,通过引用解析,例如 e2e-test-builder@lespaceman/athena-workflow-marketplace。
工作流是可组合的——一个工作流可以打包插件,并可以通过任何 Git 仓库进行共享。编写您自己的工作流只需一个 workflow.json 文件和一个提示文件。
目前仅支持 Claude Code,但 Codex 支持正在进行中。如果您已经拥有 Claude Code 订阅,则免费使用,无需单独的 API 密钥。采用 MIT 许可证。
文档: [https://athenaflow.in](https://athenaflow.in) GitHub: [https://github.com/lespaceman/athena-flow](https://github.com/lespaceman/athena-flow)
非常希望收到反馈,特别是来自那些基于 Claude Code 钩子构建或考虑在代理运行时之间实现工作流可移植性的人。
该演示直接在您的浏览器中加载两个运行实例——无需注册、无需上传,页面加载后也不进行网络调用。<p>Frank:一个保守的代理。验证结果为有效(VALID)。
Phil:一个带有篡改证据的激进代理。验证结果为无效(INVALID),并指出链条断裂的确切位置。<p>我所解决的问题是:当一个人工智能代理在生产环境中做出意外行为时,事后分析通常归结为“相信我们的日志”。我希望能够提供跨越信任边界的证据——从工程到安全、合规或监管机构——而不需要任何人信任一个仪表板。<p>其工作原理:<p>- 每个动作、政策决策和状态转换都记录在一个哈希链式的NDJSON事件日志中
- 日志被封装成证据包(ZIP),并附有清单和签名
- 验证器(在演示中也有)离线验证完整性,并返回有效(VALID)/无效(INVALID)/部分有效(PARTIAL)及机器可读的原因代码
- 相同的输入始终产生相同的工件,因此差异是有意义的,重放是确定性的<p>验证器和用户界面故意分开。用户界面可能是错误的,验证器仍将根据密码学证明接受或拒绝。<p>在最近关于自主代理的公共事件使其成为热门话题之前,我就构建了这个系统。乐意回答有关架构、证明边界设计或我仍在努力解决的差距的问题。