返回首页
最新
我花了一年时间构建了一条从零开始的理论学习路径,涵盖了直到次属和借用和弦等主题。这个学习路径结合了游戏、互动课程和间隔重复的方法,帮助你理解和记忆概念,而不仅仅是学到新知识后几天就忘记。
我想弄清楚:
1. 这个进阶是否合乎逻辑?
2. 你希望在其中看到哪些我遗漏的内容?
3. 哪些地方让人感到困惑,需要更多的澄清?
你好!我是亚历克斯,我和我的联合创始人塔伦一起创建了Kampala(<a href="https://www.zatanna.ai/kampala">https://www.zatanna.ai/kampala</a>)。这是一个中间人(MITM)风格的代理,允许你主动逆向工程现有工作流程,而无需脆弱的浏览器自动化或计算机使用代理。它适用于网站、移动应用和桌面应用。
<p>演示:<a href="https://www.youtube.com/watch?v=z_PeostC-b4" rel="nofollow">https://www.youtube.com/watch?v=z_PeostC-b4</a>。
许多人每天花费数小时在传统仪表板和本地解决方案中,跨平台对数据进行对账。目前的自动化尝试使用浏览器自动化或计算机使用代理,这些方法脆弱、缓慢且不确定。我来自网络逆向工程背景,在过去的7到8年里,我手动构建了运动鞋/票务发布、体育博彩登录等的集成。在此期间,我为几家公司提供咨询服务,将它们从基于浏览器的基础设施迁移到请求层。
<p>当我们开始创建Zatanna(这是我们的公司名称)时,我们在牙科技术领域工作,这意味着我们必须处理大量保险支付者仪表板和传统牙科实践解决方案。我们的超能力(作为一家相对没有差异化的语音代理/前台助理公司)是能够与几乎任何请求的系统进行集成。在这段时间里,我们构建了大量工具(包括我们现在称之为Kampala的工具),以便快速启动这些集成。
现有的MITM代理和工具由于几个原因无法工作:(1)它们在传输过程中操控TLS和HTTP2指纹,这被严格的反机器人检测所识别。(2)它们的MCP(多通道处理器)表现不佳,未能充分暴露必要的功能,如脚本/重放。(3)它们不允许根据样本或请求序列构建工作流程或操作。
<p>随着我们构建的工具变得越来越强大,我们开始在内部使用它们来抓取会议参与者、连接外部PMS系统以及与Slack应用互动。我甚至把它发给了我的物业经理妈妈,在我的帮助下(笑),她在Yardi中自动化了2-3小时的账单信息录入。到那时,我们意识到这其实与牙科并没有太大关系 :)
<p>由于Kampala是一个MITM,它能够利用现有的会话令牌/反机器人Cookies,并在几秒钟内以确定性方式自动化操作。你可以使用我们的代理工具,直接通过提示你进行操作来创建脚本/API,或者通过手动执行一次工作流程,要求你首选的编码代理使用Kampala生成一个脚本/API来复制它。一旦你有了API/脚本,你可以导出、运行,甚至让我们为你托管。
<p>我们认为,自动化的未来并不是将网页的截图发送给大型语言模型,而是使用计算机实际理解的底层层次。期待听到你的想法/问题/反馈!
我厌倦了那些臃肿的天气应用程序,于是我制作了一个新的应用,用户可以输入自己的城镇和喜欢的活动,它会找到最佳的时间窗口供徒步旅行、观星、野餐等,并提供自然语言的解释。
对SF Signal著名流程图的重新诠释,采用类型表单的形式。
找到你下一个幻想/科幻阅读的书籍,或与朋友分享你至今的阅读旅程。
所有链接指向bookshop.org或storygraph。
欢迎反馈 :)
我在2006年开始开发EDDI,最初是一个基于规则的对话引擎。当时主要依靠模式匹配和状态机。当大型语言模型(LLMs)出现时,值得思考的问题不是“我该如何调用GPT”,而是“我如何在生产环境中控制AI的行为?”
我的回答是:代理逻辑应该放在JSON配置文件中,而不是代码里。你需要描述一个代理应该做什么,使用哪个LLM,能够调用哪些工具,以及它应该如何表现。引擎读取这些配置并执行。绝不进行动态代码执行。LLM的设计上不能运行任意代码。引擎是严格的,这样AI才能发挥创造力。
v6是这个理念真正变得实用的版本。你可以让一组代理以五种不同的编排风格(圆桌会议、同行评审、辩论者等)讨论一个主题。每个代理可以使用不同的模型。一个级联系统首先尝试廉价模型,只有在信心不足时才升级到昂贵模型。
它还实现了MCP,既作为服务器也作为客户端,因此你可以通过Claude Desktop或Cursor控制EDDI。同时,它支持谷歌的A2A协议,让代理能够跨平台相互发现。
整个系统在Quarkus上运行于Java 25,以单个Docker镜像发布,并通过一条命令安装。自2017年以来开源,采用Apache 2.0许可证。
我很想听听大家对架构和功能集的看法。如果你有关于缺失功能的想法或希望从这样的系统中获得什么,我非常乐意倾听。始终欢迎对未来发展路线的良好建议。