返回首页

一周热榜

1作者: y426 天前原帖
我已经持有这个域名很多年了,一直在不同的个人项目之间切换。最新的想法是:一个用于常见图像相关任务的工具箱: <p>- 调整大小、裁剪和颜色调整 - 使用几种不同算法生成图案 - 添加文本或形状等注释 - 显示常见社交媒体格式 - 使用Tesseract进行OCR提取,支持在浏览器中操作 - 简单的动画效果,如肯·伯恩斯效果 - ASCII转换器 - 隐写术 <p>当然,还有EXIF数据查看器、反向图像搜索等功能。 <p>这个工具是免费的,大部分功能都是基于浏览器的,除了AI图像识别和从外部来源获取图像(这需要服务器端代理)。 <p>告诉我你的想法。希望用户界面不会太混乱。
1作者: alcray7 天前原帖
大家好, 我开发了 TrainForgeTester,这是一个开源的场景测试运行器,专门用于测试执行动作(调用工具)的 AI 代理。 这个想法是:测试代理在特定公司场景中的表现,而不仅仅是在一般基准测试中。更具体地说,测试代理是否会采取错误的行动、跳过必要的步骤、调用错误的工具或传递错误的参数。 TrainForgeTester 允许您运行多轮场景(您可以根据个人用例和数据,按照提供的场景架构创建这些场景),并检查: * 工具调用和参数 * 严格或无序的工具执行 * 预期的响应 * 在模型、提示或工具更改后的回归 这个场景测试器是项目的第一部分(类似于版本 0.1.0)。 我现在正在开发下一部分:一个“场景生成器”,它可以处理杂乱的历史公司数据(客户支持日志、代理记录、工具调用、转录等),并将其转化为可测试的场景,以便在这个框架中使用。再次尝试使其尽可能确定性。 代码库: [https://github.com/TrainForge/TrainForgeTester](https://github.com/TrainForge/TrainForgeTester) 我非常希望能收到以下方面的反馈: * 目前尚未覆盖的真实代理测试用例(浏览器使用、音频、视频、鼠标使用) * 这个方向是否合理 * 这个项目作为产品/开发工具的潜在发展方向 * 代码库中的问题、边缘案例或缺失功能 任何 GitHub 问题、分支或拉取请求都将非常感谢。