返回首页
最新
嗨,HN,我是来自Contextual AI的Jay(<a href="https://contextual.ai" rel="nofollow">https://contextual.ai</a>)。
我们正在构建一个专注于技术行业(如半导体、航空航天、制造等)的AI代理平台。Agent Composer是我们强大的新视觉构建器和运行时,用于创建能够对技术文档、日志和规格进行推理的代理。
我们解决的问题是:通用AI在复杂技术任务上表现不佳。这并不是因为模型没有能力,而是因为它们无法获取正确的上下文(数据表、测试日志、流程规格、机构知识)。
Agent Composer的功能包括:
- 三种创建代理的方式:预构建模板、自然语言描述或空白画布
- 视觉拖放构建器,提供无代码体验,同时为开发者提供YAML配置
- 混合工作流:将确定性步骤(合规检查、验证)与动态推理(根本原因分析、研究)结合
- 基于您的数据,提供完整的归属
我们在构建过程中学到的经验:
- 解析比人们想象的更为重要。包含表格、图形和交叉引用的技术PDF会破坏大多数现成的解析器。我们自己构建了一个。
- 检索精度至关重要。基本的向量搜索可以解决70%的问题;最后30%需要混合检索、重新排序和查询重构。那最后的30%是“精彩演示”和“真正有用”之间的区别。
- 企业需要控制。纯自主代理让合规团队感到害怕。在一个工作流中混合确定性和动态步骤的能力是对客户反馈的直接回应。
以下是一些供您探索的链接:
- 产品快速入门指南:<a href="https://docs.contextual.ai/quickstarts/agent-composer" rel="nofollow">https://docs.contextual.ai/quickstarts/agent-composer</a>
- 我们构建的有趣火箭科学演示:<a href="https://demo.contextual.ai/" rel="nofollow">https://demo.contextual.ai/</a>
- 博客:<a href="https://contextual.ai/blog/introducing-agent-composer" rel="nofollow">https://contextual.ai/blog/introducing-agent-composer</a>
- 免费账户注册链接:<a href="https://app.contextual.ai/?signup=1" rel="nofollow">https://app.contextual.ai/?signup=1</a>
欢迎深入讨论架构、检索策略或经验教训。您有什么问题或反馈吗?
嗨,我是Tony,Cosmic的创始人(一个基于AI的无头CMS和应用开发平台)。我们一直遇到同样的问题:借助AI代理创建博客文章,然后将输出用于另一个提示以生成社交媒体帖子,最后手动发布到X、LinkedIn和Facebook。每次都是如此。
因此,我们构建了AI工作流——将多个代理链在一起,让它们自主运行,每个步骤都接收来自前一步的输出。
您可以链式连接的三种代理类型:
- 代码代理:在GitHub中构建功能,进行提交和拉取请求。
- 内容代理:根据前一步的上下文生成CMS内容。
- 计算机使用代理:自动化浏览器工作流程并录制演示。
工作原理:
1. 定义步骤,包括代理类型、提示和配置。
2. 步骤可以顺序或并行运行(可配置)。
3. 上下文在步骤之间自动传递。
4. 可以手动触发、按计划(cron)触发,或通过CMS和API事件(如object.created、object.edited等)触发。
5. 在关键步骤之前添加审批环节以供人工审核。
示例:自动化功能开发:
步骤1:内容代理根据用户反馈撰写功能规格。
步骤2:代码代理构建该功能,创建PR并部署到生产环境。
步骤3:内容代理生成文档和更新日志条目。
步骤4:计算机使用代理将更新发布到团队的Slack,附上PR链接和预览URL。
目前处于测试阶段。非常希望能收到您对工作流模型的反馈,以及您希望自动化的用例。
嗨,HN,我正在开发 Mystral Native——一个轻量级的本地运行时,让你可以使用标准的 Web API(WebGPU、Canvas 2D、Web Audio、fetch)用 JavaScript/TypeScript 编写游戏,并将其作为独立的桌面应用程序运行。可以把它想象成“游戏的 Electron”,但没有 Chromium。或者像 Node、Deno 或 Bun 的 JavaScript 运行时,但针对 WebGPU 进行了优化(并使用 SDL3 打包了窗口/事件系统)。
为什么要做这个:我最初是想基于 WebGPU 开发一个新的游戏引擎,我喜欢用 TypeScript 编写代码并通过热重载立即在浏览器中看到变化的迭代循环。在实现了一些功能并发布了一个演示后,我意识到如果我还希望同一代码库在移动设备上运行,发布一个完整的浏览器并不现实。当然,我可以使用 webview,但这并不总是能为用户提供良好或一致的体验——在 iOS 上,Safari 对 WebGPU 的支持存在细微差别,而桌面版 Chrome 则有不同的功能。我真正想要的是一个在任何平台上都一致且可用的 WebGPU 运行时。我受到 Deno 的 --unsafe-webgpu 标志的启发,但我意识到 Deno 可能不适合长期使用,因为它不支持 iOS 或 Android,并且不打包窗口/事件系统(他们有“自带窗口”,但这意味着需要编写大量自定义代码来处理事件、窗口管理,更不用说实现 WebAudio shim 等更具体的内容)。因此,我开始了构建一个专门为游戏设计的本地运行时的道路,这就是 Mystral Native。
现在,借助 Mystral Native,我可以拥有相同的开发体验(编写 JS,使用 WGSL 着色器,调用 requestAnimationFrame),但可以生成一个真正的本地二进制文件,能够在任何平台上交付给玩家,而无需依赖 webview 或浏览器。没有 200MB 的 Chromium 运行时,没有 CEF 的开销,只有游戏代码和大约 25MB 的运行时。
它的功能包括:
- 通过 Dawn(Chrome 的实现)或 wgpu-native(Rust)提供完整的 WebGPU 支持
- 通过 SDL3 提供本地窗口和事件
- 支持 Canvas 2D(Skia)、Web Audio(SDL3)、fetch(文件/http/https)
- 使用 V8 作为 JS 引擎(与 Chrome/Node 相同),同时支持 QuickJS 和 JSC
- 支持 ES 模块,通过 SWC 使用 TypeScript
- 编译为单个二进制文件(类似于“pkg”):`mystral compile game.js --include assets -o my-game`
- macOS 的 .app 包含代码签名,Linux/Windows 的独立可执行文件
- 为 iOS 和 Android 提供嵌入 API(JSC/QuickJS + wgpu-native)
目前处于早期 alpha 阶段——核心渲染路径运行良好,我已经在 Mac、Linux(Ubuntu 24.04)和 Windows 11 上进行了测试,并为 iOS 和 Android 制作了一些自定义构建以验证它们的可行性,但还有很多需要改进的地方。非常希望能得到一些反馈,看看它能走向何方!
MIT 许可证。
仓库: [https://github.com/mystralengine/mystralnative](https://github.com/mystralengine/mystralnative)
文档: [https://mystralengine.github.io/mystralnative/](https://mystralengine.github.io/mystralnative/)
那么我想他们的竞争对手会停止自己的免费大型语言模型服务(为什么要烧钱呢?)。我可以使用什么样的本地大型语言模型来至少检查我的代码?
技术技能真的重要吗?