2作者: yaoke25929 天前原帖
为了提供一些背景信息,我目前正在公司创建一个AI代理团队,通过扩展大量子代理来处理大量的转录数据并生成报告。当分析在中途失败时,比如某个步骤(如API调用返回错误或机器内存不足),会导致级联错误,几乎没有可见性,从而破坏整个生成过程。我刚花了一个月的时间将各个任务重写为在DBOS上的持久执行任务,但我在想是否还有更好的解决方案,以及其他人是否遇到过类似的问题?还有一个问题是如何将进度反馈给用户,老实说,我只是临时编码处理这个问题……<p>当一个代理在12个步骤中的第9步失败时,你是如何处理的?<p>你在代理基础设施(如持久性、监控、人机协作、实时用户界面)上投入了多少工程周,而不是实际的代理逻辑?我很好奇我的比例是否正常。<p>对于那些在内部构建这些东西的人:这是否曾经是一个自建与购买的讨论?如果要你购买而不是自建,一个工具需要具备什么功能?<p>你目前在代理堆栈中是否支付了任何费用(如LangSmith、Temporal、Braintrust等)?是什么让这个工具值得列为开支,而其他工具却不值得?我是否也应该考虑一下?
1作者: joas_coder29 天前原帖
我制作了我的第一个 macOS 实用程序应用,它包含了一个捆绑的 Gemma 4 模型,具体来说是 Gemma E4B 模型。我的应用程序 DMG 文件大小为 5.3 GB,但我认为对于这个免费的本地模型所能提供的强大功能来说,这个大小是相对较小的。 它在 CPU 上运行良好,也可以在 Apple Silicon GPU 上运行,尽管我没有注意到在 GPU 上的性能提升(在 M5 芯片上测试)。 我认为这些本地轻量级和多模态模型将为需要隐私保护的新软件工具开辟多种可能性。
13作者: Throwaway_sys29 天前原帖
我不想在报告中留下空白,所以我决定在这里询问一下。 我正在进行一项合同工作,清理数据中心,做一些例行工作,比如在我们退役硬件之前进行库存和审计。问题是,有一个节点不断出现,但在文档中找不到。它的IP地址在46.28.x.x范围内,但不在设施登记册中。我通过RIPE和ARIN查询过,什么也没找到。 不过,令我困惑的是延迟。每次往返延迟都是0.4毫秒。我从多台机器上测试过,包括一部LTE手机,得到的响应时间都是一样的。这理论上意味着我离这台机器非常近,但在三种不同的连接下,这并不合理。 我检查了物理硬件,发现这不是我见过的任何标准1U或2U端口,可能是专有的。序列号格式是: CC-[4位数字]-[2位数字]-[6个字母数字] CC前缀与Cisco、IBM、DEC、3Com等都不符。我回顾了设施的历史日志,发现该节点出现在他们最早的可用记录中,追溯到1994年,而该设施建于1997年。 有没有人见过CC-序列前缀?或者对延迟的一致性有什么解释吗?
1作者: rallies29 天前原帖
在过去的十年里,我一直是一名人工智能工程师,并且在周末持续构建小型算法交易系统。<p>我即将全职进入金融领域,并开始在净资产追踪、代理金融和基于大型语言模型的投资(B2C)方面开发产品。<p>我希望能尽可能多地阅读相关书籍,以深入理解这个领域及其运作方式等。<p>有什么推荐吗?不一定只是书籍,也非常欢迎任何建议。