3作者: jakejohnson7 个月前原帖
嗨,HN,我在帮助客户预测AI代理的费用时,遇到了同样的问题。定价可能很复杂,需要认真处理电子表格。你需要考虑不同的模型层级、令牌估算、提示缓存以及特定工作流程中的各种服务。 在为每个客户手动构建电子表格后,我决定开发BotBudget——一个免费的计算器,可以对数百种大型语言模型(LLM)和AI服务的成本进行建模。 主要功能: - 多服务工作流程(LLM + 语音转文本/文本转语音 + RAG + 保护措施) - 主要供应商的最新定价数据 - 内置的令牌化工具用于提示估算 - 包含增长情景的成本预测 - 可分享的团队链接 这对我的咨询工作非常有帮助,我希望其他开发AI产品的人也能找到它的价值。 可以在botbudget.com上试用——非常希望能收到关于缺失功能或改进建议的反馈。 顺便提一下,技术栈很简单:它是用Next.js构建的,托管在Cloudflare Workers上,使用@opennextjs/cloudflare,并且每日通过GitHub工作流从自己和社区维护的来源更新平面JSON定价数据。
1作者: pinter697 个月前原帖
我想重新启动我的旧通讯,并建立一个新网站。每个网页也将作为一封通讯邮件。我希望有一个简单易用的设置,能够让我拥有数据和受众,而不依赖于某个平台在未来几年内继续以合理的价格为我服务。
1作者: d00mB0t7 个月前原帖
人工智能令人印象深刻,但只有那些追逐最新潮流的中等智力者才相信它能够思考。科技寡头们在炒作它,因为这种炒作能带来巨额利润。
2作者: atommachinist7 个月前原帖
上周我发布了一篇关于我窗口管理解决方案的帖子。<p>https://news.ycombinator.com/item?id=44500066<p>一些评论中有人分享了他们的窗口管理解决方案。我想给大家一个再次分享的机会。<p>你们的窗口管理解决方案是什么?
2作者: rooagi7 个月前原帖
RooAGI(<a href="https://rooagi.com" rel="nofollow">https://rooagi.com</a>)发布了Roo-VectorDB,这是一个为高维向量数据设计的高性能存储解决方案的PostgreSQL扩展。您可以在GitHub上查看:<a href="https://github.com/RooAGI/Roo-VectorDB">https://github.com/RooAGI/Roo-VectorDB</a>。 我们选择在PostgreSQL上构建,是因为它提供了现成的元数据搜索功能,并且关系数据库的可扩展性经过验证。尽管PGVector在这一领域开创了先河,但它常常被认为比Milvus等原生向量数据库速度更慢。Roo-VectorDB基于PGVector框架,结合了我们在搜索策略、内存管理和对高维向量支持方面的优化。 在使用ANN-Benchmark进行的初步实验室测试中,Roo-VectorDB在每秒查询数(QPS)方面的表现与Milvus相当,甚至显著优于Milvus。 RooAGI将继续开发以人工智能为中心的产品,Roo-VectorDB将作为我们技术栈中的核心存储组件。我们邀请全球的开发者试用当前版本并分享反馈。