1作者: blixt26 天前原帖
我进行了探索,研究使用大型语言模型(LLM)令牌作为随机 ID 的单个“数字”是否能在相同数量的令牌下获得更多的随机性,结果是肯定的。使用这个库中的当前策略比使用 base64 ID 的令牌效率高约 50%。<p>我还对 OpenAI API 进行了数百次会话测试,以查看使用这种策略时的对数概率(logprobs)是否与 base64 ID 相比有明显差异,结果显示大致相同,甚至可能稍微更好(更“尖锐”)。<p>这可能对需要提供 ID 以便后续引用的代理框架有用。虽然只是一个小的进步,但探索的过程很有趣!
10作者: rbajp26 天前原帖
嗨,HN, 我开发了Pane,一个原生于电子表格的智能助手,它直接在网格(单元格、公式、引用、范围)上操作,而不是将电子表格视为文本。 大多数电子表格AI工具失败的原因在于: - 生成错误的公式 - 在编辑过程中丢失上下文 - 无法可靠地修改现有模型 Pane在电子表格环境中运行,使用与人类相同的基本操作:选择单元格、编辑公式、插入范围、对账表格。 我在这个周末在Product Hunt上发布了它,意外地引起了共鸣,这让我好奇这种方法在严格审视下是否真的有效。 我希望能得到以下方面的反馈: - 你预期的明显失败模式 - 这是否在根本上优于脚本 + 公式 + 辅助工具 欢迎提出技术问题。
2作者: hrshw26 天前原帖
嗨,HN, 我创建了SubTrack,旨在帮助团队发现未使用的SaaS工具和云资源,以免它们悄悄侵蚀预算。 我的动机源于发现回答一些简单问题是多么困难: – 实际上使用的SaaS工具有哪些? – 哪些云资源处于闲置状态? – 我们月底的支出情况会是怎样的? SubTrack可以连接到AWS、GitHub、Vercel等工具,从一个地方展示未使用的资源和成本信号。最近,我增加了多账户支持、货币本地化和可选的基于AI的洞察功能,以帮助解读使用模式。 这是一个早期阶段的项目,我正在积极迭代。非常希望能得到反馈,尤其是来自管理云或SaaS资源扩张的朋友们。