我进行了探索,研究使用大型语言模型(LLM)令牌作为随机 ID 的单个“数字”是否能在相同数量的令牌下获得更多的随机性,结果是肯定的。使用这个库中的当前策略比使用 base64 ID 的令牌效率高约 50%。<p>我还对 OpenAI API 进行了数百次会话测试,以查看使用这种策略时的对数概率(logprobs)是否与 base64 ID 相比有明显差异,结果显示大致相同,甚至可能稍微更好(更“尖锐”)。<p>这可能对需要提供 ID 以便后续引用的代理框架有用。虽然只是一个小的进步,但探索的过程很有趣!
返回首页
最新
嗨,HN,
我开发了Pane,一个原生于电子表格的智能助手,它直接在网格(单元格、公式、引用、范围)上操作,而不是将电子表格视为文本。
大多数电子表格AI工具失败的原因在于:
- 生成错误的公式
- 在编辑过程中丢失上下文
- 无法可靠地修改现有模型
Pane在电子表格环境中运行,使用与人类相同的基本操作:选择单元格、编辑公式、插入范围、对账表格。
我在这个周末在Product Hunt上发布了它,意外地引起了共鸣,这让我好奇这种方法在严格审视下是否真的有效。
我希望能得到以下方面的反馈:
- 你预期的明显失败模式
- 这是否在根本上优于脚本 + 公式 + 辅助工具
欢迎提出技术问题。
嗨,HN,
我创建了SubTrack,旨在帮助团队发现未使用的SaaS工具和云资源,以免它们悄悄侵蚀预算。
我的动机源于发现回答一些简单问题是多么困难:
– 实际上使用的SaaS工具有哪些?
– 哪些云资源处于闲置状态?
– 我们月底的支出情况会是怎样的?
SubTrack可以连接到AWS、GitHub、Vercel等工具,从一个地方展示未使用的资源和成本信号。最近,我增加了多账户支持、货币本地化和可选的基于AI的洞察功能,以帮助解读使用模式。
这是一个早期阶段的项目,我正在积极迭代。非常希望能得到反馈,尤其是来自管理云或SaaS资源扩张的朋友们。
安装我们的 Reality Check Chrome 扩展程序后,您将能够:
- 在主要平台上对任何帖子进行点赞或点踩,特别是在 X 上 :) 点赞会与平台本身的点赞同步。
- 对任何网站进行评分和评论。这就像 TrustPilot,但始终存在。
- 成为评论员/事实核查者,举报假新闻、AI 垃圾、诈骗等,让用户可以在帖子上看到您的简短评论,并附上您网站/频道的链接以获取更多详情,从而为您带来流量。这就像 X 上的 Community Notes,但更好 :)
- 根据作者发布的虚假或误导性帖子数量来检查其可信度。
- 即使作者已关闭帖子评论,您也可以发表评论。
- 以后我们将在评论中推广专家意见,以免它们淹没在低质量或有毒的讨论中。
这解决了社交网络有毒和误导的问题,避免了大量的 AI 垃圾和虚假社交影响者,因为:
- 他们取消了点踩按钮,这导致了有毒内容的传播。
- 即使您知道这是 AI 垃圾、诈骗帖子、欺骗性、误导性或假新闻,您也无法与其他用户分享这个信号。评论无效。
- 如果帖子/视频的作者因挑衅内容而关闭评论,您就无法以任何方式回应。
该扩展适用于 X、YouTube、Instagram、Bluesky、Truth Social、Threads 等更多平台……
<a href="https://reality-check.info" rel="nofollow">https://reality-check.info</a>
嗨,HN,
我开发并刚刚发布了另一个Geoguessr的替代品。与大多数其他游戏(以及官方版本)不同的是,它完全不使用Google Maps API,这使得游戏更加可持续,同时保持服务免费。
这是我很久以前开发的一个类似Geoguessr游戏的继任项目。从那时起我一直在学习,觉得这次可以以更清晰的方式设计和实现这个项目。这种动力促使我从头开始重建它。
如果你是一个轻度用户,对支付订阅费用犹豫不决并在寻找替代品,欢迎试试这个游戏。我非常欢迎任何反馈。
源代码: [https://github.com/spider-hand/geoguess-lite](https://github.com/spider-hand/geoguess-lite)
我构建了一个系统来解决与AI辅助编码相关的最大问题:六个月后你无法维护代码,因为你已经失去了关于为什么要编写这些代码的所有上下文。
核心理念很简单:与其直接进入编码,不如先生成规范,然后在markdown文件中跟踪每一个规划决策和待办事项,这些文件会在不同的文件夹中流转(计划 → 进行中 → 已执行)。这个执行历史将永远伴随你的项目。
工具包包括:
- 规范生成器(根据需求生成架构和开发规范)
- 会话管理(跟踪编码会话中的进展)
- 执行历史跟踪(3个文件夹系统)
- Git工作流助手(分支、规范提交)
- Spring Boot测试生成
- 自动化代码审查代理(OWASP安全、SOLID原则、性能)
这个系统是为Claude Code构建的,但工作流概念适用于任何AI编码工具。
我用这个系统构建了一个完整的Spring Boot后端——原本预计需要45天的工作压缩到5天。几个月后,执行历史仍然清晰可读。
完整工具包售价49美元: [https://hathwar.gumroad.com/l/spec-driven-ai](https://hathwar.gumroad.com/l/spec-driven-ai)
详细信息的着陆页:[https://samhath03.github.io/spec-driven-ai/](https://samhath03.github.io/spec-driven-ai/)
欢迎随时询问关于工作流的问题。