6 分•作者: TXTOS•6 个月前•原帖

我们持续推出“简单”的大语言模型（LLM）功能，这些功能虽然流畅但常常出错。在经历了太多的事后分析后，我们总结了失败模式，并在模型前添加了一个小的推理层。这个推理层与模型无关，可以与您现有的技术栈并行使用，您可以通过一份PDF文档（MIT许可）来实现它。 **PDF内容概览** 这份PDF中包含了我们在实际系统中遇到的16种失败模式的问题图谱（如OCR/布局漂移、表格与问题不匹配、嵌入≠意义、部署前崩溃等）。您今天可以添加的四个轻量级门控： 1. 知识边界探测器（空的/对抗的/已知事实探测）。 2. ΔS“语义跳跃”检查，用于捕捉当草稿答案偏离检索上下文时的流畅无意义内容。 3. 布局感知锚定，以确保在跨PDF/表格分块时不会默默中断路由。 4. 最小语义追踪，用于事件回顾（小型，不是完整的转录）。 **基准快照**（相同模型，有无门控的对比）：语义准确率提高22.4% · 推理成功率提高42.1% · 稳定性提高3.6倍。 **用户反馈（最近约50天）** - PDF下载量约2400次。 - 相关材料在GitHub上获得约300个冷启动星标（没有营销推广）。 - 还获得了tesseract.js创作者的星标，这在OCR界得到了很好的验证。 **为什么这对您可能有用** 您不需要更换模型或供应商。PDF描述了您可以直接放入任何RAG/代理/服务管道的检查逻辑。无需服务器、SDK或代理层——仅需您可以复制的逻辑。链接是Git仓库。欢迎回答HN风格的问题（什么会出错，在哪里失败，消融实验，我们如何计算ΔS等）。如果您尝试后没有帮助，我也对反例感兴趣。与Tesseract（OCR传奇）获得星标的验证，我们在top1上是WFFY。 [GitHub链接](https://github.com/bijection?tab=stars)

人工智能承诺提高效率，然而它却让我们工作得更辛苦。

79 分•作者: mooreds•6 个月前•原帖

Anthropic首席执行官自豪地表示，尽管提供了1亿美元的报价，扎克仍然无法挖走他的员工。

1 分•作者: bundie•6 个月前•原帖

格拉斯哥哈斯克尔编译器 9.10.2

1 分•作者: barrister•6 个月前•原帖

Mesa 25.2 为 Nouveau 用户带来了新的硬件支持。

2 分•作者: losgehts•6 个月前•原帖

特斯拉向首席执行官埃隆·马斯克授予价值290亿美元的股票。

1 分•作者: batmaniam•6 个月前•原帖

Rust、Python 和 TypeScript：新的三重奏

1 分•作者: cyber1•6 个月前•原帖

来自印度尼西亚的视角 [视频]

1 分•作者: mooreds•6 个月前•原帖

前沿思维：关于人工智能研究者心理健康的深入分析——“O3-Pro”分析

1 分•作者: WASDAai•6 个月前•原帖

开场 – 由 অপূর্ব、Hridnic、Ahmed Masum 和 Prothey 演奏 – 放松钢琴音乐

1 分•作者: playlsd•6 个月前•原帖

来自亚马逊S3向量存储的经验教训及混合向量存储的细微差别

1 分•作者: sangwook•6 个月前•原帖

与外包开发公司合作的经验

2 分•作者: whack•6 个月前•原帖

软件需要一个“独立审计员”。

23 分•作者: dakshgupta•6 个月前•原帖

展示HN：我创建了一个平台，用于建立电话语音AI代理机构

3 分•作者: marchypolite•6 个月前•原帖

你好，我创建了这个平台，旨在帮助人们使用 Vapi.ai 开始建立自己的电话语音 AI 代理机构。目前，代理机构为客户提供能够进行客户服务、预约和电话冷联系的语音 AI 代理，但他们没有办法向客户提供代理的表现、工作内容以及根据使用情况进行计费的洞察。这就是我创建这个平台的原因，因为在我考虑基于 Vapi AI 创建产品时，我自己也遇到了这个问题。

物体应该安静点。

24 分•作者: gm678•6 个月前•原帖

我们是如何将 JSON.stringify 的速度提升超过两倍的

77 分•作者: emschwartz•6 个月前•原帖

最小化容器镜像 [视频]

1 分•作者: pitterpeter45•6 个月前•原帖

展示HN：Limitly – 管理和保护您的API密钥的最简单方法

1 分•作者: guiolmar•6 个月前•原帖

嘿，HN！我们正在开发Limitly，这是一种即插即用的解决方案，用于管理API密钥、速率限制和任何基于API的产品的使用计划。<p>它包括一个网页仪表板、一个REST API和一个SDK（支持Node.js、Next.js和Python）。您可以定义使用层级、撤销密钥、设置限制并监控消费——无需重新发明轮子。<p>我们之所以开发这个工具，是因为厌倦了在每个项目中都要构建定制的密钥系统。<p>我们非常希望听到您的反馈，并了解您目前是如何处理API安全和速率限制的！ <a href="https://www.limitly.dev" rel="nofollow">https://www.limitly.dev</a>

克里斯蒂安·惠更斯与土星的科学秘密

1 分•作者: bookofjoe•6 个月前•原帖

在平凡事件中发现美与真理

1 分•作者: georgecmu•6 个月前•原帖

上一页 1...2763 2764 2765 2766 2767...4756 下一页

最新