2作者: jimbo808大约 2 个月前原帖
这里有一句引述: “这不是神经科学——这只是用学术术语包装起来的伪科学推理。” 我想我们大多数使用ChatGPT的人都会立即认出这句话是由AI生成的。它的英语表达完全正确,我们都能想象一个真实的人会这样说,但ChatGPT(或者更广泛的语言模型)似乎总是使用像这样的某些模式。这是一种过拟合吗?是在训练后引入了对这种模式的偏见?还是其他什么原因?
1作者: mfrye0大约 2 个月前原帖
大家好!我想分享我们刚刚推出的企业层级API,目前处于测试阶段。它的主要目标是通过对开放网络和全球政府注册信息的深入研究,绘制出完整的企业所有权结构,直到最终母公司。 问题:公司在合规/风险问题上花费了数百万美元来雇佣人工研究团队,以回答诸如“这家企业是否归属于中国/俄罗斯的国有实体?”这样的问题。我们合作的一家破产处理公司就有30人专门手动研究这样的数据点。一位前壳牌交易员告诉我们,壳牌有800人,每年花费超过1亿美元与德勤合作进行手动研究,以确保国际贸易合规。 现有解决方案的不足:一个不为人知的秘密是,像邓白氏、Orbis和标普这样的传统提供商依赖大量人工工人,并且基于数十年前的技术。在查询时,您通常是在访问一个每季度生成的、静态的、昂贵的数据库。 我们的解决方案:我们在我们的实体解析引擎基础上构建了这个API——一个深度研究代理,将实体锚定到我们的商业图谱上,依托于与政府登记机构的直接集成和我们的网络爬虫基础设施。当您需要层级研究时,我们的AI代理平均花费10到20分钟进行向上研究,以识别最终母公司并构建完整的所有权有向无环图(DAG),并附上来源引用。我们自动生成Mermaid图表,以便您可以立即在自己的应用中呈现结果。 技术背景:我在B2B初创公司和企业中花费了10年时间构建主数据管理、数据增强和实体解析系统,主要集中在金融科技领域。实际上,在我们被收取过高费用并几乎导致我所在的初创公司倒闭后,我构建了一个内部的Clearbit替代品。核心挑战始终如一——将杂乱的商业数据映射到网络数据和实际法律实体上。大多数现成的解决方案都很平庸,因为它们跳过了最困难的部分:那些迫使您进行手动研究的20-40%的复杂记录。 当前状态:我们只有三个人,自筹资金。我们也收到了完整子公司映射的请求,但目前专注于向上层级。我们仍在确定定价(市场价格似乎是每次查询几美元,但我们的目标是更低)。深入研究成本高昂,但我们相信可以实现规模化。 试用一下: - 互动演示: [https://savvyiq.ai/products/entity-hierarchy](https://savvyiq.ai/products/entity-hierarchy)(无需注册) - 免费账户: [https://savvyiq.ai/signup](https://savvyiq.ai/signup) - API文档: [https://savvyiq.ai/api-reference#tag/entity-hierarchy-beta](https://savvyiq.ai/api-reference#tag/entity-hierarchy-beta) 我们非常希望能收到关于层级API的反馈,特别是关于架构、缺口/边缘案例的意见,同时也对其他商业身份解析的痛点用例感兴趣。 如果有人想看看API的实际效果,我很乐意在评论中进行几次实体层级查询——我可以将结果以Mermaid图表的形式分享,您可以直接粘贴到任何Mermaid渲染器中。
1作者: pythonbrad大约 2 个月前原帖
Afrim是一个框架/工具,旨在简化输入法引擎(IME)的实现。它兼容任何顺序书写系统,如阿姆哈拉语、吉兹语、拼音等。 Afrim使用Rust编写,其架构受到librime的启发。它支持Rust(afrim)、Python(afrim-py)、JavaScript(afrim-js)等多种语言。 请注意,该项目之前在<a href="https://news.ycombinator.com/item?id=41427563">https://news.ycombinator.com/item?id=41427563</a>上作为一种非洲语言的输入法进行了介绍。从那时起,我进行了多次更改。 代码库:<a href="https://github.com/fodydev/afrim" rel="nofollow">https://github.com/fodydev/afrim</a> 演示:<a href="https://fodydev.github.io/afrim-web/" rel="nofollow">https://fodydev.github.io/afrim-web/</a> 常见问题:<a href="https://github.com/fodydev/afrim/blob/main/FAQ.md" rel="nofollow">https://github.com/fodydev/afrim/blob/main/FAQ.md</a>
1作者: zombico大约 2 个月前原帖
LLM 应用程序传统上被视为文本生成器。如果我们将它们视为 HTTP API,强制输出可检查、可验证和可调试的结构化结果,会怎样呢? 我将现有的模式结合起来,提出了一种方法:强制 LLM 输出 JSON,将其绑定到 HTTP 请求,并记录所有内容。 这个代码库是一个参考实现: - LLM 必须以结构化的 JSON(而不是原始文本)进行响应 - 每个响应都包括推理过程的痕迹。时间和元数据在后面附加 - 每个事件都保存在 SQLite 中,允许对话重建 - 加密哈希验证对话的完整性 - DevTools 风格的检查器实时显示所有内容 演示:安大略省采购指南聊天机器人,支持完整的 RAG 和多轮对话调试。 在 Node.js 和 .NET 中分别实现,功能相当。与 Anthropic/OpenAI/Ollama 兼容。 注意:这展示了一种架构模式,而不是一个即插即用的产品。它是可扩展的,但需要围绕结构化输出重构您的应用程序。
4作者: irgolic大约 2 个月前原帖
我们创建了RuleHunt,以使用类似TikTok的互动监测来搜索有趣的细胞自动机规则。<p>第一个展示的规则是康威的生命游戏。当你滚动时,你会看到其他随机规则——搜索空间为2^512。请通过给你喜欢的规则点赞,帮助我们找到好的规则启发式!<p>在移动设备上,它是一个类似TikTok的滚动界面;在桌面上,它是一个用于目标规则搜索的界面。被点赞的规则会进入全球排行榜。<p>GitHub 仓库:<a href="https://github.com/rulehunt/rulehunt" rel="nofollow">https://github.com/rulehunt/rulehunt</a>
2作者: buildwithnumen大约 2 个月前原帖
嘿,HN, 我已经从事网站建设工作15年了。我是一个完美主义者——无论是视觉效果还是技术层面——对于每次审计都要在不同工具、手动检查和文档之间反复切换感到厌倦。 因此,我开发了GuardianScan,可以在45秒内完成所有检查: - 核心网页指标(LCP、INP、CLS) - WCAG 2.2合规性 - 安全头部和内容安全策略(CSP) - 现代框架模式 - SEO和架构标记 总共进行了47项检查。 这些标准存在是有原因的。谷歌优先考虑快速的网站。可访问的网站能够接触到更多的人。安全的网站建立信任。当你达到现代标准时,你会在流量和转化率上看到明显的提升。 技术栈:Next.js 15、React 19、Supabase、Browserless.io用于无头Chrome。 虽然无法捕捉到所有问题——自动化的可访问性检查大约能解决70%的问题,但这是我现在每次部署前都会使用的工具。 着陆页已上线,计划于11月1日正式发布。每月£24,没有企业定价的繁琐条款。 欢迎提问。
1作者: 0xrelogic大约 2 个月前原帖
嗨,HN! 我创建了 Streaky 来解决一个个人问题——在忙碌的日子里,我总是会失去我的 GitHub 连续贡献记录。它会监控你的贡献连贯性,并在即将中断之前向 Discord/Telegram 发送通知。 <i>技术上的有趣之处:</i> 1. <i>分布式 Cron 处理</i>:使用 Cloudflare 服务绑定来绕过 30 秒的 CPU 限制。每个用户在一个独立的 Worker 实例中处理,拥有自己的 CPU 预算。 2. <i>幂等队列系统</i>:基于 D1 的队列结合原子操作,防止在 Cron 作业重叠或重试时出现重复处理。 3. <i>零知识安全</i>:GitHub 令牌从不存储(OAuth 刷新流程),Webhook 使用 AES-256-GCM 加密,通知通过独立的 Rust 代理发送。 4. <i>速率限制解决方案</i>:Cloudflare Workers 使用共享 IP 池,这会触发 Discord/Telegram 的速率限制。通过将通知路由到 Koyeb 上的专用 Rust 服务器来解决。 <i>技术栈:</i> - 前端:Next.js 15, React 19, TypeScript - 后端:Cloudflare Workers + D1 (SQLite) - 基础设施:Rust 通知代理 - 认证:通过 NextAuth.js v5 的 GitHub OAuth <i>在线演示</i>:<a href="https://streakyy.vercel.app" rel="nofollow">https://streakyy.vercel.app</a> 该项目完全开源,采用 MIT 许可证。欢迎随时询问有关架构或实现的问题。