1作者: simantakDabhade27 天前原帖
大家好!<p>我大部分时间都在TinyFish调试和玩弄非常强大的搜索引擎(这真是太棒了)。最近,我对利用搜索引擎递归构建数据集的想法产生了浓厚的兴趣。<p>我一直在玩Exa的WebSets产品,发现它主要集中在潜在客户开发上,并且创建的数据集存在很多缺失数据。<p>因此,我们构建了一个完全开源的项目,可以在任何主题上构建和更新数据集。<p>到目前为止,我生成的数据集包括: “星巴克在亚马逊上销售的所有产品,包括价格和库存状态”, “加利福尼亚州的所有主题公园,包括票价”, “所有当前招聘工程职位的YC公司及其招聘页面链接”。<p><pre><code> 希望大家试用一下,并分享你们的想法、评价和反馈。谢谢!</code></pre>
2作者: oryocyph27 天前原帖
背景:在一家大型科技公司担任高级软件工程师。<p>我所在组织中高级工程师的目标之一是识别并实施人工智能项目。<p>我已经熟悉并积极使用MCP、AI代理、插件等。虽然这些工具很有用,但我感觉公司里大多数人都在做类似的事情。<p>我想知道贵组织是否开发或采用了任何人工智能驱动的工具、工作流程或用例,这些工具和用例带来了显著的商业价值,并且可能被其他组织所借鉴。
6作者: shikhar27 天前原帖
嗨,HN,我是s2.dev的创始人之一。RePlaya([链接](https://github.com/s2-streamstore/replaya))是一个自托管的浏览器会话重放工具,使用了rrweb([链接](https://github.com/rrweb-io/rrweb))。 我想到,为每个会话提供一个持久化流将是构建此类工具的一个更整洁的架构基础。作为一个独特的功能,它还使实时跟踪变得简单,因为播放器可以从记录器正在追加的同一流中读取数据。 另一种架构可能是一个数据摄取火hose,然后进行索引,这会带来相关的复杂性和延迟。你需要将多个数据系统串联在一起,比如消息队列、元数据数据库和Blob存储和/或OLAP数据库。 在这里,唯一的依赖是S2,它有一个可以自托管的开源版本,叫做s2-lite([链接](https://news.ycombinator.com/item?id=46708055))。 它的工作原理如下: - 每个浏览器会话一个S2流 - 大型rrweb事件(如完整快照)跨多个二进制S2记录进行框架处理,并在读取时重新组装 - 活跃会话通过S2读取会话进行跟踪,并通过SSE桥接到浏览器 - 会话列表依赖于流名称编码反向时间戳,因为S2返回的是字典序排列的列表 - 依赖于围栏令牌,以防止已停止的会话被迟到的记录器再次写入 - 保留和垃圾回收通过S2流配置处理,因此不需要后台作业 期待听到大家对这个工具或每会话一个流模型的看法!
4作者: patrickmds27 天前原帖
我一直在尝试寻找提高非技术人员对人工智能采用的方法。基本上,所有公司都在推动人工智能,因为这个话题在新闻中频繁出现,他们感到被落在了后面,但大多数人不知道从何开始。 我认为90%的人(即非程序员)通过使用协作工具而不是Claude Code或类似工具,已经能够很好地满足他们的需求。如果我们能让销售、客户支持、市场营销等部门的人合作,利用他们的技能和协作工具形成一个公司的“智慧大脑”,我认为这将是非常有价值的。 因此,我认为社区有机会分享适用于成千上万种用例的有效技能。然而,目前找到好的技能并判断它们是否值得使用还是相当困难的。 Gstack之所以取得巨大成功,得益于Gary的影响力和信誉。像Claudinho.xyz这样的平台能否托管由社区构建的技能?你对此有什么看法或担忧?
5作者: acoye27 天前原帖
你好,HN 我最近尝试了代理编码,并感到有必要根据项目跟踪更多的上下文数据。同时,我也希望能够超越一维聊天与代理进行沟通。 因此,我创建了一个本地文档存储,代理可以自行发现。命令行界面(CLI)设计得易于代理上手。它也允许人类通过阅读、搜索和编辑存储中的文档进行协作。 我正在审核一个Mac本地图形用户界面(GUI),希望它能尽快出现在App Store中。 你可以轻松尝试,说明在这里: [https://metabrain.eu/](https://metabrain.eu/) 这是GitHub链接:[https://github.com/OpenCow42/metaBrain](https://github.com/OpenCow42/metaBrain) 这个项目对我来说也是一个实验,旨在构建一个真正跨平台的Swift项目(Mac / Linux / Windows)。它是开源的,使用与我在Swift中封装的LevelDB相同的许可证。 代理(和人类)可以通过搜索快速检索内容,从而在代理工作期间将特定知识重新注入到特定上下文中。有趣的是,我曾认为“推理规则库”是旧的功能性专家系统的一个被遗忘的想法。现在,当我开始与代理工作时,我越来越感到需要动态地从这样的库中提取以前有效的解决方案。 我很乐意听取反馈。在产品适配方面,这对你有用吗,还是只有我对此感到满意? 最后,我在文档压缩方面玩得很开心,它尝试使用ZSTD快速压缩,如果压缩率不超过10%,则以未压缩形式存储数据,否则对数据进行ZSTD等级9的压缩。我从OpenZFS中学到了这个技巧。 谢谢!