2作者: selljamhere5 个月前原帖
Whodunit最初是一个适合家庭游戏之夜的纸笔游戏。它在GopherCon '25的闪电演讲中演变为一个可玩的网页应用程序。<p>所有的谜题都是由大型语言模型(LLM)编写的。有些谜题质量更高,但大多数都表现良好。<p>这个网页应用程序是用Go语言编写的,使用了模板HTML模板、HTMX实现页面内交互,以及作为Temporal工作流编写的回合制游戏引擎。<p>有关更多信息,请查看谜题生成的详细介绍:<a href="https://blog.apartment304.com/whodunit-llm-murder-mysteries" rel="nofollow">https://blog.apartment304.com/whodunit-llm-murder-mysteries</a>
3作者: ventali085 个月前原帖
Sudo — 开发者的AI变现基础设施 四个月前,我在构建AI产品时遇到了同样的问题:推理成本高,订阅模式不够灵活,而广告并不适合生成内容。 因此,我开始着手开发Sudo,这是一个基础设施层,旨在简化AI应用的推出和变现。 —— 主要功能(目前处于测试阶段): • 一个API,能够在顶级模型之间进行路由(无供应商锁定) • 实时计量与计费(基于使用量的、订阅制或混合模式) • 可选的AI原生广告——上下文相关、开发者定义和个性化 • 用于跟踪使用情况、收入和利润的仪表板 您可以在这里试用: [https://sudoapp.dev](https://sudoapp.dev) 文档: [https://docs.sudoapp.dev](https://docs.sudoapp.dev) Discord: [https://discord.com/invite/UbPf5BgrfK](https://discord.com/invite/UbPf5BgrfK) —— 我们为早期测试者提供首月10%的额外积分。 期待您的反馈——哪些地方感觉不顺畅,缺少什么,什么能让这个工具真正适合您的项目?
2作者: wafflemaker5 个月前原帖
在过去的一年里,我们观察到了编码代理的迅速增长。它们比以往任何时候都更受欢迎。 我正在学习信息技术,想要进入这个市场。和一位同学一起,我们发现很难获得面试机会,而初级工程师的职位似乎有不少空缺。我的情况是初级Linux管理员,我朋友则是初级数据工程师。 我从许多不在这个行业的朋友那里听说,根据他们在IT行业认识的人说,一些公司已经停止招聘初级职位。使用大型语言模型(LLM)似乎更为划算。这与市场上初级职位广告数量的减少相符。 你能分享一下你的经验吗?你们公司还在招聘初级职位吗?你在行业里的朋友们怎么说? 也许我错了,市场的饱和使得大多数职位“隐蔽”了,人们通过自己的网络找工作,而这些职位根本没有被公开招聘。也可能是因为我只在特隆赫姆找工作,这里并不是一个很大的城市(15万人口,但由于全国最大的技术大学位于这里,技术市场相对可观)。 之前提问(2024):https://news.ycombinator.com/item?id=40905701
7作者: nickpapciak5 个月前原帖
大家好!我们是 Abhi、Venkat、Tom 和 Nick,我们正在构建 Datafruit(<a href="https://datafruit.dev">https://datafruit.dev</a>),一个 AI DevOps 代理。我们就像 DevOps 领域的 Devin。你可以让 Datafruit 检查你的云支出,寻找松散的安全策略,修改你的基础设施即代码(IaC),并能够在你的部署标准、设计文档和 DevOps 实践之间进行推理。 <p>演示视频:<a href="https://www.youtube.com/watch?v=2FitSggI7tg" rel="nofollow">https://www.youtube.com/watch?v=2FitSggI7tg</a>。</p> 目前,我们有两种主要方式与 Datafruit 互动: <p>(1) 自动化基础设施审计——代理定期扫描你的环境,以寻找成本优化机会,检测基础设施漂移,并验证你的基础设施是否符合合规要求。</p> <p>(2) 聊天界面(可通过网页 UI 和 Slack 使用)——向代理提问以获取实时洞察,或直接分配任务,例如调查支出异常、审查安全态势或对 IaC 资源进行更改。</p> 在 FAANG 和各种高增长初创公司工作时,我们意识到基础设施工作需要大量的上下文,往往比传统软件工程还要多。业务决策、代码库和云本身在任何分配的任务中都极为重要。为了最大化代理的成功,我们进行了相当多的上下文工程。避免幻觉是非常重要的! <p>我们采用的一个非常有效的方法是多代理系统,其中我们有专门的子代理,能够访问特定工具调用和文档。代理在觉得其他代理更适合某项任务时,可以选择“交接”。然而,所有代理共享相同的上下文(<a href="https://cognition.ai/blog/dont-build-multi-agents" rel="nofollow">https://cognition.ai/blog/dont-build-multi-agents</a>)。我们对这种方法感到非常满意,并相信它可以在其他需要大量专业知识的领域中发挥作用。</p> 基础设施可能是任何软件组织中最关键的部分,需要非常严格的保护措施来确保安全。语言模型尚未达到可以信任其进行更改的程度(我们与几家初创公司交谈过,其中 Claude Code + AWS CLI 的组合导致了他们的基础设施崩溃)。目前,Datafruit 仅获得对你的基础设施的只读访问权限,只能通过对你的 IaC 仓库的拉取请求进行更改。代理还在一个沙盒虚拟环境中运行,因此即使它想写云 CLI 命令也无法做到! <p>大型语言模型(LLMs)可以显著增加价值的地方在于减少那些消耗云支出并延误截止日期的持续操作低效——这些小而紧急的操作工作。一旦 Datafruit 索引了你的环境,你可以让它执行以下操作:</p> <pre><code> &quot;授予 @User 24 小时内对分析 S3 桶的写入访问权限&quot; -&gt; 创建临时 IAM 角色,发送最小权限凭证,明天自动撤销 &quot;找出这个密钥的使用位置,以便我可以在不造成停机的情况下进行轮换&quot; -&gt; 发现所有密钥的实例,包括你可能不知道的旧定时任务,以便你可以安全地轮换密钥 &quot;为什么昨天数据库成本激增?&quot; -&gt; 识别高成本查询,展示优化选项,实施修复 </code></pre> 我们采用简单的订阅模式收费,提供托管版本,但也提供自带云的模式。Datafruit 的所有功能都可以使用 Helm 图表在 Kubernetes 上部署,适用于数据不能离开你的 VPC 的企业客户。 目前,我们正在客户的云上自行安装产品。它尚未以自助服务的形式存在。我们最终会实现这一点,但在此期间,如果你感兴趣,我们非常希望你能通过 founders@datafruit.dev 给我们发邮件。 <p>我们期待听到你的想法!如果你从事云基础设施工作,我们特别希望了解你希望能够转交给代理的工作类型。</p>
1作者: gtirloni5 个月前原帖
刚收到一封关于教育科技的调查邮件,上周也收到关于他们因隐私问题起诉一些人的邮件,我想是这样。<p>我知道他们分拆了Thunderbird(算是?),并期待对其他产品也采取类似的措施。<p>我有些困惑,有人知道他们的方向是什么吗?
1作者: overregulated5 个月前原帖
据我了解,如果您在非商业活动中(无论是开源软件还是其他)发布软件,CRA(加拿大税务局)并不适用。假设一个承包商有一个在线品牌(以个人名义)、一个博客和一个包含一些项目的GitHub账户,那么您是否可以在不触及CRA规定的情况下进行一个爱好项目呢?有人可能会争辩说,在线存在本身就是一种商业活动,并且与之相关的软件也是如此。 我认为,确保安全的一种方法是将商业产品放在另一个网站上,使用另一个品牌名称,并仅从个人网站链接到该品牌,这样个人网站更像是一个关于我的页面。但我不确定这样做的安全性有多高。 法律是这样规定的,但对什么是商业活动并没有明确的定义: https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=OJ:L_202402847 “本条例适用于在市场上提供的具有数字元素的产品,其预期目的或合理可预见的使用包括与设备或网络的直接或间接逻辑或物理数据连接。” “‘在市场上提供’是指在商业活动中,为在欧盟市场上分发或使用而提供具有数字元素的产品,无论是有偿还是无偿。” 在引言中提到了商业活动,但这并不具有法律约束力: “本条例仅适用于与在市场上提供的具有数字元素的产品相关的经济运营者,因此在商业活动中为在欧盟市场上分发或使用而提供。商业活动中的供应不仅可以通过对具有数字元素的产品收取价格来表征,还可以通过对技术支持服务收取价格(如果这不仅仅是为了弥补实际成本),通过意图实现货币化,例如通过提供一个软件平台,制造商通过该平台货币化其他服务,或者通过将处理个人数据作为使用条件,而不仅仅是为了改善软件的安全性、兼容性或互操作性,或者通过接受超过与设计、开发和提供具有数字元素的产品相关的成本的捐赠。接受没有盈利意图的捐赠不应被视为商业活动。”