最新

航空票价的“桶碰撞”问题，以及如何降低你的票价

2 分•作者: damian2000•20 天前•原帖

前代理怀旧

1 分•作者: ronbenton•20 天前•原帖

大规模隐私工程：构建自动化数据保留系统

1 分•作者: sandhyavinjam•20 天前•原帖

没有足够大的语料库。

1 分•作者: rad_val•20 天前•原帖

美人鱼作为人工智能代理的编程语言

1 分•作者: xxchan22•20 天前•原帖

展示HN：N.codes – 让用户在您的应用中生成迷你应用程序

1 分•作者: yungookim•20 天前•原帖

嘿，HN，我一直在开发 n.codes，这是一个开源框架，允许最终用户通过自然语言提示在您的应用中生成自己的用户界面。问题是：每个 SaaS 团队都被功能请求淹没。大多数请求并不复杂——只是现有数据的不同排列：“给我显示需要审批的超过 $500 的退款”，“导出这个格式化为会计的报告”，“批量归档这些记录”。后端已经可以做到这一点。瓶颈在于通过用户界面暴露这些功能。它的工作原理： - 读取您的组件（React/Vue），以了解可用的 UI 原语和样式 - 从您的 API、模式和文档中构建功能映射 - 当用户发出提示时，在您的应用中生成一个使用现有 API 和组件的沙盒 UI 它并不适用于营销页面或复杂流程。它是针对 80% 的内部工具，这些工具只是 CRUD、仪表板和工作流。当前状态：早期阶段。架构已定义，核心功能映射有效。在构建完整运行时之前，寻求反馈。希望获得以下方面的反馈： - 这是否解决了您遇到的真实问题？ - 什么能让您信任在生产应用中生成的 UI？（沙盒模型、权限、审计跟踪？） - 我应该研究的类似方法？ GitHub: [https://github.com/yungookim/n.codes](https://github.com/yungookim/n.codes) 网站: [https://n.codes](https://n.codes)

展示HN：PixelMotion：使用Sora 2、Veo 3.1及其他9个模型的AI视频生成

1 分•作者: anotherbuilder•20 天前•原帖

嗨，HN！我创建了PixelMotion，旨在解决作为内容创作者时遇到的一个问题：在扩展过程中需要同时使用太多工具。技术栈： - 前端：Next.js 15 + React 19 + TailwindCSS - 后端：Express.js + PostgreSQL + Sequelize - 人工智能：Replicate、FAL AI、OpenAI APIs - 视频模型：Sora 2、Veo 3.1、Luma Ray2、Runway Gen-3、Kling、Hailuo 2.3等 - 存储：Google Cloud Storage 它的不同之处在于： 1. 所有11个高级视频模型集中在一个地方（不再需要在不同服务之间切换） 2. 内置客户发现功能——直接找到可以进行推销的企业 3. 可直接发布到YouTube、TikTok、Instagram 欢迎随时询问有关架构或AI模型集成的技术问题。试用一下：7天免费试用，无需信用卡。

特斯拉正在调查其自动驾驶技术是否导致了交通违规行为。

1 分•作者: MilnerRoute•20 天前•原帖

我为电子商务产品图像生成构建了一个合适的用户界面（聊天无法扩展）。

1 分•作者: dairis•20 天前•原帖

问HN：我们能否用实际的Git问题来替代职位描述？

1 分•作者: A1aM0•20 天前•原帖

你好，HN，我正在探索一个概念，以解决“职位描述”和“实际工作”之间的脱节问题。问题：公司通常以特定的意图进行招聘（例如，“我们需要一个人来解决我们的遗留支付同步问题”），但当这些信息传达到职位描述时，往往变成了一堆泛泛而谈的关键词：“必须拥有5年以上的Java、微服务经验……” 假设：招聘是为了解决问题。那么，为什么不直接用问题本身作为职位描述呢？提议的工作流程：输入 = 问题背景（公开或私有）：招聘经理不再编写职位描述，而是从他们的问题跟踪系统（如GitHub、Jira等）中选择一组实际任务/问题。示例（开源）：“这是问题#123（内存泄漏）。帮我找一个解决过类似复杂问题的人。” 示例（企业）：“这是一个关于高并发数据库锁定的已解决任务。我们需要另一个能够处理这种工作水平的人。” 愿景：这可以通过API或MCP（模型上下文协议）服务器来实现，安全地获取任务背景——代码差异、讨论和复杂性指标。匹配：我们将这个“问题向量”与候选人的“活动向量”（从他们的git日志或贡献历史中得出）进行比较。结果：“候选人X的匹配度为90%，因为他们最近在Rust中重构了一个类似的异步队列系统，这与您输入的问题的复杂性相符。” 隐私挑战（房间里的大象）：为了在企业（私有仓库）中实现这一点，隐私至关重要。我在考虑一个本地提取层，在将“问题背景”发送到大型语言模型进行分析之前，先对其进行清理（去除个人身份信息/机密信息）。目标是提取问题的模式，而不是专有代码本身。我的问题：我首先在公共GitHub用例上构建原型。但对于那些在企业中招聘的人：您是否会信任一个解析您内部问题背景（经过清理）的工具，以生成精确的候选人要求档案？我相信这种“基于任务的招聘”比“简历解析”更公平，但我很好奇您认为这个模型在哪些方面会出现问题。

问HN：你的电脑上有多少个本地登录？

2 分•作者: bahmboo•20 天前•原帖

在很久以前，计算机是一种稀缺资源，我们必须共享它们。为此，我们使用了多个本地用户账户。现在我发现，除了我的个人登录和有时的管理员登录外，我几乎没有多个本地登录（即访问物理硬件时使用的用户名和密码）。我很好奇其他人是如何做的，以及在什么情况下使用。对于工作环境中的专用设备，这样做是非常合理的。在家里，你是否为你的孩子设置了不同的账户？额外加分：在手机或平板电脑上使用多个用户。我曾经在安卓设备上做过一次，感觉很有趣。

展示HN：我多年前 quit 编程。AI让我重返编程。

3 分•作者: ivcatcher•20 天前•原帖

快速背景介绍：我曾经编程过。在学校学习过，写过一些项目，但最终说服自己不适合这个领域。进展太慢，错误太多，感觉像个冒名顶替者——这就是常见的故事。所以我转行，成为了一家早期天使基金的投资助理，多年来没有写过真正的代码。快进到现在。我是个巴菲特迷——坚信复利是生活中的一种思维模型。我不断进行复利计算。并不是因为我需要这样做，而是因为在市场波动时，看到数字在30到40年间增长让我保持耐心。这基本上是长期投资者的冥想。问题是？网上的复利计算器都很糟糕。界面丑陋，广告覆盖了屏幕的一半，无法正确自定义复利频率，也没有逐年细分。我试过很多，它们都不行。当“氛围编码”开始流行时，我突然有了灵感。也许我真的可以构建我想要的计算器？我不再需要成为一个“真正的开发者”——我只需要清楚地描述我想要的。于是我试了一下。两周后，花费约100美元（Opus 4.5思维模型）的API费用，我居然有了60多个计算器。自然是从复利计算器开始的。然后我想，“既然我在这里……”就添加了抵押贷款、贷款摊销、储蓄目标、退休预测。然后一发不可收拾——BMI计算器、时区转换器、正则表达式测试器。哎呀。 AI（我通过Windsurf使用Claude）完美地处理了繁重的工作。我会准确描述我想要的——“带有每月/每季/每年选项的复利计算器，逐年细分表格，支持定期贡献”——它就能实现。还有验证、漂亮的组件，甚至测试。我意识到：我离开编码的这些年并没有浪费。我仍然理解架构，仍然知道什么是良好的用户体验，仍然拥有领域专业知识（金融数学）。我只是无法高效地将这些全部输入。AI完美地填补了这个空白。氛围编码并没有让我成为一个10倍工程师。但它让我重新获得了构建的许可。我多年来的想法突然变得可实现。对我来说，这才是真正的胜利。技术栈：Next.js、React、TailwindCSS、shadcn/ui，支持四种语言（英语/德语/法语/日语）。当我说“现代且简洁”时，AI选择了大部分这些技术。网站已上线，地址是 [https://calquio.com](https://calquio.com)。复利计算器仍然是我最喜欢的页面——终于是我想要的样子。我很好奇是否还有其他人有类似的故事。还有人像我一样在离开后重新回到构建的道路上吗？

仓库：具有上下文重新定位的语言模型

1 分•作者: hardmaru•20 天前•原帖

论文

1 分•作者: KaoruAK•20 天前•原帖

地铁MCP：华盛顿特区和纽约市地铁的MCP服务器

1 分•作者: Aarekaz•20 天前•原帖

克劳德正在席卷人工智能界，连非技术人员也感到惊艳。

2 分•作者: alhazrod•20 天前•原帖

YouTube 正在悄悄删除上传的 SRV3（样式化）字幕。

2 分•作者: slowdog•20 天前•原帖

展示HN：我为什么分叉了Gemini CLI - FOSS Cowork的替代品，它*就是*操作系统

1 分•作者: ProfHarita•20 天前•原帖

嗨，HN，我是TerminAI的维护者。我从Gemini CLI分叉了这个项目，因为它拥有我见过的最佳PTY实现。说实话，Gemini CLI，尤其是2.5版本，在编码方面表现得很糟糕。但它的执行框架本身——处理交互式终端、sudo提示、ssh会话、TUI应用的方式——那真是太棒了。随着Gemini 3的推出，我看到了可能性。因此，我重新设计了它，构建了TerminAI。支持多种LLM（Gemini、ChatGPT OAuth、LM Studio）。去掉了所有Google的遥测。构建了一个新的大脑，可以满足人类与计算机互动的各种需求。我最终得到的成果： - 本地优先。默认情况下零遥测。你的提示信息保留在你的设备上。 - 真正的PTY。交互命令不会挂起。增强了跨操作系统平台的执行能力。 - A/B/C审批梯度。破坏性操作需要你的明确批准。你定义什么是安全的。 - 多平台支持。Windows兼容性。PowerShell的表现与bash一样出色。 --------------------------------------------------------------------------------------------- 一些诚实的说明： - 桌面GUI存在，但尚未达到CoWork级别。我的重点是CLI。我需要贡献者。 - 一些模型（如GPT-5.2）表现不佳。这是因为它们的训练——它们不知道TerminAI是来保护它们的。Gemini、grok-code-fast-1，甚至GLM都能很好地运行。 - 可靠的部分：核心运行时。大脑、安全性、多LLM、跨平台、配方、Linux和Windows。 - 不可靠的部分：桌面应用、语音模式、自托管云中继、MCPs/扩展（代码在里面；需要测试和最终确认）。 --------------------------------------------------------------------------------------------- 安装与运行： ``` npm install -g @terminai/cli terminai ``` 在应用中： ``` /llm --设置LLM提供者 /llm reset --更改LLM提供者。当前需要重启应用才能生效 “审核我的docker容器，找出内存占用高的，检查其日志，总结错误。” “修复我的驱动程序……” “为我规划一个详细的行程，并输出为PDF格式，附带地图……” 或者你也可以随时使用老办法 “清理我的下载文件夹” ``` 很高兴深入讨论内部实现。

Utopian.Build – 让开发者获得报酬

1 分•作者: ludwigschubi•20 天前•原帖

展示HN：我使用Agent SDK让Claude玩Minecraft

2 分•作者: haksndot•20 天前•原帖

这个周末，我为我玩的一个Minecraft服务器构建了一个机器人。它使用Agent SDK作为主循环，并结合了一些自定义的MCP工具。一些亮点包括： * 机器人积极参与游戏内聊天，允许所有玩家与其互动。 * 具备与容器互动、制作物品、与村民交易以及其他各种功能的工具。 * 记忆系统，机器人利用它来跟踪游戏内事件、与玩家的互动等。 * 截图工具，让Claude可以使用视觉模式四处查看（虽然不太实用，但很有趣）。 * 与插件GriefPrevention和QuickShop互动的工具，使机器人能够管理土地声明和商店。 * 用于服务器管理、运行服务器命令等的工具。这是一个单独的、可选的工具集，存放在一个独立的代码库中。截至目前，共有69个工具。我们在玩家社区中不断提出新想法的同时，持续添加更多工具。大约三分之二的工具是对Mineflayer的封装。 100%凭感觉编码。没有一行代码是由人类编写或阅读的。 MIT许可证。如果你试用这个机器人，我非常希望听到你的反馈！

上一页 1...297 298 299 300 301...4741 下一页