最新

1 分•作者: cebert•23 天前•原帖

1 分•作者: marsorange•23 天前•原帖

嗨，HN，我开发了SnapCan（[https://snapcan.app](https://snapcan.app)），这是一款iOS应用，利用人工智能将您的照片真实地放置在地球上的任何地点。为了获取您诚实的反馈，前几次生成照片完全免费（无需付款）。我认为它非常适合三种简单的用途： 1. 重新捕捉错过的回忆：在实际旅行中忘记拍摄好照片？可以追溯性地获得完美的照片。 2. 即使分开也能在一起：即使相隔千里，也可以与朋友或亲人在同一个地方（比如你们的老学校）创建一张真实的合影。 3. 纯粹为了好玩：为社交媒体或自己开心，制作不可能或幽默的“如果”照片。如果您尝试了，我很想知道： - 您尝试了以上哪个用例，结果是否符合您的期望？ - 过程（上传、选择地点、生成）是否简单明了？ - 有什么想法能让您再次使用它？直接的免费iOS链接：[https://apps.apple.com/us/app/snapcan/id6756778727](https://apps.apple.com/us/app/snapcan/id6756778727) 我会在这里回答所有问题并讨论反馈。谢谢！

与Memgraph首席技术官一起构建更优秀企业图形RAG管道的建议

1 分•作者: taubek•23 天前•原帖

代理技能改变了我与人工智能的工作方式

1 分•作者: intellectronica•23 天前•原帖

展示 HN：WatchLLM – 逐步调试 AI 代理并进行成本归属

1 分•作者: Kaadz•23 天前•原帖

嗨，HN！我开发了WatchLLM，旨在解决在构建AI代理时遇到的两个问题： 1. 调试代理非常痛苦 - 当你的代理进行20次工具调用并失败时，想要弄清楚哪个决策出错了可真是个挑战。WatchLLM提供逐步时间线，显示每个决策、工具调用和模型响应，并解释代理为何做出这些决策。 2. 代理成本迅速上升 - 代理喜欢陷入循环或重复调用昂贵的工具。WatchLLM跟踪每一步的成本，并标记异常情况，比如“检测到循环 - 相同操作重复3次，浪费了$0.012”或“高成本步骤 - $0.08超出阈值”。核心功能： - 每个代理决策的时间线视图及成本细分 - 异常检测（循环、重复工具、高成本步骤） - 语义缓存，额外减少40-70%的LLM费用它与OpenAI、Anthropic、Groq兼容，只需更改你的baseURL。该工具基于ClickHouse构建，提供实时遥测，并使用向量相似性作为缓存层。代理调试器通过LLM生成的摘要解释每个步骤发生的原因。目前，它对每月最多50,000次请求免费开放。我正在寻找早期用户，他们正在构建代理，并希望更好地观察实际发生的情况（以及相关成本）。试试吧： [https://watchllm.dev](https://watchllm.dev) 非常希望能听到你对其他调试功能的反馈。你希望在代理出现问题时拥有哪些功能？

展示HN：VoGen – 一款用于超真实声音生成和克隆的网络应用程序

1 分•作者: leoyixing•23 天前•原帖

嗨，HN，我是VoGen的创始人 [https://vogen.app]。我一直对人工智能技术的发展感到着迷，但我发现大多数现有的情感表达工具都需要昂贵的订阅费用。我创建VoGen是为了探索如何让AI语音变得更加“人性化”和可及。它的功能包括： - **语音克隆**：您可以使用3到60秒的样本克隆一个声音。它在清晰的单人录音中效果最佳。 - **情感文本转语音（TTS）**：您可以选择快乐、愤怒、悲伤等多种情感，而不是单调的语调。 - **双语支持**：目前支持英语和普通话。 - **隐私优先工具**：我还添加了一个基于浏览器的音频速度转换器，该工具在本地处理文件——对于这个特定工具，音频数据不会离开您的设备。 **技术栈**：前端使用React.js构建，并部署在Vercel上。语音引擎使用了一个定制的管道，专注于低延迟推理，同时保持高保真度。 **为什么是免费的？** 目前，VoGen处于早期阶段（MVP）。我想了解人们如何使用它，以及社区对语音质量的期望，然后再考虑商业化。 **隐私说明**：我知道语音数据是多么敏感。我们不会使用您上传的克隆样本来训练我们的基础模型。我非常希望能得到HN社区的反馈。无论是关于延迟、情感的自然性，还是UI/UX方面——我都非常欢迎。您认为哪些功能会使这个工具对您的工作流程更有用？

展示HN：免费AI图像放大器（100%本地，私密且免费）

2 分•作者: tamnv•23 天前•原帖

在崩溃时代做一个人（2022）[pdf]

28 分•作者: barishnamazov•23 天前•原帖

皮：有很多编码代理，但这个是我的。

1 分•作者: tosh•23 天前•原帖

展示HN：使用Strudel控制舞蹈动画

1 分•作者: bntr•23 天前•原帖

我们有无数复杂的格斗游戏，拥有极其复杂的输入系统：长按键组合、精确的时机。然而，当谈到游戏或互动系统中的舞蹈时，复杂性几乎总是消失。舞蹈游戏通常要求你在摄像头前进行身体移动，或者踩在垫子上，或者仅仅触发一个单一的表情动画。与此同时，在像Roblox这样的平台上，玩家收集舞蹈动画，并在合适的时刻触发它们来展示自己。有时多个玩家甚至会同步他们的舞蹈，这已经有点像一个迪斯科派对。所以让我一直困惑的问题是：为什么我们没有“舞蹈格斗者”——一种通过同样复杂的控制来掌握富有表现力和复杂性的舞蹈的系统，使用模式、时机和结构，而不是身体运动？这个项目是朝这个方向的小实验：我正在探索通过一个基于模式的实时编码界面（Strudel）来控制角色的舞蹈动画，实时混合短动画循环。它还不是一个游戏，只是一个概念验证——但我很好奇舞蹈是否可以被视为一种技巧性、富有表现力的控制空间，就像格斗输入或音乐表演一样。

人工智能摧毁机构

1 分•作者: sean_the_geek•23 天前•原帖

集成显式解析数论网络

1 分•作者: jjgreen•23 天前•原帖

计算机使用代理的控制流完整性

1 分•作者: iliaishacked•23 天前•原帖

Kamal：随时随地部署网络应用程序

1 分•作者: ndr•23 天前•原帖

展示HN：Codex Plus – 为无头工作流加速的OpenAI Codex

1 分•作者: SafeDusk•23 天前•原帖

我经常使用 codex exec，但它内置的遥测支持不足，无法满足调试和优化的需求。<p>codex-plus 提供了一个命令行接口，镜像了 codex exec 的界面，但它是基于 TypeScript SDK（@openai/codex-sdk）实现的。<p>每次运行后，它会将完整的会话日志导出到远程的 OpenTelemetry 收集器，然后可以通过 codex-plus-log-viewer 进行调试和优化。<p>请查看 <a href="https://github.com/aperoc/codex-plus" rel="nofollow">https://github.com/aperoc/codex-plus</a>！

《延续的发现》[pdf]

1 分•作者: fanf2•23 天前•原帖

我开发了一个工具来帮助我停止刷新这个网站。

1 分•作者: gaborme•23 天前•原帖

如果一棵树倒下——西克莫峡谷杀手的审判

1 分•作者: bcraven•23 天前•原帖

隔离的光谱：从裸金属到WebAssembly

7 分•作者: ThierryBuilds•23 天前•原帖

开启AWS欧洲主权云

17 分•作者: notmine1337•23 天前•原帖

上一页 1...341 342 343 344 345...4745 下一页