2作者: faebi22 天前原帖
我自2006年3月20日起使用用户名@switzerland。瑞士旅游自2006年10月17日起使用另一个用户名。最近,谷歌在没有任何通知的情况下将我的用户名转让给了瑞士旅游。他们的另一个用户名实际上已经使用了20年,毫无问题。 更糟糕的是,应用程序在很长一段时间内仍然显示我的用户名,而youtube.com/@Switzerland已经显示了瑞士旅游(Schweiz Tourismus)的用户名,而我对此毫不知情。因此,我几个月前就失去了这个用户名。 我为什么要告诉你这些?你可能会失去你的用户名,而你甚至没有意识到。
2作者: inferno2222 天前原帖
Gitmore (https://gitmore.io) – 为创始人和利益相关者提供开发可见性。 *Gitmore 的功能:* 连接您的代码库。用简单的英语提问: - “本季度发布了什么?” - “上个月推出了哪些功能?” - “谁参与了哪些工作?” 获取可以直接放入董事会报告的答案。 *自动报告:* 安排每周或每月的总结发送到 Slack 或电子邮件: - 发布的功能 - 修复的错误 - 贡献者 直接转发给投资者,或者在您周一会议前自动发送。 *Slack 机器人:* 将其添加到您的工作区。从您已经工作的地方提问。无需 GitHub 登录 – 对您或您的团队都不需要。 *工作原理:* 仅使用 Webhook。Git 平台推送元数据 – 提交信息、PR 描述、作者、时间戳。 每个事件都被规范化为结构化模式。AI 查询的是结构,而不是原始文本。 *安全性:* 仅限元数据。我们从不访问源代码。 - 加密令牌(Fernet) - Webhook 签名验证 - 支持双因素认证(2FA) GitHub、GitLab、Bitbucket – 一个仪表盘。 免费使用 1 个代码库: https://gitmore.io 您目前如何处理投资者关于工程进展的问题?
1作者: dinasorous22 天前原帖
在我从事人工智能代理的工作时,我发现自己不断思考如何有效地对它们进行测试。随着我们整合更多的知识来源并扩展代理的能力,测试变得越来越复杂。作为一种标准做法,我们使用评估来确保质量得以维持。但老实说,我觉得缺少了一些东西。 我所看到的问题是,作为工程师,我们有时缺乏足够的领域知识来准确评估代理的响应。同时,现有的工具限制了与领域专家合作进行测试的可能性。例如,当前的工具更注重仪表板,而不是实际结果的可读性。 这就是我迄今为止的经验——我很想听听你对此的看法。
1作者: logotype22 天前原帖
我写了一篇关于实时大语言模型(LLM)推理在流数据中的新方法的论文。希望找一位在 cs.LG 或 cs.AI 领域拥有 arXiv 认证权限的人来帮助我提交论文。 认证代码:GBUUPW 如果您想先进行审阅,我很乐意分享论文草稿。您可以通过 victor@logotype.se 联系我。 谢谢!
1作者: marsorange22 天前原帖
嗨,HN, 我开发了SnapCan([https://snapcan.app](https://snapcan.app)),这是一款iOS应用,利用人工智能将您的照片真实地放置在地球上的任何地点。 为了获取您诚实的反馈,前几次生成照片完全免费(无需付款)。 我认为它非常适合三种简单的用途: 1. 重新捕捉错过的回忆:在实际旅行中忘记拍摄好照片?可以追溯性地获得完美的照片。 2. 即使分开也能在一起:即使相隔千里,也可以与朋友或亲人在同一个地方(比如你们的老学校)创建一张真实的合影。 3. 纯粹为了好玩:为社交媒体或自己开心,制作不可能或幽默的“如果”照片。 如果您尝试了,我很想知道: - 您尝试了以上哪个用例,结果是否符合您的期望? - 过程(上传、选择地点、生成)是否简单明了? - 有什么想法能让您再次使用它? 直接的免费iOS链接:[https://apps.apple.com/us/app/snapcan/id6756778727](https://apps.apple.com/us/app/snapcan/id6756778727) 我会在这里回答所有问题并讨论反馈。谢谢!
1作者: Kaadz22 天前原帖
嗨,HN!我开发了WatchLLM,旨在解决在构建AI代理时遇到的两个问题: 1. 调试代理非常痛苦 - 当你的代理进行20次工具调用并失败时,想要弄清楚哪个决策出错了可真是个挑战。WatchLLM提供逐步时间线,显示每个决策、工具调用和模型响应,并解释代理为何做出这些决策。 2. 代理成本迅速上升 - 代理喜欢陷入循环或重复调用昂贵的工具。WatchLLM跟踪每一步的成本,并标记异常情况,比如“检测到循环 - 相同操作重复3次,浪费了$0.012”或“高成本步骤 - $0.08超出阈值”。 核心功能: - 每个代理决策的时间线视图及成本细分 - 异常检测(循环、重复工具、高成本步骤) - 语义缓存,额外减少40-70%的LLM费用 它与OpenAI、Anthropic、Groq兼容,只需更改你的baseURL。 该工具基于ClickHouse构建,提供实时遥测,并使用向量相似性作为缓存层。代理调试器通过LLM生成的摘要解释每个步骤发生的原因。 目前,它对每月最多50,000次请求免费开放。我正在寻找早期用户,他们正在构建代理,并希望更好地观察实际发生的情况(以及相关成本)。 试试吧: [https://watchllm.dev](https://watchllm.dev) 非常希望能听到你对其他调试功能的反馈。你希望在代理出现问题时拥有哪些功能?
1作者: leoyixing22 天前原帖
嗨,HN, 我是VoGen的创始人 [https://vogen.app]。 我一直对人工智能技术的发展感到着迷,但我发现大多数现有的情感表达工具都需要昂贵的订阅费用。我创建VoGen是为了探索如何让AI语音变得更加“人性化”和可及。 它的功能包括: - **语音克隆**:您可以使用3到60秒的样本克隆一个声音。它在清晰的单人录音中效果最佳。 - **情感文本转语音(TTS)**:您可以选择快乐、愤怒、悲伤等多种情感,而不是单调的语调。 - **双语支持**:目前支持英语和普通话。 - **隐私优先工具**:我还添加了一个基于浏览器的音频速度转换器,该工具在本地处理文件——对于这个特定工具,音频数据不会离开您的设备。 **技术栈**:前端使用React.js构建,并部署在Vercel上。语音引擎使用了一个定制的管道,专注于低延迟推理,同时保持高保真度。 **为什么是免费的?** 目前,VoGen处于早期阶段(MVP)。我想了解人们如何使用它,以及社区对语音质量的期望,然后再考虑商业化。 **隐私说明**:我知道语音数据是多么敏感。我们不会使用您上传的克隆样本来训练我们的基础模型。 我非常希望能得到HN社区的反馈。无论是关于延迟、情感的自然性,还是UI/UX方面——我都非常欢迎。 您认为哪些功能会使这个工具对您的工作流程更有用?
1作者: bntr22 天前原帖
我们有无数复杂的格斗游戏,拥有极其复杂的输入系统:长按键组合、精确的时机。然而,当谈到游戏或互动系统中的舞蹈时,复杂性几乎总是消失。 舞蹈游戏通常要求你在摄像头前进行身体移动,或者踩在垫子上,或者仅仅触发一个单一的表情动画。与此同时,在像Roblox这样的平台上,玩家收集舞蹈动画,并在合适的时刻触发它们来展示自己。有时多个玩家甚至会同步他们的舞蹈,这已经有点像一个迪斯科派对。 所以让我一直困惑的问题是:为什么我们没有“舞蹈格斗者”——一种通过同样复杂的控制来掌握富有表现力和复杂性的舞蹈的系统,使用模式、时机和结构,而不是身体运动? 这个项目是朝这个方向的小实验:我正在探索通过一个基于模式的实时编码界面(Strudel)来控制角色的舞蹈动画,实时混合短动画循环。它还不是一个游戏,只是一个概念验证——但我很好奇舞蹈是否可以被视为一种技巧性、富有表现力的控制空间,就像格斗输入或音乐表演一样。