返回首页
最新
我自2006年3月20日起使用用户名@switzerland。瑞士旅游自2006年10月17日起使用另一个用户名。最近,谷歌在没有任何通知的情况下将我的用户名转让给了瑞士旅游。他们的另一个用户名实际上已经使用了20年,毫无问题。
更糟糕的是,应用程序在很长一段时间内仍然显示我的用户名,而youtube.com/@Switzerland已经显示了瑞士旅游(Schweiz Tourismus)的用户名,而我对此毫不知情。因此,我几个月前就失去了这个用户名。
我为什么要告诉你这些?你可能会失去你的用户名,而你甚至没有意识到。
Gitmore (https://gitmore.io) – 为创始人和利益相关者提供开发可见性。
*Gitmore 的功能:*
连接您的代码库。用简单的英语提问:
- “本季度发布了什么?”
- “上个月推出了哪些功能?”
- “谁参与了哪些工作?”
获取可以直接放入董事会报告的答案。
*自动报告:*
安排每周或每月的总结发送到 Slack 或电子邮件:
- 发布的功能
- 修复的错误
- 贡献者
直接转发给投资者,或者在您周一会议前自动发送。
*Slack 机器人:*
将其添加到您的工作区。从您已经工作的地方提问。无需 GitHub 登录 – 对您或您的团队都不需要。
*工作原理:*
仅使用 Webhook。Git 平台推送元数据 – 提交信息、PR 描述、作者、时间戳。
每个事件都被规范化为结构化模式。AI 查询的是结构,而不是原始文本。
*安全性:*
仅限元数据。我们从不访问源代码。
- 加密令牌(Fernet)
- Webhook 签名验证
- 支持双因素认证(2FA)
GitHub、GitLab、Bitbucket – 一个仪表盘。
免费使用 1 个代码库: https://gitmore.io
您目前如何处理投资者关于工程进展的问题?
在我从事人工智能代理的工作时,我发现自己不断思考如何有效地对它们进行测试。随着我们整合更多的知识来源并扩展代理的能力,测试变得越来越复杂。作为一种标准做法,我们使用评估来确保质量得以维持。但老实说,我觉得缺少了一些东西。
我所看到的问题是,作为工程师,我们有时缺乏足够的领域知识来准确评估代理的响应。同时,现有的工具限制了与领域专家合作进行测试的可能性。例如,当前的工具更注重仪表板,而不是实际结果的可读性。
这就是我迄今为止的经验——我很想听听你对此的看法。
我写了一篇关于实时大语言模型(LLM)推理在流数据中的新方法的论文。希望找一位在 cs.LG 或 cs.AI 领域拥有 arXiv 认证权限的人来帮助我提交论文。
认证代码:GBUUPW
如果您想先进行审阅,我很乐意分享论文草稿。您可以通过 victor@logotype.se 联系我。
谢谢!
嗨,HN,
我开发了SnapCan([https://snapcan.app](https://snapcan.app)),这是一款iOS应用,利用人工智能将您的照片真实地放置在地球上的任何地点。
为了获取您诚实的反馈,前几次生成照片完全免费(无需付款)。
我认为它非常适合三种简单的用途:
1. 重新捕捉错过的回忆:在实际旅行中忘记拍摄好照片?可以追溯性地获得完美的照片。
2. 即使分开也能在一起:即使相隔千里,也可以与朋友或亲人在同一个地方(比如你们的老学校)创建一张真实的合影。
3. 纯粹为了好玩:为社交媒体或自己开心,制作不可能或幽默的“如果”照片。
如果您尝试了,我很想知道:
- 您尝试了以上哪个用例,结果是否符合您的期望?
- 过程(上传、选择地点、生成)是否简单明了?
- 有什么想法能让您再次使用它?
直接的免费iOS链接:[https://apps.apple.com/us/app/snapcan/id6756778727](https://apps.apple.com/us/app/snapcan/id6756778727)
我会在这里回答所有问题并讨论反馈。谢谢!
嗨,HN!我开发了WatchLLM,旨在解决在构建AI代理时遇到的两个问题:
1. 调试代理非常痛苦 - 当你的代理进行20次工具调用并失败时,想要弄清楚哪个决策出错了可真是个挑战。WatchLLM提供逐步时间线,显示每个决策、工具调用和模型响应,并解释代理为何做出这些决策。
2. 代理成本迅速上升 - 代理喜欢陷入循环或重复调用昂贵的工具。WatchLLM跟踪每一步的成本,并标记异常情况,比如“检测到循环 - 相同操作重复3次,浪费了$0.012”或“高成本步骤 - $0.08超出阈值”。
核心功能:
- 每个代理决策的时间线视图及成本细分
- 异常检测(循环、重复工具、高成本步骤)
- 语义缓存,额外减少40-70%的LLM费用
它与OpenAI、Anthropic、Groq兼容,只需更改你的baseURL。
该工具基于ClickHouse构建,提供实时遥测,并使用向量相似性作为缓存层。代理调试器通过LLM生成的摘要解释每个步骤发生的原因。
目前,它对每月最多50,000次请求免费开放。我正在寻找早期用户,他们正在构建代理,并希望更好地观察实际发生的情况(以及相关成本)。
试试吧: [https://watchllm.dev](https://watchllm.dev)
非常希望能听到你对其他调试功能的反馈。你希望在代理出现问题时拥有哪些功能?
嗨,HN,
我是VoGen的创始人 [https://vogen.app]。
我一直对人工智能技术的发展感到着迷,但我发现大多数现有的情感表达工具都需要昂贵的订阅费用。我创建VoGen是为了探索如何让AI语音变得更加“人性化”和可及。
它的功能包括:
- **语音克隆**:您可以使用3到60秒的样本克隆一个声音。它在清晰的单人录音中效果最佳。
- **情感文本转语音(TTS)**:您可以选择快乐、愤怒、悲伤等多种情感,而不是单调的语调。
- **双语支持**:目前支持英语和普通话。
- **隐私优先工具**:我还添加了一个基于浏览器的音频速度转换器,该工具在本地处理文件——对于这个特定工具,音频数据不会离开您的设备。
**技术栈**:前端使用React.js构建,并部署在Vercel上。语音引擎使用了一个定制的管道,专注于低延迟推理,同时保持高保真度。
**为什么是免费的?** 目前,VoGen处于早期阶段(MVP)。我想了解人们如何使用它,以及社区对语音质量的期望,然后再考虑商业化。
**隐私说明**:我知道语音数据是多么敏感。我们不会使用您上传的克隆样本来训练我们的基础模型。
我非常希望能得到HN社区的反馈。无论是关于延迟、情感的自然性,还是UI/UX方面——我都非常欢迎。
您认为哪些功能会使这个工具对您的工作流程更有用?
我们有无数复杂的格斗游戏,拥有极其复杂的输入系统:长按键组合、精确的时机。然而,当谈到游戏或互动系统中的舞蹈时,复杂性几乎总是消失。
舞蹈游戏通常要求你在摄像头前进行身体移动,或者踩在垫子上,或者仅仅触发一个单一的表情动画。与此同时,在像Roblox这样的平台上,玩家收集舞蹈动画,并在合适的时刻触发它们来展示自己。有时多个玩家甚至会同步他们的舞蹈,这已经有点像一个迪斯科派对。
所以让我一直困惑的问题是:为什么我们没有“舞蹈格斗者”——一种通过同样复杂的控制来掌握富有表现力和复杂性的舞蹈的系统,使用模式、时机和结构,而不是身体运动?
这个项目是朝这个方向的小实验:我正在探索通过一个基于模式的实时编码界面(Strudel)来控制角色的舞蹈动画,实时混合短动画循环。它还不是一个游戏,只是一个概念验证——但我很好奇舞蹈是否可以被视为一种技巧性、富有表现力的控制空间,就像格斗输入或音乐表演一样。