2作者: sagarkava5 个月前原帖
嘿,HN, 这份通讯并不是来自于某种增长黑客或内容策略。 它源于一种挫败感。 每周,我都在大量的博客、新闻稿和推特讨论中苦苦挣扎,试图跟上语音与人工智能的动态。新的模型不断推出,合作关系一夜之间建立,印度和亚洲的初创公司在推动基础设施升级,而这些都没有被报道。 但每当我想知道真正重要的事情时,信号总是被噪音淹没。 而且没有一份通讯专注于印度的语音人工智能生态系统——大多数只关注美国。 所以我创建了我希望存在的东西:Voice AI Stack——一份关于印度、亚洲和全球语音人工智能更新的通讯。 每周五你将收到的内容包括: - 实际推动语音与人工智能生态系统前进的产品发布 - 基础设施升级和战略交易(附带它们为何重要的背景信息) - 语音技术、翻译和代理性能的进展 - 聚焦于VideoSDK的AI代理功能——正在发布的内容以及未来的计划 如果你是开发者、产品经理、研究人员,或者只是对印度及其他地区的AI语音和代理的未来感到好奇——这份通讯适合你。 幕后故事 昨晚11:30,我们正在测试我们的VideoSDK AI代理。一切运行得非常顺利——流畅、稳定,完全没有问题。 然后突然间,每个代理都开始用歌剧的声音说话。它们不是在回答问题,而是在像意大利舞台上的歌手一样唱歌。 我们忍不住大笑。然后是恐慌。最后是解决方案。 这就是在这个领域构建的真实状态——混乱、惊喜,充满了意想不到的时刻。在每个精心打磨的演示背后,都是这样的夜晚:错误、欢笑和小胜利,让这段旅程变得值得。 这份通讯是我为你打开那扇门的方式。让你一窥实验、跌倒、以及“等等,那个代理刚才是不是……”的时刻,这些都让这个领域充满了兴奋。 在这里订阅,以便保持更新。 <a href="https:&#x2F;&#x2F;videosdkweekly.substack.com&#x2F;p&#x2F;welcome-to-voice-ai-stack-weekly" rel="nofollow">https:&#x2F;&#x2F;videosdkweekly.substack.com&#x2F;p&#x2F;welcome-to-voice-ai-st...</a> 如果你有朋友正在构建或对语音AI感到好奇——把这份通讯转发给他们。 让我们一起穿越噪音。 明天见, Sagar Kava
3作者: kashishhora5 个月前原帖
大家好!<p>我们与多个MCP服务器维护者合作,发现与现有供应商一起使用即插即用的日志记录和身份归属时遇到了一些困难。我们希望解决的几个挑战包括: - 将工具调用的基线管道与传统供应商连接 - 如何将工具调用与“用户会话”关联 - 理解代理发起的工具调用背后的上下文<p>因此,我们构建了一些东西。:) MCPcat库完全免费使用,采用MIT许可证,并提供了一行代码即可为任何支持OpenTelemetry的供应商添加日志记录和可观察性的解决方案。我们为Datadog和Sentry添加了自定义支持,因为我们个人使用这些供应商,但如果有兴趣,我们很乐意添加更多。<p>它的工作原理如下:<p><pre><code> mcpcat.track(serverObject, {...options…}) </code></pre> 这将初始化一系列监听器: 1. 在同一工作会话内对事件进行分类 2. 将这些事件直接发布到您的第三方数据提供商<p>您还可以选择屏蔽敏感数据。这些数据不会经过我们的服务器(除非您选择进行额外的上下文分析,我将在下面提到)。<p>一些团队可能还希望更好地了解“人们在我的MCP服务器上发现了哪些用例”。为此,我们提供了一个单独的仪表板,以更详细地可视化用户旅程(对于每月使用量较高的用户免费,开源项目始终免费)。<p>到目前为止,我们有两个SDK: Python SDK: &lt;<a href="https://github.com/MCPCat/mcpcat-python-sdk" rel="nofollow">https://github.com/MCPCat/mcpcat-python-sdk</a>&gt; TypeScript SDK: &lt;<a href="https://github.com/MCPCat/mcpcat-typescript-sdk" rel="nofollow">https://github.com/MCPCat/mcpcat-typescript-sdk</a>&gt;<p>其他SDK正在开发中!
2作者: drl55 个月前原帖
为什么要开发它?<p>首先,我不喜欢“一体化”的概念。特别是,我几乎只需要文字。我曾经使用过Typora,它确实很好,但除了编辑功能外,几乎无法满足我的需求。因此,我想知道是否有一个简单的Markdown编辑器,可以管理文件并提供良好的编辑体验?于是就有了MarkFlowy。<p>功能:<p>MarkFlowy独立开发了2.5年。基于轻量、简单和高可用性的设计理念,它现在拥有相当多的功能,例如:<p>- <i>本地优先</i>:MarkFlowy是一个纯粹的编辑器,旨在编辑您的本地内容。同步方式由用户自行选择。目前,它提供了一个Git管理器,未来还将与其他类似的云存储服务集成以实现同步。欢迎对此提供反馈。<p>- <i>用户体验至上</i>:它提供多种编辑模式,包括源代码和所见即所得(WYSIWYG)。此外,它支持自定义主题。而且,高性能是良好用户体验的基础。MarkFlowy具有轻量的包体积和专业的性能优化。实际测试表明,在M1 Mac设备上,编辑超过200,000个字符的文档仍然能够确保中文和英文的流畅书写。<p>- <i>AI支持</i>:MarkFlowy与多个AI供应商集成,如Deepseek、OpenAI和Ollama。它还支持在编辑器内使用他们的功能进行问答、摘要、翻译等任务,以提高您的写作效率。<p>- <i>简单性</i>:开箱即用。您只需熟悉Markdown语法即可轻松使用。它还提供Git等同步方法和强大的文件管理树。<p>除了这些功能,MarkFlowy还可以编辑文本文件(txt)、JSON文件,并查看图像文件等其他实用功能。我们欢迎大家体验、交流想法并参与其中。
5作者: byintes5 个月前原帖
嗨,HN,我开发了Yoink AI,以解决我对AI工具最大的烦恼:它们总是打断我的工作流程。我厌倦了在应用程序和聊天机器人之间复制粘贴,仅仅为了进行简单的编辑。 Yoink AI是一款macOS应用程序,将AI带到您身边。只需一个简单的快捷键(⌘ Shift Y),它就可以直接在任何应用程序的文本输入框中工作。如果您可以在那儿输入,Yoink就可以在那儿写作。 主要功能: - 自动捕捉您所在文本框的上下文,因此您无需手动输入。 - 创建基于您自己写作样本训练的自定义语音。这有助于您调整输出,使其符合您的个人风格,避免产生普通的、听起来像机器人的文本。 - Yoink不仅仅是简单地输出文本。它提供的建议以红线编辑的形式呈现,您可以选择接受或拒绝,从而保持完全的控制权。 它更像是一个适应您工作流程的协作写作伙伴,而不是反过来。 我们提供每月10次请求的免费套餐,并刚刚推出了专业试用版,您可以在前7天内获得100次请求来试用! 我在这里回答问题,也很想听听您的想法——像所有早期阶段的初创公司一样,反馈总是非常受欢迎的。