返回首页

一周热榜

10作者: ElasticBottle3 天前原帖
大家好, 我们是 Winston、Edward 和 James,我们开发了 Meka Agent,这是一个开源框架,允许基于视觉的 LLM(大语言模型)像人一样直接在计算机上执行任务。 背景故事: 在过去几个月中,我们一直在构建计算机使用代理,这些代理已被多个团队用于质量保证测试,但我们意识到现有的浏览框架还不够完善。 因此,我们一直在开发一个浏览代理。 我们在 WebArena 上取得了 72.7% 的成绩,相比之下,OpenAI 的新 ChatGPT 代理的最新成绩为 65.4%。您可以在这里了解更多信息: [https://github.com/trymeka/webarena_evals](https://github.com/trymeka/webarena_evals)。 今天,我们将最先进的代理 Meka 开源,允许任何人从零开始构建自己的强大视觉代理。我们为困难的部分提供了基础设施,因此您无需担心: * 真实的基于视觉的控制:Meka 不仅仅是读取 HTML。它观察屏幕,识别交互元素,并决定点击、输入和滚动的位置。 * 完整的计算机访问:它并不局限于浏览器的沙箱环境。Meka 以操作系统级别的控制运行,能够处理系统对话框、文件上传以及其他仅限于浏览器的自动化工具无法处理的交互。 * 设计上可扩展:我们使得插入您自己的 LLM 和计算机提供者变得简单。 * 最先进的性能:在 WebArena 上取得 72.7% 的成绩。 我们的目标是使开发者能够通过提示代理,在任何计算机上创建可重复、稳健的任务,而无需担心实现细节。 我们非常希望听到您对这个工具如何融入您的自动化工作流程的反馈。请试用一下,并告诉我们您的想法。 您可以在 GitHub 上找到该仓库,并通过我们的托管平台快速开始:[https://app.withmeka.com/](https://app.withmeka.com/)。 谢谢, Winston、Edward 和 James
10作者: taure2 天前原帖
嗨,Hacker News社区, 我很高兴与大家分享Nova,这是一个为Erlang构建的新型网络框架,旨在使Erlang的网络开发变得更简单、更快速和更易于接触。Nova利用Erlang的并发性、可靠性和可扩展性,创建了一个强大而轻量的框架,用于构建现代网络应用程序。 主要特点: * 轻量且模块化:易于与现有的Erlang项目集成。 * 为并发而生:利用Erlang的演员模型,实现高性能的网络应用。 * 开发者友好:简化路由、中间件和模板处理。 * 可扩展:支持插件和自定义集成。 请查看: GitHub: [https://github.com/novaframework/nova](https://github.com/novaframework/nova) 主页: [https://novaframework.org](https://novaframework.org) 入门指南: [https://dev.to/taure/getting-started-with-nova-1ioo/stats](https://dev.to/taure/getting-started-with-nova-1ioo/stats) 我们目前处于开发早期,非常希望得到社区的反馈!如果你是Erlang爱好者,或者对使用这种以可靠性著称的语言(想想WhatsApp或RabbitMQ)构建网络应用感兴趣,请试试Nova,并告诉我们你的想法。 你对使用Erlang进行网络开发有什么看法?你希望在这样的框架中看到哪些功能?
9作者: pzullo2 天前原帖
嗨,Pietro 和 Luigi 在这里,我们是 mcp-use 的作者(<a href="https://github.com/mcp-use/mcp-use">https://github.com/mcp-use/mcp-use</a>)。 <p>当第一批 MCP 服务器发布时,我们对这项技术感到非常兴奋,但当我们想要深入了解时,发现 MCP 只能通过 Claude Desktop 或 Cursor 使用。作为工程师,我们对此并不满意。MCP 似乎是一个你想要自己用来构建产品和应用的工具,而不是一个隐藏在闭源应用后面的东西。 <p>于是我们开始接触 SDK,但对开发者体验感到相当不满(双重异步循环,大量样板代码)。我们决定编写 mcp-use 来简化我们的工作。 <p>mcp-use 让你只需 6 行代码即可将任何 LLM 连接到任何 MCP 服务器。我们提供了一个高层次的抽象,覆盖了官方 MCP SDK,使你的生活更轻松,并支持协议的所有功能。 <p>演示视频在这里:<a href="https://www.youtube.com/watch?v=nL_B6LZAsp4" rel="nofollow">https://www.youtube.com/watch?v=nL_B6LZAsp4</a>。 <p>我们提供的关键抽象称为 MCPClient 和 MCPAgent。 <p>MCPClient 接收一组服务器配置,自动检测传输类型,并创建一个后台任务来处理与服务器之间的流。 <p>MCPAgent 是 MCPClient、LLM 和自定义系统提示的组合。它通过将工具、资源和提示转换为模型无关的工具来消费 MCP 客户端,这些工具可以被 LLM 调用。 <p>该库还包含一些很酷的实用工具: <p>- 安全的沙箱执行 MCP 服务器(我们知道该协议在安全性方面表现不佳) <p>- 允许代理搜索可用服务器和工具的元工具(以避免上下文泛滥),并动态连接到所需的服务器(你可以用这个创建全能代理)。 <p>我们用这个做了一些很酷的事情: - 编写一个可以使用浏览器的代理,创建/读取更新了最新信息的线性票据。 <p>- 编写一个可以访问我们公司指标的代理,自动生成每周报告。 <p>- 我将一个代理连接到我在 IKEA 窗帘上黑客攻击的 MCP,以根据光照情况的图像调整我的房间照明。 <p>- 重建了一个开源的 Claude 代码风格 CLI,具有完整的 MCP 功能,但使用自定义模型和 BYOK(<a href="https://github.com/mcp-use/mcp-use-cli">https://github.com/mcp-use/mcp-use-cli</a>)。 <p>我们最近的下载量超过了 100,000 次,许多组织,包括 NASA,都在使用我们的工具! <p>我们很想听听你们的想法,最重要的是我们如何改进它!我们乐意回答任何问题,并期待你们的反馈。
9作者: Haakam212 天前原帖
大家好,我们是 Haakam、Michael 和 Adi。我们正在构建 AgentMail(<a href="https://agentmail.to">https://agentmail.to</a>),这是一个为 AI 代理提供独立电子邮箱的 API。我们不是在谈论为您的电子邮件提供 AI,而是为您的 AI 提供电子邮件。 我们开始构建电子邮件代理,因为它们可以在收件箱中与用户对话,自动化基于电子邮件的工作流程,并与第三方应用进行身份验证。鉴于这些独特的功能,我们认为电子邮件将成为代理的核心接口。 但我们最初是在 Gmail 的基础上进行开发,这让我们感到很挣扎:API 支持差、订阅费用高、速率限制、发送限制、GCP Pub/Sub、OAuth、糟糕的关键词搜索,以及整体糟糕的开发者体验。 Gmail 和其他提供商并不适合我们。因此,我们决定迎难而上,自己构建一个。 AgentMail 类似于 Gmail,但以 API 为先,支持程序化收件箱创建、通过 Webhook 和 WebSocket 发送事件、简单的 API 密钥认证、全组织的语义搜索、结构化数据提取,以及基于使用量的定价,随着发送/接收的电子邮件数量而扩展。 这里有一个构建电子邮件代理的演示:<a href="https://youtu.be/1V7BISeFUTM" rel="nofollow">https://youtu.be/1V7BISeFUTM</a> 这里有一个拥有自己电子邮箱的语音代理的演示:<a href="https://youtu.be/eG2fCsRK4RY" rel="nofollow">https://youtu.be/eG2fCsRK4RY</a> 到目前为止,AgentMail 已经被部署在多个用例中,例如为每个用户提供独立收件箱的应用、实时接收文档的语音代理、自动化账户配置和质量测试、拥有数千个收件箱的冷外呼平台、处理发票的自动化,以及与人类和其他代理协调工作的代理。 我们非常希望听到您的想法和反馈。您可以在 <a href="https://chat.agentmail.to">https://chat.agentmail.to</a> 尝试我们的演示平台。
9作者: Digit-Al4 天前原帖
我目前并不是Mastodon的用户,但对这个项目有一些兴趣。我看到了一些内容,似乎表明OSA(在线安全法案)可能会使自托管Mastodon变得困难,因为需要提供年龄验证。然后我阅读了相关条款,意识到这实际上不会影响到你,除非你每月有至少300万用户,因此理论上不会影响只有少量用户的自托管者。但我又想到,如果你与一个非常大的实例进行联邦连接,那么你的用户可能会与足够多的用户互动,从而受到这些条款的影响。 这可能是一个灰色地带,如果自托管者不小心,可能会面临相当大的风险。 我想知道是否有任何英国的Mastodon托管者在考虑这个问题。你们是否考虑关闭以避免任何责任?这会不会是Mastodon在英国托管的“死亡”?
8作者: stelcodes2 天前原帖
我创建并开源了一个Astro开发者博客模板,配备了一个互动主题切换器,包含所有60种主题,并与JS代码高亮工具Shiki捆绑在一起。更改主题会影响整个网站,包括代码示例和Giscus评论。受到原始Markdown美学的启发,我希望创建一个美丽的博客,类似于<a href="https://github.com/panr/hugo-theme-terminal">https://github.com/panr/hugo-theme-terminal</a>,但进行了现代化的重新设计,并融入了Astro的强大功能。 <p>功能:</p> <pre><code> - 简单的配置文件 - 多种主题模式(单一、亮色/暗色/自动、选择) - Giscus评论 - RSS订阅 - SEO最佳实践 + 社交卡片生成 - Markdown扩展(目录、提示、阅读时间等)</code></pre>