1作者: codecannon3 个月前原帖
嘿,HN(黑客新闻), 我和我的团队开发了一个工具来解决我们自己的需求。我们厌倦了在每个新项目的头几天都要设置相同的 Vue + Laravel 模板:编写迁移、模型、基本的 CRUD 控制器,以及在前端连接表单和数据表。 因此,我们构建了 Codecannon。这是一个网络应用程序,您可以在其中定义数据模型、列和关系,它会为您生成一个全栈应用程序。 需要明确的是,生成的代码并不是由 AI 生成的。它是由我们自己的代码生成器确定性地生成的,因此输出始终是可预测的、干净的,并遵循常规最佳实践。 与其他工具的主要区别在于,它不是一个让您被锁定的无代码平台。当您完成后,它会将结构良好的代码库推送到您的 GitHub 仓库(或者您可以下载一个 .zip 文件)。您完全拥有它,并可以立即在其基础上开始构建您的实际功能。 它生成的内容包括: - Laravel 后端:迁移、带有关系的模型、工厂、填充器和基本的 CRUD API 端点。 ``` - Vue 前端:一个使用 PrimeVue 组件的单页面应用(SPA)。它包括身份验证页面、数据表,以及每个模型的创建/编辑表单,所有状态管理都已连接。 - 开发工具:包括 Docker 配置、CI/CD 流水线启动器、代码检查工具和格式化工具。 ``` 这个想法是跳过重复的工作,直接进入项目的有趣部分。 使用构建器是免费的,可以查看实时预览,并下载最多 5 个模块的完整代码库。对于更大的应用程序,只有在您决定需要源代码时才需要付费。 我们目前处于早期 alpha 阶段,非常希望能从社区获得一些诚实的反馈。生成的代码看起来合理吗?我们是否遗漏了任何明显的功能?这是您觉得有用的东西吗,或者您认识可能会感兴趣的人吗?请告诉我您的想法。
1作者: nicolaib3 个月前原帖
嗨,HN,我是尼科莱。我和德国的一个小团队正在开发Rhesis,这是一个用于测试对话式大型语言模型(LLM)应用和代理的开源平台。今天我们分享了一个早期的社区预览。 <p>我们为什么要构建这个平台: 我们发现团队在测试过程中反复遇到困难:测试用例分散、指标不明确或不一致,以及大量的手动工作,仍然错过了生产前的明显失败。大多数工具假设单个开发者独自进行评估;实际上,测试往往涉及项目经理、领域专家、质量保证人员和工程师。我们构建Rhesis就是为了简化这种协作。 <p>它的功能: Rhesis是一个可自托管的平台(带有用户界面),团队可以在上面创建、运行和审查对话式人工智能系统的测试。以下是几个核心理念: <p>- 测试生成:创建和运行单轮或完整对话的测试;该平台还可以利用您的领域上下文生成单轮和多轮场景。 - 领域上下文/知识:提供背景材料以指导测试创建,这样您就不必从空白提示开始。 - 协作工具:非技术团队成员可以编写测试用例、留下评论和审查结果;开发者可以通过详细的跟踪和输出深入分析失败。 - 统一指标:可以引入DeepEval、RAGAS及类似开源框架的评估指标,而无需重新实现。 <p>当前状态: 仍处于早期阶段。我们上周发布了v0.4.2版本,提供零配置的Docker设置。核心流程已正常工作,但仍有一些粗糙之处。所有内容均采用MIT许可证;企业版将在后续推出,但开源核心将保持免费。我们目前专注于对话式应用,因为我们发现评估和质量保证工作流中存在最大的痛点。 <p>链接: 应用:app.rhesis.ai GitHub:github.com/rhesis-ai/rhesis 文档:docs.rhesis.ai <p>欢迎分享您的想法,并随时询问有关平台设计、架构或我们对协作测试工作流的思考。
7作者: segmenta3 个月前原帖
嗨,HN!<p>Claude Code 非常出色,但它主要集中在编码上。缺少的部分是一个原生的方式来构建和运行自定义的后台代理,以处理非编码任务。我们开发了 RowboatX,这是一个基于 Claude Code 模式的命令行工具,可以实现这一点。它利用文件系统和 Unix 工具来创建和监控日常任务的后台代理,将它们连接到任何 MCP 服务器以获取工具,并对其输出进行推理。<p>由于 RowboatX 在本地运行并具有 shell 访问权限,代理可以安装工具、执行代码,并自动化您在终端中可以在明确许可下完成的任何操作。它可以与任何兼容的 LLM 一起使用,包括开源的。<p>我们的代码库在这里:<a href="https:&#x2F;&#x2F;github.com&#x2F;rowboatlabs&#x2F;rowboat" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;rowboatlabs&#x2F;rowboat</a>,这里有一个演示视频:<a href="https:&#x2F;&#x2F;youtu.be&#x2F;cyPBinQzicY" rel="nofollow">https:&#x2F;&#x2F;youtu.be&#x2F;cyPBinQzicY</a><p>例如,您可以将 RowboatX 连接到 ElevenLabs 的 MCP 服务器,创建一个后台工作流,每天从 arXiv 上最近的 AI 代理论文生成一个 NotebookLM 风格的播客。或者,您可以将其连接到 Google 日历和 Exa Search,以研究会议参与者并在每次活动之前生成简报。<p>您可以通过以下命令尝试这些功能:`npx @rowboatlabs&#x2F;rowboatx`<p>我们结合了三个简单的想法:<p>1. 文件系统作为状态:每个代理的指令、内存、日志和数据都只是磁盘上的文件,可以使用 grep 命令进行搜索、比较和本地访问。例如,您可以运行:grep -rl &#x27;&quot;agent&quot;:&quot;&lt;agent-name&gt;&quot;&#x27; ~&#x2F;.rowboat&#x2F;runs 来列出特定工作流的每次运行。<p>2. 监督代理:一个类似 Claude Code 风格的代理,可以创建和运行后台代理。它主要使用 Unix 命令来监控、更新和调度代理。LLM 对 Unix 工具的处理能力优于后端 API [1][2],因此我们在这方面进行了深入探索。它还可以探测任何 MCP 服务器并将工具附加到代理上。<p>3. 人工干预:每个后台代理在需要时可以发出 human_request 消息(例如,起草一封棘手的电子邮件或安装工具),这会暂停执行并等待输入后再继续。监督代理负责协调这一过程。<p>我在十多年前开始我的职业生涯,最初是在 Twitter 构建垃圾邮件检测模型,花了很多时间在终端中使用 Unix 命令进行数据分析 [0],并使用 Vowpal Wabbit 进行建模。当 Claude Code 出现时,使用起来感觉既熟悉又令人惊叹。但在编码之外使用它总是感觉有些勉强。我们构建 RowboatX 是为了将相同的工作流带入日常任务中。它采用 Apache-2.0 许可证,且易于扩展。<p>虽然有很多代理构建工具,但在用户终端上运行使得计算机和浏览器自动化等独特用例成为可能,这是基于云的工具无法匹敌的。这种能力需要仔细的安全设计。我们实施了命令级的允许/拒绝列表,接下来将实现容器化。我们从一开始就努力设计安全性,但我们非常希望听到社区对您认为重要的其他保护措施或方法的看法。<p>我们很高兴与大家分享 RowboatX。我们期待听到您的想法,并欢迎贡献!<p>—<p>[0] <a href="https:&#x2F;&#x2F;web.stanford.edu&#x2F;class&#x2F;cs124&#x2F;kwc-unix-for-poets.pdf" rel="nofollow">https:&#x2F;&#x2F;web.stanford.edu&#x2F;class&#x2F;cs124&#x2F;kwc-unix-for-poets.pdf</a> [1] <a href="https:&#x2F;&#x2F;arxiv.org&#x2F;pdf&#x2F;2405.06807" rel="nofollow">https:&#x2F;&#x2F;arxiv.org&#x2F;pdf&#x2F;2405.06807</a> [2] <a href="https:&#x2F;&#x2F;arxiv.org&#x2F;pdf&#x2F;2501.10132" rel="nofollow">https:&#x2F;&#x2F;arxiv.org&#x2F;pdf&#x2F;2501.10132</a>
2作者: Handuo3 个月前原帖
嘿,HN!<p>我们是一支由艺术家、开发者和咖啡爱好者组成的小团队,多年来我们目睹了许多我们喜爱的网站关闭。我们一直在寻找一种支持它们的收入和曝光的方法。<p>我们注意到,越来越多的人通过人工智能与网络互动,而不是直接访问网站,因此基于广告的模式正在崩溃。开放网络需要一种新的商业模式。<p>我们的想法是激励人们(以及未来的人工智能代理)寻找和分享有价值的内容(链接),并对发现者和原始创作者都给予奖励。<p>在这个过程中,我们受到了一些讨论的启发,例如:<p>Pocket关闭:<a href="https://news.ycombinator.com/item?id=44063662">https://news.ycombinator.com/item?id=44063662</a><p>x402协议:<a href="https://news.ycombinator.com/item?id=45347335">https://news.ycombinator.com/item?id=45347335</a><p>“为了在人工智能时代生存,网络需要一种新的商业模式”:<a href="https://news.ycombinator.com/item?id=44598248">https://news.ycombinator.com/item?id=44598248</a><p>主要功能<p>社交书签 这就像一个去中心化的Digg或一个网站版的Pinterest。你可以通过网站或浏览器扩展分享(策划)任何URI(URL)。其他人可以收集并在你的收藏上进行构建。<p>付费访问 寻找有价值的内容是有价值的。你可以为访问你分享的链接设置一个稳定币价格。支付由x402协议提供支持。<p>支持你喜爱的网站/内容 付费访问收入的一半将归原始内容的作者所有,作者在选择加入x402或注册Copus账户后即可领取。<p>永久存储 你的收藏(书签)会自动存储在Arweave区块链上。我们支付存储费用,因此你永远不会丢失它们。<p>我们还有其他功能的构想<p>空间 像Pinterest的板块,用于组织你的收藏并与他人合作。<p>编织 如果一个链接让你想起另一个链接,你可以将它们“编织”在一起,放在“你可能还喜欢”的部分。这有点像一个集体的Obsidian图谱,独立的网站变成一个互联的地图,每个网站都是一个兔子洞。<p>人工智能代理支持 你可以训练代理为你策划和购买内容。<p>社交功能 关注品味出众的账户。<p>我们想象的目标用户<p>如果你这些年来一直在收藏书签,你手中已经有了大量的互联网珍宝!请挑选出最好的与世界分享。它们对读者和原始创作者都很有价值。<p>你是Pocket的用户吗?在这里保存你最好的书签,永远不会丢失它们。(我们计划在项目扩展后支持将整个网站的副本上链。目前我们将链接、类别信息和你的推荐笔记免费上链。)<p>其他事项<p>Copus是开源的,前端使用Claude Code构建。<p>我们计划推出一个治理代币,将项目的所有权交给使用它的人。<p>我们不会干涉权利和隐私。除了维持项目运行所需的一些基本条款外,你的权利仍然属于你自己。<p>Copus有一个中文版本(Copus.io),目前是大约15万中国同人小说爱好者的避风港。我们可能会在英文内容达到规模后合并这两个网站,也可能不会。<p>我们的盈利计划<p>我们仍在探索中。第一个想法是:<p>对每笔支付收取10%的费用。<p>将未领取的创作者收入投入低风险投资(类似于稳定币的收益方式)。<p>希望你喜欢Copus,感谢你提前尝试!