返回首页
一周热榜
大家好,我是扎克 :wave:。我一直在思考误导性人工智能拉取请求的问题,想提出一个可能的解决方案,欢迎大家反馈。基本上,CleverCrow 允许支持者向 GitHub 仓库(或该仓库中的一组问题)赠送代币,供维护者用来构建或修复内容。实现过程中的有趣挑战在于如何实现代币池的动态管理,并确保维护者掌控全局,同时激励支持者继续支持他们的工作。
我正在维护一个开源项目(确定性开源重复代码检测器),有用户请求一个我不太清楚如何实现的功能。
这似乎是一个很难解决的问题:
- 测试重复相同的场景。对于结构性检测器来说,这被标记为重复(重复代码)。然而,测试并不是人们希望从代码库中删除的内容。
- 测试中的重复(故意的)最终看起来像是不必要的代码重复,而工具无法区分哪一个是哪个。
- 解决这个问题的一种方法可能是引入“人类在环”的机制(类似于代码检查工具允许用户在第一次运行时接受某些内容,同时保持默认的零配置)。
我想知道你们是如何处理这个问题的,以及是否有人有任何想法。
这是项目的仓库链接:https://github.com/Rafaelpta/dupehound
这是更详细的问题链接:https://github.com/Rafaelpta/dupehound/issues/23
最近,人工智能和智能代理占据了大部分的关注焦点。<p>你对近期非人工智能技术的进展感到兴奋的是什么?为什么?
我这是开玩笑做的。一个朋友打赌我到年底赚不到100万美元。<p>现在已经赚到了5010美元。真是不可思议居然真的成功了。
大家好。我和我的联合创始人正式将 persona.js 开源(MIT 许可)。这是一款 VanillaJS 库,旨在帮助任何人无需依赖框架即可在网页上构建智能体验,并且完全支持 WebMCP。
那么,我们为什么要这样做呢?
1) 我们是网络和浏览器的超级粉丝,今天的浏览器可以做很多事情。
2) 我们发现 AI 的构建往往过于复杂,因为前端需要在现有应用中进行大型项目,或者网站本身就没有使用框架。
如果你曾参与过包含多个框架的大型应用,或者在内容管理系统/网站构建器/电子商务平台工作过……你就知道我们在说什么。一个“简单”的 AI 功能可能会让你困扰数月。
如果你有一个单一的 React 代码库,无法想象在没有 JSX 的情况下构建界面,那这里就没什么值得关注的了!你已经有很多非常酷的优秀选项。可以看看 Assistant UI、CopilotKit 和 AI Elements,它们都是 MIT 许可的。
----
一些具体信息:
Persona 的 Brotli 压缩体积约为 15 kB,首次绘制时(完整小部件在第一次点击时懒加载),能够渲染网页上大多数主要的智能体验:从“Fin”(药丸启动器)到“Claude”(全屏助手)再到“Shopify Sidekick”(停靠式)。
你可以在 Shadow DOM 隔离模式下运行它,这样现有样式也能良好兼容。
一切都有钩子和事件,因此你可以在几行代码中添加独特的风格(并轻松分享回来!)。
我们在库网站上有大量演示,以及所有可以调整的参数,以便玩转每个方面的渲染效果。工具和推理、自定义加载动画、语音、审批用户体验等。
我们还添加了大量跨代理和前端技术栈的示例。
查看代码请访问 <a href="https://github.com/runtypelabs/persona" rel="nofollow">https://github.com/runtypelabs/persona</a>。
欢迎反馈和贡献!
你认为未来的人类总体上会比现在更快乐还是更不快乐?
我创建了一个名为 Domphy 的 UI 框架,因为我多次尝试学习 React,但始终无法掌握。我是说,我无法理解被多层隐藏的 React 代码,尤其是当其中一些使用了 React 生态系统的库时。也许我是一个转行的架构师,所以我没有编程的基础,或者我期待的是一些清晰简洁的东西。
我认为 UI 应该是简单的——HTML 和 JS 足够了,只需要某种方式使其具备状态,而不是让它变得更加复杂。我的想法是:仅使用 JS 对象来反映 HTML,并使用函数来管理状态。当我需要重用一个组件时,我还有一个额外的概念——只需制作一个部分(我称之为 Patch)来向主对象添加属性(但原生属性仍然优先)。采用基于组件的方法会导致深层嵌套和属性膨胀,但使用补丁则不会。下面是一个示例:
```javascript
import { ElementNode, toState } from "@domphy/core";
import { tooltip } from "@domphy/ui";
const count = toState(0);
const App = {
div: [
{ h3: (listener) => `Count: ${count.get(listener)}` },
{
button: "Increment",
onClick: () => count.set(count.get() + 1),
$: [tooltip({ content: "Add one to the count" })],
},
],
style: { display: "flex", gap: "8px", alignItems: "center" },
};
const root = new ElementNode(App);
root.render(document.getElementById("app")!);
```
目前,我是唯一一个使用 Domphy 的人,已经快一年了,主要用于在建筑、工程和施工(AEC)行业创建 SketchUp 和 Revit 插件。我在 AI 代码生成兴起之前就创建了 Domphy,目的是为了生成人类可以清晰阅读和理解的代码,但现在 AI 可以很好地使用 React 构建 UI,所以有时我觉得我的工作毫无意义。不过,我仍然在我的应用中使用 Domphy,因为当 AI 遇到瓶颈时,我在阅读和编辑 UI 代码时会更有信心。
嘿,HN,
最近对元控制器、循环和多智能体编排的关注度很高。显然,已经有很多优秀的工具,比如 Conductor、cmux、原生的 Codex / Claude 代码应用等。
就我个人的使用案例而言,我觉得编排层往往显得过于复杂。我主要想要一个简单的本地控制器(即 Pi),用于运行和跟踪 CLI 代理,并能够通过 tmux 进行切换。Relaymux 是我对此的有针对性的尝试。
以下是一些设计原则:
- 前端仅限于 Telegram / iMessage / CLI。如果我想要更多的可视化,我会切换到 tmux。
- 子代理是正常的交互式 CLI 代理,运行在 tmux 窗口中,通常有自己的工作树。
- 控制器拥有 tmux 会话,因此每个较长的任务都会变成一个命名的标签/窗口。子代理在被阻塞或完成时通过 CLI 向编排者报告。然后,编排者会通过 Telegram / iMessage 给我发消息。
- 它可以与任何具有交互式终端模式的 CLI 代理配合使用,因此我不需要特殊的打印模式/非交互式支持。这意味着我不需要担心 Agent SDK / claude -p 的计费限制。
大家好,我们是 Oskar、Szymon 和 Piotr,我们正在构建 TesterArmy(<a href="https://tester.army">https://tester.army</a>)。TesterArmy 是一个智能测试平台,在部署前和生产环境中进行端到端检查。我们不再浪费时间在手动测试或维护静态脚本上,而是让您用自然语言指定测试,平台会处理其中的一切。我们完全围绕代理构建了这个平台。我们的代理将可靠地执行测试,而您的编码代理可以管理平台中的所有内容,从用自然语言定义测试到代表您运行测试。
请查看我们的演示视频:<a href="https://www.youtube.com/watch?v=291IkUbPrlk" rel="nofollow">https://www.youtube.com/watch?v=291IkUbPrlk</a>。
我们创建 TesterArmy 是因为测试仍然太痛苦。人工智能编码工具使得编写和发布代码的速度大大加快,但测试仍然是一个瓶颈。传统的端到端测试设置缓慢且维护成本高。管理身份验证和测试用户非常麻烦。设置预发布环境也很麻烦。可靠地运行测试更是困难。
我们认为大多数团队并不想花时间编写选择器或维护测试基础设施。他们只想确保核心流程正常工作。使用 TesterArmy,工程师可以注册,给代理我们的命令行工具,然后让它处理创建测试和按计划或在 GitHub 上运行测试。
当出现问题时,TesterArmy 会通过 Slack 或 Discord 及时提醒您的团队。
在过去几个月里,我们的产品用户从零增长到每天有 30 多个团队使用。我们在关键流程中发现了错误,包括用户注册、结账和 AI 聊天。许多客户因为我们代理的质量和可靠性而从已经建立的竞争对手那里迁移到我们这里。
以下是我们代理发现的一些近期错误(数量相当多!):
1) 一个客户应用中的时区错误,影响了预订流程,仪表板非常复杂,人类难以发现。
2) 代理编排中的回归问题导致沙盒环境卡在加载状态,得益于 TesterArmy,团队能够在问题影响生产之前解决它。
3) 在一个复杂的仪表板结账流程中错误计算订单金额,得益于 TesterArmy,团队能够在影响收入之前解决它。
4) 捕捉到 AI 聊天流程中的回归问题,导致用户无法检索数据,因为工具调用出现故障。
还有许多其他问题,主要与一些错误的 API 调用、404 错误、未处理的错误等相关。
如果这听起来有用,我们非常希望听到您的反馈,您可以访问 <a href="https://tester.army">https://tester.army</a>。我们为您准备了一些免费的测试运行供您尝试。请放心,我们不会让您进行销售电话,也没有冗长的入职流程或烦人的设置。我们的目标是提供一种“开箱即用”的体验。
如果您正在寻找端到端测试解决方案,我们非常期待您的反馈!