返回首页
最新
我正在探索一个针对产品和用户体验团队的人工智能工具,它管理完整的用户研究工作流程,而不仅仅是AI笔记或转录。这个工具的目的是帮助团队:
◉ 规划访谈会议
◉ 制定议程和问题
◉ 在通话过程中保持会议的进度
◉ 录音和转录
◉ 提取主题、洞察和行动项
◉ 将研究成果汇总到一个统一的知识库中
可以将其视为TL;DV/Fathom(捕捉)和Dovetail/Condens(综合/洞察)等工具的结合,但它是贯穿整个工作流程的集成,而不是孤立的。
我正在验证这个工具是否解决了真实的痛点,谁需要它,以及它的价值在哪里最高。
如果您从事产品发现、用户体验访谈或持续研究,我将非常感谢您花3分钟时间提供反馈:
调查链接:https://forms.fillout.com/t/grQzTdK7opus
嘿,HN!我是创作者。
我在今年早些时候将这个项目作为SaaS推出,但未能获得 traction。后来意识到,我只是在解决我自己的问题,却没有清楚地解释它。
因此,我决定将其开源,并提供一个更好的介绍:
问题:我有20多个Tampermonkey脚本用于一次性调整。维护这些脚本非常麻烦。为简单的事情编写新的脚本感觉有些过于繁琐。
解决方案:一个聊天界面,你只需描述想要的更改,AI会生成CSS/JS,并立即应用。
日常使用案例:
- “将此页面设置为暗黑模式”
- “隐藏YouTube短视频”
- “移除付费墙”(是的,这个有争议)
- “添加键盘快捷键”
技术细节:
- 你的API密钥(Claude/GPT/Gemini/Grok/OpenRouter)
- 智能DOM选择器,带有稳定性评分(在回退到类或nth-child之前,检查稳定的ID、属性如data-testid、role、aria-label)
- 处理Shadow DOM、单页应用(SPA)和动态内容
- 通过Supabase进行云同步(可选)
GitHub: [https://github.com/kchander/magix-extension](https://github.com/kchander/magix-extension)
Chrome商店: [https://chromewebstore.google.com/detail/magix/ebfhenlkpdngcofiegobedbahdeemgjo](https://chromewebstore.google.com/detail/magix/ebfhenlkpdngcofiegobedbahdeemgjo)
困难的部分不是AI,而是让修改在页面更新后依然有效。它使用Chrome的UserScripts API(Chrome 138+)来持久注册脚本,处理动态内容注入,并管理脚本在导航中的生命周期。对于被SPA替换的元素,涉及大量的MutationObserver操作。
再见!这也是我的第一个开源项目 :)
我一直在研究一种更高效的代码执行方法,使用MCP服务器来消除Anthropic最近博客文章中提到的文件系统开销。
Anthropic的文章(https://www.anthropic.com/engineering/code-execution-mcp)展示了代理如何通过编写代码调用MCP工具,而不是直接调用工具,从而避免令牌膨胀。
他们的方法为每个工具生成TypeScript文件,以实现渐进式发现。这种方法效果很好,但引入了复杂性:你需要为每个工具生成文件,管理复杂的类型架构,在工具更新时重新构建,并处理版本冲突。在大规模应用中,1000个MCP工具意味着需要维护1000个生成的文件。
我使用纯动态执行构建了codex-mcp。我们不再生成文件,而是仅暴露两个轻量级工具:list_mcp_tools()返回可用工具的名称,get_mcp_tool_details(name)按需加载定义。代理像浏览文件系统一样探索工具,但实际上没有任何东西存在于磁盘上。
代码片段以字符串的形式存储在聊天会话数据的内存中。当你执行一个片段时,我们使用AsyncFunction构造函数直接将callMCPTool函数注入执行环境。没有导入,没有文件系统依赖,仅仅是运行时注入。该函数直接调用mcpManager.tools,因此你始终连接到实时的MCP。
这意味着工具始终保持同步。当服务器上某个工具的架构发生变化时,你已经在调用更新后的版本。无需重新生成,无需构建步骤,也没有版本不匹配。代理获得了文件系统方法的所有好处(渐进式发现、上下文效率、复杂控制流、隐私保护),而没有任何维护开销。
一个警告:MCP协议并不强制输出架构,因此链式工具调用需要防御性解析,因为模型无法预测输出结构。不过,这影响所有MCP实现,而不仅限于我们的方法。
动态执行得益于Vercel AI SDK的MCP支持,它提供了从代码直接调用MCP工具的运行时基础设施。
项目链接:https://github.com/pranftw/aiter-app
希望能收到在大规模使用MCP的朋友们的反馈。有没有人探索过类似的模式?