返回首页
最新
我很好奇今年大家的书单上有哪些书籍、论文或长篇文章。是技术书籍吗?新领域的书籍?还是老朋友?
几天前我在这里发布了Julie的周末原型:一个开源桌面助手,它以一个小型覆盖层的形式存在,并利用你的屏幕作为上下文(而不是复制粘贴、切换标签等)。
更新:我刚刚发布了Julie v1.0,最大的变化是它不再仅仅是“回答关于我屏幕的问题”。现在它可以通过CUA工具包运行代理(写作/编码)和计算机使用模式。 ((https://tryjulie.vercel.app/))
这在实践中意味着:
- 通用AI助手:它听到你听到的声音,看到你看到的画面,并即时为任何问题提供实时答案。
- 写作代理:以你的语气起草/重写,然后在覆盖层中与你迭代(无需新的工作区)。
- 编码代理:帮助你进行多步骤的实现/重构,同时保持你的编辑器作为“真实来源”。
- 计算机使用代理:当你需要时,它可以采取“下一步”(点击/输入/导航),而不仅仅是告诉你该做什么。
目标仍然是一样的:不要打断我的工作流程。我希望助手像一个小工具一样,帮助20秒后消失,而不是一个你需要管理的第二生活。
一些实施说明/限制(提到这些是因为我知道人们会问):
- 权限是自愿选择的(屏幕 + 可访问性/自动化),并且旨在在你观看的情况下使用,而不是静默运行。
- 用户界面故意保持简约;我努力不把它变成一个完整的聊天应用程序,带有标签/设置/信息流。
代码库和安装程序在这里:https://github.com/Luthiraa/julie
希望能收到关于两件事的反馈:
1. 如果你构建过/使用过计算机使用代理:哪些安全/用户体验模式在日常使用中实际上感觉可接受?
2. 你希望这个助手完成的一个端到端的工作流程是什么,而不需要切换上下文?