返回首页
最新
大多数企业工作并不是因为数据差而变得缓慢,而是因为访问这些数据的界面分散。<p>像“哪些交易停滞不前?”这样一个简单的问题,涉及到仪表板、电子表格、客户关系管理(CRM)、商业智能(BI)工具、内部脚本以及几个Slack讨论。对答案采取行动需要在系统之间切换,这中间的摩擦就是问题所在。<p>Worqlo是一个通过将对话作为接口层、将确定性工作流作为执行层来消除这种摩擦的实验。<p>这个想法很简单:自然语言输入 → 验证后的工作流输出。<p>大型语言模型(LLM)处理意图,结构化工作流引擎负责执行:CRM查询、字段更新、通知、权限和审计日志。该模型从不直接执行操作。<p>以下是其工作原理。<p>为什么选择对话?<p>人们以问题为思维方式,而系统则以模式为思维方式。仪表板在它们之间起到桥梁作用。<p>接口层面不断增加,因为每个系统都暴露出自己的用户界面。工程师最终会构建内部工具、过滤器、查询、分析页面和一次性自动化。这就是用户界面的“税收”。<p>对话减少了表面复杂度,工作流则增加了安全性和确定性。<p>架构(简化版)
用户 → LLM(意图) → 路由器 → 工作流引擎 → 连接器 → 系统<p>LLM<p>提取意图和参数。
没有执行权限。<p>意图路由器<p>将意图映射到已知的工作流模板。<p>工作流引擎<p>按顺序执行步骤:
- 模式验证
- 权限检查
- CRM查询
- API更新
- 通知
- 审计日志<p>连接器<p>针对CRM、ERP、内部API和消息系统的严格适配器。<p>如果以下情况发生,工作流引擎将拒绝运行:
- 字段不存在
- 数据类型不匹配
- 权限失败
- 工作流模板与用户意图不匹配<p>这可以防止常见的LLM失败案例:虚构字段、不正确的API调用、不安全的操作等。<p>示例查询<p>用户:
“给我看看本周DACH的销售管道”<p>内部流程:
意图 = llm.parse(“管道查询”)
验证(意图)
获取(数据)
汇总(统计)
返回(摘要)<p>后续:
“将汉莎航空的交易重新分配给朱莉,并提醒亚历克斯跟进”<p>工作流:
按名称查找交易
验证所有权变更
写入CRM更新
发送Slack通知
写入审计日志<p>所有操作都通过确定性的步骤进行。<p>为什么从销售开始?<p>销售CRM结构化且可预测。
工作流重复(重新分配、提醒、跟进)。
延迟很重要。
输出是可测量的。
这使得该领域成为对话工作流的良好测试环境。<p>长期的想法并不局限于销售。
相同的模式适用于运营、财务、市场营销和人力资源。<p>为什么不直接使用“ChatGPT + API”?<p>因为那样会导致速度变慢。<p>LLM并不是可靠的执行引擎。
它们会虚构字段名称、ID、端点和逻辑。
企业系统需要安全、可审计的操作。<p>Worqlo将LLM视为解析器,而不是工作者。<p>执行在一个受控环境中进行,包含:
- 工作流模板
- 模式合同
- 基于角色的访问控制(RBAC)
- 日志
- 可重复的结果<p>这保持了自然语言的便利性和经典自动化引擎的可靠性。<p>我们正在测试什么<p>我们想看看:
- 对话是否可以替代用户界面,处理狭窄、结构化的任务
- 确定性执行是否可以与自然语言意图共存
- 多轮工作流是否真的可以减少操作负担
- 连接器模型是否可以扩展而不产生另一个集成混乱
- 工程师是否更喜欢通过工作流而不是用户界面层来暴露功能<p>现在还为时已早。
但该模型在高容量、低级别的操作工作中似乎很有前景。
这种时机开始让人觉得有些巧合。今天——就在谷歌宣布与迈凯伦合作之后——Firefox再次无法在F1TV网站上使用。<p>今年早些时候也发生过同样的问题,当时Mozilla正在努力修复(https://techissuestoday.com/firefox-users-locked-out-of-f1tv-mozilla-engineer-confirms-a-fix-is-coming)。他们的修复措施一直有效,直到今天。<p>当同样的问题在如此短的时间内发生两次时,很难相信这只是巧合。我并不是在暗示有什么故意的行为,但这种模式让我怀疑谷歌在F1的参与是否可能间接影响了哪些浏览器能够获得适当的支持。
我有近20年的工作记录,包括个人笔记、通信、代码和文档。这些内容分散在多个(云)服务中,跨这些领域进行搜索变得不切实际。
问题是这样的:“啊,我记得和某人谈论过[算法],然后记录了一个重要的见解。我们来找找这个。”
这不是一个大型语言模型(LLM)能够解决的问题。阻碍在于没有办法在所有这些纯文本中运行搜索代码。
服务包括:
* 电子邮件(Gmail,已与我的macOS磁盘通过Apple Mail同步)
* Dropbox
* Notion
* Google Drive
* Obsidian
* Github
* Apple Notes
* Discord聊天
* Trello
* 我自己的博客
如果我把所有内容都同步到我的Mac磁盘,也许我可以在那里进行纯文本搜索。然而,Spotlight的索引总是不完整,常常漏掉明显的文件。我的Dropbox太大了,所以我并没有将其全部本地同步。
有些服务我已经不再使用,比如Evernote。当我归档这个服务时,我导出了所有内容并将其移动到我的Dropbox中。因此,如果我搜索Dropbox,它也会搜索Evernote中的旧笔记。我不可能对我正在积极使用的所有服务都这样做。
我现在的搜索方式是猜测结果最有可能在哪个服务中,然后在那里搜索。当没有结果时,我就搜索下一个最有可能的服务,反复进行。
对于我自己的博客,我曾经使用Google的站内搜索,但我最近发现这个搜索不完整:https://bsky.app/profile/dustinfreeman.bsky.social/post/3m5l5tto6pk27
我可以想象一个解决方案,即有一个第三方服务能够访问我所有服务的访问密钥。但是,现实是,这需要巨大的信任。此外,我对所有这些服务的访问都需要双重身份验证,并且有有效期,因此我需要不断地重新授权给这个第三方服务。在这种情况下,继续按照我现在的方式进行搜索就显得更有意义。
我正在尝试了解不同团队在扩展过程中如何处理平台完整性和用户信任的问题。
对于那些运营消费应用、市场平台、金融科技产品或任何用户活动显著的平台的团队:
你们目前是如何构建“信任层”的?
具体来说:
- 你们如何检测虚假用户、机器人、设备农场或自动注册?
- 你们依赖哪些早期信号来识别可疑行为?
- 你们是否收集任何行为、设备或网络层的数据来做出信任决策?
- 你们的技术栈中有多少是自家开发的,多少是第三方的?
- 在扩展过程中,哪些做法有效,哪些做法无效?
- 如果今天重新构建你们的信任/欺诈处理流程,你们会做哪些改变?
我希望从不同领域的真实经验中学习,任何你们可以分享的内容(架构、失败、教训、希望存在的工具)都将非常有帮助。
谢谢!