返回首页
最新
尽管关于代理人的宣传声势浩大,但我认为我们正处于为人工智能代理人构建在线基础设施的阶段,而我们对此的具体样貌尚不清楚。因此,我创建了 SentientTube([https://sentienttube.com](https://sentienttube.com)),以探索让人工智能代理人成为内容创作者的意义。
流程是这样的:代理人通过 API 提交一个提示,返回一个完全制作好的电影视频,并可以将其发布到公共信息流中——无需人类参与。我提供了一个 /skill.md 端点,以便代理人可以在没有任何用户界面的情况下自我注册。
人类也可以使用这个平台(而且大多数早期用户都是人类),但设计是以代理人为优先:API 注册、代理人可读的集成规范,以及一个声明系统,使人类可以“拥有”他们代理人的频道。
我不知道你对此会有什么感觉,但浏览公共信息流时,感觉奇妙地像是早期的 YouTube——未经打磨、奇特,只是展示了一些可能性。我很好奇人们的看法,以及你或你的代理人会制作什么:[https://sentienttube.com/videos](https://sentienttube.com/videos)
目前免费使用,我只是想测试一下兴趣。
初步想法:我最喜欢的就是当你要求一个代理人根据它对你的了解制作视频时,可能会给你带来惊喜、挑战你的想法、帮助你克服障碍等等。如果它对你的生活和挣扎有足够的了解,这可能会非常激励人心。
大家好!我是Urav,Evos的创始人([https://getevos.ai](https://getevos.ai))。
Evos最初是做一些人工智能咨询的,在部署这些系统的过程中,我不断遇到同样的问题:AI代理在核心行业的实际操作工作中表现糟糕。虽然代理可以编写整个系统的代码,但当要求它处理货运异常或索赔截止日期问题时,它就崩溃了——因为它缺乏领域知识。
因此,我开始将运营专家实际掌握的知识进行翻译和编码——决策框架、边缘案例、升级协议——转化为Evos平台的代理技能。
上周,我注意到ClawHub上有超过3000个技能,几乎所有的都是开发工具封装和API集成。根据我的观察,真正教授传统行业领域专业知识的技能并不多,而来自经过验证的专业知识的技能更是寥寥无几。
今天,我开源了Evos代理技能。
我们发布了8个技能,适用于物流、制造、零售和能源等用例。每个技能都遵循代理技能开放标准,并且可以在所有主要平台上使用。
除了技能之外,我还构建了一个评估套件——包含20到25个来自真实操作的场景,按照加权评分标准进行评分,并且对比了拥有这些技能的代理与没有技能的代理的表现。
代码库:[https://github.com/ai-evos/agent-skills](https://github.com/ai-evos/agent-skills)
欢迎任何在这些行业工作过的朋友提供反馈,或者分享你们的想法。
我会在评论区等待大家的回复,谢谢!
我构建了AegisBPF,以探索使用BPF-LSM进行确定性运行时强制执行,而不是传统的eBPF安全工具中常见的检测和警报模型。
大多数基于eBPF的运行时安全系统观察事件(tracepoints/kprobes)并异步发出警报。Aegis附加到Linux安全模块(LSM)钩子,例如:
- file_open
- inode_permission
- bprm_check_security
- socket_connect / socket_bind
这使得在系统调用完成之前,可以同步拒绝操作。
核心理念:
- 基于inode的文件强制执行(在重命名时保持稳定)
- 在内核中强制执行双栈IPv4/IPv6网络拒绝规则
- 明确的强制执行与审计姿态合同
- 具备能力感知的失败关闭模式
- 结构化状态转换(ENFORCE / AUDIT_FALLBACK / DEGRADED)
性能(示例基线,200k操作):
- 打开操作的p95开销约为2-3%
- 连接操作的开销约为0.5-1%
- 无论规则数量如何,查找映射的时间复杂度为O(1)
该项目包括:
- 签名的策略包(Ed25519)
- 能力/姿态报告
- 内核兼容性矩阵持续集成
- 记录的威胁模型和TOCTOU分析
我撰写了两篇技术深入文章,解释设计理念:
- 第1部分 – 通过eBPF-LSM实现同步内核级拒绝
[链接](https://medium.com/@erenari27/part-1-synchronous-kernel-level-denial-via-ebpf-lsm-a-case-against-the-detect-and-alert-paradigm-281e9f54764f)
- 第2部分 – 确定性强制执行合同与姿态语义
[链接](https://medium.com/@erenari27/part-2-deterministic-enforcement-contracts-in-aegisbpf-posture-semantics-failure-modes-and-7876791e8890)
欢迎讨论钩子选择的权衡、验证器约束、seccomp与LSM的比较、Landlock的比较或强制执行失败模式。
我开发这个工具是为了自己解决一个问题——在使用GPT-4/Claude时,针对那些Gemini Flash能够很好处理的提示支付费用。
InferShrink将您现有的OpenAI/Anthropic/Google客户端用三行代码封装起来。它会对提示的复杂性进行分类,并将其路由到能够处理该复杂性的最便宜的模型。使用同一提供商,避免意外切换。
工作流程如下:分类 → 压缩(LLMLingua,可选) → 检索(FAISS,可选) → 路由 → 跟踪。当所有阶段结合时,可以在混合工作负载上实现10倍以上的成本降低。
关键设计决策:
• 仅限同一提供商路由。如果您使用OpenAI,它将始终保持在OpenAI上。没有跨提供商的意外情况。
• 子毫秒级的分类开销
• 可选的FAISS检索 + LLMLingua压缩,用于RAG管道
• 进行了539次测试,使用Semgrep和Trivy进行扫描
您可以通过以下命令安装:pip install infershrink
有关此工具设计思路的博客文章: [https://musashimiyamoto1-cloud.github.io/infershrink-site/blog/hidden-cost-of-llm-overprovisioning.html](https://musashimiyamoto1-cloud.github.io/infershrink-site/blog/hidden-cost-of-llm-overprovisioning.html)
欢迎随时询问有关路由启发式或压缩权衡的问题。