返回首页
最新
我是一个创始人/开发者,正在寻找更好的技术面试方式,因为目前的状态简直是一场噩梦。
现在,每个标准的带回家作业或HackerRank/LeetCode测试都很容易被大型语言模型(LLMs)解决。因此,公司不小心雇佣了我们称之为“氛围编码者”的候选人,他们在引导AI生成模板代码方面表现出色,但在架构复杂、出现故障或AI微妙地产生幻觉时完全失去反应。
我们正在研究一种新方法,我想与实际进行这些面试的人验证一下工程逻辑。
我们不想试图禁止AI(这是一场注定要失败的战斗),而是希望测试“AI引导”。
我们的想法是:
1. 将候选人放入一个真实且稍显混乱的沙盒代码库中。
2. 让他们使用任何他们想要的AI。
3. 注入一个微妙的架构变化、一个破坏性的依赖关系或一个AI幻觉。
4. 通过遥测(Git差异、CI/CD运行、调试路径)纯粹测量他们如何恢复并修复混乱。
基本上:停止测试语法,开始在AI时代测试架构和调试技能。
在我们花几个月时间构建这个模拟的后端之前,我需要来自经验丰富的领导者的现实检查:
1. 测试候选人“引导”和调试AI生成代码的能力,对你来说是否比传统算法更有意义?
2. 你目前是如何防止这些“仅会提示”的开发者在自己的面试环节中溜走的?
(这里不链接任何内容,因为还没有东西可以出售,只是希望得到对方法论的严厉反馈。)
FFmpeg可以在格式之间转换所有内容,除了字幕。SRT转为蓝光PGS?“当前字幕编码仅支持从文本到文本或位图到位图。” 这是2014年提交的第3819号工单。
我和Claude Code在几周内共同完成了这个项目。Claude编写了大部分编码器,发现了解码器缓冲区跟踪中的整数溢出,并从五个角度进行了审查。我阅读了松下和索尼的专利,做出了架构决策,并在它对规范理解错误时进行了纠正。我们争论了DTS计算是否应该在复用器中进行。(答案是应该,同时也在fftools中进行。我们都做了。)
动画是一个有趣的问题。高级SubStation Alpha的渐变必须能够成功转换为蓝光的PGS格式。编码器会监测帧之间的像素变化并进行分类:调色板变化或完全重绘。渐变变成仅调色板更新,不进行位图重传。具有不同结束时间的重叠字幕经历了四次重写和一个事件前瞻窗口。
我希望能够妥善维护这个项目,并最终将补丁提交到上游。如果你遇到bug或有不工作的字幕工作流程,请提出问题。我对人们如何使用这个项目非常好奇,但我也有一些关于基于OCR工作的翻译相关插件的计划。
经过六次迭代,23个补丁。libass和Tesseract已经在FFmpeg的滤镜库中。我将它们以与sub2video相同的方式接入主管道。文本转位图,位图转文本,支持114种OCR语言,RGBA转GIF。开发页面上有历史记录。
已为6个平台预构建,无依赖项: [https://connollydavid.github.io/pgs-release/](https://connollydavid.github.io/pgs-release/)
大家好,
我们开发了 FireClaw,因为我们注意到 AI 代理在网页内容中遭遇提示注入攻击。代理获取一个页面,页面上写着“忽略之前的指令”,结果你的代理突然开始泄露数据或执行不该执行的命令。
现有的解决方案是在事后检测注入攻击。我们希望能够加以预防。
FireClaw 是一个安全代理,位于你的 AI 代理与网络之间。每次请求都经过四个阶段的处理:
1. DNS 黑名单检查(URLhaus、PhishTank、社区数据源)
2. 结构化清理(去除隐藏的 CSS、零宽度 Unicode、编码技巧)
3. 隔离的 LLM 摘要(强化的子进程,没有工具或内存)
4. 输出扫描,使用金丝雀令牌(检测内容是否绕过摘要处理)
关键的见解是:即使第三阶段的 LLM 被注入,它也没有工具、没有内存,并且无法访问你的数据。它只能返回文本——而这些文本在第四阶段仍会被扫描。攻击者会陷入死胡同。
其他设计决策:
- 没有旁路模式。处理流程是固定的。如果你的代理被攻陷,它无法禁用 FireClaw。
- 社区威胁数据源——实例匿名共享检测元数据(域名、严重性、检测次数),以建立共享黑名单。绝不会发送页面内容。
- 作为物理设备在 Raspberry Pi 上运行,配有 OLED 显示屏,实时显示统计信息,并在捕获到威胁时点亮动画火焰。
我们广泛搜索了文献和开源项目——没有其他人正在进行基于代理的防御以应对代理提示注入。虽然存在检测和沙箱技术,但没有一个可以在内容到达代理上下文之前进行清理的内联代理?我们找不到这样的解决方案。
提供了 200 多种检测模式、JSONL 审计日志、域名信任等级、速率限制和成本控制。采用 AGPLv3 许可证。
网站: [https://fireclaw.app](https://fireclaw.app)
希望能收到任何从事 AI 代理安全工作的人的反馈。我们还缺少什么?我们应该将哪些攻击向量添加到模式数据库中?
我喜欢阅读计算机早期发展的历史,但在原始历史档案中寻找相关信息往往很困难。为了改善这一点,我在周末构建了 f0lkl0r3.dev。
这个网站整合了来自计算机历史博物馆的近1000个口述历史,使其可以被探索、搜索、互联和多模态访问。为了构建这个平台,我使用了 Gemini API(通过 ai.dev)来处理大量非结构化的访谈文本,从中提取出时间线、机器和人物,以便进行交叉引用。这个应用本身是用 Antigravity 构建的,接下来的步骤将是添加图片和视频。
你可以按特定的主机搜索,按时间线浏览不同的时代,或者直接阅读伪经部分,了解一些奇特的历史轶事。希望你能享受这个探索的过程!我希望今天能吸引并启发比我更多的人。 :)
@ECHO OFF<p>CLS<p>ECHO 我记得很清楚,当我还是个孩子的时候,我不仅想看看我的PC/286计算机能运行什么,还想拥有让它为我做事情的能力。我的第一次尝试是通过一个.BAT文件和ECHO命令。我输入了几行,按下回车键。我感到无比自豪,甚至邀请我的父亲来展示我如何让计算机说出我想要的话。这是一次改变人生的经历。<p>ECHO 当然,BAT文件并不够,因为它只是一个脚本,我想要的是一个EXE文件,于是我进一步学习了Borland Pascal,第一次使用writeln,不仅让计算机显示我想要的内容,还将其编译成可执行的二进制文件。想象一下,一个真正的EXE文件(!),你可以运行它,它会让计算机显示你想要的内容。在那一刻,我跨越了用户与创造者之间的界限,再也没有回头。<p>ECHO.<p>ECHO 我爱你!<p>PAUSE
大家好!我们很高兴地发布 Unsloth Studio——这是我们希望为社区提供的众多功能的汇聚,主要包括:
1. 一个聊天界面,具有自动调用工具、Python 和 Bash 代码执行、网页搜索、图像和文档输入等功能!
2. 音频、视觉和大语言模型的微调,配备自动 AI 助手的数据准备。
3. 支持 GGUF 格式,兼容 Mac、Windows、Linux,并具备音频生成能力。
4. 支持浏览器中的 SVG 渲染,并可导出为 GGUF 格式。
5. gpt-oss 和谐渲染,所有推理参数均已预设并推荐使用。
6. 数据设计器和合成数据生成。
7. 快速并行的数据准备和嵌入微调。
8. 还有更多更多功能!
要获取它,请运行:
```
pip install unsloth
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888
```
欢迎提出建议,我们期待您的贡献,也希望大家来试用!感谢大家!
大家好,我很高兴与大家分享 Antfly:一个用 Go 编写的分布式文档数据库和搜索引擎,结合了全文搜索、向量搜索和图搜索。您可以将其用于分布式多模态搜索和记忆,或者用于本地开发和小型部署。
我构建这个项目是为了给开发者提供一个单一二进制文件的部署,具备本地机器学习推理能力(通过一个名为 Termite 的内置服务),这意味着您不需要外部 API 调用来进行向量搜索,除非您希望使用它们。
以下是一些可能会吸引大家的功能:
- **功能**:多模态索引(图像、音频、视频)、类似 MongoDB 的原地更新以及流式 RAG(检索增强生成)。
- **分布式系统**:基于 etcd 库构建的多 Raft 设置,后端使用 Pebble(CockroachDB 的存储引擎)。元数据和数据分片各自拥有自己的 Raft 组。
- **单一二进制**:antfly swarm 提供一个单进程的部署,所有功能均在其中运行。适合本地开发和小型部署。需要扩展时可以通过添加节点来实现。
- **生态系统**:配备 Kubernetes 操作器和用于 LLM 工具使用的 MCP 服务器。
- **本地机器学习推理**:Antfly 附带 Termite。可以将其视为一个内置的 Ollama,适用于非生成模型(如嵌入、重排序、分块、文本生成)。不需要外部 API 调用,但也支持它们(如 OpenAI、Ollama、Bedrock、Gemini 等)。
**许可证**:我选择了 Elastic License v2,而不是 OSI 批准的许可证。我知道这是一个有强烈观点的话题。实际的结果是:您可以使用、修改、自己托管它,并在其基础上构建产品,但不能将 Antfly 本身作为托管服务提供。这是为了可持续性而做出的合理权衡,同时仍然保持源代码的可用性。
欢迎大家提出关于架构、Raft 实现或其他任何问题的反馈!