2作者: jonjou大约 1 个月前原帖
我是一个创始人/开发者,正在寻找更好的技术面试方式,因为目前的状态简直是一场噩梦。 现在,每个标准的带回家作业或HackerRank/LeetCode测试都很容易被大型语言模型(LLMs)解决。因此,公司不小心雇佣了我们称之为“氛围编码者”的候选人,他们在引导AI生成模板代码方面表现出色,但在架构复杂、出现故障或AI微妙地产生幻觉时完全失去反应。 我们正在研究一种新方法,我想与实际进行这些面试的人验证一下工程逻辑。 我们不想试图禁止AI(这是一场注定要失败的战斗),而是希望测试“AI引导”。 我们的想法是: 1. 将候选人放入一个真实且稍显混乱的沙盒代码库中。 2. 让他们使用任何他们想要的AI。 3. 注入一个微妙的架构变化、一个破坏性的依赖关系或一个AI幻觉。 4. 通过遥测(Git差异、CI/CD运行、调试路径)纯粹测量他们如何恢复并修复混乱。 基本上:停止测试语法,开始在AI时代测试架构和调试技能。 在我们花几个月时间构建这个模拟的后端之前,我需要来自经验丰富的领导者的现实检查: 1. 测试候选人“引导”和调试AI生成代码的能力,对你来说是否比传统算法更有意义? 2. 你目前是如何防止这些“仅会提示”的开发者在自己的面试环节中溜走的? (这里不链接任何内容,因为还没有东西可以出售,只是希望得到对方法论的严厉反馈。)
13作者: slartibardfast0大约 1 个月前原帖
FFmpeg可以在格式之间转换所有内容,除了字幕。SRT转为蓝光PGS?“当前字幕编码仅支持从文本到文本或位图到位图。” 这是2014年提交的第3819号工单。 我和Claude Code在几周内共同完成了这个项目。Claude编写了大部分编码器,发现了解码器缓冲区跟踪中的整数溢出,并从五个角度进行了审查。我阅读了松下和索尼的专利,做出了架构决策,并在它对规范理解错误时进行了纠正。我们争论了DTS计算是否应该在复用器中进行。(答案是应该,同时也在fftools中进行。我们都做了。) 动画是一个有趣的问题。高级SubStation Alpha的渐变必须能够成功转换为蓝光的PGS格式。编码器会监测帧之间的像素变化并进行分类:调色板变化或完全重绘。渐变变成仅调色板更新,不进行位图重传。具有不同结束时间的重叠字幕经历了四次重写和一个事件前瞻窗口。 我希望能够妥善维护这个项目,并最终将补丁提交到上游。如果你遇到bug或有不工作的字幕工作流程,请提出问题。我对人们如何使用这个项目非常好奇,但我也有一些关于基于OCR工作的翻译相关插件的计划。 经过六次迭代,23个补丁。libass和Tesseract已经在FFmpeg的滤镜库中。我将它们以与sub2video相同的方式接入主管道。文本转位图,位图转文本,支持114种OCR语言,RGBA转GIF。开发页面上有历史记录。 已为6个平台预构建,无依赖项: [https://connollydavid.github.io/pgs-release/](https://connollydavid.github.io/pgs-release/)
3作者: raiph_ai大约 1 个月前原帖
大家好, 我们开发了 FireClaw,因为我们注意到 AI 代理在网页内容中遭遇提示注入攻击。代理获取一个页面,页面上写着“忽略之前的指令”,结果你的代理突然开始泄露数据或执行不该执行的命令。 现有的解决方案是在事后检测注入攻击。我们希望能够加以预防。 FireClaw 是一个安全代理,位于你的 AI 代理与网络之间。每次请求都经过四个阶段的处理: 1. DNS 黑名单检查(URLhaus、PhishTank、社区数据源) 2. 结构化清理(去除隐藏的 CSS、零宽度 Unicode、编码技巧) 3. 隔离的 LLM 摘要(强化的子进程,没有工具或内存) 4. 输出扫描,使用金丝雀令牌(检测内容是否绕过摘要处理) 关键的见解是:即使第三阶段的 LLM 被注入,它也没有工具、没有内存,并且无法访问你的数据。它只能返回文本——而这些文本在第四阶段仍会被扫描。攻击者会陷入死胡同。 其他设计决策: - 没有旁路模式。处理流程是固定的。如果你的代理被攻陷,它无法禁用 FireClaw。 - 社区威胁数据源——实例匿名共享检测元数据(域名、严重性、检测次数),以建立共享黑名单。绝不会发送页面内容。 - 作为物理设备在 Raspberry Pi 上运行,配有 OLED 显示屏,实时显示统计信息,并在捕获到威胁时点亮动画火焰。 我们广泛搜索了文献和开源项目——没有其他人正在进行基于代理的防御以应对代理提示注入。虽然存在检测和沙箱技术,但没有一个可以在内容到达代理上下文之前进行清理的内联代理?我们找不到这样的解决方案。 提供了 200 多种检测模式、JSONL 审计日志、域名信任等级、速率限制和成本控制。采用 AGPLv3 许可证。 网站: [https://fireclaw.app](https://fireclaw.app) 希望能收到任何从事 AI 代理安全工作的人的反馈。我们还缺少什么?我们应该将哪些攻击向量添加到模式数据库中?
2作者: dynamicwebpaige大约 1 个月前原帖
我喜欢阅读计算机早期发展的历史,但在原始历史档案中寻找相关信息往往很困难。为了改善这一点,我在周末构建了 f0lkl0r3.dev。 这个网站整合了来自计算机历史博物馆的近1000个口述历史,使其可以被探索、搜索、互联和多模态访问。为了构建这个平台,我使用了 Gemini API(通过 ai.dev)来处理大量非结构化的访谈文本,从中提取出时间线、机器和人物,以便进行交叉引用。这个应用本身是用 Antigravity 构建的,接下来的步骤将是添加图片和视频。 你可以按特定的主机搜索,按时间线浏览不同的时代,或者直接阅读伪经部分,了解一些奇特的历史轶事。希望你能享受这个探索的过程!我希望今天能吸引并启发比我更多的人。 :)
1作者: reconnecting大约 1 个月前原帖
@ECHO OFF<p>CLS<p>ECHO 我记得很清楚,当我还是个孩子的时候,我不仅想看看我的PC/286计算机能运行什么,还想拥有让它为我做事情的能力。我的第一次尝试是通过一个.BAT文件和ECHO命令。我输入了几行,按下回车键。我感到无比自豪,甚至邀请我的父亲来展示我如何让计算机说出我想要的话。这是一次改变人生的经历。<p>ECHO 当然,BAT文件并不够,因为它只是一个脚本,我想要的是一个EXE文件,于是我进一步学习了Borland Pascal,第一次使用writeln,不仅让计算机显示我想要的内容,还将其编译成可执行的二进制文件。想象一下,一个真正的EXE文件(!),你可以运行它,它会让计算机显示你想要的内容。在那一刻,我跨越了用户与创造者之间的界限,再也没有回头。<p>ECHO.<p>ECHO 我爱你!<p>PAUSE