12作者: Genesis_rish大约 1 个月前原帖
大家好, 我在尝试对图像生成进行对抗性扰动,看看需要多大的扭曲才能阻止模型生成图像或使其偏离目标。结果大多没有什么进展,这并不令人惊讶。 然后我尝试了一些更奇怪的事情:我不是与模型对抗,而是试图推动它自行将上传的图像分类为不适合工作(NSFW),从而触发它自己的安全防护措施。 这比我预期的要有趣得多。虽然结果不一致,且绝对不够稳健,但在某些情况下,相对温和的变换就足以使模型对原本无害的图像的内部安全分类发生翻转。 这并不是为了绕过安全措施,实际上正好相反。这个想法是故意给安全层施加压力。我计划在行为更加稳定和可重复后,将其作为一个小工具和用户界面开源,主要是为了探测和预过滤内容审核流程。 如果它能可靠地工作,哪怕只是部分成功,至少可以提高那些从滥用这些系统中获得乐趣的人的成本。
1作者: oceanwaves大约 1 个月前原帖
我发布了Formfactor,这是一个实用插件,可以观察来自MIDI的时间、活动和强度。除了不改变地传递原始的MIDI模式外,它还允许您多路复用多达八个额外通道的形状化、独立序列化的MIDI CC输出,以调制外部硬件或软件乐器。 我为自己开发了这个插件,并享受在音乐上塑造和路由Eurorack调制的乐趣。 Formfactor是免费的。支持CLAP/VST3/AUv2。
6作者: quarkcarbon279大约 1 个月前原帖
嗨,HN,我是Bhavani(来自rtrvr.ai)。 我们构建了原生DOM网页代理(不基于截图的视觉识别,也不使用CDP/Playwright调试端口控制)。我们能够原生处理验证码,包括Google reCAPTCHA的图像挑战,通过跨域的iframe和shadow DOM进行操作。目前,这方面的延迟较高。 问题是:在调试图像选择验证码(“选择所有有交通信号灯的图像”)时,日志并不能告诉你代理为什么点击了错误的区域。我发现自己盯着执行日志,心想“它是否正确看到了网格?”并意识到我只是想看看它是如何工作的。 因此,我们为无服务器的Chrome工作者在Cloud Run上构建了实时VNC视图和接管功能。 关键经验: 1. 会话亲和性是尽力而为的;“稍后附加”可能会连接到不同的实例。 2. 一个单独的中继服务,通过短期令牌将查看者和运行者配对,使得附加过程变得确定性。 3. 运行者保持干净:并发=1,每个容器一个浏览器,没有混合流量。 希望能得到那些已经推出类似功能的朋友们的反馈: 1. 对你来说,什么替代了VNC(WebRTC等),为什么? 2. 在不占用大量存储的情况下,录制/重放的最佳方法是什么? 3. 在无服务器环境中,你是如何安全地处理“稍后附加”的?
1作者: xakpc大约 1 个月前原帖
最初,我认为通过HTTP暴露类似dstp的东西会很酷:这是一种通过REST API远程运行低级网络诊断的简单方法。然后我放弃了dstp,使用.NET重写了每一个检查。接着,我添加了显而易见的下一步——从不同的地理区域运行相同的检查,因为大多数真实事件并不是局部的。我已经有了一些用于副项目的服务器,所以尝试起来很简单。 在某个时候,我切换到了完全的极简开发模式,删除了所有非必要的部分。没有代理,没有设置,没有监控,没有账户。只需发出一个请求,即可从多个地方并行检查,返回原始结果。目标是让你在发生事件时可以快速使用curl命令,立即回答“这是在所有地方都坏了吗,还是仅仅在这里坏?” 此外,还有一个开源的边车(sidecar),供希望自托管监控的人使用,但它仍然需要一些调整。 我还不完全确定下一步该怎么做,可能会推出一个小额付费层来覆盖服务器成本和买杯咖啡,但目前公共API即使在没有API密钥的情况下也有相当慷慨的限制,如果你想试试的话。
1作者: IslamTayeb大约 1 个月前原帖
Spotify Wrapped 对我来说不够,所以我下载了我的音乐库,制作了自己的“品味地图”!<p>1,253 首曲目 → 33 个可解释维度(音频 + 歌词) → 5 个聚类 + 播放列表<p>详细的写作中包含了完整的方法论、互动图表,以及一些个人反思,探讨这些聚类/时间线如何与生活的不同阶段相对应。<p>如果大家对这些内容感兴趣,我在 X 平台上经常发布这些副项目和灵感想法(<a href="https://x.com/islamTyb" rel="nofollow">https://x.com/islamTyb</a>)!