3作者: mobinpo19 天前原帖
在看到开发者每天在Stack Overflow上泄露凭证后,我构建了这个工具。主要功能包括:(1) 拥有20多种检测模式的隐私扫描器 (2) 针对敏感问题的客户端RSA加密 (3) 基于实际贡献的AI职位匹配。技术栈:Cloudflare Workers + D1 + Vectorize。运行在100%免费套餐上。希望能得到关于加密实现的反馈。
30作者: teendifferent19 天前原帖
帖子作者在这里。我在周末对小规模开放权重模型(Qwen2.5-1.5B、Qwen3-1.7B、Gemma-3-1b-it 和 SmolLM2-1.7B)进行了红队测试。 我发现它们之间存在一个一致的漏洞:安全对齐几乎完全依赖于聊天模板的存在。 当我去掉了 <|im_start|> / 指令标记并传递原始字符串时: Gemma-3 的拒绝率从 100% 降至 60%。 Qwen3 的拒绝率从 80% 降至 40%。 SmolLM2 显示出 0% 的拒绝率(完全服从)。 定性失败非常明显:之前拒绝生成炸药教程或露骨小说的模型,在没有触发模板的“助手”角色时,立即遵从。 看起来我们将客户端字符串格式化视为一个承重的安全墙。完整的日志、apply_chat_template 消融代码和热图都在帖子中。 阅读完整分析: [https://teendifferent.substack.com/p/apply_chat_template-is-the-safety](https://teendifferent.substack.com/p/apply_chat_template-is-the-safety)
1作者: fallinditch20 天前原帖
我最近在一次Perplexity聊天会话中遇到了一个奇怪的检索模式,这表明他们的RAG可能受到严重偏向或被小众SEO操控。<p>当时我正在研究一个与宗教完全无关的主题(技术/文化分析),但模型却提供了一系列自信但显然错误的答案。当我审查引用时,发现10个来源中有8个是宗教出版物——比如biblehub、耶稣基督教会和各种宗派博客——这些都与我所寻求的客观事实毫无关联。<p>这让我感觉他们索引中的“域名权威”权重正在被利用。我想现在有一些机构专门提供“基督教Perplexity SEO”服务,以帮助基于信仰的组织“衡量AI扫描器的可信度”。<p>在这种情况和对大型语言模型(LLM)调优中“多样化视角”的普遍推动下,世俗的、客观的查询似乎正受到冲击。<p>最近有没有其他人注意到他们的AI搜索结果中突然涌现出大量基于信仰或智库的来源?<p>[1] https://himfirstmedia.com/perplexity-seo/